• 検索結果がありません。

aimed00212_v2.dvi

N/A
N/A
Protected

Academic year: 2021

シェア "aimed00212_v2.dvi"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

医療情報学会・人工知能学会 AIM 合同研究会資料 SIG-AIMED-002-12

クラスタ分析に基づく同一

DPC

コード内の症例の類型化

Classification of Cases with the same DPC code assigned

based on Cluster Analysis

津本周作,平野章二

1∗

岩田春子

2

木村知広

3

Shusaku Tsumoto, Shoji Hirano

1

Haruko Iwata

2

Tomohiro Kimura

3

1

島根大学医学部医学科医療情報学

1

Department of Medical Informatics, Faculty of Medicine Shimane University

2

島根大学医学部附属病院入退院管理センター

2

Center for Bed-control, Shimane University Hospital

3

東芝メディカルシステムズ

3

Toshiba Medical Systems

Abstract: Abstract. This paper shows a process how clinical cases with the same DPC code can

be characterized by mixture model clustering, and analysis of discharge summaries. First, cases are classified into a given number of clusters by mixture models, and then keywords important for classification are extracted by correspondence analysis and SVM. The experiemental results show that all the process gives good performance for automatic classification of examples.

1

はじめに

コーディングによる疾病分類は,DPC[1] 導入以降, 制度として定着してきた。電子カルテにおける疾病名 登録として,診療報酬請求を中心に,病院の経営を支 える根幹をなしている。しかし,ICD[8] そのものの疾 病分類が,WHO の疾病統計とのためのコーディング であることから,コーディングそのものと臨床の病態 との間に乖離があることは以前から知られていた。そ のため,疾患に関するデータを抽出する際,ICD, DPC でのコードで抽出したものから,さらに必要な症例を 選別するという作業が必要になる。 本研究では,この症例の選別をより省力化するため に,同一 DPC コード内での疾患の類別を入院日数と いう観点から,混合分布モデルを用いて行い,得られ たクラスについて,対応分析用いて,得られたクラス における性質に対応するキーワードを退院時要約から 抽出した。さらに,これらのキーワードを用いて,判 別モデルを SVM で構築した。本プロセスを用いた判 別性能について 2011 年度から 2015 年度の各年度での 退院時要約を用いて,クロスでの検証を試み,手法と しては荒井ものの 60∼90%程度の正答率が得られた。 連絡先:島根大学医学部医学科     〒693-8501 島根県出雲市塩冶町 89-1.     E-mail: tsumoto@med.shimane-u.ac.jp

2

方法と結果

:

類型化

図 1 に,本稿のプロセス全体を示した。与えられた DPC コードに関する入院情報,退院時要約を抽出,入 院日数についてのクラスタリングによる類別化,各生 成された類について退院時要約の形態素解析を行い,得 られたターム行列を用いて,Wordcloud, 対応分析,決 定木,SVM によって類別化についての特徴付けおよび 検証を行った。 ㏥㝔᫬せ⣙䛾ᙧែ⣲ゎᯒ ྛ⑕౛䛾㢮ู໬ 䝕䞊䝍䛾ᢳฟ ධ㝔᪥ᩘ,㏥㝔᫬せ⣙ ΰྜศᕸ䝰䝕䝹 䛻䜘䜛䜽䝷䝇䝍䝸䞁䜾(ධ㝔᪥ᩘ) 㢮ู໬䛾᳨ド Wordcloud, ᑐᛂศᯒ䠈 Ỵᐃᮌ䠈SVM 図 1: 類別化と検証のプロセス

(2)

2.1

データ抽出

解析データは [9, 4] に記述したようなプロセスをも とに,島根大学医学部附属病院の 2015 年度に入院した 患者について,DPC 上上位 20 位までの疾患を抽出し, 同時に各疾患の退院時要約を抽出した抽出時に個人を 特定できる情報はすべて削除した。

2.2

混合分布モデル

同一コード内に複数の病態が含まれる時,各病態が 独自の時間発展を遂げると考えると,コードでの入院 日数の分布は複数の病態を反映した混合分布となると 考えられる。これらを分離する方法として,混合分布 モデル [7] を用いた。もともと本手法は判別分析におけ る方法として提案されたが,現在,EM アルゴリズム を用いたモデルベースのクラスタリングの一つと位置 づけられている。 本実験では,R 3.3.1 上に実装されている mixtools[2], flexmix[6] を用いた。表 1 に,DPC 上位 20 位までの 症例について,件数,あてはめの結果および入院日数 の平均値と中央値を示した。正規性を示したのは,2 型 糖尿病,肺の悪性腫瘍,肘・膝の外傷,慢性腎炎,脳 梗塞,二峰性を示したのは,肘・膝の外傷,慢性腎炎, 脳梗塞であった。 これらは,それぞれ肘・膝,慢性腎炎・慢性腎炎,脳梗 塞の部位の違いに起因することが予想される。図 2 に, 脳梗塞における mixtools の適用結果を示した。以下で は,脳梗塞の症例について,詳細な分析結果を示す。 Density Curves Data D ensi ty 0 10 20 30 40 50 0. 00 0. 01 0. 02 0. 03 0. 04 図 2: 脳梗塞における mixtools のプロット

3

方法と結果

:

テキストマイニング

3.1

Wordcloud

による可視化

次いで,俯瞰的情報を得るために,脳梗塞のグルー プを入院日数の短いもの (group1),長いもの (group2) に分けて,解析を行った。グループの振り分けには, flexmix で算出した帰属確率の値によった。グループへの 割り付けの後,退院時要約に形態素分析 (RMeCab)[10] を適用し,term matrix を算出,Wordcloud[3] を適用 した。 図 3 と 4 それぞれに適用結果を示す。相違点を探す のは困難であるが,わずかに入院日数の長いグループ には,麻痺が目立つ位置に布置されており,これが重 要なキーワードであることが予想される。

᱾ሰ

ṇᖖ

㞀ᐖ

ධ㝔

⑕ ᡤぢ 㐠ື ཯ᑕ 㘄 ᖺ ศ Ⅼ ㏥㝔 㢌㒊 ᭶ ಙྕ ␗ᖖ ᚰ ᳨ᰝ ➽ MRI ෆ᭹ ⓗ ⑕≧ 㯞⑷ ⚄⤒ ㍍ᗘ ୰ 㒊 పୗ ୧ഃ ᵓ㡢 ᫂僯傱 ື⬦ ୖ⫥ ྍ⬟ 儌儗兠 ᐙ᪘ ຍ⒪ ⤒㐣 㢦㠃 Ṍ⾜ ๓ ᅇ 㢌 ୗ⫥ ⑓ ฟ⾑ ᣦ CT ⾑ ⾑ᅽ ᪤  ཷデ ഃ 㝔 ║ 㧗⾑ᅽ ║⌫ ⑓Ṕ 儻免 兠儓 ᮅ D ⬚㒊 ⴥ ⛉ ព㆑ ឤぬ ⊃✽ ᕥྑ ⏕ά ッ ᮇ 㛤ጞ ᨵၿ ᚰ㟁ᅗ ⬦ ෆ ⾑ᑠᯈ ⾑ᰦ Ꮫ 㧗 R ື ෆ⛉ ⫥ 㣧㓇 ୗᆶ ႚ↮ ᛴᛶ ⾑⢾ ⯉ DWI MRA ఩ ⢾ᒀ⣽ ⸆ ୖ Na ᩆᛴ ᚰᡣ CTR FLAIR 㢕ື ㄆ▱ ⬺ຊ ↓傽 Barre 僑債 傪 ᶵ⬟ K 儆優 ῝㒊 ᇦ NIHSS mL min ᕪ ᣦ᦬ ኚ໬ ㍤ᗘ ⭝ HR ⛬ᗘ 兑兠兄 ⭸ 㡢 ฎ᪉ デ᩿ dimer儻免儷儧儓儝 እ᮶ 㰯 Ⰻዲ CRP (-) ࿧྾ ヨ㦂 ALT AST Bil Crea ⾑⟶ 㞧㡢 ⑓ኚ ⭡㒊 ぬ APTT ⓑ⾑⌫ ⓶㉁ INR ኻ 㡭 CK PT Ύ᫂ LDH 免儓儮 ᕥୖ ㌟య ❅⣲ ▖Ꮝ ᒀ⣲ 凘 ⥅⥆ 㢁ື⬦ ⮬Ꮿ ᑠ⬻ ៏ᛶ kg ㉁ 傎 (-) ↓ど 㝜ᛶ ๓㢌ⴥ 㢌㡬 Ὕ 剟剥削剰剭剝剰副 ᖹᡂ BNP bp m ᗘ + ⤂௓ 儌儤免兀兗 ␲傪 ⫵ ཎ ど M ⓑ ἞⒪ ศᒱ Cl SpO 㓟 ⺮ⓑ ⑓㝔 僃僔௚ mm H g ୗ ᫬㛫 ฟ⌧ 㣗஦ Ⓨ⑕ 僧僤傪 ෙ ኱⬻ ᨺ⥺ ᅔ㞴 ᑐ ṓ ᐊ ADL ᶫ ༙ ⮬❧ ᮅ㣗 ೫ ᄟୗ Ca eGFR 傽僙僲 児兗儬儖兗 ་㝔 ║▛ ග ཱྀゅ ቨ 僎傹僳 僮催 ᮏ ᙉ傪 ᣑ኱ ኻㄪ ㈋⾑ 㡿ᇦ 剃剫 剞 剰剢 副 ⑓ⓗ 㝞 傻 ჾ BP LDA ぢᙜ ⮬ぬ ୖୗ ⢭ᰝ ᥥฟ HbA V c ⤖⭷ ㆑ ᚩೃ ⬻⚄⤒ ໬ ᆺ ③ S ×M ே ീ ᮅኤ ↓ 傪 จ ᅛ ᪋ ⾜ ไ 㝈 ㏻ 㝔 儆 児 兏 儒 兠 Ẇ ⾑ ᾮ ど 㔝 ୖ ⭎ ᒀ ᾋ ⭘ 」 day እ య ⴎ ⦰ ෌ Ⓨ Ⅼ ⁲ GTP ug ྑ ᡭ ⏬ ീ ᰾ ゐ ぬ ③ ぬ Ⓨ స ⬦ ᢿ BSA Ύ ๣ ኱ ὶ A BT Mingazzini cm ᡭ ቑ ᝏ ⫧ ኱ ண 㜵 list 傱 傱 僰 僊傷 儆儝 儸 兎兗 ⹫ 㢁 㒊 ⌧㉥ ⾑ ⌫ ㊊ ⠊ᅖ 㔝 ⒪ ἲ ኤ ADC LDL MCA ㌾ ゎ 㞳 ᙉ ㄪ ㄪ ᚊ Alp ᕦ ⦓ ᅄ ⫥ 㣗 ᚋ ⭈ య   ┠ⓗ ௨๓ ᖹ ᆠ Babinski O m ఩ ⨨ ᣑ ᩓ ☜ ㄆ 㦵 ᢡ ᣺ື ᥱ ຊ ୗ ⭣ ᕥ ᡭ ሰ ᰦ ᳝㦵 ᮏ ே ᵝ Ꮚ 剌剬剏 剕剭剫 ⒗ 僃 僔 ᚋ ᣋ ຎ ୙ ᩚ I 儆 兏 儐 儬兑 儴 兗 ྍ ⾜ Ἴ ᩓ ᅾ ▱ ぬ ⫧ ཌ ၥ 㢟 Fi b 兎儝儓 እ ⛉ 㛵 ⠇ ᇶ ᗏ ⬚ ゝ ㄒ ᢠ య ሙ ᡤ ๓ ᅇ ⓶ ⭵ ᪉ 㔪 ኤ 㣗 ⣔ ⭘ 㝿 ௒ᚋ ᮏ᪥ HDL ᅽ ③ ⅖ ㄒ ್ 傍 凖 ᚠ ⎔ ୖ ᪼ 㐍 ⾜ 㛢 ሰ ண ᐃ せ ㄳ ᮶ 㝔 Amylase Xp 僤 僎 僧 儈 儔儚 児 兏 儬 ᣲ ᕥ ୗ ⢭ ⚄ ୰ ᚰ ㄆ ୙ ඲ 㒊 ఩ ⭷ ୙ ᫂ ≧ ௨ ୖ ⤖ ᯝ ⌧ ᅾ DAPT DM E IC A JCS NGSP 㓇 儹儍兑 兠 ༠ ㄪ デ ᐹ FT 儓兎儯 儧儓 兎儳 儷兎 兎儳 儷兎優兠 儛 克兗 児儽 兏 ဗ 㢌 ⬮ ᭱ 㧗 ⬡ ⫫ ど ᗋ ⪥ 㬆 僰 ᚰ ୙ ඲ 㧊 ṇ ୰ ๓ ❧ ⭢ ୰ ᛶ ⫼ ㋖ ᩚ ୍ 㒊 Chaddock ECG EF MMT ST good 儌兎儑 光 兠 儝 ჎ Ẽ 㔞 * ᅇ᚟ ╧╀ ᦤྲྀ ⫈ྲྀ ᢞ୚ ≉グ ྰᐃ ホ౯ 儬儈児 儴儈 ᙳ ⤖⠇ ⏥≧⭢ ᕥഃ どຊ ኻㄒ ᚰ㡢 ▼⅊ ⭠ ᗏ ㌿ ⬻ฟ⾑ ᘚ⭷ ᮎᲈ 㝧ᛶ 儝兄兠儞 problem ឤ ྎ Af PICA Tromner f ollow high %( 傍 -㐠㌿ ௓ㆤ ほᐹ ᖐᏯ ㉳ᗋ ◳໬ ᪋タ ᡭ⾡ ᾘኻ ᣿ ೫ወ ኚ᭦ Hb 儜兇儰儷儆 儼儵兎兗 ୍㐣 ྑഃ ⒴ ✵㛫 ᭱኱ ጔ ୺ᖿ ᕢ ᖺ 㱋 ⬻༞୰ 㧗ᗘ   ฟ㞼 ⌫ ᫨ ⩣᪥ Hof f mann f ull mR S s sharp 儓兑儸儭儔児兏 ་ 傎 % (+) )( 凬 傍 ) (-) ㉳❧ 㐀ᙳᦙ㏦ ᣕ ᢠ ChE VA mg× plaque 儆兄兑儜儸兗 儲儴儝儣兗 儷兠兏 儻免儚儑儙 ୍⯡ ෇ ᚋ㑇⑕ ⬡㉁ ⑌ᝈ ୖグ ≧ែ ኱⭣ 㞴 ⫈ ༙⌫ ᚤ ᑠ ୙ᩚ⬦ 剟剡剖削剪剁剖 㢕㒊 ୙Ⰻ ௒ᅇ ⾡ᚋ MCV WI ⑞ ㌴ ౽ ╀傪 )= -/-ᝏ ໬ ᩚᙧ ᝿㉳ ὀど ㌿ ಽ ෆໟ 㓄ྜ ಖᣢ MCHC Neutro 僳僲僊 儣兠兏 儻兑儺児兄 兎儝儬 㝜ᙳ ሷ 㯤⑇ ⫢ ║⛉ ⬚ቨ ➽ຊ ⤒ ᵓㄒ 㡯┠ ஦ 㡯 ⑕ೃ 㣗ḧ ㏿ᗘ 㢌③ ෆ᭹⸆ 㰯⭍ ⭎ ⥭ᛴ ᭷ព Mingazzinni 儻児 ඹ ྜ ᡓ ௨㝆 ඲య ᬑẁ ㍍ᛌ ER LV MR P RR mild sinus 儿兏儣兠 ┠ ᝏ傪 傍 % 傎 (+) 傍 , 凚 凛傎 +/ + ɝ 催僉⾑ ౫㢗 ☜ᐃ ⚗↮ ᣦ♧ ᣦᑟ デ⒪ ቑ㔞 ከⓎ ୰Ṇ 㐺 ᛂ ุ᩿ ஹ㐍 刷 ⽸ື ATR Ly mph OD PT R low m ic robl eeds 儈兗儝兎兗 儗兗儙兏儬 儣儴儗 儵兎儌儧儬 ୗ㒊 ⵹ ⬚Ỉ ഴྥ ཎᅉ ᕷẸ ἞ 㦂 ᤸ 㝶ព ୰➼ 㕲 㢌⵹ ྠ኱ ෆ㒊 ㌾ཱྀ⵹ ∗ ẕ ࿅ᚊ Ᏻᐃ ඃ఩ CBC NS R ᾮ ಶ 㐌㛫 ᵝ 僨僔 ୍᫬ BAD GCS HT PVH no 㢦 ⬟ ᡤ ῐ傪 (-,-) 傎 ) ,, 傰㢪傪 ᅽ ㏕ ᙳ㡪 ᕼᮃ ཧຍ ṧᏑ ่⃭ ど デ ཰⦰ ᾘ໬ ఏᑟ ືᦂ ධᡤ 㐃Ⓨ CP MCH TSH max 傱傱僎 儆儑児儝⭝ 儆 儬 兏 儴 儝 儣 儥 兗 儏兠優兗 儔兏 儱儑儛儊兄儏儻償兏 儽 儧 儭 ᾏ㤿 ឤ傾 㦵⢒㧼⑕ ⬡ ෗┿ య㔜 ྇ᡴ ༢఩ ⫈ຊ ᐃᮇ ㌿㝔 ⬻ᖿ ⥙⭷ ႍᜥ ᏶ ඲ ྠ ᵝ Prob le m ㉳ ⭁ 傺僳 僎僨 ⾡ ➼ ᢿ ୙ྍ ∦ 傹僲 Ᏻ㟼 CCA CPA HCV LA OK RA TP asy nergyf lx ೺ ຊ ◳傪 (+), 傎 (+,+) 傏 ) 凬 傍 ) ± -/-, 凚 凛 +, + 凚±/±凛傎 䰳 ǔ傎 ż ), ż, 㚷ู ᒅ᭤ 㝆ᅽ ౑⏝ ♧၀ ㄯ ㏣ຍ ฿╔ ᭹⏝ ኚᙧ ჎ྤ AR BIF Baso Eos Mono NH PCA Simpson angle drug pulse rhy thm score 儏兏儽儜兑兠兏 儝 儗 儆 償兗儣兠 儬兠儰儝 儱儑儛儊兄 儺兑儧儓 ⦕ ௓ຓ እഃ ⾑⭘ ⌧≧ 㧗್ ᯞ ⮬Ⓨ ⮬ศ ㍈ ⭘⒆ ࿘ᅖ ୖ㒊 ⫋ᴗ ᚰ⮚ ㌟㛗 ᪩ᮇ ⪏ ⢾ ༢ ⏨ᛶ ⬻እ⛉ ⫵⅖ ༙㌟ ⑓ᕢ ⭡ ಖ㝤 ᬽ僯傽 ፉ ㍺ᾮ 剪副 剜 剱 ⭤⬔ 㢛⢏ ୺ ヲ⣽ ༢⣧ ST T f lair f ood total బ⏣ ῭⏕఍ 刟刟 僃催 党᭶ 㦵 ḟ ᙅ ฟ ㏿ ௦ ㄪ ㏻僰 ᘚ ẖ 僃僲 僎傳 ༗๓ Ỉᖹ ୙✜ F HD S TIA TR bruit dilatation f l p ×A ×MA 儝儣儥兗 ⟶ ῶ 傰傱傽傪 ᙅ傪 ከ 傪 ኱傳傪 ஈ傽傪 (++,++) 傍 (-) ): 凬 )- /--) -), 傎 -) 凚+/+凛 凚±/±凛 儗兗儬兑兠兏 ୍⮴ ᅇ ㌿ ほᛕ Ḟᦆ ⪃៖ ෌᳨ ᅾᏯ ᧜ᙳ ௙ ஦ ཷᐜ ᑵᐷ 㞟✚ 㐍ᒎ ㄝ᫂  ᐃ ㄪᩚ ᥦฟ ㈞௜ ⤫ྜ ᚟ ၐ ▩┪ ㍽㍵ BUN Biceps Brachioradialis JDS LAD LAVI MB N a reg sep 儆 儜 兏 儴 儆兏儗兠兏 儆兏儨儳儈兂兠 儏儻償兏 儛兗儥 儜儆儭儗儑儱兠儠 儲兀兎兗 儹儅兆儥儜兗 兑儠児兄 ⫶ ⫶⒴ ༳㇟ ሷ㓟 ᶵ఍ ⳦ ᒅ ඗ ⤒ཱྀ ゝⴥ ຠᯝ ཱྀ ᢠཎ ⭍ 㧗僧 ጼໃ ᚑ࿨ ⦰ ↝㓅 ⑕ೃ⩌ ୖ傲僰 ᚰ➽ ᪂つ ッ傮 ᜥ Ꮚ ᩿ ㊴③ ┤⭠ ㏻ᖖ ₽ ⒆ ᐃᛶ ᪥ᖖ ⃰ᗘ ⫵Ẽ⭘ ⓶ୗ ㎶ ┣ ᶨ 㦵 ⬯㦵 ABI HBs Romberg Vital ள Ọ℩ ᚋ⸨ ཌ బ⸨ ᕥෆ ࿘ ᪥ᮏ ╀ 傻價 ௨㐲 ᑠ ᪥㛫 ᮼ ⛊ ⛊㛫 ἲ ᯛ ⏝ ⢏ ௨ᚋ ༗ᚋ ẖ㣗 ARB B CAVI DTR Ddimer FAB FNF GPA IVC LVEF LVH MMSE SOCRATES clear o room tPA ᶵ ┴ Ꮚ ⏕ Ⓨ ᪉ 㐲 傪 ᅛ傪 㧗傪 ప傪 㞴傽傪 傏 % 凬 ) (-) +/+ 傍 + 凚 ] 凬/ 凚+,+凛傎 凚 凛 -,-凚 凛 -/-凚凝凛, 僢價僪僰 儙 兠 儷 儝 儵儝 ጤ⦰ ⛣⾜ ᅇ᪕ 㛤║ グ ㍕ ྾཰ ᙧᡂ Ḟஈ ῶ㔞 ᵓᡂ సᴗ సᡂ Ṛஸ ᣢ⥆ ᐇ᪋ ⤊ ஢ კク ఙᒎ ᾐ₶ ⏦ㄳ ⥲ྜ ቑຍ ௚⏺ ᑐᛂ ఏ᧛ 㟁 ヰ ྠᒃ ⊂ᒃ ධᾎ ๤㞳 ᢤṑ ཯᚟ ኚື ฼⏝ ㊤ ⾜ Alb A lz hei m e r BRTR CA CTA HK Mg Plt Q SPECT TTR Tibial Triceps WBC air and ef fu s ion half lat lesion one 僪僱Ẽ 儆儤免兠儬 儆儭儶儆免兗儝 儆兏儤儓儬兗 儊兏儡儫儎儑儛儗兠兏 儌儓儆 儓儌兗 儗儯兠兏 儛兑儝儣儢兠兏 儛兗儔児儆 儝儣兠 儝優兑儈儭 儝允儧儬 儣兄儝兑儛兗 優兠儻 儫儈儙兠儷儝 儬免儧儓 儴児兠 儻児儭儯兗 元儏 兏 儫 儇儝 充儴兑儥兗 免兗 免兗儡儻免儢兠兏 兎儊兂儥 兎儳 兑儑儡儯兗 ᅽ ་ᖌ ་⒪ ྑ๓ ᰤ㣴 㯤   ᗘ 㡢Ἴ ᐙ እയ ᖿ ᇶ‽ ᇶ♏ Ẽ⟶ᨭ Ẽ㐨 Ẽศ ㏆ᡤ ᚄ ㍍⑕ ๻ ⾑⟶⭘ ஺㏻ ᗈ傲僰 㧗 㱋 ⭜ ⭜᳝ ᕥ㊊ ᭱⤊ ᕷ❧ ど⚄⤒ ṑ⛉ ⪥㰯 ⮬ຊ ᩳ ᡭ ㊊ ⭘⬽ ᑠᣦ ୖ㢡 ≧ἣ ⫋ဨ ᚰ➽᱾ሰ ᣺ᖜ 㟼⬦ ඛ➃ ᰁ ₯ ⥺⥔ ๓᪉ ඲㌟ ᮰ ᖏ≧ ὀ ③僥 ㏻ᡤ ∎ ᐃ㔞 㕲๣ ື 傳 ෆഃ ங ᄞỈ ᄞ⬊ ⬻⭘⒆ ⫵⒴ ⓑෆ㞀 ⑓ྡ ௜㏆ ኵ፬ ∗ぶ ቎▼ ᡣ ච␿ ⸆ຠ 㝧 ⌮Ꮫ ୧ ぶ ⥳ෆ㞀 㱋 ⿣ ᨥ⦰ 前剮剄 ⒕⑞ ╰ẟ ⡆༢ ᛴ ೺ᗣ ୙ Ᏻ ᐃ ୙⬟ ᫂ ☜ neck not probrem ×N 储 傻 僘 儝 優 兗 儬 儹免兗儭兏 㞼༡ ຍ 㛤 ྂ℩ ᗈᓥ Ụὠ ጞ ᚎ ᯇỤ ⥲ྜ་⒪償兗儣兠 ᩫᕝ ⟠ ᡤ ఍ 㛫 㙾 ⩌ ᡯ ᕷ ᩘ 㝲 ᖺ㛫 ྡ 傪僀僲 ᭱㏆ ᫖ᖺ ๓᪥ ᙜ᪥ ␃⨨ ᑠ้僥 ┦ᛂ AS Angio BTR HOT Hofmann Ma n n PA PH PR Pa f SAH SD S Sural VC div e 刟RS 儆兄兑儜兗 儥儏儔児兑兏 ゅ ⥺ ⓶ ⪅ ኪ 図 3: 入院日数の短いグループでの退院時要約による Wordcloud

3.2

対応分析

グループは 2 つしかないが,キーワードの特性を見 るために,前節で得られた term matrix を用いて,R の パッケージ MASS に含まれる対応分析を試みた。図 5 に示すように,明らかに異なるキーワードがそれぞれ に含まれている。これらのキーワードについて上位 20 位までを表 2 と 3 に示した。表に示す通り,グループ 2 では,明らかに麻痺症状に関連するキーワードが並 んでいる。

(3)

表 1: データと混合分布モデルのあてはめの結果 DPC 名称 DPC コード 件数 正規性 二峰性 平均値 中央値 白内障、水晶体の疾患 手術手術あり 重症度等片眼 020110xx97xxx0 445 3.27 3 白内障、水晶体の疾患 手術手術あり 重症度等両眼 020110xx97xxx1 152 7.78 8 2型糖尿病 (糖尿病性ケトアシドーシスを除く。) 100070xxxxxxxx 145 ○ 12.90 13 肺の悪性腫瘍 手術手術あり 処置等2なし 040040xx97x0xx 131 ○ 14.80 13 子宮頸・体部の悪性腫瘍 手術手術なし 処置等24あり 副傷病名なし 12002xxx99x40x 121 5.40 5 肺の悪性腫瘍 手術手術なし 処置等1あり 処置等2なし 副傷病名なし 040040xx99100x 120 2.84 2 子宮の良性腫瘍 手術腹腔鏡下腟式子宮全摘術等 120060xx02xxxx 111 7.05 7 肺の悪性腫瘍 手術手術なし 処置等1なし 処置等24あり 040040xx9904xx 110 9.16 8 妊娠期間短縮、低出産体重に関連する障害 (出生時体重 2500g 以上) 手術手術なし 処置等2なし 副傷病名なし 140010x199x00x 110 3.02 2 肘、膝の外傷(スポーツ障害等を含む。) 手術腱縫合術等 160620xx01xxxx 99 ○ ○ 18.20 17 全身性臓器障害を伴う自己免疫性疾患 手術手術なし 処置等2なし 070560xx99x0xx 96 12.31 3 非ホジキンリンパ腫 手術手術なし 処置等24あり 副傷病名なし 130030xx99x40x 94 19.55 13.5 肺炎、急性気管支炎、急性細気管支炎 ( 15 歳以上) 手術手術なし 処置等2なし 040080x099x0xx 86 13.41 11 肺の悪性腫瘍 手術手術なし 処置等1なし 処置等2なし 040040xx9900xx 85 17.20 11 慢性腎炎症候群・慢性間質性腎炎 ・ 慢性腎不全手術手術なし 処置等1なし 処置等2なし 副傷病名なし 110280xx99000x 83 ○ ○ 12.81 11 肝・肝内胆管の悪性腫瘍(続発性を含む。) 手術その他の手術あり 処置等2なし 060050xx97x0xx 82 15.48 9 胆管(肝内外)結石、胆管炎 手術限局性腹腔膿瘍手術等 処置等2なし 副傷病名なし 060340xx03x00x 82 11.04 8 脳梗塞(JCS10 未満) 手術手術なし 処置等1なし 処置等23あり 副傷病名なし 010060x099030x 80 ○ ○ 20.95 17.5 網膜剥離 手術手術あり 重症度等片眼 020160xx97xxx0 75 ○ 11.83 13 胎児及び胎児付属物の異常 手術子宮全摘術等 120180xx01xxxx 73 10.45 9

(4)

᱾ሰ

㞀ᐖ

ධ㝔

Ṕ 㯞⑷ 㐠ື ᭶ ᳨ᰝ ᡤぢ Ⅼ ␗ᖖ పୗ ᚰ ᖺ 㢌㒊 ⾑ 㘄 ศ ಙྕ ᮇ ᒀMRI ྍ⬟ ㍍ᗘ ୗ⫥ 㒊 儌儗兠 ⓗ ഃ ⑕≧ ⬦ ᵓ㡢 ⊃✽ ື⬦ ⴥ ⤒㐣 ᐙ᪘ 㢌 ୰ ෆ᭹ ឤぬ ୖ⫥ ➽ ฟ⾑ CT ㏥㝔 ཯ᑕ ⚄⤒ ୖ 儻免兠儓 ⫥ 㛤ጞ ᮅ㣗 ⑓㝔 ᅇ ๓ 㢁ື⬦ ⛉ ᨵၿ ⬚㒊 ṇᖖ ⣽ D ᪤  ୧ഃ ᫂僯傱 ኻ 㢕ື ෆ ᮅ NI H S S ຍ⒪ Ṍ⾜ 㢦㠃 ఩ ㍤ᗘ ⾑ᑠᯈ ᚰ㟁ᅗ ṓ 㝔 ព㆑ ཷデ ⾑ᅽ (-) ᣑ኱ ᕥୖ ື ᗘ Bil ᛴᛶ ሰᰦ ⛬ᗘ ⸆ ᶵ⬟ ႚ↮ ἞⒪ ッ ⑓Ṕ 㡿ᇦ K ⾑ᰦ ᚰᡣ ⓶㉁ Ꮫ DWI ␲傪 ⺮ⓑ ㌿㝔 ⑓ኚ 㧗 儻免儷儧儓儝 ⏕ά 兎儳儷兎 ⾑⢾ ⓑ⾑⌫ ᕥྑ 㧗⾑ᅽ ཎ ෙ ୗᆶ Na ᩆᛴ 㣗ᚋ 㢌㡬 ᨺ⥺ ᅔ㞴 ALT ⑓ 㡭 (+,+) 㣧㓇 ฎ᪉ AST Crea ⭡㒊 CRP ║ 㓟 ኤ㣗 ᇦ MCA c ᪋⾜ デ᩿ ೫ LDH di m e r 凘 ど R min ศᒱ HbA 兑兠兄 ኻㄒ Ⰻዲ 僃僔௚ Barre INR MRA PT ᣦ᦬ ↓ど APTT M ❅⣲ ෆ⛉ ᒀ⣲ 僃僔ᚋ FLAIR ⥅⥆ ኚ໬ 儆優 ᑠ⬻ ⯉ ⬺ຊ ໟ ៏ᛶ ฟ㞼 ∦ ὶ LDL V kg ᫬㛫 ෆໟ Ⓨ⑕ ug 儆儝 儸 兎 兗 儌儤 免兀 兗 兎儳儷兎優兠儛克兗 ║⌫ 㞧㡢 ᣦ ど㔝 ๓㢌ⴥ ᐊ BNP BabinskimmHgbpm CK 㡢 僑債傪 ࿧྾ ฟ⌧ ୖୗ Cl እ᮶ ⬮ ᣲ ⾑⟶ ⫵ 剟剥削剰剭剝剰副 ᖹᡂ ୗ ᅇ᚟ ኻㄪ 㣗஦ ㄆ▱ ᰾ ᕷẸ ᕪ CTR HR ×M ༙ FT SpO 儬儈児 ⢾ᒀ ᾋ⭘ ⒗ ჾ ๣ BP E HDL cm ⟶ ཰⦰ Ca ⌧ ⬡⫫ ㉥⾑⌫ ୰ᛶ MMT ே จᅛ ⮬ぬ ㈋⾑GTP 儴儈 ⬡㉁ ᮏே 㝧ᛶ 剌剬剏剕剭剫 ⭝ 刟刟 ⣔ JCS mL ྍ ⾜ ᙉ傪 ぢᙜ Al p 僧僤傪 ⏬ീ ᢠయ ㆑ ኱⬻ Ὕ ≧ ADC O 免儓儮 ☜ㄆ ὀど ᥥ ฟ eGFR 儆 児 兏 儒 兠 ゝ ㄒ ᕥ ୗ ῝ 㒊 ₯ ᐃ ᛶ 㞴 ⫈ Ⓨ స ┠ ⓗ 剃剫剞 剰剢副 ኤ Chaddock I S 儆 兏 儐 儬兑 儴 兗 Ἴ ่ ⃭ ⮬❧ 㐀 ᙳ ከ Ⓨ 㛢 ሰ ண 㜵 ᮶ 㝔 Amylase 儗兗 儙 兏 儬 ⤖ ⭷ ᅄ ⫥ ⭈ ▖ Ꮝ ㄆ ⭸ ศ Ỉ ᕊ ⒪ ἲ 㝞 ᑐ BSA DAPT EF GCS ᡭ 㣗 య ヨ 㦂 ୖ ᪼ ಖ ᣢ ண ᐃ 兎儝儓 ║▛ ㌟ య ๓ ❧ ⭢ ୙ ඲ 㒊 ఩ 㧗 ᗘ ぬ 傻 ᆺ ᮏ ↓ 傽 僎 傹僳 ௨ ๓ ⤖ ᯝ ㉁ ╀ 傪 (-,-) ඹ ྠ 㐍 ⾜ ⢭ ᰝ Ⅼ ⁲ ホ ౯ ྑഃ ග ᭱ ኱ ⭷ ⌧ ᅾ ᭷ ព BT mRS ㌾ ῐ傪 ㉳ ❧ ◳ ໬ ᩓ ᅾ ṧ Ꮡ ᚠ⎔ ไ 㝈 ୰ Ṇ ⫧ ኱ NGSP 僤 僎 僧 儌 兎儑 光兠 儝 児 儽 兏 እ ⛉ᇶ ᗏ ✵ 㛫 ᕥ ᡭ ୖ ⭎ ㏿ ᗘ ୰ ᚰ ୰ ➼ ③ ぬ ᖺ 㱋 㰯 ቨ ୙ ᫂ ⅖ ឤ 僮催 ᖹ ᆠ ADL 儿 兏 儣兠 ⓑ 㢕 㒊 ຊ ෌ Ⓨ Ύ ᫂ ᚟ ၐ ⌮ ゎ Fib LDA list 儼 儵 兎兗 ⾑ ᾮ ሙ ᡤ ≧ ែ ᚰ ୙ ඲ ᕢ ▱ ⬻ ⚄ ⤒ ⬻ ༞ ୰ ༙ ㌟ ᮎ ᲈ ⭤ ⬔ Ύ ᣋ ຎ LA ೺ ീ ኱ ್ ᮅ ኤ 傎 (-) * 傍凖 ほ ᐹ ㉳ᗋ ౑ ⏝ ⤂ ௓ ቑᝏ ᦙ ㏦ Tromner m 㝜 ᛶ ୗ ⭣ ⤒ ⮬ ᕫ ᚑ ࿨ ື 傳 ⫼ ୙ ᩚ ⬦ 」 ⬦ ᢿ ୙ Ⰻ እ ⢏ Mi ngaz z ini day high low ᅽ ③ ⌫ 傎 ) + ଈ ༠ ㄪ ᾘኻ ᦤྲྀ ㄪᚊ TSH 儆儬兏儴儝儣儥兗 ་㝔 ⒴ ഴྥ ⮬Ꮿ ⭘⒆ య  ᚩೃ ෆ᭹⸆ 㒊ศ ᪉㔪 ᵝᏊ 傻價 ໬ 㝿 ⾡ᚋ ୙ᩚ A P ST WBC Xp ᫂ ᶫ ㄒ ㍈ ᓥ ⴭ 傪 催僉⾑ ⴎ⦰ ⫧ཌ せㄳ PTR 児兗儬儖兗 ྑᡭ ௓ຓ ⹫ ⬚ ⬚Ỉ ⁁ 㡯┠ ⭜㒊 ᭱⤊ どᗋ ⬨ᰕ ᜥᏊ ኱ື⬦ ∗ ᘚ⭷ ẕ ༢⣧ ⑓ⓗ ᩚ ྎ ༗๓ BAD BT R F LV MCV TP fu ll s sharp sinus ་ ୙ྍ ౽ ↓傪 -, 䰳 ୍⮴ ᣑᙇ ௙஦ ᣢ⥆ 㜼ᐖ 㐺ᛂ ືᦂ ኚ᭦ ၥ㢟 ATR IU Ly mph Neutro pH plaque score 傽 僙 僲 兎儓儛儆儮 ពḧ 㯤 Ẇ ⬚ቨ ➽ຊ 㢁㒊 ཎᅉᚋ㑇⑕ ⏥≧⭢ ᭱㧗 ⪥㬆僰 ゐぬ ᚰ㡢 ᄞ⬊ ẚ㔜 ᑿ ᚤ ᑠ ኵ 剟剡剖削剪剁剖 Ᏻᐃ OK pro b le m ×N   ᾮ ḟ ⢾ ⛊ ௒ᅇ௒ᚋ CEA bruit f l total 㢦 ┠ ᪉ ከ傪 %( 傎 % -/-ᙳ㡪 ྾཰ ᙉㄪ ෌㛤 ᐇ᪋ ㏻㝔 ືస ஹ㐍 BRTR Baso Eos Hb Mono OD PC A SPO TTR f lx mEq 傱傱僰僊傷 儆兄兑儜儸兗 儣兠兏 儽 儧 儭 兂儔免儧儓儝 兎儝儬 ᥱຊ ᰤ㣴 ⫢ ᘪ ᯞ ᪂つ 㧊 ᰁ య㔜 ⭠ ┤⭠ ᘵ ᪥ᖖ 㔝 ୧᪉ ࿅ᚊ ⥭ᛴ ୺ ᚲ せ 儻児 㞼༡ ᕥෆ ࿘ ⭘ ➼ ⛊㛫 ୍㒊 ඲ య ᙜึ ẖ㣗 ᕦ⦓ Ỉᖹ B BM I CPA ECG HBs HCV HPF Hof f mann PSV Paf RA room ಶ Ⓨ 㐲傪 ??/ 儹儍兑兠 ᝏ໬ ఩⨨ 㛤㛢 ほᛕ ᕼᮃ 㝆ᅽ ┦ ㄯ ୰᩿ ⫈ྲྀ ≉ グ ධ ᡤ ⿵ ᄟୗ Af Al b Cho JDS MCHC N ai r 儝儣儥兗 儬兠儰儝 儵兎儌儧儬 儻兑儺児兄 ⫶ 㝜ᙳ ሷ ⮩ ឤ傾 㧗್ ᭱Ⰻ ⑌ᝈ ෗┿ 㔜ᗘ 㔜ຊ ㌟㛗 㝶ព ṇ୰ ⬨㧊 ⭢ ⭘ ኱⭠ 㛗ዪ ෆ ഃ ㌾ཱྀ⵹ ⬻ฟ⾑ Ἢ ᒀ ჾ ᡣ ፉ 儝兄兠儞 ᏶඲ DSEP ᚎ 僃催 ἲ ᵝ 僔 僨僔 ᬑẁ CTA ICA MR Mingazzinni RR asy nergy 兓兠儹儅兎兗 ჎Ẽ ᭩ ⴭ 㧗傪 (+) -) 凚 凛+ ǔ傍 ௓ㆤ ᣑᩓ ᖐᏯ ᣄྰ ᳨ウ ࿧⛠ ᢠ ྜィ ΰྜ ㉁ၥ ᡭ⾡ ⤊ ஢ ᾘ໬ ఙᒎ ṇゎ ▱ ぬ ὀព ᤼ᒀ ཯ᛂ ᚟ᖐ ే⏝ ೫ወ 㐃Ⓨ 刷 ChE MCH NH RBC rhy thm 儏兠優兗 儓兎儯儧儓 儓兑儸儭儔児兏 儙兏儣兗 儝儗儆 儾兠儝 充兠儏兠 兑儠児兄 ୍⯡ဗ㢌 ᙳ ⵹ ඗ ᠁ ⤒ཱྀ ⤖ ⠇ ཱྀゅ ᢠ ཎ ⏥≧ 㓝 ⣲ 㧗ḟ ᕥഃ ጔ ᕷ❧ ஦㡯 Ꮠ ⮬Ⓨ ⱝ ᖺ ୺ ᖿ ↝㓅 ⑕ೃ⩌ ୖグ ᮫ ▼⅊ ๓ ᅇ ⵬ ㊊ ᳝㦵 ③㢼 㕲 Ⅼᩘ ෆ 㒊 ෆศἪ ᪥௜ ᢤཤ ༙⌫ ⠊ᅖ ᬽ僯傽 ⭎ 剪副 剜 剱 㢕᳝ ヲ⣽ ኚ HDS MMSE Problem ཌ ㌴ ᙅ ᡤ ᩘ ⥺ ③ ᖺ㛫 ᮼ ᢿ ྡ ㊰ 傪僀僲 傹僲 僎傳 ௨ୖ ௒ ┤ᚋ ᮏ ᪥ BUN CAVI FNF IVC SVPC wall ×A 儣儕儻兑兗 儲儴儝儣兗 前剮剄 ෇ ῶ ❧ ᝏ傪 ◳傪 ୖᡭ傪 ኱傳傪 %), (++,++) (+ /+ ), 傎 (+/+) 傎 (-/-) )= 傎 -/-凬凖 凚+/+凛傎 儗充兗儬 儗兗儬兑兠兏 ⛣஌ ⛣ ື ୗ⑩ 㛤 ║ ☜ ᐃ ぬ㓰 ⟶⌮ ⚗↮ ㍍ῶ Ḟᦆ ᳨⣴ ᳨デ ῶᑡ ᵓ ᡂ ෌᳨ ᧜ᙳ ཧຍ ⟬ ᣦᑟ ᾘཤ ᣺ື ᾐ₶ デ⒪ ᩚᙧ ␯㏻ ᝿㉳ ቑ 㔞 ⫈デ ㏣ຍ ✺Ⓨ Ⓨ⇕ ุ᩿ ೫ೄ ኚື ಖᏑ ⽸ື Bruit Chol TG clear motion reg 刁凶 僘僤僵僰 僪僱Ẽ 儆儑児儝⭝ 儏優兠優兏 儙儆元儎兗 儛兗儥 儛兗充儬児兏 儜 兇 儰 儷 儆 償兑儓儌兏 儥免兠儦兗 儷兠兏 儸儣儴儝儣儥兗 儽儙儗兎兗 兎儳 兎兗儵 ⫶⒴ 㐪࿴ឤ ⱌ ྍື ᇶ‽ ᶵ఍ ⊃ ᚰ ⑕ ᒅ ⾑⭘ ⌧㇟ ຠᯝ ཱྀ 㦵⢒㧼⑕ ⬡ ἞㦂 ⪥ ࿘ᅖ ࿘㎶ ⑕ೃ ◪㓟ሷ ᚰ⮚ ᣺ᖜ 㗹 ⢭⚄ ⏨ᛶ ⫈ぬ ⫈ຊ ᐃᮇ ᗏ ㌿ ྠ᫬ ᒀ㐨 ᄞỈ ⃰ᗘ ⬻እ⛉ 㒊ᒇ ┠ᶆ ⪁ே ᶨ㦵 ㋖ 㢛⢏ 储傳僯傱 ೺ᗣ ඃ఩ ABI PPI d np ள ዟฟ㞼 ྜྷᒸ Ụὠ ᪥ᮏ 则 傺僳 ౯ ඹ ⑞ ⏫ 傹僳 ᭱㏆ ᫨ ⩣᪥ ␃⨨ CA DM FAB HT LAVI PH Simpson abnormal drug f ollow f ood moderate normoactiv e p ┴ 㓇 ⏝ ⣽傱傪 " 傏 % 傍 (++/+) 傎 (+,+) (-,+) ): 凬 ) -/-傎 + -# ɝ 傍 傍 凚+/+凛 凚 凛傎+ 凚 凛 -/-ɝ 儝儓兎兠儯兗儔 儝免儈儝 ᅉ グ㍕ ィ⟬ Ḟஈ ஺᥮ ◳┤ ⪃៖ ΰ ⃮ ᥇ ⾑ ᣦ♧ ᚰ㓄 ╧╀ ṇ⟅ ᡴ ᧞ ᑐᛂ ኱⑓ ᘱ⦆ ㈓␃ ೵Ṇ ᣿ ఏᑟ 㟁ヰ ᢞ୚ ฿ ╔ ᒡ 㕌㯞 ධᾎ ◚ ⿣ 㓄ྜ Ⓨぢ Ⓨ㐩 ẚ㍑ ⫧‶ ࿨௧ ⴠୗ ⪁⾶ Ⴔዲ ADCmap Ab CCA FDP LAP Lt PS L Plt Rt VA echo ext maxIMT or sep 僁價ዶ 僳僲僊 儆兏儨儳儈兂兠 儈兗儝兎兗 儌儓償儔免兗 儌儵儫兠兏 儏儻償兏 儕儬兗 儗 元光 儯 儕 兠 儛 克兗 儱儑儛儊兄儏儻償兏 儴兏 儴兏兠兗 儹儅儓儣兠 儼 兏 儵 兠 兂兠儏兠 元儏兏儫儇儝 兊儽免 兊兎兠儹 免 兓儡免兗 兓兏儹儅兎兗 ᅉ Ꮚ ྑ⭎ ෙື⬦ ⨁ 㛵 ⠇ ᇶ♏ ⬚⭷ ᚄ ㍍ᛌ ⫪ ゝⴥ †Ỉ ཱྀᚄ 㡯 㧗㱋 㦵┙ ⣽⳦ ṑ⛉ ḟዪ ⪥㰯 ⮬ຊ ㌴᳔Ꮚ ᡭ ㊊ 㐌 ୖ㒊 ⫋ ሙ 㣗ḧ ᚰ⪥ Ỉ‽ ⏕໬Ꮫ ⏕⌮ ๓ 㢌 ッ傮 ᪩ᮇ ⲡส僰 ኱⭣ ༢ ༢఩ ୰㒊 㛗⏨ ྤ傳Ẽ 㢌③ ྠ኱ ྠ⬊ ᑟ ⊂Ṍ ங ⫵⒴ ⓶⭵ ⫝ ⑓ᕢ ௜㏆ 㢼࿅ ≀ ရ ᨺᑕ⥺ ᪉ྥ ┣ 㣰 ኪ㛫 ⮫ᗋ ⱎ ᩓ 剖剂剮 ⑊③ ⭁ゐ ᗈ ⠊ ᪂僅 AM BS CB C PSA SDS Summary ῭ ⏕ ఍ ᑠ㧗 ோᦶ ᕝᮏ ⥲ྜ་⒪償兗儣兠 㛗㇂ᕝ ጲ㔝 ╀ 傱᭶ 㙾 ᫬༙ ᘧ 㐌㛫 ⾡ ㏿ ẖ ❧僌 ௨ෆ ஦ ௒᭶ ௒ᖺ ᫖᪥ ᑡ㔞 ᙜ᪥ ኪ ኤ᪉ Ᏻ㟼 ACA AR CAS DT R EOM HK HL Hofmann TR VPC af map mild no normal o pause smooth 儔 兎償 儎 兠 兏 儛兑儝儣儢兠兏 償児儗儧儓儝 児儝兎兗 ⏕ ㏻僰 㣗 ๓ 図 4: 入院日数の長いグループでの退院時要約による Wordcloud 表 2: 入院日数の短いグループのキーワード キーワード tf-idf 骨折 0.01105774 自宅 0.009951966 ADL 0.0084776 橋 0.0084776 しびれ 0.008109009 レントゲン 0.008109009 医院 0.008109009 口角 0.008109009 嚥下 0.008109009 病的 0.007740418 化 0.007371826 徴候 0.007371826 痛 0.007371826 day 0.007003235 殻 0.007003235 通院 0.007003235 無い 0.007003235 BT 0.006634644 Mingazzini 0.006634644 萎縮 0.006634644 右手 0.006634644

4

方法

:

分類モデル

上記で抽出したキーワードを用いて,各退院時要約 に関して,これらの有無を検索して,各症例から 2 値分 -1.0 -0.5 0.0 0.5 1.0 -1 .0 -0 .5 0 .0 0 .5 1 .0 傍凖凘(-) 傎 (-) * (+,+)(-,-) + ×M A

ADLdayBT FLAIRBarreHRCTRLDA LDHlistmeGFRBSAmindimerAPTTbpmINRCKClDWIFibkgCRPBPCaChaddockCreaASTALTDBNPGTPHbAKAmylaseCTM MCAAlpBilcmc FTLDL BabinskGCSJCSHDLEI ingazzini mLmmHgMRA MRINa NGSPNIHSSO MMT刟刟

problem児兗儬儖兗傱傱僰僊傷儝兄兠儞儓兎儯儧儓儔儚児兏儬⏥≧⭢儹儍兑兠⬻ฟ⾑⪥㬆僰傽僙僲㛵⠇⤖⠇ᘚ⭷ᢞ୚ᕦ⦓ཱྀゅ≉グゎ㞳㢁㒊⠊ᅖᙉㄪ୙ᩚᣑᩓ༠ㄪ⑓ⓗ⫧ཌ⓶⭵ྰᐃ㦵ᢡ᭱㧗௒ᚋ๓ᅇ╧╀デᐹ᣺ືᚰ㡢⢭⚄▼⅊ゐぬᣋຎᦤྲྀయ ㏻㝔 どຊどᗋ▱ぬᚩೃ⫈ྲྀㄪᚊ᳝㦵᪉㔪ᕥഃྑᡭṇ୰ဗ㢌ᄟୗ௨ୖᮏ᪥఩⨨ၥ㢟ᵝᏊⴎ⦰ᥱຊせㄳᅽ③་㝔୍㒊↓傪Xp ṇᖖ 㝜ᛶΎ᫂↓傽⤂௓㰯⭸῝㒊 ⚄⤒ヨ㦂║⌫ ║▛཯ᑕ㌟య⢾ᒀ㏥㝔⬻⚄⤒免儓儮▖Ꮝ㧗⾑ᅽ僮催ㄆ▱ ᖺ⬦ᢿ୧ഃ ⒪ἲ⾑ᾮ」 ศ ศᒱ᫂僯傱ෆ⛉ቑᝏ僑債傪኱ ኱⬻෌Ⓨ僎傹僳ຍ⒪ ྍไ㝈 ᛶୖ⭎ሙᡤ㢦㠃 ჾෆ᭹⬺ຊ⢭ᰝᕥྑṌ⾜ ③ぬእ᮶⾑ᅽᡤぢᑠ⬻⑕⾑⟶⾑ᑠᯈ࿧྾⏕ά儆優 儆兏儐儬兑儴兗⑓Ṕ㈋⾑ኚ໬ୗ⭣PT剃剫剞剰剢副㣧㓇㍍ᗘཷデ⫧኱僧僤傪ᣦ᦬R㞧㡢ᩓᅾ 㓟ୗᆶⅬ⁲剟剥削剰剭剝剰副儆児兏儒兠⑕≧እ እ⛉᪤ 兑兠兄⤖⭷ಙྕ ᚰ⾑ᰦ❧㆑ᩆᛴⰋዲព㆑␗ᖖ⾑⢾ ᭶ᥥฟSpO㢌㒊๓㢌ⴥ儌儤免兀兗ᕥᡭ ᕥୖᵓ㡢デ᩿ᚰ㟁ᅗᙉ傪ୖ⫥ୖ᪼ᖹᡂぢᙜ ཎ㐠ື儻免儷儧儓儝ື⬦ႚ↮ධ㝔᱾ሰ㞀ᐖᇶᗏ❅⣲៏ᛶ⥅⥆ᐙ᪘ᒀ⣲ ㄆண㜵Ⓨసᛴᛶᚰᡣᚰ୙඲௨๓⮬ぬฎ᪉⬚㒊⤒㐣᫬㛫㣗஦ฟ⾑⭡㒊ᮅኤ↓ど୰ᚰ୙᫂ฟ⌧ᅄ⫥ᚠ⎔僤僎僧จᅛ⏬ീ㒊㒊఩儌儗兠儌兎儑光兠儝儻免兠儓ᨵၿᶵ⬟ⓑ⾑⌫ኻㄪ㢌㢌㡬Ⓨ⑕ ༙兎儝儓┠ⓗ児儽兏ྍ⬟ᮎᲈ㐍⾜僃僔௚⌧ᅾୗ⫥ᾋ⭘㉥⾑⌫⑓ኚ㛤ጞ☜ㄆ᳨ᰝ⤖ᯝୖୗ⓶㉁୙඲剌剬剏剕剭剫ணᐃ㢕ື๓❧⭢㍤ᗘឤぬゝㄒ㛢ሰ᮶㝔⊃✽ᮏேど㔝ᢠయSホ౯పୗ儆儝儸兎兗Vᕥୗ⛬ᗘᨺ⥺ᅔ㞴␲傪ug㯞⑷⺮ⓑ᪋⾜兎儳儷兎優兠儛克兗἞⒪㢁ື⬦⬡⫫僃僔ᚋ୰ᛶ㡿ᇦ㝧ᛶ儴儈ᣑ኱儬儈児㣗ᚋᅇ᚟⑓㝔ኤ㣗ᮅ㣗ሰᰦኻㄒ兎儳儷兎 儗兗儙兏Tromne⬻༞୰儼儵兎兗ศỈᕊ୙ᩚ⬦⌮ゎ᭷ពྑഃ⭤⬔ಖᣢ㢕㒊᭱኱ᕷẸ㧗ᗘᐃᛶᖹᆠṧᏑ౑⏝่⃭ὀど཰⦰୰➼୰Ṇ⬡㉁ᚑ࿨⮬ᕫከⓎ㏿ᗘ㌿㝔◳໬㐀ᙳฟ㞼᚟ၐ୙Ⰻ≧ែほᐹᦙ㏦༙㌟㉳ᗋ㉳❧ඹྠᖺ㱋✵㛫㞴⫈ෆໟ╀傪ῐ傪ື傳 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 -0 .3 -0 .2 -0 .1 0 .0 0 .1 0 .2 0 .3 Group-1 Group-2 図 5: 対応分析の結果 表 3: 入院日数の長いグループのキーワード キーワード tf-idf 転院 0.012553504 共同 0.01033818 出雲 0.009230518 片 0.009230518 包 0.009230518 Babinski 0.008861297 内包 0.008861297 市民 0.008122856 HDL 0.007753635 管 0.007753635 MMT 0.007384414 収縮 0.007384414 JCS 0.007015194 mm 0.007015194 脂質 0.007015194 I 0.006276752 潜 0.006276752 注視 0.006276752 定性 0.006276752 難聴 0.006276752 波 0.006276752 GCS 0.005907531 類表を作成した。作成した表を使って,決定木と SVM により,グループ 1 とグループ 2 の分類モデルを構築 した。

(5)

表 4: 決定木の結果 2015 年度 2014 年度 2013 年度 2012 年度 2011 年度 2015 年度 0.763 0.618 0.740 0.595 0.605 2014 年度 0.813 0.764 0.750 0.620 0.645 2013 年度 0.775 0.764 0.720 0.722 0.737 2012 年度 0.575 0.697 0.660 0.658 0.553 2011 年度 0.688 0.438 0.610 0.570 0.605 表 5: SVM の結果 2015 年度 2014 年度 2013 年度 2012 年度 2011 年度 2015 年度 0.788 0.775 0.730 0.582 0.513 2014 年度 0.663 0.708 0.640 0.582 0.539 2013 年度 0.738 0.798 0.680 0.595 0.592 2012 年度 0.563 0.652 0.580 0.696 0.605 2011 年度 0.575 0.663 0.590 0.709 0.605

4.1

決定木

図 6 は 2015 年度の退院時要約から得られた決定木 であり,生成には R3.3.1 上の rpart を用いた。転院の 有る無しが筆頭になっており,これは入院日数の短い ものについては,麻痺等がほとんどなく,そのまま退 院しているのに対し,長いものについては,麻痺等が あり,引き続きの加療が必要であることに対応してい る。結果としては,当然の内容となってしまっている が,退院時要約内での重要なキーワードについては着 目できていることがわかる。2 つめに選択された変量に ついては解釈が難しいが,筋収縮の有無が症状の程度 に関係していると考えれば,それらが最も重要な因子 であると考えられていることがわかる。表 4 に,2011 年度から 2015 年度の退院時要約から決定木を生成し, 各年度に対して 5 回適用した平均の正答率を示した。 対角線上,すなわち 2015-1015 年度については,5-fold cross validation の結果を示している。

4.2

SVM

学習には,R3.3.1 上の kernlab [5] を用いた。2015 年 度のデータから得られたモデルについて,5-fold cross validation にて正答率を評価したところ,78.8%であ った。 表 5 に,2011 年度から 2015 年度の退院時要約から 決定木を生成し,各年度に対して 5 回適用した平均の 正答率を示した。対角線上,すなわち 2015-1015 年度に ついては,5-fold cross validation の結果を示している。

㌿㝔 1 <0.5 ≥0.5 ཰⦰ 2 <0.5 ≥0.5 Node 3 (n = 38) G ro up-2 G roup-1 0 0.2 0.4 0.6 0.8 1 Node 4 (n = 12) G ro up-2 G roup-1 0 0.2 0.4 0.6 0.8 1 ↓傪 5 ≥0.5 <0.5 Node 6 (n = 7) G ro up-2 G roup-1 0 0.2 0.4 0.6 0.8 1 Node 7 (n = 23) G ro up-2 G roup-1 0 0.2 0.4 0.6 0.8 1 図 6: 決定木の結果 表で示す通り,2013∼2015 年度における正答率はほ ぼ同じであるのに対し,2011,2012 年度では明らかに正 答率が低い。これは,これらの年度が 2015 年度による 傾向と異なる症例からなることを示唆しており,今後, これらの検討をしていく予定である。 さらに,正答率という観点からは,SVM の正答率は 決定木と同等あるいはそれより低めである。モデル構 築に使用したキーワードの選択が overfitting であった のか,その線形結合による単純なモデルが問題なのか

(6)

はさらなる検証が必要であり,これについても今後進 めていく予定である。

5

おわりに

本研究では,同一 DPC における複数の病態があり 得る場合,それらを分離する方法として混合分布モデ ルを,またその分離の特徴付けを行うための分類モデ ルの生成について,実際の症例を用いて評価した結果 を示した。これらによって,同一 DPC からの時系列分 析等,病態との関係が重要となる知識の獲得のために 適切な実例の確保するためのフィリタリングの方法と して,これらの方法が有効であることが示された。本 稿では,混合分布モデルについて,正規性に着目して, 分析を進めたが,今後は,正規分布とは異なる分布を とりうる場合について検討を進める予定である。

謝辞

本研究は日本医療研究開発機構・臨床研究・治験推 進研究事業 15lk1010003h0001 「医用知能情報システ ム基盤の研究開発」の助成によった。

参考文献

[1] DPC 点数早見表 診断群分類樹形図と包括点数・ 対象疾患一覧. 医学通信社, 2009.

[2] Tatiana Benaglia, Didier Chauveau, David R. Hunter, and Derek Young. mixtools: An r pack-age for analyzing finite mixture models. Journal

of Statistical Software, 32(6):1–29, 2009.

[3] Ian Felllows. Word clouds. https: //cran.r-project.org/web/packages/ wordcloud/index.html, 2014.

[4] Haruko Iwata, Shoji Hirano, and Shusaku Tsumoto. Maintenance and discovery of do-main knowledge for nursing care using data in hospital information system. Fundam. Inform., 137(2):237–252, 2015.

[5] Alexandros Karatzoglou, Alex Smola, Kurt Hornik, and Achim Zeileis. kernlab – an S4 pack-age for kernel methods in R. Journal of Statistical

Software, 11(9):1–20, 2004.

[6] Friedrich Leisch. Flexmix: A general framework for finite mixture models and latent class regres-sion in r. Journal of Statistical Software, 11(8):1– 18, 2004.

[7] G. J. McLachlan and D. Peel. Finite Mixture

Models. Wiley, New York, 2000.

[8] World Health Organization. ICD-10. ICD-10 / World Health Organization. World Health Orga-nization, 1993.

[9] Shusaku Tsumoto, Haruko Iwata, Shoji Hirano, and Yuko Tsumoto. Similarity-based behavior and process mining of medical practices. Future

Generation Comp. Syst., 33:21–31, 2014.

[10] 石田基広. Rmecab. http://rmecab.jp/wiki/ index.php?RMeCabFunctions, 2016.

表 1: データと混合分布モデルのあてはめの結果 DPC 名称 DPC コード 件数 正規性 二峰性 平均値 中央値 白内障、水晶体の疾患 手術手術あり 重症度等片眼 020110xx97xxx0 445 3.27 3 白内障、水晶体の疾患 手術手術あり 重症度等両眼 020110xx97xxx1 152 7.78 8 2型糖尿病 (糖尿病性ケトアシドーシスを除く。) 100070xxxxxxxx 145 ○ 12.90 13 肺の悪性腫瘍 手術手術あり 処置等2なし 040040xx97x0xx 131
表 4: 決定木の結果 2015 年度 2014 年度 2013 年度 2012 年度 2011 年度 2015 年度 0.763 0.618 0.740 0.595 0.605 2014 年度 0.813 0.764 0.750 0.620 0.645 2013 年度 0.775 0.764 0.720 0.722 0.737 2012 年度 0.575 0.697 0.660 0.658 0.553 2011 年度 0.688 0.438 0.610 0.570 0.605 表 5: SVM の結果 2

参照

関連したドキュメント

In this paper, first we give a theorem which generalizes the Banach contraction principle and fixed point theorems given by many authors, and then a fixed point theorem for

This, together with the observations on action calculi and acyclic sharing theories, immediately implies that the models of a reflexive action calculus are given by models of

[14.] It must, however, be remembered, as a part of such development, that although, when this condition (232) or (235) or (236) is satisfied, the three auxiliary problems above

But before maximizing the entropy function one has to see whether the given moment values are consistent or not i.e whether there is any probability distribution which corresponds

Using the multi-scale convergence method, we derive a homogenization result whose limit problem is defined on a fixed domain and is of the same type as the problem with

A Melnikov analysis of single-degree-of-freedom (DOF) oscillators is performed by tak- ing into account the first (classical) and higher-order Melnikov functions, by

Indeed, when GCD(p, n) = 2, the Gelfand model M splits also in a differ- ent way as the direct sum of two distinguished modules: the symmetric submodule M Sym , which is spanned by

Motivated by the brilliant observation of Kowalewski that integrable cases of the heavy top are integrated by means of elliptic and hyperelliptic integrals and that, therefore,