医療情報学会・人工知能学会 AIM 合同研究会資料 SIG-AIMED-003-03
機械学習手法を用いた脳梗塞の予後予測因子の抽出
Extracting Predictive Indicator for Prognosis of Cerebral Infarction
Using Machine Learning Techniques
野原 康伸
1∗松本 晃太郎
2中島 直樹
1Yasunobu Nohara
1Koutarou Matsumoto
2Naoki Nakashima
11
九州大学病院
1
Kyushu University Hospital
2済生会熊本病院
2
Saiseikai Kumamoto Hospital
Abstract: We extracted important factors for prognosis of cerebral infection. We analyzed data
of 1,710 patients with 1,566 variables using gradient boosting decision tree, one of the tree-based machine learning techniques. Extracted factors include not only well known factors such as mRS, age, etc but also new indicators such as modified basal energy expenditure and Albumin/Globrin ratio.
1
はじめに
クリニカルパスは医療行為標準化の為の重要な方法 の一つであり、医療行為のばらつきを減らし [1]、医療 費や入院期間といった治療成績 (アウトカム) を改善す ることが可能になる。本研究の目的は、パスにおける アウトカムに影響を与える因子を探査的に抽出するこ とである。あらかじめ、患者の予後を予測することが できれば、リハビリなどの計画を立てやすくなるほか、 予後悪化を防ぐための方策をパスに取り込むことなど が可能になる。 本解析では、脳梗塞患者のうち、比較的軽症な患者 に使用される自宅退院パスを適用された 1710 名の患者 のデータを対象として、決定木を用いた機械学習手法 の一つである GBDT を用いて、予後の重要因子を抽出 する。また、どの因子がどのように患者予後と関連す るかについても示す。2
方法
済生会熊本病院では、2011 年 10 月から 2016 年 10 月の期間において、脳梗塞で 3,920 名の患者が入院し、 そのうち 1,849 名の患者に比較的軽症な脳梗塞に用い ∗連絡先: 九州大学病院 〒 812-8582 福岡市東区馬出 3-1-1 E-mail: [email protected] られる自宅退院パスが適用された。未測定の項目など を含む患者を除外し、最終的に 1,710 名の患者に対す るデータを用いて予後予測因子を抽出する。2.1
目的変数
患者予後を示す指標として、mRS (modified Rankin Scale) と ADL (Activity of Daily Living) の 2 種類を 考え、目的変数として使用する。 mRS は、脳卒中患者の日常生活における身体状態を 評価するための指標であり、0∼6 までの7段階で評価 される。数値が大きいほど重症であり、3以上は日常 生活での自立が困難と評価されるため、予後不良を表 す基準としてよく用いられる。本論文でも、退院時に おける mRS が3以上であるか否かを予後指標の一つ として用いる。 ADL は、日常生活における基本的動作の自立の程度 を表した指標で、食事やトイレ動作などの日常動作各 10 項目に関して、自立・部分介助・全介助の3段階で 評価される。日常生活において1項目でも全介助が必 要な動作があると、患者の生活に大きな影響を与える と考えられるため、10 項目中に全介助が必要な項目が 一つでもあるか否かを予後指標として用いる。2.2
説明変数
入院期間中、患者に関する様々な情報が取得できる が、入院早期での予後予測を可能とするため、入院初 日に取得可能な情報 (1566 変数) を用いる。 説明変数は、下記の 5 つのデータソースから抽出した。 2.2.1 DPC 様式 1 情報 済生会熊本病院は、DPC 対象病院の一つであり、様 式 1 とよばれる退院時サマリーを作成している。様式 1のデータフォーマットは、全国で共通であり、病院情 報や患者情報 (性別、生年月日など)、入退院情報 (入院 日、退院日など)、診断情報 (発症病名や併存症など)、 手術情報(手術名や手術日など)、そしてケア情報 (入 退院時における ADL や Japan Coma Scale など) の情 報が含まれている。 2.2.2 神経内科退院時サマリー 神経内科では、様式 1 とは別に、患者に対して退院 時サマリーを作成しており、救急処置の内容や、各時 間帯における NIHSS、検査結果、抗血栓薬の処方、そ の他神経内科に特有の情報などが含まれている。 2.2.3 看護師観察情報 入院期間中、看護師は毎日患者状態を観察し、その 結果を記録している。観察記録には、意識レベルや各 部位の麻痺の程度、食事の摂取状況、痛みやバイタル 情報などが記載されている。 2.2.4 検査結果 検査結果には、血液検体検査や、血液ガス検査、尿 検査の結果などが含まれる。 2.2.5 栄養管理情報 管理栄養士によって、患者の栄養状態に関するレポー トが作成されており、栄養評価やエネルギー消費量等 の情報が記載されている。2.3
分析方法
1) 医療データには非線形性が存在すること、2) 多数 の説明変数があってもうまく働くこと、3) 変数重要度 が解析結果を解釈するのに有用なことから、本論文で は、決定木をベースとした機械学習手法である Gradient Boosting Decision Tree (GBDT) [2] を解析に用いる。 GBDT を用いて、退院時における患者予後を入院初日 に入手可能な 1,566 個の説明変数で予測し、予後に強 く関連しているのはどの説明変数か、その説明変数が どう予後に影響を与えているかを解析する。 2.3.1 ブートストラッピング 大きさ n のデータセット D が与えられたとき、ここ から重複ありでランダムに n 個のデータをサンプリン グし、訓練データセット Dtとする。Dtにおける n 個 のデータ中、63.2%(= 1− e−1) のデータがユニークで あることが期待される。訓練データセット Dtとして一 度も選ばれなかったデータ D− Dtを検証用データセッ ト Dvとして用いる。Dvは、平均して元のデータセッ トの 36.8%のデータに当たることになる。Dtを用いて学習し、Dvを用いて、AUC (area under curve) を評
価することで、予測モデルの正確性を検証する。この 際、各説明変数の変数重要度の計算も併せて行う。 上記手順を 20 回測定し、AUC と各変数の重要度の 平均を計算する。なお、GBDT のハイパーパラメータ (ラウンド数や決定木の最大深さ、学習率など) は、10 分割交差検証による AUC の平均を最大化するように チューニングして決定した。
2.3.2 Partial Dependence Plot
決定木をベースとした機械学習手法では、各説明変 数が目的変数の予測にどれだけ寄与しているかを示す 変数重要度を計算することができる。しかし、変数重 要度は説明変数と目的変数の関連性の強さを示すのみ で、説明変数の値が変化したとき、目的変数がどのよ うに変化するかは分からない。
PDP(Partial Dependence Plot; 部分従属グラフ) は、 Friedman [2] が提案した、高次元関数を可視化するた めの手法の一つであり、目的変数と説明変数の関係を 示すのに有用である。f (x1, x2,· · · , xp) を p 個の説明変 数を用いてアウトカムを予測する予測器とし、i∈ [1, p] 番目の説明変数 xiの効果を可視化することを考える。 このとき PDP を表す Fi(x) は、式 (1) で与えられる。 Fi(x) = 1 N N ∑ j=1 f (xj1,· · · , xji−1, x, xji+1,· · · , xjp) (1)
ここで、xj i は、ユーザ j∈ [1, N] の i 番目の説明変数の 値を表すものとする。式 (1) は、N 人全てのユーザの、 効果を見たい説明変数 xiを全て x に変化させたと仮定 したときのアウトカムの平均であると見ることができ る。Fi(xa) と Fi(xb) では、i 番目の説明変数をそれぞ れ xaと xbに変えただけで、その他の説明変数は全て 同じものを用いている。したがって、Fi(xb)− Fi(xa) は、他の説明変数の影響を除去した、i 番目の説明変数 を xaから xbに変えた時の純粋な変化を表していると 解釈できる [3, 4]。本論文では、ある説明変数がアウト カムに与える影響を解釈するための手法として、PDP を用いる。
3
結果
1,566 個の説明変数を用いて、2 種類の患者予後を予 測する予測モデルを GBDT により構築し、重要予測 因子を抽出した。mRS3 以上に関する予後予測モデル の AUC は 0.839、ADL に関する予測モデルの AUC は 0.856 であり、どちらも十分な汎化性能を有していると 考えられる。mRS の予後予測に関する寄与度の高い重 要因子 Top20 は、以下の通りである。 1. 発症前 mRS 2. 入院時 NIHSS スコアの合計値 3. 入院時年齢 4. 血液: D ダイマー 5. 血液: カリウム 6. 入院時 ADL(排尿管理) 7. 血液: A/G 比 8. 体重 9. 最終未発症確認から来院までの時間 10. 一過性脳虚血発作(TIA) の有無 11. 分枝粥腫型梗塞 (BAD) の有無 12. 入院時 ADL(平地歩行) 13. 心拍数 14. 収縮期血圧 15. 補正 BEE 16. 血液: アルカリフォスファターゼ (ALP) 17. 血液: γ-GTP 18. BMI 19. 入院時 ADL(トイレ動作) 20. 血液: ミオグロビン また、ADL の予測に関する寄与度の高い重要因子 Top20 は、次の通りである。 1. 発症前 mRS 2. 入院時年齢 3. 意識レベル JCS 4. 入院時 ADL(トイレ動作) 5. 補正 BEE 6. 入院時 ADL(排尿管理) 7. 入院時 NIHSS スコアの合計値 8. 麻痺レベル左上肢 9. 入院時 ADL(整容) 10. 血液: A/G 比 11. 血液: アルカリフォスファターゼ (ALP) 12. 血液: ミオグロビン 13. 血液: D ダイマー 14. 血液: CK(CPK) 15. GCS(言語機能) 16. 血液: フェリチン 17. 身長 18. 最終未発症確認から来院までの時間 19. 入院時 ADL(食事) 20. 血液: カリウム 抽出された重要因子の中には、これまで臨床の現場 でも予後予測因子として広く知られている発症前 mRS や、年齢、入院時 ADL、NIHSS スコア、JCS、D ダイ マー、GCS などが抽出された。本手法の有効性を確認 するために、いくつかの既知の因子に関する PDP を示 す。図 1 と図 2 は、発症前 mRS が高いほど、また入院 時 NIHSS スコアの合計が大きいほど、退院時 ADL が 全介助ありになるリスクが高いことを示している。図 3 は、D ダイマーが 0.75 を超えたあたりから、退院時 ADL が全介助ありになるリスクが高くなることを示し ている。図 4 は、年齢が 60 歳を超えたあたりから、退図 1: 発症前 mRS が、退院時 ADL 全介助ありに与え る影響に関する PDP 図 2: 入院時 NIHSS スコアの合計が、退院時 ADL 全 介助ありに与える影響に関する PDP 院時 ADL が全介助ありになるリスクが徐々に高くな り始め、80 歳前後で大きくリスクが上昇することを示 している。図 1∼4 の PDP は、医師の臨床現場におけ る経験と整合性が取れていた。 一方で、これまでに臨床現場でも広く知られていな い指標も抽出された。補正 BEE(Basal Energy Expen-diture: 基礎エネルギー消費量) は、患者の活動状況を 考慮した一日に消費される消費カロリーの推定値であっ て、栄養管理に使用されるものである。図 6 は、補正 BEE と mRS 予後の関係を示した PDP であり、補正 BEE が 800kcal を超えると、予後悪化のリスクが低く なることがわかる。 A/G 比は、血液中のアルブミンとグロブリンの比で あり、患者の栄養状態を把握したり、肝臓などの異常 を知るためなどに用いられる。図 7 は、入院時 ADL に 全介助ありのリスクと A/G 比の関係を示した PDP で ある。A/G 比が 1.5 以上の患者群において、全介助の リスクが低くなるという結果が読み取れる。 図 3: D ダイマーが、退院時 ADL 全介助ありに与える 影響に関する PDP 図 4: 年齢が、退院時 ADL 全介助ありに与える影響に 関する PDP
4
考察
4.1
機械学習による解析に関して
年齢と例として、機械学習による解析の利点を考え てみる。一般的なロジスティック回帰解析では、説明変 数として年齢をそのまま使用したり、解析者が定めた 基準に基づいて階層化して (例えば 50 代以下、60 代、 70 代、80 代以上など) 使用される。年齢をそのまま説 明変数に加えた場合、年齢とリスクの非線形な関係を とらえることができないし、階層化する場合は閾値と 何個のグループに分割するかの両方を解析者が適切に 定める必要がある。 一方で、機械学習 (GBDT) の場合は、年齢をそのま ま説明変数として投入すれば、データに基づいて、汎 化性能を高めるように、閾値やグループ分けが自動的 に実施される。図 4 と図 5 は、2つの予後に関する年 齢の影響を示した PDP である。両図とも、加齢に伴っ て予後悪化のリスクが高くなっている点では異なるが、 その上昇は非線形であり、形も両者で異なっている。両図 5: 年齢が、退院時 mRS3 以上に与える影響に関す る PDP 図 6: 補正 BEE が、退院時 mRS3 以上に与える影響に 関する PDP 図の PDP の差は、説明変数の種類に応じて、適切に加 齢に伴う影響が評価された結果と考えられ、より正確 な解析に資していると考えられる。
4.2
新規因子に関して
補正 BEE は、消費カロリーの推定値であるが、性 別・年齢・身長・体重・活動レベル・ストレスレベルに 基づいて計算される値である。性別や年齢といった患 者状態を密接に表している指標から計算されているた め、重要因子として抽出されたと考えられる。 Tomasz らは、アルブミン高値が急性脳卒中の予後 不良リスクを軽減させると報告している [5]. また、 Palesch らは、アルブミンに神経保護効果があるとし て、脳梗塞患者に対して 25%アルブミンを投与する治 療法を提案している [6]。アルブミンは A/G 比の分子 に当たるため、高 A/G 比が予後不良リスクを低下させ るという今回の解析結果 (図 7) は、両研究と整合性が ある。ただし、A/G 比は予後予測因子として mRS で 図 7: A/G 比が、退院時 mRS3 以上に与える影響に関 する PDP 7 位、ADL で 10 位と、2つの予後評価において重要 因子として抽出されたが、両者ともアルブミンは上位 20 位以内の予後予測因子として抽出されなかった。こ の理由として、アルブミンだけでなく、A/G 比の分母 であるグロブリンが、予後と関連している可能性が示 唆され、今後の更なる調査が必要と考えられる。5
おわりに
本論文では、脳梗塞の予後に関連する重要因子の抽 出を行った。発症前 mRS といったこれまで臨床現場 でも広く知られていた指標だけでなく、補正 BEE や A/G 比といった新たな指標が予後予測因子として抽出 された。今後の課題としては、機械学習の結果を活用 しつつ、A/G 比などの影響を統計的仮説検定の枠組み で評価することなどが考えられる。謝辞
本研究は、国立研究開発法人日本医療研究開発機構 (AMED)の支援によって実施された。参考文献
[1] M. Panella, S. Marchisio and F. Di Stanislao. Re-ducing clinical variations with clinical pathways: do pathways work?, Int J Qual Health Care. 15 (6): 509521. Dec. 2003
[2] Friedman JH. Greedy Function Approximation: A Gradient Boosting Machine. The Annals of Statis-tics Vol. 29, No. 5, pp. 1189-1232, Oct. 2001
[3] Yasunobu Nohara, Yoshifuru Wakata and Naoki Nakashima. Interpreting Medical Information Us-ing Ma-chine LearnUs-ing and Individual Condi-tional Expectation, Proceedings of the 15th World Congress on Medical and Health Informatics (MedInfo2015), p.1073, Aug. 2015
[4] 野原 康伸, 若田 好史, 中島 直樹, “機械学習による 医療情報の解釈方法の提案”, 第 1 回医用人工知能 研究会, Vol. 001, No.12, 2015 年 9 月
[5] Tomasz Dziedzic, Agnieszka Slowik, Andrzej Szczudlik. Serum Albumin Level as a Predictor of Ischemic Stroke Outcome, Stroke. 2004;35:e156-e158, May 2004
[6] Palesch YY, Hill MD, Ryckborst KJ, Tamariz D, Ginsberg MD. The ALIAS Pilot Trial: a dose-escalation and safety study of albumin therapy for acute ischemic stroke–II: neurologic outcome and efficacy analysis. Stroke;37(8):2107-14. Aug. 2006