医療情報学会・人工知能学会 AIM 合同研究会資料 SIG-AIMED-021-07
07-01
機械学習を適用した PSA マーカーによる前立腺癌の予測
Machine learning application in prostate cancer prediction using PSAV and PSAD
長谷川守邦
1、林貴之
2、橋本賢一郎
3、新田聡
4、田沼光三郎
4、目翔太郎
4、遠藤剛
4、堤
雅一
4Morikuni Hasegawa
1, Takayuki Hayashi
2, Kenichiro Hashimoto
3,Satoshi Nitta
4,
Kozaburo Tanuma
4, Shotaro Sakka
4, Tsuyoshi Endoh
4and Masakazu Tsutsumi
41
日立製作所 ヘルスケアビジネスユニット
1Hitachi,Ltd. Healthcare Business Unit
2
日立製作所 公共社会ビジネスユニット
1Hitachi,Ltd. Government, Public Corporation & Social Infrastructure Business Unit
3
日立総合病院 情報システム部
1Hitachi General Hospital, Dept. of Information Systems
4
日立総合病院 泌尿器科
1Hitachi General Hospital, Dept. of Urology
Abstract: PSA is an excellent marker of prostate cancer; however, it is influenced by several factors, and
level instability is problematic. We examined the possibility of predicting prostate cancer from changes in the PSA level using the following machine learning technologies of neural network(BP: back propagation), SVM(support Vector Machine) and RF(Random Forest). The accurate diagnosis rates were approximately 70% and AUCs calculated were more than 0.75. AUCs calculated by machine learning were superior to PSAV and PSAD, and no significant difference was found among the three machine learning methodologies. Machine learning technologies predicted prostate cancer based on changes in the PSA level more efficiently than PSAV or PSAD.
1.はじめに
機械学習や深層学習は、今後、ヘルスケアの様々 な分野で必要不可欠の技術になると考えられるが、 実際の患者への適用には技術の信頼性がハードルと なる。そこで本研究では、一般的な機械学習の技術 がどの程度使えるものになるのか実際の患者データ を使って検証することにした。本研究は、2015 年 4 月より 2017 年 9 月まで実施した一連の研究の一部を 紹介するものである。2.臨床現場の問題意識
前立腺癌の診断では生検により組織を採取して病 理検査を行うことが一般的であるが、生検は患者へ の負担が大きいため、PSA 腫瘍マーカーや MRI 画像 などによって生検および再生検の要否を判断してい る。PSA マーカーは前立腺癌の優れたマーカーだが、 いくつかの要因の影響を受け、レベルの不安定性が 問題になる(図 1)。例えば前立腺癌なのか炎症なの か判断に困ることがある。 そこで、もし PSA の複数回の採血結果の変動を機 械学習で加味することにより前立腺癌を効率よく予 測できるのであれば生検のタイミングが適切になり 患者負担も減らせると考えた。 (図1)Front-line doctors have these impressions, however, can not precisely explain
0 2 4 6 8 10 12 14 Cancer ? Not cancer? Prostatitis? PSA (ng/l) Duration Figure1
医療情報学会・人工知能学会 AIM 合同研究会資料 SIG-AIMED-021-07 07-02
3.手法
3.1.対象患者
2002 年 10 月から 2016 年 6 月までに日立総合病 院で前立腺生検を受けた 3911 名のうち過去 2 年分の 連続した PSA データがある 512 名を対象として母集 団 A とした(図2)。さらに初回の生検時のデータ のみを使って母集団 B とした。母集団 A と母集団 B の2つの母集団を評価する理由は、医師が2回目以 降の生検を実施することの心理バイアスを除外する ことができるかを評価するためである。 (図2)3.2.手法
■手法 教師あり学習モデルとして、データニューラルネ ットワークバックプロパゲーション(BP)、サポー トベクターマシン(SVM)、ランダムフォレスト(RF) 3 つのモデルを使用して、PSA レベルの変化から前 立腺癌を予測する可能性を検討した。 ■データ 入力データには、対象症例の年齢、最新の生検日 から過去 2 年間での PSA(最大値、最小値、中間値、 平均、分散)、膿尿の有無、前立腺体積を使った。図 3にイメージ図を示す。また教師データには対象症 例の前立腺生検の結果(癌あり・癌なし)を選定し た。 (図3:イメージ図) ■精度検証 入力データは 90%の症例を学習用とし、残りの 10%を検証に当て、その診断精度を算出した。なお、 この間の人為的 Artifact を除外するために 10 分割交 差検証法を用いて分析した。4.結果
4.1.正診率
正診率は3つの機械学習手法ともに約 70%となっ た。母集団 B では母集団 A よりも若干高いが、誤差 を含めると大きな差はないと言える。(表1) (表1)4.2.ROC 曲線
機械学習モデルの正確性を評価するために、3つ の手法ごとに計算された値を使って ROC 曲線を描 いた。機械学習で計算された FP(False Positive) Rate と TP(True Positive) Rate をそれぞれ横軸、縦軸とし て ROC 曲線をマッピングした。手法の有効性を評価するためには、既存の手法と の比較が欠かせない。そこで、診療の現場で使われ ている指標である PSA Velocity、PSA Density につい て、それぞれ ROC 曲線に追加して描画した。 母集団 A についての結果を図4に、母集団 B につ いての結果を図5に示す。 (図4) 2002年10月~2016年6月までに当院で前立腺生検を受けた3911名 アボルブなどPSAに影響する薬物投与症例 複数回のPSA結果があるが連続した結果でない症例 2年分の連続したPSA結果がある512名 N=657 初回生検のデータのみ N=491 母集団A 母集団B 除外 除外 0 2 4 6 8 10 -72 -60 -48 -36 -24 -12 0 PSA 生検日 ← 生検日より過去の月数 機械学習手法 母集団A 母集団B BP 69.5(+/-0.8) 71.6(+/-0.9) SVM 69.9(+/-0.5) 71.6(+/-2.6) RF 69.1(+/-0.5) 72.1(+/-1.1)
医療情報学会・人工知能学会 AIM 合同研究会資料 SIG-AIMED-021-07
07-03 (図5)
その結果、機械学習で計算された ROC 曲線はいず れも PSA Velocity、PSA Density の ROC 曲線よりも縦 軸側に位置しており、機械学習モデルが既存の指標 よりも有効であることを示している。 また、ROC 曲線の信頼度を占める指標である AUC についても、高い値を示した。母集団 A,母集団 B そ れぞれについて表2、表3に示す。 (表2:母集団 A) (表3:母集団 B) AUC の値は、母集団 A については、SVM:0.75、 BP:0.76、RF:0.78 となり、PSA Velocity: 0.53、PSA Density:0.45 を大きく上回る。母集団については、 SVM:0.63、BP:0.69、RF:0.64 となり、PSA Velocity : 0.55、 PSA Density :0.41 を大きく上回る。
つまり機械学習による AUC はいずれも伝統的な指 標である PSA Velocity や PSA Density を上回り、予 測手法としての有効性を示した。また3つの手法で 大きな違いはないことがわかった。
5.まとめ
過去 2 年分の連続した PSA データがあれば約 70% の正診率で前立腺癌が診断可能であることがわかっ た。AUC も 0.7 前後となり現場で使われている PSA velocity や PSA density よりも高い信頼度を示した。これらのことから、今後、機械学習が前立腺生検 の必要性を判断する有用なツールになる可能性を示 した。今後、実際の臨床へ適用していくためには、 さらに類似の研究報告との比較や、入力データや手 法を工夫することで精度を高めていくことと、信頼 度を担保する仕組みの構築が必要である。
参考文献
[1] Masakazu Tsutsumi, Satoshi Nitta, Shotaro Sakka, Tsuyoshi Endoh, Kenichiro Hashimoto, Morikuni Hasegawa , Takayuki Hayashi: “Artificial intelligence (AI) can more efficiently predict prostate cancer compared with PSAV and PSAD”, 37th
Congress of the Societe Internationale d’Urologie, Oct19-22, 2017 [2] 新田聡、堤雅一、田沼光三郎、目翔太郎、遠藤剛、
橋本賢一郎、長谷川守邦、林貴之:「人工知能(AI)は
PSA の変化から前立腺癌を予測可能か」、第 55 回日