• 検索結果がありません。

光干渉断層計による画像と機械学習を用いた眼底疾患スクリーニング

N/A
N/A
Protected

Academic year: 2021

シェア "光干渉断層計による画像と機械学習を用いた眼底疾患スクリーニング"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

医療情報学会・人工知能学会 AIM 合同研究会資料 SIG-AIMED-004-05

光干渉断層計による画像と機械学習を用いた

眼底疾患スクリーニング

Screening of Fundus Diseases through

Optical Coherence Tomography Image using Machine Learning

綾塚 祐二

1

工藤 裕介

1

雅樂 隆基

1

桑山 創一郎

2

臼井 英晶

2

加藤 亜紀

2

小椋 祐一郎

2

安川 力

2

Yuji AYATSUKA

1

, Yusuke KUDO

1

, Takaki UTA

1

, Soichiro KUWAYAMA

2

,

Hideaki USUI

2

, Aki KATO

2

, Yuichiro OGURA

2

, Tsutomu YASUKAWA

2

1

株式会社クレスコ

1

CRESCO LTD.

2

名古屋市立大学大学院医学研究科視覚科学

2

Department of Ophthalmology and Visual Science,

Nagoya City University Graduate School of Medical Sciences

Abstract: Optical Coherence Tomography (OCT) brings sliced images of fundus non-invasively

and great help for diagnosing fundus diseases. It requires skilled doctors for interpretation of those images, so that automatic interpretation will help wider use of OCT to detect fundus diseases in their early stages. We applied machine learning techinique with Convolutional Neural Network for OCT images to screen fundus diseases. We compared some algorithms, including use of different types of trained models, combinations of results for vertical and horizontal slices and different thresholds.

1

はじめに

眼科疾患の診断において、光干渉断層計 (Optical Co-herence Tomography, OCT) は眼底の断層画像を非侵 襲で得られ、情報量も多い検査手段である (図 1)。患 者の負担も少ないので、健康診断の場などのスクリー ニングに応用すれば眼底疾患の早期発見に繋げられる と期待できる。しかし、得られた画像の読影には充分 な知識や経験が必要であり、そうした専門の医師の数 は充分にいるとは言えない。 我々は OCT 画像と、その読影に充分な経験を持つ医 師の診断とを CNN (Convolutional Neural Network) に学習させ、診断の補助を行うための研究を行ってい る。21 種の疾患、正常状態、判断不能としたものの計 23 種を学習させたモデルは、正答率が 83%、確信度の 高い候補上位 3 以内に正しい (医師の診断と同じ) 診断 名が入るのは 92% という性能を示した [1]。 疾患名の判別まではできなくとも、正常か、何らか の疾患があるかを充分な精度で分類できれば、健康診 連絡先: 株式会社クレスコ 技術研究所 〒 108-6026 東京都港区港南 2-15-1 品川インターシティA 棟 26F E-mail: y-ayatsuka@cresco.co.jp 図 1: OCT で得られる眼底の画像の例 断などでのスクリーニング用途で用いることができる。 早期の眼科疾患の発見は失明の回避や医療費の削減な どにつながり、患者個人だけでなく社会的にも重要で あるが、対象者数も多くなるので読影しなければなら ない総数も格段に多くなる。人手だけでは対応しきれ ないかもしれず、機械学習によるスクリーニングはそ れに対応するための手段となる。 スクリーニングのためには、疾患名の分類を行う学 習済みモデルの出力から疾患の有無を検討することも 可能であるが、最初から CNN を疾患の有無のみに特 化して学習させることも可能である。本稿では、OCT 画像と機械学習を用いて眼科疾患の有無のスクリーニ 05-1

(2)

ングを行うためのこうした複数のアルゴリズムと、そ れらを比較した実験の結果を述べる。

2

スクリーニングのアルゴリズム

前節で述べたとおり、CNN を用いてスクリーニング を行うためには、疾患名まで学習させた学習済みモデ ルを使うこともできれば、疾患の有無のみに特化して 学習させた学習済みモデルを使うこともできる。また、 OCT は眼底の複数方向 (通常は垂直および水平方向) の断層画像を生成することができるので、これらの結 果を併せて判断させることもできる。そして、何らか の疾患 (の疑い) ありと見做す確信度の閾値をどれくら いに設定するかによっても、当然性能は変わる。比較 は、これら三つの種類の違いを組み合わせて行なった。

2.1

疾患名を学習させるか、有無に特化す

るか

機械学習の性質を考えると、疾患の有無の分類が目 的であれば、それに特化した学習を行わせたほうが性 能を上げやすいのではないか、と推測できる。一方で、 具体的な疾患名は学習時の付加的な情報となるので、 疾患ごとの適切な学習が行え、結果として疾患の有無 の区分けの性能が向上する、とも考えられる。モデル で分類すべき数の違いは、チューニングのしやすさな どにも影響する。 本研究では、疾患名の分類の学習については、透見 不能やスキーシスなども含め、32 種の疾患名や病変と、 正常状態の計 33 種類を分類させた。黄斑部付近の OCT 画像を用いているので、緑内障は含んでいない。疾患 の有無に特化した学習では、正常状態以外は全て疾患 の疑い有りとして学習させた。

2.2

垂直断面に対する結果と水平断面に対

する結果の統合

複数の断面を併せて判断するにはさまざまな方法を 取りうる。本研究では、縦断面、横断面それぞれに対 して学習済みモデルが出力した結果のリスト (診断名 もしくは疾患の有無と、それに対する確信度の組のリ スト) から、(機械学習に依らず) 統合した結果のリス トを生成する、という方法をとった。 疾患による病変は眼底の全体に均一に現れるわけで はないので、二方向の断面のどちらかでしか病変は見 られないこともある。また、疾患の見逃しを抑えるこ とも考慮すると、併せる際には「疾患有り」の判定を 優先し、重く取り扱うことが適切だと考えられる。 そこで、二つの断面に対する分類結果において診断 名が「正常」 (疾患なし) であるものの確信度が低いほ うをとるようにする。後述する実験では、それが妥当で あるかどうかを検証するために、比較対象として、疾患 の有無のみを分類する学習済みモデルに関して、二つ のリストの確信度の平均値を取ることで統合する、と いうパターンも用意した。

2.3

閾値の調整

目的とする分類が二種であれば、50% を閾値として 区切るのが最も単純かつ自然である。しかし前述のよ うに、疾患の発見という意味では「疾患有り」を重め に扱ったほうが適切である。最適な閾値の決め方を一 般的に設定することは困難であると思われるので、本 研究では、実験に用いる各学習済みモデルで 10%きざ みで閾値を変え、感度や特異度のバランス (スクリーニ ングが目的であるので、感度をやや優先している) を みてそれぞれの場合で設定した。実験では、これと閾 値 50% のものとを比較する。

3

実験設定

CNN による学習のプラットフォームには Caffe を用 い、ネットワーク構造はすべて畳み込み層 3 段、全結 合層 2 段のものを使用し、それぞれの場合に対しパラ メータをチューニングした。閾値の違いは、テスト結果 を集計する際に適用しており、閾値のみが違うパター ンには同じ学習済みモデルを用いている。垂直・水平ど ちらの断面に対しても同じ学習済みモデルを用いてい る。実行環境は、すべて AWS (Amazon Web Service) の GPU インスタンスである。 学習にはニデック社の 3000 Advance 及び RS-330 で撮影された画像、垂直・水平断面併せて 3,552 枚 を用意した。同じ眼に対して、垂直・水平どちらかの 断面の画像が不鮮明にしか得られない場合があったの で、その場合は不鮮明なもののみを取り除いている (す なわち、垂直・水平のどちらかの画像しかないものが ある)。実際の学習は、これを、データオーグメンテー ション (回転などを行なった画像を追加する) により 92,352 枚にして用いている。「正解」の診断名は OCT 画像からの診断に充分な経験を持つ著者らの一人が判 断している。 テストには同機種で得られた、214 眼分、414 枚の画 像を用いた (学習に用いたのと同じ眼の画像は含まな い)。垂直・水平どちらかのみしかないもの (14 枚) に 関して、実際の使用場面でもどちらかの画像が不鮮明 といったことは起こるという想定で、両断面を併せる 05-2

(3)

処理では一つの断面に関する結果をそのまま結果とし ている。 比較したのは、次の 10 パターンである。以下では、 各パターンを必要に応じてこのアルファベットや数字 の組み合わせで A-1 のように指し示す。 A. 疾患の有無に特化した学習済みモデルを用いる (1) 垂直・水平それぞれの画像だけで判断 a. 閾値 50% b. 閾値 80% (2) 垂直・水平の画像を併せて判断 i. 疾患ありの確信度を比較し高いほうを 取る a. 閾値 50% b. 閾値 30% ii. 確信度の平均を取る a. 閾値 50% b. 閾値 70% B. 疾患名を分類する学習済みモデルから疾患の有 無を判断する (1) 垂直・水平それぞれの画像だけで判断 a. 閾値 50% b. 閾値 80% (2) 垂直・水平の画像を併せて判断 a. 閾値 50% b. 閾値 80%

4

実験結果

表 1∼5 に各パターンの結果 (正確度 (accuracy)、感 度 (recall)、特異度 (specificity)) をまとめる。閾値の 違いは一つの表に入れている。 疾患の有無に特化した学習済みモデルを用いた場合 も、疾患名を分類する学習済みモデルを用いた場合も、 水平・垂直断面を別々に判断させた場合よりも併せて 判断させたほうが正確度や感度が向上している。疾患 名を分類する学習済みモデルを用いた場合の特異度は やや下がっているが、他のパターンと比較して良い値 になっている。 閾値 50% の場合は疾患の有無に特化した学習済みモ デルを用いたほうが感度が 0.1 ポイント近く高くなっ ている。しかし特異度が 0.1 ポイント以上低くなって おり、閾値を調整した場合の感度、特異度のバランス は、疾患名を分類する学習済みモデルを利用したもの のほうがよいと言える。 表 1: 有無に特化、縦横別 (A-1) 閾値 50% 閾値 80% 正確度 0.877 0.862 感度 0.894 0.929 特異度 0.849 0.755 表 2: 有無に特化、縦横統合 (比較) (A-2-i) 閾値 50% 閾値 30% 正確度 0.883 0.907 感度 0.940 0.933 特異度 0.788 0.863 表 3: 有無に特化、縦横統合 (平均) (A-2-ii) 閾値 50% 閾値 70% 正確度 0.897 0.893 感度 0.925 0.963 特異度 0.850 0.775 表 4: 疾患名を分類、縦横別 (B-1) 閾値 50% 閾値 80% 正確度 0.870 0.908 感度 0.804 0.894 特異度 0.975 0.931 表 5: 疾患名を分類、縦横統合 (B-2) 閾値 50% 閾値 80% 正確度 0.893 0.925 感度 0.851 0.940 特異度 0.962 0.900 今回比較した 10 パターンのうち最もバランスがよい ものは、疾患名を分類する学習済みモデルを利用し、垂 直・水平断面を併せ、閾値 80% で判断したもの (B-2-b) となった。感度のみを見ると疾患の有無に特化した学 習済みモデルを用いた A-2-ii-b のパターンのほうが上 回っているが、そのパターンでは特異度が大きく B-2-b を下回る。

5

考察

本研究での比較は、学習データは同じものに揃えて いるが、各学習済みモデルのチューニングは、機械学習 の性質上、それぞれ最良のものであるかどうかや、程 度として揃っているかどうかなどは保証できない。ま た、別の学習データやテストデータに対して同様の実 05-3

(4)

験を行うと、細かい結果は当然変わりうるし、有意性 を検証する必要もある。 しかし、水平・垂直断面を別に分類した場合よりも、 併せて判断させるほうが、また閾値を調整したほうが 感度などが向上するのは、同じ学習済みモデルでの比 較なので、チューニングの影響はあまり受けない。また 定性的な議論から推測されることと一致するので、学 習データなどによる違いも比較的少ないと思われる。 疾患の有無の判別を目的としながら、それに特化し た学習を行なった学習済みモデルよりも疾患名を分類 する学習済みモデルのほうが高い感度などを出しうる のは、疾患ごとにそれに伴う症状の現れ方・程度の違 いなどを細かく学習している可能性がある。また疾患 ごとに発症していると言えるか否かの境界が違ってい る可能性もある。 総合的には、ネットワーク構造の調整などと同様に、 疾患名の分類を学習させ、その出力を用いて疾患の有 無を判別するというアルゴリズムもチューニングの選 択肢の一つとして考慮すべきであると言える。垂直・水 平両断面に対する分類結果を合わせて判別を行うとい うアルゴリズムも含め、これらは CNN と他のアルゴ リズムを組み合わせているとみなせるが、このような 組み合わせが有効な場面は、OCT 画像以外の他の課題 に対してもあるものと思われる。 本研究の実験結果は、これらのアルゴリズムの選択 やチューニング次第で、OCT 画像と機械学習による眼 底疾患のスクリーニングが実用的な精度で行えること を示していると考えられる。本研究では緑内障は対象 外となっているが、眼底領域の画像に機械学習を適用 して緑内障の診断やタイプの識別を行う研究も行われ ている [2, 3, 4]。これらを組み合わせることで、より総 合的な眼底疾患の判別が可能になることが期待できる。

6

まとめ

本稿では、光干渉断層計で得られる眼底の断層画像 から疾患の有無を、機械学習を用いてスクリーニング するアルゴリズムについて述べた。疾患の有無に特化 した学習済みモデルで判別する場合と疾患名を分類す る学習済みモデルを用いて有無を判別した場合、また、 垂直・水平の断層画像をそれぞれ単独で判別する場合 と両者の判別結果を合わせて判別する場合など、10 パ ターンの方法の比較実験を行なった。 アルゴリズムの選択を含めたチューニングを行うこ とで、光干渉断層計で得られる眼底の断層画像からの 疾患の有無のスクリーニングは実用的な精度が出せる と考えられる。今後は、精度の向上や他の種類の眼科 疾患の判別など、より実用的な利用ができることを目 指し研究を進める。

参考文献

[1] 綾塚祐二, 桑山創一郎, 臼井英晶, 加藤亜紀, 小椋祐 一郎, 安川力. 光干渉断層計による画像と機械学習を 用いた眼病の判別. 信学技報 (IEICE Technical Re-port), Vol. 116, No. 298, pp. 11–14. 電子情報通信 学会 医用画像研究会, 電子情報通信学会, November 2016. [2] 安光州, 面高宗子, 津田聡, 志賀由己浩, 高田菜生子, 木川勉, 中澤徹, 横田秀夫, 秋葉正博. 眼底検査装 置からの出力データを用いた緑内障視神経乳頭形 状分類の機械学習モデルの構築. 信学技報 (IEICE Technical Report), Vol. 117, No. 50, pp. 63–66. 電 子情報通信学会 医用画像研究会, 電子情報通信学 会, May 2017. [3] 面高宗子, 安光州, 木川勉, 横田秀夫, 秋葉正博, 中 澤徹. Oct 画像と眼底写真を用いた正常眼と緑内障 眼を区別する機械学習モデルの構築. 第 71 回日本 臨床眼科学会 プログラム・抄録集, Vol. 71, p. 86. 日本眼科学会, October 2017. [4] 坂口美華, 末岡榮三郎, 西村知久, 奥村佳雄, 菅谷俊 二, 江内田寛. 人工知能を用いた眼底診断支援シス テムの開発と臨床評価. 第 71 回日本臨床眼科学会 プログラム・抄録集, Vol. 71, p. 86. 日本眼科学会, October 2017. 05-4

参照

関連したドキュメント

プログラムに参加したどの生徒も週末になると大

このように,フラッシュマーケティングのためのサイトを運営するパブ

テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。

次に我々の結果を述べるために Kronheimer の ALE gravitational instanton の構成 [Kronheimer] を復習する。なお,これ以降の section では dual space に induce され

このように、このWの姿を捉えることを通して、「子どもが生き、自ら願いを形成し実現しよう

このような情念の側面を取り扱わないことには それなりの理由がある。しかし、リードもまた

本アルゴリズムを、図 5.2.1 に示すメカニカルシールの各種故障モードを再現するために設 定した異常状態模擬試験に対して適用した結果、本書

計算で求めた理論値と比較検討した。その結果をFig・3‑12に示す。図中の実線は