• 検索結果がありません。

検査画像情報を取り入れた医師国家試験自動解答プログラムの構築

N/A
N/A
Protected

Academic year: 2021

シェア "検査画像情報を取り入れた医師国家試験自動解答プログラムの構築"

Copied!
3
0
0

読み込み中.... (全文を見る)

全文

(1)

医療情報学会・人工知能学会 AIM 合同研究会資料 SIG-AIMED-002-06

検査画像情報を取り入れた医師国家試験自動解答プログラムの

構築

Development of a question-answering program for the medical

licensing examination with clinical images

川村 健史

1

伊藤 詩乃

1

榊原 康文

1∗

Kenji Kawamura

1

Shino Ito

1

Yasubumi Sakakibara

1 1

慶應義塾大学

1

Keio University

Abstract: In our previous study, toward a final goal to construct a medical diagnostic support system, we developed a question-answering program that automatically answers the medical li-censing examination as its pilot study. In this study, we extend the question-answering program to dealing with the clinical images.

1

はじめに

私たちはこれまで,病名診断支援システムの構築を 最終目標として,そのパイロット研究として,医師国 家試験を自動解答するプログラムの構築を行ってきた [1].医師国家試験 [2] の問題文は電子カルテの記述と類 似しており,医療の現場で用いられる病歴報告に近い ものである.その中でも問題文として患者の症状や検 査結果が与えられ,医学的な知識と診断能力を問うた めに,選択肢の中から適切な病名を解答する形式のも の(臨床実地問題)がある.先行研究 [1] において,こ のタイプの問題を解答することで,医療現場における 患者情報からの病名診断システムの土台を築いた. し かし,先行研究では臨床問題内に検査画像が含まれて いるものに関しては解析の対象外としていた.現場の 医療情報には,検査画像が存在しているものが多く,そ のため,検査画像を含む臨床問題にも対応することは 必須の課題である.本研究では,医師国家試験の画像 から情報を読み取り,医師国家試験の臨床問題のうち 画像があるものを自動解答するプログラムの構築を目 的とした.

2

方法

2.1

問題解答プログラムの構成

問題解答プログラムの概要を以下に示す. ∗連絡先:慶應義塾大学理工学部生命情報学科       〒 223-8522 横浜市港北区日吉 3-14-1        E-mail: [email protected] ၥ㢟ᩥ䛛䜙 䛾⑕≧ ⏬ീゎᯒ 䝥䝻䜾䝷䝮 ၥ㢟ᩥ ၥ㢟⏬ീ ẚ ㍑ ⏬ീ䛜䜒䛴 ⑕≧ ゎ⟅ ⏬ീ䜰䝜䝔䞊䝅䝵䞁 䝕䞊䝍䝧䞊䝇 ၥ㢟 ⏬ീ ⏬ീ䜰䝜䝔䞊䝅䝵䞁 䝕䞊䝍䝧䞊䝇 䝹䞊䝹䝧䞊䝇 ၥ㢟ᩥ⏝ 䝹䞊䝹 ⏬ീ⏝ 䝹䞊䝹 䝇䝁䜰ィ⟬ 図 1: 自動解答プログラムの構成 図 1 に示した通り,まず,検査画像とその画像に対す る注釈(所見など)を結合したものを多数集めた画像 アノテーションデータベースと,各病名に対して症状 や検査画像に注釈された所見との関係をまとめたルー ルベースを作成した.次に,医師国家試験の問題画像 とデータベース中の画像を比較し,類似画像を検索し た.そして,類似画像がもつ注釈と問題文から得られ た症状をルールベースと照らし合わせ,それらの症状 をもつ病名にスコアを加えた.最終的に,スコアが最 も高い病名を解答とした.以下に,詳細を述べる. 問題中に示された画像と類似比較を行うために,検 査画像とその画像にアノテーション情報を付けたもの を多数集めたデータベースを構築した(図 2).検査画 像は,インターネット上に公開されているもの [3, 4] を 利用した. 医師国家試験問題では,問題文中において画像を参 06-1

(2)

\“ñŽw’°“û“ª•”‚ÌŽî‘å –â‘è‰æ‘œ ‰æ‘œƒAƒmƒe[ƒVƒ‡ƒ“ ƒf[ƒ^ƒx[ƒX –â‘è‰æ‘œ‚ÌÇó ‰æ‘œA i—ÞŽ—j \“ñŽw’°“û“ª•”‚ÌŽî‘å iƒAƒmƒe[ƒVƒ‡ƒ“j ŒŒð ‰æ‘œB iƒAƒmƒe[ƒVƒ‡ƒ“j . . . 図 2: 画像アノテーションデータベース 照させる際に部位名と画像種類名が明記されている.そ のため,本研究では,収集した検査画像を各部位・各 画像種類ごとに区別し,類似比較を行う際に,問題文 中に明記された部位や画像種類に限定して画像データ ベース内を検索することで,精度良く効率的に類似比 較を行えるようにした. 画像アノテーションデータベースにおいて類似して いる画像を検索し,その類似画像のアノテーション情 報を画像がもつ症状として出力する画像解析プログラ ムを構築した.類似画像比較には,ORB アルゴリズム (Oriented FAST and Rotated BRIEF)[5] を用いた.

問題文からの症状抽出には,先行研究の手法 [1] を用 いた. 各病名に対して,症状や検査画像におけるアノテー ション情報との関係を表にまとめたルールベースを構 築した.各症状や画像アノテーション情報をもつすべ ての病名にスコアとして 1 を加算し,持たない病名に は 0 を加算した. 問題画像から画像解析プログラムによって出力され た画像がもつ症状と問題文から得られた症状をルール ベースと照らし合わせ,選択肢の病名について該当す る症状のスコアを足し合わせる.そして,最もスコア の高い病名を解答として出力した.

2.2

解答対象

平成 26 年に行われた第 108 回医師国家試験の臨床 実地問題のうち,検査画像を含む 17 題について解答を 行った.具体的には,平成 26 年に行われた第 108 回の 医師国家試験問題のうち,以下の条件に当てはまる問 題を用いた. (1)問題文において患者の症状・検査結果などが示さ れ,選択肢の中から適切な病名を解答する問題. (2)検査画像が示されている問題. このような条件に当てはまる問題は全部で 28 問存在し たが,この中で 11 題は画像データベースを構築する上 でデータ不足のために対象外とした.

3

結果

解答結果を表 1 にまとめる.ここで,(a) は「解答を 1病名選択し,正答した」,(b) は「解答を複数病名選 択し,その中に正答があった」,(c) は「誤った解答の みを選択した」,(d) は「解答を選択できなかった」,を 表す. 表 1: 第 108 回医師国家試験問題解答結果. 問題文と画像を 問題文のみ 用いて解答 用いて解答 (a) 9題 5題 (b) 4題 1題 (c) 4題 10題 (d) 0題 1題 プログラムが複数解答した中に正答が含まれている 場合,解答が複数解答のなかからランダムに一つ出力 されると考え,その割合を加算した.すなわち,表 1(b) に関しては,半分の確率で正答すると考えることとす る.プログラムの正答率は下記のようになった: 9 + 4 ∗ 1 2 17 ∗ 100 = 64.7% この問題を問題文のみを用いて解答したときの正答 率は 32.4%となったため,問題文に検査画像を加えて 解析して解答することで正答率が上昇したと言える. 一方で,実際の医師国家試験では,臨床問題の合格 基準は 10 年間の平均で 66.6%となっており,これには わずかに届かない結果となった. 複数解答や不正解となった問題においては,問題画 像からの症状を正しく得られなかったものが多かった. 本プログラムで用いた類似画像検索アルゴリズムのパ ラメータには調整可能なものが 4 つあり,それらを最 適化することで精度上昇が見込まれる.また,検査画像 データの収集不足によるスコアの誤りが起きてしまっ た問題もあった.例えば,アレルギー性肉芽腫性血管 炎の画像を集める際に,「すりガラス陰影」や「浸潤影」 を示す画像を収集することができず,スコアを付ける ことができなかった.さらに,本プログラムで構築し た病名判定ルールでは,症状の有る無しに対して,単 純に 1 と 0 のスコアを付けている.固定しているスコ アの値を,その病名に特徴的な症状は高く,一般的な 症状は低くして差別化することで,複数解答の問題点 を解決できると考えられる. 06-2

(3)

4

おわりに

医師国家試験問題のうち,検査画像を含む臨床実地 問題の自動解答プログラムを構築した.第 108 回医師 国家試験問題について解答を行った.問題文の症状に 問題画像から得られる症状を追加することで正解率が 上昇した.今後の課題として,スコアの最適化により 正答率の上昇が見込まれるものが複数あげられた.ま た,データベース中の検査画像をより多く収集するこ とで正確なスコアがつき,正答率が上昇すると考えら れる.

参考文献

[1] 伊藤詩乃, 田中佑岳, 狩野芳伸, 榊原康文: 医師国 家試験を自動解答するプログラムの構築, 人工知 能学会論文誌・論文特集 「人工知能学会創立 30 周年記念論文特集」, in press, 2016. [2] 厚生労働省: 第 108 回医師国家試験の問題および 正答について, (http://www.mhlw.go.jp/seisakunitsuite/bunya/ kenkou iryou/iryou/topics/tp140512-01.html). [3] 日本病理学会 (Japanese Society of Pathology)

教育委員会: 病理コア画像,

(http://pathology.or.jp/corepictures2010/index.html). [4] 国立がん研究センター情報委員会: がん診療画像

レファレンスデータベース,

(http://cir.ncc.go.jp/jp/index.html).

[5] Edward, R., et al.: Faster and better: A machine learning approach to corner detection, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.32, 1, 105-119, 2008.

参照

関連したドキュメント

「臨床推論」 という日本語の定義として確立し

The method is consisted of the following four steps : 1) Calculation of standard deviation (SD) map 2) Edge detection and removal on SD map 3) Interpolation of the removed

災害に対する自宅での備えでは、4割弱の方が特に備えをしていないと回答していま

現実感のもてる問題場面からスタートし,問題 場面を自らの考えや表現を用いて表し,教師の

・アカデミーでの絵画の研究とが彼を遠く離れた新しい関心1Fへと連去ってし

しかしながら、世の中には相当情報がはんらんしておりまして、中には怪しいような情 報もあります。先ほど芳住先生からお話があったのは

は,医師による生命に対する犯罪が問題である。医師の職責から派生する このような関係は,それ自体としては

 筆記試験は与えられた課題に対して、時間 内に回答 しなければなりません。時間内に答 え を出すことは働 くことと 同様です。 だから分からな い問題は後回しでもいいので