• 検索結果がありません。

PDFファイル 1G4OS19a オーガナイズドセッション「OS19 Linked Dataとオントロジー 」

N/A
N/A
Protected

Academic year: 2018

シェア "PDFファイル 1G4OS19a オーガナイズドセッション「OS19 Linked Dataとオントロジー 」"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

生命科学系

LOD

と異常状態オントロジーの統合

-疾患知識横断的把握および相互運用に向けて-

An Integration of Abnormality Ontology with Biomedical Knowledge from LOD

山縣

友紀

*1

古崎

晃司

*1

今井

*2

大江

和彦

*2

溝口

理一郎

*3

Yuki Yamagata Kouji Kozaki Takeshi Imai Kazuhiko Ohe Riichiro Mizoguchi

*1

大阪大学産業科学研究所

*2

東京大学大学院医学系研究科

*3

北陸先端科学技術大学院大学

The Institute of Scientific and Industrial

Research (ISIR),Osaka University

Department of Medical Informatics,

Graduate School of Medicine, The University of Tokyo

Japan Advanced Institute of Science and Technology

In this paper, we discuss applying Linked Open Data (LOD) techniques to abnormality ontology. We have developed a three-layer ontological model of abnormal states. This article focuses on linking abnormal states to several biomedical ontologies and terminologies appropriately. Then, we discuss integrated knowledge acquisition and interoperability between generic and human disease-dependent abnormal states.

1.

はじめに

近年,生命科学分野において, これまで蓄積されたデータを

オープンにし,情報を共有するという動きが高まっており,ここ数

年,公開されるデータセット数は爆発的に増加している[Whetzel

11].一方,医療分野においては,現在,電子カルテシステムの

導入など,情報のシステム化が急速に進められるとともに,蓄積

された様々な医療 情報をいか に 交換,知識 共有し,さ らに相互

運用できるかが課題となっており,データから,疾患や異常状態

というような概 念レベルの高 い知 識までを統合的に扱 えるよ うな

基盤の構築が強く求められている.

筆者らは,これ まで約 7 年間にわたり 臨床医 学オントロジー の構 築 を進 めて お り , オン トロ ジー 工 学 者 と 臨 床 医 を含 む 医 療

領域の専門家の綿密な協力の下,疾患オントロジー,解剖学オ

ントロジー,および異常状態オントロジーの体系化を行ってきた

[大江 10, Mizoguchi 09, 11].これらの概念を既存のオントロジ

ー や 標 準 語 彙 な どと 関 連 付 け て , 統 合 化 す るこ と は 上 述 のよ う

な知識の共有と活用において重要となる.

そこ で , 本 稿 で は , 現 在 構 築 中 で ある異 常 状 態 オ ン トロ ジ ー

[山 縣 12, Yamagata 12]と 外 部 で 公 開 さ れ て い る デ ー タ セ ッ ト

(外部リソース)をLinked Open Data (LOD) 技術を用いて統合 する試みを紹介するとともに,生命科学分野の異常状態知識統

合への貢献について議論する.

以下,2章では,本研究で LOD化の対象とする異常状態オ ントロジーの概要を述べる.3章では,異常状態オントロジーの 各概念レベルに応じた外部リソースとの関連付けについて考察

し,続く 4章では本研究を総括すると共に今後の展望を述べる.

2.

異常状態オントロジーの概要

2.1 異常状態の3階層

異常状態のis-a階層を構築するにあたり,一貫した視点で概 念化を行うことが必要である.そこで,本オントロジーは,異常状

態概念を下記のような3層構造として捉えることとした(図1). • レベル1:汎用異常状態(対象物非依存の異常状態)

• レベル2:対象物に応じて共通に現れうる異常状態 • レベル3:特定のコンテキスト(疾患)を構成する異常状態 なお,2014年1月14日時点で本疾患オントロジーには,13 診療科に渡る 6,302の疾患と,その疾患を構成する 21,669 の 異常状態が定義されており, 本 稿ではそのうち,現在洗 練作業

が行われている5診療科,1,602疾患を構成する9,985の異常 状態)を対象とする.

2.2 異常状態オントロジーの計算機表現

異常状態オントロジーにおける疾患定義の「法造」による計算

機表現の例を図2に示す.これは,異常状態を汎用レベルから 疾 患 定 義 にお け る異 常 状 態 まで の特 殊 化 の具 体 例 を示 した も

のである.

レ ベ ル 1 の 汎 用 的 異 常 状 態 で あ る 「 面 積 縮 小 」 は , 属 性 「 面

積」とその値が「小さい」として定義されている (図2右上段). レベル2最上位(図 2左上段)では汎用的異常状態「面積縮 小」をクラス制約として参照し,対象物のクラス制約を「管状構造

物」と特定するとともに上位から継承された「面積」を「断面積」に

特 殊 化 し, 「 管 の断 面 積 が小 さい」 と 表 現 す るこ と で, 管 の異 常

状態である「管の狭窄」状態を定義することができる.また,レベ

ル2の下位にいくにつれて,人体の解剖構造物である「血管」に

おける「血管の狭窄」(図 2左中段),「動脈狭窄」(図 2では省 図1 異常状態オントロジー3階層モデル

連 絡 先 : 山 縣 友 紀 , 大 阪 大 学 産 業 科 学 研 究 所 , 〒567-0047

大阪府茨木市美穂が丘8-1,Tel:06-6879-8416,

Fax:06-6879-2123,E-mail:[email protected]

(2)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 2 - 略),「冠状動脈狭窄」(図 2 左下段)のように特殊化され,器官 固有の異常状態として,必要とする粒度まで表現している.

さらに,「 冠状動 脈狭窄」は, レベル3の疾患 を構 成す る異常

として,右下に示すように,例えば狭心症を構成する異常状態と

し て 「 狭 心 症 ・ 冠 状 動 脈 狭 窄 」 の よ う に 特 殊 化 さ れ る ( 図 2 右 下

段).

本異常状態オントロジーは,汎用性をもたせたドメイン非依存

かつ構造物非依存の異常状態から特殊化し,汎用的構造物依

存として例 えば管 に共通す る異 常を定義 し,さらに医療 ドメイン

内 で も 汎 用 的 レ ベ ル か ら, 特 定 コン テ キ ス ト を構 成 す る 異 常 状

態まで特殊化していくという,共通性と特殊性を明確に分離しな

がらコンテキス トに応 じた 異常状 態を表 現す ることがで きる記述

となっている[山縣12,Yamagata 12].

3.

生命医学分野各種リソースとの統合

3.1 異常状態と各種リソースの関連付け

異常状 態概 念は多 種多様で あり,外 部リソースと の統 合を考

えた場合,これらの概念階層にあわせて適切に関連付けを行う

ことが必要となる.

ここで,生命科学分野では,実験による観測や臨床所見を通

じて異常状態知 識を把握す るのが一般的であり, 表現型を強く

意識した形で異常状態に関す る知識が存在する.そこで,まず,

表現型のオントロジーとしてよく用いられている外部リソースとマ

ッ ピ ン グ す る こ と と し , 具 体 的 に は ,PATO(Phenotypic Quality

Ontology)[Gkoutos 05],HP (The Human Phenotype Ontology )

[Köhler 14] を対象として選定することとした(表1).

前章で述べたように,本異常状態オントロジーは 3 層構造で 体系化している.最上位(レベル1)の異常状態は,複数の対象

物に汎用的に見られる(対象物非依存)共通の異常状態(汎用

異常状 態)を定義 して おり, 構造 関連異 常, 機能関 連異 常,パ

ラメーター異常などに大別されている.概念例として,圧力増加,

変形,機能低下等が挙げられるが,これらはバイオメディカル分

野以外でも用いられる一般的な基本概念といえる.

一方 PATOは,バイオ分野で表現型や性質を扱うオントロジ ーとして知られており,生物種を横断した概念を提供し,バイオ

コ ミ ュ ニテ ィで 広 く 使 われ て い る. 例 えば , 「 部 品 の欠 損 」 , 「 面

積縮小」,「圧力増加」,のように対象生物種を限定せず汎用的

な概念を体系化しており,これらは本異常状態オントロジーのレ

ベル1汎用異常状態(対象物非 依存の異常状態)と対応す ると

考えられる.そこで,本レベル1の異常状態概念を PATO の対 応概念へマッピングすることとした.

次に,異常状態オントロジーのレベル2では,対象となるオブ

ジェクト(対象物)に固有の異常 状態が定義されている. レベル

2の最上位では,複数ドメインに共通する形態的全 体物を対象

と した 異 常 状 態 が定 義さ れ る.形 態 的 全 体 物 とは , 形 態 そのも

のにアイデンティティをもつオブ ジェクトで あり,例 えば,中 空性

構 造 物 , 袋 状 構 造 物 な ど をい う . レベ ル 1 で 定 義 さ れ た 汎 用 的

な 異 常状 態 を異 常対 象 に沿 って 特 殊化 す ること で, レベル2 の

異常状態のis-a階層が定義される.

レベル 2の更 に下 位に行 くにつれ て,対 象とな るドメ イン のオ

ブジェクト(対象物)下で現れる共通の異常状態を担う概念が定

義 さ れ て いく. 本 異 常 状 態 オ ントロ ジ ー で は , 人 体 解 剖 構 造 物

を対象として体系化しており,レベル2最上位の管状構造物は,

人 体 固 有 の「 人 体 管 状 構 造 物 」コン テ キ ス トで先 の「 管 狭 窄」 を

特殊化した「人体管狭窄」となって定義される.さらに,それが血

管で現れると「血管狭窄」となり,冠状動脈では「冠状動脈狭窄」

となるように,専門医が必要とする粒度まで階層記述をなってい

る.

一方 HPはヒトの表現型に特化したオントロジーとして知られ ており,遺伝病 DBである OMIM[OMIM]の記述に際し,登場 する表現型に関して統制語句を提供するために開発されたもの

である.現 在,約 10,000 用語が公開さ れてお り,例 えば「肺高 血圧」,「冠動脈狭窄」のような 各器官でおこる異常状態 が定義

されている.これらの概念は,上述した本異常状態オントロジー

のレベ ル2 の異 常 状態 の人 体 の各 器 官 依 存 の概念 と 対応 す る

といえる.そこで,本レベル 2の異常状態概念を HPの対応す る概念に関連付けることとした.

さらに,本異常状態オントロジーでは,レベル3に疾患コンテキ

ス ト 依 存 の 異 常 状 態 に つ いて 定 義 し て い る . 例 え ば , 「 虚 血 性

心疾患における心筋虚血」,「糖尿病おける高血糖」などがあげ

られ る. しか し,こ のよ うな ,疾 患コン テキス トに依存 す る異 常 状

態概念は外部リソースではあまり存在しない.

しかし,WHOが提供する 2017年改定予定の国際疾病分類

ICD11[ICD11]では,疾患にその「原因因子(Causal Properties)」

を記 述 す る予 定 と な って いるので , 将 来 , それ らの中 の異 常 状

態とマッピングできればと考えている.

なお,本異常状態オントロジーではレベル 3では疾患コンテ キ ス ト依 存 の異 常 状 態 を 専 門 医 が定 義 して お り , 例 えば 「 排 尿

後 の一 過 性 の血 圧 低 下」 のよ うに, その疾 患 で何 が起 こ った か

を専 門 医 の高 度 か つ 専 門 性 の ある 特 殊 化 した 概 念 と して 詳 細

に記述されており,修飾語が多く用いられている.これら修飾語

は , 修 飾 属 性 と して 別 に扱 って お り , それ ら修 飾 語 を 除 い た 概

念を外部リソースと対応付ける予定である.

本 オ ン ト ロ ジ ー と こ れ ら 表 現 型 リ ソ ー ス と の 統 合 によ って , 外 図2 異常状態オントロジーの計算機表現

(3)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 3 - 部リソースのユーザーにとっても次の利点があると考えられる.

外部リソース利用者は,適当な概念について,マッピングされ

た 本 オ ン ト ロ ジ ー ツ リ ー をみ れ ば , そ の 概 念 の汎 用 レ ベ ル か ら

特殊化された階層までのレベルを把握できる.例えば,HPは, どこ で その表 現 型 が起 こ って い るか と い う解 剖 構 造 か ら の視 点

で表現型概念を体系化している.そのため,動脈狭窄is-a血管 異常と いうよ うに「狭 窄」と いう異 常状態 自体 の体 系化は不 明で

あ る 場 合 が 多 い . そ こ で , 例 え ば , 本 異 常 状 態 オ ン ト ロ ジ ー の

「動脈狭窄」とマッピングしていた場合,その HP の「動脈狭窄」 をみたユーザーは,「動脈狭窄 is-a血管狭窄 is-a管狭窄is-a 面積縮 小」と いう階層 構造 を本 オントロジ ーによって 把握 す るこ

ととが可能となる.さらに,面積縮小は生物種を横断した表現型

PATO と結びついていることがわかる.つまり,本オントロジーを

介して,生物種をヒトに特化した表現型 HP と生物種横断表現 型PATOとそれらとの関係が把握できることになる.

な お , 生 物 種 を 超 えた マ ウ ス や ラッ トと の表 現 型 と ヒト の表 現

型 を対 応付 け につ いては, 属 性(A)と その値(V)のセ ッ トが一 致 した 上 で, 対 象物(O)で ある解 剖構 造 物 同 士 の similarityを い わな けれ ばな らな い.現 在 ,マウ ス , ラッ トの表 現型 デ ー タベ ー

ス の 統 合 が 試 み ら れ て い る[桝 屋 13]の で , そ れ ら を 利 用 し ,

LOD と してつなぐことで生物種横断的なマッピングが可能 にな

り , ひ いて は 生 物 種 横 断 概 念 か ら各 種 生 物 種 に特 化 し た 概 念

までを統合化した知識を提供できると考えている.

3.2 異常状態の各構成要素と各種リソースの関連付け

本 異 常 状 態 オ ン トロ ジ ー に お い て , 異 常 状 態 は 特 性(P)で 表 現し,それを属性分解したトリプル表現<対象物(O),属性(A), 属 性 値 (V) > で 表 現 す るこ と として いる. そこ で , こ れ ら構 成 要 素を各 種外部 リソースと対 応付 けることを 検討 して いる.例 えば ,

FMA (The Foundational Model of Anatomy ontology) [FMA] は

解剖学オントロジーとして著名なオントロジーであり,レベル2の

異常状態の対象物を FMAとマッピングする予定である.また, 検査データについては,LOINC[LOINC]や国内では

MEDIS[MEDIS]が標準用 語, コード の提 供を行ってお り,将来

こ れ らと 本 異 常 状 態 オ ン トロ ジー の対 応 す る各 構 成 要 素 をマ ッ

ピングす ることで,データと疾患 定義における異常状態のよ うな

高次知識との相互運用に貢献すると考えている.

3.3 疾患とICD10の関連付け

ICD10は,WHOが提供する国際疾病分類第10版であり,も

ともとは国際死因 分類 に関す る統計のた めに設け られたが,近

年 は 各 種 統 計 調 査 や 医 療 機 関 にお け る 診 療 録 の管 理 等 に使

われている[ICD10].

そこで,本疾 患オン トロジー の各 疾患概 念とICD10に記 述さ れている疾患名に対応付けることとした

1

こ こ で , 疾 患オ ン トロ ジ ー の疾 患 連 鎖 で は , 各 疾 患 を構 成 す

る異常状態(レベル3)の因果関係を専門医によって定義されて

いるので,ICD10のユーザーにとっても,本オントロジーとのリン ク を介 して , その疾 患 がど のよ う な 異 常 状 態 の因 果 関 係 が起 こ

っているかを理解するのに有用であると考えている. .

さらに,例えば ICD10の狭心症で起こりうる異常状態冠動脈 狭窄について,HPとひもづいているので,それら外部リソースを 介してヒトの表現型および OMIM との対応関係も可能になる. また,前節で述べたように異常状態について,対象物を規定す

る解剖学オントロジーとFMAのリンクがあれば,ICD10コードに 対応する疾患が起こりうる解剖構造に関する情報をFMAコード も含めて知ることができるという利点がある.

3.4 LSD,MeSHとの関連付け

検 索 をす る上 で, 本 異 常 状態 オン トロ ジー で 記述 され て いる

概念と一般的に用いられている辞書の用語とを対応付けを行っ

て お くこと は有 用 で あると 考 えられ る. そこで ,生 命 科 学 分野 で

研 究 者 に広 く用 いられて いるライフサイエンス 辞書(LSD)[LSD] と のマ ッ ピン グを 行 う 予 定 で あ る. ラ イ フ サ イエ ン ス 辞 書 の各 用

語は,米国国立医学図書館(NLM)が提供する生命科学分野の 文献の統制語彙である MeSHターム[MeSH]との対応付けが行 われている.MeSH タームには,疾患および異常状態に関する 概念も含まれるため,LSDの概念を介してMeSHタームとリンク し て お け ば , 異 常 状 態 お よ び 疾 患 に 関 す る文 献 の情 報 と の 関

連付けが可能となると考えている.その結果,例えば,疾患連鎖

のある異常状 態間 の因 果関 係 に関す る文献 を集 め, 因果 関係

に つ いて 解 析 を 行 い, 既 に 記 述 し た 因 果 関 係 につ いて 更 な る

知識の追加や, 別の因果 関係 について新たな 知見の取得な ど

へ応用できる可能性がある.また,文献を記述した研究者にとっ

ても,オントロジーを介してその 異常状態が別 の疾患でどのよう

な異常状態と関係す るか,また, オントロジーの兄弟概 念として,

他の臓器で起こっている同様の異常状態を検出したり,生物種

を超えて関連する異常状態知識を把握するなどさらなる研究の

発展に役立つ可能性がある.

4.

まとめおよび今後の検討課題

こ れ ま で , 本 研 究 グル ー プ で は , 疾 患 オ ン ト ロ ジ ー か ら 疾 患 連

鎖に関する情報のみを抽出してRDF化した疾患連鎖LOD

2

非常に高度かつ専門性のある特殊化した概念は,ともすればそ

のドメイン内の非常に狭い範囲のみの知識として完結してしまう

おそれがある.一方,非常に一般的な概念は実用上使いにくい

という側面もある.そこで,特殊化された概念から汎用的な概念

まで,概念 層 に切り 分けて, その概 念レベルに適切 に応 じた外 を公

開している[古崎 13].今後,異常状態オントロジーをLODとして どのように公開するか現在検討を行う予定である.

1本研究ではICD10分類の第1章-14章を対象とした

(4)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 4 - 部リソースとマ ッピングす ることで ,臨床 医学ド メイン 知識 か ら生

物種 を超 えた 知識まで ,生 命科 学分野 の異 常状 態に関連 する

知識を統合することができると考えている.

このように,LODとオントロジー組み合わせることにより,すで に構 築され た 概念 を積 極 的に利 用 し, 自 身の専 門以 外の分 野

の知識について 理解を深 めるこ とができるとともに,分 野を超 え

たユーザーの多様な視点に基づいた各研究にも利用できるよう

な相互運用性の向上 に有用で あると考 えている.その結 果,基

礎 研 究 と 臨 床 研 究 の 橋 渡 しと な り , 生 命 科 学 分 野 全 体 の 知 識

基盤構築に貢献することが期待される.

謝辞

本 研 究 の一 部 は , 日 本 学 術 振 興 会 の 最 先 端 研 究 開 発 支 援

プ ロ グラムお よび 厚生 労働 省医療 知 識基 盤研 究開 発事 業によ

り , 助成 を受 けたも ので ある。疾患 オン トロジ ー の記 述と 臨床 医

学的な知 識の提供 を頂 いた 東 大病院 の臨 床医 の先生 方(大友 夏 子 先 生 , 林 亜紀 先 生 ,松 村貴 由 先 生 , 桜 井亮 太 先 生, 寺 田

さとみ先生,脇嘉代先生ら), 東大病院企画情報運営部河添悦 昌先生,梶野正幸先生,疾患生 命工学センター篠原恵美子先

生に心よりの感謝を申し上げます.

参考文献

[Whetzel PL 11] PL Whetzel, NF Noy, NH Shah, PR Alexander, C Nyulas, T Tudorache, MA Musen., Nucleic Acids Res, 39(Web Server issue):W541-5, (2011).

[大江 10] 大江和彦,今井健:臨床医学知識処理を目指した医

療 オ ン ト ロ ジ ー 開 発 , 人 工 知 能 学 会 誌 ,Vol. 25,No. 4,

pp.493-500,2010.

[Mizoguchi 09] R. Mizoguchi, H. Kou, J. Zhou, K. Kozaki, T., Imai and K. Ohe: An Advanced Clinical Ontology, In Proc. of International Conference on Biomedical Ontology (ICBO), pp.119-122, Buffalo, NY, June 24 – 26, (2009)

[Mizoguchi 11] R. Mizoguchi, K. Kozaki, H. Kou, Y. Yamagata, T., Imai, K. Waki and K. Ohe: River Flow Model of Diseases, In Proc. of 2nd International Conference on Biomedical Ontology (ICBO2011), pp.63-70 July 28-30, 2011, Buffalo, NY, USA, 2011.

[山縣12] 山縣友紀,国府裕子,古崎晃司,今井健,大江和彦,

溝 口 理一 郎:異 常状 態オン トロジ ーと その応用 ,2012 年 度 人工知能学会全国大会(第26回)資料集,1I2-R-4-3, 2012.

[Yamagata 12] Y. Yamagata, H. Kou, K. Kozaki, R. Mizoguchi, T. Imai, K. Ohe: Ontological Modeling of Interoperable Abnormal States, In Proc. of the 2nd Joint International Semantic Technology Conference (JIST2012), LNCS 7774, pp. 33-48, Nara, Japan, Dec. 2-4, 2012.

[Gkoutos 05] Gkoutos GV, Green EC, Mallon AM, Hancock JM, Davidson D: Using ontologies to describe mouse phenotypes, Genome Biol, 6, R8. (2005)

[Köhler 14] Köhler S et al.: The Human Phenotype Ontology project: linking molecular biology and disease through phenotype data, Nucleic Acids Res, 42 (Database issue):D966-74. (2014)

[OMIM] http://www.ncbi.nlm.nih.gov/omim

[ICD11] http://www.who.int/classifications/icd/revision/en/ [桝屋 13] 桝屋啓志,古崎晃司,溝口理一郎:コンテキストに依

存した定性値を扱う生物表現型 統合データベースの試作,

2013年度人工知能学会全国大会(第27回)資料集,3I1-2,

2013.

[FMA] http://sig.biostr.washington.edu/projects/fm/ [LOINC] https://loinc.org/

[MEDIS] http://www.medis.or.jp/4_hyojyun/medis-master/ [ICD10] http://www.who.int/classifications/icd/en/ [LSD] http://lsd.pharm.kyoto-u.ac.jp/ja/index.html [MeSH] http://www.nlm.nih.gov/mesh/meshhome.html

[古崎 13] 古崎晃司,山縣友紀,国府裕子,今井健,大江和彦,

溝口理一郎:医療知識基盤の構築に向けた臨床医学オント

参照

関連したドキュメント

Comparison between serum protein components as obtained by QIEP and single radial immunodiffusion.... Comparison between QIEP pattern of normal and abnormal Hodgkin's

We generalized Definition 5 of close-to-convex univalent functions so that the new class CC) includes p-valent functions.. close-to-convex) and hence any theorem about

We generalized Definition 5 of close-to-convex univalent functions so that the new class CC) includes p-valent functions.. close-to-convex) and hence any theorem about

In [6], Chen and Saloff-Coste compare the total variation cutoffs between the continuous time chains and lazy discrete time chains, while the next proposition also provides a

The approach based on the strangeness index includes un- determined solution components but requires a number of constant rank conditions, whereas the approach based on

2 Similarity between number theory and knot theory 4 3 Iwasawa invariants of cyclic covers of link exteriors 4.. 4 Profinite

We prove the coincidence of the two definitions of the integrated density of states (IDS) for Schr¨ odinger operators with strongly singular magnetic fields and scalar potentials:

Using an “energy approach” introduced by Bronsard and Kohn [11] to study slow motion for Allen-Cahn equation and improved by Grant [25] in the study of Cahn-Morral systems, we