• 検索結果がありません。

PDFファイル 1G3 「生命科学における知識共有」

N/A
N/A
Protected

Academic year: 2018

シェア "PDFファイル 1G3 「生命科学における知識共有」"

Copied!
3
0
0

読み込み中.... (全文を見る)

全文

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

Web

技術

用い

生物表現型統

タベ

The integrated phenome database with semantic web technology

桝屋

啓志

*1

照江

*1

斎藤

実香子

*1

高山

英起

*1

*2

Hiroshi Masuya Terue Takatsuki Mikako Saito Eiki Takayama Yuko Yoshida

布子

*3

芳樹

*4

土井

考爾

*2

紀郎

*2

哲郎

*2

Yuko Makita Yoshiki Mochizuki Koji Doi Norio Kobayashi Tetsuro Toyoda

*1

理化学研究所

ンタ

*2

理化学研究所

情報

ンタ

RIKEN BioResource Center Advanced Center for Computing and Communication, RIKEN

*3

理化学研究所

環境資源科学研究

ンタ

*4

理化学研究所

生命

科学

ンタ

RIKEN Center for Sustainable Resource Science RIKEN Center for Integrative Medical Sciences

The phenome is the set of phenotypes correlated each other through common molecular pathways underlying, evolutional relationships of molecules or biological interaction between environments. Understanding of phenome or individual phenotypes is one of the fundamental issues to promote innovation in the biomedical science. We have tried to integrate variety of phenotype data using semantic web technologies and RDF data format. We designed scheme of phenotypic data based on the study of upper ontology, and also designed interrelationships among different data, gene, organisms and molecules. Using these linked data, we developed applications to propose “recommendations” of biological materials, which show similar phenotype to selected material by users. In this paper, we report application of semantic web technology for improvement of access to biological resources.

1.

じめに

Phenotype 表現型 遺伝因子 環境因子 相互作用

現 表 現 形 質 変 化 定 義 近 年 う

表 現 型 総 体 示 概 念 使 わ う

い 生 物 表 現 型 個 々 独 立 現

く 相互 深く関係 い 事 意味 い 例え

個体 生物 示 様々 表現型 盤 分子 ニ

通 互 い 関 係 生 物 種 間 分 子 進 化

的 関係 通 互い 関連 い 生態系 い

生物 士 相互作用や 環境応答 通 関係 い

遺 伝 子 多 型 薬 物 応 答 個 人 差 生 出 う 遺 伝

因 子 環 境 因 子 組 わ 表 現 型 い 理 解

後 ン 要課題 あ 近年ニ

高 い 生命原理応用 ベ ン 加

様々 生物 得 研究 果情報 種 い 踏 え

統 必要 あ

従 来 生 物 種 横 断 的 情 報 統 分 子 ベ 広 く 行 わ

高 度 情 報 あ 表 現 型 関 標 準 化

や統 困難 公開 各生物種 研究コ ニ

内 限 定 的 用 い 新 ベ ン 障 壁

い 々 表 現 型 関 連 タ 研 究 分

垣根 越え 情報共 分子 タ 連携 能

実現 最終目的 ン ッ Web 技術

用い 生物 統 タベ 構築 取 組

い 本 報 告 RDF い 表 現 型 本 キ

作 RDF タ ン 用い 表現型情報利用

ン い 紹

2.

データおよびアプリケー

ョン

概要

本 研 究 OWL 準 RDF キ 編 集 び

RDF ン タン タ 管理 タ 視化 統 環境

[SciNets, 桝屋 2010-2] 使用 い

3.

表現型

RDF

スキーマデ

インとデータ

RDF 技術 用い 表現型 体系的 タ記述 行

う 生物 表現型 網羅的 記述 汎用 ッ

ン 行 RDF 主語 述語 目的語

組 本 構 い 表 現 型 タ 主 語 表 現

型 示 主 体 あ 測 定 部 位 生 物 学 的 特 徴 分 類 あ 測

定 対 象 形 質 各 形 質 い 生 物 具 体 的 示 特 徴 定

性 値 あ い 定 値 あ 測 定 結 果 い う 種 類 述 語 持

目的語 国 内 外 使 用 い 共通

ン タ ベ 値 代 入 う 設 計

図 々 以前 上位 ン YAMATO

盤 提 唱 表 現 型 タ 概 念 型 あ [桝 屋

2010-1, 2011, 2013] 現状 タ表示 ンタ

考慮 RDF びOWL タ形式

間 ン 構 複 雑 う 概 念 省 略

連 絡 先 : 桝 屋 啓 志 , 理 化 学 研 究 所 ソ ン タ , 茨

城 県 く 高 3 1 1, uy @ e p

(2)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 2 -

次 ッ 準 国内 ン 利用

研究材料 養細胞 微生物 び

ソ 表現型情報 元 タベ 内 自然言語記

述 既 存 ン情 報 通 収 集 系 統 約

5000件 細胞株約3600件 微生物株約 15000件 加え 表

現型 タ約18000件 上記RDF ッ 落 込

最新情報 更新 体制 表現型

タ 測定対象 形質 び 測定結果 目的語

ン Phenotypic Quality ン (PATO)

[Gkoutos 05] 語彙 用い 哺乳類特

表 現 型 示 ン Mammalian Phenotype Ontology

(MP) [MP] 提供 い ッ ン 示 う

4.

表現型情報利用

ため

インターフェイス

上記 ッ 記述 タ 図 示 う

表 形 式 び 型 ン タ 示

う 表 各 付加 タ 機能 表

現型 現 部位 形質 簡易 絞 込

体系立 RDF ン 用い 関連 表現型

情報 自動検索 ンタ 勧 機能 提供

用い 実験材料 検索 生物学者 Amazon

ン ン ッ 操 作 う 感 覚 関 連 表 現 型

示 材料 次々 閲覧 自分 研究 ふ わ い材料 選び

や く う 図

5.

考察と展望

生 命 科 学 個 別 知 識 集 大 あ 膨 大 知 識 ッ ワ

構築 い 特 現代 生命科学知識 膨大化

一途 辿 先鋭化 専門知識 生命現象

解 明 困 難 い 研 究 者 深 い 専 門 知

識 常 専 門 外 知 識 い 出 来 う 限 広 く 深

い情報収集 行 う 求 能 情

報 ン 構築 ン け 大 課

題 い 本 研 究 研 究 分 垣 根 超 え 表 現 型

情報 共 目指 表現型 普遍的 RDF タ形式 設 計 用 い 横 断 的 タ ベ 作 製 試

RDF ン 生 表 現 型 情 報 利 用 ン タ

開発 行

ッ 関 表 現 型 タ 多 様 性

ン 分類体系 吸収

自 度 高い記述 能 あ 様々 生物 多様 表

現型情報 格納 従来 MP ン

難 部位や形質 検索 容易 実現 事

機能 用い 例え 骨格形

い 上 腕 骨 や 大 腿 骨 等 長 骨 い 長 軸 方 向

長 異常 突然変異 く 方向 長 異

常 突然変異 別 整理

変異 原因遺伝子 機能 推測

図 示 表 現 型 類 似 性 示 ン タ

表 現 型 情 報 通 研 究 者 複 数 能 性 提 示

新 気 付 誘 特 徴 あ 例 え 研

究 材 料 ッ 選 択 検 索 ッ

表 現 型 観 点 他 候 補 提 示

事 研究 最 ふ わ い材料 選択 い 自

身 新 能 性 い 比 較 検 討

後 ン is_a関係 用い 推移的推論 加味 類

似性 処理 機能 実装 研究者 用い 表現型

概念 即 分類関係 示 事 能 考え

後 対 象 生 物 種 張 疾 患 研 究

活用 実験動物 検索 実用 即

タ ベ 構 築 期 々 疾 患

ッ 表現型 関係性 い ン 関

連 タ 作 あ [桝屋 2013] 利用 事

能 あ

一 方 微 生 物 哺 乳 類 表 現 型 情 報 形 式 記 述

注 意 必 要 点 示 唆 哺 乳 類 表 現 型

一 般 種 内 遺 伝 的 ン あ 遺 伝 子 型 対 応

考 え 高 血 糖 ッ 高 血 糖 い 表 現 型

糖尿病 相当 考え 血糖 い

う形 質 高 濃 度 い う定 性 値 順 序 尺 度 暗 黙 的 正 常

高 濃 度 あ い う 意 味 含 対

微 生 物 け 表 現 型 生 物 種 間 別 用 い

正常 対 いう意味 い 含 い

図2 表現 型類似 性 表示 ンタ

(3)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 3 - 回 微 生 物 表 現 型 タ 比 較 対 照 必 要

順 序 尺 度 含 義 尺 度 あ

微 生 物 い 実 験 用 大 腸 菌 遺 伝 子 操 作 能

生物 用い 哺乳類 様 正常 比

較 いう意味 い 表現型 用い 後 研究分

や 生物種 横断的 表現型情報統 向け 本 タベ

張 概念 用い コン キ 依存定

性 値 統 [桝 屋 2013]や 複 雑 化 タ 形

式 ワ 工 必要 考え

参考文献

[BioLOD] http://biolod.org

[Gkoutos 05] Gkoutos GV, Green EC, Mallon AM, Hancock JM, Davidson D: Using ontologies to describe mouse phenotypes, Genome Biol, 6, R8. (2005)

[MP] ftp://ftp.informatics.jax.org/pub/reports/MPheno_OBO. ontology

[SciNets] http://database.riken.jp/

[ 2011] 衛, 崎 司, 溝 理一郎:実践的 ント

ロジー開発に向けたオントロジー構 築 利 用 環 境 法 張 ― 理 論 編 ―人 工 知 能 学 会 論 文 誌, Vol.26

No.2,pp.387-402, (2011)

[桝屋 2010-1] 桝屋啓志, 中信彦, 脇和規, 櫛 矢, 崎

司, 溝 理一郎:上位オントロジーに基づく生物表現型 デ タ記述 考察, 第 24 回人工知能学会全国大会予稿集,

1B5-4 (2010)

[桝屋 2010-2] Masuya H., Makita Y., Kobayashi N., Nishikata

K., Yoshida Y., Mochizuki Y., Doi K., Takatsuki T., Waki K., Tanaka N., Ishii M., Matsushima A., Takahashi S., Hijikata A., Kozaki K., Furuichi T., Kawaji H., Wakana S., Nakamura Y., Yoshiki A., Murata T., Fukami-Kobayashi K., Mohan S., Ohara O., Hayashizaki Y., Mizoguchi R., Obata Y., Toyoda T.: The RIKEN integrated database of mammals, Nucleic Acids Res. 39, D861-D870, (2010).

[桝屋 2011] Masuya H., Gkoutos G.V., Tanaka N, Waki K,

Okuda Y, Kushida T., Kobayashi N, Doi K, Kozaki K, Hoehndorf R., Wakana S, Toyoda T., and Mizoguchi R.: An Advanced Strategy for Integration of Biological Measurement Data, Proc. of 2nd International Conference on Biomedical Ontology (ICBO2011) ,pp.79-86 (2011).

[桝屋 2013] 桝屋啓志, 崎 司,大江 和彦,溝 理一郎コン

キ 依 存 定 性 値 扱 う 生 物 表 現 型 統 タ ベ

試 作 , 第 27 回 人 工 知 能 学 会 全 国 大 会 予 稿 集, 3I1-2

参照

関連したドキュメント

We note that this topos is Boolean, so it does not provide a counterexample to the assertion that every completely distributive Grothendieck topos has initial normal covers for all

To capture the variation of effective control reproduction number (R c (t)), the control process are divided into three periods, the average of R c (t) are calculated for each stage

Key Words: Inequalities, convex function, Jensen’s inequality, Jessen’s inequality, iso- tonic functional, Jessen’s functional, superadditivity, subadditivity, monotonicity,

Our analyses reveal that the estimated cumulative risk of HD symptom onset obtained from the combined data is slightly lower than the risk estimated from the proband data

Projection of Differential Algebras and Elimination As was indicated in 5.23, Proposition 5.22 ensures that if we know how to resolve simple basic objects, then a sequence of

S.; On the Solvability of Boundary Value Problems with a Nonlocal Boundary Condition of Integral Form for Multidimentional Hyperbolic Equations, Differential Equations, 2006, vol..

By applying the Schauder fixed point theorem, we show existence of the solutions to the suitable approximate problem and then obtain the solutions of the considered periodic

A monotone iteration scheme for traveling waves based on ordered upper and lower solutions is derived for a class of nonlocal dispersal system with delay.. Such system can be used