The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 1 -
ン
ッ
Web
技術
用い
生物表現型統
タベ
The integrated phenome database with semantic web technology
桝屋
啓志
*1
高
照江
*1
斎藤
実香子
*1
高山
英起
*1
子
*2
Hiroshi Masuya Terue Takatsuki Mikako Saito Eiki Takayama Yuko Yoshida
蒔
布子
*3
望
芳樹
*4
土井
考爾
*2
林
紀郎
*2
豊
哲郎
*2
Yuko Makita Yoshiki Mochizuki Koji Doi Norio Kobayashi Tetsuro Toyoda
*1
理化学研究所
ソ
ンタ
*2
理化学研究所
情報
盤
ンタ
RIKEN BioResource Center Advanced Center for Computing and Communication, RIKEN
*3
理化学研究所
環境資源科学研究
ンタ
*4
理化学研究所
統
生命
科学
ンタ
RIKEN Center for Sustainable Resource Science RIKEN Center for Integrative Medical SciencesThe phenome is the set of phenotypes correlated each other through common molecular pathways underlying, evolutional relationships of molecules or biological interaction between environments. Understanding of phenome or individual phenotypes is one of the fundamental issues to promote innovation in the biomedical science. We have tried to integrate variety of phenotype data using semantic web technologies and RDF data format. We designed scheme of phenotypic data based on the study of upper ontology, and also designed interrelationships among different data, gene, organisms and molecules. Using these linked data, we developed applications to propose “recommendations” of biological materials, which show similar phenotype to selected material by users. In this paper, we report application of semantic web technology for improvement of access to biological resources.
1.
じめに
Phenotype 表現型 遺伝因子 環境因子 相互作用
現 表 現 形 質 変 化 定 義 近 年 う
表 現 型 総 体 示 概 念 使 わ う
い 生 物 表 現 型 個 々 独 立 現
く 相互 深く関係 い 事 意味 い 例え
個体 生物 示 様々 表現型 盤 分子 ニ
通 互 い 関 係 生 物 種 間 分 子 進 化
的 関係 通 互い 関連 い 生態系 い
生物 士 相互作用や 環境応答 通 関係 い
遺 伝 子 多 型 薬 物 応 答 個 人 差 生 出 う 遺 伝
因 子 環 境 因 子 組 わ 表 現 型 い 理 解
後 ン 要課題 あ 近年ニ
高 い 生命原理応用 ベ ン 加
様々 生物 得 研究 果情報 種 い 踏 え
統 必要 あ
従 来 生 物 種 横 断 的 情 報 統 分 子 ベ 広 く 行 わ
高 度 情 報 あ 表 現 型 関 標 準 化
や統 困難 公開 各生物種 研究コ ニ
内 限 定 的 用 い 新 ベ ン 障 壁
い 々 表 現 型 関 連 タ 研 究 分
垣根 越え 情報共 分子 タ 連携 能
実現 最終目的 ン ッ Web 技術
用い 生物 統 タベ 構築 取 組
い 本 報 告 RDF い 表 現 型 本 キ
作 RDF タ ン 用い 表現型情報利用
ン い 紹
2.
データおよびアプリケー
ョン
概要
本 研 究 OWL 準 RDF キ 編 集 び
RDF ン タン タ 管理 タ 視化 統 環境
[SciNets, 桝屋 2010-2] 使用 い
3.
表現型
RDF
スキーマデ
インとデータ
作
成
RDF 技術 用い 表現型 体系的 タ記述 行
う 生物 表現型 網羅的 記述 汎用 ッ
ン 行 RDF 主語 述語 目的語
組 本 構 い 表 現 型 タ 主 語 表 現
型 示 主 体 あ 測 定 部 位 生 物 学 的 特 徴 分 類 あ 測
定 対 象 形 質 各 形 質 い 生 物 具 体 的 示 特 徴 定
性 値 あ い 定 値 あ 測 定 結 果 い う 種 類 述 語 持
目的語 国 内 外 使 用 い 共通
ン タ ベ 値 代 入 う 設 計
図 々 以前 上位 ン YAMATO
盤 提 唱 表 現 型 タ 概 念 型 あ [桝 屋
2010-1, 2011, 2013] 現状 タ表示 ンタ
考慮 RDF びOWL タ形式
間 ン 構 複 雑 う 概 念 省 略
い
連 絡 先 : 桝 屋 啓 志 , 理 化 学 研 究 所 ソ ン タ , 茨
城 県 く 高 3 1 1, uy @ e p
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 2 -
次 ッ 準 国内 ン 利用
研究材料 養細胞 微生物 び
ソ 表現型情報 元 タベ 内 自然言語記
述 既 存 ン情 報 通 収 集 系 統 約
5000件 細胞株約3600件 微生物株約 15000件 加え 表
現型 タ約18000件 上記RDF ッ 落 込
最新情報 更新 体制 表現型
タ 測定対象 形質 び 測定結果 目的語
ン Phenotypic Quality ン (PATO)
[Gkoutos 05] 語彙 用い 哺乳類特
表 現 型 示 ン Mammalian Phenotype Ontology
(MP) [MP] 提供 い ッ ン 示 う
4.
表現型情報利用
ため
インターフェイス
上記 ッ 記述 タ 図 示 う
表 形 式 び 型 ン タ 示
う 表 各 付加 タ 機能 表
現型 現 部位 形質 簡易 絞 込
体系立 RDF ン 用い 関連 表現型
情報 自動検索 ンタ 勧 機能 提供
用い 実験材料 検索 生物学者 Amazon
ン ン ッ 操 作 う 感 覚 関 連 表 現 型
示 材料 次々 閲覧 自分 研究 ふ わ い材料 選び
や く う 図
5.
考察と展望
生 命 科 学 個 別 知 識 集 大 あ 膨 大 知 識 ッ ワ
構築 い 特 現代 生命科学知識 膨大化
一途 辿 先鋭化 専門知識 生命現象
解 明 困 難 い 研 究 者 深 い 専 門 知
識 常 専 門 外 知 識 い 出 来 う 限 広 く 深
い情報収集 行 う 求 能 情
報 ン 構築 ン け 大 課
題 い 本 研 究 研 究 分 垣 根 超 え 表 現 型
情報 共 目指 表現型 普遍的 RDF タ形式 設 計 用 い 横 断 的 タ ベ 作 製 試
RDF ン 生 表 現 型 情 報 利 用 ン タ
開発 行
ッ 関 表 現 型 タ 多 様 性
ン 分類体系 吸収
自 度 高い記述 能 あ 様々 生物 多様 表
現型情報 格納 従来 MP ン
難 部位や形質 検索 容易 実現 事
機能 用い 例え 骨格形
い 上 腕 骨 や 大 腿 骨 等 長 骨 い 長 軸 方 向
長 異常 突然変異 く 方向 長 異
常 突然変異 別 整理
変異 原因遺伝子 機能 推測
図 示 表 現 型 類 似 性 示 ン タ
表 現 型 情 報 通 研 究 者 複 数 能 性 提 示
新 気 付 誘 特 徴 あ 例 え 研
究 材 料 ッ 選 択 検 索 ッ
表 現 型 観 点 他 候 補 提 示
事 研究 最 ふ わ い材料 選択 い 自
身 新 能 性 い 比 較 検 討
後 ン is_a関係 用い 推移的推論 加味 類
似性 処理 機能 実装 研究者 用い 表現型
概念 即 分類関係 示 事 能 考え
後 対 象 生 物 種 張 疾 患 研 究
活用 実験動物 検索 実用 即
タ ベ 構 築 期 々 疾 患
ッ 表現型 関係性 い ン 関
連 タ 作 あ [桝屋 2013] 利用 事
能 あ
一 方 微 生 物 哺 乳 類 表 現 型 情 報 形 式 記 述
注 意 必 要 点 示 唆 哺 乳 類 表 現 型
一 般 種 内 遺 伝 的 ン あ 遺 伝 子 型 対 応
考 え 高 血 糖 ッ 高 血 糖 い 表 現 型
糖尿病 相当 考え 血糖 い
う形 質 高 濃 度 い う定 性 値 順 序 尺 度 暗 黙 的 正 常
高 濃 度 あ い う 意 味 含 対
微 生 物 け 表 現 型 生 物 種 間 別 用 い
正常 対 いう意味 い 含 い
図2 表現 型類似 性 表示 ンタ
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 3 - 回 微 生 物 表 現 型 タ 比 較 対 照 必 要
順 序 尺 度 含 義 尺 度 あ
微 生 物 い 実 験 用 大 腸 菌 遺 伝 子 操 作 能
生物 用い 哺乳類 様 正常 比
較 いう意味 い 表現型 用い 後 研究分
や 生物種 横断的 表現型情報統 向け 本 タベ
張 概念 用い コン キ 依存定
性 値 統 [桝 屋 2013]や 複 雑 化 タ 形
式 ワ 工 必要 考え
参考文献
[BioLOD] http://biolod.org
[Gkoutos 05] Gkoutos GV, Green EC, Mallon AM, Hancock JM, Davidson D: Using ontologies to describe mouse phenotypes, Genome Biol, 6, R8. (2005)
[MP] ftp://ftp.informatics.jax.org/pub/reports/MPheno_OBO. ontology
[SciNets] http://database.riken.jp/
[ 2011] 衛, 崎 司, 溝 理一郎:実践的 ント
ロジー開発に向けたオントロジー構 築 利 用 環 境 法 張 ― 理 論 編 ―人 工 知 能 学 会 論 文 誌, Vol.26
No.2,pp.387-402, (2011)
[桝屋 2010-1] 桝屋啓志, 中信彦, 脇和規, 櫛 矢, 崎
司, 溝 理一郎:上位オントロジーに基づく生物表現型 デ タ記述 考察, 第 24 回人工知能学会全国大会予稿集,
1B5-4 (2010)
[桝屋 2010-2] Masuya H., Makita Y., Kobayashi N., Nishikata
K., Yoshida Y., Mochizuki Y., Doi K., Takatsuki T., Waki K., Tanaka N., Ishii M., Matsushima A., Takahashi S., Hijikata A., Kozaki K., Furuichi T., Kawaji H., Wakana S., Nakamura Y., Yoshiki A., Murata T., Fukami-Kobayashi K., Mohan S., Ohara O., Hayashizaki Y., Mizoguchi R., Obata Y., Toyoda T.: The RIKEN integrated database of mammals, Nucleic Acids Res. 39, D861-D870, (2010).
[桝屋 2011] Masuya H., Gkoutos G.V., Tanaka N, Waki K,
Okuda Y, Kushida T., Kobayashi N, Doi K, Kozaki K, Hoehndorf R., Wakana S, Toyoda T., and Mizoguchi R.: An Advanced Strategy for Integration of Biological Measurement Data, Proc. of 2nd International Conference on Biomedical Ontology (ICBO2011) ,pp.79-86 (2011).
[桝屋 2013] 桝屋啓志, 崎 司,大江 和彦,溝 理一郎コン
キ 依 存 定 性 値 扱 う 生 物 表 現 型 統 タ ベ
試 作 , 第 27 回 人 工 知 能 学 会 全 国 大 会 予 稿 集, 3I1-2