The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 1 -
微生物
養
地
ン
開発
Development of Microbial Growth Medium Ontology
島
秀一
*1
岡本
忍
*1
Shuichi Kawashima Shinobu Okamoto
*1
サ
ン
統合
タ
センタ
Database Center for Life Science
In biomedical research field, diverse and large amount of data has been produced, which has been resulted in lots of databases in the field. Database Center for Life Science in Japan has focused on building infrastructure to enable an effective use of such data in an integrated way by using Semantic Web technology. As part of the efforts, we have been developing Growth Medium Ontology (GMO), which describes nutritional and other components of growth media used for growing microorganisms. We have also created a linked open data of growth media based on the GMO. This paper presents the newly developed resources and discusses how to utilize them in integration with other life science-related LODs.
1.
めに
大 学 共 利 用 法 人 情 報 研 究 機 構 サ ン
統合 タ センタ 以 DBCLS 生 科学
蓄 積 大 タ い セ ン ッ 技
術 応用 利用者 効率的 タ 活用
環 境 構 築 目 指 い 具 体 的 既 存 タ RDF
化や 必要 ン 整備 RDF タ運用
開発等 行 目標 実現 う い [山 口 2010]
近 年 国 際 的 生 科 学 系 タ 以 DB
RDF 提供 う 動 増え い タン 配列
DB あ UniProt [The UniProt Consortium 2013] 2008年
RDF 公開 開始 2011 年 タン 質立
体構造 DB あ PDB RDF化 2013 年 欧 ン 研 究 所 EBI 生 物 学 セ 計算機 収集 DB あ BioModels 実 験 使 サン 関 DB あ Biosamples 薬 生物 活 性 DB あ ChEMBL 遺 伝 子 発 現情 報 DB あ
ExpressioAtlas 子 DB あ Reactome 5
タ RDF 化 公開
*1
2014 年
国 立 生 物 工 学 情 報 セ ン タ NCBI 公 開 い 世 界 最 大 級 化 学 化 合 物 タ PubChem RDF
公 開
*2
現 在 EBI ゲ タ
Ensembl RDF化 準備中 あ DBCLS 原核生物
関 NCBI ゲ DB あ RefSeq 情報 RDF化 行 い ま DBCLS DB RDF化 け く 利用可能 RDF タ 統合 構築 新 いゲ 情 報 検 索 サ ビ あ TogoGenome
*3
構 築 現 在
TogoGenome 原核生物 タ ゲッ RefSeq ゲ
情報 RDF 中心 適宜 UniProt う 既存 RDF タ 統 合 い 構 造 化 形 情 報 利
用 い対象 い 原核生物 ゲ 情報 統合
有益 検索 行え 断 い 共 研究
者 新規 ン 開発や RDF タ 構築
行 具 体 的 ま 原 核 生 物 生 育 環 境 関
わ ン や 表 現 型 関 わ ン 等 開 発
TogoGenome セッ 検索 活用 い
本 稿 ゲ 配 列 中 心 生 物 学 タ 統 合
一環 々 取 組 い 微生物 養 地 RDF
化 際 必要 ン 開発 い 報告 い
2.
微生物培養培地
オン
ロジー構築
2.1 微生物培養培地
微 生 物 研 究 際 ま 研 究 材 料 当 該 微 生
物 研 究 室 養 必 要 条 件 微 生 物 養
際 地 微生物 生育 必要 栄養源
含ま 液体 ま 寒天 固 ゲ 状固形物
用い 微生物 必要 栄養素 微生物種 異
種 応 様 々 地 存 在 い 地 合
地 天然 地 大 [駒 2011] 前者 養
必要 栄養源 化学薬品 地 あ 合
地 化学組 明 増殖 微生物 必要
栄 養 十 条 件 明 必 要 条 件 限 い
う 地 比 較 的 栄 養 要 求 性 い わ 限
栄 養 素 用 い 自 増 殖 必 要 物 質 全 生
合 代 謝 系 備 え 微 生 物 養 用 い 一 方
後 者 肉 キ や タ ン 質 酵 素 解 作
チ 集ま あ ン等 添加 い 地 あ
天 然 地 明 い 多 様 栄 養 素
含 い 様 々 微 生 物 養 応 用 可 能 あ
栄 養 過 多 あ いい いうわけ く 要
栄養 含ま 増殖 阻害 あ 微生物毎
増殖 適 含ま 地 使用 必要 あ
2.2 培養培地をオン ロジー化 る意義
う 地 微生物 環境中 う 栄養
吸 収 増 殖 い 手 え く 貴
情 報 あ 吸 収 栄 養 源 様 々 代 謝 経 路 経
生 活 動 維 持 必 要 子 生 合 代 謝
経 路 関 情 報 わ 細 胞 内 酵 素 子
連 絡先 : 島秀 一
サ ン 統合 タ センタ 〒 千
葉 県柏 市若 柴 東 京大 学柏 葉 駅前 研究 棟 階
1G3-01
* :
* :
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 2 - う 変換 いく いう情報 い 様々 DB 開
発 代謝経路 渡 子 情報
わ 研 究 室 い 地 情 報 い ま
RDF 化 検索 行え 電子
化 行わ 従 地情報 RDF 化
ま 地 情 報 ゲ 情 報 や
代 謝 経 路 情 報 表 現 型 情 報 統 合 検 索 可 能 生
現象 理解 深 有用 あ 考え
地 前 い 一 部 有 除 く
都 度 目 的 応 調 整 作 ン
概 念 整 理 適 い い
々 地 作 利 用 物 質 や うい 生 物 養
利用 い 情報 記述 OWL ン
GMO: Growth Medium Ontology 構築 ン
利用 地 情報 RDF化 行
2.3 培地成分 語彙 整理
地 文 献 等 記 述 い 回 製 品 評 価
技術 盤機構 NBRC 理化学研究所 JCM 公開 い 養 地 情報 提供頂け
( 649 917 地) 抽出 ニ
ュ 統 制 語 彙 化 行 化 学 化 合 物 関
PubChem や ChEBI 等 網羅的 タ 公開
全 地 化 学 化 合 物 け あ
URI 使う 地 記述 RDF 作
新 ン 構築 必要性 少い
• 実際 地 PubChemやChEMBL等 記
載 い い化合物 少 存在
• 地 利 用 天 然 物 肉 キ や ン 等 く
利 用 以 外 ュ や 乾 燥 ビ 等
様 々 材 料 含 ま う い 多 種 多 様 概 念 対 応
既存 URI 存在 い
• 多 種 多 様 概 念 類 う 地 観
点 階層的 類 い
等 理 由 新 規 ン 構 築 ま
化 学 化 合 物 一 般 多 数 義 語 存 在 化 学 式
書 い 場 合 あ 例 え Sodium phosphate
NaH2PO4 機 械 的 寄 困 難
ニュ 統制語彙 整理 行 中 商品
売 い 地 等 複 数 物 質 い あ
うい 概念 定義
結果 現在 地 653 概念 OWL 整理 各 PubChem, ChEBI Wikipedia SNOMED-CT
MESH term 等 該当 URI あ 場合 rdfs:seeAlso
用い URI 記述
2.4 オン ロジー 階層構造
回 整 理 地 語 彙 い く 階 層 整 理 大
類 化学化合物 う 明確 定義
Defined component 天 然 物 う 明
Undefined component 大 ま 水 関 係 寒 天
Agar 関 係 や pH 調 整 緩 衝 液 等 栄 養
い 階 層 類 図 1 地
表 概念Component 以 階層図 示
2.5 培地RDF ータ
次 統制語彙化 地 利用 NBRC 提供頂い
649 地 RDF 化 行 RDF タ
TogoGenome ン 生物種 検索 際
関連情報 一 可視化 い GMO 全
Defined ま Undefined component 概念 定
義 地 合 地 全
Defined component 類 天然 地 1 以
Undefined component 類 類
情報 含 RDF化 行
3.
まとめ
回 微生物 養 地 記述 ン 構築
649 種 地 い RDF 化 行
TogoGenome ン 地 栄養 情報
ゲ 情 報 や 微 生 物 表 現 型 情 報 等 RDF 統 合
構築 後 構築 RDF 利用
地 栄養源 生物 代謝 ッ ワ 遺伝子情報
知識 発見 構築 計画 い
謝辞
本研究 DBCLS ン JST NBDC 統合化推 進 「ゲノ ・ タゲ 情報 盤 微生物 DB 統 合 」(代 表 黒 顕 東 工 大 教 授) ン 方 共 作 業
ま 養 地 情 報 製 品 評 価
技術 盤機構NBRC 理化学研究所JCM 提供頂 ま 関係者 皆様 感謝 意 表 ま
参考文献
[山口 2010] 山口敦子, 山俊明: 我が国 データベース構
築 統合戦略(第 2 回) データベースを統合利用
基盤としてセマンティック ブ技 術,細 胞 工 学 Vol. 30,
No.11, pp. 1210-1215,学研メディカル秀潤社, 2011.
[The UniProt Consortium 2013] The UniProt Consortium: Update on activities at the Universal Protein Resource (UniProt) in 2013,Nucleic Acids Research Vol. 41(Database issue), pp D43-D47, 2013.
[駒 2011] 駒大輔, 山中勇人, 森芳邦彦, 大本貴士: 地
知 いま ?, 生物工学 Vol. 89(4) 195-199, 2011. !
!
!
!