The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 1 -
ン
Linked Data
基
タベ
構築
A Development of Biomimetic Database based on Ontology and Linked Data
崎
司
*1多田
恭
*1來
信
*1溝
理一郎
*2Kouji Kozaki Kyohei Tada Yoshinobu Kitamura Riichiro Mizoguchi
*1
大阪大学産業科学研究所
*2
陸先端科学
術大学院大学
The Institute of Scientific and Industrial Research (ISIR), Osaka University Japan Advanced Institute of Science and Technology
For biomimetics research, it is important to develop biomimetics database which enable us to find a huge variety of knowledge across different domains. To realize such database, an interoperability of knowledge between them is necessary. Ontologies clarify concepts that appear in the target domains and contribute to improvement of interoperability. Furthermore, in order to integrate the database with existing databases for biological diversity, linked data technologies are very effective. This article discusses a development of biomimetics database for materials engineering based on ontology and linked data.
1.
めに
自 然 学 ぶ 目 指
biomimetics 研 究 い 新 術 開 発 う
工 学 研 究 者 生 物 多 様 性 適 応 関 情 報 通 術 革 新 着想 得 こ タベ
整備 要 さ [ 10] 本研究 こ う 発想 支 援 型 タ ベ 開 発 あ
関 知識 体系 ン 構
築 利 用 者 視 応 ン 探 索 術 [Kozaki
11] び ン 知 的 探 索 用 い 概 念 検 索 対 象 範
適 管理 術 [ 崎 13a] 用い 検索 開発 進 い [ 崎 13b]
例えば 料研究者 求 機能 機能 実現 い 生物 部位 検索 こ 考え 工学的 料 生 物 機 能 直 接 的 結 び 無 汚 泥 生 活環境 生物 防 汚機 能 持 い 生 物学 知識 必要 さ 観 検索 可能 う ン 必要 先行研究 試作
ン 用い 注目 機能 生物種 生態環境 生物 行動 構造 い 様々 観
概念 見え タベ
こ 概念 利用 概念 対応 タ タ 付 さ タ 検索 こ ン 基 検索機構 実現
さ 研究 い 生物学 工学 様々 領域 知 識 こ 新 ベ
ン 進 期待さ タベ
既 タ ベ 相 互 連 携 進 組 要 こ 要件 満 タベ 開 発 本研 究
Semantic Web 術 用い Web タ 相互
連 携(Linking)さ こ 新 い 価 生 出 う
Linked Data 術[ 13] 利用
以 2 章 ン 構築
タベ 利用 い 概説 3章 Linked Data 用い タベ 構築 い 述
4 章 本研究 現状 共 後 展望 い
述
2.
バ
ミメ
ン
ロ
構築
利用
先行研究 い 博物館 所属 昆虫 び魚類 研 究者 提供さ 生物種 関 概要説明文書 情報 元
小規模 ン 試作 対象 生物種 画 像 タ ベ 用 電 子 顕 微 鏡写真 撮影 昆虫 13種 魚類 12種 あ 本 ン
生物 種 科 目 情報 沿 is-a 階層 生物種毎 特 的 機能 構造 行動 生態環境 等
属性定義 ン 構築 法造 1 用い 定義さ 概念数 226 属性 表 数 133 あ
こ ン 対象 ン 探索 機能 → 生物種 → 構造
機能 → 生態環境 → 生物種 → 構造 機能 → 生物 行動 → 生物種 → 構造 機能 → 構造 → 生物種
い 様々 観 概念間 探索 こ 確 い [ 崎 13b]
多 種 多 様 生 物 特 模 術 革 新 発想支援 実現 多 生物種 対象 ン
構築 必要 地球 在 数百万種 越え 生物種 対象 こ 考え ン 構築 自動
必 須 課 題 あ こ 本 研 究 並 行 専 門 文 書 びLinked Open Data 用い ン 大規模 手法 開発 進 い [多田14]
結果 ン 大規模 進
述 う ン 探 索 得 概念間 組 合 わ 膨 大 適 絞 込 必 要 こ 想定さ 本研究 ン is-a 階層 沿
属 性 性 質 利 用 こ ン 探 索 用 い 概 念 検 索 対 象 範 適 管 理 多 段 階 展 開 型 検 索 手 法 [ 崎 13a] 適 用 こ 探 索 範 適 絞 込 行う
3. Linked Data
を 利 用
た バ
ミ メ
タベ
構築
3.1
生物種情報に関
る
Linked Data
近 生物多様性情報 関 タベ 多数開発さ
1 http://www.hozo.jp 連絡先: 崎 司 大阪大学産業科学研究所 知識科学研究
〒 大 阪 府 茨 木 市 美 穂 ヶ 丘 ℡ za @e sa e sa a uac
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 2 -
統 合 利 用 進 い [大 澤 14]
Linked Data Web 公開さ タベ 統合利用
術 注 目 さ ン や ン ン 多 領域 Linked Data 術 準
タベ 公開さ い 1
本 研 究 開 発 タベ 工 学 研究者 新 術開発 着想 生物種 情報 得 こ 第一 目的 あ 遺伝子配列 各生物 細 情報 生物 生態 概要情報 得 こ 要
う 情報 含 Linked Data 生物 種 情報 対象 Lodac Species2 [ 11] Wikipeda 情報 抽出
こ 構築さ 多 Linked Data ン
広 利用さ い DBpedia 日本語版3 び英語版4 日本 語 Wikipedia 元 チ 情報 含 ン
構築 公開さ い 日本語Wikipedia ン 5[玉川 11]
対象 タベ 利用 検討
3.2 Linked Data
利用に向けた予備的検証
各Linked Data 必要 情報 含 い 予備的 検証 昆虫 び魚類 研究者 提供さ
画像 タベ 写真 格納 生物 目 科 種 対象 タ計 46種 各Linked Data 含
い 調 結果 表1 示 各 タ 有無 定 各生物 目 科 種 和 文 列 完全一致検索 当 タ 得 否 行
こ 結果 Lodac Speices 検証対象 全 タ 各 生 物 種 和 含 い こ 各 和 対 応 学 種 関 情報 得 際 有 効 あ
こ DBpedia い 日本語版 対象 タ 9割以 さ い 英語版 率
半数 い こ 日本語 英語 タ 対 応 完全 い 和 英語版 DBpedia 当 タ 正 得 い 思わ Lodac Speices
得 学 等 利 用 こ 英語 版 当 タ 得 こ 可能性 あ 後 検証 い
日本語Wikipedia ン 率 DBpedia 日 本語版 小さ 日本語 Wikipedia ン 構 築 過程 利用さ い タ 補完 修正処理等 何
影響 え い 可能性 考え 日本語 Wikipedia ン DBpedia 日本語版 共 日本語 Wikipedia
元 構 築 さ い 本 来 当 タ 在 数 一 致 あ こ 差 い 日本語Wikipedia ン
DBpedia日本語版 間 ン 情報 参照
原因 細 検討 い
い こ Linked Data 得 情報 タベ 有用 あ 予備的検証 行う 種 情報 対象 い Lodac Speices以外 当
タ 在 数 最 多 い DBpedia日本語版 対 象 各生物種 情報 得 対象 生物種 述 昆虫 魚類 加え 鳥類 加え あ
1 http://lod-cloud.net/ 2 http://lod.ac/species/ 3 http://ja.dbpedia.org/ 4 http://dbpedia.org/
5 http://www.wikipediaontology.org/
表 1 画 像 タ ベ 格 納 さ 生 物 目 科 種 タ Linked Data 含 数 対象
Linked Data
当 タ 在数
当 タ 在割合(%)
Lodac Species 46 100
DBpedia日本語版 43 93.5
DBpedia英語版 19 41.3
Wikipedia ン 30 65
表 2 DBpedia 日本語版 得 情報 例 例
Wikipedia における 記事概要
エ ラ メ Heptranchias perlo 江戸油鮫 英 Sharpnose sevengill shark ラ メ目 ラ メ科に属 る メ 本種 エ ラ メ属 Heptranchias を形成 る ja
界 動物界
門 亜門 脊索動物門 脊椎動物亜門
亜 板鰓亜 軟骨魚
目 ラ メ目
科 W Heptranchias ラ メ科 属 W Heptranchias
Wikipedia における 関連記事 項目名
脊索動物
門 W Vertebrata W Chondrichthyes W Heptranchias W Chordata Category ラ メ目 メ 鉤 板鰓亜
W nimalia
ル Teeth_of_sharpnose_sevengill_shark_Heptranchia s_perlo.jpg 櫛 W Hexanchidae 脊椎動物亜
門 W Hexanchiformes 軟骨魚 1 年 エ 頭足類 動物界 ラ メ目 ラ メ科 甲殻類
ル Sharpnose_sevengill_shark__Heptranchias_perlo_ .jpg 硬骨魚類
ル Heptranchias_perlo_distmap.png W Elasmobranchii 胎生
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 3 -
DBpedia日本語版 得 主 情報 界 門亜門 網 亜網 目 科 属 い 生物種 類 情報 Wikipedia 記 概要 び Wikipedia内
ン 張 い 関連記 項目 あ 表 2 こ 得 情 報 各 生 物 専 門 家 提 示 こ 記 概要 い 数百文 程度 短い説明 い こ
情報 十 あ 意見 得 一方 関連 記 項 目 い 様 々 関 連 語 列挙さ い 十 あ 形態 生態 適
類さ ば有効 情報 得 いう ン
得 こ こ DBpedia タベ
い 利 用 関 連 記 項 目 適 類 用い こ 要 あ 言え
日本語Wikipedia ン DBpedia 細 タ 関 定 義 さ い こ 特 あ 回対象 生物種 情報 近縁種 色
DBpedia 定 義 さ い い 複 数 見
各 タ間 is-a階層 関 情報 1 jwo:hyper 表さ 日本語Wikipedia ン 方 DBpedia 整 備 さ い is-a 関 定 日 本 語
Wikipedia ン 有用 思わ
3.3 Linked Data
利用に向けた技術整備
前節 述 う 既 Linked Data 利用 検討 辺 Linked Data 術 利用 補助 ソ 開発
開発 主 ソ 簡易 SPARQL び 簡易LOD検索 作成 あ
簡易SPARQL 任意 SPARQL ン ン
Linked Data 検索 API 対 ワ
Linked Data 簡易検索 Java
ン ン あ 検 索 タ Linked
Data ソ 呼ば 一覧 選択 こ ソ
持 一 覧 表 示 さ ン 辿 こ
LOD 簡易 利用 2
複数 SPARQL ン ン 対 横断検索 あ 用意 ワ 対 一括検索
機能 あ 前節 述 う 複数 Linked Data 含 タ 一 括 検 索 容 易 行 え 前 節 予 備 的 調 査 本 用い 行
一 方 簡 易 LOD 検 索 作 成 任 意
SPARQL ン ン 対象 Linked Data 簡 検
索 簡 ン 沿 Java Script 記述 作成 あ い 検索機能
ワ 一致 検索
選択 属性 組 合わ 一致 タ 検索 セ 検索
あ 簡 設定 修正 Linked Data 利用 簡 タ 作成 術的
Java Script 組 合 わ 実 装 さ
Linked Data 検索 Java Scriptベ 容易 開発
本 作 成 例1 公 開 DBpedia 対象 生物種 情報 限定 検索 行う タ
2 開発さ い 3 タベ
開発 本 用い 実装さ 予定 あ
こ ンソ ソ
http://sourceforge.jp/projects/easylod/
公開さ い
4.
め
本稿 工学研究者 生物多様性情報 術改革 着想 得 こ 支援 タベ 開 発 い 述 本 タ ベ 基 本 的 考 え 方 工学 生物学 双方 知識 領域横断的 体系
ン 利用 者 視 応 探索 得 概念間 用い 検索 行う あ さ 既 Linked Data 生物 関連 情報 得 こ
ン こ い 広 範 領 域 知識 利用 こ
現状 小規模 ン 用い 様々 観
探索 試行 既 Linked Data う 生物 関 概要情 報 含 Lodac Speices DBpedia 日 本 語/英 語 び 日本語 Wikipedia ン 対象
1 http://lodosaka.hozo.jp/EasyLOD/ 2 http://lod.hozo.jp/SpeciesFinder/
2 簡易SPARQL 実行画面例 3
簡易SPARQL 実行画面例
生物分類 網 の限定が可能 検索キ ワ ド 検索対象
Wikipedia DBpedia で の
概 要 説 明 ,Wikipeda 記 事 ,
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 4 -
タ ベ 構 築 有 用 情 報 得 可 能 あ こ 予 備 的 検 証 実施 結果 先行研究[ 崎 13b] 検討
研 究者 必 要 検索 こ 情報 適 組 合わ こ 実現可能 あ うこ 確
タベ 構築 必要 術 的整備 Linked Data 用い 開発 用い 基
ソ 開発 こ ソ タベ
試作 用い 共 以 外 領域
Linked Data 術 用い 開発 利用 期待さ
後 課題 第一 ン
大規模 伴う既 Linked Data 利用形態 検討 必要 3章 検討 各Linked Data 得 生
物 関 情報 ン 充 用
い いう方法 ン 連携 ン 利用 いう方法 2通 考え 際
研 究 特 情 報 ン 込 生 物 一般 関 情報 既 Linked Data ン 扱う 設 計 必要
第 充 ン Linked Data 用い 探 索 検索 開発 行う 基本的 術 既 開発済
あ 探索対象 大規模 伴う探索範 方法 制御や 直感的 利用 ンタ 設計 要 思わ
さ 第 一 開発さ い
画像 タベ 文献 標本 外部 タ ベ タ タ 連 携 組 設 計 開 発 行 う 基本 的 組 Linked Data 含 Semantic
Web 術 標 準 様 沿 タ タ 付 本 研究 構
築 ン 定義さ 語彙 用い 行いこ 柔軟 連携 行え 考え い
こ 一連 統合 こ タベ 構築 利用者
実用的 実現 こ 本研究 最終的 課題
謝辞
本研究 一部 科学研究費補助金 新学術領域研究 研究 領域提案型 24120002 タベ 構築
び 基 研 究(B)25280081 ン 多 次 元 的 視 管 理 基 領 域 横 断 型 セ ン タ 知 的 探 索 助成
参考文献
[大澤 14] 大澤剛士 神保 宇嗣: タ 代 環境科学
—生物多様性 タベ 統合 横断利用 現状 課題— 数理統計 Vol.61, No.2, pp.217 231, 2013.
[ 10] 政嗣:生物 多様性 学ぶ新世代
料 術 新潮流 科学 術動向 Vol.110, pp.9-28,
2010.
[Kozaki 11] K. Kozaki, T. Hirota, and R. Mizoguchi : Understanding an Ontology through Divergent Exploration, In Proc. of 8th Extended Semantic Web Conference (ESWC2011), pp.305-320, Heraklion, Greece, May 29 - June 2, 2011.
[ 崎 13a] 河祐作 崎 司:大規模 ン 知的探
索 向 多 段 階 展 開 型 概 念 検 索 開 発 人 工 知能学会研究会資料 SIG-SWO-A1203-09 2013.
[ 崎 13b] 崎 司 : 生物 多 様性 規範 料 術
開 発 支 援 向 ン 試 作
2013 度人工知能学会全国大会,3I1-3 2013
[多田 14] 多田恭 崎 司 :専門文書 Linked Open
Data 用い ン 大規模
試 2014 度人工知能学会全国大会 2F1-5 2013
[玉川 11] 玉川奨, 森田武史, 山 高 :日本語Wikipedia
備え ン 構築 人工知能学会論 文 Vol.26 No.4 pp.504-517 2011.
[ 13] (著), チャン (著), 武田
英明 ( 訳):Linked Data: Web タ空間 組 , 近代科学社,2013
[ 11] 佳孝, 加藤文彦, 大向一輝, 武田英明, 新井紀子, 神