• 検索結果がありません。

JAIST Repository: 日本のバイオインフォマティクス政策のマクロビュー : グラントデータに基づくインフラ型プロジェクトとアプリケーション型プロジェクトの利用関係の分析

N/A
N/A
Protected

Academic year: 2021

シェア "JAIST Repository: 日本のバイオインフォマティクス政策のマクロビュー : グラントデータに基づくインフラ型プロジェクトとアプリケーション型プロジェクトの利用関係の分析"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

JAIST Repository

https://dspace.jaist.ac.jp/ Title 日本のバイオインフォマティクス政策のマクロビュー : グラントデータに基づくインフラ型プロジェクトと アプリケーション型プロジェクトの利用関係の分析 Author(s) 柳澤, 直宏; 加納, 信吾 Citation 年次学術大会講演要旨集, 26: 222-225 Issue Date 2011-10-15

Type Conference Paper Text version publisher

URL http://hdl.handle.net/10119/10106

Rights

本著作物は研究・技術計画学会の許可のもとに掲載す るものです。This material is posted here with permission of the Japan Society for Science Policy and Research Management.

(2)

2B09

日本のバイオインフォマティクス政策のマクロビュー

~グラントデータに基づくインフラ型プロジェクトとアプリケーション型プ

ロジェクトの利用関係の分析~

○柳澤 直宏,加納 信吾(東京大学)

1.はじめに

1.1 サイエンス・インフラとしてのバイオインフォマティクス バイオインフォマティクスは、生物学、計算科学、数学、統計学を用いて、生物学的配列データやゲ ノムの内容および編成を分析し、巨大分子の機能と構造を予測する、学際的な研究分野と定義されてい た(Luscombe et al., 2001)。そして、これら各種研究をするために、ゲノムから得られる配列とその 内容に関する情報、実験的に得られた遺伝子産物の構造、機能分析から得られる情報のデータベース化 が行われてきた。 特に近年では、ゲノムから得られる情報の意味を理解するポストゲノム研究が盛んである。これは、 ゲノム情報が細胞内要素の設計図にすぎず、このゲノム情報に基づいて多様なタンパク質が発現し、発 現したタンパク質の化学反応によって代謝物質を変化させることで細胞の活動が生じるからである。こ のことから、タンパク情報の集合であるプロテオームのデータや、代謝物質情報の集合であるメタボロ ームのデータ等多種多様なデータがデータベースの形で蓄積されている。

日本における代表的なデータベースの一例として Kyoto Encyclopedia of Genes and Genomics(KEGG) (Kanehisa et al, 2006)が存在するが、このデータベースは文献を基に代謝パスウェイデータを構築 公開しており、近年では薬物のデータベースを新たに追加し、その構造情報や標的分子の情報を知るこ とが可能である。そしてこの KEGG は、サイエンス・インフラとして、国内外の研究者に広く利用され ている。このように、バイオインフォマティクスには、サイエンス・インフラとしての役割がある。 1.2 ライフサイエンス・データベースを統合する活動 しかしながら、日本には数百のデータベースが存在しているといわれているものの、その利用が十分 といえないもの少なからず存在する。このような現状を踏まえて、文部科学省委託研究開発事業である 統合データベースプロジェクトによって、生命科学系データベースのポータルサイトが整備され、各種 データベースのチュートリアルが映像コンテンツ等によって提供されている(Kawano et al., 2011)。 このような活動によって、データベースの存在が明らかになるとともに、その利用が容易になってきて いる。 1.3 インフラ型プロジェクトとアプリケーション型プロジェクトの定義 本研究においては、委託費、補助金、交付金等を含めたグラントを受けたライフサイエンスの研究プ ロジェクトのうち、データベースの構築、データの拡充を研究目的の一つとして掲げているものをイン フラ型プロジェクトと定義する(バイオリソースのバンクに関するもの、統合データベースの構築に関 するものを除く)。 また、バイオインフォマティクスの研究プロジェクトのうちデータベースの構築およびデータベース の拡充以外を研究目的とするものをアプリケーション型プロジェクトと定義する。尚、アプリケーショ ン型プロジェクトには、データベースの構築と生命現象の分析をテーマとするインフラ型プロジェクト とアプリケーション型プロジェクトのハイブリット型を含むものとする。

(3)

2.研究目的

本研究の目的は、インフラ型プロジェクトとアプリケーション型プロジェクトの利用関係の分析する ことである。この分析は、日本におけるバイオインフォマティクス研究の評価、日本におけるバイオイ ンフォマティクス政策の評価につながるものであると考えている。しかしながら、インフラ型プロジェ クトとアプリケーション型プロジェクトとの間には直接的な利用関係がある訳ではないため、その評価 は困難である。本研究においては、インフラ型プロジェクトの成果物であると共に、アプリケーション 型プロジェクトの基盤となるデータベースを、インフラ型プロジェクトとアプリケーション型プロジェ クトの結節点として捉え、インフラ型プロジェクトとアプリケーション型プロジェクトの利用関係の分 析する試みを行った。 尚、統合データベースプロジェクトに代表されるように、国内に存在(散在)している数百のデータ ベースを統合する活動が活発化しているが、グラントプロジェクトとデータベースとの対応関係が明ら かになっているものは国内の主要プロジェクトに限られている。また、図1に示すように、グラントプ ロジェクトとデータベースの対応関係には多様なパターンが存在しているため、データベースの構築に あたってどの程度の資金が投入されてきたかをまとめた情報は知られている限り存在しない。これは、 グラントの種類が多いこと、実施省庁が複数存在することにその原因の一端があると考えられるが、こ のような複雑な状況において、本研究は、現時点で得られるデータを最大限用いてどの程度の検討が可 能であるかを示すことも本研究の目的とする。 1) 1対1対応型 2) 1対n対応型 3) N対1対応型 4) N対n対応型 図1:類型化されたグラントプロジェクトとデータベースの対応関係 グラントプロジェクト データベース グラントプロジェクト データベース データベース グラントプロジェクト グラントプロジェクト データベース グラントプロジェクト グラントプロジェクト データベース グラントプロジェクト データベース

(4)

3.分析方法

3.1 インフラ型プロジェクトとデータベースとの対応付け 上記 1.3 で定義したインフラ型プロジェクトのうち、少なくとも一部の期間の配分額が確認できるも の(農林水産省の助成プロジェクト:11件、厚生労働省の助成プロジェクト:4件、経済産業省の助 成プロジェクト(NEDO、JBiC によるものを含む):約20件、文部科学省の助成プロジェクト(科研費、 21世紀 COE を含む):約50件)と、生命科学系データベースカタログにエントリされている約90 0のデータベースのうち、国内の組織によって運営されているもの(組織分類されていないものを除く) との対応付けを行った。 3.2 データベースとアプリケーション型プロジェクトの対応付け 生命科学系データベースカタログにエントリされている国内外のデータベースとアプリケーション 型プロジェクトとの関連性を分析した。尚、本分析においては、テキストマイニングの手法を利用して いる。具体的には、生命科学系データベースカタログに掲載されている国内外のデータベース約900 の紹介文とアプリケーション型プロジェクト約700件の要旨との比較をすることによって、各データ ベースと各アプリケーションプロジェクトとの間にどの程度の関連性を網羅的に判定し、アプリケーシ ョン型プロジェクトとどの程度関連性があるかを示したスコア(関連度)を算出した。 3.3 インフラ型プロジェクトとアプリケーション型プロジェクトの利用関係の分析 上記 3.1、3.2 の結果を踏まえて、インフラ型プロジェクトと対応付けられた各データベースに配分 されたと推定さる額と、各データベースとアプリケーション型プロジェクトとの関連度に基づいて、デ ータベースを結節点としたインフラ型プロジェクトとアプリケーション型プロジェクトの利用関係を 分析した(図2)。 図2:インフラ型プロジェクトとアプリケーション型プロジェクトの利用関係

4.結果と考察

現在のところ、図2に示した、データベースを結節点としたインフラ型プロジェクトとアプリケーシ 各データベースに配分された額(推定) データベースとアプリケーション型 プロジェクトとの関連度 データベースA データベースB データベースC

(5)

切り口で分類し、各種検討を行っている。結果と考察の詳細については本発表にて紹介する。

5.おわりに

本研究は、基礎研究分野におけるグラントの評価を目的としたグラント・メトリクスに関するものと して、一定の成果があったと考えている。しかしながら本研究において、グラントプロジェクトとデー タベースとの対応付けが確認されなかったものが少なからず存在していることが明らかになっている。 すなわち、データベースの構築を研究プロジェクトの目的の一つとして掲げているものの、その成果物 であるデータの所在が不明という状態である。このことから、本研究は、更なる調査の余地がある。従 って、本研究は、バイオインフォマティクス分野におけるインフラ型プロジェクトとアプリケーション 型プロジェクトの利用関係の一部しか反映できていないかもしれない。一方、現在得られるデータに基 づいてどの程度の検討が可能であるかを示す目的は達成できたといえる。 尚、本研究を通じて、今後、グラントプロジェクトの成果報告書に、業績として学術論文を列挙する ように、データベースの構築やデータの拡充等の情報を掲載する必要性を強く感じたため、ここに提言 したい。

参考文献

Kanehisa M., Goto S., Hattori M., Aoki-Kinoshita K.F., Itoh M., Kawashima S., Katayama T., Araki M., and Hirakawa M.(2006) Nucleic Acids Res. 34, D354-357

Kawano S, Ono H, Takagi T and Bono H.(2011) Brief Bioinform 12,(Online Journal)

参照

関連したドキュメント

2 つ目の研究目的は、 SGRB の残光のスペクトル解析によってガス – ダスト比を調査し、 LGRB や典型 的な環境との比較検証を行うことで、

自動運転ユニット リーダー:菅沼 直樹  准教授 市 街 地での自動 運 転が可 能な,高度な運転知能を持 つ自動 運 転自動 車を開 発

 哺乳類のヘモグロビンはアロステリック蛋白質の典

Linux Foundation とハーバード大学による CensusⅡプロジェクトの予備的レポート ~アプリケーシ ョンに最も利用されている

FSIS が実施する HACCP の検証には、基本的検証と HACCP 運用に関する検証から構 成されている。基本的検証では、危害分析などの

本論文での分析は、叙述関係の Subject であれば、 Predicate に対して分配される ことが可能というものである。そして o

つまり、p 型の語が p 型の語を修飾するという関係になっている。しかし、p 型の語同士の Merge

区道 65 号の歩行者専用化