-3.08 -2.76

胃がん細胞株

ホモ欠失株

アレイCGH

1 2

3 4

5 6

7 8

9 10

11 12

13 14

15 16

17 18

19 20

21 22

23 24

25 26

27 28

29 30

31 32

H

2

0 PLC

ADAM23 MDH1B KIAA0971 GAPDH GPR1

CPO

ゲノムPCR

GPR1 ADAM23 MDH1B KIAA0971 CPO 100kb 2q33.3

Cen Tel

698O13 655B6

90D19 17I6

BAC (RP11)

Gene

ホモ欠失

:発現消失:13 株

(41.9%)

:発現低下: 8 株

(25.8%) ADAM23

MDH1B KIAA0971 GAPDH

1 2

3 4

5 6

7 8

9 10

11 12 14

15 16

17 18

19 20

21 22

23 24

25 26

27 28

29 30

31 32

胃がん細胞株

H

2

0

正常胃

13

ADAM23 expression

RT-PCR

-3.08 -2.76

胃がん細胞株

ホモ欠失株

アレイCGH

参考文献

1)

Inazawa J, Inoue J, Imoto I. Comparative genomic hybridization (CGH)-arrays pave the way for identification of novel cancer-related genes. Cancer Sci 2004; 95: 559-63.

2)

Takada H, Imoto I, Tsuda H, Sonoda I, Ichikura T, Mochizuki H, Okanoue T, Inazawa J.

Screening of DNA copy-number aberrations in gastric cancer cell lines by array-based comparative genomic hybridization. Cancer Sci 96:100-10, 2005.

3)Takada H, Imoto I, Tsuda H, Nakanishi Y, Ichikura T, Mochizuki H, Mitsufuji S, Hosoda F, Hirohashi S, Ohki M, Inazawa J. ADAM23, a possible tumor suppressor gene, is frequently silenced in gastric cancers by homozygous deletion or aberrant promoter hypermethylation.

Oncogene 24:8051-60, 2005.

4)Takada H, Imoto I, Tsuda H, Nakanishi Y, Sakakura C, Mitsufuji S, Hirohashi S, Inazawa J.

Genomic loss and epigenetic silencing of very low density lipoprotein receptor involved in gastric carcinogenesis. Oncogene 25:6554-62, 2006.

5)Kikuchi R, Tsuda H, Kanai Y, Kasamatsu T, Sengoku K, Hirohashi S, Inazawa J, Imoto I.

Promoter hypermethylation contributes to frequent inactivation of a putative conditional tumor-suppressor gene connective tissue growth factor in ovarian cancer. Cancer Res 67:7095-105, 2007.

2.2.2.3 がん関連遺伝子データベースの構築

(1) 研究計画

本プロジェクト開始当初の研究計画書に記載した本項の研究内容は以下の通りである。

「国立がんセンター研究所では、がん関連遺伝子を同定するための大規模な SNPs タイピング実 験やマイクロアレイによる遺伝子発現解析を行っている。どの遺伝子群に着目するかについて、

バイオインフォマティクス手法で絞込みを行うため、国立がんセンター研究所と生物情報解析研究 センターが共同で文献からの情報抽出や新規疾患遺伝子候補の予測を行い、その結果をヒト全 遺伝子データベースに格納する。また、国立がんセンター研究所の疾患の専門家による精査を受 けることにより、新規のがん関連遺伝子の発見を試みる。」

基本的にこの計画に従い、かつプロジェクト全体の目標である「ゲノム情報を統合するデータベー スの構築」への貢献を意識しつつ研究を進めた。なお、本項の研究は文部科学省科学技術振興 調整費「生命科学データベース統合に関する調査研究」、(独)医薬基盤研究所保健医療分野に おける基礎研究推進事業「疾患ゲノムデータベースの構築と創薬基盤研究」によって支援を受け ている研究とも密接に連携しつつ進めた。以下、研究としての全体像の理解を意識しつつ説明・

報告する。

(2) H-InvDB との機能的統合の推進

研究計画にあるように、国立がんセンター研究所では、国立精神・神経センター、国立国際医療 センター、国立循環器病センター、国立成育医療センター、国立医薬品食品衛生研究所等と共同 で、疾患ゲノムデータベース GeMDBJ を構築している。GeMDBJ(Genome Medicine Database of Japan、http://gemdbj.nibio.go.jp/)とは、一義的には個別化医療開発・創薬着手等の個別研究を 目標としたミレニアム・ゲノム・プロジェクトにおいて生産された、臨床試料等のゲノム解析データ の二次利用支援を目指して構築されたデータベースであり、H16 年度から公開を開始している。

同プロジェクト終了後は、国立がんセンターから医薬基盤研究所に移管され、我が国の広義の創 薬研究の基盤となるデータ提供を主要目的としている。現在、JSNP や、Illumina BeadsChip(現状 では一部)を用いた認知症・がん・高血圧・糖尿病・喘息などの生殖細胞系列の遺伝多型のゲノ ム網羅的スクリーニングデータや、Affymetrix GeneChip による 756 検体の臨床試料の発現プロフ ァイルデータに加え、蛍光二次元電気泳動によるがん細胞・がん組織等のプロテオーム解析デー タの公開も開始している。

国立がんセンターではがんの臨床試料の網羅的な分子解析情報を取得・提供しつつ、がん関 連遺伝子探索を進めているが、その膨大かつノイズやバイアスの混入が避けられない臨床試料 等の omics 解析データから出発して、どの遺伝子群に着目するかを絞りこむためには、文献等の アノテーション情報を高度に整理し、最大限活用することが必須である。そのような優れたアノテ ーション情報を提供しているのが H-InvDB であるため、まず GeMDBJ と、H-InvDB との連携を実 現し、有機的・機能的統合を通して新規疾患(がん)関連遺伝子候補を予測するための基盤構築

図 2.2.2.3-1 GH 連携の例

すなわち、図 2.2.2.3-1 に示すように GeMDBJ における個別のデータレベルでのリンクを構築して H-InvDB の情報を参照することを可能にした。これにより、GeMDBJ が提供している豊富なゲノム

・トランスクリプトーム情報空間の中を、疾患遺伝子を求めて探訪を続けるデータベースユーザー は、両データベースが提供する genome viewer のうち、より使い慣れているものを用いて、即時的 に H-InvDB の疾患関連情報等のアノテーション情報や、GeMDBJ が標準としている Affymetrix GenChip とは別のプラットフォームの遺伝子発現情報等を活用できるようになった(GH 連携の例

(1)~(3))。

さらに、両データベースが参照している各種外部リファレンス・データベースの更新状況を、迅 速かつ整合性をもって自動的に反映させるための Hyperlink Forwarding System を GeMDBJ に導 入するための作業を進めた。

図 2.2.2.3-2 GH 連携の例(開発中)

上記 3 つの例の他、さらに下記のような GeMDBJ から H-InvDB への連携が可能かつ有用であ ると考えられ、一部実際に検討・試用を開始した。

① GeMDBJ から H-InvDB の TOPO Viewer へ

GeMDBJ 内の検索から注目される疾患関連 SNP について、その SNP の種類(g/r/i/cSNP)、

遺伝子内の位置(局在性シグナル、膜貫通ドメイン・機能ドメイン情報等)、3D 構造への影響に ついての情報を即座に参照する。

② GeMDBJ から H-InvDB の LEGENDA(PubMed の遺伝子・物質・疾患の関連情報)へ GeMDBJ 内の検索から注目される候補遺伝子について、H-InvDB が提供する強力なマイニン

合物との対応を探索する。

➂ GeMDBJ から H-InvDB の PANDA(類似遺伝子予測機能)へ

同様に、GeMDBJ 内の検索から抽出されてくる候補遺伝子群について、H-InvDB が提供する強 力なマイニングツールの一つである PANDA を用いて、候補遺伝子と特徴が似ている遺伝子を さらに絞りこまれた候補として予測する。

④ GeMDBJ から DNAProbeLocator(GeneChipProbe 情報)へ

GeMDBJ の発現プロファイルデータ取得に用いた GeneChip のプローブについて、H-InvDB が 提供するプローブ配列解析結果サブ・データベースを参照し、遺伝子との対応付けをより正確 に解釈する。

⑤ GeMDBJ の2D-DIGE プロテオームデータベースから H-Inv DB へ

GeMDBJ Proteomics が提供する蛍光二次元電気泳動上のスポットの質量分析機による蛋白 質同定情報に付加するアノテーション情報として、H-InvDB を参照する。

GeMDBJ は今後、a)第二世代のゲノムスキャン技術の適用(HapMap プロジェクトの成果を取り 入れ、遺伝子のカバー率が約 80%に上る最新鋭のスクリーニングデータを提供する)、b)解析対 象疾患の拡大(症例数の増強(例:高血圧)、選択基準の見直し(例:認知症)、同一疾患カテゴ リーの中での疾患の追加(例:がん))、c)薬理ゲノム学的解析のゲノムスキャンの追加などを 進めており、本研究により実現した H-InvDB との上記のような機能的・有機的連携は、最終的 にユーザーがあたかも単一のデータベース内の高次元で多層性の情報を縦横無尽に探索して いる環境の構築・強化を達成すると考えられる。

(3)生物情報解析研究センターと共同で行った新規がん関連遺伝子候補の予測

当初の計画に準じて、共同研究のためのルールを確定した上で、国立がんセンター研究所で 取得した胃がんのゲノム網羅的多型解析(SNP ゲノムスキャン)の未発表二次スクリーニングデ ータを生物情報解析研究センターの研究チームに提供した。同研究チームはデータを H-InvDB Disease Edition 用に加工し、多型班・タンパク質班・外部共同研究者が集まり、アノテーションを行 った。詳細は作業の主体を担当した生物情報解析研究センター側から報告されるだろうが、蛋白 質 3 次元構造への影響や、ナンセンス変異や indel における構造ドメイン破綻や NMD の有無、極 性・電荷の変化やプロリン残基をまきこむなどの「有害」な生物学的効果を及ぼす可能性のあるア ミノ酸非同義置換などの観点から、SNP タイピングの実験データのみからは得られない貴重な情 報が付加され、興味深い SNP が抽出された。最終的に 1,535 個の SNP について、これらのアノテ ーションと OMIM の情報がリスト(データベース)化された。プロジェクト当初の研究計画の最終段 階は「国立がんセンター研究所の疾患の専門家による精査を受けることにより、新規のがん関連

ストを見ても、個人あるいは数名の「専門家」の知識のみでは十分な精査ができないことが強く意 識された。これは今回のデータが事前確率によらないゲノムスキャンデータから出発していること が強く影響しており、国立がんセンター研究所側、すなわち臨床試料等の解析を行う「wet の」疾 患研究者側の「精査」においては、三次スクリーニング以降の絞込ゲノムスキャンが必要であると 考えられた。すなわち wet 側のそのような精査によって絞りこまれた単一の遺伝子あるいはゲノム 上の連鎖不平衡ブロックにおいて、dbSNP 等に登録されている SNP リストから高密度タイピングを 行う際に、今回の生物情報解析研究センターの研究チームが行った解析をさらに重ねて実施する ことでより効率良く、短期間に疾患遺伝子及びその責任多型に到達すると考えられる。

ドキュメント内 <4D F736F F D D83808FEE95F1939D8D87504A8E968BC695F18D908F915F8E968CE3955D89BF97702E646F63> (Page 126-147)

関連したドキュメント