H26 バイオインフォマティックス概論授業予定 (授業の進み具合によって変更の可能性があります) 黒字は、講義による解説。青字はウェブを使った実習を示します。 第 1 回 10 月 7 日 授業概要説明 Bioinformatics とは? ゲノム-遺伝子-mRNA-タンパク質の関係の復習(DVD) さまざまなデータベース・ゲノムデータベースに触れてみる 第 2 回 10 月 14 日 ヒト全ゲノム解読プロジェクトについての解説(1/3) ヒトゲノムプロジェクトの歴史・戦術 連鎖地図、物理地図の作製 配列データベースについての解説 データベースからの塩基配列とアミノ酸配列の取り出し方 宿題(1):配布 第 3 回 10 月 21 日 ヒト全ゲノム解読プロジェクトについての解説(2/3) BAC ライブラリーの作製、整列化 BAC ライブラリーのショットガンシーケンス ヒト全ゲノム解読プロジェクトについての解説(3/3) 配列のアセンブリー、コード配列の予測 cDNA 塩基配列から蛋白質アミノ酸配列への変換操作 第 4 回 10 月 28 日 ホモロジー検索(BLAST 検索)についての解説(1/2) BLAST 検索の実習(BLASTP) 結果の見方
Whole genome shotgun sequence によるゲノム解読
宿題(2):配布
第 5 回 11 月 4 日 Whole genome shotgun sequence によるゲノム解読(残り: scaffold の作製、FISH による染色体へのマッピング作業)
ゲノム解読で分かったヒトゲノムの特徴、医療への利用
ホモロジー検索(BLAST 検索)についての解説(2/2)
BLAST 検索の実習(BLASTN, BLASTX, TBLASTX)
第 6 回 11 月 11 日 研究計画立案、レポート・論文作成に必要な情報収集
文献検索(PubMed, 大学図書館 On line journals)
NCBI ゲノムデータベースの利用 MapViewer の利用(1):遺伝子の染色体上の位置を調べる MapViewer の利用(2):ゲノムデータベースでの BLAST 検索 MapViewer の利用(3):遺伝子ファミリーのメンバーの同定 MapViewer の利用(4):次世代シーケンスで得られた 100bp 断 片配列の参照ゲノムへのマッピング 第 7 回 11 月 18 日 配列アライメントについての解説 ペアワイズアライメント、多重配列アライメントの作成と見方 分子系統樹の作成 宿題(3)配布 第 8 回 11 月 25 日 分子生物学会出席のため鈴木、不在 酒井義文先生(本学工学研究科情報科学出身)による解説 Blast 検索、ClustalW、分子系統樹のアルゴリズムと原理 第 9 回 12 月 2 日 分子系統樹から分かること “宿題(2)提出“ 第 10 回 12 月 9 日 タンパク質/遺伝子の機能に関する情報収集:OMIM ゲノム構造の変化と生物進化 ゲノムの重複と遺伝子レパートリーの増加 オルソログとパラログの発生 遺伝子の並行進化 宿題(2)解説 宿題(4)配布 第 11 回 12 月 16 日 分子系統樹、ゲノム構造の変化と生物進化(残り) モデル生物についての解説 “宿題(3)提出”
第 12 回 1 月 6 日 バイオデータベースの利用
MGI (Mouse Genome Informatics) の利用 ZFIN (The Zebrafish Model Organism Database) 代謝経路データベース
KEGG(Kyoto Encyclopedia of Genes and Genomics)の利用
第 13 回 1 月 13 日 タンパク質の構造(シグナルペプチド、疎水・親水性プロット、 ドメイン構造)についての解説 ウェブサイトを使ったタンパク質の構造解析 分子量と等電点の予測 シグナルペプチドの予測 ドメイン構造の予測
代謝マップ・バイオデータベースを使った演習
データベースを使って、dopamine の合成経路、合成部 位、作用機序、薬剤等について情報収集する。 宿題(5)配布 “宿題(4)提出”第 14 回 1 月 20 日 ゲノムブラウザ Ensembl Genome Browser の利用
必要なゲノム塩基配列をゲノムデータベースから取り出す 遺伝子の転写調節とコンセンサス配列についての解説 Ensembl を使った転写調節配列の収集 プログラムを使ったコンセンサス配列の検索 次世代シーケンス解析 シーケンス原理 次世代シーケンス解析の利用(ゲノム解析、トランスクリプト ーム解析) 次世代シーケンサーで得られた配列断片の情報処理(アセンブ ル、BLAST2GO 等、KEGG map へのマッピング)
第 15 回 最終回 1 月 27 日 ポストゲノム研究(1)—全遺伝子の機能解析 最新の遺伝子ノックアウト技術(TALEN, CRISPR/Cas9) 遺伝子ノックダウン技術(Antisense-Morpholino) ポストゲノム研究(2)-比較ゲノム(Comparative Genomics) ヒトとフグの比較ゲノムで明らかになった脊椎動物の進化 に伴う染色体構造の変化(繰り返し配列の発生、シンテニ ー領域) ポストゲノム研究(3)—機能ゲノム(Functional Genomics) 生 物 間 で 保 存 さ れ た 非 コ ー ド 領 域 (conserved non-coding sequence):進化的に離れた生物間でゲノム配列を比較し、遺伝 子の発現調節に重要な領域をみつける=長距離アライメントプロ グラム(Lagan) “宿題(5)提出“ 授業評価 推薦図書とおもだったウェブサイトはこのファイルの最後に掲示してあります。
10 月 7 日(第 1 回) 講義 1)授業の予定と進め方 2)「バイオインフォマティックス」とは? 3)遺伝子の構造についての復習:パワーポイントのファイルを参照 4)遺伝子、転写、翻訳の復習(DVD を使って) 5)どのようなデータベースを使うか 6)ゲノムデータベース(動物、植物、菌類、バクテリア)をのぞいてみる 使用する DVD:講談社ブルーバックス B1582「見てわかる DNA のしくみ」 今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業で は、基本的に各授業の前半で講義、後半にコンピューターを使った実習を行います。 実習では、ウェブ上で公開されているデータベースやプログラムを使います。今日は、 生物学、分子生物学、農学研究に利用できるデータベースにどのようなものがあるか を紹介します。また現在では、多数の生物のゲノム配列が解読されて、配列は一般に 利用できるように整備されています。どのような生物でゲノム解読が行われているの か、ウェブサイト(NCBI, Ensembl)を使って少しのぞいてみましょう。 なおこのテキストでは、その日の授業で行う講義内容とコンピューターを使った実 習について、操作方法を含めて簡単に説明してあります。必要に応じて、プリントア ウトして下さい。講義で使うパワーポイントの図はプリントしたものを資料として配 布します。毎回、翌週のプリントを配ります。このテキストと配布資料を使って、予 習・復習して下さい。 ———————————————————————————————— 実習 2 つのウェブサイトを開いて、どのような生物でゲノム情報が利用できるか調べてみ よう
1. NCBI (National Center for Biotechnology): http://www.ncbi.nlm.nih.gov/ 2. Ensembl Genome Browser: http://asia.ensembl.org/index.html
10 月 14 日(第 2 回) 今日の授業内容 1. 講義:ゲノム解読プロジェクト(1/3) 2. 実習:データベースからのアミノ酸配列、塩基配列の取り出し方 3. 実習:配列エントリーに示されている情報について
講義
ゲノム解読には、階層的ショットガン法と全ゲノムショットガン法の 2 通りの方法 があり、現在では全ゲノムショットガン法が主流となっています(長所と短所は配付 資料を参照)。またこの数年の間に、次世代シーケンサー(NGS)が実用化され、現在で はゲノム解読は NGS を使うことが主流となっています。NGS によるシーケンスの超高 速化により、様々な生物でゲノム解読が行われることは間違いない状況です。 ゲノム解読の歴史的な背景と、ゲノム解読の方法論を理解してもらうために、授業 では階層的ショットガン法で解読されたヒトゲノムプロジェクトを例にしてゲノム解 読の道筋を解説します.予定では 3 回に分けて解説します。 ヒト全ゲノム塩基配列解読の行程(1/3) 1)連鎖地図 2)BAC ライブラリー作製 3)BAC ライブラリー整列化(物理地図) 4)ショットガンシークエンス 5)アセンブル 6)アノテーション ゲノム解読プロジェクト国際研究プロジェクトによるヒトゲノム計画 (Human Genome Project) は 1990 年に着手さ れ、13 年後の 2003 年に解読完了が宣言されました。ヒトゲノム計画は、階層的ショットガン法 と呼ばれる手法で行われました。すなわち連鎖地図の作成から BAC クローンの整列化の過 程を経たのち、染色体上にマップされた BAC クローンをショットガン法で解読し、染色体レベ ルにまで塩基配列を繋ぐという過程を経て、ゲノム塩基配列の完全解読にまで到達しました。 このプロジェクトの間に塩基配列の解析能力(DNA シークエンサー)は大幅にアップし、同時 に塩基配列をつなぎ合わせるコンピューターの処理能力も著しく進歩したことにより、連鎖地 図作製を省略して、全ゲノムをいきなりショットガン法で読むことが可能となりました。民間企 業のシエラ社は、数年のあいだに全ゲノムショットガン法によりヒトゲノムを解読することに成 功しました。最終的には、国際研究プロジェクトとシエラ社の間で協議の結果、解読成果が 同時に公表されました。
ヒトゲノム計画の終了と前後して、多くの生物で全ゲノム解読プロジェクトが始められ、既 に 100 種類に近い動物で全ゲノム配列の解読が終了し、現在も新しい生物のゲノム解読プ ロジェクトが次々に着手されています。ゲノム情報は、遺伝子の機能解析の有力なツールに なることは言うまでもありませんが、生物間でゲノム構造を比較することにより、無脊椎動物か ら脊椎動物の進化の過程で起こったゲノム構造の変化等を知ることも可能となりました。哺乳 類の中でも単孔類(カモノハシ)、有袋類(オポッサム)から有胎盤類に至る進化の過程や、 またチンパンジーとヒトでの知能の差をゲノム構造の進化の観点から議論されています。全 ゲノム塩基配列が利用できるという条件のもとで、進められる遺伝子やゲノム研究がポストゲ ノム研究です。既に家畜や野菜や穀物植物のゲノムもほとんどの種で解読されています。農 学でも新しい研究分野を開拓するためには、ゲノム情報を有効に利用できるがどうかが、極 めて重要な素養となります。 ************************************************************************* ゲノム解読プロジェクトで解析されたゲノム DNA 配列情報は、NCBI と Ensembl で一般に 利用できるよう整備されています。遺伝子の染色体上の位置や類似遺伝子の検索には NCBI が便利です。ゲノムの塩基配列をデータベースから取り出す場合には、NCBI ある いは Ensembl を使います。NCBI と Ensembl の使い方は、授業で実習します。ゲノム情報 がいかに強力なツールになるかを体験し、実感してもらおうと考えています。 ————————————————————————————————
実習
塩基配列・アミノ酸配列の検索 配列データベースから必要なタンパク質のアミノ酸配列、遺伝子の塩基配列の取り出 し方を実習します. アミノ酸の取り出し方!使用するウェブサイト:NCBI. 先頭ページ右側にあるPopular Resourcesの中の 「Protein」を使用する.あるいは左上(All databases)から選ぶことも可能.
キーワードによる検索
例:cow, prion でキーワード検索してみよう
上のタンパク質名(青字)をクリックすると配列エントリーが表示さ れる(見方は最下段と配付資料を参照のこと)
FASTA をクリックすると配列がFASTA formatで表示される 配列は、別のファイルにコピーできる.
Graphics では、タンパクの構造が表示される
Identical Proteins では、別の名前が付けられている同一タンパク質 が表示される FASTA format 塩基配列とアミノ酸配列のファイルフォーム。「>」で始まる1行がコメント (遺伝子名や任意の番号やコメント)を記述するために用意されており、続 く2行目から塩基配列あるいはアミノ酸配列を記述する。最後に改行して 「//」を記載し、1つの配列の記述が完了する(記号「//」はなくてもよい)。 ホモロジー検索、多重アライメント、分子系統樹作成等で使うフォーム。 塩基配列の取り出し方!
使用するウェブサイト:NCBI. Popular Resourcesの中の「Nucleotide」を使用す る
1. キーワードによる検索
例:cow, prion でキーワード検索してみよ
cow, prion の配列だけでなく、関連遺伝子も多数検索されてくるため、 必要な配列を見つける必要がある.Bos taurus prion (PRNP), mRNA が 今回、欲しい配列である.
上の遺伝子質名あるいは GenBank をクリックすると配列エントリーが 表示される(データの見方は配付資料を参照のこと)
FASTA をクリックすると配列が FASTA format で表示される 配列は、別のファイルにコピーできる. Graphic では、遺伝子の構造が表示される 2.アクセッション番号による検索 accession number=DDBJ/EMBL/GenBank 国際塩基配列データベースにおいて 各登録単位(エントリー;各遺伝子)に発行されるエントリー識別子(entry identification, ID)を指す。
例:NM_181015(entry identification, ID)で検索してみよう
配列エントリーに示されているデータ 遺伝子名、生物名、学名、遺伝子座、遺伝子クローニングを行った論文リスト、 翻訳開始・終了点、ドメイン構造、塩基配列、アミノ酸配列(配付資料では、 zebrafish, prion (NM_205586)を使って説明してあります) なお表示結果の詳細な説明は、次のサイトで閲覧できます。 http://hinv.ddbj.nig.ac.jp/manual_cdna-j.html
10 月 21 日(第 3 回) 今日の授業内容 1.講義:ゲノム解読プロジェクト(2/3, 3/3) 2. 実習:cDNA 塩基配列のアミノ酸配列への変換 3. 読み取りフレームと実際のタンパク質配列との関係について説明
講義
ヒト全ゲノム塩基配列解読の行程(2/3)1) 連鎖地図・物理地図(Radiation hybrid panel) 2) BAC ライブラリー作製 3) BAC ライブラリーの整列化 4) ショットガンシークエンス 5) アセンブル 6) アノテーション 7) ヒト全ゲノム塩基配列解読の行程(2/3)
1) 連鎖地図・物理地図(Radiation hybrid panel) 2) BAC ライブラリー作製
3) BAC ライブラリーの整列化 4) ショットガンシークエンス 5) アセンブル
6)アノテーション
cDNA 配列解読プロジェクト、EST(expressed sequence tags)解析プロジェクトについ ての解説
————————————————————————————————
実習
今日は、まず基本操作として、NCBI のプログラム ORF finder を使って、塩基配列 をアミノ酸配列に変換してみます。コンピューター操作に慣れるようにして下さい。 今回は、魚類の cDNA ライブラリーからクローニングされた cDNA クローンの全長配列 (5’UTR, CDS, 3’UTR を含んでいる)を使って実習します。 5’UTR(5’非翻訳領域), CDS(コード配列), 3’UTR(3’非翻訳領域) >test_DNA_sequence-1(zebrafish_charon) >test_DNA_sequence-2(eel_cathepsin-S)
塩基配列(>test_DNA_sequence-1)をアミノ酸配列に変換してみよう
1)利用するウェブサイト:NCBI (National Center for Biotechnology Center)
http://www.ncbi.nlm.nih.gov/
2)使用するアイコン:Open Reading Frame Finder (ORF finder )
open reading frame = 蛋白質をコードする塩基配列の読み取り枠 検索手順
1. NCBI のウェブサイトを開き、左上 Resource List (A-Z)をクリック 2. Open reading frame finder(ORF finder)を開ける
3.アミノ酸配列に変換する 配列(FASTA format)を枠内に配列をコピーする OrfFind ボタンを押す 青で示された部分が、予想されるアミノ酸配列 (センス、アンチセンス鎖の3フレームでの翻訳結果が示される) 通常、一番長いフレームがタンパク質のコード配列である 青のバーをクリックする=塩基配列とアミノ酸配列が表示される 4.推定されたアミノ酸配列を取り出すには Accept ボタンを押す View ボタンを押す:アミノ酸配列データと諸情報が示されている アミノ酸配列をテキストファイル等にコピーする >test_DNA_sequence-1(zebrafish_charon) AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTTCTTTTTTGTAAAATTCTATAATTTAGCTA AAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGGCGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTT GAATCCTCCGGGAATGGACCAGACGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTTCAGAAA TTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAAACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGA GGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGAGCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCC GCAGTTCCCTTTACACAGCGCATAACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCCCTCCAGCGGAGG CTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCACCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGA TCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGCCAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA // 次の配列でも練習してみよう >test_DNA_sequence-2(eel_cathepsin-S) ATCACTGCGTCTTGTGTCCTATCGGTCTAGCCTAGCCACTGTCTANAAGCTATAGGAAGGTTTCAGTATTGGGAGCCATGTTTGGGAGCCTGCTGTTCACTGTGCTGTGT GAGGCAGCAGTGGCCCTCATCAACCCAAATCTAAGCCTCCATTGGGAGATGTGGAAGGAGGGACATGACAAGACCTACCTGTTTAAGGCTGAAGAGTTTGCACGCCGCCA
GATCTGGGAGAAGAACCTGAAGCTGATAACTCTGCATAATTTGGAGGCGTCCATGGGAATGCACACCTATGATCTGGGCATGAACCACCTAGGAGACTTGACTACCGAGG AGATTCTTGACGTGCTAGCTGTAACTCGTGTGCCTCCAAACTTCAGCAGGGGTCCTTCTCCCTTTGTGGGGGTATCCAGGGCCCCTGTGCCTCACAATGTTGATTGGCGA AGAAAGGGCTATGTCACAGAAGTCAAGAGTCAGGGGCGTTGTGGCTCCTGCTGGGCCTTCAGTGCTGCAGGTGCCCTGGAGGGCCAGCTGATGAAGACTCAGGGAACACT TGTATCCCTCAGCCCTCAGAACCTGGTTGACTGCTCCTACAAATATGGCAACGAGGGCTGTCATGGAGGGTTCATGACTCAAGCCTTCCAGTATGTCATTGAGAACGGGG GCATTGAGTCTGACTTTTCATACCCTTACACTGGCATGGAAGAACAATGCAGATATGATTCAGAACTCCGTGTTGCCAACTGTTCCAGCTACAGGTTTCTTCCTGAAGGT GATGAGGTTGCATTAAAATGGGCTCTGGCCACTGTTGGACCAATCTCTGTGGCTATTGATGCTGCTCGACCTAATTTCCACTTCTACCGGAGTGGTGTGTACCATGACCC TACCTGTACCCAAGAAGTAAACCATGGTGTTCTAGCAGTTGGCTATGGTACGCTCAATGGTGAGGACTACTGGCTTGTGAAGAACAGCTGGGGACAGCCTTTTGGGGAAC AGGGCTACATTCGCATGGCACGAAACAAGAACAACCAGTGTGGCGTTGCCTTGTATGCCTGCTACCCCATTATGTGACGACCTGAAGCAAAGGATTGATTTCTAACTTGA AACATTTTAAAATTTTTATTTTGATTTGCACCTGTGCATGTTACTGATTTGTAAAGAATACTGTTAAAATGATTTGTATTAAAAAAATATATATTTTTAGATGTGGAATT TTAGTTGAACCTAAATAAATAAATGTAAAAAAAAA //
10 月 28 日(第 4 回) 今日の授業内容
1. Whole genome shotgun sequence についての解説 2. 実習:配列検索(BLAST)(1/2)
講義
Whole genome shotgun sequence の原理について、配付資料を使って説明します.
————————————————————————————————
実習
ホモロジー検索(BLAST 検索)1/2 遺伝子やゲノムを扱う研究で使用する機会が最も多いプログラムが、塩基配列やア ミノ酸配列のホモロジー(相同性)検索プログラムです。新しい遺伝子を発見した時、 最初に行う操作が相同性検索だからです。相同性検索により、クローニングした遺伝 子が、データベースに登録されているどの遺伝子に類似しているかを調べることがで きます。最近では、次世代シーケンサー解析で得られた配列をゲノムにマップする際 にも BLAST 検索が用いられます。ゲノム解読されている生物であれば、100bp の短い 配列(次世代シーケンサーの解析では、1 リードは 100bp)でもゲノムのどの位置に あるかを調べることもできます。授業では、BLAST (Basic Local Alignment Search Tool)プログラムを用います。 今日は、塩基配列・アミノ酸配列のデータベース、問い合わせ配列とデータベース の組合せ、各組合せで使う BLAST プログラムについて説明します。そのあとテスト 配列を使って、実際に BLAST 検索を行います。 ホモロジー(homology)検索 問い合わせ配列(query sequence)に対し、類似した配列をデータベースから探 し出す操作。最も高頻度に利用されるバイオインフォマティックスの手法のひ とつ。 検索内容: 例)実験でクローニングした遺伝子の種類を特定する。それがコードするアミ ノ酸配列がデータベースに登録されている遺伝子、蛋白質のどれと、またどの 程度類似するか?
遺伝子配列データベース:GenBank, DDBJ, EMBL 最も広く利用されており、検索が高速なプログラムがBLAST(昔、FAST と言う プログラムも使われていたが、現在はあまり見かけない) --- 検索の組合せ 問い合わせ配列 対 データベース --- BLASTN 塩基配列 対 塩基配列データベース BLASTP アミノ酸配列 対 アミノ酸配列データベース BLASTX 塩基配列(アミノ酸配列に置換) 対 アミノ酸配列データベース TBLASTN アミノ酸配列 対 塩基配列データベース(アミノ酸配列に置換) TBLASTX 塩基配列(アミノ酸配列に置換) 対 塩基配列データベース塩基配列(アミノ酸配列に置換) 配列の種間変異の激しい遺伝子の場合(サイトカイン等)、塩基配列を BLASTN 検 索してもヒットしないことがある。その場合には、BLASTX or TBLASTX を使うとよ い。いずれにしても、塩基配列から相同遺伝子を検索する場合、BLASTN よりも BLASTX の方が効率的である。 ************************************************************************** BLAST 検索の原理 1.ホモロジーが観察される配列間の局所アライメントには、多くの場合、ギャップ を含まない保存領域が存在する。BLAST では、そのような局所保存領域(ワード) をまず高速に検索する。 2.一致したワードからアライメントを配列に沿ってそれぞれの方向に拡張していき、 スコアが増加するまで続ける。拡張処理は、スコアの増加が止まり、伸ばす前の ベストスコアより減少し始めた時に終了する。この時点で、HSP (high-scoring segment pair)と呼ばれる、大きな配列領域が見つかる。この時点でギャップがあ るとそこから先には伸長していない。 3.一般に、アミノ酸配列と塩基配列にはギャップが生じているため、HSP のみでは 類似領域の検索として不十分である。そこで、BLAST では、HSP において対応する 位置に存在する 1 組の記号のペアを適切に選び、類似度の高い領域はこのペアを 含むものと仮定して、動的計画法と呼ばれる方法を用いて類似領域を探索する。 HSP から選んだペアを起点として探索範囲を狭く取ることによって、類似度の最 適性は保証されないものの、従来の動的計画法と比較して高速な類似領域の探索 を実現している。 (詳細は、11 月 25 日に酒井先生が解説します。) スコア
アミノ酸配列の場合:BLOSUM62 スコア(アミノ酸の組合せによって値が決められてい る) 塩基配列の場合:値は同じ塩基、異なる塩基の組合せでのみ決められている ———————————————————————————————— BLASTP 実習 先週使ったものと同じ、>test_DNA_sequence-1(私の研究グループで単離した遺伝 子で、既にデータベースに登録済みである:由来生物 zebrafish.遺伝子名 charon、 機能=内臓・脳の非対称性制御)の塩基配列とアミノ酸配列を下に示しました。試 しにこのアミノ酸配列で BLASTP 検索してみよう. BLASTP の操作手順
1.NCBI 先頭ページ右上 Popular Resources から BLAST を選択する。Basic BLAST に上記 5 種類の BLAST プログラムのアイコンがある。
2.protein blast をクリックする。アミノ酸配列(FASTA format)を枠内 に コ ピ ー す る 。 Database (non-redundant ), Algorithm (blastp; protein-protein BLAST)は、デフォルトのままでよい。 3.BLAST のボタンを押して、検索を開始する。 >test_DNA_sequence-1(zebrafish_charon)_peptide MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRR KQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLI VEECKCETSSEEAKVQNTDMFNL データベースに登録されている PSI-BLASTP, PHI-BLAST: 比較的最近開発されたプログラムで、系統的に離れた生物あるいは関連遺伝子を検索す る場合に利用する.種間の保存性が低い遺伝子の場合に利用価値が高い. 検索結果の見方: グラフィックの次に示されているリスト E-value:検索結果は、Query 配列と相同性を示す配列のアライメント結果 が表示される。e-value は、検索に使ったデータベースのなかで、Query の局所配列と検索配列の組合わせが、偶然にみつかる個数を示す。相同 性が高いほど、値は 0 に近づく(最も重要なデータ:蛋白質の場合、e-5 あたりが関連遺伝子か、そうでないかを判断する基準となる)。
Total score (bits): 検索されてきた局所配列の長さをビット形式で示し
たもの。値が大きいほど、相同性を示す領域が長い。
Query cover: 問合せ配列の全長のうち、検索配列と配列が一致している領 域の%
Identities:アミノ酸配列で、相同領域のなかで一致しているアミノ酸の比 率 アライメントの添えられている数字(上のリストにないデータ) Positives: アミノ酸配列の場合に、一致しているアミノ酸+化学的に類似 するアミノ酸の比率 Gaps:アライメントされた配列で、片一方で欠損している塩基あるいはアミ ノ酸の総計
11 月 4 日(第 5 回) 今日の授業内容 1. ヒトゲノムの特徴、医療への利用 2. 実習:配列検索(BLAST)2/2)
講義
ゲノム解読で明らかになったヒトゲノムの特徴、医療への利用について簡単に紹介します実習
ホモロジー検索(BLAST 検索)1/2 BLASTN 実習 blastn を使って、>test_DNA_sequence-1 の相同遺伝子を検索してみよう BLASTN の検索手順1.NCBI、Popular Resources の中から BLAST を選択する。Basic BLAST に 上記 5 種類の BLAST プログラムのアイコンがある。
2.nucleotide blast をクリックする。
「Database」が、デフォルトでは nucleotide collection (nr/nt) で、このままでよい。
注意:Program selection で somewhat similar sequences (blastn) を選択する。 3.塩基配列(FASTA format)を枠内にコピーする。 4.BLAST のボタンを押して、検索を開始する。 >test_DNA_sequence-1(zebrafish_charon) AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTTCTTTTTTGTAAAATTCTAT AATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGGCGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACC GACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGACGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCG GGCCGCCGTTAGTCATGTGCCGTTCAGAAATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCAT AGCAAACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGAGCGAAAAAAAGAGG CAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACAGCGCATAACGGAGGAGGGCTGTGAGACGGTGAC CGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCCCTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGC
CCCTCTAGAGCGCGCTCCGTGCTCCTGCACCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCA GCGAAGAGGCCAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA Blastn の利用例: とりあえず調べたい遺伝子が、既知のどの遺伝子に類似するか?を調べ る時等に使う。ただし、生物間で変異の激しい遺伝子(実習で使う charon が一例)の場合には、Blastn では相同遺伝子が十分に検索されてこない ことがあるので、遺伝子を特定するためには、次の Blastx を使う方がよ い。 次世代シーケンス解析で得られた断片(100bp)をゲノムにマップする 時は Blastn を用いる。 同じ遺伝子の配列>test_DNA_sequence-1(zebrafish_charon)なのに、blastp と blastn で検索されてくる遺伝子・蛋白質の数が違うことに注意!(その理由を理 解して下さい) BLASTX 実習 blastX を使って、>test_DNA_sequence-1 の相同遺伝子を検索してみよう blastx の特性: このプログラムでは、遺伝子がコードするアミノ酸配列と相同性の高い蛋 白質を探す。問い合わせ塩基配列は、一度 6 フレームで翻訳され、翻訳さ れた配列がアミノ酸配列データベースに対して検索にかけられている。 アミノ酸置換の激しい遺伝子の相同性検索に非常に有効。 進化的に離れた生物から相同遺伝子を探す場合にも有効。 次世代シーケンサーを使った de novo トランスクリプトーム解析で得ら れた配列を同定する場合、BLASTX を使用する。 TBLASTN の検索手順 tblastx を使って、>test_DNA_sequence-1 の相同性検索を試してみよう tblastx の特性: 問い合わせの塩基配列、データベースの塩基配列とも3フレームで翻訳さ れ、検索にかけられている。 Tblastx の利用例: 単離した遺伝子がコードするアミノ酸配列と相同性の高いアミノ酸配列 をコードする塩基配列を探す。配列の変異が激しい遺伝子種の場合に有効。
練習 PCNA は DNA 複製で働くタンパク質で、バクテリアからヒトまで配列の保存性 が非常に高い。この配列で BLASTN 検索して、>test_DNA_sequence-1 の検索 結果との違いを考えてみよう。 対象生物をイネに限定して、イネゲノムに相同遺伝子が存在するか調べてみ よう。また、バクテリアのゲノムで試してみよう。 >zebrafish_PCNA_cDNA ACTTTAGTTCCTCCTACTCCAAACTAAGAAAGCAGCACAATGTTTGAGGCACGTCTGGTTCAGGGATCTATCCTTAAGAAGGTCCTGGAGGCTCTGAAAGACCTGATCAC CGAGGCTTGCTGGGATGTGAGCTCGTCGGGCATTTCTCTGCAGAGTATGGACTCCTCTCATGTGTCTCTGGTGCAGCTGACGCTCCGGAGTGACGGGTTCGACTCCTACC GCTGCGACAGAAACCTAGCCATGGGGGTCAATCTGAGCAGCATGTCGAAGATTCTGAAGTGTGCTGGAAATGAAGACATCCAGACACTTAGAGCTGAAGACAATGCTGAC ACGCTGGCACTGGTCTTTGAAGCTCAAAATCAGGAGAAAGTGTCCGACTATGAGATGAAACTGATGGATCTGGATGTGGAGCAGCTTGGCATTCCAGAGCAGGAATACAG TTGTGTGGTGAAGATGCCGTCGGGTGAGTTTGCCCGCATCTGCAGGGATCTGTCACAGATTGGTGATGCTGTCATGATCTCGTGTGCCAAGGATGGCGTGAAGTTCTCTG CTAGCGGAGAGCTGGGCACAGGCAACATCAAGCTCTCACAGACCAGCAATGTCGACAAGGAGGATGAAGCGGTAACAATTGAGATGAATGAGCCAGTGCAGCTCATTTTT GCATTGAACTACCTGAACTTCTTCACCAAGCCAACTCCTCTGTCCAGAACGGTCACACTTAGAATGTCCGCACATATTCCACTAGTGGTTGAGGACAAAATTGCAGACCT TGAACACGTAAAATATTACCTGGCGCCCCAGATCGAGGATGAAGAGTCCTCCTAATCCAAGCAGAAGAGCGAAGCCTGTCATCTGTGGGATTTTCATTCTGCAACTCAGA AGTTATTGCATAGATGTTTTGGGAAAATGCATTTTATTACTCAGTGTCTGCTGTGGTTTCCAGTTCAATGGATTCCCGATTGTGACCCTCTAAAGCCATTACATATCATT GGCAGAATTGCGGGCGCACTTATTAAATGATGGTAGTTTGGGCCTTAGCTTTACCAGGCGCTCCGTGGGCTGAATCTAGAGTGCTCTCATGTACATACTCCACATTCAGT CTTGTTTTTCTCCCTTTTTGCCGTTGTCCTCTTGTGTCCATTTCAGGTTTTGTCCAACTGCTCATTCCAATGTGTAGATAATTGTCTGTAAATATGCTAATTGGACACCG TTCATCCAGTCAACCCGTAATAAAACTGTTGTATCGG >zebrafish_PCNA_Protein MFEARLVQGSILKKVLEALKDLITEACWDVSSSGISLQSMDSSHVSLVQLTLRSDGFDSYRCDRNLAMGVNLSSMSKILKCAGNEDIITLRAEDNADALALVFETLNQEK VSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSQIGDAVMISCAKDGVKFSASGELGTGNIKLSQTSNVDKEDEAVTIEMNEPVQLIFALNYLNFFTKATP LSKTVTLSMSADIPLVVEYKIADMGHVKYYLAPKIDEESS
11 月 11 日(第 6 回)
配列情報と文献の検索
研究計画を立てる場合、その研究に関連した論文をリストアップして、既に報告さ れている成果を調べておくことが不可欠です。この操作により、これから進める研究 テーマについて、研究がどこまで進んでいるのか、何が分かっていないのかを調べる 訳です。そして未知の生物現象を解明するのに、最も有効な計画を立案します。もち ろん研究で遺伝子を扱う場合、その遺伝子の配列、これまでに分かっている性質を調 べておくことも重要です。この検索操作をちゃんとしておかないと、「せっかく得ら れた実験成果が既に報告されていた」と言うような悲惨なことも起きかねません。 また卒業論文や投稿用論文の作成時には、緒言に研究の歴史と背景、研究内容の意 義を述べ、考察では実験結果と既知の成果を比較検討し、研究で得られた新しい知見 を議論します。論文を仕上げる時にも、関連論文を収集して精査する必要があります。 さらにクローニングした遺伝子と関連遺伝子とのアライメントを行うことが必要にな ること、分子系統樹を作成するのに関連遺伝子をデータベースから引き出してくるこ とが必要となることがあります。 例えば、自分の研究でウシやブタなどの家畜、あるいは作物で遺伝子をクローニン グしたとします。遺伝子機能に関する研究が進んだ現在では、モデル生物(マウス、 ニワトリ、ゼブラフィシュ、ショウジョウバエ、線虫、酵母、シロイズナズナ等)の どれかで相同遺伝子の機能が解析され、論文の形で出版されていることがほとんどで す。その論文を読めば、クローニングした遺伝子の持つ機能の概要を知ることができ ます。データベースを利用すれば、この様な情報も簡単に収集できます。遺伝子を BLAST 検索し、モデル生物の相同性の高い遺伝子配列を探し、そこから文献情報を探 すことが可能です。 今日は、研究計画を立てる時や論文を書く際、クローニングされた遺伝子の関連情 報検索に必要な、データベースからの遺伝子の塩基配列・コード配列(既に実習済み)、 論文の検索、機能情報の収集操作について実習します。 文献の検索には、(1)NCBI の PuBMed、(2)大学の図書館のオンラインジャーナル、(3) Scopus(Elsevier 社の有料検索システム)が利用できます。PuBMed の使い勝手が最近 非常によくなったので、ほとんどのことは PuBMed ですみます。従って、PuBMed の使 い方を中心に演習し、大学の図書館のオンラインジャーナルについて少し解説を加え ます。 文献検索を使う目的には、下記のように幾つかのシチュエーションに分かれます。いずれも PuBMed で可能です。 1.特定の論文をダウンロードしたい。 2.ある研究者がどのような論文を出版しているか知りたい 3.ある生物現象に関する論文をもれなく調べたい。 4.論文の考察に関連する論文を探したい 5.扱う遺伝子に関連する論文を調べたい。
文献の検索
使用するウェブサイト:NCBI 使用するアイテム: PubMed 上の枠の下にある Advanced ボタンを使う。 左の All Fields ボタンをクリックすると、著者名、出版年度、タイトル中の ワード、Abstract 中のワード、Journal(雑誌)名で検索できるシステムにな っている。これらをうまく使うと上の検索が可能である。それぞれについて試 してみよう。東北大学が購読契約している雑誌、あるは Plos One のような on-line journal であれば、検索結果のページから pdf ファイルを見て、プリ ント、ダウンロードできる。 1.特定の論文をダウンロードしたい。 例えば、山中先生がノーベル賞をもらうことになった iPS 細胞の論文を探し てみよう。Author: Yamanaka Shinya Journal: Cell 2.ある研究者がどのような論文を出版しているか知りたい 例えば、私と研究室の助教の横井さんの共著論文を探してみよう。 Author: Suzuki T Author: Yokoi H 3.ある生物現象に関する論文をもれなく調べたい。論文の考察に関連する論文を探 したい。 例えば、魚類の iPS 細胞に関する論文が出版されているか? Title/Abstract: Fish
Title/Abstract: iPS cell
成長ホルモンの日周リズムに関する論文を知りたい Title/Abstract: growth hormone
Title/Abstract: circadian rhythm
4.扱う遺伝子に関連する論文を調べたい。
例えば、癌遺伝子 Brca2 に関する論文を調べたい。 Title/Abstract: Brca2
Title/Abstract: human or mouse or zebrafish
BLAST 検索結果から、検索した遺伝子に関する文献情報を収集することもできます。 リストアップされてきた遺伝子の名称がアクティブで、それをクリックすると配列情 報に加えて、PUBMED の番号を添えた形で関連の論文もリストアップされています。 PUBMED 番号をクリックすると文献情報に入ることができます。 test_sequence-1 で試してみよう。 >test_sequence-1(zebrafish_charon)_peptide MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRR KQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLI 「電子ジャーナル」へのアクセスの方法 東北大学ホームページ→東北大学付属図書館→電子ジャーナルリスト(学内者限 定)→雑誌名のキーワード検索 OR アルファベット順で検索→volume, page 入 力・検索 「Scopus」を使った検索 「使用方法」 東北大学付属図書館→情報検索→データベース・ツールインデックス→Scopus 「Scorpus の特徴」 PubMed:医学に関係した論文を中心にデータベース化しており、生態学や資源学の雑 誌は、データに登録されていないことが多い。医学系ではほぼ事足りる。ただし、生態学 や資源学の雑誌はデータに含められていないものが多い。 Scorpus:ほぼ全ての分野の論文が、データとして収められている。生態学や資源学の論 文も検索できる。 キーワードで文献を網羅的に収集できる
Search field で Abstract を選択→Add search field で検索項目を 3 個程度に増やす → 調 べ た い 内 容 で 代 表 的 な キ ー ワ ー ド を 入 力 → 検 索 ( 例 : zebrafish, nodal, development で試してみよう)
実習
—NCBI Map Viewer の利用—
NCBI の Map Viewer ではゲノム解読が行われた生物種ごとに、遺伝子の染色体上の位 置を調べること、BLAST 検索を行うことができます。授業では、Map Viewer を使って、4 つ の使用法を実習します。
NCBI Map Viewer の利用(1/4) —遺伝子の染色体上の位置を調べるー 1.NCBI 先頭ページ All resources の Map Viewer を開ける 2.ゲノム塩基配列が公開されている生物種一覧が表示される 3.調べたい生物の Tools から虫眼鏡マークをクリック
4.Search for の枠に遺伝子名を記入し、リターンキー(or Find)を押す
5.遺伝子の位置が染色体上に赤く示される。下の Map element を選択すれば、より 詳細なゲノム情報が表示される。
ヒト染色体における遺伝子の位置(遺伝子座)を検索してみよう 練習:sonic hedghog (shh)を検索してみよう
1.NCBI で Map Viewer を開ける
2.Homo sapiens (human)の Tools から虫眼鏡マークを選択 3.Search for に shh を記入して、Return
4.Map element のなかから SHH を選んでクリック 5.shh の染色体上の位置、周辺の遺伝子が表示される 6.Zoom out、Zoom in してみよう
7.SHH をクリックすると、SHH 遺伝子のイントロン・エクソン構造、変異によ る病状等についての情報が得られる
8.OMIM (OMIM は KEGG にもリンク), HGNC (HUGO nomenclature committee; HUG0=human genome organization) を開けると、変異による異 常や分子構造の特性に関する情報が得られる
ウシ、ニワトリ、ゼブラフィッシュでも shh でキーワード検索してみよう
NCBI Map Viewer の利用(2/4)
—さまざまな生物のゲノムデータベースの利用—
NCBI, Map Viewer では、バクテリアから植物、哺乳類に至るまで多様な生物のゲノム情報 が利用できます。ヒトが持っている遺伝子の相同遺伝子を進化的にたどって、どの生物にま
で存在しているかと言う疑問についても、BLAST 検索によってたどることができます。
練習:ヒトの増殖細胞核抗原(PCNA: proliferating nuclear antigen)の相同遺伝子をイネゲノ ム(
Oryza sativa (japonica cultivar-group)
)、バクテリアから探してみよう。マウスビタミンD受容体の相同遺伝子が、ショウジョウバエ、原生動物(アメーバー)、イネに 存在するかどうかも試してみよう。 バクテリアのゲノム検索では、small genome に入り、種を指定し、検索する。 >human_pcna MFEGRLVQGSILKKVLEALKDLINEACWDISSSGVNLQSMDSSHVSLVQLTLRSEGFDTYRCDRNLAMGVNLTSMSKILKCAGNEDIITLRA EDNADTLALVFEAPNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSHIGDAVVISCAKDGVKFSASGELGNGNIKLS QTSNVDKEEEAVTIEMNEPVQLTFALRYLNFFTKATPLSSTVTLSMSADVPLVVEYKIADMGHLKYNLAPKIEDEEGS >mouse_vitamin_D_receptor MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDC RITKDNRRHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAI LLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDL NEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQ SFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPG VQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSM KLTPLVLEVFGNEIS
NCBI Map Viewer の利用(3/4)
—特定の生物のゲノムに存在するフ遺伝子ァミリーのメンバーの検索— 多くの遺伝子には、生物進化の過程で共通の遺伝子から派生した兄弟遺伝子が存在しま す。またそのメンバーは進化に伴って増える傾向にあります。マウスならマウスのゲノムに対 して、あるメンバーでゲノムを検索することにより、進化的に関連して部分的にでも共通の配 列を持つメンバーを全て検索することができます。今回は、マウスゲノムに存在する核レセプ ターファミリーのメンバー、及び G タンパク共役受容体のメンバーを探す操作を実習します。 練習:マウスゲノムに核受容体ファミリーのメンバーが幾つ存在するか? 1.NCBI の Map Viewer(ページ下、POPULAR)を開ける 2.Mus musculus の Tools から B(BLAST)を選択
3 . mouse_vitamin_D_receptor の 配 列 を 枠 に コ ピ ー し 、 Program か ら BLASTP を選択し、Begin Search をクリック
4.マウスゲノムに存在する核レセプターファミリーの全てのメンバーが検 索されてくる。60 種類あまり存在することが分かる
5.上の方にある Genome View をクリックしてみよう:検索されてきた遺伝子 の染色体上の位置が表示される >mouse_vitamin_D_receptor MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQA CRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPP IRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQ KVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQ VGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNE EHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS
G-protein coupled receptor のメンバーで試してみよう。 >human_MC4R MVNSTHRGMHTSLHLWNRSSYRLHSNASESLGKGYSDGGCYEQLFVSPEVFVTLGVISLLENILVIVAIAKNKNLHSP MYFFICSLAVADMLVSVSNGSETIVITLLNSTDTDAQSFTVNIDNVIDSVICSSLLASICSLLSIAVDRYFTIFYALQ YHNIMTVKRVGIIISCIWAACTVSGILFIIYSDSSAVIICLITMFFTMLALMASLYVHMFLMARLHIKRIAVLPGTGA IRQGANMKGAITLTILIGVFVVCWAPFFLHLIFYISCPQNPYCVCFMSHFNLYLILIMCNSIIDPLIYALRSQELRKT FKEIICCYPLGGLCDLSSRY 練習:ショウジョウバエのゲノムには、核受容体ファミリーのメンバーが幾つ存 在するでしょうか? ホヤ(Ciona intestinalis)でも検索してみよう
NCBI Map Viewer の利用(4/4)
—次世代シーケンス解析で得られた配列の染色体へのマッピング— 最も汎用されている次世代シーケンサーである Illumina2000 では、一度の解析で 100b の断片配列が約 4000 万個得られます。ゲノム解析が行われている生物では、このような 短い断片でも染色体にマッピングできます。さらに参照ゲノムと塩基配列の違いがあるか どうか、遺伝子疾患の原因が解析された個人のゲノムに存在しているかどうかも判定可能 です。 練習: BLAST 検索で human を選択して、次の配列をゲノムにマッピングしてみよう。 >human_100bp_fragment CCAAATTTAATTGATAATGGAAGCTGGCCAGCCACCACCATACAGAATTCTGTAGCTTTGA AGAATGCAGGTTTAATATCCACTTTGAAAAAGAAAACAA
11 月 18 日(第 7 回) 講義 2つあるいは3つ以上の塩基配列あるいはアミノ酸配列を比較したい場合、アライ メントプログラムを使います。タンパク質の場合、アミノ酸配列をアライメントにか けることにより、保存性の高い領域を知ることができます。系統的に隔たった生物間 (例えば、マウスとゼブラフィッシュ、あるいはマウスと酵母の関係等)で保存性が 高い領域は、タンパク質の機能で重要な役割を持った領域であることが考えられます。 またシステイン残基は、タンパク質の高次構造に深く関わるジスルフィド(S-S)結合 を作る場合が多いため、タンパク質間での保存性を調べることは重要です。 ClustalW プログラムを使うと、マルチプルアライメントの結果から分子系統樹を作 成できます。分子系統樹では、遺伝子の進化的関係を予測することができます。さら に他の生物の相同遺伝子(オーソログ)も同定できます。またモデル生物(マウス、 ゼブラフィッシュ)の配列を分子系統樹に加えることで、研究対象の遺伝子に対する モデル生物のオーソログを検索し、モデル生物の情報からから、研究対象の遺伝子の 機能についておおよその情報を得ることができます。 授業では、ペアワイズアライメント(2つの配列を比較)、マルチプルアライメント(3つ以 上の配列を比較)および分子系統樹の作成(来週)を実習します。 講義 配列アラインメント 配列アラインメントとは、配列中で同じ並び方をしている文字列を探すことである。同一も しくは似た文字は同じ列に置き、同一でない文字は同じ列に不一致として置くか、ギャッ プを入れる。 ペアワイズアラインメント (pairwise alignment):2つの配列の比較
大域的アラインメント (global pairwise alignment) 局所的アラインメント (local pairwise alignment)
多重配列アラインメント (multiple alignment):3つ以上の配列の比較
分子系統樹(進化系統樹)(molecular phylogenetic tree, evolutionary tree)
塩基配列やアミノ酸配列を基に分岐位置と分岐時間を推定し、構築された系統樹 近接接合法 (neighbor-joining method): 距離行列法で作成する分子系統樹の作 成方法で、生物分野で最も一般的に利用される。
キーワード
節、枝、クラスター (cluster)あるいはクレード(clade)
分子系統樹の利用 (1) 遺伝子の同種間、異種間での系統関係の解析 (2) 遺伝子ファミリーに属するメンバーの系統関係の解析 (2)重複遺伝子の重複時期と進化的関係の解析 (3)種や系統の進化的関係の推定 ************************************************************************ 実習 Alignment Pairwise alignment 1)使用するウェブサイト:http://www.ebi.ac.uk/Information/(Internet explorer を使って EBI で検索してもよい)
2)Services の中から Proteins を選択。→リストの中から EMBOSS Tools(Pairwise Sequence Alignment)を選択
Local alignment → Matcher (protein) 2 つの枠内に配列をペーストして Submit
練習:
下の gnrh(gonadotropin-releasing hormone; 生腺腺刺激ホルモン)からヒトと ゼブラフィシュを選んでアラインメントを実行してみよう。
次に、ヒトとホヤ(Ciona)で実行してみよう
Global alignment → Needle (protein)
Needle, Protein を選択し 2 つの枠内に配列をペーストして Submit 練習:上と同じ入力を行い、結果の違いを理解しよう
Multiple alignment
1)使用するウェブサイト:http://www.ebi.ac.uk/Information/
2)Services の中から Proteins を選択。 →リストの中から ClustalW2(Multiple Sequence Alignment)を選択
3)比較する配列 (Fasta format) を全て枠内にペーストして RUN(各種ボタンはデ フォルトで) 練 習 : 下 の gnrh (gonadotropin-releasing hormone) の う ち 、 >ciona_gnrh1(ホヤ)を除く配列でアラインメントを実行してみよう。 次に、>ciona_gnrh1 を入れてアラインメントを実行し、結果を比べてみ よう。 (このサイトでの検索でも系統樹が表示されるが、実習・宿題では次ページ
の http://clustalw.genome.jp/を使うこと)
>human_GNRH1
MKPIQKLLAGLILLTSCVEGCSSQHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIE EETGQKKI >mouse_Gnrh MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEE ARQKKM >chicken_Gnrh1 MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIE GEARRKEI >xenopus_GnRH1 MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGE NRKKI >zebrafish_gnrh2 MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQK RK >ciona_gnrh1 MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPV NARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHE GMPEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE GNRH: 生腺刺激ホルモン放出ホルモン.視床下部で合成され、下垂体門脈経路を介して下垂体前葉に運ばれ、生腺 刺激ホルモンである黄体形成ホルモン(LH)と濾法刺激ホルモン(FSH)の産生と放出を促進する神経性ペプ チドホルモン. ホルモン前駆体として合成されたあと酵素により切断され、ヒトではHWSYGLRPGペプチドがホルモンとして 機能する。 Ciona: カタユレイボヤ(ホヤの仲間で日本の研究グループによってゲノムシークエンスが解読された) 分子系統樹の作製 ClustalW で分子系統樹を作成する 1)使用するウェブサイト ClustalW http://clustalw.genome.jp/
2)Fasta format で並べた配列を枠内にペーストし、execute multiple alignment を押す (各種ボタンはデフォルトでよい)
練習:前ページの 6 種類 gnrh のアミノ酸配列をコピーして、execute multiple alignment を押して実行。
上に Multiple sequence alignments の結果が表示される。
その下にある select tree menu で表示形式を選択して、Exec をクリックする 表示形式、N-J tree branch length と Unrooted dendrogram の結果を比較 してみよう
このサイトでの検索結果では、Bootstrap value, evolutionary distance の値は表示されな い。DDBJ の ClustalW を使えば、これらの値が求められる。ただし、また結果の図形を表 示するために、Tree View と言う無料ソフトをダウンロードする必要がある。教室のコンピュ ータでは、ソフトウェアのダウンロードはためらわれるので、各自のパソコンで DDBJ を試し て下さい。
実習
分子系統樹作成:練習ショウジョウバエ(Drosophila)の hedgehog タンパク質に対する、マウス(Mus musculus)とツメガエル(Xenopus tropicalis)の類似遺伝子を検索して分子系統 樹を作成する。
演習室のワードは動作が悪いので、配列はメモ帳(Text ファイル)にコピーする。
手順は以下のように行う
1.ショウジョウバエ(Drosophila)の hedgehog タンパク質のアミノ酸配列を、 protein データベースからキーワード検索する(Accession number: AAF56102)。
FASTA ボタンを押すと、FASTA フォームの配列が表示される。アミノ酸配列を Word
にコピーする。>名前を付けて、Fasta format とする(スペースと数字は、検索 時に排除されて計算されるので、そのままにしてもかまわない)。
2.マウスの hedgehog ホモログを検索して、配列を取り出す
NCBI 先頭ページ下側 Features にある Map viewer でマウス Mus musculus の B (blast)ボタンをクリック。マウスゲノムに対する BLAST が開くので、Bastp を選 択して検索する(マウスゲノムにコードされる全てのタンパク質アミノ酸情報に 対して検索)。 検索により表示された3種類の hedgehog の配列を取り出す。取り出し方は、 Accession 番号をクリックし、表示された配列情報ページの上にある FASTA ボタ ンを押す。FASTA フォームの配列が表示されるで、コピーする。 3.Xenopus の hedgehog ホモログを検索して、配列を取り出す Map viewer で Xenopus tropicalis を選ぶ。以下、2の操作と同じ。
コピーし、マルチプルアライメントを実施する。マウスと Xenopus の間で配列の保存性を 注意深くみて、保存性の特徴を理解する。
5.分子系統樹を作成する。N-J tree branch length と Unrooted dendrogram の結果を 比較
4の結果とあわせて、Outgroup, Paralog, Ortholog の関係を理解する。ヒト遺 伝子間のパラログよりも、ヒトと Xenopus のオルソログ間の方が保存性の高いこ とに注意。これは祖先遺伝子が重複して2つの遺伝子(パラログとなる)を形成 し、そのあとに種分化が起こったためである。 Hedgehog の配列(ショウジョウバエ、マウス、カエル) >drosophila_hh MDNHSSVPWASAASVTCLSLDAKCHSSSSSSSSKSAASSISAIPQEETQTMRHIAHTQRCLSRLTSLVALLLIVLPMVFSPAHSCGPGRGLGRHRARNLYPLVLKQTIPNLSEY TNSASGPLEGVIRRDSPKFKDLVPNYNRDILFRDEEGTGADRLMSKRCKEKLNVLAYSVMNEWPGIRLLVTESWDEDYHHGQESLHYEGRAVTIATSDRDQSKYGMLARLAVEA GFDWVSYVSRRHIYCSVKSDSSISSHVHGCFTPESTALLESGVRKPLGELSIGDRVLSMTANGQAVYSEVILFMDRNLEQMQNFVQLHTDGGAVLTVTPAHLVSVWQPESQKLT FVFADRIEEKNQVLVRDVETGELRPQRVVKVGSVRSKGVVAPLTREGTIVVNSVAASCYAVINSQSLAHWGLAPMRLLSTLEAWLPAKEQLHSSPKVVSSAQQQNGIHWYANAL YKVKDYVLPQSWRHD >mouse_dhh MALPASLLPLCCLALLALSAQSCGPGRGPVGRRRYVRKQLVPLLYKQFVPSMPERTLGASGPAEGRVTRGSERFRDLVPNYNPDIIFKDEENSGADRLMTERCKERVNALAIAV MNMWPGVRLRVTEGWDEDGHHAQDSLHYEGRALDITTSDRDRNKYGLLARLAVEAGFDWVYYESRNHIHVSVKADNSLAVRAGGCFPGNATVRLRSGERKGLRELHRGDWVLAA DAAGRVVPTPVLLFLDRDLQRRASFVAVETERPPRKLLLTPWHLVFAARGPAPAPGDFAPVFARRLRAGDSVLAPGGDALQPARVARVAREEAVGVFAPLTAHGTLLVNDVLAS CYAVLESHQWAHRAFAPLRLLHALGALLPGGAVQPTGMHWYSRLLYRLAEELMG >mouse_ishh MSPAWLRPRLRFCLFLLLLLLVPAARGCGPGRVVGSRRRPPRKLVPLAYKQFSPNVPEKTLGASGRYEGKIARSSERFKELTPNYNPDIIFKDEENTGADRLMTQRCKDRLNSL AISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRNKYGLLARLAVEAGFDWVYYESKAHVHCSVKSEHSAAAKTGGCFPAGAQVRLENGERVALSAVKPGDR VLAMGEDGTPTFSDVLIFLDREPNRLRAFQVIETQDPPRRLALTPAHLLFIADNHTEPAAHFRATFASHVQPGQYVLVSGVPGLQPARVAAVSTHVALGSYAPLTRHGTLVVED VVASCFAAVADHHLAQLAFWPLRLFPSLAWGSWTPSEGVHWYPQMLYRLGRLLLEESTFHPLGMSGAGS >mouse_shh MLLLLARCFLVILASSLLVCPGLACGPGRGFGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSERFKELTPNYNPDIIFKDEENTGADRLMTQRCKDKLNALAISV MNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRSKYGMLARLAVEAGFDWVYYESKAHIHCSVKAENSVAAKSGGCFPGSATVHLEQGGTKLVKDLRPGDRVLAA DDQGRLLYSDFLTFLDRDEGAKKVFYVIETLEPRERLLLTAAHLLFVAPHNDSGPTPGPSALFASRVRPGQRVYVVAERGGDRRLLPAAVHSVTLREEEAGAYAPLTAHGTILI NRVLASCYAVIEEHSWAHRAFAPFRLAHALLAALAPARTDGGGGGSIPAAQSATEARGAEPTAGIHWYSQLLYHIGTWLLDSETMHPLGMAVKSS >xenopus_shh MLVATQSLLLLSFICTLVTPPGLACGPGRGIGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSDCFKELTPNYNPDIMFKDEESTGADRLMTQRCKDKLNALAISV MNQWPGVKLRVTEGWDEDGHHLEESLHYEGRAVDITTSDRDRSKYGMLGRLAVEAGFDWVYYESKAHIHCSVKAENSVAAKSGGCFPAGARVMVEFGGTKAVKDLRPGDRVLSS DPQGNLLYSDFLMFIDQERDVKKLFYVIETSQRKIRLTAAHLLFVAQTKVNGTRSFKSVFASNIQPGDLIYTADPKTMTLKAVKVEKVDLEEDTGAYAPLTAHGTVVIDQVLAS CYAVIEEHTWAHLAFAPLRFGMSLSSYIYPRDSSPPSGLQPHHQVDLQSHHQVDLQSHHQVDLQSHHQLEGIHWYSQLLYQIGTWLLDSNSLHPLGMATKSS >xenopus_dhh
MPAVRIVILAICCGLLLVPVRCCGPGRGPVGRRRYMRKLVPLHYKQFVPNVPEKTLGASGKSEGKIHRGSERFIELVPNYNPDIIFKDEEKTGADRLMTERCKDRVNALAISVM NMWPGVKLRVTEGWDEDGHHAHDSLHYEGRALDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHVSVKADNSLGVRSGGCFPGTAMVMMGTGERKPLSELKIGDTVYTTD ETGQLITSVVLLFLHRNPYKTATFVLIEAEGHPSKLLVTPNHLLFIQSSSSAGFLPFAYRVQIGDLVQIYVNGTQVQSSKVVRVSLEEQTGVYAPMTEHGTLLVDGVLTSCYAT VESHTLAHVSLAPLRLFQGIASMLPDLDMSDGVHWYCHILYVLAKYVLWWDMP >xenopus_ihh MQLPKVVLLLCAAALLLSGAVRGCGPGRVVGRRRRPTKLSPLSYKQFSPNVPEKTLGASGRYEGKISRNSERFKELTPNYNPDIIFKDEEITGADRLMTQRCKDRLNSLAISVM NQWPGVKLRVTEGWDEDGHHFEESLHYEGRAVDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHCSVKSEHSAAAKTGGCFPGEALATLESGEKIPVSQLSPGLRVLAMD NSGRPTYSDFLSFLDHSPKEEHMFQVIKTQDPHRRLFLTPAHLIFVSDNYSTPASEFQAVFASSVRPGQYILVSNVVGLIPAKVRSVNTQTNYGAYAPLTQHGTLVVDDVVVSC FALVQKQRLAQIVYWPLRVLYNLGIIAGTQPSQQMGIHWYSKALYHLGRLILHGNEFHPLGIVQLES
以下工事中
11 月 19 日(第 8 回)
分子系統樹:Phylogenetic tree, Evolutionary tree
分子系統樹から、様々な情報を読み取ることができます。異なる生物のホモログ遺 伝子で分子系統樹を作製すると、遺伝子の進化的関係を予測することができます。ま たミトコンドリア DNA の配列を使うと、人種の類縁関係や進化的関係を明らかにす ることが可能です。授業では、分子系統樹の作製方法とデータの見方を講義します。 オルソログとパラログ、ホモログの関係について 無脊椎動物から脊椎動物への進化の過程では、短期間のうちに全ゲノム(全ての染 色体)の重複(whole genome duplication: WGD)が 2 回起こっています。そのため原 索動物(ナメクジウオ等が含まれ、無脊椎動物のなかで脊椎動物に最も近い)で1 種 類であった遺伝子は、一度 4 つに数が増えています(4 つに増えた遺伝子でも 3 つが 消失して1 種類しか残っていないもの、4 つとも残っているもの、1 つ消失して 3 つが 残っているもの、2 つ消失して 2 つが残っているものもあります)。このようにゲノム 重複により同じ遺伝子から派生した重複産物はパラログ(Paralog)と呼ばれます。現 存の脊椎動物(円口類を除く)はゲノムの重複が起こってから分散進化しています。 そのため、脊椎動物の生物種間で、共通する重複遺伝子が存在しており、それらは (Ortholog)と呼ばれ、パラログと区別されています。オルソログとパラログとの関 係は、分子系統樹を作製することにより理解できます。ホモログは、共通祖先から発 生した遺伝子の総称で、オルソログとパラログをまとめたものになります。 オルソログとパラログの関係を理解するために、生物の進化の歴史、遺伝子重複の 歴史について解説します。またhedgehog 遺伝子をモデルとして、分子系統樹を作製し、 ホモログとパラログの関係を説明します。 無脊椎動物から脊椎動物に進化する過程で発生したゲノム重複について少し詳しく 説明します。hox 遺伝子、核内受容体遺伝子を例にして、ゲノムに刻まれた遺伝子重 複の歴史を解説します(ここでは、配付資料を参考にして説明します)。
12 月 3 日(第 10 回) 鈴木不在(分子生物学会に出席)のため酒井先生が代わりに下記の内容で授業を行いま す。 配列のアラインメント手法とBLAST検索の原理 ・配列のアラインメントとは ・全域アラインメントと局所アラインメント ・アミノ酸置換行列 ・動的計画法に基づく局所アラインメントの求め方 ・BLASTはどのように検索を行っているのか (動的計画法との違いと、それにともなう利点、問題点) 進化系統樹とCLASTAL Wで用いられている近隣結合法の原理 ・種の進化モデル ・分子時計仮説 ・ウルトラメトリック木と加法木 ・UPGMA法 ・近隣結合法 以上について概説する。 同内容の詳細については3年前期「生物生産情報処理概論」にて講義する。
12 月 10 日(第 10 回)
バイオデータベースの利用
遺伝子の機能をしりたい場合には、ポストゲノムのモデル生物(マウス、ゼブラフ ィッシュ、シロイズナズナ等)の検索サイトが重宝します。これらは、バイオデータ ベースと呼ばれます。モデル生物のなかでも、特にマウスとゼブラフィッシュのデー タベースが充実しており、遺伝子の機能だけでなく発現パターン(遺伝子が何時、ど の組織で、どれだけの量が発現するか)もデータベース化されており、遺伝子名のキ ーワード検索でデータを入手することが可能です。 モデル生物ではありませんが、ヒトの遺伝子機能と遺伝子疾患のデータベースとし て NCBI に OMIM(Online Menderian Inheritance of Men)が公開されています。遺伝 子名でキーワード検索すると、遺伝子の機能、遺伝子疾患が存在する場合には、配列 変異と疾患の表現型を知ることが可能です。マウスのデータベース(MGI: mouse genome informatics)の特徴として、遺伝子 ごとにノックアウトマウスの表現型がデータベース化されており、表現型から遺伝子 の機能を調べることができます。マウスのデータベースでは、遺伝子の正確なマップ ポジション(連鎖地図、ゲノム配列上)等も示されています。
ゼブラフィッシュのデータベース(ZFIN:zebrafish Organism Data Base)には、 in situ ハイブリダイゼーションによる発現解析のデータが写真で掲載されており、 発現部位に関する組織レベルの情報を得ることができる特徴があります。脊椎動物中 であればオルソログ遺伝子(異なる生物の同一遺伝子)の発現パターンは類似してい ることが多いので、マウス、ウシやニワトリを研究対象にする場合でも参考となりま す。 論文や単行書を読んで機能が分からない遺伝子(タンパク質)がでてきた時には、そ れらの遺伝子の機能を調べる必要があります。遺伝子機能の検索で最も一般的に利用 されているサイトに NCBI の OMIM (Online Mendelian Inheritance in Man) とマウス・ ゼブラフィッシュのウェブサイトがあります。授業では、これらのサイトの使い方と特徴につい て説明します。
OMIM
ヒトで分かっている遺伝子の機能を詳細に記述している。関連文献もリスとされている
OMIM の使い方
1. NCBI を開け、左上の All List (A-Z)から OMIM を選択する 2. 枠内に遺伝子名を入力して検索
練習に growth hormone(成長ホルモン)を検索してみよう 遺伝子の機能、変異に伴う疾患、タンパク質の構造、関連論文がまとめられている。 MGI, ZFIN の使い方 ポストゲノム研究のモデル生物のウェブサイトを利用してみよう。これまでの研究によって明ら かにされている遺伝子の機能が検索できる。 1.マウス(MGI)
mouse genome informatics: http://www.informatics.jax.org/
Search Menu から Genes を選択(全ての情報にリンク) Genes & Markers Query を選択
Gene/Marker Symbol/Name の枠に、遺伝子名を入力して検索:リスとされた遺伝 子から、目的のものを選択 試しにPax6(眼の発生の上流にある転写因子)を入力してみよう Pax6 と言うワードを含む遺伝子リストが表示される。Pax6 を選択する 得られる情報 Symbol/Name/ID:遺伝子の正式名称、略記 Synonyms:同義語(別名) Genetic map:遺伝子の連鎖地図上の位置 Sequence Map:遺伝子の物理地図上の位置 Mammalian Homology:哺乳類の相同・類似遺伝子 Sequences:ゲノム塩基配列・cDNA 塩基配列・アミノ酸配列情報 Phenotypes; ノックアウトマウスの表現型。遺伝子の生物機能が分かる Polymorphism: 系統間で見られる配列多型。SNPs(1塩基多型)等 Gene Ontology (GO):遺伝子の機能、構造
Expression:発現する組織のリスト
Protein Domains:転写産物が持つドメイン構造のリスト References:関連文献
2.ゼブラフィッシュ(ZFIN)
The Zebrafish Model Organism Database:http://zfin.org/
Genes/Makers/Clones を開ける
Name/Symbol に遺伝子名を入力して検索
試しにpax6 と入力して検索してみよう。 2 Genes を開けて、pax6b を選択する
Expression:遺伝子発現部位
Phenotype:突然変異体あるいは遺伝子ノックダウンの表現型 Map:染色体上の位置。Individual Panels を開けてみよう
12 月 17 日(第 12 回)
代謝経路データベースの利用
無料で公開されている代謝経路のデータベースとして最も充実しているのが、 京都大学化学研究所が統括している KEGG (Kyoto Encyclopedia of Genes and
Genomics)である。代謝経路のマップを調べることができるだけでなく、遺伝 子の機能、配列、タンパク質の立体構造も検索できる。クローニングした遺伝 子がどのような代謝経路に機能しているか、代謝異常のメカニズムなども調べ ることができる。 またさまざまな医薬品(抗生物質等)の構造、薬理作用を検索することもで きる。遺伝子や化合物の機能や相互作用を調べる場合、またレポート作成等に も役立つと思う。日本語表記のサイトも利用できる。授業では、KEGG の使い方 を実習します。 最近、KEGG MEDICUSと名付けられた、医薬品・疾患・パスウェーの統合デー タベースが公開されている。疾患・医薬品・環境物質など社会的ニーズの高い データを、ゲノム情報を基盤とした生体システム情報といて統合したリソース で、研究者だけでなく、医療従事者や一般の人にも情報を提供している。 http://www.genome.jp/kegg/pathway.html 代謝経路におけるタンパク質間相互作用、代謝経路に介在する酵素、薬剤の構造 等を調べることができる。 KEGG Pathway を開ける。パスウェーの項目は、以下ように分類されている。
1. Metabolism;代謝経路(ビタミン A, retinol metabolism, の代謝経路を調べてみよう。 代謝産物を示す◯がアクティブで構造等が表示される。また代謝を司る酵素名もア クティブで、配列情報等が表示される)
2. Genetic Information Processing;遺伝子から蛋白質合成経路・蛋白の修飾と分解・ ゲノムの修復等(homologous recombination と non-homologous end-joining の経路を 比較してみよう)
3. Environmental Information Processing;細胞内シグナル伝達経路・分泌性シグナル 因子を介した細胞間相互作用(TGF-beta の細胞内伝達系を調べてみよう。発現の 促進と抑制(アゴニスト)の関係が分かる)
4. Cellular Processes:細胞の活動、細胞分裂サイクル等(Oocyte meiosis(卵母細胞減 数分裂)を調べてみよう)
5. Organismal system;免疫系・内分泌制御経路等(GnRH、生殖腺刺激ホルモン放出 ホルモン、の内分泌経路を調べてみよう)
6. Human Deseases:発ガン経路・代謝異常等(Melanoma, プリオン病, diabetes(1型糖 尿病、2 型糖尿病)の発症経路を調べてみよう)