バイオインフォマティックス概論授業予定

(1)

(2)

H26 バイオインフォマティックス概論授業予定（授業の進み具合によって変更の可能性があります）黒字は、講義による解説。青字はウェブを使った実習を示します。第 1 回 10 月 7 日授業概要説明 Bioinformatics とは？ゲノム-遺伝子-mRNA-タンパク質の関係の復習（ＤＶＤ）さまざまなデータベース・ゲノムデータベースに触れてみる第 2 回 10 月 14 日ヒト全ゲノム解読プロジェクトについての解説（1/3）ヒトゲノムプロジェクトの歴史・戦術連鎖地図、物理地図の作製配列データベースについての解説データベースからの塩基配列とアミノ酸配列の取り出し方宿題（１）：配布第 3 回 10 月 21 日ヒト全ゲノム解読プロジェクトについての解説（2/3） BAC ライブラリーの作製、整列化 BAC ライブラリーのショットガンシーケンスヒト全ゲノム解読プロジェクトについての解説（3/3）配列のアセンブリー、コード配列の予測 cDNA 塩基配列から蛋白質アミノ酸配列への変換操作第 4 回 10 月 28 日ホモロジー検索（BLAST 検索）についての解説（1/2） BLAST 検索の実習（BLASTP）結果の見方

Whole genome shotgun sequence によるゲノム解読

宿題（２）：配布

第 5 回 11 月 4 日 Whole genome shotgun sequence によるゲノム解読（残り： scaffold の作製、FISH による染色体へのマッピング作業）

ゲノム解読で分かったヒトゲノムの特徴、医療への利用

ホモロジー検索（BLAST 検索）についての解説（2/2）

BLAST 検索の実習（BLASTN, BLASTX, TBLASTX）

(3)

第 6 回 11 月 11 日研究計画立案、レポート・論文作成に必要な情報収集

文献検索（PubMed, 大学図書館 On line journals）

NCBI ゲノムデータベースの利用 MapViewer の利用（１）：遺伝子の染色体上の位置を調べる MapViewer の利用（２）：ゲノムデータベースでの BLAST 検索 MapViewer の利用（３）：遺伝子ファミリーのメンバーの同定 MapViewer の利用（４）：次世代シーケンスで得られた 100bp 断片配列の参照ゲノムへのマッピング第 7 回 11 月 18 日配列アライメントについての解説ペアワイズアライメント、多重配列アライメントの作成と見方分子系統樹の作成宿題（３）配布第 8 回 11 月 25 日分子生物学会出席のため鈴木、不在酒井義文先生（本学工学研究科情報科学出身）による解説 Blast 検索、ClustalW、分子系統樹のアルゴリズムと原理第 9 回 12 月 2 日分子系統樹から分かること “宿題（２）提出“ 第 10 回 12 月 9 日タンパク質/遺伝子の機能に関する情報収集：OMIM ゲノム構造の変化と生物進化ゲノムの重複と遺伝子レパートリーの増加オルソログとパラログの発生遺伝子の並行進化宿題（２）解説宿題（４）配布第 11 回 12 月 16 日分子系統樹、ゲノム構造の変化と生物進化（残り）モデル生物についての解説 “宿題（３）提出”

(4)

第 12 回 1 月 6 日バイオデータベースの利用

MGI (Mouse Genome Informatics) の利用 ZFIN (The Zebrafish Model Organism Database) 代謝経路データベース

KEGG（Kyoto Encyclopedia of Genes and Genomics）の利用

第 13 回 1 月 13 日タンパク質の構造（シグナルペプチド、疎水・親水性プロット、ドメイン構造）についての解説ウェブサイトを使ったタンパク質の構造解析分子量と等電点の予測シグナルペプチドの予測ドメイン構造の予測

代謝マップ・バイオデータベースを使った演習

データベースを使って、dopamine の合成経路、合成部 位、作用機序、薬剤等について情報収集する。宿題（５）配布 “宿題（４）提出”

第 14 回 1 月 20 日ゲノムブラウザ Ensembl Genome Browser の利用

必要なゲノム塩基配列をゲノムデータベースから取り出す遺伝子の転写調節とコンセンサス配列についての解説 Ensembl を使った転写調節配列の収集プログラムを使ったコンセンサス配列の検索次世代シーケンス解析シーケンス原理次世代シーケンス解析の利用（ゲノム解析、トランスクリプトーム解析）次世代シーケンサーで得られた配列断片の情報処理（アセンブル、BLAST2GO 等、KEGG map へのマッピング）

(5)

第 15 回最終回 1 月 27 日ポストゲノム研究（１）—全遺伝子の機能解析最新の遺伝子ノックアウト技術（TALEN, CRISPR/Cas9）遺伝子ノックダウン技術（Antisense-Morpholino）ポストゲノム研究（２）-比較ゲノム（Comparative Genomics）ヒトとフグの比較ゲノムで明らかになった脊椎動物の進化に伴う染色体構造の変化（繰り返し配列の発生、シンテニー領域）ポストゲノム研究（３）—機能ゲノム（Functional Genomics）生物間で保存された非コード領域（conserved non-coding sequence）：進化的に離れた生物間でゲノム配列を比較し、遺伝子の発現調節に重要な領域をみつける=長距離アライメントプログラム（Lagan） “宿題（５）提出“ 授業評価推薦図書とおもだったウェブサイトはこのファイルの最後に掲示してあります。

(6)

10 月 7 日（第 1 回）講義１）授業の予定と進め方２）「バイオインフォマティックス」とは？３）遺伝子の構造についての復習：パワーポイントのファイルを参照４）遺伝子、転写、翻訳の復習（DVD を使って）５）どのようなデータベースを使うか６）ゲノムデータベース（動物、植物、菌類、バクテリア）をのぞいてみる使用する DVD：講談社ブルーバックス B1582「見てわかる DNA のしくみ」今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業では、基本的に各授業の前半で講義、後半にコンピューターを使った実習を行います。実習では、ウェブ上で公開されているデータベースやプログラムを使います。今日は、生物学、分子生物学、農学研究に利用できるデータベースにどのようなものがあるかを紹介します。また現在では、多数の生物のゲノム配列が解読されて、配列は一般に利用できるように整備されています。どのような生物でゲノム解読が行われているのか、ウェブサイト（NCBI, Ensembl）を使って少しのぞいてみましょう。なおこのテキストでは、その日の授業で行う講義内容とコンピューターを使った実習について、操作方法を含めて簡単に説明してあります。必要に応じて、プリントアウトして下さい。講義で使うパワーポイントの図はプリントしたものを資料として配布します。毎回、翌週のプリントを配ります。このテキストと配布資料を使って、予習・復習して下さい。 ———————————————————————————————— 実習 2 つのウェブサイトを開いて、どのような生物でゲノム情報が利用できるか調べてみよう

1. NCBI (National Center for Biotechnology): http://www.ncbi.nlm.nih.gov/ 2. Ensembl Genome Browser: http://asia.ensembl.org/index.html

(7)

10 月 14 日（第 2 回）今日の授業内容 1. 講義：ゲノム解読プロジェクト（1/3） 2. 実習：データベースからのアミノ酸配列、塩基配列の取り出し方 3. 実習：配列エントリーに示されている情報について

講義

ゲノム解読には、階層的ショットガン法と全ゲノムショットガン法の 2 通りの方法があり、現在では全ゲノムショットガン法が主流となっています（長所と短所は配付資料を参照）。またこの数年の間に、次世代シーケンサー(NGS)が実用化され、現在ではゲノム解読は NGS を使うことが主流となっています。NGS によるシーケンスの超高速化により、様々な生物でゲノム解読が行われることは間違いない状況です。ゲノム解読の歴史的な背景と、ゲノム解読の方法論を理解してもらうために、授業では階層的ショットガン法で解読されたヒトゲノムプロジェクトを例にしてゲノム解読の道筋を解説します．予定では 3 回に分けて解説します。ヒト全ゲノム塩基配列解読の行程（１/3）１）連鎖地図２）BAC ライブラリー作製３）BAC ライブラリー整列化（物理地図）４）ショットガンシークエンス５）アセンブル６）アノテーションゲノム解読プロジェクト

国際研究プロジェクトによるヒトゲノム計画 (Human Genome Project) は 1990 年に着手され、13 年後の 2003 年に解読完了が宣言されました。ヒトゲノム計画は、階層的ショットガン法と呼ばれる手法で行われました。すなわち連鎖地図の作成から BAC クローンの整列化の過程を経たのち、染色体上にマップされた BAC クローンをショットガン法で解読し、染色体レベルにまで塩基配列を繋ぐという過程を経て、ゲノム塩基配列の完全解読にまで到達しました。このプロジェクトの間に塩基配列の解析能力（DNA シークエンサー）は大幅にアップし、同時に塩基配列をつなぎ合わせるコンピューターの処理能力も著しく進歩したことにより、連鎖地図作製を省略して、全ゲノムをいきなりショットガン法で読むことが可能となりました。民間企業のシエラ社は、数年のあいだに全ゲノムショットガン法によりヒトゲノムを解読することに成功しました。最終的には、国際研究プロジェクトとシエラ社の間で協議の結果、解読成果が同時に公表されました。

(8)

ヒトゲノム計画の終了と前後して、多くの生物で全ゲノム解読プロジェクトが始められ、既に 100 種類に近い動物で全ゲノム配列の解読が終了し、現在も新しい生物のゲノム解読プロジェクトが次々に着手されています。ゲノム情報は、遺伝子の機能解析の有力なツールになることは言うまでもありませんが、生物間でゲノム構造を比較することにより、無脊椎動物から脊椎動物の進化の過程で起こったゲノム構造の変化等を知ることも可能となりました。哺乳類の中でも単孔類（カモノハシ）、有袋類（オポッサム）から有胎盤類に至る進化の過程や、またチンパンジーとヒトでの知能の差をゲノム構造の進化の観点から議論されています。全ゲノム塩基配列が利用できるという条件のもとで、進められる遺伝子やゲノム研究がポストゲノム研究です。既に家畜や野菜や穀物植物のゲノムもほとんどの種で解読されています。農学でも新しい研究分野を開拓するためには、ゲノム情報を有効に利用できるがどうかが、極めて重要な素養となります。 ************************************************************************* ゲノム解読プロジェクトで解析されたゲノム DNA 配列情報は、NCBI と Ensembl で一般に利用できるよう整備されています。遺伝子の染色体上の位置や類似遺伝子の検索には NCBI が便利です。ゲノムの塩基配列をデータベースから取り出す場合には、NCBI あるいは Ensembl を使います。NCBI と Ensembl の使い方は、授業で実習します。ゲノム情報がいかに強力なツールになるかを体験し、実感してもらおうと考えています。 ————————————————————————————————

実習

塩基配列・アミノ酸配列の検索配列データベースから必要なタンパク質のアミノ酸配列、遺伝子の塩基配列の取り出し方を実習します. アミノ酸の取り出し方！

使用するウェブサイト：NCBI. 先頭ページ右側にあるPopular Resourcesの中の「Protein」を使用する.あるいは左上（All databases）から選ぶことも可能.

キーワードによる検索

例：cow, prion でキーワード検索してみよう

上のタンパク質名（青字）をクリックすると配列エントリーが表示される（見方は最下段と配付資料を参照のこと）

FASTA をクリックすると配列がFASTA formatで表示される配列は、別のファイルにコピーできる.

Graphics では、タンパクの構造が表示される

(9)

Identical Proteins では、別の名前が付けられている同一タンパク質が表示される FASTA format 塩基配列とアミノ酸配列のファイルフォーム。「>」で始まる１行がコメント（遺伝子名や任意の番号やコメント）を記述するために用意されており、続く２行目から塩基配列あるいはアミノ酸配列を記述する。最後に改行して「//」を記載し、１つの配列の記述が完了する(記号「//」はなくてもよい)。ホモロジー検索、多重アライメント、分子系統樹作成等で使うフォーム。塩基配列の取り出し方！

使用するウェブサイト：NCBI. Popular Resourcesの中の「Nucleotide」を使用する

１．キーワードによる検索

例：cow, prion でキーワード検索してみよ

cow, prion の配列だけでなく、関連遺伝子も多数検索されてくるため、必要な配列を見つける必要がある.Bos taurus prion (PRNP), mRNA が今回、欲しい配列である.

上の遺伝子質名あるいは GenBank をクリックすると配列エントリーが表示される（データの見方は配付資料を参照のこと）

FASTA をクリックすると配列が FASTA format で表示される配列は、別のファイルにコピーできる. Graphic では、遺伝子の構造が表示される２．アクセッション番号による検索 accession number=DDBJ/EMBL/GenBank 国際塩基配列データベースにおいて各登録単位（エントリー；各遺伝子）に発行されるエントリー識別子（entry identification, ID）を指す。

例：NM_181015（entry identification, ID）で検索してみよう

配列エントリーに示されているデータ遺伝子名、生物名、学名、遺伝子座、遺伝子クローニングを行った論文リスト、翻訳開始・終了点、ドメイン構造、塩基配列、アミノ酸配列（配付資料では、 zebrafish, prion (NM_205586)を使って説明してあります）なお表示結果の詳細な説明は、次のサイトで閲覧できます。 http://hinv.ddbj.nig.ac.jp/manual_cdna-j.html

(10)

10 月 21 日（第 3 回）今日の授業内容１．講義：ゲノム解読プロジェクト（2/3, 3/3）２．実習：cDNA 塩基配列のアミノ酸配列への変換３．読み取りフレームと実際のタンパク質配列との関係について説明

講義

ヒト全ゲノム塩基配列解読の行程（2/3）

１）連鎖地図・物理地図（Radiation hybrid panel）２） BAC ライブラリー作製３） BAC ライブラリーの整列化４）ショットガンシークエンス５）アセンブル６）アノテーション７）ヒト全ゲノム塩基配列解読の行程（2/3）

１）連鎖地図・物理地図（Radiation hybrid panel）２） BAC ライブラリー作製

３） BAC ライブラリーの整列化４）ショットガンシークエンス５）アセンブル

６）アノテーション

cDNA 配列解読プロジェクト、EST（expressed sequence tags）解析プロジェクトについての解説

————————————————————————————————

実習

今日は、まず基本操作として、NCBI のプログラム ORF finder を使って、塩基配列をアミノ酸配列に変換してみます。コンピューター操作に慣れるようにして下さい。今回は、魚類の cDNA ライブラリーからクローニングされた cDNA クローンの全長配列（5’UTR, CDS, 3’UTR を含んでいる）を使って実習します。 5’UTR（5’非翻訳領域）, CDS（コード配列）, 3’UTR（3’非翻訳領域） >test_DNA_sequence-1(zebrafish_charon) >test_DNA_sequence-2(eel_cathepsin-S)

(11)

塩基配列（>test_DNA_sequence-1）をアミノ酸配列に変換してみよう

１）利用するウェブサイト：NCBI (National Center for Biotechnology Center)

http://www.ncbi.nlm.nih.gov/

２）使用するアイコン：Open Reading Frame Finder (ORF finder )

open reading frame = 蛋白質をコードする塩基配列の読み取り枠検索手順

１． NCBI のウェブサイトを開き、左上 Resource List (A-Z)をクリック２． Open reading frame finder(ORF finder)を開ける

３．アミノ酸配列に変換する配列(FASTA format)を枠内に配列をコピーする OrfFind ボタンを押す青で示された部分が、予想されるアミノ酸配列（センス、アンチセンス鎖の３フレームでの翻訳結果が示される）通常、一番長いフレームがタンパク質のコード配列である青のバーをクリックする=塩基配列とアミノ酸配列が表示される４．推定されたアミノ酸配列を取り出すには Accept ボタンを押す View ボタンを押す：アミノ酸配列データと諸情報が示されているアミノ酸配列をテキストファイル等にコピーする >test_DNA_sequence-1(zebrafish_charon) AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTTCTTTTTTGTAAAATTCTATAATTTAGCTA AAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGGCGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTT GAATCCTCCGGGAATGGACCAGACGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTTCAGAAA TTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAAACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGA GGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGAGCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCC GCAGTTCCCTTTACACAGCGCATAACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCCCTCCAGCGGAGG CTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCACCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGA TCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGCCAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA // 次の配列でも練習してみよう >test_DNA_sequence-2(eel_cathepsin-S) ATCACTGCGTCTTGTGTCCTATCGGTCTAGCCTAGCCACTGTCTANAAGCTATAGGAAGGTTTCAGTATTGGGAGCCATGTTTGGGAGCCTGCTGTTCACTGTGCTGTGT GAGGCAGCAGTGGCCCTCATCAACCCAAATCTAAGCCTCCATTGGGAGATGTGGAAGGAGGGACATGACAAGACCTACCTGTTTAAGGCTGAAGAGTTTGCACGCCGCCA

(12)

GATCTGGGAGAAGAACCTGAAGCTGATAACTCTGCATAATTTGGAGGCGTCCATGGGAATGCACACCTATGATCTGGGCATGAACCACCTAGGAGACTTGACTACCGAGG AGATTCTTGACGTGCTAGCTGTAACTCGTGTGCCTCCAAACTTCAGCAGGGGTCCTTCTCCCTTTGTGGGGGTATCCAGGGCCCCTGTGCCTCACAATGTTGATTGGCGA AGAAAGGGCTATGTCACAGAAGTCAAGAGTCAGGGGCGTTGTGGCTCCTGCTGGGCCTTCAGTGCTGCAGGTGCCCTGGAGGGCCAGCTGATGAAGACTCAGGGAACACT TGTATCCCTCAGCCCTCAGAACCTGGTTGACTGCTCCTACAAATATGGCAACGAGGGCTGTCATGGAGGGTTCATGACTCAAGCCTTCCAGTATGTCATTGAGAACGGGG GCATTGAGTCTGACTTTTCATACCCTTACACTGGCATGGAAGAACAATGCAGATATGATTCAGAACTCCGTGTTGCCAACTGTTCCAGCTACAGGTTTCTTCCTGAAGGT GATGAGGTTGCATTAAAATGGGCTCTGGCCACTGTTGGACCAATCTCTGTGGCTATTGATGCTGCTCGACCTAATTTCCACTTCTACCGGAGTGGTGTGTACCATGACCC TACCTGTACCCAAGAAGTAAACCATGGTGTTCTAGCAGTTGGCTATGGTACGCTCAATGGTGAGGACTACTGGCTTGTGAAGAACAGCTGGGGACAGCCTTTTGGGGAAC AGGGCTACATTCGCATGGCACGAAACAAGAACAACCAGTGTGGCGTTGCCTTGTATGCCTGCTACCCCATTATGTGACGACCTGAAGCAAAGGATTGATTTCTAACTTGA AACATTTTAAAATTTTTATTTTGATTTGCACCTGTGCATGTTACTGATTTGTAAAGAATACTGTTAAAATGATTTGTATTAAAAAAATATATATTTTTAGATGTGGAATT TTAGTTGAACCTAAATAAATAAATGTAAAAAAAAA //

(13)

10 月 28 日（第 4 回）今日の授業内容

１． Whole genome shotgun sequence についての解説２．実習：配列検索（BLAST）（1/2）

講義

Whole genome shotgun sequence の原理について、配付資料を使って説明します.

————————————————————————————————

実習

ホモロジー検索（BLAST 検索）1/2 遺伝子やゲノムを扱う研究で使用する機会が最も多いプログラムが、塩基配列やアミノ酸配列のホモロジー（相同性）検索プログラムです。新しい遺伝子を発見した時、最初に行う操作が相同性検索だからです。相同性検索により、クローニングした遺伝子が、データベースに登録されているどの遺伝子に類似しているかを調べることができます。最近では、次世代シーケンサー解析で得られた配列をゲノムにマップする際にも BLAST 検索が用いられます。ゲノム解読されている生物であれば、100bp の短い配列（次世代シーケンサーの解析では、1 リードは 100bp）でもゲノムのどの位置にあるかを調べることもできます。

授業では、BLAST (Basic Local Alignment Search Tool)プログラムを用います。今日は、塩基配列・アミノ酸配列のデータベース、問い合わせ配列とデータベースの組合せ、各組合せで使う BLAST プログラムについて説明します。そのあとテスト配列を使って、実際に BLAST 検索を行います。ホモロジー（homology）検索問い合わせ配列(query sequence)に対し、類似した配列をデータベースから探し出す操作。最も高頻度に利用されるバイオインフォマティックスの手法のひとつ。検索内容：例）実験でクローニングした遺伝子の種類を特定する。それがコードするアミノ酸配列がデータベースに登録されている遺伝子、蛋白質のどれと、またどの程度類似するか？

(14)

遺伝子配列データベース：GenBank, DDBJ, EMBL 最も広く利用されており、検索が高速なプログラムがBLAST（昔、FAST と言うプログラムも使われていたが、現在はあまり見かけない） --- 検索の組合せ問い合わせ配列対データベース --- BLASTN 塩基配列対塩基配列データベース BLASTP アミノ酸配列対アミノ酸配列データベース BLASTX 塩基配列（アミノ酸配列に置換）対アミノ酸配列データベース TBLASTN アミノ酸配列対塩基配列データベース（アミノ酸配列に置換） TBLASTX 塩基配列（アミノ酸配列に置換）対塩基配列データベース塩基配列（アミノ酸配列に置換）配列の種間変異の激しい遺伝子の場合（サイトカイン等）、塩基配列を BLASTN 検索してもヒットしないことがある。その場合には、BLASTX or TBLASTX を使うとよい。いずれにしても、塩基配列から相同遺伝子を検索する場合、BLASTN よりも BLASTX の方が効率的である。 ************************************************************************** BLAST 検索の原理１．ホモロジーが観察される配列間の局所アライメントには、多くの場合、ギャップを含まない保存領域が存在する。BLAST では、そのような局所保存領域（ワード）をまず高速に検索する。２．一致したワードからアライメントを配列に沿ってそれぞれの方向に拡張していき、スコアが増加するまで続ける。拡張処理は、スコアの増加が止まり、伸ばす前のベストスコアより減少し始めた時に終了する。この時点で、HSP (high-scoring segment pair)と呼ばれる、大きな配列領域が見つかる。この時点でギャップがあるとそこから先には伸長していない。３．一般に、アミノ酸配列と塩基配列にはギャップが生じているため、HSP のみでは類似領域の検索として不十分である。そこで、BLAST では、HSP において対応する位置に存在する 1 組の記号のペアを適切に選び、類似度の高い領域はこのペアを含むものと仮定して、動的計画法と呼ばれる方法を用いて類似領域を探索する。 HSP から選んだペアを起点として探索範囲を狭く取ることによって、類似度の最適性は保証されないものの、従来の動的計画法と比較して高速な類似領域の探索を実現している。（詳細は、11 月 25 日に酒井先生が解説します。）スコア

(15)

アミノ酸配列の場合：BLOSUM62 スコア（アミノ酸の組合せによって値が決められている）塩基配列の場合：値は同じ塩基、異なる塩基の組合せでのみ決められている ———————————————————————————————— BLASTP 実習先週使ったものと同じ、>test_DNA_sequence-1（私の研究グループで単離した遺伝子で、既にデータベースに登録済みである：由来生物 zebrafish．遺伝子名 charon、機能＝内臓・脳の非対称性制御）の塩基配列とアミノ酸配列を下に示しました。試しにこのアミノ酸配列で BLASTP 検索してみよう. BLASTP の操作手順

１．NCBI 先頭ページ右上 Popular Resources から BLAST を選択する。Basic BLAST に上記 5 種類の BLAST プログラムのアイコンがある。

２．protein blast をクリックする。アミノ酸配列(FASTA format)を枠内にコピーする。 Database (non-redundant ), Algorithm (blastp; protein-protein BLAST)は、デフォルトのままでよい。３．BLAST のボタンを押して、検索を開始する。 >test_DNA_sequence-1(zebrafish_charon)_peptide MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRR KQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLI VEECKCETSSEEAKVQNTDMFNL データベースに登録されている PSI-BLASTP, PHI-BLAST: 比較的最近開発されたプログラムで、系統的に離れた生物あるいは関連遺伝子を検索する場合に利用する.種間の保存性が低い遺伝子の場合に利用価値が高い. 検索結果の見方：グラフィックの次に示されているリスト E-value：検索結果は、Query 配列と相同性を示す配列のアライメント結果が表示される。e-value は、検索に使ったデータベースのなかで、Query の局所配列と検索配列の組合わせが、偶然にみつかる個数を示す。相同性が高いほど、値は 0 に近づく（最も重要なデータ：蛋白質の場合、e-5 あたりが関連遺伝子か、そうでないかを判断する基準となる）。

Total score (bits): 検索されてきた局所配列の長さをビット形式で示し

たもの。値が大きいほど、相同性を示す領域が長い。

Query cover: 問合せ配列の全長のうち、検索配列と配列が一致している領域の％

(16)

Identities:アミノ酸配列で、相同領域のなかで一致しているアミノ酸の比率アライメントの添えられている数字（上のリストにないデータ） Positives: アミノ酸配列の場合に、一致しているアミノ酸＋化学的に類似するアミノ酸の比率 Gaps:アライメントされた配列で、片一方で欠損している塩基あるいはアミノ酸の総計

(17)

11 月 4 日（第 5 回）今日の授業内容１．ヒトゲノムの特徴、医療への利用２．実習：配列検索（BLAST）2/2）

講義

ゲノム解読で明らかになったヒトゲノムの特徴、医療への利用について簡単に紹介します

実習

ホモロジー検索（BLAST 検索）1/2 BLASTN 実習 blastn を使って、>test_DNA_sequence-1 の相同遺伝子を検索してみよう BLASTN の検索手順

１．NCBI、Popular Resources の中から BLAST を選択する。Basic BLAST に上記 5 種類の BLAST プログラムのアイコンがある。

２.nucleotide blast をクリックする。

「Database」が、デフォルトでは nucleotide collection (nr/nt) で、このままでよい。

注意：Program selection で somewhat similar sequences (blastn) を選択する。３.塩基配列(FASTA format)を枠内にコピーする。４.BLAST のボタンを押して、検索を開始する。 >test_DNA_sequence-1(zebrafish_charon) AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTTCTTTTTTGTAAAATTCTAT AATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGGCGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACC GACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGACGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCG GGCCGCCGTTAGTCATGTGCCGTTCAGAAATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCAT AGCAAACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGAGCGAAAAAAAGAGG CAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACAGCGCATAACGGAGGAGGGCTGTGAGACGGTGAC CGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCCCTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGC

(18)

CCCTCTAGAGCGCGCTCCGTGCTCCTGCACCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCA GCGAAGAGGCCAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA Blastn の利用例：とりあえず調べたい遺伝子が、既知のどの遺伝子に類似するか？を調べる時等に使う。ただし、生物間で変異の激しい遺伝子（実習で使う charon が一例）の場合には、Blastn では相同遺伝子が十分に検索されてこないことがあるので、遺伝子を特定するためには、次の Blastx を使う方がよい。次世代シーケンス解析で得られた断片（100bp）をゲノムにマップする時は Blastn を用いる。同じ遺伝子の配列>test_DNA_sequence-1(zebrafish_charon)なのに、blastp と blastn で検索されてくる遺伝子・蛋白質の数が違うことに注意！（その理由を理解して下さい） BLASTX 実習 blastX を使って、>test_DNA_sequence-1 の相同遺伝子を検索してみよう blastx の特性：このプログラムでは、遺伝子がコードするアミノ酸配列と相同性の高い蛋白質を探す。問い合わせ塩基配列は、一度 6 フレームで翻訳され、翻訳された配列がアミノ酸配列データベースに対して検索にかけられている。アミノ酸置換の激しい遺伝子の相同性検索に非常に有効。進化的に離れた生物から相同遺伝子を探す場合にも有効。次世代シーケンサーを使った de novo トランスクリプトーム解析で得られた配列を同定する場合、BLASTX を使用する。 TBLASTN の検索手順 tblastx を使って、>test_DNA_sequence-1 の相同性検索を試してみよう tblastx の特性：問い合わせの塩基配列、データベースの塩基配列とも３フレームで翻訳され、検索にかけられている。 Tblastx の利用例：単離した遺伝子がコードするアミノ酸配列と相同性の高いアミノ酸配列をコードする塩基配列を探す。配列の変異が激しい遺伝子種の場合に有効。

(19)

練習 PCNA は DNA 複製で働くタンパク質で、バクテリアからヒトまで配列の保存性が非常に高い。この配列で BLASTN 検索して、>test_DNA_sequence-1 の検索結果との違いを考えてみよう。対象生物をイネに限定して、イネゲノムに相同遺伝子が存在するか調べてみよう。また、バクテリアのゲノムで試してみよう。 >zebrafish_PCNA_cDNA ACTTTAGTTCCTCCTACTCCAAACTAAGAAAGCAGCACAATGTTTGAGGCACGTCTGGTTCAGGGATCTATCCTTAAGAAGGTCCTGGAGGCTCTGAAAGACCTGATCAC CGAGGCTTGCTGGGATGTGAGCTCGTCGGGCATTTCTCTGCAGAGTATGGACTCCTCTCATGTGTCTCTGGTGCAGCTGACGCTCCGGAGTGACGGGTTCGACTCCTACC GCTGCGACAGAAACCTAGCCATGGGGGTCAATCTGAGCAGCATGTCGAAGATTCTGAAGTGTGCTGGAAATGAAGACATCCAGACACTTAGAGCTGAAGACAATGCTGAC ACGCTGGCACTGGTCTTTGAAGCTCAAAATCAGGAGAAAGTGTCCGACTATGAGATGAAACTGATGGATCTGGATGTGGAGCAGCTTGGCATTCCAGAGCAGGAATACAG TTGTGTGGTGAAGATGCCGTCGGGTGAGTTTGCCCGCATCTGCAGGGATCTGTCACAGATTGGTGATGCTGTCATGATCTCGTGTGCCAAGGATGGCGTGAAGTTCTCTG CTAGCGGAGAGCTGGGCACAGGCAACATCAAGCTCTCACAGACCAGCAATGTCGACAAGGAGGATGAAGCGGTAACAATTGAGATGAATGAGCCAGTGCAGCTCATTTTT GCATTGAACTACCTGAACTTCTTCACCAAGCCAACTCCTCTGTCCAGAACGGTCACACTTAGAATGTCCGCACATATTCCACTAGTGGTTGAGGACAAAATTGCAGACCT TGAACACGTAAAATATTACCTGGCGCCCCAGATCGAGGATGAAGAGTCCTCCTAATCCAAGCAGAAGAGCGAAGCCTGTCATCTGTGGGATTTTCATTCTGCAACTCAGA AGTTATTGCATAGATGTTTTGGGAAAATGCATTTTATTACTCAGTGTCTGCTGTGGTTTCCAGTTCAATGGATTCCCGATTGTGACCCTCTAAAGCCATTACATATCATT GGCAGAATTGCGGGCGCACTTATTAAATGATGGTAGTTTGGGCCTTAGCTTTACCAGGCGCTCCGTGGGCTGAATCTAGAGTGCTCTCATGTACATACTCCACATTCAGT CTTGTTTTTCTCCCTTTTTGCCGTTGTCCTCTTGTGTCCATTTCAGGTTTTGTCCAACTGCTCATTCCAATGTGTAGATAATTGTCTGTAAATATGCTAATTGGACACCG TTCATCCAGTCAACCCGTAATAAAACTGTTGTATCGG >zebrafish_PCNA_Protein MFEARLVQGSILKKVLEALKDLITEACWDVSSSGISLQSMDSSHVSLVQLTLRSDGFDSYRCDRNLAMGVNLSSMSKILKCAGNEDIITLRAEDNADALALVFETLNQEK VSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSQIGDAVMISCAKDGVKFSASGELGTGNIKLSQTSNVDKEDEAVTIEMNEPVQLIFALNYLNFFTKATP LSKTVTLSMSADIPLVVEYKIADMGHVKYYLAPKIDEESS

(20)

11 月 11 日（第 6 回）

配列情報と文献の検索

研究計画を立てる場合、その研究に関連した論文をリストアップして、既に報告されている成果を調べておくことが不可欠です。この操作により、これから進める研究テーマについて、研究がどこまで進んでいるのか、何が分かっていないのかを調べる訳です。そして未知の生物現象を解明するのに、最も有効な計画を立案します。もちろん研究で遺伝子を扱う場合、その遺伝子の配列、これまでに分かっている性質を調べておくことも重要です。この検索操作をちゃんとしておかないと、「せっかく得られた実験成果が既に報告されていた」と言うような悲惨なことも起きかねません。また卒業論文や投稿用論文の作成時には、緒言に研究の歴史と背景、研究内容の意義を述べ、考察では実験結果と既知の成果を比較検討し、研究で得られた新しい知見を議論します。論文を仕上げる時にも、関連論文を収集して精査する必要があります。さらにクローニングした遺伝子と関連遺伝子とのアライメントを行うことが必要になること、分子系統樹を作成するのに関連遺伝子をデータベースから引き出してくることが必要となることがあります。例えば、自分の研究でウシやブタなどの家畜、あるいは作物で遺伝子をクローニングしたとします。遺伝子機能に関する研究が進んだ現在では、モデル生物（マウス、ニワトリ、ゼブラフィシュ、ショウジョウバエ、線虫、酵母、シロイズナズナ等）のどれかで相同遺伝子の機能が解析され、論文の形で出版されていることがほとんどです。その論文を読めば、クローニングした遺伝子の持つ機能の概要を知ることができます。データベースを利用すれば、この様な情報も簡単に収集できます。遺伝子を BLAST 検索し、モデル生物の相同性の高い遺伝子配列を探し、そこから文献情報を探すことが可能です。今日は、研究計画を立てる時や論文を書く際、クローニングされた遺伝子の関連情報検索に必要な、データベースからの遺伝子の塩基配列・コード配列（既に実習済み）、論文の検索、機能情報の収集操作について実習します。文献の検索には、（1）NCBI の PuBMed、（2）大学の図書館のオンラインジャーナル、（3） Scopus（Elsevier 社の有料検索システム）が利用できます。PuBMed の使い勝手が最近非常によくなったので、ほとんどのことは PuBMed ですみます。従って、PuBMed の使い方を中心に演習し、大学の図書館のオンラインジャーナルについて少し解説を加えます。文献検索を使う目的には、下記のように幾つかのシチュエーションに分かれます。い

(21)

ずれも PuBMed で可能です。１．特定の論文をダウンロードしたい。２．ある研究者がどのような論文を出版しているか知りたい３．ある生物現象に関する論文をもれなく調べたい。４．論文の考察に関連する論文を探したい５．扱う遺伝子に関連する論文を調べたい。

文献の検索

使用するウェブサイト：NCBI 使用するアイテム： PubMed 上の枠の下にある Advanced ボタンを使う。左の All Fields ボタンをクリックすると、著者名、出版年度、タイトル中のワード、Abstract 中のワード、Journal（雑誌）名で検索できるシステムになっている。これらをうまく使うと上の検索が可能である。それぞれについて試してみよう。東北大学が購読契約している雑誌、あるは Plos One のような on-line journal であれば、検索結果のページから pdf ファイルを見て、プリント、ダウンロードできる。１．特定の論文をダウンロードしたい。例えば、山中先生がノーベル賞をもらうことになった iPS 細胞の論文を探してみよう。

Author: Yamanaka Shinya Journal: Cell ２．ある研究者がどのような論文を出版しているか知りたい例えば、私と研究室の助教の横井さんの共著論文を探してみよう。 Author: Suzuki T Author: Yokoi H ３．ある生物現象に関する論文をもれなく調べたい。論文の考察に関連する論文を探したい。例えば、魚類の iPS 細胞に関する論文が出版されているか？ Title/Abstract: Fish

Title/Abstract: iPS cell

成長ホルモンの日周リズムに関する論文を知りたい Title/Abstract: growth hormone

(22)

Title/Abstract: circadian rhythm

４．扱う遺伝子に関連する論文を調べたい。

例えば、癌遺伝子 Brca2 に関する論文を調べたい。 Title/Abstract: Brca2

Title/Abstract: human or mouse or zebrafish

BLAST 検索結果から、検索した遺伝子に関する文献情報を収集することもできます。リストアップされてきた遺伝子の名称がアクティブで、それをクリックすると配列情報に加えて、PUBMED の番号を添えた形で関連の論文もリストアップされています。 PUBMED 番号をクリックすると文献情報に入ることができます。 test_sequence-1 で試してみよう。 >test_sequence-1(zebrafish_charon)_peptide MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRR KQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLI 「電子ジャーナル」へのアクセスの方法東北大学ホームページ→東北大学付属図書館→電子ジャーナルリスト（学内者限定）→雑誌名のキーワード検索 OR アルファベット順で検索→volume, page 入力・検索「Scopus」を使った検索「使用方法」東北大学付属図書館→情報検索→データベース・ツールインデックス→Scopus 「Scorpus の特徴」 PubMed：医学に関係した論文を中心にデータベース化しており、生態学や資源学の雑誌は、データに登録されていないことが多い。医学系ではほぼ事足りる。ただし、生態学や資源学の雑誌はデータに含められていないものが多い。 Scorpus：ほぼ全ての分野の論文が、データとして収められている。生態学や資源学の論文も検索できる。キーワードで文献を網羅的に収集できる

Search field で Abstract を選択→Add search field で検索項目を 3 個程度に増やす → 調べたい内容で代表的なキーワードを入力 → 検索（例： zebrafish, nodal, development で試してみよう）

(23)

実習

—NCBI Map Viewer の利用—

NCBI の Map Viewer ではゲノム解読が行われた生物種ごとに、遺伝子の染色体上の位置を調べること、BLAST 検索を行うことができます。授業では、Map Viewer を使って、4 つの使用法を実習します。

NCBI Map Viewer の利用（１/4） —遺伝子の染色体上の位置を調べるー １．NCBI 先頭ページ All resources の Map Viewer を開ける２．ゲノム塩基配列が公開されている生物種一覧が表示される３．調べたい生物の Tools から虫眼鏡マークをクリック

４．Search for の枠に遺伝子名を記入し、リターンキー（or Find）を押す

５．遺伝子の位置が染色体上に赤く示される。下の Map element を選択すれば、より詳細なゲノム情報が表示される。

ヒト染色体における遺伝子の位置（遺伝子座）を検索してみよう練習：sonic hedghog (shh)を検索してみよう

１．NCBI で Map Viewer を開ける

２．Homo sapiens (human)の Tools から虫眼鏡マークを選択３．Search for に shh を記入して、Return

４．Map element のなかから SHH を選んでクリック５．shh の染色体上の位置、周辺の遺伝子が表示される６．Zoom out、Zoom in してみよう

７．SHH をクリックすると、SHH 遺伝子のイントロン・エクソン構造、変異による病状等についての情報が得られる

８．OMIM (OMIM は KEGG にもリンク), HGNC (HUGO nomenclature committee; HUG0=human genome organization) を開けると、変異による異常や分子構造の特性に関する情報が得られる

ウシ、ニワトリ、ゼブラフィッシュでも shh でキーワード検索してみよう

NCBI Map Viewer の利用（2/4）

—さまざまな生物のゲノムデータベースの利用—

NCBI, Map Viewer では、バクテリアから植物、哺乳類に至るまで多様な生物のゲノム情報が利用できます。ヒトが持っている遺伝子の相同遺伝子を進化的にたどって、どの生物にま

(24)

で存在しているかと言う疑問についても、BLAST 検索によってたどることができます。

練習：ヒトの増殖細胞核抗原（PCNA: proliferating nuclear antigen）の相同遺伝子をイネゲノム（

Oryza sativa (japonica cultivar-group)

）、バクテリアから探してみよう。

マウスビタミンＤ受容体の相同遺伝子が、ショウジョウバエ、原生動物（アメーバー）、イネに存在するかどうかも試してみよう。バクテリアのゲノム検索では、small genome に入り、種を指定し、検索する。 >human_pcna MFEGRLVQGSILKKVLEALKDLINEACWDISSSGVNLQSMDSSHVSLVQLTLRSEGFDTYRCDRNLAMGVNLTSMSKILKCAGNEDIITLRA EDNADTLALVFEAPNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSHIGDAVVISCAKDGVKFSASGELGNGNIKLS QTSNVDKEEEAVTIEMNEPVQLTFALRYLNFFTKATPLSSTVTLSMSADVPLVVEYKIADMGHLKYNLAPKIEDEEGS >mouse_vitamin_D_receptor MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDC RITKDNRRHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAI LLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDL NEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQ SFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPG VQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSM KLTPLVLEVFGNEIS

—特定の生物のゲノムに存在するフ遺伝子ァミリーのメンバーの検索— 多くの遺伝子には、生物進化の過程で共通の遺伝子から派生した兄弟遺伝子が存在します。またそのメンバーは進化に伴って増える傾向にあります。マウスならマウスのゲノムに対して、あるメンバーでゲノムを検索することにより、進化的に関連して部分的にでも共通の配列を持つメンバーを全て検索することができます。今回は、マウスゲノムに存在する核レセプターファミリーのメンバー、及び G タンパク共役受容体のメンバーを探す操作を実習します。練習：マウスゲノムに核受容体ファミリーのメンバーが幾つ存在するか？１．NCBI の Map Viewer（ページ下、POPULAR）を開ける２．Mus musculus の Tools から B（BLAST）を選択

３． mouse_vitamin_D_receptor の配列を枠にコピーし、 Program から BLASTP を選択し、Begin Search をクリック

４．マウスゲノムに存在する核レセプターファミリーの全てのメンバーが検索されてくる。60 種類あまり存在することが分かる

(25)

５．上の方にある Genome View をクリックしてみよう：検索されてきた遺伝子の染色体上の位置が表示される >mouse_vitamin_D_receptor MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQA CRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPP IRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQ KVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQ VGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNE EHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS

G-protein coupled receptor のメンバーで試してみよう。 >human_MC4R MVNSTHRGMHTSLHLWNRSSYRLHSNASESLGKGYSDGGCYEQLFVSPEVFVTLGVISLLENILVIVAIAKNKNLHSP MYFFICSLAVADMLVSVSNGSETIVITLLNSTDTDAQSFTVNIDNVIDSVICSSLLASICSLLSIAVDRYFTIFYALQ YHNIMTVKRVGIIISCIWAACTVSGILFIIYSDSSAVIICLITMFFTMLALMASLYVHMFLMARLHIKRIAVLPGTGA IRQGANMKGAITLTILIGVFVVCWAPFFLHLIFYISCPQNPYCVCFMSHFNLYLILIMCNSIIDPLIYALRSQELRKT FKEIICCYPLGGLCDLSSRY 練習：ショウジョウバエのゲノムには、核受容体ファミリーのメンバーが幾つ存在するでしょうか？ホヤ（Ciona intestinalis）でも検索してみよう

—次世代シーケンス解析で得られた配列の染色体へのマッピング— 最も汎用されている次世代シーケンサーである Illumina2000 では、一度の解析で 100b の断片配列が約 4000 万個得られます。ゲノム解析が行われている生物では、このような短い断片でも染色体にマッピングできます。さらに参照ゲノムと塩基配列の違いがあるかどうか、遺伝子疾患の原因が解析された個人のゲノムに存在しているかどうかも判定可能です。練習： BLAST 検索で human を選択して、次の配列をゲノムにマッピングしてみよう。 >human_100bp_fragment CCAAATTTAATTGATAATGGAAGCTGGCCAGCCACCACCATACAGAATTCTGTAGCTTTGA AGAATGCAGGTTTAATATCCACTTTGAAAAAGAAAACAA

(26)

11 月 18 日（第 7 回）講義２つあるいは３つ以上の塩基配列あるいはアミノ酸配列を比較したい場合、アライメントプログラムを使います。タンパク質の場合、アミノ酸配列をアライメントにかけることにより、保存性の高い領域を知ることができます。系統的に隔たった生物間（例えば、マウスとゼブラフィッシュ、あるいはマウスと酵母の関係等）で保存性が高い領域は、タンパク質の機能で重要な役割を持った領域であることが考えられます。またシステイン残基は、タンパク質の高次構造に深く関わるジスルフィド（S-S）結合を作る場合が多いため、タンパク質間での保存性を調べることは重要です。 ClustalW プログラムを使うと、マルチプルアライメントの結果から分子系統樹を作成できます。分子系統樹では、遺伝子の進化的関係を予測することができます。さらに他の生物の相同遺伝子（オーソログ）も同定できます。またモデル生物（マウス、ゼブラフィッシュ）の配列を分子系統樹に加えることで、研究対象の遺伝子に対するモデル生物のオーソログを検索し、モデル生物の情報からから、研究対象の遺伝子の機能についておおよその情報を得ることができます。授業では、ペアワイズアライメント（２つの配列を比較）、マルチプルアライメント（３つ以上の配列を比較）および分子系統樹の作成（来週）を実習します。講義配列アラインメント配列アラインメントとは、配列中で同じ並び方をしている文字列を探すことである。同一もしくは似た文字は同じ列に置き、同一でない文字は同じ列に不一致として置くか、ギャップを入れる。ペアワイズアラインメント (pairwise alignment)：２つの配列の比較

大域的アラインメント (global pairwise alignment) 局所的アラインメント (local pairwise alignment)

多重配列アラインメント (multiple alignment)：３つ以上の配列の比較

分子系統樹（進化系統樹）(molecular phylogenetic tree, evolutionary tree)

塩基配列やアミノ酸配列を基に分岐位置と分岐時間を推定し、構築された系統樹近接接合法 (neighbor-joining method): 距離行列法で作成する分子系統樹の作成方法で、生物分野で最も一般的に利用される。

キーワード

節、枝、クラスター (cluster)あるいはクレード(clade)

(27)

分子系統樹の利用（１）遺伝子の同種間、異種間での系統関係の解析（２）遺伝子ファミリーに属するメンバーの系統関係の解析（２）重複遺伝子の重複時期と進化的関係の解析（３）種や系統の進化的関係の推定 ************************************************************************ 実習 Alignment Pairwise alignment １）使用するウェブサイト：http://www.ebi.ac.uk/Information/（Internet explorer を使って EBI で検索してもよい）

２）Services の中から Proteins を選択。→リストの中から EMBOSS Tools（Pairwise Sequence Alignment）を選択

Local alignment → Matcher (protein) 2 つの枠内に配列をペーストして Submit

練習：

下の gnrh（gonadotropin-releasing hormone; 生腺腺刺激ホルモン）からヒトとゼブラフィシュを選んでアラインメントを実行してみよう。

次に、ヒトとホヤ（Ciona）で実行してみよう

Global alignment → Needle (protein)

Needle, Protein を選択し 2 つの枠内に配列をペーストして Submit 練習：上と同じ入力を行い、結果の違いを理解しよう

Multiple alignment

１）使用するウェブサイト：http://www.ebi.ac.uk/Information/

２）Services の中から Proteins を選択。 →リストの中から ClustalW2（Multiple Sequence Alignment）を選択

３）比較する配列 (Fasta format) を全て枠内にペーストして RUN（各種ボタンはデフォルトで）練習：下の gnrh (gonadotropin-releasing hormone) のうち、 >ciona_gnrh1（ホヤ）を除く配列でアラインメントを実行してみよう。 次に、>ciona_gnrh1 を入れてアラインメントを実行し、結果を比べてみ よう。（このサイトでの検索でも系統樹が表示されるが、実習・宿題では次ページ

(28)

の http://clustalw.genome.jp/を使うこと）

>human_GNRH1

MKPIQKLLAGLILLTSCVEGCSSQHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIE EETGQKKI >mouse_Gnrh MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEE ARQKKM >chicken_Gnrh1 MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIE GEARRKEI >xenopus_GnRH1 MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGE NRKKI >zebrafish_gnrh2 MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQK RK >ciona_gnrh1 MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPV NARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHE GMPEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE GNRH: 生腺刺激ホルモン放出ホルモン.視床下部で合成され、下垂体門脈経路を介して下垂体前葉に運ばれ、生腺刺激ホルモンである黄体形成ホルモン（ＬＨ）と濾法刺激ホルモン（ＦＳＨ）の産生と放出を促進する神経性ペプチドホルモン. ホルモン前駆体として合成されたあと酵素により切断され、ヒトではHWSYGLRPGペプチドがホルモンとして機能する。 Ciona: カタユレイボヤ（ホヤの仲間で日本の研究グループによってゲノムシークエンスが解読された）分子系統樹の作製 ClustalW で分子系統樹を作成する１）使用するウェブサイト ClustalW http://clustalw.genome.jp/

２）Fasta format で並べた配列を枠内にペーストし、execute multiple alignment を押す（各種ボタンはデフォルトでよい）

練習：前ページの 6 種類 gnrh のアミノ酸配列をコピーして、execute multiple alignment を押して実行。

(29)

上に Multiple sequence alignments の結果が表示される。

その下にある select tree menu で表示形式を選択して、Exec をクリックする表示形式、N-J tree branch length と Unrooted dendrogram の結果を比較してみよう

このサイトでの検索結果では、Bootstrap value, evolutionary distance の値は表示されない。DDBJ の ClustalW を使えば、これらの値が求められる。ただし、また結果の図形を表示するために、Tree View と言う無料ソフトをダウンロードする必要がある。教室のコンピュータでは、ソフトウェアのダウンロードはためらわれるので、各自のパソコンで DDBJ を試して下さい。

実習

分子系統樹作成：練習

ショウジョウバエ（Drosophila）の hedgehog タンパク質に対する、マウス（Mus musculus）とツメガエル（Xenopus tropicalis）の類似遺伝子を検索して分子系統樹を作成する。

演習室のワードは動作が悪いので、配列はメモ帳（Text ファイル）にコピーする。

手順は以下のように行う

１．ショウジョウバエ（Drosophila）の hedgehog タンパク質のアミノ酸配列を、 protein データベースからキーワード検索する(Accession number: AAF56102)。

FASTA ボタンを押すと、FASTA フォームの配列が表示される。アミノ酸配列を Word

にコピーする。>名前を付けて、Fasta format とする（スペースと数字は、検索時に排除されて計算されるので、そのままにしてもかまわない）。

２．マウスの hedgehog ホモログを検索して、配列を取り出す

NCBI 先頭ページ下側 Features にある Map viewer でマウス Mus musculus の B (blast)ボタンをクリック。マウスゲノムに対する BLAST が開くので、Bastp を選択して検索する（マウスゲノムにコードされる全てのタンパク質アミノ酸情報に対して検索）。検索により表示された３種類の hedgehog の配列を取り出す。取り出し方は、 Accession 番号をクリックし、表示された配列情報ページの上にある FASTA ボタンを押す。FASTA フォームの配列が表示されるで、コピーする。３．Xenopus の hedgehog ホモログを検索して、配列を取り出す Map viewer で Xenopus tropicalis を選ぶ。以下、２の操作と同じ。

(30)

コピーし、マルチプルアライメントを実施する。マウスと Xenopus の間で配列の保存性を注意深くみて、保存性の特徴を理解する。

５．分子系統樹を作成する。N-J tree branch length と Unrooted dendrogram の結果を比較

４の結果とあわせて、Outgroup, Paralog, Ortholog の関係を理解する。ヒト遺伝子間のパラログよりも、ヒトと Xenopus のオルソログ間の方が保存性の高いことに注意。これは祖先遺伝子が重複して２つの遺伝子（パラログとなる）を形成し、そのあとに種分化が起こったためである。 Hedgehog の配列（ショウジョウバエ、マウス、カエル） >drosophila_hh MDNHSSVPWASAASVTCLSLDAKCHSSSSSSSSKSAASSISAIPQEETQTMRHIAHTQRCLSRLTSLVALLLIVLPMVFSPAHSCGPGRGLGRHRARNLYPLVLKQTIPNLSEY TNSASGPLEGVIRRDSPKFKDLVPNYNRDILFRDEEGTGADRLMSKRCKEKLNVLAYSVMNEWPGIRLLVTESWDEDYHHGQESLHYEGRAVTIATSDRDQSKYGMLARLAVEA GFDWVSYVSRRHIYCSVKSDSSISSHVHGCFTPESTALLESGVRKPLGELSIGDRVLSMTANGQAVYSEVILFMDRNLEQMQNFVQLHTDGGAVLTVTPAHLVSVWQPESQKLT FVFADRIEEKNQVLVRDVETGELRPQRVVKVGSVRSKGVVAPLTREGTIVVNSVAASCYAVINSQSLAHWGLAPMRLLSTLEAWLPAKEQLHSSPKVVSSAQQQNGIHWYANAL YKVKDYVLPQSWRHD >mouse_dhh MALPASLLPLCCLALLALSAQSCGPGRGPVGRRRYVRKQLVPLLYKQFVPSMPERTLGASGPAEGRVTRGSERFRDLVPNYNPDIIFKDEENSGADRLMTERCKERVNALAIAV MNMWPGVRLRVTEGWDEDGHHAQDSLHYEGRALDITTSDRDRNKYGLLARLAVEAGFDWVYYESRNHIHVSVKADNSLAVRAGGCFPGNATVRLRSGERKGLRELHRGDWVLAA DAAGRVVPTPVLLFLDRDLQRRASFVAVETERPPRKLLLTPWHLVFAARGPAPAPGDFAPVFARRLRAGDSVLAPGGDALQPARVARVAREEAVGVFAPLTAHGTLLVNDVLAS CYAVLESHQWAHRAFAPLRLLHALGALLPGGAVQPTGMHWYSRLLYRLAEELMG >mouse_ishh MSPAWLRPRLRFCLFLLLLLLVPAARGCGPGRVVGSRRRPPRKLVPLAYKQFSPNVPEKTLGASGRYEGKIARSSERFKELTPNYNPDIIFKDEENTGADRLMTQRCKDRLNSL AISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRNKYGLLARLAVEAGFDWVYYESKAHVHCSVKSEHSAAAKTGGCFPAGAQVRLENGERVALSAVKPGDR VLAMGEDGTPTFSDVLIFLDREPNRLRAFQVIETQDPPRRLALTPAHLLFIADNHTEPAAHFRATFASHVQPGQYVLVSGVPGLQPARVAAVSTHVALGSYAPLTRHGTLVVED VVASCFAAVADHHLAQLAFWPLRLFPSLAWGSWTPSEGVHWYPQMLYRLGRLLLEESTFHPLGMSGAGS >mouse_shh MLLLLARCFLVILASSLLVCPGLACGPGRGFGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSERFKELTPNYNPDIIFKDEENTGADRLMTQRCKDKLNALAISV MNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRSKYGMLARLAVEAGFDWVYYESKAHIHCSVKAENSVAAKSGGCFPGSATVHLEQGGTKLVKDLRPGDRVLAA DDQGRLLYSDFLTFLDRDEGAKKVFYVIETLEPRERLLLTAAHLLFVAPHNDSGPTPGPSALFASRVRPGQRVYVVAERGGDRRLLPAAVHSVTLREEEAGAYAPLTAHGTILI NRVLASCYAVIEEHSWAHRAFAPFRLAHALLAALAPARTDGGGGGSIPAAQSATEARGAEPTAGIHWYSQLLYHIGTWLLDSETMHPLGMAVKSS >xenopus_shh MLVATQSLLLLSFICTLVTPPGLACGPGRGIGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSDCFKELTPNYNPDIMFKDEESTGADRLMTQRCKDKLNALAISV MNQWPGVKLRVTEGWDEDGHHLEESLHYEGRAVDITTSDRDRSKYGMLGRLAVEAGFDWVYYESKAHIHCSVKAENSVAAKSGGCFPAGARVMVEFGGTKAVKDLRPGDRVLSS DPQGNLLYSDFLMFIDQERDVKKLFYVIETSQRKIRLTAAHLLFVAQTKVNGTRSFKSVFASNIQPGDLIYTADPKTMTLKAVKVEKVDLEEDTGAYAPLTAHGTVVIDQVLAS CYAVIEEHTWAHLAFAPLRFGMSLSSYIYPRDSSPPSGLQPHHQVDLQSHHQVDLQSHHQVDLQSHHQLEGIHWYSQLLYQIGTWLLDSNSLHPLGMATKSS >xenopus_dhh

(31)

MPAVRIVILAICCGLLLVPVRCCGPGRGPVGRRRYMRKLVPLHYKQFVPNVPEKTLGASGKSEGKIHRGSERFIELVPNYNPDIIFKDEEKTGADRLMTERCKDRVNALAISVM NMWPGVKLRVTEGWDEDGHHAHDSLHYEGRALDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHVSVKADNSLGVRSGGCFPGTAMVMMGTGERKPLSELKIGDTVYTTD ETGQLITSVVLLFLHRNPYKTATFVLIEAEGHPSKLLVTPNHLLFIQSSSSAGFLPFAYRVQIGDLVQIYVNGTQVQSSKVVRVSLEEQTGVYAPMTEHGTLLVDGVLTSCYAT VESHTLAHVSLAPLRLFQGIASMLPDLDMSDGVHWYCHILYVLAKYVLWWDMP >xenopus_ihh MQLPKVVLLLCAAALLLSGAVRGCGPGRVVGRRRRPTKLSPLSYKQFSPNVPEKTLGASGRYEGKISRNSERFKELTPNYNPDIIFKDEEITGADRLMTQRCKDRLNSLAISVM NQWPGVKLRVTEGWDEDGHHFEESLHYEGRAVDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHCSVKSEHSAAAKTGGCFPGEALATLESGEKIPVSQLSPGLRVLAMD NSGRPTYSDFLSFLDHSPKEEHMFQVIKTQDPHRRLFLTPAHLIFVSDNYSTPASEFQAVFASSVRPGQYILVSNVVGLIPAKVRSVNTQTNYGAYAPLTQHGTLVVDDVVVSC FALVQKQRLAQIVYWPLRVLYNLGIIAGTQPSQQMGIHWYSKALYHLGRLILHGNEFHPLGIVQLES

(32)

以下工事中

11 月 19 日（第 8 回）

分子系統樹：Phylogenetic tree, Evolutionary tree

分子系統樹から、様々な情報を読み取ることができます。異なる生物のホモログ遺伝子で分子系統樹を作製すると、遺伝子の進化的関係を予測することができます。またミトコンドリア DNA の配列を使うと、人種の類縁関係や進化的関係を明らかにすることが可能です。授業では、分子系統樹の作製方法とデータの見方を講義します。オルソログとパラログ、ホモログの関係について無脊椎動物から脊椎動物への進化の過程では、短期間のうちに全ゲノム（全ての染色体）の重複（whole genome duplication: WGD）が 2 回起こっています。そのため原索動物（ナメクジウオ等が含まれ、無脊椎動物のなかで脊椎動物に最も近い）で1 種類であった遺伝子は、一度 4 つに数が増えています（4 つに増えた遺伝子でも 3 つが消失して1 種類しか残っていないもの、4 つとも残っているもの、1 つ消失して 3 つが残っているもの、2 つ消失して 2 つが残っているものもあります）。このようにゲノム重複により同じ遺伝子から派生した重複産物はパラログ（Paralog）と呼ばれます。現存の脊椎動物（円口類を除く）はゲノムの重複が起こってから分散進化しています。そのため、脊椎動物の生物種間で、共通する重複遺伝子が存在しており、それらは（Ortholog）と呼ばれ、パラログと区別されています。オルソログとパラログとの関係は、分子系統樹を作製することにより理解できます。ホモログは、共通祖先から発生した遺伝子の総称で、オルソログとパラログをまとめたものになります。オルソログとパラログの関係を理解するために、生物の進化の歴史、遺伝子重複の歴史について解説します。またhedgehog 遺伝子をモデルとして、分子系統樹を作製し、ホモログとパラログの関係を説明します。無脊椎動物から脊椎動物に進化する過程で発生したゲノム重複について少し詳しく説明します。hox 遺伝子、核内受容体遺伝子を例にして、ゲノムに刻まれた遺伝子重複の歴史を解説します（ここでは、配付資料を参考にして説明します）。

(33)

12 月 3 日（第 10 回）鈴木不在（分子生物学会に出席）のため酒井先生が代わりに下記の内容で授業を行います。配列のアラインメント手法とＢＬＡＳＴ検索の原理・配列のアラインメントとは・全域アラインメントと局所アラインメント・アミノ酸置換行列・動的計画法に基づく局所アラインメントの求め方・ＢＬＡＳＴはどのように検索を行っているのか（動的計画法との違いと、それにともなう利点、問題点）進化系統樹とＣＬＡＳＴＡＬＷで用いられている近隣結合法の原理・種の進化モデル・分子時計仮説・ウルトラメトリック木と加法木・ＵＰＧＭＡ法・近隣結合法以上について概説する。同内容の詳細については３年前期「生物生産情報処理概論」にて講義する。

(34)

12 月 10 日（第 10 回）

バイオデータベースの利用

遺伝子の機能をしりたい場合には、ポストゲノムのモデル生物（マウス、ゼブラフィッシュ、シロイズナズナ等）の検索サイトが重宝します。これらは、バイオデータベースと呼ばれます。モデル生物のなかでも、特にマウスとゼブラフィッシュのデータベースが充実しており、遺伝子の機能だけでなく発現パターン（遺伝子が何時、どの組織で、どれだけの量が発現するか）もデータベース化されており、遺伝子名のキーワード検索でデータを入手することが可能です。モデル生物ではありませんが、ヒトの遺伝子機能と遺伝子疾患のデータベースとして NCBI に OMIM（Online Menderian Inheritance of Men）が公開されています。遺伝子名でキーワード検索すると、遺伝子の機能、遺伝子疾患が存在する場合には、配列変異と疾患の表現型を知ることが可能です。

マウスのデータベース（MGI: mouse genome informatics）の特徴として、遺伝子ごとにノックアウトマウスの表現型がデータベース化されており、表現型から遺伝子の機能を調べることができます。マウスのデータベースでは、遺伝子の正確なマップポジション（連鎖地図、ゲノム配列上）等も示されています。

ゼブラフィッシュのデータベース（ZFIN：zebrafish Organism Data Base）には、 in situ ハイブリダイゼーションによる発現解析のデータが写真で掲載されており、発現部位に関する組織レベルの情報を得ることができる特徴があります。脊椎動物中であればオルソログ遺伝子（異なる生物の同一遺伝子）の発現パターンは類似していることが多いので、マウス、ウシやニワトリを研究対象にする場合でも参考となります。論文や単行書を読んで機能が分からない遺伝子（タンパク質）がでてきた時には、それらの遺伝子の機能を調べる必要があります。遺伝子機能の検索で最も一般的に利用されているサイトに NCBI の OMIM (Online Mendelian Inheritance in Man) とマウス・ゼブラフィッシュのウェブサイトがあります。授業では、これらのサイトの使い方と特徴について説明します。

OMIM

ヒトで分かっている遺伝子の機能を詳細に記述している。関連文献もリスとされている

OMIM の使い方

１． NCBI を開け、左上の All List (A-Z)から OMIM を選択する２．枠内に遺伝子名を入力して検索

(35)

練習に growth hormone（成長ホルモン）を検索してみよう遺伝子の機能、変異に伴う疾患、タンパク質の構造、関連論文がまとめられている。 MGI, ZFIN の使い方ポストゲノム研究のモデル生物のウェブサイトを利用してみよう。これまでの研究によって明らかにされている遺伝子の機能が検索できる。１．マウス（MGI）

mouse genome informatics： http://www.informatics.jax.org/

Search Menu から Genes を選択（全ての情報にリンク） Genes & Markers Query を選択

Gene/Marker Symbol/Name の枠に、遺伝子名を入力して検索:リスとされた遺伝子から、目的のものを選択試しにPax6（眼の発生の上流にある転写因子）を入力してみよう Pax6 と言うワードを含む遺伝子リストが表示される。Pax6 を選択する得られる情報 Symbol/Name/ID：遺伝子の正式名称、略記 Synonyms：同義語（別名） Genetic map：遺伝子の連鎖地図上の位置 Sequence Map：遺伝子の物理地図上の位置 Mammalian Homology：哺乳類の相同・類似遺伝子 Sequences：ゲノム塩基配列・cDNA 塩基配列・アミノ酸配列情報 Phenotypes; ノックアウトマウスの表現型。遺伝子の生物機能が分かる Polymorphism: 系統間で見られる配列多型。SNPs（１塩基多型）等 Gene Ontology (GO)：遺伝子の機能、構造

Expression：発現する組織のリスト

Protein Domains：転写産物が持つドメイン構造のリスト References：関連文献

２．ゼブラフィッシュ（ZFIN）

The Zebrafish Model Organism Database：http://zfin.org/

Genes/Makers/Clones を開ける

Name/Symbol に遺伝子名を入力して検索

試しにpax6 と入力して検索してみよう。 2 Genes を開けて、pax6b を選択する

(36)

Expression：遺伝子発現部位

Phenotype：突然変異体あるいは遺伝子ノックダウンの表現型 Map：染色体上の位置。Individual Panels を開けてみよう

(37)

12 月 17 日（第 12 回）

代謝経路データベースの利用

無料で公開されている代謝経路のデータベースとして最も充実しているのが、京都大学化学研究所が統括している KEGG (Kyoto Encyclopedia of Genes and

Genomics)である。代謝経路のマップを調べることができるだけでなく、遺伝子の機能、配列、タンパク質の立体構造も検索できる。クローニングした遺伝子がどのような代謝経路に機能しているか、代謝異常のメカニズムなども調べることができる。またさまざまな医薬品（抗生物質等）の構造、薬理作用を検索することもできる。遺伝子や化合物の機能や相互作用を調べる場合、またレポート作成等にも役立つと思う。日本語表記のサイトも利用できる。授業では、KEGG の使い方を実習します。最近、KEGG MEDICUSと名付けられた、医薬品・疾患・パスウェーの統合データベースが公開されている。疾患・医薬品・環境物質など社会的ニーズの高いデータを、ゲノム情報を基盤とした生体システム情報といて統合したリソースで、研究者だけでなく、医療従事者や一般の人にも情報を提供している。 http://www.genome.jp/kegg/pathway.html 代謝経路におけるタンパク質間相互作用、代謝経路に介在する酵素、薬剤の構造等を調べることができる。 KEGG Pathway を開ける。パスウェーの項目は、以下ように分類されている。

1. Metabolism；代謝経路（ビタミン A, retinol metabolism, の代謝経路を調べてみよう。代謝産物を示す◯がアクティブで構造等が表示される。また代謝を司る酵素名もアクティブで、配列情報等が表示される）

2. Genetic Information Processing；遺伝子から蛋白質合成経路・蛋白の修飾と分解・ゲノムの修復等（homologous recombination と non-homologous end-joining の経路を比較してみよう）

3. Environmental Information Processing；細胞内シグナル伝達経路・分泌性シグナル因子を介した細胞間相互作用（TGF-beta の細胞内伝達系を調べてみよう。発現の促進と抑制（アゴニスト）の関係が分かる）

4. Cellular Processes：細胞の活動、細胞分裂サイクル等（Oocyte meiosis（卵母細胞減数分裂）を調べてみよう）

5. Organismal system；免疫系・内分泌制御経路等（GnRH、生殖腺刺激ホルモン放出ホルモン、の内分泌経路を調べてみよう）

6. Human Deseases：発ガン経路・代謝異常等（Melanoma, プリオン病, diabetes（１型糖尿病、2 型糖尿病）の発症経路を調べてみよう）