• 検索結果がありません。

バイオインフォマティクス第四回

N/A
N/A
Protected

Academic year: 2021

シェア "バイオインフォマティクス第四回"

Copied!
131
0
0

読み込み中.... (全文を見る)

全文

(1)

バイオインフォマティクス

4回

藤 博幸

バイオインフォマティクス

4回

藤 博幸

BIO

IT

(2)

本日の講義

(1) 分子系統解析の概要

(2) 犯罪捜査への応用

(3)

本日の講義

(1) 分子系統解析の概要

(4)

分子系統解析の手続き

(1) 相同配列の収集

系統分類の場合は、オーソロガスな配列を収集

(2) 相同配列のマルチプルアラインメントの作成

(5)

分子系統解析の手続き

(1) 相同配列の収集

系統分類の場合は、オーソロガスな配列を収集

例えば

BLASTで検索して収集

(2) 相同配列のマルチプルアラインメントの作成

例えば

mafftで構築

(3) アラインメントから

分子系統樹

を構築

(6)

相同

(homologous, homolog)

orthologous, ortholog

種分化に伴い分岐

paralogous, paralog

遺伝子重複に伴い分岐

共通祖先から分岐

(7)

種系統樹と遺伝子系統樹

分子系統樹 種系統樹 (Species Tree) 遺伝子系統樹 (Gene Tree) オーソロガスな遺伝子のみ使用 生物の進化的関係を反映 パラロガスな遺伝子もオーソロガスな遺伝子 も混在。遺伝子(タンパク質)の分子進化の 歴史を反映

(8)

種系統樹と遺伝子系統樹

分子系統樹 種系統樹 (Species Tree) 遺伝子系統樹 (Gene Tree) オーソロガスな遺伝子のみ使用 生物の進化的関係を反映 パラロガスな遺伝子もオーソロガスな遺伝子 も混在。遺伝子(タンパク質)の分子進化の 歴史を反映 ・系統分類に利用 ・オーソログの同定が鍵 系統関係がわかれば同定できる? いたちごっこ

(9)

なお、系統樹に含まれる操作単位(生物、遺伝子)を OTU (Operational Taxonomic Unit) とよぶ。

有根樹

(Rooted tree)

の表現例

枝の先(葉)に生物種などが配置される 枝の長さは生物種間の何らかの「形質」の違いを反映した量を 表す(形態の差異、遺伝子の有無、遺伝子中の塩基置換など) もし、それらの違いが時間と共に増大するならば、枝の長さは近 似的に時間に比例 根 (root)(leaf, node)(branch, edge) 過去 現在

(10)

有根樹と無根樹

有根樹

(Rooted tree)

無根樹

(Unrooted tree)

Edge (枝) Node 節 (Internal node、内部節) (External node、外部節 = leaf = 葉)

(11)

有根樹と無根樹

有根樹

(Rooted tree)

無根樹

(Unrooted tree)

Node 節 (Internal node、内部節) (External node、外部節 = leaf = 葉)

(12)

有根樹と無根樹

有根樹

(Rooted tree)

無根樹

(Unrooted tree)

(13)

主な分子系統樹推定法

(1)距離行列法

(2)形質状態法

●最節約法(Maximum Parsimony Method)

●統計的方法

○最尤法(Maximum Likelihood Method)

○ベイズ法

(14)

主な分子系統樹推定法

(1)距離行列法

(2)形質状態法

●最節約法(Maximum Parsimony Method)

●統計的方法

○最尤法(Maximum Likelihood Method)

○ベイズ法

(15)

距離行列法

(1) アラインメントから全ての配列ペアの間の距離を計算

(2) 距離行列 (distance matrix) の構築

(16)

距離行列法

距離行列法として複数の系統樹構築法が提案されて

いるが、ここでは現在最も広く利用されている

近隣結合法

(neighbor-joining method)

について説明

する

(17)

距離行列法

(1) アラインメントから全ての配列ペアの間の距離を計算

(2) 距離行列 (distance matrix) の構築

(3) (2)の距離行列に基づき系統樹を構築

(1), (2)は様々な距離行列法で共通

(3)の部分が、距離行列法の手法により異なる。

ただし、

(1)には複数の手法がある。

(18)

距離行列法

(1) アラインメントから全ての配列ペアの間の距離を計算

(2) 距離行列 (distance matrix) の構築

(19)

最も簡単な配列間距離=

p距離

(p distance)

Nヌクレオチドの長さの二つの配列で、

Mサイトに差異がある場合

p-distance = M / N

p距離の問題点

多重置換

復帰置換

平行置換

を含む)

=同じサイトでの複数回の置換

---> 数回分の変化が隠されてしまう

(20)

TTCAAGAC

C

TCAAGAC

CT

T

AAGAC

CTTAA

A

AC

CTTA

G

AAC

A

TTAGAAC

ATTA

C

AAC

ATTAC

G

AC

T

C

CAAGAC

TCCA

C

GAC

TC

T

ACGAC

ATTACGAC

TCTACGAC

7回

3回

実際のサイトあたりの置換数

= (3 + 7) / 8 =

1.25

p距離 = 2 / 8 =

0.25

祖先配列 現在の配列 1 現在の配列 2 復帰 平行

(21)

進化モデルを考え、観測値から真の距離を推定する。 塩基の進化モデルの例 (1) JC69 全ての塩基は同じ速度で他の塩基に置換 (2) K80 トランジション(プリン間あるいはピリミジン間の置換) とトランスバージョン(プリンとピリミジン間の置換)では 異なる速度 … この他にも多くの進化モデルが考えられ、距離の推定が 行われている。 アミノ酸でも同様に多くの進化モデルが考えられており、 観測値からの真の距離の推定が行われている。

(22)

マルチプルアラインメント 種1 種2 種345 選択された進化モデル 種1と種2の距離 d12 種1と種3の距離 d12 . . . 種4と種5の距離 d45 マルチプルアラインメント中の全ての配列のペアに対して、 選択した進化モデルにしたがって、距離を計算

(23)

距離行列法

(1) アラインメントから全ての配列ペアの間の距離を計算

(2) 距離行列 (distance matrix) の構築

(24)

マルチプルアラインメント 種1 種2 種345 選択された進化モデル 種1と種2の距離 d12 種1と種3の距離 d12 . . . 種4と種5の距離 d45 マルチプルアラインメント中の全ての配列のペアに対して、 選択した進化モデルにしたがって、距離を計算

(25)

1と種2の距離 d12 種1と種3の距離 d12 . . . 種4と種5の距離 d45 計算された配列ペアの距離を行列の形にまとめる 種1 種2 d12 種3 d13 d23 種4 d14 d24 d34 種5 d15 d25 d35 d45 種1 種2 種3 種4 種5

距離行列

dij = dji なので上半分は表示していない

(26)

距離行列法

(1) アラインメントから全ての配列ペアの間の距離を計算

(2) 距離行列 (distance matrix) の構築

(3) 距離行列に基づき系統樹を構築

近隣結合法について説明

(27)

1 種2 種3 種4 種51 種2 種3 種4 種5 種4 種5 種1 種2 種3 種1 種3 種4 種4 種5 . . . . . . 星状系統樹 任意の二つのOUTを組んだ 全ての樹形を発生させる それぞれの系統樹 について、距離行列 から枝の長さの総和 を求める

(28)

1

種2

3

4

5

L1

L2

L3

L4

L6

L5

枝の長さの総和とは

L1 + L2 + L3 + L4 + L5 + L6

(29)

距離行列からの枝の長さの求め方の基本的

な考え方(配列3つのケースを例として)

種1 種2 種3 種1 種2 d12 種3 d13 d23 L3 L1 L2 L1 + L2 = d12 L1 + L3 = d13 L2 + L3 = d23 距離行列 d13 – d23 + d12 2 L1 = L2 = d12 – d13 + d23 2 L3 = d13 – d12 + d23 2 系統樹と距離行列から 連立方程式をつくる 方程式を解いてL1 + L2+L3 を求める

(30)

1 種2 種3 種4 種5 種4 種5 種1 種2 種3 種1 種3 種4 種4 種5 . . . それぞれの系統樹 について、距離行列 から枝の長さの総和 を求める 枝の長さの総和が最小 になるペアリングを選択

(31)

1 種2 種3 種4 種5 種4 種5 種1 種2 種3 種1 種3 種4 種4 種5 . . . 枝の長さの総和が最小のペアを選択 することの意味 枝の長さは、距離(=サイトあたりの置換 数)から計算される 枝の長さの総和が最小であるとは、 距離行列から計算されるその系統樹の 形の上で生じた置換の総数が最小である ことを意味する

(32)

1 種2 種3 種4 種5 種4 種5 種1 種2 種3 種1 種3 種4 種4 種5 . . .1 種3 種4 種4 種5 今、種1と種3のペアリングにおいて 枝の長さの総和が最小になったする 種1と種2をOUTから外し、 種1と種2をペアとした新たな OUTを考え距離行列を再構築

(33)

種2 種4 d24 種5 d25 d45 種1-3 d2,1-3 d4,1-3 d5,1-3 種2 種4 種5 種1-3

距離行列の更新

d2,1-3= d12 + d23 – d13 2 d4,1-3= d14 + d34 – d13 2 d5,1-3= d15 + d35 – d13 2

(34)

更新された距離行列をもとに、同じ処理を繰り返す。 OUTの数が3になったところで繰り返しを停止する。 上記の例であれば 種2 種4 種5 種1-3 種2 種5 種4 種1-3 種2 種1-3 種4 種5 の3つの樹形から枝の長さの総和が最小のものを選択 種2と種5がペアをつくったものが最小であったとする。 ここでOUT数が3となり、この結果の系統樹は次のようになる

(35)

種1 種3 種2 種5 種2 無根系統樹が得られる 近隣結合法では進化速度の一定性は仮定されていないので、 一つの内部節から分岐した外部節への枝の長さが異なることに注意

(36)

分子系統解析では、系統樹は無根系統樹として作成される。

根の導入は、外群(outgroup)を用いてなされる

進化速度の一定性が成立する場合(=分子時計が成立して いる場合)を除き、注目するグループの根を決められない 多くの場合、分子時計の一定性は仮定できない

(37)

外群の利用 研究対象である群:内群 (ingroup) 内群に対して遠い関係であることがわかっているもの:外群(outgroup), 外群を含めて系統樹を構築 全体としては無根系統樹だが、内群の根(root)を決めることができる。 今、種1~4(哺乳類)の系統関係を調べたい 根を導入するために種5(爬虫類)を外群として導入 種5 種1 種2 種3 種4 内群の根

(38)

最尤法・ベイズ推定プログラム

PHYLIP (http://evolution.genetics.washington.edu/phyli.html) 最尤法、最節約法、距離行列法など PAUP* (http://paup.csit.fsu.edu) 最尤法、最節約法、距離行列法など Molphy (http://bioweb.pasteur.fr/seqanal/interfaces/prot.nucml.html) 最尤法 RAxML (http://sco.h-its.org/exelixis/web/software/raxml/index.html) 最尤法 MEGA (http://www.megasoftware.net) 最尤法 MrBayes (http://mrbayes.csit.fsu.edu/index.php) ベイズ推定 を導入した系統樹推定

(39)

本日の講義

(1) 分子系統解析の概要

(2) 犯罪捜査への応用

(40)

Maria Jones

(20) ♀ 看護師 既婚

Robert White

(34) ♂ 消化器科の医者 既婚 ルイジアナ州 ラファイエット

いわゆる

W不倫

離婚

妻と離婚することを

約束するが守らない

(41)

Maria Jones

(20) ♀ 看護師

Robert White

(34) ♂ 消化器科の医者 既婚 ・妻と離婚することを 約束するが守らない ・異常に嫉妬深く、支配的 (Mariaが他の男性を見た だけで、彼らを殺すなどと いう)

10年間つきあったが、

ついに別れることを決心

1994年7月

(42)

Maria Jones

(20) ♀ 看護師

Robert White

(34) ♂ 消化器科の医者 既婚 関係が悪化する前、 定期的にビタミンB12 の注射をしていた 1994年8月 深夜にMariaが息子とベッドで眠っている所に Robertがやってきて、もう一度注射をしたいという Mairaは疲れており、深夜であることから断ったが、注射されてしまう Mairaは、何かがおかしいと感じた。これまで感じたことのない強い 痛みを覚えた。

(43)

2週間後、Mairaのリンパ節が腫れ上がった

(ウイルス感染を意味する)

12月の定期検診で、HIV陽性、HCV陽性

であることが判明

(44)

当初、警察はMairaの訴えをまじめに捉えていなかった しかし、 (1) 1984 – 1995の期間にMariaが関係を持った男性は 全員 HIV陰性であった (2) Mairaについて問い合わせた時に、Robertは嘘をついていた (3) Robertの患者の記録の中に、8月初頭に2つの血液サンプルが とられているにも関わらず、適切な検査記録がないものがある ことを警察が見つけた。 血液サンプルの一方はAIDS患者からのもので、他方はC型肝炎 の患者からのものであった。2人の患者はRobertから研究のため に血液サンプルが欲しいといわれ、提供していた。

(45)

Robertの注射によって、MariaはHIVとHCVに感染した 可能性が高い しかし、検察はMairaのHIVが、他の人から感染した のではなく、Robertの患者のサンプルに由来すると いう確固とした証拠を必要とした (1) Mariaから分離したHIV, (2) Robertの患者から分離したHIV, (3) 同じ地域の他のAIDS患者から分離したHIV で分子系統解析が行われた

(46)

配列データの入手法については、今回の資料の最後に

書いてある。

今回のデータは既に論文になっており、

NCBIから

入手可能

今回は、mafftで作成したアラインメントデータ (hivpol.aln)を用いて、 系統樹を構築する。

(47)

P1.BCM.RT ---cccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat P4.BCM.RT ---cccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat P7.BCM.RT ---cccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat P3.MIC.RT ttaaattttcccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat P5.MIC.RT ttaaattttcccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat P2.BCM.RT ---cccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat P1.MIC.RT ttaaattttcccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat P2.MIC.RT ttaaattttcccataagtcctattgaaactgtaccagtaaaattagagccaggaatggat P3.BCM.RT ---cccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat P5.BCM.RT ---cccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat V1.BCM.RT ---cccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat V2.BCM.RT ---cccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat P6.MIC.RT ttaaattttcccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat V1.MIC.RT ttaaattttcccataagtcctgttgaaactgtaccagtaaaattaaagccaggaatggat V2.MIC.RT ttaaattttcccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat P4.MIC.RT ttaaattttcccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat P6.BCM.RT ---cccataagtcctattgaaactgtaccagtaaaattaaagccaggaatggat LA04.RT ---cccattagtcctattgaaactgtaccagtaaaattaaagccaggaatggat LA21.RT ---cccattagtcctattgraactgtaccagtaaaattaaagccaggaatggat LA24.RT ---cccattagtcctattgaaactgtaccagtaaaattaaagccaggaatggat LA31.RT ---cccattagtcctattgaaactgtaccagtaaaattaaagccaggaatggat LA10.RT ---cccattagtcctattgaaactgtaccagtaaaattaaagccaggaatggat

(48)

準備したファイルでは、配列の名前を短くしてあります。

Vで始まる名前 victim = Mariaから分離されたHIVのRT Pで始まる名前 patient=Robertの患者から分離されたHIVのRT LAで始まる名前 Lafeyetteで生活するAIDS患者から分離された HIVのRT RT = Reverse Transcriptase 逆転写酵素

(49)

得られたアラインメントを使って

MEGAで系統樹を作成

(1) MEGAを起動してmafftで作成したアラインメントの読み込み (2) MEGA形式へのデータの変換

(3) モデル選択

(50)

得られたアラインメントを使って

MEGAで系統樹を作成

(1) MEGAを起動してmafftで作成したアラインメントの読み込み

(2) MEGA形式へのデータの変換 (3) モデル選択

(51)

MEGAの起動

① 左下のスタートをクリック ②下部ウィンドウに

MEGAと入力 ③MEGAのアイコンが出てくる ので、クリックして起動

(52)
(53)

メニューバーの

Fileを

クリック

(54)
(55)
(56)

前ページのファイル選択ウィンドウを拡大したもの

スクロールバーで表示位置を変更しながら ファイルを探して選択

(57)
(58)

ファイルを選択すると、

File name ウィンドウ

にファイル名が現れる

この状態で

Openをクリック

① ② ③

(59)
(60)

得られたアラインメントを使って

MEGAで系統樹を作成

(1) MEGAを起動してmafftで作成したアラインメントの読み込み

(2) MEGA形式へのデータの変換

(3) モデル選択

(61)

アラインメントを表示するウィンドウが表意される Utilitiesをクリック

(62)
(63)
(64)

MEGA形式のデータを保存するファイル名を入力するウィンドウが開く *の部分を書き換える。拡張子(.meg)は変更してはいけない

(65)

前ページのファイル名入力ウィンドウを拡大 ファイル名を*から書き換える

(66)
(67)
(68)

得られたアラインメントを使って

MEGAで系統樹を作成

(1) MEGAを起動してmafftで作成したアラインメントの読み込み (2) MEGA形式へのデータの変換

(3) モデル選択

(69)

① Modelsをクリック

② Find Best DNA.Protein Models (ML) をクリック

(70)

現在 activeばファイル(=hivpol.meg)を使用するかを 聞いてくるウィンドウが開く

(71)

モデル選択の計算のオプション確認のウィンドウが開く 黄色の部分が Automatic Nucleotide Complete deletion になっていることを確認して、Computeをクリック

(72)
(73)

結果画面出力 行がモデル

(74)

BIC, AICc : 情報量基準 この表がBICでソートされている 情報量は小さい方が良い lnL: 対数尤度 大きい方が良い BIC最小の T92+G モデルを今回使用することにする このウィンドウは閉じる

(75)

得られたアラインメントを使って

MEGAで系統樹を作成

(1) MEGAを起動してmafftで作成したアラインメントの読み込み (2) MEGA形式へのデータの変換

(3) モデル選択

(76)

① Phylogenyをクリックし プルダウンメニューから ②

Construct/Test Neighbor-Joining Tree… を選択

(77)

現在activeなファイル(=hivpol.meg)を使用するかを 問い合せるウィンドウが開くので、Yesをクリック

(78)

計算の設定を問い合わせるウィンドウが開く 黄色の部分が変更可能

(79)

Bootstrap法

デフォルトのリサンプリング回数

は500まんで、右端をクリックした時に

現れる上下の矢印の上向矢印をクリックし 1000にする。

(80)

Model/Methodは、デフォルトはNo. of differencesになっている モデル選択の結果に従い、T92+Gに変更する。

Tamura 3-parameterモデルは1992に提案されており、 これがT92に相当すると考えられるので、これを選択。

(81)

Tamura の3パラメータを選択すると Rates among Sitesでは、Gamma Distributedが自動的に選択される これがモデル選択の+Gの部分

(82)
(83)

計算の進行状況を 示すウィンドウが表示

(84)

計算が終わると 系統樹が別の ウィンドウに表示 される。

(85)

Victim (Maria)から単離された HIVは、Robertの患者から 単離されたHIVに近縁 (ただし、bootstrap support (bootstrap probabilityともよぶ) 小さい)

(86)

デフォルトではOriginal Treeが表示されている Bootstrap consensus treeのタブを選択

(87)

1000回のbootstrap サンプル のそれぞれについて構築された 系統樹のコンセンサスが 示される。 系統樹の枝振り(トポロジー) についてのみコンセンサス が示されており、枝の長さには 意味はない。 コンセンサスでもVictim由来HIV はPatient由来HIVに近い 再び、Original treeタブを選択

(88)

① Original treeタブを選択し オリジナルの系統樹を 表示 ② メニューバーのFileを クリック ③ Export Current Tree (Newick) を選択

(89)

Newick 形式のデータを 保存するファイル名を 聞いてくるので、

Hivpol.nwkとファイル名を 指定してSaveをクリック

(90)

hivpol.nwkをメモ帳で開く (((((((((((((((V1.MIC.RT:0.00183356,V2.MIC.RT:-0.00005991)0.8910:0.00358471,P6¥ .MIC.RT:-0.00000974)0.1770:0.00000487,V1.BCM.RT:-0.00000487)0.1240:0.00000487,P¥ 5.BCM.RT:-0.00000487)0.1580:0.00000487,V2.BCM.RT:-0.00000649)0.6510:0.00179596,¥ P6.BCM.RT:-0.00002443)0.2560:0.00047535,(P3.MIC.RT:0.00247068,(P5.MIC.RT:0.0001¥ 0360,(P4.BCM.RT:-0.00001486,(P1.BCM.RT:0.00180051,P7.BCM.RT:-0.00002890)0.3290:¥ 0.00001486)0.6290:0.00167160)0.3700:0.00110497)0.1450:0.00042271)0.1300:0.00012¥ 758,(P2.MIC.RT:0.00692434,(P3.BCM.RT:0.00000000,P4.MIC.RT:0.00000000)0.3170:0.0¥ 0022865)0.3800:0.00123392)0.2950:0.00120878,P2.BCM.RT:0.00151719)0.1530:0.00021¥ 449,LA32.RT:0.00555837)0.1380:0.00004296,(LA08.RT:0.00517567,LA05.RT:0.01117874¥ )0.4190:0.00175445)0.2030:0.00101235,P1.MIC.RT:0.00223222)0.3350:0.00231784,LA1¥ 8.RT:0.00719763)0.0810:0.00037487,((((LA29.RT:0.01283766,LA06.RT:0.00724592)0.3¥ 080:0.00136025,LA12.RT:0.00407447)0.1500:0.00100562,(LA28.RT:0.01213187,LA07.RT¥ :0.00795380)0.5010:0.00248453)0.0890:0.00048663,((LA10.RT:0.00771152,LA23.RT:0.¥ 01441878)0.4210:0.00234077,((((LA04.RT:0.00992803,LA25.RT:0.01196780)0.2190:0.0¥ 0075079,LA27.RT:0.00367005)0.1520:0.00156941,(LA22.RT:0.01275031,LA30.RT:0.0111¥ 6664)0.2420:0.00081036)0.0260:0.00057137,((LA17.RT:0.00971516,LA13.RT:0.0103715¥ 9)0.5080:0.00308458,(LA31.RT:0.00767816,(LA14.RT:0.01046118,(LA21.RT:0.00708465¥ ,LA24.RT:0.00192401)0.8140:0.00438466)0.2290:0.00054839)0.1320:0.00076469)0.146¥ 0:0.00116298)0.0090:0.00046111)0.0210:0.00077806)0.0200:0.00022654)0.1420:0.001¥ 01897,LA16.RT:0.00625876)0.5290:0.00018712,(LA26.RT:0.00566221,LA02.RT:0.016280¥ 61)0.5290:0.00268962); Newick形式とは、系統樹の情報を、テキストとして記述したもの

(91)
(92)

合衆国の法廷ではじめて分子系統解析が利用された

のがこの事件

1998年、Robert Whiteは二級殺人について有罪判決

(93)

モデル選択のモデルとは何か

距離の最尤推定とは何か

bootstrap support (bootstrap probablity)とは何か?

Newick 形式とは何か?

(94)

参考文献

Samuelsson, T. (2012) “Genomics and Bioinformatics - An Introduction to Programming Tools - “

(95)
(96)

配列データは

NCBIに登録されている

AY156734 – AY156907

配列を取得

Multi FASTA 形式のファイルで保存

mafft でmultiple alignment

MEGAで系統解析

(97)

NCBIをググる

(98)

① AY156734 を入力

(99)
(100)
(101)

前ページのGenes部分を拡大

(102)
(103)
(104)
(105)

前ページの図のトップを拡大

(106)

Send to をクリックすると図のようなメニューが出てくる

Fileをチェックすると、下部のメニューが出てくるので

(107)
(108)

>gi|24209939|gb|AY156734.1| HIV-1 clone P1.BCM.RT from USA reverse transcriptase (pol) gene, partial CCCATAAGTCCTATTGAAACTGTACCAGTAAAATTAAAGCCAGGAATGGATGGCCCAAAAGTTAAACAAT GGCCACTGACAGAAGAAAAAATAAAAGCATTAGTAGAAATTTGTACAGAAATGGAAAAGGAAGGAAAAAT TTCAAAAATTGGGCCTGAAAATCCATACAATACTCCAGTATTTGCCATAAAGAAAAAAGACAGTACTAAA TGGAGAAAATTAGTAGATTTCAGAGAACTTAATAAGAGAACTCAGGACTTCTGGGAAGTTCAATTAGGAA TACCACATCCTGCAGGGTTAAAAAAGAAAAAATCAGTAACAGTGCTGGATGTGGGTGATGCATATTTTTC AGTTCCCTTAGATAAAGAGTTCAGGAAGTATACTGCATTTACCATACCTAGTATAAACAATGAGACACCA GGGATTAGATATCAGTACAATGTGCTTCCACAGGGATGGAAAGGATCACCAGCAATATTCCAAAGTAGCA TGACAAAAATCTTAGAGCCTTTTAGAAAACAAAATCCAGACATAGTTATCTATCAATACATGGATGATCT GTATGTAGGATCTGACTTAGAAATAGGGCAGCATAGAATAAAAATAGAGGAACTAAGACAACATCTGTTG AAGTGGGGACTTACCACACCAGACAAAAAACATAAGAAGGAACCCCCATTCCTTTGGAT

>gi|24209941|gb|AY156735.1| HIV-1 clone P2.BCM.RT from USA reverse transcriptase (pol) gene, partial CCCATAAGTCCTATTGAAACTGTACCAGTAAAATTAAAGCCAGGAATGGATGGCCCAAAAGTTAAGCAAT GGCCACTGACAGAAGAAAAAATAAAAGCATTAGTAGAAATTTGTACAGAAATGGAAAAGGAAGGAAAAAT TTCAAAAATTGGGCCTGAAAATCCATACAATACTCCAGTATTTGCCATAAAGAAAAAAGACAGTACTAAA TGGAGAAAATTAGTAGATTTCAGAGAACTTAATAAGAGAACTCAAGACTTCTGGGAAGTTCAATTAGGAA TACCACATCCTGCAGGGTTAAAAAAGAAAAAATCAGTAACAGTGCTGGATGTGGGTGATGCATATTTTTC AGTTCCCTTAGATAAGGAGTTCAGGAAGTATACTGCATTTACCATACCTAGTATAAACAATGAGACACCA GGGATTAGATATCAGTACAATGTGCTTCCACAGGGATGGAAAGGATCACCAGCAATATTCCAAAGTAGCA TGACAAAAATCTTAGAGCCTTTTAGAAAACAAAATCCAGACATAGTTATCTATCAATACATGGATGATTT GTATGTAGGATCTGACTTAGAAATAGGGCAGCATAGAATAAAAATAGAAGAACTAAGACAACATCTGTTG AAGTGGGGACTTACCACACCAGACAAAAAACATCAGAAGGAACCTCCATTCCTTTGGAT

>gi|24209943|gb|AY156736.1| HIV-1 clone P3.BCM.RT from USA reverse transcriptase (pol) gene, partial CCCATAAGTCCTATTGAAACTGTACCAGTAAAATTAAAGCCAGGAATGGATGGCCCAAAAGTTAAACAAT GGCCACTGACAGAAGAAAAAATAAAAGCATTAGTAGAAATTTGTACAGAAATGGAAAAGGAAGGAAAAAT TTCAAAGATTGGGCCTGAAAATCCATACAATACTCCAGTATTTGCCATAAAGAAAAAAAACAGTACTAGA TGGAGAAAATTAGTAGATTTCAGAGAACTTAATAAGAGAACTCAAGACTTCTGGGAAGTTCAATTAGGAA TACCACATCCTGCAGGGTTAAAAAAGAAAAAATCAGTAACAGTGCTGGATGTGGGTGATGCATATTTTTC AGTTCCCTTAGATAAAGAGTTCAGGAAGTATACTGCATTTACCATACCTAGTATAAACAATGAGACACCA GGGATTAGATATCAATACAATGTGCTTCCACAGGGATGGAAAGGATCACCAGCAATATTCCAAAGTAGCA TGACAAAAATCTTAGAGCCTTTTAGAAAACAAAATCCAGACATAGTTATCTATCAATACATGGATGATCT GTATGTAGGATCTGACTTAGAAATAGGGCAGCATAGAATAAAAATAGAGGAACTAAGACAACATCTGTTG AAGTGGGGATTTATCACACCAGACGAAAAACACCAGAAGGAACCTCCATTCCGTTGGAT ダウンロードされたファイルにはMulti-Fasta形式で塩基配列が含まれている

(109)

準備したファイルでは、配列の名前を短くしてあります。

Vで始まる名前 victim = Mariaから分離されたHIVのRT Pで始まる名前 patient=Robertの患者から分離されたHIVのRT LAで始まる名前 Lafeyetteで生活するAIDS患者から分離された HIVのRT RT = Reverse Transcriptase 逆転写酵素

(110)

ダウンロードしたファイルを

Mafftでアラインして、

Clustal 形式のアラインメントを作成する。

(111)

Mafftを起動する

(112)
(113)

2. 検索ウィンドウにmafftと入力

(114)

1. このウィンドウにmafftと入力

2. 表示されたmafft をクリック

(115)
(116)

Input file? (fasta format)

(117)

4. 入力ファイルを指定するために、multi-fasta formatのファイルが置かれた Directoryを表示する。(ここからはWindows OS上での処理)

(118)

ドキュメントを選択 ファイルが

ドキュメントフォルダ にある場合

(119)

5. ドキュメントdirectoryが表示される。

Directoryからmafftのウィンドウにファイルをドラッグすると、ファイル名が入力 される。ファイル名が入力されたらenterキーをおす。

(120)

Fasta formatの入力ファイルのアイコン をmafftの入力画面にドラッグする

(121)

6. Outputすなわち、アラインメントを出力するファイル名を聞かれる、入力

ファイル名を参考にZドライブ上のファイル(新規でも既存の者でも良い)を指定し Enterキーをおす。出力オプションを聞いてくるので2を指定する。

(122)

1. 入力ファイルが Z:¥ファイル名の 形で記入される エンターキーをお す 2. Output file? @ とアラインメントの出力 ファイルを聞いてくるので Z:¥ファイル名 としてドキュメントフォルダの ファイル名を持つファイルに 保存するようにしてエンター キーをおす 3. 6つのアウトプット形式が出力される

(123)

6つ出力形式

1 Clustal format/ Sorted

2 Clustal format / Input order 3 Fasta format / Sorted

4 Fasta format / Input Order 5 Phylip format / Sorted

6 Phylip format / Input Order

Clustal と Fastaは説明済み

Phylipは系統解析の際に説明

(124)

Sorted と Input Order

入力ファイル fasta format >配列1 atgccttgcccaccgctg… >配列2 atgggttgggcacccctg… >配列3 atgcgttggccaccgctg… >配列4 atgccctggcccccgctc… Guide-treeは次のようになって いるとする 配列1 配列4 配列2 配列3 Sorted Input Order 配列1 ATGCCTTGCC 配列4 ATGCCCTGGC 配列2 ATGGGTTGG 配列3 ATGCGTTGGCA 配列1 ATGCCTTGCC 配列2 ATGGGTTGG 配列3 ATGCGTTGGCA 配列4 ATGCCCTGGC

(125)

7. アラインメントのオプションを聞いてくる。1の—autoオプションを指定 してenter

(126)

アラインメントのオプションを聞いてくる(正確さ優先か、速度優先か)。 1の—autoオプションを指定してenter

(127)

t7

8. 指定したファイルやオプションを、コマンドライン形式で確認してくる 問題なければ Y を入力してenter

(128)
(129)

9. ウィンドウ中に、出力が表示

(130)
(131)

点数 (4) 100-90 (3) 89-80 (2) 79-70 (1) 69-60 達成目標 (3)に加え、 配列の取 得、アライ ンメント、系 統樹の構 築までの一 連の処理を これまでマ ナbだツー ルやサイト を使って実 行できる (2)に加え、 MEGAを操 作して近隣 結合法で系 統樹を作成 できる。 (1)に加え、 系統樹の 作成方法 の中の距 離行列法、 特に近隣結 合法につい て説明でき る。また、 相違度では なく進化距 離を推定す る必要性に ついて説明 できる 系統樹に関 する用語を 説明できる (種系統樹 と遺伝子系 統樹, 根、 葉、節、枝, 有根系統 樹、無根系 統樹,)

参照

Outline

関連したドキュメント

Tkachov; Doubly nonlocal Fisher-KPP equation: Speeds and uniqueness of traveling waves.. Tkachov; Doubly nonlocal Fisher-KPP equation:

ホーム > 政策について > 分野別の政策一覧 > 健康・医療 > 食品 > 輸入食品監視業務 >

ホーム >政策について >分野別の政策一覧 >福祉・介護 >介護・高齢者福祉

Joshi; Existence and nonexistence of solutions of sublinear problems with prescribed num- ber of zeros on exterior domains, Electronic Journal of Differential Equations, 2017 No..

Thus, Fujita’s result says that there are no global, nontrivial solutions of (1.3) whenever the blow up rate for y(t) is not smaller than the decay rate for w(x, t) while there are

0.1uF のポリプロピレン・コンデンサと 10uF を並列に配置した 100M

< >内は、30cm角 角穴1ヶ所に必要量 セメント:2.5(5)<9>kg以上 砂 :4.5(9)<16>l以上 砂利 :6 (12)<21> l

[r]