バイオインフォマティクス
第
5回
藤 博幸
バイオインフォマティクス
第
5回
藤 博幸
BIO
IT
本日の講義
(1)前回の近隣結合法による系統樹構築の補足
(1-1) モデル選択、モデルとは?
(1-2) ブートストラップ法
(1-3) Newick形式
(2) 最尤法による系統樹構築
外群導入による根の同定
本日の講義
(1)前回の近隣結合法による系統樹構築の補足
(1-1) モデル選択、モデルとは?
(1-2) ブートストラップ法
(1-3) Newick形式
(2) 最尤法による系統樹構築
外群導入による根の同定
得られたアラインメントを使って
MEGAで系統樹を作成
(1) MEGAを起動してmafftで作成したアラインメントの読み込み (2) MEGA形式へのデータの変換(3) モデル選択
モデル選択
モデルとは?
① Modelsをクリック
② Find Best DNA.Protein Models (ML) をクリック
現在 activeばファイル(=hivpol.meg)を使用するかを 聞いてくるウィンドウが開く
モデル選択の計算のオプション確認のウィンドウが開く 黄色の部分が Automatic Nucleotide Complete deletion になっていることを確認して、Computeをクリック
結果画面出力 行がモデル
BIC, AICc : 情報量基準 この表がBICでソートされている 情報量は小さい方が良い lnL: 対数尤度 大きい方が良い BIC最小の T92+G モデルを今回使用することにする このウィンドウは閉じる
最も簡単な配列間距離=p距離 (p distance) Nヌクレオチドの長さの二つの配列で、 Mサイトに差異がある場合 p-distance = M / N p距離の問題点 多重置換(復帰置換や平行置換を含む) =同じサイトでの複数回の置換 ---> 数回分の変化が隠されてしまう p < 5% 程度の時のみ、p距離は有効
TTCAAGAC CTCAAGAC CTTAAGAC CTTAAAAC CTTAGAAC ATTAGAAC ATTACAAC ATTACGAC TCCAAGAC TCCACGAC TCTACGAC ATTACGAC TCTACGAC 7回 3回 実際のサイトあたりの置換数 = (3 + 7) / 8 = 1.25 p距離 = 2 / 8 = 0.25
置換数の推定 <--- 塩基置換を表現する確率モデルが必用 連続時間マルコフ連鎖 (continuous -time Markov chain) が良く使用される。 仮定: (1)全てのサイトは独立に進化 (2)特定のサイトの置換 (substitution) は マルコフ連鎖で表現 (3)塩基置換速度に異なる制約 → 異なるモデル
TTCAAGAC CTCAAGAC CTTAAGAC CTTAAAAC CTTAGAAC ATTAGAAC ATTACAAC ATTACGAC このサイトに着目 時刻0 時刻t サイト5は、 A → A → A → A → G → G → C → C と遷移している。 4種類の塩基を、このサイトのと りうる状態(state)とよぶ。 状態の遷移は確率的に生じる。 マルコフ性(Markovian property) :無記憶性
€
P(C | G,G,A,A,A,A) = P(C | G)
次の時点の状態が何になるかは、現在の状態にのみ依存 過去にとった状態が何であるかは影響しない塩基置換のマルコフ・モデルと距離の推定
JC69モデル
(1)
塩基置換速度に異なる制約 → 異なるモデル ↓ JC69モデル (Jukes and Cantor, 1969) どの塩基も、任意の他の塩基に同じ速度λで変化すると仮定 瞬間置換速度行列(instantaneous substitution-rate matrix)を次の ようにおくことで表現 € Q = q[ ]
ij = −3λ λ λ λ λ −3λ λ λ λ λ −3λ λ λ λ λ −3λ $ % & & & & ' ( ) ) ) )€ Q = q
[ ]
ij = −3λ λ λ λ λ −3λ λ λ λ λ −3λ λ λ λ λ −3λ $ % & & & & ' ( ) ) ) ) 行、列はT, C, A, Gを表す€
q
12=
λ
は、T (1)から C (2) への瞬間置換速度が λであることを表している。 ※ 各行の総和は0になることに注意 ある塩基iが、任意の塩基に置換される速度の総和は€
3
λ
= −q
iiSTEP1: 配列間距離dのQによる表現 t /2 祖先配列 配列1 配列2 t 配列1 配列2
(1)配列1の塩基組成を € πT πC πA πG
(
)
とする。€
Δt
(2)Qが与えられた時に 時間間隔 の間に塩基iからjに変化する確率€
= q
ijΔt
(3)任意の塩基が他の塩基に置換される速度€
3
λ
STEP1: 配列間距離dのQによる表現 t 配列1 配列2 配列1と配列2の距離€
d = π
T( )
3λ
t + π
C( )
3λ
t + π
A( )
3λ
t + π
G( )
3λ
t
=
(
π
T+
π
C+
π
A+
π
G)
( )
3λ
t = 3λt
STEP2: JC69モデルのもとで2本の配列で差異のあるサイト の期待確率 t 配列1 配列2 JC69モデルのもとでの遷移確率行列 € P(t) = eQt = p0(t) p1(t) p1(t) p1(t) p1(t) p0(t) p1(t) p1(t) p1(t) p1(t) p0(t) p1(t) p1(t) p1(t) p1(t) p0(t) " # $ $ $ $ % & ' ' ' ' € p0(t) = 1 4 + 3 4 e −4λt p1(t) = 1 4 − 1 4 e −4λt € p = πT pTC(t) + πT pTA(t) + πT pTG(t) +πCpCT(t) + πCpCA(t) + πCpCG(t) +πA pAT(t) + πApAC(t) + πApAG(t) +πGpGT(t) + πGpGC(t) + πGpGA(t) = πT(3p1(t)) + πC(3p1(t)) + πA(3p1(t)) + πG(3p1(t)) = (πT + πC + πA + πG)(3p1(t)) = 3p1(t) = 3 4 − 3 4 e −4λt = 3 4 − 3 4 e −4 3d (1.5)
STEP3:実測値との対応付けによる推定
配列1と配列2で差異のあるサイト数x 総サイト数 n 差異のあるサイトの割合€
ˆ
p = p
とおく。 € x n = 3 4 − 3 4 e −4 3d € e− 4 3d = 1− 4 3 x n (ハットは推定値を意味する) ^€
p =
x
n
€ d = − 3 4 ln 1− 4 3 x n # $ % & ' ( € d = − 3 4 ln 1− 4 3 x n # $ % & ' ( = − 3 4 ln 1− 4 3 p # $ % & ' ( ^ ^ p > (3/4) であれば、この距離の公式は適用できない ^ ※K80モデル
トランジション ピリミジン間 (T <--> C)の置換 プリン間 (A <-->G)の置換 トランスバージョン プリン、ピリミジン間 (T、C <--> A,G)の置換 トランジションは、トランスバージョンより高い速度で生じてい る を考慮したモデルT C
A G
T C
A G
K80モデル、あるいはKimuraの2パラメータモデル におけるQの設定 € −
(
α + 2β)
α β β α −(
α + 2β)
β β β β −(
α + 2β)
α β β α −(
α + 2β)
% & ' ' ' ' ( ) * * * * トランジションの置換速度 α トランスバージョンの置換速度 β T C A G T C A G (1.8)d = −
1
2
log(1−V − 2S) −
1
4
log(1− 2V )
TN93
€
Q =
−
(
α
1π
C+
βπ
R)
α
1π
Cβπ
Aβπ
Gα
1π
T−
(
α
1π
T+
βπ
R)
βπ
Aβπ
Gβπ
Tβπ
C−
(
α
2π
G+
βπ
Y)
α
2π
Gβπ
Tβπ
Cα
2π
A−
(
α
2π
A+
βπ
Y)
&
'
(
(
(
(
)
*
+
+
+
+
ここで、€
π
Y=
π
T+
π
Cπ
R=
π
A+
π
G ピリミジンの頻度 プリンの頻度T C
A G
α1
α2
TN93の特殊なケース
TN93 HKY85€
α
1=
α
2=
α
κ
1=
κ
2=
κ
あるいは F84 € α1 = 1+(
κ /πY)
β,α2 = 1+(
κ /πR)
β, パラメータが1つ減る F81€
α
1=
α
2=
β
結果画面出力 行がモデル
配列間距離の推定のため、与えられたアラインメントに
もっとも適したモデルを選択する
モデル
:塩基置換の生じ方を記述
得られたアラインメントを使って
MEGAで系統樹を作成
(1) MEGAを起動してmafftで作成したアラインメントの読み込み (2) MEGA形式へのデータの変換(3) モデル選択
ブートストラップ法
(bootstrap)
Victim (Maria)から単離された HIVは、Robertの患者から 単離されたHIVに近縁 (ただし、bootstrap support (bootstrap probabilityともよぶ) 小さい)
ブートストラップサンプル1 . . . ブートストラップサンプル1000 系統樹1 系統樹1000 例えば、1000個のブートストラップサンプルから作られた 系統樹の中で、ヒト、チンパジー、ボノボがクラスターを 形成している回数が994回であれば、99.4%をブートストラップ サポートをオリジナルの系統樹にマッピングする。
① Original treeタブを選択し オリジナルの系統樹を 表示 ② メニューバーのFileを クリック ③ Export Current Tree (Newick) を選択
Newick 形式のデータを 保存するファイル名を 聞いてくるので、
Hivpol.nwkとファイル名を 指定してSaveをクリック
hivpol.nwkをメモ帳で開く (((((((((((((((V1.MIC.RT:0.00183356,V2.MIC.RT:-0.00005991)0.8910:0.00358471,P6¥ .MIC.RT:-0.00000974)0.1770:0.00000487,V1.BCM.RT:-0.00000487)0.1240:0.00000487,P¥ 5.BCM.RT:-0.00000487)0.1580:0.00000487,V2.BCM.RT:-0.00000649)0.6510:0.00179596,¥ P6.BCM.RT:-0.00002443)0.2560:0.00047535,(P3.MIC.RT:0.00247068,(P5.MIC.RT:0.0001¥ 0360,(P4.BCM.RT:-0.00001486,(P1.BCM.RT:0.00180051,P7.BCM.RT:-0.00002890)0.3290:¥ 0.00001486)0.6290:0.00167160)0.3700:0.00110497)0.1450:0.00042271)0.1300:0.00012¥ 758,(P2.MIC.RT:0.00692434,(P3.BCM.RT:0.00000000,P4.MIC.RT:0.00000000)0.3170:0.0¥ 0022865)0.3800:0.00123392)0.2950:0.00120878,P2.BCM.RT:0.00151719)0.1530:0.00021¥ 449,LA32.RT:0.00555837)0.1380:0.00004296,(LA08.RT:0.00517567,LA05.RT:0.01117874¥ )0.4190:0.00175445)0.2030:0.00101235,P1.MIC.RT:0.00223222)0.3350:0.00231784,LA1¥ 8.RT:0.00719763)0.0810:0.00037487,((((LA29.RT:0.01283766,LA06.RT:0.00724592)0.3¥ 080:0.00136025,LA12.RT:0.00407447)0.1500:0.00100562,(LA28.RT:0.01213187,LA07.RT¥ :0.00795380)0.5010:0.00248453)0.0890:0.00048663,((LA10.RT:0.00771152,LA23.RT:0.¥ 01441878)0.4210:0.00234077,((((LA04.RT:0.00992803,LA25.RT:0.01196780)0.2190:0.0¥ 0075079,LA27.RT:0.00367005)0.1520:0.00156941,(LA22.RT:0.01275031,LA30.RT:0.0111¥ 6664)0.2420:0.00081036)0.0260:0.00057137,((LA17.RT:0.00971516,LA13.RT:0.0103715¥ 9)0.5080:0.00308458,(LA31.RT:0.00767816,(LA14.RT:0.01046118,(LA21.RT:0.00708465¥ ,LA24.RT:0.00192401)0.8140:0.00438466)0.2290:0.00054839)0.1320:0.00076469)0.146¥ 0:0.00116298)0.0090:0.00046111)0.0210:0.00077806)0.0200:0.00022654)0.1420:0.001¥ 01897,LA16.RT:0.00625876)0.5290:0.00018712,(LA26.RT:0.00566221,LA02.RT:0.016280¥ 61)0.5290:0.00268962); Newick形式とは、系統樹の情報を、テキストとして記述したもの
Newickフォーマット
(A,B,(C,D)); leaf nodes are named (A,B,(C,D)E)F; all nodes are named
(A:0.1,B:0.2,(C:0.3,D:0.4):0.5); distances and leaf names (popular) (A:0.1,B:0.2,(C:0.3,D:0.4)E:0.5)F; distances and all names
http://en.wikipedia.org/wiki/Newick_format より
Newick フォーマットの表記は一意ではない
1
2
3
4
5
( ( 1 , 2 ) , ( 3 , 4 ) , 5 );
テキスト形式による系統樹の記述
- Newick format
( ( 1 , 2 ) , ( 4 , 5 ) , 3 ); ( ( ( 1 , 2 ) , 3 ) , 4 , 5 ); ( 1 , ( ( 4 , 5 ) , 3 ) , 2 ); …
Newick Format による系統樹表記は1通りに決まらない
1
3
4
5
2
この系統樹は、たとえば左のような 複数の表記が可能である1
3
4
5
2
1.0 3.0 2.0 4.0 3.0 2.0 2.0 ( ( 1 : 2.0 , 2 : 1.0 ) : 2.0 , 3 : 3.0 , ( 4 : 2.0 , 5 : 4.0 ) : 3.0 );枝の長さの情報を付加した
Newick Format による
系統樹表記
1
3
4
5
2
1.0 2.0 3.0 4.0 3.0 2.0 2.0 ( ( 1 : 2.0 , 2 : 1.0 ) 60 : 2.0 , 3 : 3.0 , ( 4 : 2.0 , 5 : 4.0 ) 90 : 3.0 ); 90(%) 60(%)枝の長さの情報と
Bootstrap サポートを付加した
Newick Format による系統樹表記
本日の講義
(1)前回の近隣結合法による系統樹構築の補足
(1-1) モデル選択、モデルとは?
(1-2) ブートストラップ法
(1-3) Newick形式
(2) 最尤法による系統樹構築
外群導入による根の同定
種1 種3 種2 種5 種2 無根系統樹がえられる 近隣結合法では進化速度の一定性は仮定されていないので、 一つの内部節から分岐した外部節への枝の長さが異なることに注意
分子系統解析では、系統樹は無根系統樹として作成される。
根の導入は、外群(outgroup)を用いてなされる
進化速度の一定性が成立する場合(=分子時計が成立して
いる場合)を除き、注目するグループの根を決められない
外群の利用 研究対象である群:内群(ingroup) 内群に対して遠い関係であることがわかっているもの:外群(outgroup), 外群を含めて系統樹を構築 全体としては無根系統樹だが、内群の根(root)を決めることができる。 今、種1~4(哺乳類)の系統関係を調べたい 根を導入するために種5(爬虫類)を外群として導入 種5 種1 種2 種3 種4 内群の根
ブートストラップの説明図は
「分子系統学への統計的アプローチ」 共立出版 を改変
Newick formatは、隈啓一 京都大学化学研究所 ゲノム情報解析特論 (系統樹推定法)を改変
カール
•ウーズ
(Carl Rechard Woese, 1928-2012)
rRNAを用いた分子分類や 細胞の違いなどから、真正細菌 とも真核生物とも異なる古細菌 の存在を示唆し、3ドメイン体系 を提唱した。 エルンスト•マイヤーらから激しい 反発をうける 「こんな分類体系を思いつくのは 生物学者ではない証拠だ」 受容には時間がかかった。http://ja.wikipedia.org/wiki/ファイル:PhylogeneticTree.png
古細菌も真正細菌も、原核細胞を持った原核生物
残りは真核生物
従来あった動物界や植物界などを残して、これらの
分類群を呼ぶために、
上位の階級名
として
ドメイン
(domain, 超界)
がつくられた。
• 真正細菌 (バクテリア)ドメイン
• 古細菌(アーキア)ドメイン
• 真核生物(ユーカリア)ドメイン
従来の「界」はそのまま使用される・
3つのドメインの間の関係
3者についての
無根系統樹
3通りの関係が考えられる。
通常は、
外群
を導入して「
根
(= 共通祖先)」
を決定
しかし、3者で地球上の生物は尽きており、
これよりも遠い関係の生物はいない
真核生物ドメイン 真正細菌ドメイン 古細菌ドメイン 三者の関係の3つの仮説 真核生物 真正細菌 古細菌 真正生物 真核生物 古細菌 古細菌 真正細菌 真核生物
遺伝子データとして、3つのドメイン全てが核にコード されたパラログを有する遺伝子を考える ※ ミトコンドリアや葉緑体に由来するものを外す (細胞内共生によるものは真正細菌に近くなる) 真正細菌ドメイン 古細菌ドメイン 真核生物ドメイン 遺伝子A 遺伝子 B 全てのドメインにパラログ(遺伝子Aと遺伝子B)があると いうことは、遺伝子A, Bはこれら3つのドメインが種分化 する以前の祖先生物において遺伝子重複により生じた と考えられる。 遺伝子Aと遺伝子Bをお互いに外群として利用できる。
藤田俊彦(2010) “動物の系統分類と進化” 裳華房 より 外群としてパラログを利用して3つのドメインの根を決定したのは 宮田隆のグループの研究 (Iwabe et al. 1989) EF-1α/Tu EF2/G 遺伝子重複 全生物の共通祖先 真核生物 古細菌 真正細菌 真核生物 古細菌 真正細菌
Ecocyte Hypothesis = Two Domains Hypothesis
Two Domains = Archaea and Bacteria
Eukaryotes arose through endosymbiotic
Partnership between Archaea and Bacteria
最尤法 (maximum likelihood method)による系統樹の構築 elongation factor 1-alphaのアミノ酸配列を使用
(1) 真核生物
ヒト (Homo sapiens gi |4503471) (2) 古細菌
クレンアーキオータ (Sulfolobus solafatarocus gi|80090675)
ユーリアーキオータ (Methonococcus maripaludis, gi|73919278) (3) 真正細菌 (outgroupとして導入)
大腸菌 (Escherichia coli gi|487459962)
(1) MEGAを起動してmafftで作成したアラインメントの読み込み (2) MEGA形式へのデータの変換
(3) モデル選択
(1) MEGAを起動してmafftで作成したアラインメントの読み込み
(2) MEGA形式へのデータの変換 (3) モデル選択
aaseq2.aln
mafft で作成されたEF-1αのアラインメント
を入力として使用
CLUSTAL format alignment by MAFFT L-INS-i (v7.130b)
gi|4503471|ref| MGKEKTHINIVVIGHVDSGKSTTTGHLIYKCGGIDKRTIEKFEKEAAEMGKGSFKYAWVL gi|800906750|gb M-SQKPHLNLIVIGHIDHGKSTLVGRLLMDRGFIDEKTVKEAEEAAKKLGKESEKFAFLL gi|73919278|sp| MAKEKPILNVAFIGHVDAGKSTTVGRLLLDGGAIDPQLIVRLRKEAEEKGKAGFEFAYVM gi|487459962|re ---gi|4503471|ref| DKLKAERERGITIDISLWKFETSKYYVTIIDAPGHRDFIKNMITGTSQADCAVLIVAAGV gi|800906750|gb DRLKEERERGVTINLTFMRFETKKYFFTIIDAPGHRDFVKNMITGASQADAAILVVSAKK gi|73919278|sp| DGLKEERERGVTIDVAHKKFPTAKYEVTIVDCPGHRDFIKNMITGASQADAAVLVV--NV gi|487459962|re ---ETPKYHVTVIDAPGHRDFIKNMITGTSQADCAILIIAGGT * ** .*::*.******:******:****.*:*:: gi|4503471|ref| GEFEAGISKNGQTREHALLAYTLGVKQLIVGVNKMDSTEPPYSQKRYEEIVKEV-STYIK gi|800906750|gb GEYEAGMSVEGQTREHIILAKTMGLDQLIVAVNKMDLTDPPYDEKRYKEIVDQV-SKFMR gi|73919278|sp| DDAKSGIQP--QTREHVFLSRTLGITQLAVAINKMDTVN--FSEADYNEMKKMLGDQLLK gi|487459962|re GEFEAGISKDGQTREHALLAYTLGVKQLIVAVNKMDSVK--WDKNRFEEIIKET-SNFVK .: ::*:. ***** :*: *:*: ** *.:**** .. :.: ::*: . . :: gi|4503471|ref| KIGYNPDTVAFVPISGWNGDNMLEPSANMPWFKGWKVTRKDGNASGTTLLEALDCILPPT gi|800906750|gb SYGFNTNKVRFVPVVAPAGDNITHRSENMKWY---NGPTLEEYLDQLELPP gi|73919278|sp| MVGFNPDNIDFIPVASLLGDNVFKKSENTPWY---NGPTLAQVIDGFQPPE gi|487459962|re KVGYNPKTVPFVPISGWNGDNMIEPSTNCPWYKGWEKETKSGKVTGKTLLEAIDAIEPPT *:*...: *:*: . ***: . * * *: .* ** : :* : *
MEGAの起動
① 左下のスタートをクリック ②下部ウィンドウに
MEGAと入力 ③MEGAのアイコンが出てくる ので、クリックして起動
メニューバーの
Fileを
クリック
前ページのファイル選択ウィンドウを拡大したもの
スクロールバーで表示位置を変更しながら ファイルを探して選択
読み込まれたアラインメント が新しいウィンドウ上で
(1) MEGAを起動してmafftで作成したアラインメントの読み込み
(2) MEGA形式へのデータの変換
(3) モデル選択
アラインメントウィンドウのメニューバーの Utilityをクリック
プルダウンメニューからConvert to MEGA Formatを選択
新しいウィンドウが開いて
ファイルと形式を確認してくる ので、OKをクリック
MEGA形式のデータを保存する
ファイル名を聞いてくるので
* の部分を aaseq2 として
aaseq2.megという名前で保存
変換が正常に終了したことを
示すウィンドウが現れる。
OKをおしてとじる
それまで
Clustal 形式だったアラインメントが
MEGA形式に変換されて表示されている
(1) MEGAを起動してmafftで作成したアラインメントの読み込み (2) MEGA形式へのデータの変換
(3) モデル選択
モデルをクリック
新しく開いたウィンドウから、変換した
MEGA形式のファイルを選択し
新しいウィンドウが開くので、 Protein Sequencesを選択して OKをクリック
モデル選択の確認画面がでてくる
BIC, AIC, lnLがモデル選択の基準
BIC, AICcは小さい程よく、lnLは大きいほど良い。 MEGAではBICでソートされている
(1) MEGAを起動してmafftで作成したアラインメントの読み込み (2) MEGA形式へのデータの変換
(3) モデル選択
上部のPhylogenyをクリック プルダウンメニューから
Construct/Test Maximum Likelihood Tree を選択
現在、activeになっているaaseq2.megについて系統樹をつくるのかを 聞いてくるので、 Yes をクリック
最尤法の計算設定の画面が現れる 黄色の部分が変更可能
① Phylogeny Test Bootstrapを100回 ② Substitution Model LG model ③ Rates and Patterns Has Invariant sites (I) 他はデフォルトで
変更の仕方 変更する項目をクリックすると 右端にボタンが出てくるのでそれを使って変更 Bootstrapの回数の変更 上向き矢印で増加、下向きで減少 今回は 100 になるようにしてください
変更の仕方 変更する項目をクリックすると 右端にボタンが出てくるのでそれを使って変更 Bootstrapの回数の変更 上向き矢印で増加、下向きで減少 今回は 100 になるようにしてください
Substitution modelは、右端をクリックすると 現れるプルダウンメニューの中から選択
設定が完了したら Computeをクリック
時間がかかるので
途中経過を示すウィンドウ が表示される
計算が終了すると
最尤系統樹に
bootstrap support
系統樹を
Newick formatで保存
系統樹のウインドウのメニューバーの
Fileメニューから、Export Current Tree (Newick) を選択
ファイルネームを aaseq2.nwk として、Saveをクリック
((gi|4503471|ref|:0.09656983,gi|487459962|re:0.11764039)1.0000:0.31334860, (gi|800906750|gb:0.36944335,gi|73919278|sp|:0.37953026)1.0000:0.05145874);
系統樹のメニューバーの
Imageをクリック
プルダウンメニューから
先ほど指定したファイル名が残されているので
必要に応じて書き換えて、
Saveをクリック
aaseq2.PDFというファイル名で、系統樹の
画像ファイルが保存される
gi|4503471|ref| gi|487459962|re gi|800906750|gb gi|73919278|sp| 1 0 0 0.1ヒトとクレンアーキオータがクラスタを形成することを 期待して作成したが、古細菌同士がクラスタを形成
今回の系統樹
大腸菌 (外群)
ヒト
クレンアーキオータ ユーリアーキオータ
この解析の問題点 (1) 真核生物、クレンアーキオータ、ユーリアーキオータ、 真正細菌を1種ずつで代表させる。 選択したそれぞれの生物に特化した進化の状況が 反映されてしまう。 ---à もっと種数を増やす (2) Elongation factor 1-alpha/Tuだけしか使っていない 他のタンパク質についても解析するべき
今回のまとめ
アミノ酸にも置換モデルがある
分子系統樹は基本的には無根
(unrooted)
根を導入するには、何らかの根拠から遠い関係に
あると考えられる配列を外群(
outgroup)として
導入する
最尤法の説明については次回
点数 (4) 100-90 (3) 89-80 (2) 79-70 (1) 69-60 達成目標 (3)に加え、 MEGAで最 尤法による 系統樹の 構築ができ る。 (2)に加え、 Newick formatにつ いて説明で きる。 (1)に加え、 ブートスト ラップ法の 計算の手 続きや、そ の計算結 果の解釈に ついて説明 できる。 進化モデル について説 明できる。 特にJC69, K80, TN93 について説 明できる。 またモデル 選択につい て説明でき る。