• 検索結果がありません。

マルチプルアライメント

ドキュメント内 春プロ勉強会14.pages (ページ 77-88)

!

5.1 分子進化 

  古来から進化の研究と言えば化石(あるいは現存する生物の形態比較)しか手がかりはあ りませんでした.しかし分子生物学が進展しDNA情報を元に進化解析を行う事ができるよ うになり進化学は飛躍的に進展しています.DNAを進化解析に使用する利点としては以下 の三点が挙げられるでしょう.!

!

 a. 全生物が共通して持つ物質である (例えば骨は全生物の”共通項”ではない)!

 b. DNAの変化には一定のルールがある (形態は多様性に”富みすぎて”いる)!

 c. DNAは圧倒的に情報量が多い (長さnのDNAが持つ情報は4n)!

!

進化の要因は”突然変異”と”選択”です.塩基置換,in/del,組み替え,遺伝子変換などで突 然変異を起こした遺伝子が遺伝的浮動(←中立説)や自然選択で集団内に広がり,最終的に 種の中に固定されることの繰り返しで漸進的に進化は進みます.この漸進性が現在の生物 種の情報から祖先の情報へ”辿っていく”ことを可能にするのです.さらにその”道のり”には 時間的な情報も付加する事ができます.それが分子時計というものです.!

!

  分子時計: DNAやタンパク質の置換数から推定された相対的な進化時間!

!

ただし,ここで注意しなくてはいけない点があります.それはその進化速度は”決して不変 ではない”ということです.例えばポリメラーゼの校正精度の違いや,サイトによる選択圧 の違いなどは速度を変える原因になり得ます.系統解析においてはこのような進化速度の 変化に常に留意する必要があります.!

5.3 系統樹.進化モデル 

 系統樹を巡っては独特な用語が多用されているのですが,そこを正確に理解しておかな いと結果の解釈を誤る原因となってしまいます.そこで以下に重要と思われる概念を列挙 し,各単語について特にその違いを強調した定義をしてみました.!

!

有根系統樹,無根系藤樹!

  系統樹はあくまでも要素間の兄弟関係を推測するものですので,そこから必ずしも”親 子関係”すなわち”祖先”が推測できるとは限りません.例えばNJ法は根っこのない系統 樹,すなわち無根系統樹を構築する手法ですので,その系統樹から”祖先”を推測するには 系統樹全体から遠くはなれた”アウトグループ(外群)”と呼ばれる要素を用意して,祖先とな る 節 点 を”つ り 上 げ る”よ う に して 系 統 樹 を 再 構 築 し な く て は い け ま せ ん . あ る い

は”internal outgroup”,すなわち系統樹内部の要素の中から無理矢理アウトグループを作り

出す事で祖先を推測することもできますが,その手法は暗に”循環論法”を含んでおり,適 用には十分注意しなくてはいけません.!

!

 有根系統樹: 祖先が明示された系統樹!

 無根系統樹: 祖先-子孫関係を明示しない系統樹!

!

二分岐型,多分岐型!

  節点からいくつの子葉が派生するかで二分岐型と多分岐型に分類されます.ミクロな視 点では新たな遺伝子は祖先遺伝子から一つずつ分岐して派生したと考えられますので理屈 として二分岐型系統樹が正しいと言えるかもしれません.しかしネットワーク系統樹など に代表されるように,水平伝播やドメインシャッフリング,あるいは収斂進化などを系統 樹に反映すべきであるとの考え方もあり,その場合は一つの節点から3つ以上の子葉が派 生する多分岐型系統樹(あるいはループを含む系統樹やネットワーク型系統樹),が構築さ れます.!

!

 二分岐型: 節点における子葉への分岐が必ず二つ以下になっている系統樹!  多分岐型: 三つ以上の子葉への分岐節点を含む系統樹!

!

単系統群,側系統群,多系統群!

  系統樹における”祖先”と”子孫”の関係について”単系統群”という考え方があります.これ は”ある祖先とそこから派生した全ての子孫全体の集合”と定義される系統群だと考えてく ださい.そしてさらにそこから派生する形で”側系統群”と”多系統群”が定義されます.どち らも”単系統群”からいくつかの要素を取り去った部分集合,という点では同じ概念なので すが,取り除いたときに系統樹が分断されるかされないか,で異なります.系統樹を分断 しないように(ある節点から先,子孫の方向は全部の要素取り除くイメージ)カットしてで きたものが側系統群で,系統樹が分断するよう(系統樹の中心を中抜きしてしまうイメー ジ)にカットしてできたものが多系統群です.まとめると以下のような感じです.!

!

 単系統群: 祖先とその子孫を全て含む種の集合!

 側系統群: 系統樹が分断されないように単系統からいくつかの系統群を除いたもの!  多系統群: 系統樹を分断するように単系統からいくつかの系統群を除いたもの!

!

遺伝子系統樹,種系統樹!

  系統樹は遺伝子単位で描いたものと,種単位で描いたものに大別できるでしょう.さら に遺伝子のなかでもドメインのようにさらに部分的な配列で系統樹を描いたり,あるいは 複数の遺伝子の集合を比較して系統樹を描く事もありますが,これらはまとめて遺伝子系 統樹と捉えることができます.その逆は種系統樹でしょう.古くは形態情報や化石などか ら構築していたものですが,最近では16S/18S rRNA,あるいはミトコンドリアゲノムと いった分子生物学的な情報に基づいた種系統樹が多く構築されています.!

!

 遺伝子系統樹: 遺伝子単位での系統樹!  種系統樹: 種単位での系統樹!

!

ホモロジー,ホモプラシー!

  どちらも類似関係を意味する言葉ですが,ホモロジーは共通祖先がある類似形質,ホモ プラシーは共通祖先をもたない類似形質という対極の概念になっています.また,よく誤 用されるのですが,”ホモロジーが高い”という言い方は完全に間違っています.これは例 えば”貴乃花と若乃花は血縁関係が高い”とか言うようなものです.ホモロジーはあくまで” 有るか無いか”で語られるべき概念です.!

!

 ホモロジー: 共通祖先に由来する類似形質.e.g. 16S rRNA,Hox遺伝子など!  ホモプラシー: 共通祖先に由来しない類似形質.e.g. コウモリ翼と鳥の翼!

!

オーソログ,パラログ!

  ホモログには二種類あります.まずオーソログは種分化により発生したホモログです.

簡単には”異生物種間でのホモログ”ということになります.一方でパラログは遺伝子重複 によって発生したホモログです.これは”同一種内でのホモログ”ということになります.

ただ,当然パラログ遺伝子が種分化でオーソログになることも多々あり,その場合はオー ソログ,パラログの概念は複雑に入り交じります.文脈で注意深く使い分けましょう.!

!

 オーソログ: 種分化により派生した遺伝子!  パラログ: 遺伝子重複により派生した遺伝子!

! !

塩基置換のモデル!

・転移と転換!

 ヌクレオチドの置換は転移と転換の二種類があります.以下の図で示される通り転移(α) はピリミジンあるいはプリン同士の置換(a t,c g),転換(β)はそれ以外の置換です.転 移と転換は起こりやすさが違います.従って”突然変異”も均等に発生するのではないた め,進化的にその変異が蓄積してくるとある偏りを示す事になります.それを反映したも のが進化モデルで,進化系統樹と進化モデルの尤度を計測する事で進化系統樹の検証を行 う事ができます.!

!

・進化モデル!

 これまでに非常にたくさんの進化モデルが提案されてきています.以下に代表的で重要 な進化モデルを列挙しておきます.!

!

 (A) Jukes-Cantorモデル!

最もシンプルな塩基置換モデルです.すなわちどの塩基間の置換速度も同一の確率で 起こると仮定したモデルとなっています.!

!

 (B) 木村の2変数法!

転移と転換で速度が異なると仮定したモデルです.つまりJukes-Cantorモデルが一変 数のみを使っているのに対して,このモデルでは二変数を使っています.!

!

 (C) 田村-根井モデル!

様々な撹乱要因を除外してJukes-Cantorモデルに (平衡に達していると仮定した) 塩 基頻度を掛けたモデルを均等インプットモデルと言いますが,さらにそこに木村の2 変数法を導入したモデルです.!

!

 (D) 無制限モデル!

全ての塩基間の置換速度が異なると仮定したモデルです.!

!

Fig.25-ヌクレオチド置換における転置(α)と転換(β)の違い.

! !

アミノ酸置換のモデル!

 塩基配列と同様にアミノ酸の置換モデルも立てる事ができます.代表的なものはPAMと BLOSUMでしょう.以下に最も良く使われる置換行列であるBLOSUM62を示しておき ます.似た性質のアミノ酸同士の置換スコアが実際高くなっている事を確認しましょう. 

!

   

   5.4 系統樹の作成法 

A T C G A T C G

(A) Jukes-Cantorモデル (C) 田村-根井モデル

A - α α α A - βg βg αg

T α - α α T βg - αg βg

C α α - α C βg αg - βg

G α α α - G αg βg βg

-(B) 木村の2変数法 (D) 無制限モデル

A - β β α A - a a a

T β - α β T a - a a

C β α - β C a a - a

G α β β - G a a a

-A R N D C Q E G H I L K M F P S T W Y V B Z

A 4 -1 -2 -2 0 -1 -1 0 -2 -1 -1 -1 -1 -2 -1 1 0 -3 -2 0 -2 -1 R -1 5 0 -2 -3 1 0 -2 0 -3 -2 2 -1 -3 -2 -1 -1 -3 -2 -3 -1 0 N -2 0 6 1 -3 0 0 0 1 -3 -3 0 -2 -3 -2 1 0 -4 -2 -3 3 0 D -2 -2 1 6 -3 0 2 -1 -1 -3 -4 -1 -3 -3 -1 0 -1 -4 -3 -3 4 1 C 0 -3 -3 -3 9 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1 -3 -3 Q -1 1 0 0 -3 5 2 -2 0 -3 -2 1 0 -3 -1 0 -1 -2 -1 -2 0 3 E -1 0 0 2 -4 2 5 -2 0 -3 -3 1 -2 -3 -1 0 -1 -3 -2 -2 1 4 G 0 -2 0 -1 -3 -2 -2 6 -2 -4 -4 -2 -3 -3 -2 0 -2 -2 -3 -3 -1 -2 H -2 0 1 -1 -3 0 0 -2 8 -3 -3 -1 -2 -1 -2 -1 -2 -2 2 -3 0 0 I -1 -3 -3 -3 -1 -3 -3 -4 -3 4 2 -3 1 0 -3 -2 -1 -3 -1 3 -3 -3 L -1 -2 -3 -4 -1 -2 -3 -4 -3 2 4 -2 2 0 -3 -2 -1 -2 -1 1 -4 -3 K -1 2 0 -1 -3 1 1 -2 -1 -3 -2 5 -1 -3 -1 0 -1 -3 -2 -2 0 1 M -1 -1 -2 -3 -1 0 -2 -3 -2 1 2 -1 5 0 -2 -1 -1 -1 -1 1 -3 -1 F -2 -3 -3 -3 -2 -3 -3 -3 -1 0 0 -3 0 6 -4 -2 -2 1 3 -1 -3 -3 P -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4 7 -1 -1 -4 -3 -2 -2 -1 S 1 -1 1 0 -1 0 0 0 -1 -2 -2 0 -1 -2 -1 4 1 -3 -2 -2 0 0 T 0 -1 0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1 1 5 -2 -2 0 -1 -1 W -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1 1 -4 -3 -2 11 2 -3 -4 -3 Y -2 -2 -2 -3 -2 -1 -2 -3 2 -1 -1 -2 -1 3 -3 -2 -2 2 7 -1 -3 -2 V 0 -3 -3 -3 -1 -2 -2 -3 -3 3 1 -2 1 -1 -2 -2 0 -3 -1 4 -3 -2 B -2 -1 3 4 -3 0 1 -1 0 -3 -4 0 -3 -3 -2 0 -1 -4 -3 -3 4 1 Z -1 0 0 1 -3 3 4 -2 0 -3 -3 1 -1 -3 -1 0 -1 -3 -2 -2 1 4

Tab.3-BLOSUM62.

Tab.2-代表的な塩基置換モデル.αβは置換確率.giは塩基頻度 (Nei et al., 2006から引用,改変)

!

a.距離法!

・UPGMA (Unweighted pair group method using arithmetic averages)!

各配列間の距離からボトムアップにクラスタリングして系統樹を構成する方法です.枝長 が最短になっているかどうかが系統樹の妥当性の評価基準となります.!

!

[アルゴリズム]!

 初期化:一つの配列のみから成るクラスターを配列の数だけ作る.!

 反復 :距離が最小となるクラスタのペアを求め,新しいクラスタとして統合!  終了 :クラスタが2個だけとなったら,根を配置して終了.!

!

[正当性]!

 ウルトラメトリック (分子時計が一定の速度)ならば正当な系統樹を与えられます.!

!

[欠点]!

  進化速度がLUCAから今に至るまで常に一定であるとの仮定は非現実的.今はそのまま

UPGMAを適用するのではなく,各節点に重み付けして進化速度の変化を反映するような

修正を施すのが一般的です.!

!

・NJ法 (Neighbor joining method,近隣結合法)!

  加法性 (任意の葉の間の距離が葉を結ぶパス上の枝長の和に等しいこと)が成り立つこと を前提として,距離が最小となる葉のペアを順にくくりだす事で系統樹を構成します.非 常に高速なアルゴリズムで,かつ多くの場合妥当な系統樹を与えるため,最も広く使用さ れている手法の一つです.ちなみに日本人の斎藤-根井らが開発した手法です!

!

[アルゴリズム]!

 初期化:Lを葉集合とする.!

 反復 :Lの中から距離が最小となるペアを選びくくりだす!  終了 :Lが葉2つだけになったら間に枝をはる.!

!

[正当性]!

 加法性が保証されるならば正当な系統樹が得られます.!

!

[欠点]!

  妥当性を検証する手段が事実上ない(加法性が成り立つなら正当な系統樹を与える事は 証明されているが,加法性が果たして本当に成立しているかを検証するのは困難).また根 の位置が同定できないことも欠点の一つでしょう.アウトグループを追加することで根の 位置を同定することが良く行われているが,この操作にはどうしても”恣意性”が入ってし まうため適用には注意が必要です.!

!

ドキュメント内 春プロ勉強会14.pages (ページ 77-88)

関連したドキュメント