最尤法とベイズ法 - 春プロ勉強会14.pages

最後に系統解析で良く出てくる最尤法とベイズ法についてその基本を押さえておきましょう．一見難しそうな分野ですが(実際難しいですが...)，その根本的な考え方自体はシンプルです．!

!

条件付き確率!

「Bの時にAが起こる確率」を意味する条件付き確率P(A|B)は以下の式で定義されます．!

右辺は「Bであることを前提としたとき(分母)にAとBが同時に起こる(分子)確率」です．

すなわち「Bのとき，Aが起こる確率」と言い換える事ができます．これは左辺に他なりません．またP(A)は何かしらの限定条件が与えられる前の確率ということで”事前確率”，

P(A|B)はBという情報が与えられた後の確率なので”事後確率”と解釈できます!

!

*ちなみにはcapといって「AとBが同時に起こる」ことを意味する記号です．ピンセットでつまむイメージを持つと覚えやすいでしょう．またはcupといって「AかBのどちらかが起こる」ことを意味する記号です．同じようにコップのなかにAとBを放り込むイメージを持っておくと間違えません．!

!

尤度!

あるデータDが観測されたときに，それを説明するn個のモデル(H1,H2,...,Hn)があったとします．するとそれぞれのモデルHiについて以下のように尤度L(Hi)は定義されます．!

つまり「モデルHiのもとでデータＤが生じる確率が尤度L(Hi)」です．簡単に言えばモデル Hiを与えたときのデータDの”事後確率”ということですね．そして最尤法とは観測データD に対して尤度が最大となるモデルを選択する手法，という事になります．!

!

ベイズの定理!

さて，条件付き確率の式を変形すると，!

になりますが，これはAとBを入れ替えても成立します．すなわち!

ですね．ここで当然!

P (A | B) = P (A B ) P (B )

L(H

) = P (D | H

)

P (A B ) = P (A | B )P (B )

P (B A) = P (B | A)P (A)

なので!

となり，!

を得ます．ここに先程の尤度の式をあてはめていきますと!

となります．この式をよく見ると，まず右辺のP(D | Hi )は先程出てきた尤度ですね．そしてP(Hi)はモデルHiの事前確率，P(D)はデータDの事前確率です．そして左辺P(Hi | D)はDが与えられたときのモデルHiの事後確率，と解釈する事ができます．モデルHiの事前確率は事前に計算できますし，P(D)は既に観測したデータですので定数として扱う事ができます．つまりモデルHiと尤度をかけるとHiの事後確率が求まるという事ですね．この式こそがかの有名な「ベイズの定理」です．!

!

そして，さらに変形しますとまずP(D)について!

ですので，!

と変形できます．こうすると事後確率は事前確率と尤度から求める事が可能である事がはっきりと分かりますね． 

P (B A) = P (A B )

P (A | B )P (B) = P (B | A)P (A)

P (A | B) = P (B | A)P (A) P (B )

P (H

| D) = P (D | H

)P (H

) P (D)

P (D) = P ((D H

₁

) (D H

₂

) · · · (D H

))

=

i=1

P (D H

)

=

i=1

P (D | H

)P (H

)

P (H

| D) = P (D | H

)P (H

)

i=1

P (D | H

)P (H

)

最尤法とベイズ法の違い!

!

系統解析においては!

!

・最尤法: 最大の尤度P(D | Hi)を持つ系統樹を探索することが目標．!

・ベイズ法: 事後確率P(Hi | D)を最大化する系統樹を探索することが目標!

!

ということで「尤度を含む関数を最大化することで適当な系統樹を選択する手法」であるという点で類似した最尤法とベイズ法ですが，その裏には実は頻度主義とベイズ主義の教義のぶつかり合いを反映した考え方の著しい違い，対立があります．その顕著な例としては事前確率の扱い方が挙げられるでしょう．!

!

例えば，データが何もない状態では各々の系統樹の生じる確率については何も言えないので事前確率Ｐ(Hi)には等確率をおくのが「従来の考え方では普通」です．例えばコイン投げ試行を想像してください．この試行をまだ一度も行っていない段階では，我々はコインは「フェア」であると仮定し，表と裏の割合は1:1になるだろうという”等確率”を前提とした予測をします．このような流儀で事後確率について考えますと当然!

の右辺のP(Hi)/P(D)は定数となりますので，最尤法とベイズ法の結果は等しくなります．

しかし「事前確率として等確率ではない確率分布を設定してもいいじゃない？」というのがベイズ法の考え方なので，こういった観測データが無いようなケースでもベイズ法では事前確率に異なる分布を仮定することがあります．その時，最尤法とベイズ法で結果の乖離が生じるのです．!

!

つまり，最尤法は”頻度主義”を背景とした手法ですのでこのような事前確率が未知の場合では等確率を事前確率として仮定するのですが，ベイズ法はベイズ主義を背景にしているので事前確率として「主観的確率」を導入する事を許容するのです．「主観的確率」はより多くの情報を生かした結論を導く事ができるため非常に有用なのですが，その一方で系統推定に作成者の主観的な意見が入り込む危険性を生じます．!

!

どちらの手法が良いかという議論に結論は未だに出ていませんし，また原理的に決着はつかないのかもしれません．我々としてはこの議論の行く末を注意深く見守りつつ，今後系統樹に出くわしたときには，それがどのような思想のもと作成されたのか？ということにまず気をつけて見ていくとよいのではないでしょうか． 

P (H

| D) = P (D | H

)P (H

)

P (D)

5.1 分子進化

古来から進化の研究と言えば化石(あるいは現存する生物の形態比較)しか手がかりはありませんでした．しかし分子生物学が進展しDNA情報を元に進化解析を行う事ができるようになり進化学は飛躍的に進展しています．DNAを進化解析に使用する利点としては以下の三点が挙げられるでしょう．!

!

a. 全生物が共通して持つ物質である (例えば骨は全生物の”共通項”ではない)!

b. DNAの変化には一定のルールがある (形態は多様性に”富みすぎて”いる)!

c. DNAは圧倒的に情報量が多い (長さnのDNAが持つ情報は4ⁿ)!

!

進化の要因は”突然変異”と”選択”です．塩基置換，in/del，組み替え，遺伝子変換などで突然変異を起こした遺伝子が遺伝的浮動(←中立説)や自然選択で集団内に広がり，最終的に種の中に固定されることの繰り返しで漸進的に進化は進みます．この漸進性が現在の生物種の情報から祖先の情報へ”辿っていく”ことを可能にするのです．さらにその”道のり”には時間的な情報も付加する事ができます．それが分子時計というものです．!

!

分子時計: DNAやタンパク質の置換数から推定された相対的な進化時間!

!

ただし，ここで注意しなくてはいけない点があります．それはその進化速度は”決して不変ではない”ということです．例えばポリメラーゼの校正精度の違いや，サイトによる選択圧の違いなどは速度を変える原因になり得ます．系統解析においてはこのような進化速度の変化に常に留意する必要があります．!

ドキュメント内春プロ勉強会14.pages (ページ 74-77)