• 検索結果がありません。

Treefinder による仮説検定

ドキュメント内 分子系統学演習 (ページ 101-104)

第 7 章 仮説検定 91

7.2 Treefinder による仮説検定

• ResolveMultifurcations->True,の行を追加する

• 出力ファイル名を適宜変更する

ただし、樹形制約を課した樹形探索ではなく、樹形を完全に固定しての尤度最大化を行う場合は2つ目は必要 ありません。ファイルが用意できたら、TreefinderのKernelメニューにあるLoad TL Script ...からこの ファイルを開くことで内容が実行されます。

制約付きlikelihood ratchetを行うには、pgtfratchetの下記の質問の際に制約系統樹ファイルの名前を与え

てやればいいだけです。

If you want to give topological constraint, specify an input file name.

Otherwise, just press enter.

pgtfratchetで初期系統樹作成をTNTにさせる場合、ファイル7.3のような制約を課そうとするとうまく いかないことがあります。これは、TNTでは必ず外群を指定する必要があり、外群を正の制約内に含めること ができないという制限があるためです。pgtfratchetは制約樹形の先頭にあるOTUを外群とするためTaxonA が外群になりますが、TaxonAを含む正の制約を課そうとしているのでうまくいかないわけです。制約樹形の先 頭にあるOTUを外群とするのですから、以下のように記述すれば問題無く動作するはずです。

ファイルの内容7.5 樹形制約を指定する系統樹ファイル 1 ( TaxonD , TaxonE ,(( TaxonA , TaxonB ), TaxonC ));

これでも制約の内容は全く同じですが、TaxonDが外群として使われるため問題が起きません。ファイル7.2

の制約はTaxonAとTaxonBの単系統性制約と考えるとうまくいかないように思えますが、TaxonCとTaxonD

とTaxonEの単系統性制約として自動的に変換されるので問題無いはずです。ただし、この変換は外群となる先

頭OTUを含む制約を消すことで実現しているため、注意しないと意図していない制約へと変えられてしまう可 能性があるので十分注意して下さい。

7.2 Treefinder による仮説検定

複数の系統仮説を比較したいとき、それぞれの仮説を制約として課した最尤系統推定によって得られた制約下 の最尤系統樹を比較してやることで、どの仮説が他の仮説より良いか、それは有意な違いかを調べることができ ます。また、特定の単系統性を検証したいときは、その単系統性の制約下の最尤系統樹と、その単系統性とは矛 盾する仮説、即ち負の制約下の最尤系統樹とを比較してやればよいでしょう。ここではブートストラップリサン プリングを応用した検定法と、モンテカルロシミュレーションを応用したパラメトリックブートストラップ検定 の実行方法について説明します。

94 第7章 仮説検定

7.2.1 KH ・ SH ・ AU 検定

ブートストラップリサンプリングによって、複数の系統樹間で尤度の差が有意と言えるのか否かを調べる方 法がKishino-Hasegawa検定(KH test)です(Kishino and Hasegawa, 1989)。しかし、この方法では3つ以上の系 統樹を比較する場合に多重検定となってしまい第1種の過誤(有意な差は無いのに誤検出する)が増大してしま うため、その抑制を行う補正を加えたのがShimodaira-Hasegawa検定(SH test)です(Shimodaira and Hasegawa,

1999)。ただし、この方法では逆に第2種の過誤(有意な差があるのに検出できない)が増大してしまいます。そ

こで、近似的に不偏な検定(approximately unbiased [AU] test)は、マルチスケールブートストラップ法を用いて さらに高度な補正を行うことでこれをある程度解決しています(Shimodaira, 2002)。

Treefinderでこれらの検定を行うには、あらかじめ比較する系統樹・尤度・分子進化モデルを最尤法で推定し

ておきます。これまでの説明の通りに解析を行っていれば、.logというファイルができているはずです。それ ぞれの系統樹の.logファイルが用意できているなら、それを結合します。

.logファイル(TreefinderではReport Fileと呼んでいる)を結合するには、TreefinderのUtilitiesメニュー にあるJoin Report Files ...を用います。結合元のファイルと結合後の出力ファイルを1つ1つ指定して OKを押せば結合したReport Fileが作成されます。また、Phylogears2にもpgtfjoinlogというコマンドがあ り、これを用いて同様のことができます。コマンドプロンプトやターミナルで以下のように用います。入力ファ イルは3つ以上指定することもできます。

pgtfjoinlog input_file1 input_file2 output_file

結合したReport Fileの用意ができたら、AnalysisメニューのTest Hypotheses ...からダイアログを呼 び出します。Sequence FileにはReport Fileの系統推定に用いたデータファイル(ここまでの説明通りなら partition xxx.tf)を指定し、Hypothesis Fileに先ほど作成したReport Fileを指定します。# Replicates (ブートストラップリサンプリングの反復数)を適当な値(AU検定を使うなら10万以上)に、Criterionを

Likelihoodに設定してOKを押すことで計算が開始されます。しばらく待って計算が終わると、結果が画面に

表示されます。この結果は、FileメニューのExport Tree ...からReport Fileとして、SaveからPostScript 画像として保存できます。結果は、Report Fileにある系統樹ごとに検定結果が表示されます。KHやSH検定の p値が1になっているのが最尤系統樹で、最尤系統樹のp値には意味がありません。画面下部の

のボタンを押

すと別の系統樹の結果が出ますので、最尤でない系統樹の結果を見て下さい。

7.2 Treefinderによる仮説検定 95

7.2.2 パラメトリックブートストラップ検定

パラメトリックブートストラップ検定(parametric bootstrap test)とは、帰無仮説に基づいたモンテカルロシ ミュレーションによって生成したデータに帰無仮説と対立仮説を当てはめて尤度最大化し、その尤度比の分布に 対して元データにおける尤度比がどうなるかを検討することで帰無仮説を棄却する(または棄却しない)検定法 です。つまり、「帰無仮説が正しい」という仮定の下で生成したデータでの尤度比よりも元データでの尤度比が 有意に大きいなら、それは「帰無仮説が正しい」という仮定が間違っていると考えられるので、帰無仮説を棄却 できるということです。

この方法の特長は、系統推定法そのものに内在する問題を検出可能であるという点にあります。本当は帰無仮 説とされた方が正しいにもかかわらず、系統推定法に問題があるせいで対立仮説がより尤度が高くなってしまう のなら、帰無仮説の下で生成したデータにおける尤度比は元データにおける尤度比と大きく変わらないはずで す。そのため、系統推定法に問題があるのなら帰無仮説を棄却できなくなります。前述のKH・SH・AU検定で はこのような能力は全くありません。ただし、帰無仮説が棄却できたからといって、推定方法に問題は無いと言 い切れるわけではありません。

Treefinderでパラメトリックブートストラップ検定を行うには、前述の検定と同様にReport Fileが必要で

す。ただし、結合する必要はありません。Report Fileが用意できたら、AnalysisメニューのParametric Bootstrap Test ...からダイアログを呼び出します。表示されるダイアログで、H0に帰無仮説となる=デー タ生成に用いられるReport Fileを、H1に対立仮説のReport Fileを指定します。# Replicates(反復数)を適 当な値に、CriterionをLikelihoodに設定してOKを押します。しばらくして計算が終わると、結果が表示さ れます。計算にはかなりの時間を要します。Treefinderの現行バージョンでは、帰無仮説が対立仮説より有意に 劣るのはp値が0.95以上のときです。帰無仮説が棄却できないなら、系統推定の方法に問題があるか、2つの 系統仮説間に有意な差があるとは言えないと考えられます。

推定方法に問題が無ければ(あってもこの検定で検出できるような問題でなければ)、この検定では2つの仮 説がよほど僅差でない限り、ほとんどの場合で帰無仮説は棄却されます。KH・SH・AU検定の結果とこの検定 の結果が一致する場合には何も悩む必要はありませんが、矛盾する場合には少し解釈を考える必要があります。

KH・SH・AU検定で棄却された仮説がこの検定で棄却できない場合は、2つの仮説間に有意な差があるものの 系統推定法に問題があるため確実とは言えない、と考えるべきでしょう。KH・SH・AU検定で棄却できなかっ た仮説がこの検定で棄却された場合の解釈方法に関してはおそらく幅広いコンセンサスが得られていないと思い ますが、筆者個人としては、系統推定法に問題は(おそらく)無いが仮説間の尤度の差は有意ではない、とするの が安全だろうと考えています。

96 第7章 仮説検定

ドキュメント内 分子系統学演習 (ページ 101-104)