• 検索結果がありません。

分子系統解析における様々な問題について 田辺晶史

N/A
N/A
Protected

Academic year: 2021

シェア "分子系統解析における様々な問題について 田辺晶史"

Copied!
52
0
0

読み込み中.... (全文を見る)

全文

(1)

分子系統解析における

様々な問題について

(2)
(3)
(4)

そもそもどこの配列を使うべき

?

(5)

そもそもどこの配列を使うべき

?

● 置換が早すぎず遅すぎない(=多すぎず少なすぎない)

(6)

そもそもどこの配列を使うべき

?

● 置換が早すぎず遅すぎない(=多すぎず少なすぎない) ● 連続長は長い方が良い

(7)
(8)

で、そういう領域をどうやって探す

?

(9)

で、そういう領域をどうやって探す

?

● 外群種と内群種のゲノム・トランスクリプトームがある場合

(10)

で、そういう領域をどうやって探す

?

● 外群種と内群種のゲノム・トランスクリプトームがある場合

● BLASTで類似箇所を探す

● 類似度が高く、アライメント長が長く、そういうのが1件だけ

(11)

で、そういう領域をどうやって探す

?

● 外群種と内群種のゲノム・トランスクリプトームがある場合 ● BLASTで類似箇所を探す ● 類似度が高く、アライメント長が長く、そういうのが1件だけ のものを採用 ● PhyloMarkerというソフトが自動的にやってくれる

(12)

で、そういう領域をどうやって探す

?

● 外群種と内群種のゲノム・トランスクリプトームがある場合 ● BLASTで類似箇所を探す ● 類似度が高く、アライメント長が長く、そういうのが1件だけ のものを採用 ● PhyloMarkerというソフトが自動的にやってくれる ● ゲノム・トランスクリプトームがない場合

(13)

で、そういう領域をどうやって探す

?

● 外群種と内群種のゲノム・トランスクリプトームがある場合 ● BLASTで類似箇所を探す ● 類似度が高く、アライメント長が長く、そういうのが1件だけ のものを採用 ● PhyloMarkerというソフトが自動的にやってくれる ● ゲノム・トランスクリプトームがない場合 ● 全ゲノム解読する

(14)

で、そういう領域をどうやって探す

?

● 外群種と内群種のゲノム・トランスクリプトームがある場合 ● BLASTで類似箇所を探す ● 類似度が高く、アライメント長が長く、そういうのが1件だけ のものを採用 ● PhyloMarkerというソフトが自動的にやってくれる ● ゲノム・トランスクリプトームがない場合 ● 全ゲノム解読する ● トランスクリプトーム解析を行う

(15)
(16)

多遺伝子座連結解析の問題

● パラログ混入や浸透交雑、水平伝播、incomplete lineage

(17)

多遺伝子座連結解析の問題

● パラログ混入や浸透交雑、水平伝播、incomplete lineage

sortingで、遺伝子座間で支持する系統樹が異なる

(18)

多遺伝子座連結解析の問題

● パラログ混入や浸透交雑、水平伝播、incomplete lineage

sortingで、遺伝子座間で支持する系統樹が異なる

● 連結解析のブートストラップ値悪化やアーティファクトの原因

(19)
(20)

遺伝子座の選別方法

● 連結データの最尤系統樹を各遺伝子座配列で各遺伝子座の最尤

(21)

遺伝子座の選別方法

● 連結データの最尤系統樹を各遺伝子座配列で各遺伝子座の最尤

系統樹と比較し、棄却してしまう遺伝子座を除去

(22)
(23)

タクソンサンプリング法

(24)

タクソンサンプリング法

● 全種サンプリングは必ずしも良くない

(25)

タクソンサンプリング法

● 全種サンプリングは必ずしも良くない

● 系統樹上の分岐点・端点の密度ができるだけ偏らない方が良い

(26)
(27)

パーティションの切り方

(28)

パーティションの切り方

● Kakusan4は以下を比較して選択

● 遺伝子座間・コドン位置間全部切る

● 遺伝子座間全部切る・コドン位置間全部切らない ● 遺伝子座間・コドン位置間全部切らない

(29)

パーティションの切り方

● Kakusan4は以下を比較して選択 ● 遺伝子座間・コドン位置間全部切る ● 遺伝子座間全部切る・コドン位置間全部切らない ● 遺伝子座間・コドン位置間全部切らない ● もっと柔軟にな切り方があるのでは?

(30)

パーティションの切り方

● Kakusan4は以下を比較して選択 ● 遺伝子座間・コドン位置間全部切る ● 遺伝子座間全部切る・コドン位置間全部切らない ● 遺伝子座間・コドン位置間全部切らない ● もっと柔軟にな切り方があるのでは? ● PartitionFinderで探索可能

(31)
(32)

χ

2

検定で組成の均一性が棄却されたら

(33)

χ

2

検定で組成の均一性が棄却されたら

● 塩基配列ではACGTをAGYやRYに変換する

(34)

χ

2

検定で組成の均一性が棄却されたら

● 塩基配列ではACGTをAGYやRYに変換する

● アミノ酸配列はDayhoff coding法+GTR20モデルなどを使う

(35)

例:塩基配列の第

3コドン位置だけRYコード化

pgrecodeseq \ --type=DNA \ 3-.\3 \ GT-AC \ inputfile \ outputfile …コマンド名 …入力配列はDNA …3つめから最後まで3つおきに処理 …GをAに、TをCに置換 …入力ファイル名 …出力ファイル名 下記のコマンドを入力してEnter 「\」は「次の行に改行なしで続く」という意味であることに注意 ただしスペースは入れること

(36)

例:

χ

2

検定で不均質解消を確認

pgtestcomposition \ --type=DNA \ 3-.\3 \ inputfile \ outputfile …コマンド名 …入力配列はDNA …3つめから最後まで3つおきに処理 …入力ファイル名 …出力ファイル名 下記のコマンドを入力してEnter

(37)

例:アミノ酸配列を

Dayhoffコード化

pgrecodeseq \ --type=AA \ STGPNEQKHVILYW-AAAADDDRRMMMFF \ inputfile \ outputfile …コマンド名 …入力配列はアミノ酸 …入力ファイル名 …出力ファイル名 下記のコマンドを入力してEnter 「\」は「次の行に改行なしで続く」という意味であることに注意 ただしスペースは入れること

(38)

χ

2

検定で組成の均一性が棄却されたら

● 塩基配列ではACGTをAGYやRYに変換する

● アミノ酸配列はDayhoff coding法+GTR20モデルなどを使う

● 形質状態のいくつかを統合することで無理矢理均一に

(39)

χ

2

検定で組成の均一性が棄却されたら

● 塩基配列ではACGTをAGYやRYに変換する ● アミノ酸配列はDayhoff coding法+GTR20モデルなどを使う ● 形質状態のいくつかを統合することで無理矢理均一に ● nhPhyloBayesで系統樹上での組成変化を許す ● より適しているがLinux上でしか動かない

(40)
(41)

データのギャップ情報を使いたいとき

● トリミング前の配列から、simple indel coding法でギャップの

(42)

データのギャップ情報を使いたいとき

● トリミング前の配列から、simple indel coding法でギャップの

有無を01に符号化

(43)

例:

simple indel coding法でギャップ情報を01データ化

pgencodegap \ --method=SIC \ inputfile \ outputfile …コマンド名 …符号化法はSIC …入力ファイル名 …出力ファイル名 注:入力ファイル形式はNEXUSのみに対応 下記のコマンドを入力してEnter 「\」は「次の行に改行なしで続く」という意味であることに注意 ただしスペースは入れること

(44)

例:ギャップの

01データを塩基配列と連結

pgconcatgap \ --output=MrBayes \ DNAseqfile \ binarydatafile …コマンド名 …MrBayes向けの出力を行う …塩基配列ファイル名 …01データファイル名 下記のコマンドを入力してEnter

(45)
(46)

系統樹推定の勘所

(47)

系統樹推定の勘所

● データの質

重要度高

(48)

系統樹推定の勘所

● データの質 ● 多重整列とトリミング ● 遺伝子座サンプリング ● タクソンサンプリング ● 不適な部分の除去

重要度高

(49)

系統樹推定の勘所

● データの質 ● 多重整列とトリミング ● 遺伝子座サンプリング ● タクソンサンプリング ● 不適な部分の除去 ● 樹形探索範囲の広さ(NNI・SPR・TBR・多点探索)

重要度高

重要度低

(50)

系統樹推定の勘所

● データの質 ● 多重整列とトリミング ● 遺伝子座サンプリング ● タクソンサンプリング ● 不適な部分の除去 ● 樹形探索範囲の広さ(NNI・SPR・TBR・多点探索) ● パーティションの切り方

重要度高

(51)

系統樹推定の勘所

● データの質 ● 多重整列とトリミング ● 遺伝子座サンプリング ● タクソンサンプリング ● 不適な部分の除去 ● 樹形探索範囲の広さ(NNI・SPR・TBR・多点探索) ● パーティションの切り方 ● パーティション間モデル(等速度・比例・分離)

重要度高

重要度低

(52)

系統樹推定の勘所

● データの質 ● 多重整列とトリミング ● 遺伝子座サンプリング ● タクソンサンプリング ● 不適な部分の除去 ● 樹形探索範囲の広さ(NNI・SPR・TBR・多点探索) ● パーティションの切り方 ● パーティション間モデル(等速度・比例・分離)

重要度高

参照

関連したドキュメント

振動流中および一様 流中に没水 した小口径の直立 円柱周辺の3次 元流体場 に関する数値解析 を行った.円 柱高 さの違いに よる流況および底面せん断力

テキストマイニング は,大量の構 造化されていないテキスト情報を様々な観点から

婚・子育て世代が将来にわたる展望を描ける 環境をつくる」、「多様化する子育て家庭の

研究計画書(様式 2)の項目 27~29 の内容に沿って、個人情報や提供されたデータの「①利用 目的」

区分 項目 内容 公開方法等 公開情報 地内基幹送電線に関する情報

シートの入力方法について シート内の【入力例】に基づいて以下の項目について、入力してください。 ・住宅の名称 ・住宅の所在地

雇用契約としての扱い等の検討が行われている︒しかしながらこれらの尽力によっても︑婚姻制度上の難点や人格的

一般法理学の分野ほどイングランドの学問的貢献がわずか