アクチンは 4 つ のドメインから
H- InvDB: ヒト遺伝子アノテーション統合データベース
ヒトゲノムのアノテー ション(注釈付け)がま とまっています。
“actin muscle” で検索 し、 HIT000035891 を クリック
2D&3D Structure をク リック
GTOP をクリック
このリンクはH-InvDB用の GTOPのリンクです。
C. Yamasaki et al., Gene 364, 99-107 (2005), “Investigation of protein functions through data-mining on integrated human transcriptome database, H-Invitational database (H-InvDB) ”
GTOP : Genomes TO Protein structures and functions
本家: [URL] http://spock.genes.nig.ac.jp/~genome/
先程、皆さんが実行したのと同じ(リガンドはなしですが)、
E-value<0.001でホモロジーモデリングした構造が表示さ
れます。 立体構造予測だけでは
なく、機能予測やいくつ かの解析がまとめられ ています。
それも446生物種全て のゲノムに対して解析 したまとめです。
T. Kawabata, K. Nishikawa, Tanpakushitsu Kakusan Koso 46, 2592-2597 (2001), “GTOP: database for protein 3D structure prediction ”
PDB-BLAST
:少し遠縁の検索これまでのモデリング(構造予測)は、PDBデータベースに対 して、相同性検索に基づいたものですが、有意な構造がない 場合、構造が構築できません。
上記より、少し遠縁のタンパク質を検索する方法として PDB-BLASTがあります。
構造に偏りのあるPDBではなく、初めにNRデータベースに対して5ラ ウンドPSI-BLAST検索しPSSMを出力します。
そのPSSMを用いて、PDBデータベースに対して、PSI-BLAST検索 して少し遠縁のタンパク質を検索します。
モデリングは、アラインメントを基に先程おこなったものと同じ です。
2ページ後の3D-Juryの項目に入ってます(内部で実行)。
Fold Recognition (フォールド認識)サーバー : FUGUE2
これまでの、PSI-BLASTに おけるプロファイル(PSSM) は配列情報のみによる。
既知立体構造(PDB)情報 を基にデータベース
HOMSTRADを構築し、そ のデータベースに対して、
配列のPSSMおよび構造の PSSMを用いて、フォールド の検索を行う。
PSSMの例) ACTA1配列をPSI-BLAST検索 (構造PSSMではない)
J. Shi, T.L. Blundell, K. Mizuguchi, J. Mol. Biol.310, 243-257 (2001), “FUGUE: sequence-structure homology recognition using environment-specific substitution tables and structure-dependent gap penalties ”
フォールド認識法 Threading など
これまでは、BLAST、PSI-BLAST等による相同性検索を用いて主に近縁の配列 を検索し、その鋳型・アラインメントを基にモデル構築をおこないましたが、
マルチプルアラインメント、プロファイル(PSSM)を有効に用いたり、構造配列相 関を用いることにより、より遠縁の鋳型を検索することができます。
これらフォールド認識法を用いた多くのサーバーが存在します。
3D-PSSM, FUGUE2, Sam-T02, mGenThreaderなど
さらに、それらいくつかのサーバーのメタサーバー(コンセンサス予測をする)もあ ります。
3D-Jury
[URL] http://bioinfo.pl/meta/
K. Ginalski et al., Bioinformatics19, 1015-1018 (2003), “3D-Jury: a simple approach to improve protein structure predictions”
K. Ginalski
やはり、時代はコンセンサス!?
バイオインフォマティクスリテラシーIと同じ資料
Webで顔写真を 探して下さい。
ab initio / de novo 予測法 Fragment Assembly 法