ヒトゲノムのアノテー ション(注釈付け)がま とまっています。
“actin skeletal
muscle” で検索し、
HIT000035891 をク リック
Protein Structure をク リック
GTOP をクリック
このリンクは
H-InvDB
用のGTOP
のリンクです。C. Yamasaki et al., Gene 364, 99-107 (2005), “Investigation of protein functions through data-mining on integrated human
transcriptome database, H-Invitational database (H-InvDB) ”
38
GTOP : Genomes TO Protein structures and functions
先程、皆さんが実行したのと同じ(リガンドはなしですが)、E-value
<0.001
でホモロジーモデリングした構造が表示されます。
立体構造予測だけではなく、機能予測やいくつ かの解析がまとめられ ています。
それも610
生物種全て のゲノムに対して解析 したまとめです。T. Kawabata, K. Nishikawa, Tanpakushitsu Kakusan Koso 46, 2592-2597 (2001), “GTOP: database for protein 3D structure prediction ”
このH-invDBからのGTOPはヒトのみですが、講義ページのリンクはGTOP本体にリンクしています。
39
PDB-BLAST
:少し遠縁の検索
これまでのモデリング(構造予測)は、PDB
データベースに対 して、相同性検索に基づいたものですが、有意な構造がない 場合、構造が構築できません。
上記より、少し遠縁のタンパク質を検索する方法としてPDB-BLAST
があります。構造に偏りのある
PDB
ではなく、初めにNR
データベースに対して5
ラ ウンドPSI-BLAST
検索しPSSM
を出力します。その
PSSM
を用いて、PDB
データベースに対して、PSI-BLAST
検索 して少し遠縁のタンパク質を検索します。
モデリングは、アラインメントを基に先程おこなったものと同じ です。2
ページ後の3D-Jury
の項目に入ってます(内部で実行)。
プロファイル(PSSM
)情報は大変有用です。40
Fold Recognition (フォールド認識)サーバー : FUGUE2
これまでの、PSI-BLAST
に おけるプロファイル(PSSM
) は配列情報のみによる。
既知立体構造(PDB
)情報 を基にデータベースHOMSTRAD
を構築し、そ のデータベースに対して、配列の
PSSM
および構造/
環境のPSSM
(ESSTs
)を 用いて、フォールド・機能の 検索を行う。PSSMの例) ACTA1配列をPSI-BLAST検索 (構造PSSMではない)
J. Shi, T.L. Blundell, K. Mizuguchi, J. Mol. Biol. 310, 243-257 (2001), “FUGUE: sequence-structure homology recognition using
environment-specific substitution tables and structure-dependent gap penalties ”
41
フォールド認識法 Threading など
これまでは、BLAST、PSI-BLAST等による相同性検索を用いて主に近縁の配列 を検索し、その鋳型・アラインメントを基にモデル構築をおこないましたが、
マルチプルアラインメント、プロファイル(PSSM)を有効に用いたり、構造配列相 関を用いることにより、より遠縁の鋳型を検索することができます。
これらフォールド認識法を用いた多くのサーバーが存在します。3D-PSSM, FUGUE2, Sam-T02, mGenThreaderなど
さらに、それらいくつかのサーバーのメタサーバー(コンセンサス予測をする)もあ ります。3D-Jury
[URL] http://bioinfo.pl/meta/
ドキュメント内
立体構造予測 フォールディング問題、
(ページ 37-41)