転写
翻訳
逆転写
レトロウイルスを含む レトロエレメント
ファイルの確認
RetroProtease.fasta
(
テキスト形式のファイル)ダウンロードしたものをデスクトップにおく
“
メモ帳”
で開いてmulQ-FASTA
形式であることを確認以下、メモ帳の開き方
1
左下 スタート をクリック 全てのプログラムをクリック3.
アクセサリをクリック4.
メモ帳 をクリック5.
メモ帳が開く6.
開いた メモ帳 のメニューバーから ファイル を選択7.
プルダウンメニューから 開く を選択8.
ファイル選択ウィンドウで、ファイルのあるディレクトリまで移動(
ここではドキュメントdirectory)
9.
テキスト形式のファイルだが、拡張子がfasta
のため認識されない。左下のプルダウンメニューを テキスト文書 から すべてのファイル に変更
10.
ファイル を選択して、左下の 開く をクリック11.
選択されたファイルが開く>gi|443546|pdb|7HVP|A Chain A, Protease Of Human Immunodeficiency Virus 1 PQITLWQRPLVTIRIGGQLKEALLDTGADDTVLEEMNLPGKWKPKMIGGIGGFIKVRQYDQIPVEIXGHK AIGTVLVGPTPVNIIGRNLLTQIGXTLNF
> HIV2 protease (NP_663784 REGION: 523..603)
vtayiedqpv evlldtgadd sivagielgd nytpkivggi ggfintkeyk nveikvlnkr vratimtgdt pinifgrnil t
> simian immunodeficiency virus SIV-mnd 2 (NP_758887 REGION: 72..166)
slwnrpttvv eiegqkveal ldtgaddtvi kdldlkgnwk pqiiggiggs invkqffnck vtiagkttha svlvgptpvn ivgrnvlkkl gctln
>gi|4389337|pdb|1BAI|A Chain A, Rous Sarcoma Virus Protease
LAMTMEHKDRPLVRVILTNTGSHPVKQRSVYITALLDTGADDTVISEEDWPTDWPVMEAANPQIHGIGGG IPVRKSRDMIELGVINRDGSLERPLLLFPLVAMTPVNILGRDCLQGLGLRLTNL
>gi|224443|prf||1104339A MoMuLV protease
TLDDQGGQGQEPPPEPRITLKVGGQPVTFLVDTGAQHSVLTQNPGPLSDKSAWVQGATGGKRYRWTTDRK VHLATGKVTHSFLHVPDCPYPLLGRDLLTKLKAQIHFEGSGAQVMGPMGQPLQVL
1.
配列は、スペースがあいていても構わないことに注意2. Ma\
は大文字も、小文字も区別せずに配列を処理してくれるが、ソフトによっては大文字あるいは小文字しか処理できない場合があるかもしれない マルチ
fasta
形式MAFFT によるマルチプルアラインメント
ma\
は宮田研究室で開発され、加藤和貴によって継続的に 開発されているマルチプルアラインメントのフリーソフトウェア 海外の多くの研究機関で利用されている。Web
上でのアラインメントサービスに加え、ダウンロードして自身のPC
上で利用できる。Mac, Windows, Linux
など様々なOS
に対応しているここでは、既に関西学院大学の計算システム(
Windows
環境)
にインストール されているma\
を利用する。Ma>
を起動する1
左下 スタート をクリック2.
検索ウィンドウにma\
と入力上部に
ma\
のインストール場所が表示される。このma\
のアイコンをクリック3. ma\
の入力画面がたちあがる。4.
入力ファイルを指定するために、mulQ-fasta format
のファイルが置かれたDirectory
を表示する。(ここからはWindows OS
上での処理)左下のスタートをクリックし、出て来たパネル左上のドキュメントを選択
5.
ドキュメントdirectory
が表示される。Directory
からma\
のウィンドウにファイルをドラッグすると、ファイル名が入力される。ファイル名が入力されたら
enter
キーをおす。6. Output
すなわち、アラインメントを出力するファイル名を聞かれる、入力ファイル名を参考に
Z
ドライブ上のファイル(新規でも既存の者でも良い)を指定しEnter
キーをおす。出力オプションを聞いてくるので2
を指定する。Clustal
形式/Fasta
形式Sorted Order/Input Order
説明はアラインメントを見ながら7.
アラインメントのオプションを聞いてくる。1
の—auto
オプションを指定 してenter
auto
オプション 小規模データ丁寧に、大規模データそれなりにアラインt7
8.
指定したファイルやオプションを、コマンドライン形式で確認してくる 問題なければY
を入力してenter
9.
ウィンドウ中に、出力が表示(END)
が表示された時点で、出力ファイルに書き込まれている。10.
メモ帳 によってClustal
形式のアラインメントを確認LUSTAL format alignment by MAFFT L-INS-i (v7.130b)
gi|443546|pdb|7 PQITLW---QRPLVTIRIGGQL---KEALLDTGADDTVLEEMNLPG HIV2 ---VTAYIEDQP---VEVLLDTGADDSIVAGIELGD simian ---SLW---NRPTTVVEIEGQK---VEALLDTGADDTVIKDLDLKG gi|4389337|pdb| LAMTMEHK---DRPLVRVILTNTGSHPVKQRSVYITALLDTGADDTVISEEDWPT gi|224443|prf|| ---TLDDQGGQGQEPPPEPRITLKVGGQP---VTFLVDTGAQHSVLTQNPGPL : . *:****:.:::
gi|443546|pdb|7 KW---KPKMIGGIGGFIKVRQ---YDQIPVEIXGHKAIGTVL----VGPTPVNIIGR HIV2 NY---TPKIVGGIGGFINTKE---YKNVEIKVLNKRVRATIM----TGDTPINIFGR simian NW---KPQIIGGIGGSINVKQ---FFNCKVTIAGKTTHASVL----VGPTPVNIVGR gi|4389337|pdb| DWPVMEAANPQ-IHGIGGGIPVRKSRDMIELGVINRDGSLERPLLLFPLVAMTPVNILGR gi|224443|prf|| SD---KSAWVQGATGGKRYRW---TTDRKVHLATGKVTHSFLH---VPDCPYPLLGR . .. : * * : : : ..: . * :.**
gi|443546|pdb|7 NLLTQIGXTLN---F HIV2 NILT---simian NVLKKLGCTLN---gi|4389337|pdb| DCLQGLGLRLT---NL gi|224443|prf|| DLLTKLKAQIHFEGSGAQVMGPMGQPLQVL : *
Clustal
形式のアラインメント強く保存しているセグメント(モチーフ)が2ケ所見いだされる
Clustal
形式アラインメント下段のシンボルの意味“
*”
では,完全に保存“:”
では,強い物理化学的類似性のあるグループで保存“.”
では,弱い類似性のあるグル―
プで保存強い弱いの基準は,
PAM250
行列において,アミノ酸間のスコアが0.5
よ り大きいか,0.5
以下かで分けているPAM250
行列については次回説明Clustal
形式:後述コマンドライン入力の場合:
–reorder Fasta
形式:コマンドライン入力の場合:デフォルト
Sorted Order:
アラインメントした際、近縁なもの
(guide tree
上で 近い順番、guide tree
について次回)を近くに配置 するように配列の順番を変更コマンドライン入力の場合:
--reorder Input Order:
Fasta
形式の入力ファイルに入っている順番でアラインメント中の配列が配置される コマンドライン入力の場合:デフォルト
立体構造は
PDB
から得た.
。PDB ID=7HVP
レトロウイルス・プロテアーゼのコンセンサス配列�
� �
(Hydrophobic)-Asp-Thr-Gly-(Small Hydrophilic)�
� �
モチーフ配列は、酸性プロテアーゼの活性中心に類似
検 証
X 線結晶構造解析からHIV プロテアーゼは酸性プロテーゼと類似の構造である。