PepNovo と PEAKS を用いた de novo ペプチド配列 解析
著者 磯野 直人, 柳原 和典, 小林 裕子, 小林 一成, 久 松 眞
雑誌名 三重大学大学院生物資源学研究科紀要
巻 37
ページ 79‑85
発行年 2011‑02‑01
その他のタイトル De novo peptide sequencing by PepNovo and PEAKS
URL http://hdl.handle.net/10076/11524
は じ め に
近年,質量分析法の発展やゲノム解析の進歩に より,ペプチドマスフィンガープリンティング
(PMF )法や MS/ MS イオンサーチ法を用いて,
タンパク質を簡単に同定できるようになった。し かし,これらはゲノムデータベースや ESTデー タベースなどが整備された生物種に限り有効な実 験手法である。データベースを利用せずにアミノ 酸配列を決定する方法として,タンデム質量分析 装置を用いた
denovoペプチド配列解析法(denovo pepti desequenci ng )がある
1)。これはペプチドイ オンの開裂によって生じた生成イオンのスペクト ル(MS/ MS スペクトル)から数学的演算により アミノ酸配列を算出する技術である。 通常,
MS/ MS スペクトル中には多くのピークが観察さ
れる。例えば, 10 残基程度のペプチドの場合,
明瞭なピークだけでも数十本あることが多く,さ らに多数のノイズが見られる。そのため,マニュ アル操作で構造未知のペプチドのアミノ酸配列を 正確に決定するのはほとんど不可能であると考え られる。最近,AUDENS,Lutef i sk,NovoHMM, PepNovo,PEAKS をはじめとする,多くの優れ た
denovoペプチド配列解析用のアルゴリズム
(プログラム)が考案された
2-6)。現在では,これ らのプログラムを利用したアミノ酸配列決定が,
比較的容易に実行できるようになりつつある。
三 重 大 学 で は 2009 年 に 4800 Pl usMALDI TOF/ TOFAnal yzer (エービー・サイエックス社 製 ) が 設 置 さ れ た 。 本 機 種 の 標 準 機 能 で は Protei nPi l ot ソフトウェア(エービー・サイエッ クス社製)や Mascot (マトリックスサイエンス
PepNovo と PEAKS を用いた denovo ペプチド配列解析
磯野 直人
1*・柳原 和典
1・小林 裕子
2,3・小林 一成
2,3・久松 眞
11三重大学大学院生物資源学研究科,
2三重大学生命科学研究支援センター,
3三重大学大学院地域イノベーション学研究科
Denovo peptidesequencingbyPepNovoandPEAKS
NaotoI
SONO1*,KazunoriY
ANAGIHARA1,YuhkoK
OBAYASHI2,3, IsseiK
OBAYASHI2,3andMakotoH
ISAMATSU11GraduateSchoolofBioresources,MieUniversity,Tsu,Mie514-8507,Japan
2LifeResearchCenter,MieUniversity,Tsu,Mie514-8507,Japan
3GraduateSchoolofRegionalInnovationStudies,MieUniversity,Tsu,Mie514-8507,Japan
Abstract
Wepresentatechniqueofdenovopeptidesequencingfrom MALDITOF/TOFtandem massspectraby web-based programs,PepNovoand PEAKS. Furthermore,weshow theresultofdenovopeptide sequencingofkidneybeangranule-boundstarchsynthaseI(GBSSI).
KeyWords:denovopeptidesequencing,PepNovo,PEAKS,MALDITOF/TOF tandem massspectrometry
三重大学大学院生物資源学研究科紀要 第37号:79~85
平成23年2月
2010年10月4日受理
* Forcorrespondence(e-mail:[email protected])
社製)を用いたタンパク質の解析が可能である。
これらはデータベースや既知のアミノ酸配列情報 を利用し,既知タンパク質の同定や修飾解析を行 うことを目的とするプログラムである。構造が未 知でデータベース未登録のタンパク質のアミノ酸 配列は決定できない。そこで,本解説では 4800 Pl usMALDITOF/ TOF Anal yzer で 得 ら れ た MS/ MS スペクトルから,ウェブベースのソフト ウェアである PepNovo と PEAKSOnl i ne を用い て,denovo ペプチド配列解析する方法について 紹介する。以下では,インゲンマメの Granul e- boundstarchsynthaseI (GBSSI,EC 2. 4. 1. 242 ) を試料として用いた場合の解析方法と結果を示す。
方 法
1 . SDS-ポ リ ア ク リ ル ア ミ ド ゲ ル 電 気 泳 動
(SDS-PAGE)およびゲル内消化
既報
7)にしたがって精製した組換え型 GBSSI
(5 μg ) を SDS- PAGEで分離した後, ゲルを Bi o- Saf eCBBG- 250 ステイン(バイオラッド社 製)で染色し,目的のバンドを含むゲル片を切り 出した。続いて,東京都老人総合研究所産学公連 携プロテオーム共同研究センターの標準操作法に したがって,還元アルキル化とトリプシンによる ゲル内消化を行った
8-9)。得られた消化液を遠心 エバポレーターで 2 μL程度まで濃縮した後,40 μLの溶媒 A (2 % アセトニトリル,0. 1% トリ フルオロ酢酸)と混合した。
2.ナノ LCによるペプチドの分離
ゲル内消化した試料はトラップカラム Hi Q si l C18W (内径 500 μm×長さ 1mm, 粒子径 3 μmの C18粒子を充填,ケーワイエーテクノロ ジーズ社製)を用いて脱塩した後,逆相カラム Hi Q si lC18W (内径 50 μm ×長さ 50mm ,粒 子径 3 μm の C18粒子を充填,ケーワイエーテ クノロジーズ社製)を接続した Di NAダイレク トナノ HPLCシステム(ケーワイエーテクノロ ジーズ社製)に供した。溶媒 Aで 10 分間カラム を洗浄した後,0- 50 %溶媒 B (70 % アセトニト リル,0. 1 % トリフルオロ酢酸)の直線濃度勾配
(45 分間),50- 100 % 溶媒 Bの直線濃度勾配(10 分間),100- 0 % 溶媒 B の直線濃度勾配(10 分間)
でペプチドを分画した。操作はすべて流速 300 nL/ 分で行った。カラムから溶出されたペプチド 試料をマトリックス溶液(0. 4 % α- シアノ- 4- ヒ ドロキシケイ皮酸,2 % クエン酸二アンモニウム,
0. 1 % トリフルオロ酢酸,70 % アセトニトリル)
と混合し,MALDI プレート(エービー・サイエッ クス社製)に 30 秒/ スポットの速度で合計 119 ス ポットに分画した。
3.MALDITOF/TOFタンデム質量分析
マトリックス支援レーザー脱離イオン化飛行時 間型タンデム質量分析計 (MALDITOF/ TOF MS ) で あ る 4800 Pl us MALDI TOF/ TOF Anal yzer (エービー・サイエックス社製)を用い てペプチドの質量分析を行った。前駆イオンを検 出するために,MSRef l ectorPosi ti ve モードで検 出範囲を 800 ~4000Da ,FocusMass を 2400Da に設定した。イオンカウントが 1 万カウント程度 になるようにレーザー強度を設定し,1 スポット あたり 25 箇所について 50 回レーザーをランダム に照射して全てのスポット(119 スポット)に含 まれる分子イオンの TOF質量スペクトルを測定 した。さらに,各スポットから検出されるスペク トルのうち,イオン強度の高い上位 10 本のピー クを前駆イオンとして,MS- MS1kVPosi ti ve モー ドで MS/ MS 自動測定を実施した。衝突誘起開裂
(CID )コントロールを ・CID Of f ・ ,レーザー強 度は前駆イオン検出時の 1. 2 倍に設定し,1 スポッ トあたり 50 箇所について 50 回レーザーをランダ ムに照射した。
4.データ変換
4800Pl usMALDITOF/ TOFAnal yzer によっ て得られた SpotSet データをソフトウェア 4000 Seri esExpl orer で開き, PeakstoMascot の機能 を用いて単一の Mascot
形式ファイルに変換した。Experi mentType として ・Protei n- Pepti debySpot Set・ を選択した。MS/ MSPeakFi l ter では,Mi n S/ N を 20 , Mi n Areaを 1000に 設 定 し た
(MS/ MS スペクトルのピークが小さい場合は,
これらの設定値を小さくする)。PeakstoMascot によって出力されるファイルの拡張子は txt であ るが, PepNovo で解析する時にエラーとなるた め,拡張子を mgf に変更した。
磯野 直人・柳原 和典・小林 裕子・小林 一成・久松 眞 80
5.PepNovo
PepNovo は Uni versi tyofCal i f orni a,SanDi ego の Centerf orComputati onalMassSpectrometry の Web サイト (http: / / proteomi cs. ucsd. edu/ Li ve Search/ )から無料で利用できる。メインページ の Toolsel ecti on では Tool を ・PepNovo・ とし,
Spectrum f i l e で Mascot 形式ファイル(拡張子 mgf )を選択した。また, ・Usespectrum Charge・
と ・Usespectrum precursorm/ z・ の両方にチェッ クを入れた。 Moreopti ons では Pepnovosearch type を ・De Novo・ と し , Numberofdesi red sol uti ons を ・1・ とした(各ペプチドについて多数 の予想配列を得たい場合はこの数値を増やす)。
なお,翻訳後修飾が予想される場合はメインペー ジの Al l owedPost- Transl ati onalModi f i cati ons で,
考慮する修飾の種類を設定することができる。た だし,翻訳後修飾を考慮すると解析に必要な時間 が長くなる。また,実際は未修飾のペプチドに対 して,修飾を考慮した解析を行うと,正しいアミ ノ酸配列が得られないことが多い。
6.PEAKSOnline
PEAKSOnl i ne は Bi oi nf ormati csSol uti onsInc.
の Web サイト
(http: / / www. bi oi nf or. com: 8080/ peaksonl i ne/ ) か ら無料で利用できる。ただし,はじめて使用する 前にアカウントを作成する必要があり,一つのア カウントからの解析は 1 日 5 回に制限されている。
多数の試料について,短時間で解析する必要があ る場合は Bi oi nf ormati csSol uti onsInc. から購入で きるスタンドアローン版の PEAKSStudi o を利 用しても良い。
Search ページの Enzyme は ・SemiTrypsi n・ , Functi on は ・Fi nddenovosequences・ とした。
Preprocessで ・Do preprocess・を 選 択 し , Instrument は ・TOF- TOF・ とした。 Mergetol . , Parenttol . ,Fragmenttol . はすべて 0. 5Da とし,
Precursormass は ・Monoi sotopi c・ とした。 Data f i l e として Mascot 形式ファイル(拡張子 mgf ) を 選 択 し た 。 デ ー タ ベ ー ス に 関 す る 項 目 は PEAKSOnl i ne では無効であるため,初期設定 のままとした。なお,PepNovo と同様,翻訳後 修飾について考慮した解析をするように設定する ことも可能である。
解析結果
インゲンマメ GBSSI はデンプンのアミロース 合成に関与する酵素であり,すでに cDNAの全 塩基配列が決定され,国際塩基配列データベース に登録されている (アクセッション番号 AB 029546 )
7)。 ト リ プ シ ン 消 化 し た GBSSIを MALDITOF/ TOF質量分析計で分析したところ 合計 86 個のペプチドイオンの MS/ MS スペクト ルが得られた。このデータを用いて
denovo配列 解析を行った。ただし,denovo 配列解析には,
アミノ酸配列や塩基配列のデータベース情報は使 用しなかった。
PepNovo による解析では,図 1 のような予想 アミノ酸配列と PepNovo スコアの一覧表が得ら れる。 PepNovo スコアが大きな値の場合,予想 配列が実際のアミノ酸配列と一致あるいは類似し ている可能性が高い。GBSSI の分析結果では 78 個のペプチドの予想配列が示された(PepNovo スコア:- 135 ~112 )。PepNovo スコアが 60 以上 のペプチドは 22 個あり,このうち 11 個は予想配 列が実際の配列と連続 7 残基以上一致していた
(表 1 )。つまり,PepNovo はこれらのペプチドの 配列をかなり正しく決定できたことがわかった。
一方,スコア 60 以下の場合,PepNovo 予想配列 の信頼性は低く,特にスコア 50 以下の予想配列 は実際の配列とほとんど一致しなかった(データ は示さない)。また, PepNovo はペプチドの N 末端側もしくは C末端側の分析結果の信頼性が 低い場合,この部分の予想配列を返さずにペプチ ド末端からの質量(N- Gap および C- Gap )を用 いた結果を示すことがある。 一例を示すと,
GBSSIの ト リ プ シ ン 分 解 物 で あ る
m/z= 1750. 722 のペプチドイオン(前駆イオン)の予 想配列は LFVGAEVAであり,N- Gap と C- Gap がそれぞれ 431. 341 と 533. 328 であった。実際の 配列は GMNLIFVGAEVAPWSK であり,下線 部の配列と予想配列は完全に一致していた(後述 するように,I と Lは質量が同一であり識別でき ない)。
PEAKS では,図 2 のような予想アミノ酸配列 候補とそれぞれのスコアの一覧表が得られる。一 つのペプチドについて, 20 種類の予想配列候補 が提示される。スコアが大きな値の場合,予想配
Denovoペプチド配列解析 81
磯野 直人・柳原 和典・小林 裕子・小林 一成・久松 眞 82
表1.PepNovoとPEAKSによるGBSSIの予想アミノ酸配列1) №ペプチド イオンm/z実際のアミノ酸配列PepNovo予想配列2,3)PepNovo スコアPEAKS予想配列2,4)PEAKS スコアPepNovo-PEAKS 共通配列2,5) 11786.928FIDQNVQIIILGTGKLFDQVLLLQVQ+490.352112EMDNLNQLLLLDNNK10-- 21734.7841GMNLIFVGAEVAPWSKTSNLLFVKEVA+533.315105GMNLLFVQEVANDER15NLLFVXEVA6) 31240.5389ALGTYGTVAMEKALGTYGTVA+407.32595ALGTYGTVAMEK82ALGTYGTVA 4904.377ELVSGEDRELVSSVDR85ELVSSVDR56ELVSSVDR7) 51750.722GMNLIFVGAEVAPWSK431.341+LFVGAEVA+533.32883QFRLFVGAEVAVGSDR10LFVGAEVA 61896.944FLLKEALQAEVGLPVNR501.438+EALKAEV+655.36783SSAKKEALQAEVGLFYR10EALXAEV6) 71766.728TDKFIDIHFDTTSVK491.346+LDLHFDTTSVK82KLCFLDLHFDTTSVK14LDLHFDTTSVK 81745.7629QIEQLEEIYPEK763.345+LQEKLEEL+1745.76381RDVQLEELYLLQAR10XLEEL6) 91796.729LYGPSAGVDYEDNQLR276.425+GALAGVDYED+530.24281EFGPSAGVDYEDNQLR10AGVDYED 101589.705SAFDFTDGHLKPVR783.362+GHLQPVR80SSMDFTDGHLQHSK10GHLQ6) 111738.764GMNLIFVGAEVAPWSK431.354+LFVGAEV+592.35779SDNDLFVGAEVADCQR10LFVGAEV 12884.3989FDGPLAHKFDGPLAHK78FDGPLAHK49FDGPLAHK 131256.537ALGTYGTVAMEKALGTYGTVA+423.23775ALGTYGTVAFEK38ALGTYGTVA 141564.675VAFCIHNISYQGR727.291+NLSYGAGR74SSGMDLHNLSYNAR10NLSY 152094.917?217.397+EKVSTAHFD+863.50868FAQQVSTAHFDEEEEAEK10VSTAHFD 162000.833HPFEDFPLLNLPNEYR510.401+DFPLLNL+678.32368HPEFDFPLLNLPAGDYR10DFPLLNL 172013.918TGGLGDVLGGLPSALAEHGHR385.412+DVLGGLPSAL+706.26867--- 181395.678EALQAEVGLPVNR271.075000+AVAEVGL+485.26665ELAQAEVGLVPNR10AEVGL 192105.804YDQYKDAWDTNVTVEVK1101.36+DTNVTVEVK64FVQVSHDACDDTNVPCPMK13DTNV 201952.924AAILESDLVLTVSPYYAK497.358+SDLVLTW+641.43163QCHESDLVLTVSACCCNK23SDLVLTX7) 212073.834YDQYKDAWDTNVTVEVK1069.449+DTNVTVEVK63FMGMCQDAWDTNVPCEAR10DTNV 221518.639QIEQLEEIYPEK611.278+EEYLPTR61KLMYLEELQHSK10EE 231672.646IIQNCMAQDFSWKLLQNCFAQD+583.37458EPQNGCFAQDDSMCK10CFAQD 242089.8149YDQYKDAWDTNVTVEVKENYYKDASDDT+788.36855FMQYQDACVDTNVTVPCR10YXDA6) 251952.9449AAILESDLVLTVSPYYAK497.501+MALVLTW+641.30454GVVLESDLVLTVSAAHTNK14LVLTX7) 261456.576FFHCYKQGVDR754.236+QGAGVDR52RDGCGCYKQRDR10XXXDR6,8) 271404.6121VFVDHPCFLEK597.364+PSSFLEK51AGFLFACPHDAAGK10-- 281419.676IIAGSDFIMIPSR174.08+PSLMLFD+442.41351LLAGSDFLMLPSR14LML 1)PepNovoスコアが50以上のペプチド(28個)の解析結果を示した。 2)実際のアミノ酸配列と一致する連続した2残基以上の配列を赤字で示した。また記号Lは「I(イソロイシン)あるいはL(ロイシン)」を意味している。 3)N-GapとC-Gap(図1)がある場合は予想配列の前後に数値を記載した。PEAKS予想配列と一致する連続した2残基以上の配列を下線で示した。 4)20種類の予想配列のうち,最も高いスコアを示す配列を記載した。最高スコアが10のペプチドについてはseq1(図2)の配列を示した。また,PepNovo予想配列と一致する連続し た2残基以上の配列を下線で示した。 5)PepNovoとPEAKSの両方のプログラムで共通して予想された配列を示した。 6)K≒Q=AG=GA(質量) 7)W≒AD=DA=EG=GE≒SV=VS(質量) 8)R≒GV=VG(質量)
列が実際のアミノ酸配列と一致あるいは類似して いる可能性が高い。GBSSI の分析結果では 80 個 のペプチドの予想配列が示された(PEAKS スコ ア:10 ~82 )。PEAKS スコアが 25 以上のペプチ ドは合計 12 個あり,このうち 5 個は予想配列が 実際の配列と連続 7 残基以上一致していた(デー タは示さない)。ただし,PEAKS スコアが最低 値の 10 であるにもかかわらず,予想配列の一部 が実際の配列と一致するケースも多かった。例え ば,表 1 では PepNovo スコアが 50 以上のペプチ ド(28 個)が示されているが,PEAKS スコア 10 のペプチドが 17 個あり,このうち 7 個は予想配 列が実際の配列と連続 7 残基以上一致していた。
また,PEAKSは PepNovo と異なり,ペプチド の末端についても必ず予想配列を提示する。しか し,PEAKS スコアが極めて高いケースを除き,
ペプチドの末端側の配列の信頼性は低かった(表 1 )。
このように, PepNovo と PEAKS は優れた
de novoペプチド配列解析プログラムであり,部分 的ではあるが,正確にアミノ酸配列を決定するこ
とができた。ただし,denovo ペプチド配列解析 では気をつけなければならない点がいくつかある。
(1 )アミノ酸残基 Lと I は同一の質量であるた め識別できない。そのため,PepNovo と PEAKS の予想配列中の記号 Lは「I または L 」を意味し ている。(2 ) アミノ酸残基 K と Q の質量差は 0. 036 しかない。また,Qは AGあるいは GAと 同一の質量である。スペクトルによってはこれら のアミノ酸残基(配列)の判別ができないことが ある。 同様に,(3 ) N と GG の識別,(4 ) W, AD,DA,EG,GE,SV, VSの識別,(5 )R,GV, VGの識別も難しいので,これらのアミノ酸残基
(配列)が予想配列中にある場合は,注意する必 要がある。
タンパク質をコードする遺伝子や cDNAをク ローニングするために,アミノ酸配列情報を基に して,(RT- ) PCRに用いるオリゴヌクレオチド プライマー(縮重プライマー)を設計することが ある。しかし, PepNovo あるいは PEAKSのい ずれか一方のプログラムの結果のみを用いて効果 的なプライマーを設計するのは難しい。例えば,
Denovoペプチド配列解析 83
図1 PepNovoの解析結果画面
GBSSI の場合,PepNovo ではスコア 60 以上のペ プチド(22 個)のうち,提示された予想配列が 完全に正しいペプチドは 10 個であった(表 1 )。
また, PEAKSではスコア 25 以上のペプチド
(12 個)のうち,予想配列が完全に正しいペプチ ドは 3 個だけであった。つまり,これらのペプチ ド予想配列を用いて作成したプライマーの多くは,
(RT- ) PCRで機能しないことが予想された。そ こで,私たちは PepNovo と PEAKS の両方のプ ログラムで,共通して予想された配列を調べた。
その結果,連続した 7 残基以上の配列が共通して いるペプチドは 10 個あることが明らかとなった
(表 1 )。この共通予想配列のうち 8 個については 実際のアミノ酸配列と完全に一致していた。この ように, PepNovo と PEAKS を併用し,情報を 絞り込めば,より確実に正しいアミノ酸配列を取 得できることがわかった。これらの共通予想配列 を用いれば,(RT- ) PCRに有効なプライマーを,
効率的に作成することができると推定した。
最近,私たちは本解説で紹介した手法を用いて,
微 細 藻 類
Ochromonasdanica由 来 β - 1,3- gl ucan phosphoryl ase (EC 2. 4. 1. 97 )のアミノ酸配列を 決定した(データ未発表)。本酵素は
Ochromonas属以外では発見されておらず,これまで構造が不 明であり,Oc
hromonasdanicaや類縁生物のゲノム 配列も決定されていなかった。また,アミノ酸配 列情報から作成した縮重プライマーを用いて RT- PCRを行い,本酵素をコードする cDNAの クローニングにも成功した。このように
denovoペプチド配列解析は,構造未知のタンパク質の研 究を進める際に非常に役立つ技術であり,今後さ らに利用が進むであろう。
要 約
マトリックス支援レーザー脱離イオン化飛行時 間型タンデム質量分析計 (MALDITOF/ TOF MS )によって得られた MS/ MS スペクトルを用
磯野 直人・柳原 和典・小林 裕子・小林 一成・久松 眞84
図2 PEAKSの解析結果画面
いて,denovoペプチド配列決定する手法を解説 す る 。 ウ ェ ブ ベ ー ス の ソ フ ト ウ ェ ア で あ る PepNovoとPEAKS onlineを使用した解析方法 を紹介する。また,インゲンマメGranule-bound starchsynthaseI(GBSSI)を試料とした解析例 を示す。
引 用 文 献
1)MEDZIHRADSZKY,K.F.(2005)Peptidesequence analysis.MethodsEnzymol.402:209-244.
2)GROSSMANN,J.,ROOS,F.F.,CIELIEBAK,M.,LIPT・K, Z.,MATHIS,L.K.,M・LLER,M.,GRUISSEM,W.and BAGINSKY,S.(2005)AUDENS:atoolforautomated peptidedenovo sequencing. J.ProteomeRes. 4: 1768-1774.
3)TAYLOR,J.A.andJOHNSON.R.S.(2001)Imple- mentationandusesofautomateddenovopeptide sequencingbytandem massspectrometry. Anal. Chem.73:2594-2604.
4)FISCHER,B.,ROTH,V.,ROOS,F.,GROSSMANN,J., BAGINSKY,S.,WIDMAYER,P.,GRUISSEM,W.and
BUHMANN,J.M.(2005)NovoHMM:a hidden Markov modelfordenovo peptidesequencing.
Anal.Chem.77:7265-7273.
5)FRANK,A.andPEVZNER,P.(2005)PepNovo:de novopeptidesequencingviaprobabilisticnetwork modeling.Anal.Chem.77:964-973.
6)MA,B.,ZHANG,K.,HENDRIE,C.,LIANG,C.,LI, M.,DOHERTY-KIRBY,A.and LAJOIE,G.(2003) PEAKS:powerfulsoftwareforpeptidedenovo sequencingbytandem massspectrometry.Rapid Commun.MassSpectrom.17:2337-2342.
7)ISONO,N.,ITO,H.,SENOURA,T.,YOSHIKAWA,M., NOZAKI,K.and MATSUI.,H.(2003)Molecular cloningofacDNA encodinggranule-boundstarch synthaseIfrom kidneybeanseedsandexpressionin Escherichiacoli.J.Appl.Glycosci.50:355-360.
8)戸田年総(1997)固定化pH勾配ゲルストリップ を用いた二次元電気泳動.生物物理化学 41:13- 20.
9)http://www.proteome.jp/2D/J_2DEmethod.html
Denovoペプチド配列解析 85