1
質問
Q1 ホモロジー検 索 におけるスコア値 (Score) と同 一 性 (Identities) の関 係 は? Q2 アライメント情 報 に表 示 されるハイフン (-),プラス (+),コロン (:) などの意 味 を知りたい. Q3 BLAST ホモロジー検 索 の結 果 で,自 分 が作 成 した配 列 質 問 式 に含 めていない XXX や NNN が表 示 されることがあります.なぜですか? (低 分 子 領 域 とは?)Q4 tBLASTn, tBLASTx, BLASTx を 実 行* す る と , 結 果 の ア ラ イ メ ン ト 情 報 に Frame 1, Frame 2 などが表 示 されます.この Frame の意 味 は?
ま た , 一 つ の 回 答 に 一 つ の Frame し か な い 場 合 と Frame 1, Frame 3 な ど 複 数 の Frame が表 示 される場 合 があります.これはなぜですか?
* tBLASTn は REGISTRY フ ァ イ ル (BLAST), DGENE/PCTGEN/USGENE フ ァ イ ル (BLAST, GETSIM) で利 用 可 能 .
tBLASTx と BLASTx は REGISTRY ファイル (BLAST) のみで利 用 可 能 .
Q5 ホモロジー検 索 でホモロジー検 索 で曖 昧 コードを使 用 した場 合 と使 用 しなかった場 合 のス コア値 は同じですか? 例 えば,DGENE ファイルの曖 昧 コード R は A または G を意 味 しますが,コード R で 検 索 した時 の結 果 は,(コード A の結 果 OR コード G の結 果 ) と同 じになりますか Q6 基 となる配 列 (質 問 式 A) と,その一 部 のコードを切 り取 った配 列 (質 問 式 B) の部 分 配 列 検 索 の結 果 は,下 記 の関 係 が成 立します. 質 問 式 A の回 答 件 数 ≦ 質 問 式 B の回 答 件 数 同じ関 係 が,ホモロジー検 索 の結 果 でも成 立 しますか? Q7 環 状 の核 酸 ・タンパク質 を検 索 する方 法 は?
参 考
下 記 サ イ ト に は , 上 記 以 外 の DGENE/PCTGEN/USGENE フ ァ イ ル の BLAST お よ び GETSIM ホモロジー検 索 に関 する多 くの質 問 が記 載されています (英 語 資 料 ). ぜひご覧 ください. http://www.stn-international.com/fileadmin/be_user/STN/pdf/search_materials/Bioseq uence_Searching/dgenefaq.pdf2 Q1 ホモロジー検 索 におけるスコア値 (Score) と同 一 性 (Identities) の関 係 は? A1 ホモロジー検 索 では,質 問 式 配 列 と回 答 配 列 が一 致 した局 所 領 域 について類 似 性 を,スコア 値 および同 一 性 パーセントで表しています. スコア値 (Score) ・ 配 列 質 問 式 および結 果 のコードの一 致 ,不 一 致 ,類 似 性 により,点 数 が決 まっており,そ の点 数 を加 算していくことでスコア値 が算 出 されます. - BLAST : 核 酸 Query: 67 ggagacgtagattcggagg ← 質 問 式 ||||||||||||||||a|| Sbjct: 44 ggagacgtagattcggcgg ← 回 答 - BLAST : タンパク質 選 択 した置 換 行 列 により,コードの点 数 が異 なります. 下 記 は,デフォールト BLOSUM 62 におけるマトリックスチャートです. Query: 22 KPIKLVELINIHV ← 質 問 式 Sbjct: 565 KPIK+VELGKIHV Sbjct: 565 KPIKIVELGKIHV ← 回 答 ・ 以 上 より,一 致 しているコード,ファミリーで一 致 しているコードが多 いほど,高 いスコア値 に なります. デフォールト設 定 の場 合 コードが一 致 : 1 点 コードが不 一 致 : -3 点 K-K で一 致 : 5 点 L+I でファミリー一 致 : 2 点 I G で不 一 致 : -4 点
3 同 一 性 パーセント (Identitties) ・ 局 所 領 域 において塩 基 やアミノ酸 コードが一 致 している割 合を示 します. Identities = 29/30 (96%) Query: 16 caggttccctggtgcaggcagcgctgactc 45 |||||||||||||C|||||||||||||||| Subject: 65 caggttccctggtccaggcagcgctgactc 94 スコア値 (Score) と同 一 性 パーセント (Identities)の関 係 例 ) 質 問 式 の配 列 長 が 200 である場 合 (200 コードが完 全 に一 致 した時 のスコア値 を 400 と仮 定 し,100 コードが一 致した時 のスコア 値 を 300 と仮 定します.) 1. 質 問 式 の配 列 と完 全 に同 じ配 列 (配 列 長 200) のレコード 2. 全 配 列 長 が 400 で,質 問 式 の配 列 を完 全 に含 むレコード 3. 全 配 列 長 が 400 で,質 問 式 の一 部 の配 列 と完 全 に一 致 する配 列 を有 するレコード 4. 全 配 列 長 が 150 で,質 問 式 の一 部 の配 列 と完 全 に一 致 する配 列 を有 するレコード ・ 1. と 2. は回 答 の配 列 長 に関 わらず,局 所 領 域 で一 致 したコードの数 が同 じなので,スコア値 が同じです.(最 大 スコア値 ) ・ 3. と 4. は同 一 性 パーセント (局 所 領 域 においてコードが一 致 している割 合 ) が 100% と高 い ですが,1., 2. に比 べて一 致したコードが半 分 のため,スコア値が低 くなります. 局 所 領 域 の配 列 長 : 30 一 致 しているコード数 : 29 ⇒ 同 一 性 パーセント : 29/30 (96%) 質 問 式 回 答 200 200 200 コードが完 全 に一 致 する スコア値 は 400 同 一 性 パーセント : 100% (200/200) 質 問 式 回 答 200 400 200 コードが完 全 に一 致 する スコア値 は 400 同 一 性 パーセント : 100% (200/200) 1 1 1 1 100 300 質 問 式 回 答 200 400 100 コードが一 致 する スコア値 は 300 同 一 性 パーセント : 100% (100/100) 1 1 151 250 51 150 質 問 式 回 答 200 150 100 コードが一 致 する スコア値 は 300 同 一 性 パーセント : 100% (100/100) 1 1 31 51 150 130
4
Q2 アライメント情 報 に表 示 されるハイフン (-),プラス (+),コロン (:) などの意 味 を知りたい.
A2 アライメント情 報 に表 示 される記 号 は,核 酸 ,タンパク質 および BLAST,GETSIM ホモロジー 検 索 で異 なります.
・ 核 酸 – REGISTRY BLAST および DGENE/PCTGEN/USGENE ファイルの BLAST Query: 67 ggagacgtagattcggaggcggccaggcggcg ← 質 問 式 ||||||||||||||||C||||||CA||||||| Sbjct: 44 ggagacgtagattcggcggcggc—ggcggcg ← 回答 ・ 核 酸 – DGENE/PCTGEN/USGENE ファイルの GETSIM 29 na overlap starting at 546 aggagugguaggucuuagccagcuguaau ← 質 問 式 ::T:T.CA.:TT.AC.:::::::.GU::. agtattcatatttactagccagct--aat ← 回 答
・ タンパク質 – REGISTRY BLAST および DGENE/PCTGEN/USGENE ファイルの BLAST Query: 22 QVGKGSVSPNAALVAEKISARSGAE QVQ+NS+HR+AALVAEKISARSKL+ Sbjct: 565 QVQQNSLHRDAAL---RSKLQ ・ タンパク質 – DGENE/PCTGEN/USGENE ファイルの GETSIM 31 aa overlap starting at 569 qlkkflkialetparicp_inysllasllpk ::.::::.:..::.r.n:s:.l:s:.:l.:: qlrkflklaiktpvwlnpsitlsslgs_fpk ギャップ (GAP) は質 問 式 または回 答 の配 列 に挿 入 されることがあり,ギャップが挿 入 されると, スコア値 は下 がります. | : 一 致 空 欄 : 不 一 致 - : ギャップ (GAP) : : 一 致 空 欄 : 不 一 致 . : U と T の一 致 - : ギャップ (GAP) コード : 一 致 空 欄 : 不 一 致 + : アミノ酸 ファミリーの一 致 - : ギャップ (GAP) : : 一 致 空 欄 : 不 一 致 . : アミノ酸 ファミリーの一 致 - : ギャップ (GAP)
5
Q3 BLAST ホ モ ロ ジ ー 検 索 の 結 果 で , 自 分 が 作 成 し た 配 列 質 問 式 に 含 め て い な い XXX や NNN が表 示 されることがあります.なぜですか?
A3 REGISTRY BLAST で , Low Complete Filtering に チ ェ ッ ク が 付 い た 情 報 で 検 索 , ま た は DGENE/PCTGEN/USGENE ファイルの BLAST で,デフォールト (オプションで -F F を付 与 しない) 検 索 すると,配 列 質 問 式 の低 複 雑 度 領 域* にマスクフィルタリングが行 われます. フィルタリングが行 われるのは,質 問 式 に対 してのみで,データベースの配 列 には行 われません. フィルタプログラムにより見 つけられた配 列 質 問 式 の低 複 雑 度 領 域 は,塩 基 配 列 の場 合 は N, アミノ酸 配 列 の場 合 は X の文 字 で置 き換えられます. 例 ) アミノ酸 の配 列 質 問 式 NLDDNKNTGIFIISARGGIEGLQQKLWTGISIAIAQAAAALEGLRIAATLQGDNQ Query: NLDDNKNTGIFIISARGGIEGLQQKLWTGXXXXXXXXXXXXXXXXXXXTLQGDNQ NLDDNKNTGIFIISARGGIEGLQQKLWTGISIAIAQAAAALEGLRIAATLQGDNQ Subject: NLDDNKNTGIFIISARGGIEGLQQKLWTGISIAIAQAAAALEGLRIAATLQGDNQ * 低 複 雑 領 域 とは,ホモポリマー領 域 ,短 周 期 リピート,特 定 残 基 への偏 りなど,偏 った組 成 を持った配 列 領 域 のことです.(例 : proline-rich 領 域 ,poly A tails など)
一 般 に,低 複 雑 度 領 域 は構 造 的 な偏 りが反 映 され,BLAST プログラムでは非 常 に高 いス コアがつく傾 向 があります.このような配 列 は,統 計 的 には有 意 (スコアが高 い) であっても 生 物 学 的 には類 似 度 は高 くないということになります.そのため,フィルタリングを行 うことに より,このような低 複 雑 度 領 域 に対 する一 致 など,有 意 でない一 致 を結 果 から除 くことがで きます.
6
Q4-1 tBLASTn, tBLASTx, BLASTx を実 行* すると,結 果 のアライメント情 報 に Frame 1, Frame 2 などが表 示 されます.この Frame の意 味 は?
A4-1 3 つの核 酸 が 1 つのアミノ酸に翻 訳 されます.
tBLASTn, ではデータベース中 の核 酸 配 列 を,tBLASTx, BLASTx では質 問 式 中 の核 酸 配 列 をアミノ酸 配 列 に翻 訳 する際 に,3 つの核 酸 をどこから括 り始 めるかにより翻 訳 されるアミノ酸 にバリエーションが生じます. この際 の読み枠 を Frame (フレーム,読 み枠 ) と呼 びます. Frame (フレーム,読 み枠 ) ・ Frame をずらせば,一 本 の核 酸 配 列 から三 本 のアミノ酸 配 列 を作 成 できます また核 酸 には相 補 鎖 もあるので,相 補 鎖 からも,三 本 のアミノ酸 配 列 が作 成 されます. よって,合 計 6 通 りのアミノ酸 配 列 が作 成され,検 索 に利 用されます. G T C A A T C A G C A C C T T T G T G G T C A G T T A G T C G T G G A A A C A C C A (相 補 鎖 )
・ Universal Genetic Code Table (遺 伝 子 コード表 ) : 核 酸 をアミノ酸 に翻 訳 する際 に使 用 される表
5’ 3’ Frame 1 Frame 2 Frame 3 アミノ酸 配 列 に翻 訳 すると, Frame 1 の場 合 VNQHLCG Frame 2 の場 合 SISTFV Frame 3 の場 合 QSAPLW 5’ 3’ 1: 表 中 の T は T または U を表 現 しています
7 例 ) 下 記 のアミノ酸 配 列 を REGISTRY ファイルの tBLASTn で検 索 する. TVDQHLCGSHLVEALYSVWVHEAKGLPRAAAGAPGVRAELWLDGALLARTAPRAGPG QLFWAERFHFEALPPARRLSLRLRGLGPGSAVLGRVALALEELDAPRAPAAGLERWF - ヒットしたホモロジー検 索 の回 答 例 RN 903919-84-6 Length = 351 Score = 35.0 Expect = 7.1 Identities = 15/17 (88%) Positives = 16/17 (94%) Frame = +3 Query: 2 VDQHLCGSHLVEALYSV 18 V+QHLCGSHLVEALYSV Subject: 93 VNQHLCGSHLVEALYLV 143 ・ 対 応 する RN 903919-84-6 の全 配 列 長 を REGISTRY ファイルで表 示 (SQD 表 示 形 式 ) RN 903919-84-6 REGISTRY FS NUCLEIC ACID SEQUENCE SQL 351
NA 65 a 93 c 100 g 93 t
PATENT ANNOTATIONS (PNTE): Sequence |Patent Source |Reference =========+============== Not Given|IN190003 |unclaimed PAGE |7 S E Q 1 a a t t c a t g g g c c t a t g g a t c c g t c t a c t g c c t c t g a t c g c g c t g c t g a t c 5 1 c t c t g g g g a c c g g a t c c a g c t g c g g c c g a a t t c c g g a t g t t t g t c a a t c a 1 0 1 g c a c c t t t g t g g t t c t c a c c t g g t g g a g g c t c t g t a c c t g g t g t g t g g g g 1 5 1 a a c g t g g t t t c t t c t a c a c a c c c a a g a c c c g t c g t g a a g c t g a a g a c c t t 2 0 1 c a a g t g g g t c a a g t t g a a c t t g g t g g g g g t c c t g g t g c g g g t t c t c t t c a 2 5 1 a c c t t t g g c t c t c g a g g g a t c a c t t c a a a a g c g t g g c a t t g t g g a g c a g t 3 0 1 g c t g c a c c a g c a t c t g c t c c c t c t a c c a a c t g g a g a a c t a c t g c a a c t g a 3 5 1 g
**RELATED SEQUENCES AVAILABLE WITH SEQLINK**
Q4-2 また,一 つの回 答 に一 つの Frame しかない場 合 と Frame 1, Frame 3 など複 数 の Frame が 表 示 される場 合 があります.これはなぜですか?
A4-2 Frame が一 つしか表 示 されない回 答 は,それ以 外 の Frame とは類 似 性 が無 いことを意 味 し ています. 複 数 の Frame で類 似 性 が生 じた場 合 は,その類 似 性 のあるヒットした Frame がすべて表 示 されます. ここから核 酸 配 列 の 翻 訳 を 開 始 したので,Frame = +3 Frame 3 から核 酸 のアミノ酸 への翻 訳 を開 始 すると,塩 基 コード 93 番 目 から 143 番 目 で翻 訳 されたアミノ酸 (VNQHLCGSHLVEALYLV) が質 問 式 のアミノ酸 配 列 と類 似 していた
8 Q5 ホモロジー検 索 で曖 昧 コードを使 用 した場 合と使 用 しなかった場 合 のスコア値 は同じですか? 例 えば,DGENE ファイルの曖 昧 コード R は A または G を意 味 しますが,コード R で検 索 した時の結 果 は,(コード A の結 果 OR コード G の結 果 ) と同 じになりますか? A5 いいえ,スコア値は異 なります. コード R で検 索 した結 果 は,(コード A の結 果 OR コード G の結 果 ) の結 果とは異 なります. 理 由 : 使 用 するコードにより,スコア値 を算 出 するための点 数 が異 なるためです. ・ GETSIM の核 酸 検 索 のマトリックス - 質 問 式 中 のコード R が回 答 のコード A または G でヒットした時 は 2 点 - 質 問 式 中 のコード A が回 答 のコード A でヒットした時 は 5 点 - 質 問 式 中 のコード G が回 答 のコード G でヒットした時 は 5 点 点 数 が異 なればスコア値 にも影 響 します
9 Q6 基 となる配 列 (質 問 式 A) と,その一 部 のコードを切 り取 った配 列 (質 問 式 B) の部 分 配 列 検 索 の結 果 は下 記 のようになりますが,同じ関 係 がホモロジー検 索 の結 果 でも成 立 しますか? 質 問 式 A の回 答 件 数 ≦ 質 問 式 B の回 答 件 数 A6 いいえ,成 立しません. 部 分 配 列 検 索 の結 果 は,質 問 式 の配 列 を含 むすべての配 列 が得 られますが,ホモロジー検 索 では,質 問 式 の配 列 と局 所 領 域 において類 似 した配 列 が得 られます.そのため,通 常 は配 列 長 の長 い質 問 式 A の回 答 件 数 の方 が,質 問 式 B の回 答 件 数 より多 くなります. (検 証 ) 下 記 の 2 つのアミノ酸 配 列 を REGISTRY ファイルで検 索 する. ・ 質 問 式 A (配 列 長 250)
KYCLNWRHQS VKLFARSLDR LFGLDHAFSW IHVRLTNSTM YVADPFNPPD SDACTNLDDN KNTGIFIISA RGGIEGLQQK LWTGISIAIA QAAAALEGLR IAATLQGDNQ VLAITKEFMT PVPEDVIHEQ LSEAMSRYKR TFTYLNYLMG HQLKDKETIQ SSDFFVYSKR IFFNGSILSQ CLKNFSKLTT NATTLAENTV AGCSDISSCI ARCVENGLPK DAAYIQNIIM TRLQLLLDHY YSMHGGINSE
・ 質 問 式 B (配 列 長 50) : 質 問 式 A の一 部 (上 記 の網 掛 け部 分 ) の配 列
KYCLNWRHQS VKLFARSLDR LFGLDHAFSW IHVRLTNSTM YVADPFNPPD (検 索 ) 質 問 式 部 分 配 列 検 索 の結 果 (件 数 ) BLAST ホモロジー検 索 の結 果 (件 数 ) A 1 800 B 3 452 BLAST ホモロジー検 索 の結 果 で,質 問 式 A のみで得 られた回 答 例 ① CAS 登 録 番 号 821688-36-2 質 問 式 A 質 問 式 A の 4 ~ 219 番 目 の コ ー ド と 821688-36-2 の 605 ~ 829 番 目 のコードが類 似 していました. 質 問 式 B で考 えた場 合 質 問 式 B の 4~42 番 目 のコードに対 して,821688-36-2 の 605~ 647 番 目 のコードが対 応 しています (上 記 の枠 内 ).しかしこの 2 つの コード間 では一 致 しているコードが少 なく,さらに GAP も入 っています ので,類 似 性 は非 常 に低 いと考 えられます.そのため,質 問 式 B の回 答 に 821688-36-2 が含 まれていなかったと思 われます.
10 ② CAS 登 録 番 号 1375769-78-0 質 問 式 A の 112 ~195 番 目 のコード と 1375769-78-0 の 259 ~339 番 目 のコードが類 似 していました. つまり,質 問 式 A の 1~50 番 目 のコード (= 質 問 式 B) に対 しては, 1375769-78-0 のコードは類 似 性 がありませんでした.
11 Q7 環 状 の核 酸 ・タンパク質 を検 索 する方 法 は? A7 REGISTRY ファイル ・ 完 全 な環 状 であれば,特 別 な登 録 処 理 がされており,いずれの位 置 から始 めても検 索 出 来 るようになっています. ・ NTE フィールドに環 化 (CYCLIC) と収 録されます.
検 索 式 : => S コード/SQEP AND CYCLIC/NTE
DGENE/PCTGEN/USGENE ファイル
・ ある位 置 で切 断 され,鎖 状 で登 録されているため,開 始 位 置 を考 慮 する必 要 があります.
・ 環 化 の場 合 は,FEAT フィールドや標 題 ・抄 録 中 に CYCLIC のキーワードが収 録 されてい る場 合が多 いので,必 要 に応じて環 化 のキーワード/FEAT で検 索 します.
検 索 式 : => RUN GETSEQ コード/SQEP AND CYCL?/FEAT (または CYCL?)
<検 索 例 : 下 記 の環 状 ペプチドを調 査 する>
REGISTRY ファイル
・ 上 記 の環 状 ペプチドは完 全 な環 状 なので,GDYKR/SQEP, DYKRG/SQEP, YKRGD/SQEP, KRGDY/SQEP RGDYK/SQEP,の何 れの検 索 式 でもヒットします. => FILE REGISTRY L1 326 S GDYKR/SQEP ← G か ら 始 め る L2 54121 S CYCLIC/NTE ← 環 化 で 限 定 す る た め の キ ー ワ ー ド L3 319 S L1 AND L2 (検 証 ) 1 個 ずつコードをずらして検 索 します. L4 321 S DYKRG/SQEP ← D か ら 始 め る L5 319 S L4 AND L2 ← 環 化 さ れ て い る レ コ ー ド に 限 定 L6 324 S YKRGD/SQEP ← Y か ら 始 め ま す L7 319 S L6 AND L2 L8 322 S KRGDY/SQEP ← K か ら 始 め ま す L9 319 S L8 AND L2 L10 322 S RGDYK/SQEP ← G か ら 始 め ま す L11 319 S L10 AND L2 L12 319 S L3 OR L5 OR L7 OR L9 OR L11 ← 何 れ の 場 合 も 結 果 は 同 じ で す Arg (R) Gly (G) Asp (D) Tyr (Y) Lys (K)
12
=> D L3 SQIDE 1 ← L3 の 1 件 目 を SQIDE 表 示 形 式 で 表 示
L3 ANSWER 1 OF 319 REGISTRY COPYRIGHT 2012 ACS on STN RN 1380037-49-9 REGISTRY
CN Cyclo[L-arginylglycyl-L-α-aspartyl-D-tyrosyl-N6-(1-oxooctadecyl)-L- lysyl] (CA INDEX NAME)
FS PROTEIN SEQUENCE; STEREOSEARCH SQL 5
NTE cyclic
modified (modifications unspecified)
--- type --- location --- description
--- modification Lys-5 - undetermined modification ---
SEQ 1 RGDYK =====
HITS AT: 1, 2-5 **RELATED SEQUENCES AVAILABLE WITH SEQLINK**
MF C45 H75 N9 O9 SR CA
LC STN Files: CA, CAPLUS, TOXCENTER DT.CA CAplus document type: Patent
RL.P Roles from patents: PREP (Preparation); PROC (Process)
Absolute stereochemistry.
**PROPERTY DATA AVAILABLE IN THE 'PROP' FORMAT**
1 REFERENCES IN FILE CA (1907 TO DATE) 1 REFERENCES IN FILE CAPLUS (1907 TO DATE)
質 問 式 GDYKR/SQEP と SEQ フィールドの 並 びは 異 な って いますが,完 全 な環 化 の場 合 は,開 始 位 置 に関 わらずヒットし ます. HITS AT フィールドでヒット位 置 が表 示 されます 参 考 : 一 部 が環 状 化 された配 列 REGISTYR ファイルでは,一 部 が環 状 化 された配 列 については,特 別 な登 録 処 理 がされていないため, 開 始 位 置 を考 慮 する必 要 があります
13 DGENE ファイル
・ REGISTRY ファイルと異 なり,環 状 の配 列 はある位 置 で切 断 された鎖 状 の形 式 で登 録 されて いるため,開 始 位 置 を 1 個 ずつずらして検 索するしかありません.
=> FILE DGENE
=> RUN GETSEQ GDYKR/SQEP ← G か ら 始 め ま す L1 0 GDYKR/SQEP
=> RUN GETSEQ DYKRG/SQEP ← D か ら 始 め ま す L2 2 DYKRG/SQEP
=> RUN GETSEQ YKRGD/SQEP ← Y か ら 始 め ま す L3 1 YKRGD/SQEP
=> RUN GETSEQ KRGDY/SQEP ← K か ら 始 め ま す L4 1 KRGDY/SQEP
=> RUN GETSEQ RGDYK/SQEP ← R か ら 始 め ま す L5 64 RGDYK/SQEP => S CYCL?/FEAT L6 26800 CYCL?/FEAT => S L2 AND L6 L7 0 L2 AND L6 => S L3 AND L6 L8 0 L3 AND L6 => S L4 AND L6 L9 0 L4 AND L6 => S L5 AND L6 L10 38 L5 AND L6
=> D L10 SQIDE 1 ← RGDYK/SQEP で ヒ ッ ト し た 回 答 を SQIDE 表 示 形 式 で 表 示
L10 ANSWER 1 OF 38 DGENE COPYRIGHT 2012 THOMSON REUTERS on STN AN AZV31409 peptide DGENE
AA 0 A; 1 R; 0 N; 1 D; 0 B; 0 C; 0 Q; 0 E; 0 Z; 1 G; 0 H; 0 I; 0 L; 1 K; 0 M; 0 F; 0 P; 0 S; 0 T; 0 W; 1 Y; 0 V; 0 Others SQL 5 SEQ 1 rgdyk ===== HITS AT: 1-5 FEATURE TABLE: Key |Location|Qualifier| =============+========+=========+========================== Modified-site|1 |note |"This residue is condensed | | |onto residue 5 to form a | | |cyclic peptide" Modified-site|5 |note |"This residue is condensed | | |onto residue 1 to form a | | |cyclic peptide" 特 徴 表 (FEAT) に環 化 のキーワードが収 録 されて いるレコードに限 定 します (特 徴 表 でヒットしない場 合 は,標 題 ・抄 録 中 に環 化 があるレコードまで広 げます ((CYCL?) で検 索 )) 1 位 と 5 位 の アミ ノ酸 が 結 合 し,環 を形 成 しています 完 全 な環 状 配 列 の調 査 は,DGENE ファイルよ りも REGISTRY ファイルの検 索 方 法 が 簡 単 です