• 検索結果がありません。

2004 年度修士論文

N/A
N/A
Protected

Academic year: 2022

シェア "2004 年度修士論文"

Copied!
47
0
0

読み込み中.... (全文を見る)

全文

(1)

2004 年度修士論文

たんぱく質における完全グラフを利用した rigid domain の同定法と SCOP への適用  

     

提出日: 2005 年 2 月 2 日 指導教員:山名早人助教授

       

早稲田大学大学院 理工学研究科 情報・ネットワーク専攻 学籍番号: 3603u129-8

益子 理絵

(2)

概 要

 アミノ酸配列上は類似性がみられないたんぱく質間でも,類似構造を持つたんぱく質が 多数存在する.たんぱく質の機能と立体構造は密接な関係にあり,類似構造を持つたんぱく 質間の機能には関係があると推測できる.また,たんぱく質の立体構造の中には進化的に 保存されてきた部位があり,その部位が機能に大きな役割を果たしている.PDB(Protein

Data Bank)に代表される,既知の膨大な構造データを利用して立体構造を比較すること

は,配列の類似性のない分子進化的に離れたたんぱく質同士の関係を評価する上で重要な 役割を果たす.

本研究の目的は,たんぱく質内部で,進化の過程で保持されている局所的な構造を同定 し,分類や解析することで,立体構造の構築原理についての知見と,多様性を生み出す機 構についての知見の得ることである.本論文では,構造データが既知で,互いに類似した 構造をもつ複数のたんぱく質について,その対応関係をグラフに表し,その中から完全グ ラフを見つけることで,局所的に共通する構造,あるいはそれらのたんぱく質の間で変化 しない硬い構造(rigid domain)を同定する方法を提案した.この方法では,まず,たんぱ く質の各アミノ酸をCαで代表し,そのCαをグラフ上の1つの点と考える.続いて,あ るCαペアについて,比較するたんぱく質間で対応するすべてのCαペアの距離のばらつ きが,ある一定範囲内にあるとき,その2つの点を結ぶ辺が存在するものとする.こうし て得られたグラフから完全グラフを発見し,進化の過程で保持されてきたrigid domainを 抽出した.評価として,たんぱく質構造データベースSCOP(Structural Classification Of Proteins)の階層的な分類を利用して,同一のFold,同一のSuperFamily,あるいは同一の

Familyに属する複数のたんぱく質に対してrigid domainを求め,その結果を考察した.

(3)

目 次

第1章 はじめに 1

第2章 関連研究 4

2.1 局所構造発見の位置づけ . . . . 4

2.2 立体構造の比較手法 . . . . 6

2.2.1 原子間距離による構造類似性のスコア . . . . 6

2.2.2 構造アラインメントと立体構造比較法 . . . . 7

2.3 局所構造の抽出手法 . . . . 10

2.3.1 残基が隣接している局所モチーフの決定手法 . . . . 10

2.3.2 残基が隣接していない局所モチーフの決定手法. . . . 11

第3章 完全グラフを利用したrigid domainの同定 13 3.1 グラフの利用方法とrigid domainの定義 . . . . 13

3.2 残基の対応づけ . . . . 14

3.3 rigid domainの探索アルゴリズム . . . . 14

3.3.1 行列の作成 . . . . 15

3.3.2 rigid domainの探索方法 . . . . 16

3.4 得られたrigid domainの表示 . . . . 17

3.4.1 Rasmolの利用 . . . . 17

3.4.2 構造の重ね合わせ. . . . 18

第4章 実験 20 4.1 Family:Ubiquitin-like . . . . 21

4.2 SuperFamily:Cytochromes . . . . 25

(4)

4.3 Fold:Flavodoxin-like . . . . 28 4.4 考察 . . . . 33

第5章 おわりに 34

付 録A PDBのデータフォーマット 39

A.1 全体のデータフォーマット . . . . 39 A.2 ATOM行のフォーマット . . . . 41

付 録B プログラムの仕様と実験環境 42

B.1 プログラムの仕様 . . . . 42 B.2 実験環境 . . . . 42

(5)

第 1 章 はじめに

 たんぱく質は,生物細胞の主要な構成物質で,細胞内の構造形成に関与したり,酵素と して生体反応を触媒するなどの機能を果たす生体高分子である.たんぱく質は,DNA上 にコードされた遺伝子塩基配列がRNA配列に転写され,そのRNA配列がアミノ酸に翻 訳されるというセントラルドグマの過程を経て(図1.1),一次元の鎖状のアミノ酸配列に 生合成されたものである.たんぱく質の立体構造は,20種類からなるこのアミノ酸配列か ら決定されており(アンフィンゼンのドグマ[1]),生体を形作ったり,代謝などの生命活動 を営む特異的な機能を発現している.

図1.1: セントラルドグマ

PDB(Protein Data Bank[2],[3])は,実験的に構造決定されたたんぱく質の立体構造デー タベースとして広く利用されている.X線結晶解析やNMR解析等の実験的方法によって 決定されたデータ登録数は増加しており,2005年1月の時点で29,000件を超えている(図 1.2参照).付録Aに,PDBのエントリー例を示す.登録されている膨大なPDBの構造 データを利用して,立体構造比較からの機能推定,立体構造の予測,機能部位の特定等と いった研究を行うことが可能となっている.

たんぱく質は,遺伝子重複や種文化を経ながら多様化してきた.この過程で,保存され てきた(あるいは保存されなければならなかった)部位と,多様性を増した部位を明らかに することが,たんぱく質を理解することに繋がると考えられる.また,その保存部位は機 能に関わっていることが確認され,部分的な配列及びその構造と機能の関係が議論されて いる.これまで,保存部位は主に生物学的実験に基づいて決定されてきたが,時間と手間

(6)

図1.2: PDBのエントリー数の推移([3]より引用)

がかかるため,近年では,判明済みの膨大なアミノ酸配列などの一次元データの比較から アルゴリズムによって自動的に保存部位を抽出する方法も利用されている.現在までに提 案されている手法の多くは,複数のアミノ酸配列における,アミノ酸の20種の文字の羅 列からパターンを発見するというやり方である.しかし,アミノ酸配列上類似性がみられ ないたんぱく質の間でも,類似構造を持つたんぱく質が多数存在している.このため,計 算量は多くなるが,文字の配列の比較ではなく,たんぱく質の構造データの比較から保存 部位を抽出することは,より正確な保存部位の抽出に繋がり,分子進化的に離れたたんぱ く質どうしに共通する保存部位の抽出も期待できる.

以上のことから,本論文の研究目的は,たんぱく質の立体構造比較を行うことで局所的 に共通する(アミノ酸配列が連続している・していないに関わらず)立体構造を同定し,進 化の過程で保持されている構造と多様性を生み出す領域を明らかにすることである.局所 的な構造を同定し,分類や解析することで,立体構造の構築原理についての知見と,多様 性を生み出す機構についての知見が得られるものと期待できる.

(7)

本論文の構成を次に示す.2章では,たんぱく質の立体構造比較に関連する研究を紹介 する.3章では,完全グラフを利用したrigid domainの同定方法について述べる.4章で は,構造データベースであるSCOP(Structural Classification Of Proteins)[5]のたんぱく 質について適用した結果を示す.5章では,本研究のまとめと考察を行う.

(8)

第 2 章 関連研究

立体構造のデータから局所構造を抽出するには,構造を比較して条件に合う構造部を発見 するという作業が必要である.現在までに提案されている構造比較の手法は,たんぱく質 のフォールド(立体構造パターン)全体を比較する手法が主であるが,構造比較過程で類似 性を計算するアルゴリズムが局所構造の抽出においても基本的に利用される.局所構造の 抽出に特化した手法はまだ少ないため,構造比較についての関連研究も示す.本章では,

構造データの利用における局所構造発見の位置づけについて述べた後,立体構造比較手法 について述べ,続いて,局所的な構造を抽出する手法について述べる.

2.1 局所構造発見の位置づけ

たんぱく質の立体構造のパターン(フォールド)は,1000種程度であると言われている.

立体構造は機能と直結していることと,配列よりも立体構造の方が保存的であるという ことから,まず全てのフォールドを明らかにし,それを軸に機能予測や構造予測などの研 究が行われている.局所構造であるモチーフの発見についての研究も,既知の立体構造の データベースを利用して行われる(図2.1参照).構造データを,計算機上で発掘または対 比することで局所構造のパターンを抽出し,局所的に強く保存されていると判明すればモ チーフの構造データベースに登録する.構造データベースもモチーフデータベースも,た んぱく質の立体構造予測,機能予測,そして構造分類のために利用される.

具体的に,局所構造(パターン)を発見するためのフレームワークは,図2.2の通りであ る.パターンは,実験的に直接発見する方法,比較アルゴリズムを用いて行う方法,そし てパターンマッチングによって発見する方法によって抽出される.図2.2中の辺(1)は,比 較した結果は1つ以上のパターンとして表されるためにさらなる何らかの処理を必要とす る可能性を示す.さらに,2つの構造を比較した結果を局所パターンとして表すことがで

(9)

図2.1: たんぱく質の比較とモチーフの発見([6]より引用)

図2.2: パターン発見のプロセス([6]より引用)

(10)

き,他の構造や局所パターンと比較できる場合,図中の辺(2)は,徐々により大きい構造 とマッチするパターンを見つける作業が可能であることを示す.構造が一致しているかを

見る”Matcher”と,構造比較を行う”Comparison”は,非常に似た作業であり,実際に同じ

手法を使用している場合がほとんどである[6].

2.2 立体構造の比較手法

立体構造の比較には,構造類似性のスコアを定義して計算する必要がある.構造類似性 のスコアは,構造アラインメントを行う際に得られる.構造アラインメントでは,探索ア ルゴリズムとスコアリング関数の定義の両面から研究が行われている.最も直接的な手法 は,残基同士の対応が予め求められている場合には,原子間距離によって構造類似性を計 算することである.まずは,この原子間距離を基にした基本的なスコア計算について述べ る.その後,残基間の対応自体も求める必要がある場合の,類似性のスコアが一番高くな るように構造アラインメントを行う手法について述べる.

2.2.1 原子間距離による構造類似性のスコア

残基同士の対応があらかじめ求められていて,なおかつ残基数が同一である場合には,

単純に原子間の距離から類似性のスコアを算出可能である.2つのたんぱく質の構造を比 較するときの尺度として利用されている,RMS距離(Root Mean Square Distance)には,

次の2つの計算方法がある[7].比較対象の2つのたんぱく質をABとする.cRM SD の計算式を次に示す.

cRM SD(A, B) = vu ut 1

N XN i=1

(kA(i)−B(i)k2)

cRM SDの場合は,Bは元の配列B0のままではなく,予めcRM SD(A, B)が最小となる

ように平行移動・回転を加えたものである.それには,B0の重心がAの重心と重なるよう に平行移動し,続いて最適な回転行列を求める.N は類似性を評価する原子の数であり,

A(i), B(i)は2つのたんぱく質の対応する原子座標である.続いて,dRM SDの計算式を

(11)

示す.

dRM SD= vu ut 1

N(N 1)

N−1X

i=1

XN j=i+1

(dAij−dBij)2

dRM Sの場合は,相互距離のそれぞれ(例えばi, j間)において,たんぱく質ABでど

のくらい一致しているかを比較指標とする.N は類似性を評価する原始の数, dAij はたん ぱく質Aの原子i, j間の距離である.cRM SDのように座標の変換を求める必要がなく,

理解しやすい.

これらのRM SDは,外れた要素がある場合には,その要素に引きずられる,たんぱく

質のサイズが大きいほど値が大きくなる傾向にある,重心より遠いほど重みが増すなどの 問題があり,類似の構造間の比較においてのみ有効な尺度である.また,単に原子間の距 離を考慮するのみだけでは,進化の過程で保存された部位や活性部位を無視している.こ

のため,RM SDのみを利用して構造比較を行う方式はほとんどとられていない.

2.2.2 構造アラインメントと立体構造比較法

立体構造の比較法では,類似性のスコアが一番高くなるように構造アライメントが行わ れ,残基が対応付けられる.現在までに,自動で立体構造の比較を行うプログラムも含め て,構造アラインメントを行うプログラムが多数提案されている.それらのプログラムと 採用している手法について,[7]と[8]を参考に,次の表2.1にまとめた.各手法について 簡単に紹介する.

CE(1998)[9]

CE(Combinatorial Extension of the optimal pathway)は,構造類似性に関して一定の 基準を満たすようにアラインメントした断片を組み合わせて延長していくことで,二つの 構造の最善なアラインメントを見つけようとする.構造類似性のスコアは,RM SDを利 用する.また,アラインメント中のギャップ(複数のたんぱく質間で対応関係にない残基) の最大値が制限されている.また,全体の指標として,ランダムな構造を比較する際に,

同じ長さのアラインメントを作成する確率を計算することによって得られる,Zスコアが 利用される.

(12)

表2.1:構造比較プログラムの一覧 プログラム名URL手法 CE[9]http://cl.sdsc.eduExtensionoftheoptimalpath DALI[10]http://www2.ebi.ac.uk/daliDistancematrixalignment Matras[11]http://biunit.naist.jp/matrasMarkoviantransitionofstrustureevolution SAP[12]http://mathbio.nimr.mrc.ac.uk/tools(DownloadOnly)Doubledynamicprogramming STRUCTAL[13]http://bioinfo.mbb.yale.edu/align/server.cgiDoubledynamicprogramming VAST[14]http://www.ncbi.nlm.nih.gov/Structure/VAST/vastsearch.htmlVectoralignment

(13)

DALI(1993)[10]

DALIでは,比較対象のたんぱく質各々について,Cα原子間の距離行列を作成する.そ の距離行列を比較することによって,どれだけ一致するかを構造比較する.もし,全体を 比較すると,たんぱく質の残基長の二乗の積に比例する計算時間がかかる.このため,局 所的な部分毎に区切って比較を行い,最後にこの局所部をMonte Carloシミュレーション で統合する.

Matras(2000)[11]

Matrasは,マルコフ連鎖による構造変化モデルを利用した,相同性と相似性の対数オッ

ズ関数という特殊なスコアを使って相同な構造類似性を認識する.構造類似性のスコアは 次の通りである.

S(i, j) = logP(i→j) P(j)

i, jを比較対象の構造的特徴(ここでは距離)とし,P(i→j)が,進化の過程でijに変 移する確率,P(j)が,jが偶然に存在する確率である.特徴として,残基主鎖のおおまか な比較を行う点と,マルコフ連鎖の進化モデルに基づく方法ゆえに,進化的な由来による 類似性を認識能力が高いことが挙げられる.

SAP(1999)[12],STRUCTAL(1993)[13]

SAPもSTRUCTALもDDP(Double Dynamic Programming)を利用する.2つの残基 を対応づけるかどうかのスコアを下層のDPで求め,その値を利用して上層DPで計算す る.下層では,2つの残基を対応付けるという仮定の下で,その制限の元で得られる下層 用スコアを用意する.仮想用スコアを利用すると,周囲の最適パスを求めることが可能に なる.最適パスに含まれていたスコア値を上層スコアに加算する.全ての残基ペアについ て行うと上層スコアが準備され,通常のDPを行える.

(14)

VAST(1997)[14]

VASTは,SSEをアラインメントするのにグラフ理論に基づいたアプローチを行う.同 じ構造を持つSSEを点で表し,対応するSSEの距離や角度が特定の制約に違反しない限 り,これらの点の間に辺が存在する.VASTでは,内部の二次構造単位の型や,相対配置 の類似性を高速に調べる.

また,プログラムとして自動化されてはいないが,他に提案されている構造比較の方法

として,Geometric Hashingによる方法がある.この手法のアルゴリズムを次に示す.

Geometric Hashingによる構造比較法(1991)[15]

Cα原子を点として扱い,座標軸を複数の点に着目して固定し,他の点を変換する.座 標軸を全ての点に着目して変換し,全ての場合の変換後の点を空間に重ねて配置したマッ プを作成する.別のたんぱく質も同様にマップを作成し,互いに最も点が重なる変換方法 を採用して重ね合わせる.この手法は,主鎖上の残基の順番には注目していないのが特徴 で,利点でもあり欠点でもある.

2.3 局所構造の抽出手法

たんぱく質のとりうる構造は,物理的な立体構造と化学的な制約を受けているが,それ らの空間的制約は,連続した残基間で依存関係にある.加えて,残基配列としては連続し ていない長距離間の残基どうしにおいても,空間的制約を受けている.たんぱく質の構造 データを利用して,残基が隣接している局所モチーフを決定する手法と隣接に関係なく局 所モチーフを決定する手法に分けて示す.

2.3.1 残基が隣接している局所モチーフの決定手法

たんぱく質のループ構造の分類手法のいくつかが,局所構造モチーフの自動抽出という 問題に適応し,拡張されてきた[16],[17].これらの手法は基本的に,重複も含めてたんぱ く質を断片化した大きなデータベースを作成し,このデータベースを利用してクラスタリ

(15)

ングアルゴリズムを適用するという方法である.概念は単純であるが,この手法は以下の 問題点がある.

1. 重複した断片間の類似性は,クラスタリングアルゴリズムにノイズを生む

2. クラスタリングアルゴリズムは,三角不等式を満足する類似性の指標を必要とする 3. 考えるうる最も適切な断片サイズを決定する問題が解決されていない

Micheletti[18]らは,2000年に,この初期検査を改良し,4,5,6残基からなる断片の重 複を許さないライブラリとし,一連の10つのたんぱく質を1˚A以内に収めた.

2.3.2 残基が隣接していない局所モチーフの決定手法

rigid domainの発見[19]

Nichols[19]らは,複数のたんぱく質構造において,どの2つの対応する残基を選んでも,

残基のCα原子間距離が一定値以内にある局所構造をrigid domainと定義した.興味の対 象である,ヒトヘモグロビンのα1単量体や二量体1のoxy構造とdeoxy構造に対して,詳 細にrigid domainを求めた.rigid domainを抽出する手法としては,まず,残基間距離を 閾値0.3˚Aに大きく制限し,この残基間距離が閾値を満たすペアを抜き出し,しきい値以 上の残基数を持つ集合を抽出する.その集合の中には,閾値を満たさない残基のペアが含 まれるため,このペアをより多く形成する残基を1つずつ取り除いていき,閾値を満たす もののみをrigid domainとして同定した.

ドロネー四面体分割による局所構造モチーフの決定[20]

Wako[20]らは,1998年に残基の隣接を義務付けないモチーフを決定する新しい方法を

提案した.ドロネー四面体分割法により,与えられたタンパク質の立体構造が占める空間 を,頂点をCα原子とする四面体で一意的に分割する.そして各四面体に,それを含む局 所構造の特徴を反映したコード(文字列)を指定する.ドロネー四面体分割を用いてタン パク質構造を四面体の集合としてネットワーク的様相を持って表し,各四面体にドロネー

1重合体(ポリマーpolymer)にできる,多重結合または複数個の官能基を持つ分子.

(16)

コードなるコードを付与することで,タンパク質構造をコード化(ドロネーコード)する.

このコードを用いてタンパク質構造の特徴をとらえる.ドロネーコードはタンパク質内の アミノ酸の,空間的近接と配列上での近接の情報を持つ.また,タンパク質の全体構造の 比較と,局所構造の比較の両方に対応できる点もドロネーコードの特徴である.コード番 号が同じ部分構造を集めてみると,実際互いによく似ており,その頻度が大きいものはモ チーフと呼ぶにふさわしい構造であることを明らかにした.

(17)

第 3 章 完全グラフを利用した rigid domain の同定

本章では,完全グラフを利用して,rigid domainを求める手法について述べる.まず,た んぱく質をグラフとして利用する方法と,rigid domainの定義について述べる.次に,残 基の対応づけについて述べる.そして,rigid domainの探索アルゴリズムについて述べる.

最後に得られたrigid domainの出力方法について述べる.

3.1 グラフの利用方法と rigid domain の定義

たんぱく質をグラフとして利用するための前提を述べる.グラフは,点と辺からなる.

たんぱく質を構成するアミノ酸の中で骨格をなすCα原子をグラフの点とする.続いてア ラインメントを行って,複数のたんぱく質の間で対応するCα原子(点)を決定しておく.

1つのたんぱく質のCα1とCα2の距離と,別のたんぱく質のCα1′とCα2′の距離が一定 値以内であれば辺が存在すると仮定する.複数のたんぱく質間でも同様に,全てのたんぱ く質間で対応するCα原子間距離が一定値以内である場合に,そのCα原子(点)間には辺 が存在すると仮定する.

次に,rigid domainを定義する.複数のたんぱく質構造に共通して存在する三次構造で,

どの2つの残基を選んでも,各々のたんぱく質の対応する残基間距離が一定値以内にある

構造をrigid domainと定義する(図3.1参照).たんぱく質をグラフとして表現した中か

ら,自点以外の全ての点と連結しているグラフである完全グラフを発見することが,すな

わち,rigid domainの発見である.さらに,完全グラフの中でも最大のものを求めること

が,より大きなrigid domainを求めることになる.

(18)

図3.1: rigid domainのグラフによる表現

3.2 残基の対応づけ

rigid domainを探索する前に,複数のたんぱく質どうしの残基の対応を決定するアライ

ンメントを行う必要がある.アラインメントの方法には,残基の配列の類似性から対応関 係を決定づける配列アラインメントと,構造の類似性から対応関係を決定づける構造アラ インメントがある.配列アラインメントは,配列が似ているものは構造が似ている,そし て,構造が似ているものは機能が似ているという考えのもとで,残基の配列の並びでアラ インメント行う.一方,構造アラインメントは,配列の類似性がそれほど高くなくとも,

構造が似ているものは機能が似ているという考えで,立体構造によってアラインメントを 行う.このため,構造アラインメントは配列アラインメントよりも精度がよいが,計算時 間がかかるという特長がある.本論文では,残基の対応付けを知るためにアラインメント を行うので,より精度の高い構造アラインメントを採用し,プログラムとしてCE[9]をマ ルチプルアラインメント化した,CE-MC[21][22]を利用する.

3.3 rigid domain の探索アルゴリズム

本節では,グラフの計算機での扱いとrigid domainの探索方法について述べる.

構造データから行列を作成し,その行列内を探索する方法をとる.

(19)

3.3.1 行列の作成

比較したい複数のたんぱく質に対して,それぞれCα原子どうしの距離行列を作成する.

dkijをたんぱく質kのCα原子i, j間の距離とすると,あるたんぱく質1のd1ijと別のたん ぱく質2のd2ijの距離行列の違いは,その差の絶対値で表せる

4ij =|d1ij −d2ij| (3.1)

4ijが閾値²以下であれば,どちらのたんぱく質においてもi, jの残基間は構造的にrigid であると判断でき,グラフのi, jの残基間には辺が存在する.たんぱく質が複数ある場合 も同様に,

4ij =|max(d1ij, . . . , dpij)−min(d1ij, . . . , dpij)| (3.2) を計算し,4ij が閾値²以下かどうかを計算する.こうして,探索対象のグラフ(図3.2の 左図参照)が作成される.

作成したグラフは次のように符号化する.頂点の集合をV ={v1, . . . ,vn}とすれば,グ ラフを各要素が0または1のn×nの行列として表現可能である.図3.2は,グラフを行列 に符号化する例である.左側の部分グラフV ={v3〜v6}は完全グラフを構成する頂点集 合であり,右側の行列でも該当するペアの符号はどの組み合わせでも1として表現される.

図3.2: グラフ表現(左図)から行列(右図)の作成

実際には,

4ij > ²ならばcij = 0, 4ij ≤²ならばcij = 1 (3.3)

(20)

として,行列C= {cij}を作成する.作成したCの各要素は,残基i, j間の構造関係が

rigidであれば1であり,そうでなければ0である.

閾値²として用いられる値は,求めたいrigid domainの目的による.構造の微妙な違い をも考慮したrigid domainを探索したい場合には値を小さくし,より全体の類似性を考慮

したrigid domainを探索する場合には値を大きくする.

3.3.2 rigid domainの探索方法

グラフが与えられた中から最大の完全グラフを探索する問題は,節点数の多項式時間で は解くことができないと予想されているNP-困難な問題の1つである.そこで,ヒューリ スティックに,一定値以上の大きさのグラフを効率よく探索する方法をとる.求める解は,

どの残基対をとってもcij = 1であるような,(残基数)Smin以上の濃度を持つ集合Dであ る.以下にアルゴリズムを示す.

1. 集合の大きさの下限値Sminを定める(下限値より小さい残基集合は無視) 2. 

X

j

ckj =sk< Sminとなる残基kについて,全てのijにおいてckj =cjk = 0とする   これを,cijが更新されなくなるまで繰り返す

3. sk≥Sminを満たす残基kの集合をAとし,集合Aに含まれる残基の数をn(A)で表す   F =φとおく.

4.  (4.1)

     A←A−F

     n(A) = 0ならば,(4.6)へ

     Tmax(ドメインの大きさ(残基数)の最大値)←Smin

     集合Aに含まれる残基のうち,skが最も大きい残基kを発見      集合F ={k},x= 0, w(x) = 0,h= 0, ej0 ←ckj   (4.2)

     g←h

     集合B ← {ejg= 1となる残基jの集合} −F      n(B) = 0ならば,(4.5)へ

(21)

     集合Bに含まれる残基を,skの小さい順に並べ替えて,リストu(g)の後ろに追加      x←x+ 1, h←h+n(B)

  (4.3)

     F ←F+u(h),w(x) =h      ejh ←ejg×cu(h)j,

X

j

ejh ≥Tmaxならば,(4.2)へ   (4.4)

     F ←F− {u(h)},h←h−1, h > w(x−1)ならば(4.3)へ      x←x−1, h←h−1

     x >1ならば,(4.2)へ,x≤1ならば,(4.1)へ   (4.5)

     n(F)≥Tmaxならば,集合F を記録する,Tmax=n(F), (4.4)へ   (4.6)

     複数のドメインが得られた場合,お互いの共通部分やドメインの大きさを      考慮して,最終的に出力するrigid domainを調整する

3.4 得られた rigid domain の表示

得られたrigid domainを視覚で認識するためには,たんぱく質の構造表示ソフトである

Rasmol[23]を利用する.その際,複数のたんぱく質のrigid domain部分を重ねて表示す

ることで,共通してrigidな部分とそうでない部分の構造を明らかにすることが可能であ る.そのためにはrigid domain部分が重なるように座標の変換を行う必要がある.本節で

は,まずRasmolの利用について述べ,次に座標の変換について述べる.

3.4.1 Rasmolの利用

たんぱく質の構造データを立体表示するために,分子構造を表示する3DソフトのRasmol[23]

を利用する.Rasmolは,1993年にR.Sayle氏(当時Edinburgh Univ. Biocomputing Re-

search Unit)によって開発されて以来,オープンソースとして改良がなされており,PDB

のファイル形式にも対応している.図3.3は,rasmolによるヘモグロビンの表示例である.

(22)

様々な構造の表示法が用意されており,広く利用されている.backbone表示では,たん

図3.3: Rasmolによる表示例

     (ヘモグロビンのbackbone(左),ball-and-stick(中),cartoon(右)形式の表示) ぱく質のCα原子のみをつなげて表示するため構造の骨格が分かりやすい.そのため,本 論文のrigid domainの表示は主にこのbackbone表示を利用する.

3.4.2 構造の重ね合わせ

rigid domain部分を重ね合わせて表示するために,1つのたんぱく質を他方のたんぱく

質に重ね合わせるように座標の変換を行う.重ね合わせの方法については,[24]を参考に し,重心をあわせてから回転行列を求める方法をとる.[24]のアルゴリズムは以下の通り である.

N個の残基i= 1...Nとして,重ね合わせる座標を(x1, y2, z3)と(X1, Y2, Z3)とする.

1. それぞれ重心(g, G)を求め,重心を原点の座標系に変換 重心ggx= 1

N XN

i=1

xi,gy = 1 N

XN i=1

yi,gz = 1 N

XN i=1

zi

重心を移動:xi ←xi−gx,yi←yi−gy,zi←zi−gz

重心GGx = 1 N

XN i=1

Xi,Gy = 1 N

XN i=1

Yi,Gz = 1 N

XN i=1

Zi 重心を移動:Xi ←Xi−gx,Yi ←Yi−gy,Zi ←Zi−gz

(23)

2. 次の行列Aを計算 A(1,1) =X

i

xiXi,A(1,2) =X

i

xiYi,A(1,3) =X

i

xiZi A(2,1) =X

i

yiXi,A(2,2) =X

i

yiYi,A(2,3) =X

i

yiZi A(3,1) =X

i

ziXi,A(3,2) =X

i

ziYi,A(3,3) =X

i

ziZi

3. 行列AA=U DV の形に特異値分解(Dは対角行列(3×3),U, V は直行行列(3×3)) 4. 回転行列R(3×3)を計算

Rij =Ui1Vj1+Ui2Vj2±Ui3Vj3

ここで復号は,detA >0ならば+,<0ならばをとる.

5. 座標を変換(重心座標系の(X1, Y2, Z3)からオリジナル座標系の(x1, y2, z3)へ) Xi ←R11Xi+R12Yi+R13Zi+gx

Yi←R21Xi+R22Yi+R23Zi+gy Zi ←R31Xi+R32Yi+R33Zi+gz

重ね合わせる部分については,求められたrigid domain部分のRMSDが最小となるよ

うに,rigid domain部分の座標だけを利用して回転行列を求める.その回転行列を使って,

残りの残基の座標も変換する.

(24)

第 4 章 実験

本章では,立体構造のトポロジーを解析して分類したたんぱく質のデータベースである

SCOP[5]のいくつかの階層についてrigid domainを求めた結果を示し,考察を行う.使

用するPDBファイルのデータフォーマットについては,付録Aに,作成したプログラム の仕様と実験環境については,付録Bに示す.

SCOPでは,二次構造の含有量の類似性に応じてall-α, all-β, α/β, α+βなどの構造ク

ラス(Class)に分類した後,それらをさらに立体構造の類似性に応じて分類(Fold)して,

そこから生物学的に分類(SuperFamily,Family)を行っている.SCOPは構造全体の分類 を行ったデータベースで,部分的な構造の違いは考慮されていない.また,各グループの 代表構造といったものは特に決められていない.

rigid domainを求める実験をSCOPのFamily,SuperFamily,Fold内のいくつかのたんぱ く質を対象に行った結果をそれぞれ示し,最後に考察を述べる.

(25)

4.1 Family : Ubiquitin-like

まず,同一FamilyであるUbiquitin-related内の8つのたんぱく質を対象とした結果を 示す.対象としたたんぱく質の階層と内容は,次の通りである.

1.Root: scop

2.Class: Alpha and beta proteins (a+b) [53931]

3.Fold: beta-Grasp (ubiquitin-like) [54235]

core: beta(2)-alpha-beta(2); mixed beta-sheet 2143 4.Superfamily: Ubiquitin-like [54236]

5.Family: Ubiquitin-related [54237] 内の異なるSpeciesから 1ogw,1a5r,1ndd,1lm8,1bt0,1m94,1j8c,1iyf

結果として得られた残基の対応表と閾値²の関係は次の表4.1の通りである.また,得ら 表4.1: Family:Ubiquitin-like関係のrigid domainに関する結果

抽出対象たんぱく質データ数 8 アラインメント結果残基数 67 閾値 ² 2˚A 4 ˚A 6 ˚A 8 ˚A 10 ˚A

rigid domain残基数 10 23 38 52 55

れたrigid domainをRasmolで表示したものを次に示す.rigid domainのみの骨格表示

が図4.1で,rigid domain以外の部分の骨格も含めて重ね合わせた表示を,図4.2に示す.

rigid domain部分が太線で,それ以外の部位を細線で示す.

rigid domain部の形状と,その他の部位の形状は重ね合わせの図によって知ることが可

能であるが,1つのたんぱく質内で,閾値によるrigid domain部の変化がどのようになっ ているか,1つのたんぱく質を選んで表示することで可能である.1a5r.pdbを選択し,閾 値によってrigid domain部分を色分けしたものを図4.3に示す.図4.3では,²= 2˚A時の rigid domainをmageta,²= 4˚Aをred,²= 6˚Aをyellowで表している.また,球はCβ 原子である.

(26)

図4.1: Family:Ubiquitin-likeのrigid domain部分

(27)

図4.2: Family:Ubiquitin-likeのrigid domain部(太線)とその他の部位

(28)

図4.3: 1a5r : sumo-1の閾値によるrigid domain部の違い

(29)

4.2 SuperFamily : Cytochromes

続いて,SuperFamilyのCytochromes内の6つのたんぱく質を対象とした結果を示す.

対象データの詳細は次の通り.

1. Root: scop

2. Class: All alpha proteins [46456]

3. Fold: Four-helical up-and-down bundle [47161]

core: 4 helices; bundle, closed or partly opened, left-handed twist; up-and-down

4. Superfamily: Cytochromes [47175]内の異なるFamily,異なるSpeciesから 1jaf,256b,2ccy,1bbh,1cgn,1cgo

結果として得られた残基の対応表と閾値²の関係は次の表4.2の通りである.得られたrigid 表4.2: SuperFamily:Cytochromes関係のrigid domainに関する結果

抽出対象たんぱく質データ数 6 アラインメント結果残基数 98 閾値 ² 2˚A 4 ˚A 6 ˚A 8 ˚A 10 ˚A

rigid domain残基数 27 62 92 95 98

domainを,rigid部以外の骨格も含めて重ね合わせた図4.4を示す.また,1jaf.pdbを選択 し,閾値によってrigid domain部分を色分けしたものを図4.5に示す.²= 2˚A時のrigid domainをmageta,²= 4˚Aをred,²= 6˚Aをyellowで表している.また,球はCβ原子 である.

(30)

図4.4: SuperFamily:Cytochromes内のrigid domain部(太線)とその他の部位

(31)

図4.5: 1jaf : cytochrome c’(HEM - Protoporphyrin ix containing Fe)の閾値によるrigid domain部の違い

(32)

4.3 Fold : Flavodoxin-like

続いて,Foldレベルでの比較を行った結果を示す.Flavodoxin-like内の9つのたんぱく 質を対象とした.対象データの詳細を次に示す.

1. Root: scop

2. Class: Alpha and beta proteins (a/b) [51349]

Mainly parallel beta sheets (beta-alpha-beta units) 3. Fold: Flavodoxin-like [52171]

3 layers, a/b/a; parallel beta-sheet of 5 strand, order 21345 異なるSuperfamilyからそれぞれ3つ

4. Superfamily: CheY-like 3chy,1dcf,1m2f

4. Superfamily: SGHN hydrolase 1wab,1esc,1ivn

4. Superfamily: Flavoproteins 1b1c,2fcr,1d4a

全たんぱく質から得られた残基の対応表と閾値²の関係は次表4.3の通りである.表4.3 表4.3: Fold:Flavodoxin-like関係のrigid domainに関する結果

抽出対象たんぱく質データ数 9 アラインメント結果残基数 61 閾値 ² 2˚A 4 ˚A 6 ˚A 8 ˚A 10 ˚A

rigid domain残基数 5 8 12 14 14

から,閾値が10 ˚Aでの残基数が12である.これは,たんぱく質の大きさとほぼ同じであ り,得られたrigid domainの残基数が閾値に対して少ない.そのため,各SuperFamily内

でrigid domainを求めた結果を比較した.その結果が,表4.3の通りである.

(33)

       

表4.4: Fold:Flavodoxin-like内それぞれのSuperFamilyのrigid domainに関する結果 Superfamily: CheY-like

抽出対象たんぱく質データ数 3 アラインメント結果残基数 109 閾値 ² 2˚A 4 ˚A 6 ˚A 8 ˚A 10 ˚A rigid domain残基数 39 64 69 94 108

SGHN hydrolase

抽出対象たんぱく質データ数 3 アラインメント結果残基数 132 閾値 ² 2˚A 4 ˚A 6 ˚A 8 ˚A 10 ˚A

rigid domain残基数 8 16 29 61 86

Superfamily: Flavoproteins

抽出対象たんぱく質データ数 3 アラインメント結果残基数 142 閾値 ² 2˚A 4 ˚A 6 ˚A 8 ˚A 10 ˚A rigid domain残基数 30 62 100 112 119

(34)

得られたrigid domainを重ね合わせ,rigid部以外の骨格も含めて図4.6に示す.また,

1b1c.pdbと3chy.pdbを選択し,閾値によってrigid domain部分を色分けしたものを図4.7 と図4.8に示す.²= 2˚A時のrigid domainをmageta,²= 4˚Aをred,²= 6˚Aをyellow で,Cβ原子を球で表している.

(35)

図4.6: Fold:Flavodoxin-like内のrigid domain部(太線)とその他の部位

(36)

図 4.7: (左)1b1c :NADPH-cytochrome p450 reductase(Ligand: FMN - Flavin mononu- cleotide)の閾値によるrigid domain部の違い

図4.8: (右)3chy: Che Y(Ligand SO4 - Sulfate)の閾値によるrigid domain部の違い

(37)

4.4 考察

本節では,前節までに得られた結果から考察を行う.

まず,rigid domain部分を重ね合わせて表示した結果の図4.2,4.4などから,rigidな部 分とそうでない部分が明らかになると同時に,閾値の変化によってrigidな部分の中でも

よりrigidな部分というものが顕著に表される.立体構造の重ね合わせでは,全体を重ね

合わせた場合には,比較的類似の構造どうしに対しては適用することができるが,共通の 部分構造をもつ構造どうしのローカルな類似性をみることはできない.この場合は,どの 領域に注目して重ね合わせるかが重要である.rigid domain部分を重ね合わせて表示する ことで,核となる局所構造,あるいはモチーフ構造を視覚によって得ることが可能である.

また,図4.6の中段のSGHN hydrolaseの通り,閾値を大きくしても,大きなrigid domain が同定されないものもある.同様に,図4.6からSCOPのFold階層が同じでも構造の細 部は自由度が大きく,SuperFamilyを超えて同じrigid domainを得るのは難しいことも明 らかになった.

1つのたんぱく質内で,rigidな部分がどう展開されているかについては,図4.3,図4.5, 図4.7,図4.8から判断することができる.特に,図4.5では,HEMと結合するための部 位として,HEM周囲の部分が特にrigidであることを示している.また,よりrigidなの は結合する内側の部分で,比較的ゆるいrigidなのがその周囲の外側であることもわかる.

そして,図4.7,図4.8からは,緑色で示されているリガンド1の結合部位が,rigid domain に含まれる場合も,含まれない場合もあることがわかる.

1リガンド()は,受容体(鍵穴)に特異的に結合することによって特定のシグナルを細胞内に伝達する.

(38)

第 5 章 おわりに

 本論文では,完全グラフの探索を利用してたんぱく質のrigid domainを求める手法を提 案し,SCOPの数種のデータに適用した.

解決すべき問題点の1つとして,計算時間の問題がある.本論文で行った実験では,残 基数が多くなるにつれて複数のrigid domainを得るのに時間がかかりすぎ,最初に見つ

かったrigid domainを採用して出力した.これを,複数のrigid domainを網羅的に現実

的な時間で得られるように改良し,それらをどのように統合もしくは取捨選択するかを考 える必要がある.

また,rigid domainと機能の関係についてもさらなる調査が必要であり,そのためには

生物学についての知識も必要である.rigid domainを求めるWebシステムを提供するこ とで,必要とする研究者などに役立ててもらいたい.加えて,rigid domainの大きさと閾 値の関係をSCOPでの全データに対して統計調査を行うことによって,SCOPの分類状 況や,立体構造の構築原理に関してより深い洞察が行えることも期待できる.

(39)

謝辞

早稲田大学社会学部の輪湖博先生には多大なご指導を賜りましたことを深く感謝いたしま す.研究の環境と指導を賜りました指導教授の山名早人先生にも,感謝いたします.また,

研究室の先輩である山田真介氏には,数多くのアドバイスを頂いた他,色々とお世話にな りましたことに感謝いたします.

(40)

参考文献

[1] Anfinsen,C.B. (1973) Principle that govern the folding of protein chains,Science, 181, 223.

[2] Bernstein,F.C., Koetzle,T.F., Williams,G.J.B., Meyer Jr,E.F., Brice,M.D., Rodgers,J.R. , Kennard,O. , Shimanouchi,T., Tasumi,M. (1977) The Protein Data Bank: a computer-based archival file for macromolecular structures,J. Mol. Biol., 112, 535-542

[3] Protein Data Bank (PDB) http://www.rcsb.org/pdb/

[4] Murzin,A.G., Brenner,S.E., Hubbard,T., Chothia,C. (1995) SCOP: a structural classification of proteins database for the investigation of sequences and structures, J. Mol. Biol.,247, 536-540.

[5] Structural Classification Of Proteins (SCOP) http://scop.berkeley.edu/

[6] Eidhammer,I., Jonassen,I., Taylor,W.R. (2000) Structure Comparison and Struc- ture Patterns, J. Comput. Biol.,7, 685-716.

[7] Koehl,P. (2001) Protein Structure Similarities,Curr. Opin. Struct. Biol.,11, 348- 353.

[8] Novotny,M., Madsen,D., Kleywegt,G.J. (2004) Evaluation of protein fold compar- ison servers,Proteins,54, 260-270.

(41)

[9] Shindyalov IN, Bourne PE (1998) Protein structure alignment by incremental com- binatorial extension (CE) of the optimal path, Protein Eng.,11, 739-747.

[10] Holm,L. and Sander,C. (1993) Protein structure comparison by alignment of dis- tance matrix, J. Mol. Biol.,233, 123-138.

[11] Kawabata,T., Nishikawa,K. (2000) Protein structure comparison using the Markov transition matrix of evolution,Proteins,41, 108-122.

[12] Taylor,W.R. (1999) Protein structure comparison using iterated double dynamic programming, Proteins Sci.,8, 654-665

[13] Subbiah,S., Laurents,D.V., Levitt,M. (1993) Structural similarity of DNA-binding domains of bacteriophage repressors and the globin core,Curr. Biol.,3, 141-148 [14] Gibrat,J.F., Madej,T., Spouge,J.L., Bryant,S.H. (1997) The vast protein structure

comparison method, Biophys. J.,72, MP298

[15] Nussinov,R., Wolfson,H.J. (1991) Efficient Detection of Three-Dimensional Struc- tural Motifs in Biological Macromolecules by Computer Vision Techniques, Proc.

Natl. Acad. Sci.,88, 10495-10499

[16] vanVlijmen,H.W.T., Karplus,M. (1997) PDB-based protein loop prediction: pa- rameters ofr selection and methods for optimization,J.Mol.Biol.,267, 975-1001 [17] Rufino,S.D., Donate,L.E., Canard,L.H.J., Blundell,T.L. (1997) Predicting the con-

formational class of short and medium sixze loops connecting regular secondary structures: application to comparative modeling, J.Mol.Biol.,267, 352-367 [18] Micheletti,C., Seno,F., Maritan,A. (2000) Recurrent oligomers in proteins: an op-

timal scheme reconciling accurate and concise backbone representations in auto- mated folding and design studies., Proteins,40, 662-674

[19] Nichols,W.L., Rose,G.D., Ten Eyck,L.F., Zimm,B.H. (1995) Rigid domains in pro- teins: An algorithmic approach to their identification, Proteins,23, 38-48.

(42)

[20] Wako,H., Yamato,T. (1998) Novel method to detect a motif of local structures in different protein conformations, Protein Eng.,11, 981-990.

[21] CE-MC

http://cemc.sdsc.edu/

bibitemce-mc01Guda,C., Scheeff,E.D., Bourne,P.E., Shindyalov,I.N. (2001) A new algorithm for the alignment of multiple protein structures using Monte Carlo op- timization, Proc. Pac. Symp. Biocomp.,6, 275-286.

[22] Guda,C., Scheeff,E.D., Bourne,P.E., Shindyalov,I.N. (2004) A multiple protein structure alignment server,Nucleic Acids Res.,32, W100-W104.

[23] R.Sayle and E.J.Milner-White (1995) RasMol: Biomolecular graphics for all, Trends Biochem. Sci.,20, 374.

[24] A.D.McLachlan (1979) Least Squares Fitting of Two Structures,J.Mol.Biol.,128, 74-79.

(43)

付 録 A PDB のデータフォーマット

PDBのデータフォーマットについて示す.まず全体のデータフォーマットについて示し,

特に構造データが記されているATOM行レコードのフォーマットについて示す.

A.1 全体のデータフォーマット

図A.1にPDBのエントリー例を示す.エントリーデータは,1行が80カラムからなるテ キストデータである.最初の6カラムが,その行の内容を示すヘッダである.ヘッダは,タイ トル,一次構造,二次構造,座標部などに分類されている.9−10カラム目は継続情報で,11 カラム目からは,ヘッダに対応した情報が記述されている.図A.1の例では,”HEADER”

行に記述されている通り,たんぱく質の種類が OXYGEN STORAGE/TRANSPORT,

公開日が21-FEB-03,PDBコードが1J40である.構造を示すたんぱく質の原子座標は,

ATOM行に記述されている.その他,生物種,実験方法,文献情報,分解能や配列など の情報が記述されており,最後は”END”行で終わる.

(44)

HEADER OXYGEN STORAGE/TRANSPORT 21-FEB-03 1J40 TITLE DIRECT OBSERVATION OF PHOTOLYSIS-INDUCED TERTIARY

TITLE 2 STRUCTURAL CHANGES IN HUMAN HAEMOGLOBIN; CRYSTAL STRUCTURE TITLE 3 OF ALPHA(NI)-BETA(FE-CO) HEMOGLOBIN (LASER UNPHOTOLYSED) COMPND MOL_ID: 1;

COMPND 2 MOLECULE: HEMOGLOBIN ALPHA CHAIN;

COMPND 3 CHAIN: A, C, E, G;

SOURCE MOL_ID: 1;

SOURCE 2 ORGANISM_SCIENTIFIC: HOMO SAPIENS;

SOURCE 3 ORGANISM_COMMON: HUMAN;

JRNL AUTH S.ADACHI,S.-Y.PARK,J.R.H.TAME,Y.SHIRO,N.SHIBAYAMA JRNL TITL DIRECT OBSERVATION OF PHOTOLYSIS-INDUCED TERTIARY JRNL TITL 2 STRUCTURAL CHANGES IN HEMOGLOBIN

REMARK 1 REMARK 2

REMARK 2 RESOLUTION. 1.45 ANGSTROMS.

SEQRES 1 A 141 VAL LEU SER PRO ALA ASP LYS THR ASN VAL LYS ALA ALA SEQRES 2 A 141 TRP GLY LYS VAL GLY ALA HIS ALA GLY GLU TYR GLY ALA SEQRES 3 A 141 GLU ALA LEU GLU ARG MET PHE LEU SER PHE PRO THR THR

HELIX 1 1 SER A 3 GLY A 18 1 16

HELIX 2 2 HIS A 20 PHE A 36 1 17

HELIX 3 3 PRO A 37 PHE A 43 5 7

ATOM 1 N VAL A 1 2.681 60.206 2.122 1.00 13.81 N

ATOM 2 CA VAL A 1 2.090 58.978 1.501 1.00 13.54 C

ATOM 3 C VAL A 1 0.789 59.379 0.795 1.00 12.64 C

ATOM 8773 CE1 HIS H 146 23.835 37.479 30.528 1.00 15.63 C ATOM 8774 NE2 HIS H 146 22.888 37.495 31.450 1.00 16.23 N ATOM 8775 OXT HIS H 146 27.809 38.614 32.493 1.00 15.29 O TER 8776 HIS H 146

HETATM 8777 NI HNI A 142 13.458 63.973 -17.042 1.00 9.67 NI HETATM 8778 CHA HNI A 142 15.029 62.298 -19.583 1.00 10.71 C HETATM 8779 CHB HNI A 142 11.041 61.526 -16.880 1.00 8.69 C

CONECT 9139 9135 9138 CONECT 9140 9138

MASTER 275 0 14 73 0 0 0 611364 8 376 92

END

(45)

A.2 ATOM 行のフォーマット

原子座標に関するデータは,ヘッダがATOMの行に記述されている.ATOM行のデー タのフォーマットは次の通りである.

COLUMNS DATA TYPE CONTENTS

--- 01 - 06 Record Name ATOM

07 - 11 Integer Atom Serial Number

13 - 16 Atom Atom Name

17 Character Alternate location indicator 18 - 20 Residue name Residue Name

22 Character Chain identifier 23 - 26 Integer Residue sequence number 27 AChar Code for insertion of residues

31 - 38 Real(8.3) Orthogonal coordinates for X in Angstroms 39 - 46 Real(8.3) Orthogonal coordinates for Y in Angstroms 47 - 54 Real(8.3) Orthogonal coordinates for Z in Angstroms 55 - 60 Real(6.2) Occupancy

61 - 66 Real(6.2) Temperature factor

73 - 76 LString(4) Segment identifier, left-justified 77 - 78 LString(2) Element symbol, right-justified 79 - 80 LString(2) Charge on the atom

ATOM行の例を次に示す.

12345678901234567890123456789012345678901234567890123456789012345678901234567890 ATOM 145 N VAL A 25 32.433 16.336 57.540 1.00 11.92 A1 N ATOM 146 CA VAL A 25 31.132 16.439 58.160 1.00 11.85 A1 C ATOM 147 C VAL A 25 30.447 15.105 58.363 1.00 12.34 A1 C

(46)

付 録 B プログラムの仕様と実験環境

B.1 プログラムの仕様

プログラムはC言語で作成し,トータルで約3000行である.

入力として与えるファイルは,対象としたいたんぱく質のPDB形式のファイル(複数) と,PDBファイル名を改行コードで区切って羅列したリストのファイルの2つである.出力 されるファイルは,閾値が2,4,6,8,10˚Aの場合について,重ね合わせ済みのrigid domain のみを表すPDB形式のファイルと,同じく重ね合わせ済みの全残基データのPDB形式の ファイルである.同時に,全残基データを重ね合わせたPDB形式のファイル用に,Rasmol

でrigid domain部分を色分けして強調するためのscriptも出力する.

B.2 実験環境

表B.1: 実験環境

CPU UltraSPARC-IIs 450MHz ×4

Memory 1024MB

OS Solaris 8 10/00

Compiler gcc version 2.95.2

(47)

研究業績

講演等

益子理絵,輪湖 博,山名早人(2004.12):”完全グラフを利用したタンパク質のrigid

domainの同定とSCOPへの応用”,日本生物物理学会第42回年会

その他 ( コンテスト )

Imagine Cup 2004 日本大会準優勝 ソフトウェアデザイン部門:益子理絵,岩橋永悟,

仲沢由香里,本田大

参照

関連したドキュメント

ここで,図 8 において震度 5 強・5 弱について見 ると,ともに被害が生じていないことがわかる.4 章のライフライン被害の項を見ると震度 5

以上の結果について、キーワード全体の関連 を図に示したのが図8および図9である。図8

6-4 LIFEの画面がInternet Exproler(IE)で開かれるが、Edgeで利用したい 6-5 Windows 7でLIFEを利用したい..

手動のレバーを押して津波がどのようにして起きるかを観察 することができます。シミュレーターの前には、 「地図で見る日本

ASTM E2500-07 ISPE は、2005 年初頭、FDA から奨励され、設備や施設が意図された使用に適しているこ

高さについてお伺いしたいのですけれども、4 ページ、5 ページ、6 ページのあたりの記 述ですが、まず 4 ページ、5

ある架空のまちに見たてた地図があります。この地図には 10 ㎝角で区画があります。20

平成 27 年 2 月 17 日に開催した第 4 回では,図-3 の基 本計画案を提案し了承を得た上で,敷地 1 の整備計画に