JP02
JP02
JP02
JP02
(山形大工,奈良先端大)○林 稔久,木ノ内 誠
生体高分子の討論用データベース
∗,
工藤 喜弘,金谷 重彦
∗ [email protected]1
1
1
1 はじめに
はじめに
はじめに
はじめに
生体高分子の研究は、現在多くの研究者により行わ れている。多くの研究者がそれぞれ研究を進めている ため、意見の衝突も少なくない。その様な衝突が起こる 原因には個体差と測定誤差の問題があるが、差異の原 因は必ずしも明らかにされていない。研究者たちが意 見をすり合わせる事により、衝突意見の原因が明らかと なり、原因を明らかにすることで、その後の議論を誤っ た方向に進ませないことが生体高分子の本質の解明を 促進させる方法であると我々は考える。だが、現在この ような意見のすり合わせは論文を発表する方法、または 意見の衝突を起こした研究者が個別に連絡を取り合っ て議論を行う方法が主流である。だが、議論を論文で行 った場合、時間と手間がかかるのが現状である。また個 別に議論を行っては、同一の研究を行っているほかの 研究者はその議論を把握することができない。以上のこ とを踏まえ、我々は効率のよい議論の方法を提供する 生体高分子の討論用データベースを提案する。本研究 では 生体高分子の基本データの 1 つである、DNA、 RNA 塩基配列、ペプチド配列、構造に関して議論を進 める討論用データベースと、配列データの比較解析を 行うユーティリティとで構成する。2
2
2
2 生体高分子の討論用データベース
生体高分子の討論用データベース
生体高分子の討論用データベース
生体高分子の討論用データベース
本研究のデータベースで扱うデータの流れを図 1 に 示す。本データベースで扱うデータは、研究者の、ある 論文に対する意見や疑問や反論などの主張である。こ のような主張データを投稿してもらい、データベースへ と登録する。また、登録したデータに対する主張も受け 付ける。これにより、論文に対する主張と、データベース に登録されている主張に対する主張の投稿が行える。 この主張のやり取りによって討論を行う。関連データ同 士はリンクさせ、討論の様子をつかみやすくしている。こ れにより、討論を行っている当事者以外の研究者も、討 論を見ることができ、参加することができる。 図1 図1 図1 図1 データの流れ 主張の投稿と表示 主張の投稿と表示主張の投稿と表示 主張の投稿と表示 主張の投稿は、固定のフォームにしたがって行う。フ ォームについては図2に示す。必要事項を記入し、主 張の内容を投稿する。またその投稿内容は、対象生体 高分子名などからの検索や、主張対象からリンクする形 で見ることができる。ここで、投稿内容の表示例を図3に 示す。投稿意見は独立論文に準じた扱いを受けるよう に考慮する。 図2 図2 図2 図2 投稿フォーム 図3 図3 図3 図3 表示例 討論用 データベース 研究者 論 文 主張の投稿 データ登録 紹介データ 作成図4 図4 図4 図4 比較方法 図5 図5 図5 図5 比較する配列 データの保存形式 データの保存形式 データの保存形式 データの保存形式 データは、XML 形式で保存する。XML を使うことのメ リットは、可変長のデータが保存しやすいこと、データを 他の形式に加工する時の処理が容易であること、デー タの追加が容易に行えることがあげられる。XML 形式で データを保存し、プログラムによりデータベースへとデ ータを加工している。
3
3
3
3 ユーティリティ
ユーティリティ
ユーティリティ
ユーティリティ
ユーティリティでは、生体高分子のデータを解析する ツールを設けている。これにより、データを違った角度 から比較、解析し、新たな発見を生み出すことを意図し ている。解析ツールとして現在進めているのは、ペプチ ド配列の塩基配列レベルでの比較ツールである。 ペプチド配列の塩基配列レベルでの比較 ペプチド配列の塩基配列レベルでの比較 ペプチド配列の塩基配列レベルでの比較 ペプチド配列の塩基配列レベルでの比較 現在、実験に基づいて得られたアミノ酸配列ではなく、 塩基配列からの翻訳に基づいて得られたアミノ酸配列 も、発表されている。そのような配列の中には技術的な 問題などで塩基の読み落としをして、本来のペプチド配 列とまったく違う配列になってしまっている場合がある。 機能が同じでも配列がまったく違うという蛋白質は、実 際にそのような物もあるが、塩基配列に戻した結果、似 たような配列をしている場合がある。このような時のため に、ペプチド配列の塩基配列レベルでの比較ツールを 制作した。 比較方法と出力 比較方法と出力 比較方法と出力 比較方法と出力 まずアミノ酸をコドンとの対応に合わせて塩基 配列に直す。ここで問題なのは、1つのアミノ酸に 対応するコドンが1つではなく、1対多対応である ことである。そのため、アミノ酸とコドンを a,t,g,c 以外のアルファベットを使い 1 対 1 対応になるよう に割り当てる。アミノ酸によっては場合わけなどを 考え、1対 1 対応にした塩基に基づいて比較を行う。 比較の結果、図4のような出力になる。2 つの配列 をたてと横に並べ、塩基が一致する可能性のある部 分を表示している。塩基が連続で一致している可能 性があれば影で示すように、塩基が斜めに連なって 出力されるという物である。また、全体を一度に把 握するため同時にドットでも出力するようにした。 今回はドットの出力を見てもらう。図5に示す 2 つ の Transcarbamylase の配列は、影のつけてある部分 がまったく違ったアミノ酸配列になっている。この 配列を比較した。結果を図6に示す。塩基が連続し て一致するごとに色濃く出力してある。斜めに線が 見て取れれば、塩基配列が類似している可能性があ るといえる。その結果図6は、ほぼ対角線上に斜め に一本線が通っているのが見て取れる。そのため塩 基配列が似ている可能性があるといえる。比較のた めにランダム配列での比較結果を図7に示す。ラン ダム配列では、図6のような長く連なった線は見ら れない。そのため図5の 2 つの配列は塩基配列が似 ているといっても過言ではない。この比較ツールに より、ペプチド配列では相同性が見出せなかった配 列の塩基配列レベルでの相同性の検証を実現する。4
4
4
4 考察
考察
考察
考察
現在、本データベースのデータとして、現在手元 に集まった約 200 件の論文から、内容種類の紹介(図 2,3参照)として、20 件のデータをまとめた。今後 さらにデータをまとめると共に、データベースを利 用した結果を踏まえ、改良点を見出し、完成型へと 近づけていく。ユーティリティの方では、ペプチド 配列の塩基配列レベルでの比較の他に、ペプチド配 列からドメインの検出や、ペプチド配列から 2 次構 造の推定、DNA からイントロンの検出などのツール を開発していく予定である。データ引用文献
データ引用文献
データ引用文献
データ引用文献
[1] Takashi Abiko, Ikuko Onodeta, and Hiroshi Sekino, Chem. Pharm. Bull., 1982, 30(9), 3271-3277.
[2] David H. Schlesinger, and Gideon Goldstein, Cell, 1975, 5, 361-365.
[3] Jeffrey N. Davidson, and Christine B. Kern, J. Mol. Biol., 1994, 243, 364-366.
[4] J. N. Freund, and B. P. Jarry, J. Mol. Biol., 1987, 193, 1-13. ペプチド名 Transcarbamylase
文献 Jeffrey N. Davidson, and Christine B. Kern, J. Mol. Biol., 1994, 243, 364-366.
配列 NGLTITMVGDLKNGRTVHSLARLLTLYNVNLQYVAPNSLQMPDEVVQ FVHQRGVKQLFARDLKNVLPDTDVLYMTRIQRER
文献 J. N. Freund, and B. P. Jarry, J. Mol. Biol., 1987, 193, 1-13. 配列 NGLTITMWRLEEQTDRALAGPPADPVQCEPAVMWRRDSLQMPDEVVQ FVHQRGVKQLFARDLKECAARERHGCALHDSHSR g t n g g n g a y t t t t t g g g g g g g g g g g g g g g m m m a c g g g g g g g p g t p g g p g a P y t y y c 図 図 図 図7777 塩基配列が一致しない 配列の比較結果 図6 図6 図6 図6 Transcarbamylase の ドットでの出力