• 検索結果がありません。

3rd-jikken-comparative

N/A
N/A
Protected

Academic year: 2021

シェア "3rd-jikken-comparative"

Copied!
33
0
0

読み込み中.... (全文を見る)

全文

(1)

生命情報実験

A

「バイオインフォマティクスの道具箱」

比較ゲノム解析

慶應義塾大学生命情報学科

榊原康文,佐藤健吾

(2)

比較ゲノム解析

u

ゲノム配列情報の蓄積

n

決定済:真核生物 183 種, 原核生物 3956 種

n

進行中:真核生物 4628 種, 原核生物 15233 種

2013年4月現在,

GOLD Genomes OnLine Database v4.0

u

比較ゲノム解析の手順:

保存性の高い相同性領域を検索してアンカーを決定

ゲノム間の保存領域から,

n

遺伝子領域の同定

n

オーソログやパラログなどのホモログ遺伝子の解析

n

進化系統樹の解析

n

ゲノム再編成(挿入や欠失)やトランスポゾン(ゲノム中を

動き回る遺伝子などの領域)の同定

(3)

比較ゲノム解析

脊椎動物

脊索動物

前口動物

ホヤ

ヒト

マウス

ハエ

線虫

真正細菌

古細菌

大腸菌

霊長類

チンパンジー

真核生物

(4)

例題:2つの文章の比較解析

2つの似ている歌詞を比較してみる:

(浜崎あゆみ

"ever free")

Cocco "Raining")

同じ

「単語」や「短い文節」が両方の文章に出現

それは とても晴れた日で 泣くこと

さえできなくて あまりにも大地は

果てしなく 全ては美しく 白い服で

遠くから 行列に並べずに少し

歌ってた

それはとても晴れた日 おだやかな

笑顔に 白い花を一輪そっとそえた

美しいものは ときに悲しい生き物

やがてくる別れ感じて 黒い列なら

べずに

(5)

例題:ゲノム配列の比較解析

マイコバクテリアの

M. tuberculosis (結核菌)

M.leprae (らい菌)

アンカー(単語)

アンカーの対応関係

GGCAGTGCCCCAACCTCGGGGTCCTTCGGC GTCGGTGACGAAGAACCCCCCTTCTAGTAA CGAAACGGAAAGAATTACACACATGGCCAA GTCCACCAAGCGGCGTCCAGCACCGGAGAA GCCGGCCAAAGCGCGTAAATGCGTTTTCTG CGCCAAGAAGAACCAGCAAATCGACTACAA GGACACCACGCTACTGCGGACGTACATCAG TGAGCGGGGCAAGATCCGGGCCCGTCGGGT CACTGGTAACTGCGTGCAACACCAGCGCGA CATCGCGATCGCGGTGAAGAACGCCCGCGA GGTGGCTCTGCTGCCCTTTACCTCCTCGGC GCGATAACCGGACGGACGGTAACCGCTGCA AGCCCAACGGAAAGTACGAAAACGATGAAG CTGATTCTGACGGCTGATGTCGACCATCTT CGTCGGGTTCGTTCGGCGGCGGCGATGACG AACCGCCATTCTGACCCCAAGAACTGCAAA TCAAGAAACGGAAAGATAGACACTCATGGC CAAGTCCAGCAAGCGGCGCCCGGCTCCGGA AAAGCCGGTCAAGACGCGTAAATGCGTGTT CTGCGCGAAGAAGGACCAAGCGATCGACTA CAAGGACACCGCGCTGTTGCGCACCTACAT CAGCGAGCGCGGCAAGATCCGCGCGCGTCG GGTCACGGGCAACTGCGTGCAGCACCAGCG AGACATCGCGCTCGCGGTGAAGAACGCCCG CGAGGTGGCGCTGCTGCCCTTTACGTCTTC GGTGCGGTAGCGCCGAATGTCCAACGGAGA GTGCAAAATACCATGAAGCTCATTCTCACG GCCGATGTCGATCACCTCGGGTCCATCGGC

(6)

例題:ゲノム配列の比較解析

n

アンカーは,ゲノムを一つの長い文書と見なしたときに,

単語に相当するもの

rpsR1: ribosomal protein S18

遺伝子コード領域

GGCAGTGCCCCAACCTCGGGGTCCTTCGGC GTCGGTGACGAAGAACCCCCCTTCTAGTAA CGAAACGGAAAGAATTACACACATGGCCAA GTCCACCAAGCGGCGTCCAGCACCGGAGAA GCCGGCCAAAGCGCGTAAATGCGTTTTCTG CGCCAAGAAGAACCAGCAAATCGACTACAA GGACACCACGCTACTGCGGACGTACATCAG TGAGCGGGGCAAGATCCGGGCCCGTCGGGT CACTGGTAACTGCGTGCAACACCAGCGCGA CATCGCGATCGCGGTGAAGAACGCCCGCGA GGTGGCTCTGCTGCCCTTTACCTCCTCGGC GCGATAACCGGACGGACGGTAACCGCTGCA AGCCCAACGGAAAGTACGAAAACGATGAAG CTGATTCTGACGGCTGATGTCGACCATCTT CGTCGGGTTCGTTCGGCGGCGGCGATGACG AACCGCCATTCTGACCCCAAGAACTGCAAA TCAAGAAACGGAAAGATAGACACTCATGGC CAAGTCCAGCAAGCGGCGCCCGGCTCCGGA AAAGCCGGTCAAGACGCGTAAATGCGTGTT CTGCGCGAAGAAGGACCAAGCGATCGACTA CAAGGACACCGCGCTGTTGCGCACCTACAT CAGCGAGCGCGGCAAGATCCGCGCGCGTCG GGTCACGGGCAACTGCGTGCAGCACCAGCG AGACATCGCGCTCGCGGTGAAGAACGCCCG CGAGGTGGCGCTGCTGCCCTTTACGTCTTC GGTGCGGTAGCGCCGAATGTCCAACGGAGA GTGCAAAATACCATGAAGCTCATTCTCACG GCCGATGTCGATCACCTCGGGTCCATCGGC

(7)

ゲノム配列の進化

・・・GCG

T

TAGCCG・・・

・・・GCG

C

TAGCCG・・・

1

-5

4

-3

2

1

2

-5

4

-3

1

2

-5

-4

-3

1

2

3

4

5

ゲノム

A

ゲノム

B

転移

逆位

逆位

突然変異:

ゲノム再編成:

(8)

アンカーの計算

アンカーの抽出:

配列レベルで相同性の高い保存領域

anchor, pip, (local alignment)などと呼ばれたりする

数十から数百塩基ほどの相同領域で,エクソンや短い遺伝子

くらいの単位

アンカー

ゲノム

A

ゲノム

B

重複

欠失

転位

逆位

ゲノム

C

(9)

既存の手法の問題点を解決して,国産のマルチプルゲノム比較システムを開発

Murasakiのタスク:

u

(1)アンカー(単語)の切り出し,(2)アンカーの格納,

(3)アンカー間の対応関係付け

システムのスケール性:

u

単一CPUで,

100Mbp(ヒト染色体)オーダーのゲノム配列

までは実用時間内で計算可能

配列パターンの出現頻度に関する統計的解析が可能

並列化による高速化とより大きなゲノムの比較

Murasaki : 比較ゲノムシステム

アンカー切り出し

アンカー対応関係

(10)

Murasaki: 霊長類ゲノムの比較

l

ヒト(

human)

l

チンパンジー(

chimp)

l

アカゲザル(

rhesus)

Human 22+X+Y

Chimp 23+X+Y

Rhesus 20+X

12百万年

百万年

6

アカゲザル(マカク)

テナガザル

オランウータン

ゴリラ

チンパンジー

ヒト

原猿類

マーモセット

霊長類の系統樹

7

百万年

18百万年

25百万年

35百万年

60~65百万年

(11)

並列

Murasaki:霊長類ゲノムの比較

u

humanーchimpーrhesusの丸ごと(全染色体)の比較

human

chimp

(12)

human

chimp

rhesus

1 2 3 4 5 6 7 8 9

10

11

12

13

14

15

16 17

18

19

20

21 22 X Y

(13)

複数種のゲノム配列の比較解析

タンパク質をコードする遺伝子領域などの機能的に重要な

領域では,その機能を保存する必要があるため,変異や再

編成などが起こり難い

複数の生物種のゲノムを比較することにより,変化の多い

部分と少ない部分を同定する

「強く保存されている場所には遺伝子などの機能的に重要

な領域が含まれている」

(14)

n

オーソログ遺伝子

orthologous gene)

– 異なる生物の最終共通祖先が持っていた同一の遺伝情報

にゆらい

– ヒトのαグロビンとマウスのαグロビン

オーソログ遺伝子とは

・・・

C A T A T G G A

・・・

・・・

C A T A T G G A

・・・

・・・

C A T A T G G A

・・・

・・・

C A

A

A T G G A

・・・

・・・

C A T A T G C T

・・・

(祖先)

(生物種

A

(生物種

B

遺伝子

A

遺伝子

A

遺伝子

A

(15)

並列

Murasaki:霊長類ゲノムの比較

代表的遺伝子の比較:

ALDH2

(アルデヒド分解酵素)

human

chimp

rhesus

12番染色体

11番染色体(予測)

13番染色体

(16)

並列

Murasaki:霊長類ゲノムの比較

代表的遺伝子の比較:

ALDH2

(アルデヒド分解酵素)

human

chimp

(17)

表示システム

GMV:

GTK+ Murasaki Viewer

u

Murasaki の出力を可視化する

(18)

GMVへのブラウザ機能の追加

(19)

GMVへのブラウザ機能の追加

u

アンカーのつながりを確認

l

アンカーをクリックすると各配列上のアンカーで結ばれた

領域を表示

注目

箇所

(20)

GMVへのブラウザ機能の追加

u

データベースにもリンク可能

(21)

GMVへのブラウザ機能の追加

u

アノテーション情報の検索

(22)
(23)

Bacillus 属バクテリア

Bacillus 属は好気性の真正細菌

モデル生物として有名な枯草菌や炭疽菌などが,この種に含

まれる

納豆を作る納豆菌は,枯草菌の近縁種である

Bacillus 属3 種のゲノム配列,B. subtilis Merburg168(枯草

菌),

B. subtilis BEST195(納豆菌), B. subtilis ネパール株

(24)

納豆菌(

Bacillus subtilis natto )のゲノム

(Nishito et al., BMC Genomics, 2010)

T

A

納豆菌

ゲノム

G C

A

T

G

C

γ-ポリグルタミン酸

(γPGA)

ドラッグデリバリーシステム

水の浄化

(朝日新聞 朝刊科学面

2010年5月14日)

サプリメント

化粧品

(25)

納豆菌ゲノムの遺伝子解析

1. 総遺伝子数:4,429

納豆菌固有:

670 (15.1%)

枯草菌と共通:

3,612 (81.6%)

Bacillus属と共通:3,612+147 (84.9%)

2. DDBJにゲノム配列を登録

3. 納豆菌ゲノムブラウザー

http://www.natto-genome.org/

(26)

納豆菌ゲノムの解読から分かること

1.

ゲノム全長:

410万塩基対,総遺伝子数:4,429

2.

γポリグルタミン酸の合成関連遺伝子群

p

非常に高い吸水性,保湿力,カルシウム結合能 ⇒ 化粧品,石鹸,

サプリメント,納豆樹脂(紙オムツ,水質浄化剤),など

3.

ナットウキナーゼ遺伝子

p

プロテアーゼの一種 ⇒ 血栓溶解能,血圧降下,コレステロール

低下などの血中脂質改善

4.

エラスターゼ遺伝子

p

エラスチン(動脈などの弾性繊維の主成分)の分解 ⇒ 動脈硬化

症,高血圧,糖尿病,などの改善

5.

納豆菌ゲノムブラウザー

http://www.natto-genome.org/

(27)

納豆のねばねば(

γポリグルタミン酸)

納豆のねばねばは,アミノ酸の一つであるグルタミン酸が

10,000個以上直鎖状につながった高分子

グルタミン酸ナトリウムは化学調味料)

グルタミン酸同士の結合(ペプチド結合)に,タンパク質では

α位のカルボキ

シル基が使われているが,ねばねばでは

γ位が使われている

γポリグルタミン酸

生体のたんぱく質を構成するアミノ酸は

L型であるが,γポリグルタミン酸には

50-80%の割合で光学異性体のD型が含まれる

アミノ酸

グルタミン酸

2つの

カルボキシル基

側鎖

(28)

納豆のねばねば(

γポリグルタミン酸)

納豆菌にとっての

γポリグルタミン酸は,細胞過密で栄養源が不足したとき

の栄養貯蔵物質

p

γポリグルタミン酸は生産者である納豆菌自身によって分解される

p

分解酵素:

γグルタミルトランスフェレース

GGT,ヒトではγGTP),YwrD

p

クオーラムセンシングと呼ばれる細菌が

自己の密度(仲間が周りにたくさんいること)

を感知する仕組みが関与

γポリグルタミン酸の化学構造(自然界でも稀な存在で,Bacillus 属細菌の

一部で見られる)は,他の細菌・微生物などに貯蔵物質を横取りされないた

めの工夫

化粧品や飲料,石鹸などに

γポリグルタミン酸を添加した製品が市販されて

いる.カルシウム結合能に注目したサプリメント錠剤も市場に出ている

(食糧-その科学と技術- No.45 (食品総合研究所刊))

(29)

納豆菌,枯草菌のゲノム比較

枯草菌ゲノム

納豆菌ゲノム

アジア株ゲノム

納豆菌に大きな

欠失がみられる

(30)

納豆のねばねば成分合成のメカニズム

納豆菌ゲノム:

枯草菌(168)は納豆を作らず,納豆菌はねばねばを作る

大豆に枯草菌をかけた場合

大豆に納豆菌をかけた場合

(31)

トランスポゾンとは (可動性因子)

IS4Bsu1

5

Is256

6

ISBma2-like transposase

12

IS643-like transposase A

3

IS643-like transposase B

ISLmo1-like transposase A

11

ISLmo1-like transposase B

トランスポゼース

• ゲノム上を転移するための酵素

枯草菌:

トランスポゾンを一つも

持たない

納豆菌:

トランスポゾンを複数持つ

頻繁に移動しており,遺伝子を破壊

トランスポゼース

ITR

ITR

発見されたトランスポゼースの一覧

逆向きの反復配列

(32)

トランスポゾンによる遺伝子

yjoB の切断

納豆菌ゲノム

枯草菌ゲノム

yjoB:ATPase

タンパク質の分解に関与

納豆菌ではこのタンパク質が機能していない可能性

ねばねば合成遺伝子に挿入されると,ねばねばが作られな

ISLmo1-like transposase

(33)

納豆菌による

γPGAの合成経路

ComQ

ComP

ComX

ComA

ComA

P

DegQ

DegU

DegU

P

+

YvzD

YwsC

PgsC

PgsA

glutamate

γPGA

YwtD

glutamate

YwrD

DegS

SigD

YcgN

GltA

GudB

+

Spo0A

AprN

RocA

GltD

RocG

クオーラムセンシング

(自己の密度の感知)

シグナル伝達

γPGA合成

酵素

グルタミン酸

合成

γPGA分解

転写制御

ナットウキナーゼ

参照

関連したドキュメント

「比例的アナロジー」について,明日(2013:87) は別の規定の仕方も示している。すなわち,「「比

2 つ目の研究目的は、 SGRB の残光のスペクトル解析によってガス – ダスト比を調査し、 LGRB や典型 的な環境との比較検証を行うことで、

が前スライドの (i)-(iii) を満たすとする.このとき,以下の3つの公理を 満たす整数を に対する degree ( 次数 ) といい, と書く..

この数字は 2021 年末と比較すると約 40%の減少となっています。しかしひと月当たりの攻撃 件数を見てみると、 2022 年 1 月は 149 件であったのが 2022 年 3

点から見たときに、 債務者に、 複数債権者の有する債権額を考慮することなく弁済することを可能にしているものとしては、

目標を、子どもと教師のオリエンテーションでいくつかの文節に分け」、学習課題としている。例

1 単元について 【単元観】 本単元では,積極的に「好きなもの」につ

つまり、p 型の語が p 型の語を修飾するという関係になっている。しかし、p 型の語同士の Merge