九州大学学術情報リポジトリ
Kyushu University Institutional Repository
古細菌Thermoplasma volcaniumの全ゲノムDNAの塩基 配列の決定と情報科学的解析
川嶋, 剛
https://doi.org/10.11501/3180684
出版情報:Kyushu University, 2000, 博士(薬学), 論文博士 バージョン:
権利関係:
3・7・3 未決定ゲノムDNA領域を埋めるコスミドクローンの選択
121個のλクローンのインサー卜DNAの塩基配列が決定した時点で、 27似
の コンティグとコンテイグをjf�成し ない7伽!のDNA断片が何られたこと は既 に示した。 これらのDNA断片の連結操作をくり返す過科で、11jJ .のクローン にも関わらず、 連結操作の度毎にクローンの並びが異なり、 クローンの111(1需が
一様に決定できない領域が存花することが|引かとなった。
図25に、 その具体例を示した。 コンティグ8 を形成する 入OP22の5' {JlIJは コンテイグ8Rを形成する人OCIO の3' 側と共通な配列を持つ(阿25, ケース
1 )。 一方、 λOP22の3' 側 はコンティグ8Rを形成する人OCI0の5' 側と共通 な配列を持つ(図2S、 ケース2)。 これらの境界には制限両手ぷS(/II3^'の認識配 列GATCが存在したことから 、 キメラクローンであることもII \ n変されたが、 [Ifd 末端に同じクローンと相向性を持つ配列が偶然にクローンイじされるrlJ能性は{lf いとも考えられた。
コンティグ8の 5' 末端に位置する λクローンとして人OOA8を得たので、 こ のλクローンのインサートDNAの塩基配列を決定し 、 λOOAHを含めた3 {I�Jの
λクローンで整列化を試みた(図25、 ケース3)0 3 クローンを同時に整列化さ せると、 凶25 のケース3に示したように整列化する。 これ は予惣された結果 と ー致した。 クローン内部に部分的に共通の配ダIjを持つ可能件を険証するため に、 整列の順序を入OOA8、 入OCI0、 λOP22でおこなった結沢、 λOCIOとλOOA8 にはやはり共通の配列が存在し(図25のケース4) 、 共通のl町ダIJからイミ ー致を 示す配列の境界には制限酵素SUlィ3AIの認識自己列GATCがιli�しなかった([χ1 25の 塩基配列)。
この結果から、 おそら く人クローン作成の過程で生じたキメラクローンが原 因で塩基配列が決定できないのではなく、 ケノム「のこの似j攻が他の領域と比
102
較して不安定であるため、 λ フyージを用いたク口-ニングシステムでは安定 したクローンが何られないことが原凶であり、 この領域の塩基配列を決定する ためには、 この領域に加えて周辺の安定な領域を含むクローンを、 人以外のク 口一ニンクシステムを用いてクローン化する必要があると考えた。
そこで、 千均4 0 k bp前後のインサ-卜 DNAのクローニングが可能なコスミ
ドベクターをmし1て作成したコスミドライブラ リーに対して、BAC クローン ßOE06のSP6プ口モーターによりイ午b文したRNAプローブと、 コンティグ8の ほぼ1.11央に町民するλ7B7_right.tcmpより作成したDNAプローブを用いて、96 {1Mのコスミトク[1-ンを同定化した肢に対するハイブリタイゼ-ションで陽性
ケIJーンをjE択した。BOE06のSP6フ口モーターにより作成したRNAプロー フをJiJし1たハイフリダイゼーシヨンの結果(凶2 6の])と、 λ7B7_right.tcmp より作成したDNAプローブを用いたハイブリタイゼーションの結果(図26 の 2)は、 ともに股上のF の7 の位置にあるコスミドクローン、 CF071が陽性クロ ーンであることを示していた。 この結果から、 CF071 クローンを選択し、 その
インサ-卜DNAの塩基配列を決定した。
CF0 71ク口一ンのDNAを制限酵素NOl 1で切断し、 パルスフィールドゲル電 気泳動システムにより泳動した結果が凶27-1である。 電気泳動の結果はCF071 のインサ-トDNAが、 35kbp前後であることを示した。 決定したCF071のイ ンサー卜DNAはお,040bpであった。
これによりλOP22の3 ' 側4,479bp が、 他の領域由来のDNA断片であるこ
とが明らかになった。 この|析j十はλOCI0 の'1' 末端に位置することが明かとな った。 また、 λ00A8は 5 ' 側5、860bp と3' 側9,109 bp のキメラクローンであ
ることが!万jらかになった。 この両断片はCF071に含まれた。(凶27-2)コスミ ドクローン CF071により、 コンティグ8の5' 末端とコンティグ0 0]の3' 末 端がすでに述結していることが明らかになった。 また、 CF071により他の領域
103
由来のDNA断片を除いた入OP22のヌ' 側、 すなわちコンチfゲ8の3' {HIJと コンティグ001の5' 末端の!日j3,l55bpが珂まることが明らかになった(1χ127- 2)。
したがって、 入クロ ーン121個、 BACクローン16刷、 PCR陀物ヌo州、 そ してコスミドクローンi個によって、 T. � 'o!ca niu111 の全ゲノムDNA出足配列 が決定した。 ゲノムサイズは1, 584、804bpであった(凶日)0 G/C 台;11はJ<).りη であった。 この値は既に報告されているT. �'()!cal1iUlll のG/C :;;.:1:: 3g仇(1 )と 非常に近い値であった。 ゲノムDNAの裏表両鎖のiit込円以リを決定した領域は 1,530,935bp で、 全ゲノムDNA の99.6lkであった。Id] -方向にのみ配列決定し た領域は53, 866bpで全ゲノムDNAの3.6lJéであった。
104
。川村JPRWAヘホ恥\川岩盤け
一月qnuEE明投
入|ロふ
ト2
4dO勾
。ーが時ωwh叩純Q』lム
|ム
。hい仁匂色村一恥絢G20丹羽円rZ心ゐ〈
。入
問ふ|中ヤhbehい」\
/ヘ川Kや おけ将いJ設け一
鑑川KJ
一ギ似回ωw
入|
口huLM
代hG垣市VAいい二度ωwehl口。hい〈Z白
川村J蛍社心吋巳戸何回記・2∞一』|ト
白ト ペ仰い嗣NUリ一《門寸'
肘百一Q∞''もそ小入
門r心'hーロah
〈Z出 一必斗笹川む
(ν吋リ一 ーも|山町口ohZ∞(30凶(〕白
OP22
N ...-1
OC10
メノ/シ ...〆〆 :',,:.<"χ7:l
29,739
... .... ....ノ ...ノト:-:・:・:-:・:・:.:・:.:令'X-:.>./
・/
a
OC10
FaPEB--
・4,EE ケースl
ω心O』仏〈
Z白
色52.2∞一』|ト白トペ
OP22
J ノ'.:/.'./.:./三三戸J
29.706
- ー に ーン:2;:芯予宍右目白:不5主芯.-:',:./・:ー・ .:...:...・...... γ・.,・ー
00A8
OP22
.""---'-T""' / ・., . 〆 .
,EE,且・
・‘,E' ケース2
OC10
- ー ー ・ ・ " ' ,'
s&主主不日不記事
OC10
.' ミ・1.-.・:-:ミ・:・:ミ・:・:-�:;:.:.:;:・:.:.:・:;:.:;:;手: ー
,ιZEph
・4.,..
ケース3
F
00A8 P寸
ケース4
凶 弘司
υ 凸
〈 ∞
N ...-1
...-1 ...-1
OP22
ιムネj
29,949
./.ø;:r;,.;ø二百三三・-.-.お-;-;w百古田�9;-;-:-'一一一一一一一一一一一一一一一一一一一一一一一一一;百三;.�-;.-;w;-;-;.;.;・;-;-�:-;:-百三.;.討・1 ・おく・
Eじ・11
o F・4
A A A A
F」
FL RA RA
争
中ム 巾la
-
-
‘
。口
- 円u-
A T
】-FU円U喧
中AFL 円し円U円し巾4A RA R凸巾A
TATÞ.AGATCT T:GG:A:A:C
TCTATACACA AATTGGTACA
TTTCAAGGAA :TTATCATAT
CTTGTGCTCT OC10
00A8
。、
。。
?、
\0 AAATCAAGCT
AAATCAAGCT AAATCAAGCT TTATGGACGT
TTATGGACGT TTATGGACGT TATATGATCG
TATATGATCG GATCG ATAAGAATAT
ATAAGAATAT Þ.TATTTAATT
ATATTTAATT
#10551
#10601 OC10
00A8 OP22
r甲N図
v、
寸 M
N
...-1
ω門戸O包〈
Z出。円四∞do凶O凶 入クローンの順番が一意に決定されないクローン。 塩基配列は不一致の部分の例。
コンテfゲ a番下の棒は連結の状態をあらわす。 格子i同一方向で2つ以上の クローンがw-悔している領域。 斜線と点;一本のλで決定された領域。 棒の右端に コンティゲの長さを示した。 単{立はbp。λOCI0とλOP22ではケースl、 ケース2の 2通りの系Ilみ什わせが竺じ、 OOA8が加わるとケース3、 ケース4の2通りの組み合わせ が生じた。tKA}基配石IJのl川角で11�んだ部分は、 配列の不一致の開始点がλライブラリーの ク口一ニンゲサイト、 Sau 3AIでないことを示す。
r'><J 25、
...-1 r
。 z
凶 与4
Q υ
〈 ∞
、、.Jr,,‘、ハU11ム
105
M CF071 M
97.0 一一
園-周.
‘・
岨咽‘
.国
咽・・・岨圃・
•
一一 4.4
「ヌ�27-] 、 イ ンサー 卜 DNAの堀基配列を決定した コスミドク ローン、 CF071のパルス フ ィ ールドゲル電気泳動像。
左右の数字は分子量をあらわす。 単位はkbpo 左端の矢印のVはベクタ ーのバンドをあらわす。 小 ヒ部の数字はク ローン番号、 Mは分子量マーカ ーを示す。 泳動条件は、 ]% アガロース、 0.5 xTBE、 14 oc、 14時間、 6V/ cm、 ramp 2秒ー10秒である。
ト一 一一一一一一一一-EQ
E立与�.!!æ
_一一一一一一一一→OK11
,ーーーー ーーーー ーーーーーーーー ーー一一 ー一一一 一一一一 一一一ー ー一一一一一一一一一ーーーーーー ー一_,・
3' オミ端のキメラ断片 P22
OC10
〉一一 一一一一一一一一一一一一一一一一一一一一一一ーー- -→
C F71 0OA8 #5861-#14969
トー---一ー・一一---ー--一一・ーー・一一-ーー・一一---一一-一一・P22
←・7B7・!!_gり日�mp_ィ
POA8 #1・#5860 、
図27-2、 コスミドクローン、 CF71を加えた連結。
一一一 で示したクローンは、 コンテイグ001の3'末端に位置していたクローン。
はコンティグ001の5 '末端に位置していたクローン。
コスミドクローン、 CF71によって、 コンティグ001の3 ' 末端とγ末端が連結し、 コンティグ8の位置が確定した。
コンティグ一番下の棒は連結の状態をあらわす。 黒線;正逆両方向で決定された領域。
格子i同一方向で2つ以上のクローンが重複している領域。 斜線と点; 1つのクローンで決定された領域。
棒の右端に長さを示した。 単位はbp。
0787 left
I万/そJJ/ーメン/〆/メシベ"./_':ー/ぷ/メ/γ;//ソガメ;ィ:;/釘悶祝日時間平間定 ::;:;:::祝;-:明不時四百日高野即日�革問明不況甲府府軍国・・・・・・・・・・・・E耽関与日::;:'///:;,/:;'::_;.. iiiii園田園田-,ノ〆ー〆;/J'曹'1
1 50,43�
コンテイグ8。
Vハロ
で示したものは、
円四回
�
ぐ
〈
図N∞J吋・3~ミミ豆、ョ除菌桝回目浬落尚行活迫「汁なロlい\道図。山wq,\か州事叫土ハ凋MNパペ州切「汁。お一〉守口|い\J珊一∞〉(リ守口lV\叫す一回以内問}附ぎJ斗ヤい\いum山一UN川T,V口lv\州伊♂ぴ叫io山月m三件J付対尚「汁前桝回目刻午応)凶E州伊♂持UJ叶o
目。。
3・8 決定した全ゲノム塩基配列の確認
λライブラリー(1)にキメラクローンが存仕したため、 λクローン聞に辿結
の誤りがある可能性があった。 そこで、 決定した全ゲノムDNAのI包装配列を 確認することとした。
同19にPCRによって増幅した入ライブラリー(11) のインサ-卜DNAの芯 気泳動像を示した。 いくつかのケローンでは、 PCRによるj判中[13がみられなかっ た。 それらのクローンは破棄した。 増幅が見られたクローン、 672 {[8] (96穴プ レート7枚分)に関して、 シークエンス反応をおこない112制分の左右[lLí末端 の塩基配列を決定した。 得ちれたクローンの左右両末端の配列を、 T. \'olcωlIW!1
の全ゲノム塩基配列に対してアセンブルした。 表6は、 左右両末端のI話器配列 を決定した112個のλクローンと、 末端の塩基配列と相|司な配列のゲノムDNA
上での位置、 および左右末端のゲノム上の位置から予想さ れる入クローンのイ ンサ-卜DNAの長さを示した。
λクローンの予想されるインサー卜DNAの塩基数 の平均は、 14,084.9bpであ
った。 最も長いインサ-卜DNAを持つクローンはAl1. 5 で、 その予想される 長さ は22,543bp であった。 最も短いインサー卜DNAを持つクローンはD01.3
で、 その予想される長さ は8,525bpであった。 λクローンのインサートDNAの 左右両末端の塩基配列をT. volcanium のケノムDNA J�にアッセンフルした 結果得られたインサ-卜DNAの塩基数と、 電気泳動の結�から見積もったイ ンサ-卜DNAの塩基数には栂端な差はなかった。 それゆえ、 これらの112伺 のλクローンのインサ-卜DNAの左右両末端の塩基配列におおわれた領域の ゲノムDNAの塩基配列には、 間違いがないと判断した。
コスミドクローンのインサ-卜DNAの左右両末端の出基配列決定は、 192倒 (96穴プレート2枚分)を用いた。そのうち20例のクローンのインサートDNA
の左右両末端の配ダIjが得られた。 閃29には左右両末端の塩基配列を決定した コスミドクローンを、 制限静素NOL Iで切断し、 ベクターとインサ-トDNA を切り離した後、 パルスフィールドゲル電気泳動をおこなった結果を示した。
表7には凶29の電気泳動像から測定したコスミドクローンのインサ-トDNA の長さと、 コスミドクローンのインサ-トDNAのT3プロモータ-側の頃基配 列と、 T7フロモーター側の塩基配列を、 工 νolcωzlum の全ゲノム塩基配列に 対してアセンフルした結果得られた、 両塩基配列聞の塩基数を示した。 パルス フィールドゲル電気泳動の結果から推定したコスミドクローンのインサ-ト DNAの塩基数と、 左右両末端の塩基配列を工 νolcanium のゲノムDNA上に アッセンブルした結果得られたインサ-卜DNA の塩基数には極端な差はなか った (表7)。 それゆえ、 これらの20個のコスミドクローンのインサ-トDNA
でおおわれた領域のゲノムDNA塩基配列には間違いがないと判断した。
図30-1と2には、 PCR産物のアガロースゲル電気泳動像、 およびそれらを 制限醇素で切断した結果得られた DNA 断片の電気泳動像を示した。 表8には PCR産物を切断した時に用いた制限酵素 と、 予想されるそれぞれの断片の分子 日を心した。 閃30-1と2の結果から、 PCR産物を制限酵素で切断すると、 全 て予知された分子量のDNA断片が得られた。 それゆえ、 これらの 7個の6 PCR 作物でおおわれた領域のゲノムDNA塩基配列には間違いがないと判断した。
これらの結果をあわせて、 全ゲノム上に時計表示で示したものが図31であ
る。 人ケローン、 コスミドクローンと PCR産物を合わせると全ゲノムをおおう ことになる。 この結果から、 決定した工\'o/caniul11 の全ゲノム塩基配列には、
おおきな欠尖、 伸入、 またクローン聞のつなぎ間違い等の、 誤りはないと判断 した。
際DNAデータベース(DDBJ/EMBL/GenBank)の、Iエントリーの配列はおOkbp 以下にする、 という規定に従い、 全ゲノムの出基配列を6断J十に切って笠録し た。 登録番号はAP000991-000996 である。
こうして決定し、 確認したT. \'()/ ca Il ÎllInの全ゲノム塩基配列は、 日本DNAデ ータパンク(DDBJ) に、 DDBJ大量登録システムにより登録した。 その際、 国
l i l
112
寸寸 。.。
寸.。
。ペヰC{。ヘホ…士山巳EE
。朴ハレ内心岳山叩り一 rEυ〉匂,E常国寸【fOo寸-r凶白ト×mc,代ーロ'Rト住-吋一と山市菰ぷ)rvヘGlhmhど当〉Q護側o広三当日ビ州首o
l下〈い村心崎副耐件余刊一件お(も但川叩 og菰ゾ情件以側、Lムヘ|それ代、てて(も入l口
L川代打川KJE駆け一隠楼
〆。N陀']
J )a 吋
ヘ
J
-・ 園 田 - -- - aE, ・ ρ J ・ 企竃gv
- E - - fi
il l - i l
i--jil
! ! i
ト.ik
v E
EEEE別刷E・E・--EES-E・E・----
)
かヱ ご〈N【〈CH〈
r、
〈
【豆NZ C-凶NE
。、
口
。、υ
わ4υ
C-∞
、。
∞ 者',0)6官訟の1:- tj)に時lt、lたλシロー/
clone L R length
E08 2 ヌ47.916 :134.180 13.736
E09 2 642.401 631. 962 10.4ヌ9
E09.5 373.6ラ6 359.890 13.766
I::IU 1.1ヌ1.828 1.114.287 17.541
E llj 91.698 79.702 11.996
FOU 1.083.722 1.066.992 16.730
FOl4 lラ55.031 1.542.238 12.793
F021 1.210.151 1.199.878 10.273
ド03.3 15.809 260 15.549
F加4 J .040.749 1.027.650 13.099
ドら� 5 1.442.402 1.429 ヌ10 13.092
F05.2 888.682 871.223 17.459
FOラ 3 l今29.0:19 1.212.668 16.371
FOS.4 210.016 196.012 14.024
ド05.5 1.543.572 uヌ0.118 n4月4
F師.3 323.771 309.316 14.455
F06.5 45.683 29.280 16.403
F07 I 138.854 126.74芦 12.109
F07.2 129.649 114.966 14.68月
F08.2 1.17汚442 1.161.856 13.586
F10.5 101.940 87 月44 14.396
F11.5 560.560 544.204 16.356
F12.2 848.712 8ヌ9.442 9.270
GOIヌ 月59.7ヌ8 544.195 15.543
G02.3 338.110 326.335 11.775
G02.5 1.222.857 1.206.350 16.507
G03 3 1.579.039 1.560.56ヌ 18.476
G03.5 767.06ヌ 751.416 15.627
G04.5 1.183.971 1.167.4男l 16.520
G05.3 308.700 294.702 13.998
G師 3 281.242 269.356 11.886
G06 � 1.277.28 I 1.261.313 15.968
G08 2 740.512 726.268 14.244
H02.3 8.982 1.580.617 13.164
HOヌ 2 486.754 475.579 11.175
HO.D 1.141.714 1.125.988 15.726
If03 4 1.12吋GヌO 1.108.469 13.561
1i04 3 101.143 84.819 16.324
1104.5 83.480 67.8ヌ8 15.642
H05.1 lヌ20.572 l.3 1 0.438 10.134
H05.5 588.078 576.071 12∞7
H06ヲ 1.037.827 1.020.970 16.857
H07 2 1.179.722 1,164.361 15 ヌ61
1108.5 1.066.591 1.054.245 12,346
H09.5 215.881 202.507 13.374
Hl1.1 17月979 164.24ヌ 11.7ヌ6
H12.2 1,090,037 1.071,571 18,466
手均長:14、084.9泡挙対 t- 7 "01(1/11111111υ,全)r ,ムD:\I\生基
clnne K kng1h
八02. .' 232.77S 217.<nl 1..\.807
1\02.4 977.601 9ó4.ì32 12.869
1\02 5 弓29.0i'\O � 14..j� 1 14."99
八O.ìì 4Q.16.j .j-1U4.� 12,H16
八Oヌ 4 2'i 1. 7'i白 2W.I.jO 12.616 八()ì..'i I.03H.27' 1.026.0(,0 12.2Lì
八00.1.1 1(,1.-'52 151,271 12.081
八αu 使)6.676 894.!ì1l0 11.796
八05 4 41('S�司 424可90 12.263
八06.2 21\4.1 (,6 271月19 12.847
八0<>月 7<'7.941 70.10,5% 17 ヌ4ヌ
1\(め5 193.269 17ii,()(í1 J'i.208
八072 9ヌ43リ 7iU65 14.874
八105 777.9ペリ 76<'丹4'i 12...\ 14
八11 2 92'U7リ 91 1.97ヌ 11.606
八11.5 1. J(,り234 1.10.1凸6R6 22.'i48
八125 9.ìO,2リ4 91iUO.1 I ].59 I
B01.5 1,100.24ヌ 1.0iiス11() 17.13月 110ヌ弓 1. J1 R.4!ì2 1.10.ì.2'凸 15.246
!l04司 74U22 7守男744 15.778
B().j.4 1 ヌ20.68.ì u似í.607 14.076
BO(, , IO:U月6 90.01H D.238
Iき06.:'i 2Hヌ 51月 2凸抗日,2 16.68,
11071 1.479.170 1.467 ヌ.'\0 11.840
H07.2 l.'iスR.998 1.:ヌ2司20ス 15.795
BOi>.2 8ヌ4,207 H21.220 12.987
B10.2 1.4月.'\.319 1.425芳40 9.779
BI() S ヌ19.4司4 '\07.4R9 11.94'i
B112 - 9,.921 78.852 1.'i.069
('01 1 3芦2.014 ヌ40.825 11.189
COl J J. 161.689 1. J45.73-, 1.'i.956
(可)'\2 1ヌ45.212 1.530.291 14.921
('0ヌ ヌ 1.49司149 1.474.16'i 18.984 ('0月 ヌ 1.456.416 1,443.824 12.592
(l')'i. 'i 1.391.(152 lヌ75.670 15.382
COH :' U6司6.ìO Uo;0.681 l今949
(、1(12 l 弓月7.622 1.'i24.033 iヌ 589
(司10..'i 1.553.629 1.54(1.419 D.210
4iil『
1,072 ヌM 1.(156.998 15λ661 " 1.260.272 1.247.201 13.071
ドーーーーー
J)() 1 司 りO:UI'i K94.990 8.525
l】01ベ 1 97.(}().j 18.'\.H9.j lヌ110
l】(l�2 。'i!ì.H47 616.111 12.7ス6
J)(l,2司 640.1K(l 6ユ8,'28 " .8昇8
J)()'2 1,�07.4Hl 1.296..ì09 11.172
D01.' 1. 197.43ヌ 1.18ヌ 179 14.254
])().j , 1.5:19.2..\8 U27,050 12.198
()().j 'i 1.4 <;0.612 1.4'\3.620 16,992
DO<' 2 1.:114.441 !.:'O().068 14.373
J)(]<' " 980.847 966. '58 14.489
J)(I'i 4 1.264.4(,2 1.248.449 16.013
l】(]月『 I.Hラヌ 1,570,999 l月65.1
I)(l{l , 124.647 109.757 14.890
J)(]H 2 リ64.270 リ'i1.554 12.716
l】10.2 99�U..\4 983.495 14.849
1)11ユ 'i8:'i.(){).j 男74.C)37 10.967
1.02.司 1.21こ7Hり 1.1 '17.4H4 15.30月
J:OこR 868,972 854.H12 14.160
卜0.'1月 1.14ì.1l21 1.12芦 785 17.2.'\6
]-{l.' , 8,S.9l)2 H、-'.420 l月572
H),\.j 。7H.61'i 。f>o.nx 1 Hコヌ7
1 0.'ベ 26H.714 25(1.'iOI 12.21ヌ
1 (l(、1 lヌ(U70 11..\.894 l戸476
10守ご 7'iH.I()1 746.1 ì.ì 11.968
卜07., 1,()(,\'i61 lιO'i(),2時o 1\281
t<6 ジE定
よ
璽 正 二三三三三二竺一一一一一一一一一 一 一一一一一一一一一一一一一一 三三
ll.�
lm.∞寸
10.広
11.3
ト
∞出。門向。ZEENJ-JU向
。蓉接点コ{セとど(も〈ZQ.ぺr1l択lp酬件余刊一EolFr肘川叩川駅)菰長販制代l口'hホト求G泡パKJK起B'ドwm盤監「一桂川KJV間以∞w閉山叩ω£山町〆刊誌。騨菰長MMW代lロ'Rトdb-sゎ幹州問区一)ハロ明'W、戸時ル町村二。士蓋蓋BM附山府間出巳「是S零細HHハ)仏,H~零細NR)仏(も毛川村(も,陪楼ハbEU臨時堕斗ヘ恥パKJHNホヤr-10門図
116
や司 国『E]ZOL 凶QNυ-υ凶〈
ー司
5ト
∞出。
戸口円四OZENJ【]凶凶凸NU-υ∞〈
』園、
ZOL
_..
決定したT.νolcaniumの全ゲノムDNA塩基配列の確認のために用いたコスミドクローン。
平均長: 38,410.1塩基対
cosmid L R length PFGE length
A7 1.057.791 1,017,457 40.334 40.000
AIO 164.051 129.441 34.610 36.000
All 1.227.659 1.189宝148 38.511 38.000
A12 461.030 419.051 41.979 39.000
B2 491.096 450.720 40.376 40.000
B6 355.286 322.503 32.783 34.000
B8 326.274 289,003 37.271 36.000
B10 1.357.861 1.320.178 37.683 36.000
B12 1.451.715 1,407.667 44.048 41.000
C2 146.585 109_t5_3;3 37.052 40.000
C3 1.030.680 990.929 39.751 38.000
C9 1.228.032 1.186.789 41.243 40.000
D1 350.264 315.132 35,132 36.000
D9 1,46Q1_650 1.429.087 37,.5_6J 38.000
D10 1.008.594 970.499 38.095 38.000
EI0 1.434.312 1.399.393 34,919 34.000
F8 1,004,944 966.421 38.523 38.000
H2 315.046 278.566 36.480 34.000
H7 1030.516 991.803 38.713 36.000
H9 998,082 954,946 43,136 40.000
115
表7、
R lどnglh R el\7、mぜ h3�ml'l\l nurnlwr ー.
nan、c
a、. 1 4 『 7
1.:::月4.944 1.26-1.678 9.7:0芦 /{/IId 111 5.9.' 1 1.<)49 1.719 13{1
八 1.�n.156 1.286.2ヌ7 14.mc� λ'/," 1 7.178 � �、『 1'1リ B 1月ü.:1.9�8 1.311.575 7.641> /{lIId 111 4 .. '>7" .2.111 9�Q Cl 1 ヌ18. 189 1.3�6. 7ll.t 8.516 BI//II HI ヌ40� 2.5Xリ 『、司
C2 1司2� 月<;2 U3�.369 7.818 正人/1 R\ ユ2S1 2.2.s� l、、『 J.()(、。
D 1.408.34芦 1.417 月:!2 9.17X λ'んI 1 7.ìl凸 l.H凸2
E 1.470.49<; 1.475月30 5.036 l:.w RI ヌ()62 1.<)74
F Jil"d I11 ーー
779.412 788はめ 8..W� 5.2ヌ7 月九<;X
G 796.492 8前日90 10..'99 B}:I 11 タmn 4.029 1.2S7
11 86月 781 877.916 1:::.136 B"III 111 6.2ユ『 タス% 5 1こ
877.887 89ヌ芦6� 17.676 XんI 1 12.207 4.727 742
559.9ヌ4 57ヌO� 1 1ヌ 111\ R"fII 111 五Oì日 ".oso
K 戸月日246 <;43.771 F戸26 IヘI 1 司491 �.035
LI B/lm 111 712 一
1.24ì.915 1.254.2ì5 J()..'21 6.'iX4 ヌ02S
1.2 1.251.904 1.261.418 9 .. ' I 'i J/wd 111 4 月\10 2.57ヌ lり4リ (,0-'
!11 958.2 19 96叫戸99 6.ìR 1 ,""d 111 ì. Iユヌ 1.9りo 1.2ó!\
N 949.127 95ミ9RI 凸H"'i 正'(1' RI 4凸凸リ 2.IH7
。 446.335 452.8!í1í 6芦52 PI/ I <;.4:1 I )_J 21
P BIIIII HI ん一一 一
432.903 446月戸4 l司45ユ 日ι89 2.615 2.1.1S
。 40<;.278 411.704 6.427 P.\I I 戸 ヌ71 1.0<;(,
民 182.:no ヌ98.18'i 15.8芦6 80111 HI 6.490 ヌ弓1\' 2."0リ 1.291 I .2.1� 7411
S 320.909 ヌヌ1月67 10.6"9 811111 HI ì.�"� 2.1\71 1 .9'i<; 1.41'Ì凸 ]_()りう
ECII RI .'57
ヌ04.89ヌ ヌ12.550 7.6月8 3.928 1.949 1.424
2
、 15.7月。 29.4ì1 13.702 X/r" I 7.H05 5.8リ7
3 45.561 ラ6.7ìO 11.170 ECII RJ 6.666 4.504
4 <;6.35ヌ 6.9丹凸 11.604 PII 1 究目而1 ヌ 1�'i 2.616
『 103.150 109.6α1 6.45 I F.m RV 司 912 1.469 1.070
6 175.901 178.162 2.262 1101 u�ed 2.262
7 215.770 218.190 2.421 nol used 2.421
8 232.6号O 239.'277 6.62丹 ECfI RI ヌ凸bì 2.945
9 2丹1.647 256.650 究α)4 ßI/川 111 2.9'7 1.201 866
10 355.171 ヌ60.011 4.841 Ecυ RV 2.9声。 1.891
11 37ヌラ18 382糾O 8.923 tι(1 RV 5.686 1.2ヌ7
12 :198.041 405.360 7ヌ20 l:.w RI 1.435 1.820 1. '67 691{
l' 41l.531 419.200 7.670 811111 111 3.921 3.749
14 490.890 月03.071 12.182 Fw RI 凸 6H4 2日1'10 2.61S
l.'i タ02.536 514.680 12.145 ι(0 RV 戸134 2.6S4 2.4 l' 1..,4, �71
16 528.922 538.4∞ 9.479 B“m 111 7.34' 2.1 '6
17 572.925 574.2∞ 1.276 not uscd 1.276
18 月87.97". 601.870 lヌ 896 P.\I 1 6.211 4.466 1.701 J.'iIK
19 601.421 61�.089 lヌ 669 l:.w RI 6.7ヌ9 4.36K 2.�62
20 614.606 628.481 lヌ 876 Bllm I1I 6.927 -'.280 I.wn 1.77(,
21 642.209 646.010 ヌ 802 not 11\巴d 1.K02
今、 658.721 660.535 1.8 I戸 not uscd
Uìl5
2J 678.492 690.72� 12 今32 F;c() RV 7.290 �.75芦 1. 187
24 (,90.181 702.430 12.250 B“m 11 I 4.0H2 3.252 2.9ヌ7 1.979
吋『 701.892 714. 110 12.219 正CII RV 9.217 J.92h 1.074
26 7Jì月18 725.910 12 ヌ7.' 1I111d 111 凸244 1.001 l.9Hり 1.139
27 777.671 779弓40 I.S70 nm used 1.870
2H 787.81-)8 796.90ヌ 9.016 ff!/Id 111 4ヌヌ0 , ìリH I.OHH
29 814.010 82U62 7.35ヌ 1ヘI I '.4戸() I.Hì7 1.) 1 .' ・弓:;�_1
'0 838.081 8ヌ9弓67 687 not u�cd 687
司l 848凸� 854.944 6.341 Xhll I 4.198 2. 14ヌ
,2 868.841 871 ヌ40 「号似1 nOI used 2.C;()()
月九 906月70 912.081 ヌタ1� 8ω111 11 I 4.749 76ヌ
34 9ìO.141 9月9.903 9.76ヌ ι(0 RV 7.769 I .4.j� 弓4リ
1ベ 9ヌ9.423 949.2�0 9.828 Fw RI Rスl桔 .\002 I.S()>;
ヌ6 1.142.921 1. 145.829 2.909 nOI uおじd 2.909
.,,7 1.2今 8.951 1.�44.02ヌ 15.07ヌ XI", I 8.652 6.421
ヌb 1.286.101 l、96.4月さ 10.:柄、 XIr" 1 7.874 今47S
ヌり U6�.519 1.375.744 12.226 Bllm I1I 9.77ち J.765 61>,
40 1..190.961 1.399.494 8.534 Ew RI ヌ 499 2.H.'月 2、()O
41 1.466.525 1.467.442 918 nOI used 918
42 1.492.807 1.503.320 10.514 Xhll 1 4.451 4.16K I.Xりq
4ヌ 1 芦02.765 1.512.980 10.216 Xhll I 7.200 1.016
44 1.512.448 1.52ヌ ヌ4ヌ 10.896 Xhll J 7タ61 , ,,�
4戸 8加790 814.160 7.37 1 p、I I '.96司 2.471 ,):'7 L t:払う{
rCR作物(I)jJ!�j'、 長さ、 それらを切断した時にJiJ( 、た制限hf jF:とf号制:Rð� [tJ よh
OR叶匙余ロ-2ことQ〈ZDJ1rIRー
が酬Mmt刊一
ε。いrm WMW)蔽ぽ 販制代|口'hホド合{ Q制作川村J主〔p'ドwm山「
也監吾川KJrm
リ一∞梢ωω£W
4一寸c巡蔽ゾ情件以側代|
ロ'Rhh民 同(む察制出ハ)円円、「hL町H村山町村一門。
主宰一塩B
wm匙監
荏Q零細 区一)円四r心察側出ハ)門同
(》心拍川KGmhMM詰(む「一色回附堕斗ヘ\勾早川KJN川町
一rNIC門図
、n てT fず}
卜、
、c mN寸刊門NNN-NCNひ{∞-Eト[匂-m-寸【門一N{{{(}一E
。、
x 寸寸〔寸刊寸{寸{)寸5円切門
トrhE
C門町内寸門戸町一川町一コ一(}刊。円低円ト刊⑤門町内一寸内門N
NN-NE un l
マ? 117
ト』
�
IX
XII
VI
図31、 決定した塩基配列の確からしさの確認。
緑はλクローンのインサートDNAの両末端から確認した領域、
茶色はコスミドクローンの両末端から確認された領域、 紫色は PCR産物により確認された領域を示す。
119
3.9 ゲノム上の同一遺伝子座のDNA塩基配列決定の重複度
ゲノム塩基配列決定 の戦略には、 大きく分けて、ゲノムを直接サフクローン サイズに断片化して、配列決定していくホールゲノムショットガン法( 1段階 法)と、 数lOkbpのゲノムDNA断片をクローン化し、その クローン の塩基配 列を決定した後、 並べてゆく整列化 クローン法(2段階法) の2つがあるo T
volcanium のゲノムDNAの塩基配列決定には後者のノ出去を月]いた。 2つの方
法において、 それぞれとのような長所と短所があるのか、 2つの力法の効率を 比較するため 、 ここで選択した 2 段階法のそれぞれの段階で得られた結果につ いて考察し、 1段階法と比較した。
はじめの 段階ではゲノムDNAを 断片化し、 入 、 BAC、 そしてコスミドのク 口一二ングシステムを 用いてクローン化した。 λクローンのインサ-トDNA の平均塩基長は15,576bpであった。 BACクローンのインサ-トDNAの手均培l
基長は 2 2,640pであった。 コスミドクローンは 1 クローンのみ決定した。 その イン サ-卜DNAの塩基長はお,040bpであった。 未決定ゲノムDNA領域をI可1 めるためにPCR産物も用いた。PCR産物の平均塩基長は 7,499bpであった。 名 DNA断片の長さの分布を図32に示した。λEMBL3ベクターは、9kbpから 23kbp
のDNA断片をクローン化できる。 図32 で入クローンのインサートDNAの長 さに9kbp以下のDNA断片が存在するのは、 全てキメラ クローンにIj 1来するも のである。
これらのクローンは、 さらに短い DNAI析H-に超百j皮切断して、M13 7アー ジベクターにサブクロ一二ンクし、Ml3サフクローンライフラリーを作成した。
DNAの塩基配列は、 これら M13 のサフクローンのインサ-卜DNAの ものを 決定した。DNAの塩基配列を決定したM13サフクローンの本数は、 34,217本 であった。 1回のDNAの塩基配列決定反応で読み取った出基数をあらわすヒス
120
トゲラムを|ヌ1 33にぶした。 ii;も本数の多かった読み取り塩基数は、675 から 700bpで、 10.3り日本で庇った(30.4(;{; )。 読み取り出基数の平均長は604bp であ った。 総I読みINりI品込数は20,530ユOObpであった。DNA塩基配列決定の平均重
惚j立は13であっ た。
これまで、 l1rùN何C ijlJ決定のlf{f支度、r、は全ゲノムを決定した際 の平均値とし て花火Jれている(たとえは参考丈献33)。 本研究の場合は平均亘複度は13で あった。 しかし、 この数仰は、ゲノムDNAの全て の領域の塩基配列を、 約13
1111 決定したということを怠昧しているわけではない。 また、 特定 の場所の塩基
配列を{I1J 11ミも決定し、それ以外の場所を 1固から2凶しか決定していないとい うことでもない。 、r-í�J重被度からはこのような情報を得ることが出来ない。 理 札!的には、11}頼するに足る亘復度で全ゲノム DNAの塩基配列が決定され、 重 彼度の分布にひずみが少ないという場合である。 ここで、全ゲノムDNAの 塩 基数をしbp、 1回 の塩基配列決定反応で、決定可能な塩基数をm塩基とすると、
もし、 1 II�]の塩基配列の決定反応で 決定可能な塩基数mが、 全ゲノムDNAの 出札数LとliiJじならば、言い換えると、Lとmの比が1ならば、 l回の塩基配
ダIJ決定J>i_)IL�で全ゲノム DNA の出基配列は重複度1で決定される。 塩基配列決
定)\()IL;をn 1[1]くり返せ ば、 弔禄!変はnとなり、 平均重複度と各塩基の塩基配列 決定の'I�[.惚!立は -放する。 しかしながら、 実際には、Lに対するm の比、L/m
は、 がJ 3000 である。 本石川'jzのI易f午、L/mは 1.584、804/600二264l.3 であった。
これはJljI ,�i!状態から大きくかけ離れており、 名塩基 の軍復度の分布にひずみが 't:_じることとなるの
T \'o!C{[l1illl7l のゲノム出県内政IJ決定の重後度を25 bpごとに計算し、 時計表
I J-;であらわすと1'%] 34のようになる。 赤で示した圭禄度が、 緑で示した平均量 惚!立と '3�しておらず、ゲノムDNAの領域ごとに異なっていることが分かる。
'H惚皮の分布のひずみにり-える要素を検討するため、 平均重複度を本研究の値
121
である13と、その半分の6に同定し、L/mの比を変化させていったときに、 主 復度の分布がどのように変化するかをシュミレーシヨンした。
図35-aにその結果を示した。 重夜度を6に同定した時も、13に同定した時 もL/mの比が1であれば場所に依存した亘後度の増減はなくなる。 し/mが2か ら3と増加するにしたがって、 重複!支の分布は広がり、 そ の徒L/mを 3、333ま で変化させても重複度の分布に大きな変イじは児られなかった。
1段階法で古細菌や真正細悶の全ゲノムDNA塩基配ダIJを決定する場f?、L/m は3,000-4,000となり、 部位特異的な:重複度の分布が増加することは避けられな い。 また、2 段階法を採用した本研究の場合、 はじめの段附で作成するゲノム ライブラリーのクローン のインサ-トDNAの塩基数をL2 とすると、L2 /mは 30から 40となり、 これも2から3という値を大きく仁川っており、 rY!)1け、1W 的な重複度の増減が生じることとなる。 今後、 塩基配列決定装百;の性能が[(1] L し、1回の塩基配列の決定反応で決定可能な塩基数が増加すれば、L/m の比は
減少し、 部位特異的な重復度 の分散も減少することが予想、される。
2段階法で 全ゲノムDNAの塩基配列を決定する場合 のもう1つの問題は、 は じめの段階で作成した入、 BAC、コスミドクローン のインサ-卜 DNAをアツ センブルしてコンティグを形成する際に、 隣同土のクローンと重複した部分が 生じることである。 はじめの段階で作成したクローンを 2段階1 �のサフクロー ンのDNA塩基配列を用いて重複度mで決定したとすると、 l 段階[ Jのクロー ンが隣のクローンと重なった部分は重複度2m となる。 それゆえ主政!支は中央 値を2つ持つような、 パイモータルな分布を示した(凶3 5-bのよ線2)。
本研究では、l段階自のクローンのインサ-卜DNAの嵐基長の、ド均は14.9kbp であり、 各クローンのインサ-トDNAの平均36.8�か隣のクローンと重なっ ていた。 1段階目のλクローン のインサー卜DNAの塩基配列は平均重複度 8て 決定された(図35-bの太線1)。 しかしながら、 全ゲノムDNAの出基配列は、
122
晃一引い防ム汁しドiu打川主位出苅河川口ペ一一治尚ω竺汁
(図説ケロ)汁おN)0
HX}-N
pa hU
V()伊川
{)(}{)A)寸 。
PA ・0
(xxmN
p 、y--Et
(」AX}
o
DNAの塩基配列を決定したλ、 BAC、 PCR産物の塩基長をあらわすヒストグラム。
横軸に階級、 縦軸に、 その階級に含まれる個数を示した。
lはλクローンのインサ-トDNAの塩基数、 階級の幅は500bpo 2はBACクローンのインサ-トDNAの塩基数、
階級の幅はlkbpo 3はPCR産物の塩基数、 階級の幅は500bpo
い\いい川て|
い\凶℃む)お湘〆
同{間恥卦」い(川汁J
日延毘郎防協週「J
N薄琵時代亙戸いγ判Hd剛滞期」川,ゆ
PCR
図32、
九可\ドシロZ〉む)軒桝回日中川一」尚一一片尚ヤ汁部砂J
酬や畑淘見)ゆ当30叫k守一件N辺震や附川内 い勘コ]「汁蕊ペ、イ一い汗ムペよJU〈設が
(図以ケ)0
川間浦河見)ゆ当30叫ドhNW川町、」JU〈
斗ーか汁ち一い一件
こが琵保守掛uT-Aq恥JOo
3
4
数 ウ
ト一一一
「一一ー
、 ..
2
BACヴ』
。 3
妻女 λ
4 自
ウ
14
12
) ( 'EEA
妻女
トーN
一一日〕
IIJ n
IV .
XII
-.-・. ・
xl
-. X
V111 IX -
V
九
Vl
J
VI!
oaDmN刊一哩Q定型
。川KJ係山叩〕総理(む入l口尽時£梢仰け一議謹リ一審判選〆議謹村一以露盤
。誠一時姐
川K
P臣 経hr r包出
代入
H hml
\の(b
EH
ト4・4f、
....-' 〆『
�(:�l OOOl
Ç;;Zl
Oç;;z OO�
Ç;;L2 S乙9 Ç;;L巴 OSL
CCCN 口 ご〉
ご〉...
o o o tこ〉
実話
ccc∞
CCC{)」[
COONH
図34、 T.volcωllumのゲノムDNA塩基配列決定の重複度の分布。
全ゲノム塩基配列を決定した際の塩基配列の重複度を25bp毎に平均し、
そのプロット を赤いラインで結んだ。 「司J�\円と左上にある数字は、 それぞれ重復度をあらわす。
緑の線は、 平均重複度13をあらわす。
126
rロ図
12ユ
a b
Eiv 内J 35 N(×100 00 bases)
10 10
30
0
0 2 4 6 8 1012141618202224 262830
「
30
25 25
20 20
15 15
」ω吋
5 5
0
32 0 2 4 6 8 10 121416182022 24 262830
「
図35、 l段階法と2段階法が重複度に与える影響に関するシュミレーシヨン。
a、 全ゲノムDNAの塩基配列が決定された段階での平均重複度を13と6に固定した条件で、 1回の塩基配列決定反応 で決定可能な塩基数(m)と、 決定すべき対象の塩基数配列(L)との比を、 1から2、 3、 5、 10、 50、 100、
そして3,333まで変化させた時の平均重複度の分布をプロットしたもの。 図巾のl、 2、 3,333はそれぞれ、
L/mがl、 2、 3,333のものに対応したプロット。
b、 2段階法のシュミレーシヨンとして、 l段階目で作成した整列化クローンのインサートDNAの平均長を14.9k旬、
1回のシークエンス反応で決定可能な塩基数を600塩基に固定し、 隣接する整列化クローンと重なりあった部分 を10%から100%まで10%ずつ変化させたときの平均重複度の分布をプロットした。 図中1の太線は、 T. volcanillm
ゲノムの塩基配列を決定した際のλクローンの決定に要した重複度の分布の実測値、 2の太線は、 T. volcanillmの全 ゲノムの塩基配列を決定した際の重複度の分布の実jRlj値をあらわす。 横軸:重複度、 縦軸:塩基数。
3・10 DNA塩基配列のアッセンプルの難易度
実際に全ゲノムDNAの塩基配列を決定する際に、 1段階j去を適用しようとす ると予想外の一事態が起こりうる。1段階法のために作成したDNA断片が、 十分
な毛彼度で全く任意に得られる可能性は低い。 超音波によりゲノムDNAを切 断すると、 特定の指基の組み合わせの部位で切断が起る傾向がある(大福、 未 発友)。 さらに、 対象生物のゲノム DNA の塩基配列が、 1段階法の適用を阻む ような構造を持つ1-1]能性もある。 例えば、[AIl][TJl] [G"] [CIl]や(ATGC) n のよう な配列でnが400,000であった場合、 ゲノム サイズは2Mtヲpとなり、 とちらも G/C含量は50%で、 G/C含量を調べた限りでは、 このゲノムDNAの塩基配列 を決定することは難しい計画には思えないが、1段階法でこのゲノムDNAの塩 基配列を決定することは不可能である。 もちろんこれらは極端な例であるが、
実際には、 l同の塩基配列決定反応で決定可能な塩基数mをこえる長さの反復 配ダIJがゲノムDNA上にいくつも存在した場合、 1段階法で得られた反復配列 DNAの塩基配列がゲノム上のとの位置に存在する反復配列に由来するのかを区 別してアッセンブルすることはできなし1。 しかしながら、2段階法を適用し、
以復配列の長さがクローンのインサ-トDNAの長さL2より短い場合には、 こ の問題は[n]避で、きる。
このようなゲノムDNA仁の構造を見つけるために、T. volcanium のゲノム DNAの出品配列を、 対象配列と参照配列の両方に用いたドットマトリックスを
作成しゲノム DNA上に同ー塩基配列がとの程度存在するか調べた。 比較のた めに全ゲノムDNAの塩基配列が報告されている4程の古細菌、 4種の真正細菌 と2 t'h �flの人[配ダIJに対して同様に解析した。 ここで解析したゲノムは1.50- 2.18Mbpであり、 ゲノムサイズはほぼ等しい。 また人工配列はどちらもT.
\ '01ω111U111とfr.!]じ1.58M切とした。 結果が図36である。 当然、 対象配列と参照
128
配列が全く等しいことから、 対角線上に一致のシグナルがdめられた。 比較す るDNA塩基配列が完全に一致することを佐認した後、これらのj益基配列は毛 要でないので削除した。 対角線上にあらわれた塩基配列を削除した後も、 ゲノ ムDNAよの他の領域に相向性を示す塩基配列が残った(f文J 36のb)。 それらの
塩基配列は、 ノイズを除いた後にも見られた。 この結果を他の占細問、 宍正副II 菌、 人工塩基配列の結果と共に示したのが表9である。 ここに心した数偵は、
ゲノム上にある基準を満たす相同な領域がいくつ存在するかを示しており、 l 段階法を適用したときに得られるDNA 断片のアッセンブルの附難さを矢nる指
標となる。 ここで比較したゲノム の中では、 T νolcα11lW71 のゲノム は相IwJ配 列がもっとも少なく、 1段階法にもっとも適したゲノムDNAを持つということ が明かとなった。
129