• 検索結果がありません。

クローニングのための遺伝学

N/A
N/A
Protected

Academic year: 2021

シェア "クローニングのための遺伝学"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

クローニングのための遺伝学

(前編)

Akifumi Shimizu

1. 遺伝のしくみ

○ 遺伝子(gene、DNA 配列)は、染色体(chromosome)に乗って遺伝する ○ 遺伝子が染色体に座乗する位置は決まっている(遺伝子座 locus) ○ 同一遺伝子座に座乗できる遺伝子(対立遺伝子allele)は、複数種が存在しうる ○ 染色体は、減数分裂時に乗り換える(crossing over)ことがある ○ 染色体が乗り換えることで、染色体上の対立遺伝子の組み合わせは変化する 一対の染色体からなる架空の2倍体生物の場合の遺伝の様子をみてみましょう(図 1)。こ の生物の体細胞は2n=2 本の染色体を持ちます。子孫へと遺伝情報を伝えるのは、卵と精子 という特別な細胞(配偶子)のみです。配偶子は減数分裂をして n=1 本の染色体を持っていま す(半数体、一倍体と呼ぶ)。図 1 ではアルファベットで遺伝子座の種類を、下付き数字で対 立遺伝子の種類を区別しています。 減数分裂時には相同染色体の姉妹染色体分体間で乗り換え(Crossing over)が、少なくとも 一回起こります。乗り換えにより、遺伝子座の位置は変わりませんが、同一染色体上の対 立遺伝子の組合せが変わります。生じる組合せの頻度は遺伝子座間の位置関係(遺伝距離) と関係します。図1 の例では、4つの配偶子のうち 2 つで対立遺伝子の組合せが変わって います(新たに A1B1C1D1E1F1G2H2とA2B2C2D2E2F2G1H1が生じた)。 実際には配偶子は一度に何種類もつくられます。沢山の子孫の対立遺伝子セットを調べ ることで、遺伝子が一緒に伝わる(連鎖する)か、伝わらない(独立する)かの頻度を調べその 比率をできるようになります。この比率は、遺伝子の染色体上の座乗位置と関係します。 イネなど二倍体の自殖性植物の場合、両親を交配して得た交雑当代(F1)を自殖した F2集

図1 減数分裂のモデル図(2n=2)

○はセントロメア, セントロメアを中心として短い方を短腕(A~C)、長い方(D~H)を長腕という a)普通の細胞 b)染色体の倍加 c)乗り換え d)4個の配偶子へ 2n = 2 (減数分裂中) (減数分裂中) n = 1 P1 P2 P1 P1 P2 P2 P1 P1 P2 P2 A1 A2 A1 A1 A2 A2 B1 B2 B1 B1 B2 B2 C1 C2 C1 C1 C2 C2 ○ ○

○ ○

○ ○

○ ○ ○ ○ D1 D2 D1 D1 D2 D2 E1 E2 E1 E1 E2 E2 F1 F2 F1 F1 F2 F2 G1 G2 G1 G2 G1 G2 H1 H2 H1 H2 H1 H2

(2)

2. DNA マーカー

染色体の乗換えにより遺伝情報がどのように継承されるかを追跡するための便利なツー ルに、DNA マーカーがあります。手軽に使える DNA マーカーの1つに SSR マーカーがあ ります。SSR マーカーは、”GAGAGAGA”のように単純な塩基単位の繰り返し(Simple Sequence Repeats, SSR)によって構成される DNA 配列を元にしたマーカーで、SSR は真 核生物のゲノム中に普遍的に散在していることが知られています。SSR の反復数は変異し 易いことが知られており、反復数の変異を断片長多型として検出することで複数の対立遺 伝子を識別することができます。SSR マーカーは、電気泳動法によって断片長多型を識別 するのが一般的です(図2)。 図2 電気泳動法による SSR 断片長多型の検出例 或るSSR マーカーについて断片長が異なる 2 倍体の自殖品種 A と B を考えます。品種 A のSSR 断片長を A 型とし、品種 B のものを B 型としたとき、品種 A と品種 B を交配した F A 型 B 型両方の断片長を持つヘテロ遺伝子型になるはずです。図 3 は、品種 A の (GA)6  6反復 (GA)10     10反復 GAGAGAGAGAGA GAGAGAGAGAGAGAGAGAGA CTCTCTCTCTCT CTCTCTCTCTCTCTCTCTCT PCRで増幅 PCRで増幅 電気泳動による断片長多型の検出

(3)

図3 SSR マーカーの断片長多型と遺伝子型の実例

他のDNA マーカーとしては、SNP(Single Nucleotides Polymorphisms、一塩基多型)マ ーカーがあります。SNP マーカーは最小単位の DNA 多型であり、もっとも高密度な多型 情報を得られます。

(4)

3. マーカーの連鎖

例としてイネの染色体4 に座乗する SSR マーカー(RM252 と RM241)の連鎖を見てみま しょう。品種G×品種 K の自殖 F2 86 系統について遺伝子型を調べたところ、表 1 のよう になりました。各マーカーの遺伝子型は、品種G ホモ型(GG), 品種 K ホモ型(KK)、ヘテロ 型(GK)の 3 種類で、2 種の組み合わせは 3 種類×3 種類の 9 種類になります(表 1)。

表1 この 2 マーカー間の組換え価を計算してみます。 マーカー間の組換え価がrであると仮定すると、RM252 と RM241 について、品種 G と 品種K を交配した雑種当代 F1個体の遺伝構成は次のようになるはずです。 この F1を自殖して F2分離集団をつくります。このとき、F1からできる配偶子は RM252 とRM241 について 4 種類に分類でき、 の頻度で非組換え型と組換え型の配偶子が生じます。卵配偶子(4 種類)と花粉配偶子(4 種類) RM252 RM241 86 GG GG 24 GG GK 4 GG KK 0 GK GG 4 GK GK 31 GK KK 3 KK GG 0 KK GK 7 KK KK 13 F1 組換え価

r

RM252 G K | |

r

RM241 G K 非組換え型配偶子 組換え型配偶子

頻度 (1-

r

)/2

r

/2

G

K

G

K

|

|

|

|

G

K

K

G

(5)

それぞれ、配偶子の頻度に応じて9 種類の遺伝子型クラスの期待頻度が記されています(自 分で紙に書き出して組み合わせ数がこの通りになることを確認しよう!!)。 RM252 と RM241 で実際に観測できたデータ数と上図モデルの結果をまとめてみると次 のようになります。

表2 F2 1 GG-GG (1-

r

)2/4 2 GG-GK 2(1-

r

)

r

/4 3 GG-KK

r

2/4 RM252 G G RM252 G G G G RM252 G G | | | | | | | | RM241 G G RM241 G K K G RM241 K K ① ① ① ③ ③ ① ③ ③ 4 GK-GG 2(1-

r

)

r

/4 RM252 G K K G | | | | RM241 G G G G ① ④ ④ ① 5 GK-GK 2(1-

r

)2/4+2

r

2/4 RM252 G K K G G K K G | | | | | | | | RM241 G K K G K G G K ① ② ② ① ③ ④ ④ ③ 6 GK-KK 2(1-

r

)

r

/4 RM252 G K K G | | | | RM241 K K K K ③ ② ② ③ 7 KK-GG

r

2/4 8 KK-GK 2(1-

r

)

r

/4 9 KK-KK (1-

r

)2/4 RM252 K K RM252 K K K K RM252 K K | | | | | | | | RM241 G G RM241 G K K G RM241 K K ④ ④ ④ ② ② ④ ② ②

(6)

組換え価 r の2 マーカーで、実際に観測される遺伝子型の個数は、確率関数としてあらわ すことができます。9 面のサイコロを振って(各面が表になる確率が fa~fi で与えられてい る)出る目の数を計測し(a~i)、観測値の出る確率を考えるのです。その確率関数は多項分布 の形であらわされ(N=a+b+c+d+e+f+g+h+i)、

( ) ( ) ( ) ( ) ( )

( ) ( )

( ) ( )

i i h h g g f f e e d d c c b b a a

f

f

f

f

f

f

f

f

f

i

h

g

f

e

d

c

b

a

N

r

P

!

!

!

!

!

!

!

!

!

!

)

(

=

のようになります。!記号は階乗を表し、N!=N×(N-1)×‥×2×1 です。 期待頻度の重複を考慮すると上式はもう少し簡単になって、

( ) ( )

( ) ( )

e e g c c h f d b b i a a

f

f

f

f

i

h

g

f

e

d

c

b

a

N

r

P

=

+ + + + +

!

!

!

!

!

!

!

!

!

!

)

(

1

のようになります。 多項分布は、高校の数学で習う二項分布の拡張版です。二項分布はコインの表裏など 2 つ の背反な事象を表す確率関数で、N 回コインを投げて表が出る回数が k 回(裏の出る数は N-k回)であり表になる確率がrのとき、

( ) (

k

)

N k

r

r

k

N

k

N

r

P

=

1

)!

(

!

!

)

(

のように表せます。 もし多項分布の意味がすんなりと理解できなくても、考え込まないようにしましょう。式 1 を見直してください。a~i、Nはただの観測値の数です。fa,fb,fc,fe も変数はたった一つr の関数です。rは0.0~0.5 までの値をとります。Excel のシート上でa~iを記入しておき (RM252-RM241 の場合の値は表 2 を参照)、あるrに対するP(r)を Excel の式で計算させ、 rの値を0.001~0.500 まで 0.001 刻みで計算させると、次のようになります。 図 組換え価の推定 RM252-RM241の組換え価 0 0.0000001 0.0000002 0.0000003 0.0000004 0.0000005 0.0000006 P(r)

(7)

を最尤法といいます。マーカー間の真の組換え価は神様しか知らないので、人間が組換え 価の情報を得るには、実際にマーカー遺伝子型の分離を観測し、観測データから組換え価 を推定するしかないことに注意してください。 最尤法の使用方法をより単純な確率モデル(二項分布)で説明しましょう。コインは表裏が 均等にできていれば表がでる確率は0.5 であると考えます。今、コインの表面の重さを裏面 より10%重くしてみました。表の出る確率はいくらになるでしょうか?、、、、この場合、実 際にそのコインを投げて表裏を計測し、観察値から予測をします。50 回コインを投げて表 は30 回出たとします。表の出る確率をrとして計測値のようになる確率を考えてみると、

( ) (

30

)

20

1

!

20

!

30

!

50

)

(

r

r

r

P

=

となり、rを様々に変化させてP(r)を見ることがでます。 表 3 表3 では、r=0.60 のときに P(r)が最大なので、表面を 10%重くした改造コインの場合の表 面の出る確率は r=0.60 になったと考えるのが最も尤もらしいです。r=0.6 とみなすモデル は、r=0.5 のままであるとするよりも 2.7 倍(P(0.6)/P(0.5))尤もらしいです。最尤推定量の計 算は、P(r)を最大にするrを求めればよく、前頁の図[組換え価の推定]のグラフを見れば分 かるように、P(r)の傾きが 0 になるところ、つまり P’ (r) =0 のところになります。 以上のP(r)のように観測データは既知として固定し P(r)を rだけの関数と考えるとき、 この関数を尤度と呼びます。今まで P(r)としてきたものは正確には L(r)と書くべきでもの でした。尤度L(r)を最大にするrは対数尤度で考えると便利です。RM252-RM241 の組換 え価に話を戻すと、式1(p6)から尤度は、

(

)

a i

(

)

b d f h c g

(

)

e

r

r

r

r

r

r

r

L





+









 −

×

=

+ + + + +

4

2

2

1

2

4

4

1

2

4

1

)

(

2 2 2

定数

となり、対数尤度は、

)

1

log(

)

2

2

(

log

)

(

log

L

r

=

定数

+

a

+

i

+

b

+

d

+

f

+

h

r

表 裏

r

P(

r

) 30 20 0.50 0.0419 30 20 0.55 0.0888 30 20 0.60 0.1146 30 20 0.65 0.0875 30 20 0.70 0.0370 30 20 0.75 0.0077 30 20 0.80 0.0006

(8)

(

)

1

2

2

)

2

4

(

)

2

2

(

1

)

2

2

(

)

(

log

2

+

+

+

+

+

+

+

+

+

+

+

+

+

=

r

r

e

r

r

h

f

d

b

g

c

r

h

f

d

b

i

a

r

L

が0 になるrを計算します。この等式はrの三次式になるので、結局は0≤r≤0.5 の中で logL(r) が最大になる値を探すことになります。 RM252-RM241 の観測データの場合、Excel で 0.001 刻みでrを変化させると、r=0.11 でlog L(r)が最大になりました。L(0.11)と L(0.5)の比を常用対数 log10であらわしたものを 特にLOD(logarithm of odds)スコアとよび、LOD スコアが閾値以上であると 2 つのマーカ ーは連鎖していると考えることができます(L(0.5)は 2 マーカーが独立の場合の尤度なので、 独立モデルとの差が大きく連鎖していると考える)。RM252-RM241 の場合の LOD スコア は、17.6 になり、連鎖の可能性は非常に高いです(共優性マーカー同士の場合 LOD が 3.0 以上なら連鎖しているといえる)。

4. 連鎖地図

2 マーカー間の連鎖の計算方法が分かれば、調査した全マーカーについてペアをつくり(N マーカーなら、N×(N-1)/2 回の計算量になる)、各々の連鎖を調べることができます。単純 なデータの場合は、ペア間の連鎖が閾値以上(たとえば LOD3 r<0.3)のものは同一連鎖群と みなして、マーカーを群分けすることができます。理想的にはこのときの群の数が染色体 の数になります。群内のマーカーの順序はさまざまな統計手法を用いて計算します(詳しい 計算は後述)。計算は、専用のソフトウェアを使うのが一般的です。 例:イネの連鎖地図の一部

図 3  SSR マーカーの断片長多型と遺伝子型の実例

参照

関連したドキュメント

(注 3):必修上位 17 単位の成績上位から数えて 17 単位目が 2 単位の授業科目だった場合は,1 単位と

注:一般品についての機種型名は、その部品が最初に使用された機種型名を示します。

 固定資産は、キャッシュ・フローを生み出す最小単位として、各事業部を基本単位としてグルーピングし、遊休資産に

(7)

(2)施設一体型小中一貫校の候補校        施設一体型小中一貫校の対象となる学校の選定にあたっては、平成 26 年 3

同研究グループは以前に、電位依存性カリウムチャネル Kv4.2 をコードする KCND2 遺伝子の 分断変異 10) を、側頭葉てんかんの患者から同定し報告しています

基準の電力は,原則として次のいずれかを基準として決定するも