遺伝子多型の意義
疾患との関係
潜在的リスクの判定 薬剤効果の推定
個人の同定(
DNAプロファイリング)
互いに連鎖していない多型の度合いの高い
10-15遺伝子
ゲノム
ヒトゲノムの構成 核ゲノム
l ~3200Mb
(
3200000Kb),
24本の線状
DNAl 1.5
%が
coding DNA(約
3万遺伝子。そのうちの,少なく とも
5%は翻訳されることのない
RNA遺伝子)。
Geneduplication→DNA
シークエンスファミリー
, primate-specific segmental duplicationl 3
%が非翻訳領域や制御エレメント,機能しない遺伝子 関連シークエンス(
2万偽遺伝子,遺伝子断片)
l 95
%が
non-coding DNA,
head-to-tailの繰り返し配列レト
ロトランスポジションにより形成された(
cDNAのゲノムへの挿
入)。
ミトコンドリアゲノム
l16.6Kb
,
1個の環状
DNA,
97%が
coding DNA。
37遺伝子。
l2
本の相補鎖は,重鎖(
G-rich)および軽鎖(
C-rich)から成る
lヒト細胞内には
1000-10000コピー含まれている。
l
母系遺伝(精子のミトコンドリアゲノムは寄与しない)
ミトコンドリア遺伝子
l37遺伝子のうち,H鎖(重鎖)に28個,L鎖(軽鎖)に9個コードされている。
l22遺伝子からミトコンドリアtRNA,2遺伝子からミトコンドリアrRNAが合成 される。残りはミトコンドリアリボソームで合成される呼吸鎖複合体サブユ ニットの一部のポリペプチドをコードしている。
lミトコンドリアの酸化的リン酸化酵素群は約100種のサブユニットが関与 し,その多くは核遺伝子にコードされている。その他のミトコンドリアタンパ ク質,すべてが核にコードされている。
lミトコンドリア遺伝子はイントロンが無く高密度で,一部はcoding DNAが オーバーラップしている。遺伝子間が1,2塩基の非コード塩基しか離れてい ないため,転写後に終止コドン(UAA)が導入される場合がある。
lH/L鎖が逆方向へ継続して転写され,多遺伝子転写産物が出来,その後,
切断されて成熟mRNAになる。
09_02.jpg
09_03.jpg
ヒト核ゲノムの染色体
l24
種類の線状の二本鎖
DNA(
50〜
280Mb)
lDNA
分子にヒストンおよび非ヒストンタンパク質が結合して染 色体(
22種の常染色体および
2種類の性染色体)を形成
l
染色体は染色体バンド法により識別可能。
l
染色体には,セントロメアおよび非セントロメアヘテロクロマチ
ンから成る構成的ヘテロクロマチン(
200Mb,恒常的に凝縮され
転写不活性な領域)とユークロマチン(
3000Mb)が存在する。
ヒトゲノムの塩基組成
l
ゲノム全体では
GC含有率は
41%。染色体間でも
38-49%のば らつきがある。また,同一染色体の部位によってもばらつきがあ る。
l
脊椎動物ゲノムでは,
CpG配列(同じ
DNA鎖上でシトシンとグア ニンが
5’→3’方向に並んだ配列)の存在が期待値の
1/5程度の頻 度しかない。
l
脊椎動物では
CpG配列のシトシン残基の
5位炭素がメチル化の 標的となる。ヒト
DNAでは
3%のシトシンがメチル化されるが,そ のほとんどが
CpG配列。
lCpG
配列は化学的に変化を受けやすく,チミンに変換されやす
いにもかかわらず,転写活性の高い
DNA領域には高い
CpG密度
を示す
CpGアイランドがある。
縦列遺伝子重複
反復配列
16
番染色体での染色体内および染色体間での重複化領域
ヒトゲノムの遺伝子分布密度
l
ヒトゲノムにおける遺伝子の総数は〜
3万と考えられている。こ の中にはポリペプチドには翻訳されない
RNA遺伝子が
5%以上含 まれている。
l
ゲノムサイズがヒトの
1/30である線虫のゲノムには
2万遺伝子が 含まれており,生物学的複雑性とゲノムの複雑性(遺伝子数)は パラレルではない。
l
分裂中期(
metaphase)の染色体ゲノムに
CpGアイランド領域を ハイブリダイズさせる研究から,テロメア近傍領域に,遺伝子が高 密度で分布し,染色体によって遺伝子分布密度が異なることが明 らかになった。
lGC-rich
領域が比較的遺伝子分布密度が高い。
09_04.jpg
RNA
機能の多様性
RNA遺伝子
lヒト核ゲノムには〜3000のRNA遺伝子がある。
リボソームRNA(rRNA)
l700-800種あるヒトリボソームRNA(rRNA)遺伝子は,各遺伝子が多くの偽遺伝子と共 にタンデムに繰り返されたクラスターを形成している。例えば,28S, 18S, 5.8SのrRNA遺 伝子は,それぞれが30-40タンデムリピートした一つの転写単位として,5本の染色体に コードされている。
l細胞質リボソームRNA遺伝子が多数の反復配列として存在する理由としては,遺伝子 量を増やし,タンパク合成に必要とされる膨大な細胞質リボソームを供給するためと考え られる。
転写RNA(tRNA)
l497種の細胞質tRNA遺伝子と,324種のtRNA由来の偽遺伝子がある。細胞質tRNA遺 伝子はアンチコドンの特異性から49ファミリーに分けられる。
l61の異なるセンスコドンを認識するために,一部のtRNAはコドン認識の厳密性が緩和 されている。
核内低分子RNA(snRNA)
lsnRNA は100種近く遺伝子がある。
lsnRNA分子は,ウリジンに富み,スプライソームの機能に必要である。
核小体内低分子RNA(snoRNA)
lsnoRNAは100種以上の遺伝子がある。
lsnoRNAは核小体におけるrRNAの成熟過程での修飾に関与する。
teromerase RNA:テロメラーゼのRNA成分
SRP RNA(signal recognition particleは,膜を通過するタンパク質輸送に関 わる)
マイクロRNA(miRNA)
l約22塩基のRNA分子で,他の遺伝子に対して,antisense regulaorとして機 能する。
lヘアピン様二本鎖RNAを形成する約70塩基の前駆体から,ribonuclease III により切り出されることで機能する。(ribonuclease IIIの活性を利用して,RNA interference(RNAi)が案出されている。22塩基のアンチセンスRNA分子
(siRNA)を細胞内へ導入し二本鎖RNAの形成を促すことで,これが
ribonuclease IIIにより分解されることを利用して特定の遺伝子発現を不活化 する)
l標的遺伝子の3’UTR(非翻訳領域)に相補的に結合することで翻訳を阻害 する。
比較的長い非コード制御RNA
l7SK RNA(RNA polymerase II伸長の抑制性転写制御因子),SRA1(ステロ イド受容体活性化因子),XIST遺伝子(X染色体の不活化の中心因子)
lTSIXはXISTやimprinted genesを制御するアンチセンスRNAを制御する。
20_12.jpg
ポリペプチドをコードする遺伝子の構造の多様性 l遺伝子の大きさの多様性(1Kb以下から2400Kb) lエクソン-イントロン構造の多様性
イントロンがない遺伝子がわずかにある
遺伝子の長さとエクソンの占める割合は逆相関するが,イントロンの長 さは大きな遺伝子ほど長くなる。
エクソンの平均長は200bp以下
高発現遺伝子はイントロンが短い傾向にある(長いイントロンの転写に 必要な時間とエネルギーが無駄なため)。
l 反復DNAの含量
イントロンやflanking sequences内には,反復配列がよく認められるが,
一 部ではコードDNA内においても反復配列が見つかる。
マイクロサテライトシークエンスのtandem反復した配列や,既知のある いは推定されるタンパク質ドメインをコードするシークエンスのtandem 反復はよく認められる。
09_07.jpg
Exon content
09_07_2.jpg
09_07_3.jpg
機能的に同一の遺伝子群の分布
l遺伝子クラスター内で,重複化する場合(例:α-グロビン遺伝子)。
l異なった染色体間で,重複化する場合(例:ヒストン遺伝子,ユビキチン遺伝子)。
機能的に類似した遺伝子群の分布
lシークエンスにおいて,近縁であるが同一でない遺伝子群:遺伝子ファミリー
ltandem重複化して遺伝子クラスターを形成する場合(例:α-グロビン遺伝子,β-グ ロビン遺伝子)
l異なった染色体上で重複化した遺伝子間では,遺伝子クラスター形成している遺伝 子間よりも相同性が低くなる。(例:α-グロビン遺伝子とβ-グロビン遺伝子)
lHOXホメオボックス遺伝子ファミリーは,約10遺伝子から成るクラスターを形成し,こ のクラスターが4本の異なった染色体に存在するが,この場合は同一染色体上のクラ スター内の遺伝子間よりも,各染色体上の個々の遺伝子の方が,相同性が高い。
l組織特異的アイソフォームや細胞内器官特異的アイソザイムなどは,異なる染色体 間にコードされている場合が多い。
09_11.jpg
機能的に関連性のある遺伝子
l シークエンスにおいては関連性はないが,機能的に明らかに関連 した場合(例:同じタンパク質のサブユニットや同じ代謝系や発生経路の構 成遺伝子群)は通常,異なる染色体にコードされている。
特殊な構造を持った遺伝子
l 両方向性遺伝子構造:センス・アンチセンスの両方のDNA鎖に コードされた2種の遺伝子の5’端が近傍に存在し,同期して転写される遺伝 子ペア(例:DNA修復遺伝子ペア)
l 部分的に重なった遺伝子:通常は,それぞれ,異なるDNA鎖に コードされている。
l 遺伝子内遺伝子:snoRNA遺伝子の大半が,リボソーム親和性タン パク質や核小体タンパク質の遺伝子内に存在する。親遺伝子に同調した発 現が維持されるため。ポリペプチドをコードする遺伝子内遺伝子も存在する。
親遺伝子とは反対のDNA鎖にコードされている。
09_08.jpg
ポリシストロン転写単位をもつ遺伝子
l細菌等で見られるポリシストロン転写単位が認められる遺伝子として,インシュリンA 鎖およびB鎖が合成されるインシュリン遺伝子がある。まったく関連のない2種のタンパ ク質を産生する場合もある(例:UBA52遺伝子,ユビキチンとリボソームタンパク質)。
lその他のユビキチン遺伝子は,イントロンがないポリシストロン転写単位をもつ。
ポリペプチドをコードする遺伝子ファミリー
l古典的遺伝子ファミリー:ヒストン遺伝子やα-/β-グロビン遺伝子は,遺伝子全体あ るいはコードDNA部分が高い相同性をもつ。
l保存性の高いドメインを有する遺伝子ファミリー:各遺伝子内の特定の領域において 高い相同性を有するが,その他の部分では相同性が低い。保存性の高い領域がDNA 結合能などの機能に必要なドメインをコードしている。
l短い保存されたアミノ酸モチーフをもつタンパク質をコードする遺伝子ファミリー:DNA シークエンスレベルでは,あまり明確な関連性が無いが,遺伝子産物が共通の一般的 機能を有し,短いアミノ酸保存配列モチーフによって特徴づけられた遺伝子ファミリー
(例:DEAD box,WD repeat)。