• 検索結果がありません。

Saito R.

N/A
N/A
Protected

Academic year: 2021

シェア "Saito R."

Copied!
35
0
0

読み込み中.... (全文を見る)

全文

(1)

最新分子生物学即席入門

慶應義塾大学先端生命科学研究所

平成 23 年 2 月 28 日

(2)

はじめに

この冊子は分子生物学をほとんど知らない高校生や大学生、社会人の方々に手っ取り早く分子生 物学の基礎と現状を理解して頂く事を目的として、慶應義塾大学先端生命科学研究所の若手研究者 有志によって作成されました。 シーケンサーなどの分子生物学用の実験装置の開発が急ピッチで進められ、分子レベルでの生命 現象に関する様々な知見が急速に蓄積しています。分子生物学はまさに激動の時代の中にあると言っ ても過言ではありません。 生物の基本原理を示しつつ、そんなエキサイティングな分子生物学の現状をこの冊子を通じて少 しでも読者に伝えることができれば幸いです。 Saito R.

(3)

目 次

1 分子生物学の幕開けと遺伝子 1-4 2 遺伝子発現の中心教義 3-6 3 微生物遺伝子の基本構造 4-7 4 核酸の化学 4-7 5 タンパク質の化学 6-9 6 タンパク質コード領域とその解読 7-11 7 ゲノムプロジェクトとバイオインフォマティクス 7-11 8 遺伝子操作技術と微生物の利用 8-13 9 分子生物学と分析化学 9-16 10 システム生物学とオミックス科学 10-19 11 細胞のシミュレーション 11-22 12 ゲノムのデザイン 12-28

(4)

1

分子生物学の幕開けと遺伝子

図 1: レーウェンフックの顕微鏡 「親子はなぜ容姿が類似しているのか?」「人はなぜ癌にかか るのか?」「ヒトはどのように進化してきたのか?」 生物や生命現象に関する興味深い疑問は尽きませんが、これ らの疑問にミクロなレベルから答えてくれるのが分子生物学で す [1, 2]。分子生物学はその名の通り、分子レベルで生命現象を 理解することを目的とした学問分野です。 この分野が確立された 1950 年代当初の主な研究対象は単純 で扱いやすい微生物(microorganism)でした。微生物とは、人 間の肉眼では見ることができない程度に小さな生物のことを指 します。そのサイズはいろいろですが、大きくても 10µm、ふつ うはせいぜい 1µm 程度です。微生物のなかには、有名な大腸菌 (Escherichia coli)などの細菌(bacteria)1やカビ(糸状菌)、 キノコ(担子菌)、酵母などが含まれます。17 世紀後半にオラ ンダのレーウェンフックが顕微鏡 (図 1) を発明してからこれらの微生物が実際に「小さな生物」と して認識されるようになりました。そしてこれらの微生物を使って、個体の維持に必要で子孫にも 受け継がれる因子、すなわち遺伝子 (Gene) がどのような仕組みで機能するのか研究が進められた のです。 図 2: ヨハン・メンデル (1822-1884) 遺伝子という言葉が使用されたのは新しく、1933 年にヨハンセンが使用したのが最初だと言われてい ます。しかし、遺伝という概念の成立は古く、紀元 前にまで遡ることができます。紀元前約 4 世紀の古 代バビロニアには、馬の頭やたてがみの形が子孫に 代々伝わる様子が描かれた石が残されています。ま た紀元前約 3 世紀には、中国で交雑によってイノシ シを改良し、ブタを作っていました。そこでは、なぜ 「カエルの子はカエルなのか」という素朴な疑問に対 する答えとして、親の形質は遺伝という概念(物質 だとは認識されていません)によって伝えられると 認識されていました。この遺伝が、遺伝子という物 質によって成り立つとする概念の発端は、19 世紀の ヨーロッパで生まれます。1865 年、当時オーストリ アの修道士であったメンデル (図 2) は、エンドウの 交配実験から、エンドウの形質の伝達頻度がある一 定の整数値をとることを見出し、これによって遺伝が未知の物質によって仲介されることを予測しま した [3]。有名なメンデルの法則の発見です。1900 年にこのメンデルの概念が基本的に正しいもので あることが証明されましたが、その遺伝子の本体が DNA(デオキシリボ核酸、deoxyribonucleic acid)という化学物質であることが証明されるには、さらに数十年ほどの時間が必要でした。 1細菌は原核生物 (真正細菌と古細菌がある) とも呼ばれる。他の生物は真核生物に分類される。

(5)

1928 年、イギリスのグリフィスは、熱殺菌処理した病原性肺炎双球菌(Streptococcus pneumoniae) と、未処理の非病原性肺炎双球菌を混合することによって非病原性肺炎双球菌が病原性を獲得する ことを発見しました。これは形質転換と呼ばれ、その原因物質を形質転換因子と呼びました。その 後、アメリカ・ロックフェラー大学のアベリーは、肺炎双球菌の形質転換が、DNA の授受によって 起きることを証明し、ここに現代の遺伝学・分子生物学の黎明期がスタートしました。生物の遺伝 子の本体が DNA という化学物質であるという発見は、当時の遺伝学者のみならず、化学、物理学 といった一見無関係とも思える分野の研究者たちを魅了し、多くの人材がこの分野に参入するきっ かけとなりました。 1953 年、当時イギリス・ケンブリッジ大学のキャベンディッシュ研究所で研究していた若き物理 学者であるワトソンとクリック (図 3) は、この遺伝子の本体である DNA の立体構造を明らかにす ることによって遺伝現象の分子的メカニズムを解明できると信じ、ついにあの美しい二重のらせん 構造を発見しました。彼らの発見で重要な点は、 1. DNA はアデニン (A)、グアニン (G)、シトシン (C)、チミン (T) という 4 種類の塩基から 構成される (4 節参照) 2. それらが互いに決まったペア (A と T、C と G) を作るような二重らせん構造をとる ということです。これによって DNA 複製のメカニズムが予測できるようになったと同時に、DNA → mRNA →タンパク質という遺伝情報の発現の流れである「中心教義 (セントラルドグマ, central dogma)」がより明確に認識されるようになりました (2 節参照)。 図 3: DNA 二重らせんモデルを囲むワトソンと クリック 1961 年、パスツール研究所のジャコブとモノー は、大腸菌のラクトース分解系酵素の研究から、 有名な「オペロン説」を提唱しました。彼らは、遺 伝子上には遺伝子発現を調節する領域が存在し、 この作用によって、細胞外の環境の変化に応じた 応答(例えばラクトースがたくさんある場では、 ガラクトシダーゼというラクトース分解酵素が誘 導されるといった)が起きるということを、実験 から予測しました。これは現在の分子生物学では 拡大解釈され、遺伝子の基本単位は、タンパク質 のアミノ酸配列情報が書き込まれた領域(タンパ ク質コード領域)と、この情報の発現を制御する 制御部位(プロモーター、promoter)から構成さ れる(この単位をオペロンと呼びます)という概 念が出来上がりました。これらの発見から、生物の遺伝現象はこれまでに人類が築き上げてきた諸 知識を集約することによって明らかにできることがわかり、分子生物学が発展を遂げ、多くの研究 者によって多大な成果が得られています。アメリカのマサチューセッツ工科大学の利根川教授によ る抗体分子の多様性原理の解明(1989 年度ノーベル生理学・医学賞受賞)も、この分子生物学的技 術と概念の上になされた仕事です。

(6)

役割 体の器官 構成タンパク質の名前(例) 体の形を整える 皮膚,毛髪,骨,肺 ケラチン,コラーゲン,エラスチン 感覚器 目のレンズ,角膜,網 膜,ガラス体 コラーゲン,クリスタリン,ロドプシン 食物の消化 消化酵素 ペプシン,トリプシン,キモトリプシン,リ パーゼ,ヌクレアーゼ 栄養の運搬 血液タンパク質 アルブミン,トランスフェリン,リポタンパ ク質 呼吸 肺と諸器官での酸素交 換 ヘモグロビン,ミオグロビン,炭酸デヒドラ ターゼ 免疫など 免疫システム 免疫グロブリン,補体,α2−マクログロブ リン 体 内 情 報 伝 達 細胞間連絡 成長ホルモン,インスリン,グルカゴン 表 1: 体内のタンパク質の主な働き

2

遺伝子発現の中心教義

大腸菌の重量の 70%は水 (H2O) ですが、残りの重量の半分はタンパク質で占められています。そ してタンパク質は分子レベルにおける生命現象の主役と言っても過言ではありません。実際細胞内 で起きる化学反応(糖やアミノ酸の分解など)は、酵素と呼ばれるタンパク質によって触媒されて いますし、また細胞の形を維持するために骨格のように張りめぐられたアクチンという物質も、そ の正体はタンパク質です。さらに表 1 に我々の体内で活躍するタンパク質の例を示しますが、この ように、タンパク質は細胞内の様々な機能を司るという重要なはたらきを担っていることが分かる でしょう。 タンパク質は、20 種類のアミノ酸 (図 7) が様々な長さにつながった分子で、そのアミノ酸配列に よってタンパク質の性質が決定されています。このタンパク質のアミノ酸配列の設計図が、遺伝子 上に塩基配列として書き込まれています。おおまかにいうと、遺伝情報の発現というのは、実はこ の遺伝子上の塩基配列を正確に読みとってアミノ酸を順序よくつないでいくことを指しています (6 節参照)。この遺伝情報の発現は図 4 に示したように、3 つの段階を経て行われます。つまり、DNA 上に書き込まれた遺伝情報は複製されて各細胞に分配され、発現する際、一度 mRNA(メッセン ジャー RNA: ribonucleic acid)という分子に転写されます。この反応は RNA ポリメラーゼという 酵素が触媒します。次にリボソームという大きな複合体によって、mRNA に写し取られた情報をも とにアミノ酸を連結していきます。これを翻訳と呼んでいます。この遺伝子の発現メカニズムは基 本的にすべての生物で共通なので、中心教義 (central dogma) と呼ばれています。

(7)

ㆮવᖱႎ ㆮવᖱႎ DNAⶄ⵾ ォ౮ (mRNAวᚑ) ⠡⸶ (䉺䊮䊌䉪⾰วᚑ) ㆮવᖱႎ 䊥䊗䉸䊷䊛 mRNA 䉺䊮䊌䉪⾰ (䊘䊥䊕䊒䉼䊄) mRNA RNA䊘䊥䊜䊤䊷䉷

RNA

䉺䊮䊌䉪⾰

DNA

図 4: 遺伝子発現の中心教義

3

微生物遺伝子の基本構造

細胞内に存在する各タンパク質の量は常に一定ではなく、外部の環境や細胞の状態によって刻々 と変化しています。眼の細胞と心臓の細胞では異なったタンパク質構成になっていることが予想さ れます。このような変化は、主に遺伝子発現レベルで制御されていることが知られています。これ らの制御にうちで最もよく分かっているのは転写の制御で、微生物ではこの制御に深く関わってい る遺伝子上の部位にプロモーターとオペレーターがあることが知られています。図 5 は、プロモー ター、オペレーターの遺伝子上での位置関係を示したもので、微生物遺伝子の基本構造ということ ができます。もちろん細部に関しては例外もありますし、また高等動物や植物では全く違った構造 のものもあります。プロモーターとは、RNA ポリメラーゼが結合して転写反応を開始する部位のこ とをいいます。また、オペレーターとは、普通プロモーターの近くに位置していて、そこに転写因 子と呼ばれるタンパク質が結合してプロモーターからの転写を制御しています。このプロモーター とオペレーターの働きによって、複雑な遺伝子発現制御が行われているのです。

4

核酸の化学

細胞内には 2 種類の核酸分子が存在しています。DNA と RNA です。DNA は中心教義の最上流 に位置するもので、遺伝子の本体です。DNA はアデニン (A: adenine)、 グアニン (G: guanine)、シ トシン (C: cytosine)、チミン (T: thymine) の 4 種類の塩基が、糖 (DNA の場合はデオキシリボー ス) とリン酸を含むヌクレオチドとしてつながった高分子です (図 6)。RNA は基本的に 3 種類存在 し、その機能から、mRNA(伝令 RNA: messenger)、 tRNA(転移 RNA: transfer)、 rRNA(リボ ソーム RNA: ribosome) に分類されます2。RNA はアデニン、グアニン、シトシン、ウラシル (U:

2最近では sRNA や miRNA など様々な RNA が多数発見されており、未解明の生命現象や分子進化を解き明かす分子

(8)

lacIㆮવሶ 䊒䊨䊝䊷䉺 䉥䊕䊧䊷䉺 lacZㆮવሶ

䊥䊒䊧䉾䉰䊷 䉺䊮䊌䉪⾰

lacIㆮવሶ 䊒䊨䊝䊷䉺 䉥䊕䊧䊷䉺 lacZㆮવሶ

lacIㆮવሶ 䊒䊨䊝䊷䉺 䉥䊕䊧䊷䉺 lacZㆮવሶ

䊥䊒䊧䉾䉰䊷 䉺䊮䊌䉪⾰ ᵴᕈဳ䊥䊒䊧䉾䉰䊷 ᵴᕈဳ䊥䊒䊧䉾䉰䊷 㪩㪥㪘䊘䊥䊜䊤䊷䉷 ਇᵴᕈဳ䊥䊒䊧䉾䉰䊷 䉝䊨䊤䉪䊃䊷䉴 㩿䉟䊮䊂䊠䊷䉰㪀 㱎䊷䉧䊤䉪䊃䉲䉻䊷䉷 㪩㪥㪘䊘䊥䊜䊤䊷䉷 㪩㪥㪘䊘䊥䊜䊤䊷䉷 ਇᵴᕈဳ䊥䊒䊧䉾䉰䊷 䉝䊨䊤䉪䊃䊷䉴 㩿䉟䊮䊂䊠䊷䉰㪀 㱎䊷䉧䊤䉪䊃䉲䉻䊷䉷 㪩㪥㪘䊘䊥䊜䊤䊷䉷 䊤䉪䊃䊷䉴ㆊ೾᧦ઙ(䉥䊕䊨䊮䉥䊮) 䉫䊦䉮䊷䉴ㆊ೾᧦ઙ(䉥䊕䊨䊮䉥䊐) 図 5: Lac オペロンの遺伝子制御 水素結合 2.0 nm 3.4 nm O NH2 N N O P -O O O -O OH O NH2 N N O P -O O O- O CH2 CH2 O NH2 N N O P -O O O -O OH O NH2 N N O P -O O O- O CH2 CH2 O NH2 N N CH2 O P -O O O -O OH OH 塩基 糖 O NH2 N N CH2 O P -O O O -O OH OH リン酸基 ヌクレオチド 図 6: DNA の二重らせんモデル P:リン酸、S:デオキシリボース、A:アデニン、G:グアニン、C:シトシン、T:チミン

(9)

uracyl) の 4 種類の塩基が糖 (RNA の場合はリボース) とリン酸を含むヌクレオチドとしてつながっ たものです。アデニンとグアニンは比較的大きな分子でプリン塩基と呼ばれ、チミンとシトシンは 小さく、ピリミジン塩基と呼ばれます。DNA は二重らせん構造をとっていますが、アデニンはチミ ンと、またグアニンはシトシンとそれぞれ水素結合で対合しています。対合する塩基を塩基対 (base pair) と呼びます。DNA の長さは、base (b) や base pair (bp) を単位とした塩基対の数で表します。

5

タンパク質の化学

タンパク質はアミノ酸が鎖状につながった構造をしていますが、構成するアミノ酸の種類や並び 方、長さによって多様な機能を持つことができます。図 7 にタンパク質を構成する 20 種類3のアミノ 酸の構造式と名称、表記法を示します。タンパク質の中のアミノ酸は、そのカルボキシル基 (-COOH) と隣のアミノ酸のアミノ基 (NH2-) が脱水縮合したペプチド結合によって鎖状につながっています。 アミノ酸はその側鎖の種類によりおおまかに以下の 4 種類に分類できます。

1. 疎水性アミノ酸(Ara, Val, Leu, Ile, Met, Trp, Phe, Pro) 2. 極性無電荷アミノ酸(Gly, Ser, Thr, Cys, Tyr, Asp, Gln) 3. 正電荷をもつ極性アミノ酸(Lys, His, Arg)

4. 負電荷をもつ極性アミノ酸(Asp, Glu) 各分類に属するアミノ酸同士は、側鎖の大きさに違いがありますが、化学的な性質は似ているとい うことができます。 図 8: タンパク質の立体構造の例 タンパク質の構造は 4 つの段階によって決定 されています。1 次構造とはアミノ酸の配列の ことを指します。2 次構造とは、連続するアミ ノ酸が局所的にとる立体構造を指し、α-へリッ クス(らせん)や β-シート構造などが知られて います。3 次構造は、それらの 2 次構造が組み 合わさって一本のペプチド鎖としてどのような 全体構造をしているかを示します。そして 4 次 構造とは、3 次構造をとったペプチド鎖がさら に高次に組み合わさって複合体をつくるときの、 その組み合わせ構造をさします。このようにア ミノ酸が連結してできたタンパク質は、非常に 複雑な構造を持っていて (図 8)、様々な細胞内 反応の触媒機能や他の物質に結合する機能など を司っています。タンパク質の構造と機能の研究は、現在多くの研究者が参入している分野の一つ で、最近の 10 年ほどで立体構造の解かれたタンパク質の数は指数関数的に多くなっています4。 3近年ではセレノシステインやピロリシンなど細胞内で合成される新たなアミノ酸も発見されている [5]。 4日本でも 2002 年から 5 年間理化学研究所でタンパク 3000 という大規模なタンパク質構造決定プロジェクトが進めら れた。

(10)

gly G Glycine ala A Alanine

arg R Arginine asn N Asparagine asp D Aspartic acid

cys C Cysteine gln Q Glutamine glu E Glutamic acid

his H Histidine ile I Isoleucine leu L leucine

lys K lysine met M Methionine phe F Phenylalanine

pro P Proline ser S Serine thr T Threonine

trp W Tryptophan tyr Y Tyrosine val V Valine

(11)

… aactataatgaacCaactgcttac … ctggagatgaatATGagctatacc … gcgaaaaaaTAAtcatttg … … ttgatattacttggttgacgaatg … gacctctacttatactcgatatgg … cgcttttttattagtaaac … Caacugcuuac … cuggagaugaauAUGagcuauacc … gcgaaaaaaUAAucauuug …

M S Y T … A K K 開始コドン 転写 終止コドン 翻訳

DNA

mRNA

タンパク質

コード領域 プロモーター 転写開始点 アミノ酸配列 図 9: DNA 配列から遺伝暗号によってタンパク質ができる過程 大腸菌の細胞中で生産される有毒な遊離基(ラジカル)を分解する酵素の遺伝子sodAが転写・

翻訳によって発現する過程を示した。上段はsodA周辺のDNAの2本鎖、中段はDNAの情報

を元に転写されたmRNA配列、下段はmRNAの情報を元に翻訳されたタンパク質である。

6

タンパク質コード領域とその解読

タンパク質のアミノ酸配列(1 次構造)は、それをコードしている遺伝子の塩基配列によって決 定されています。塩基は 3 つで 1 つの組すなわちコドンと呼ばれる単位を作っており、1 つのコド ンで 1 つのアミノ酸を指定しています。この対応関係は遺伝暗号(genetic code)と呼ばれていま す。表 2 に遺伝暗号をまとめたものを示します。 図 9 に示すように核酸上のタンパク質の情報を持っている部分すなわちコード領域の初めの部分 には開始コドンがあり、ここからアミノ酸を指定するコドンが始まります。開始コドンは AUG な のでこれはメチオニン (M) に翻訳され、次は AGC なのでセリン (S) に翻訳されます。一方、コー ド領域の終わりを指定しているのが終止コドンです(表 2 では赤色で示してあります)。終止コドン は 3 種類あります。ここでアミノ酸の伸長反応が停止して、ペプチド(タンパク質)が遊離します。 このようにして、コード領域の中の塩基配列は翻訳されてアミノ酸配列へと変換されます。 さて、このようにして DNA 中のコード領域の情報から、アミノ酸配列を知ることができますが、 それを眺めただけでは、到底そのタンパク質のもつ機能を知ることはできないでしょう。機能を知 るためにはもととなっている遺伝子の破壊実験を行って細胞の変化を調べたり、そのタンパク質が 相互作用する相手の分子を調べたりする実験が必要になります。ところが最近公共のデータベース に大量の DNA 情報やタンパク質の情報が蓄積してきたおかげで、コンピュータを使ってアミノ酸配 列からその機能を予測することが可能になってきたのです。これについては 7 節で説明しましょう。

7

ゲノムプロジェクトとバイオインフォマティクス

生物はどれくらいの量の遺伝情報によって成り立っているのでしょうか?大腸菌の遺伝子は約 4,000 個存在し、約 4,000,000 塩基対の DNA にその情報が書き込まれています。ヒトに至っては約 30,000 個の遺伝子5が大腸菌の 1,000 倍弱に当たる約 3,000,000,000 塩基対の DNA にコードされています。 5ゲノム配列がまだ読まれていない時代はヒトの遺伝子数は 100,000 くらいと見積もられていた。

(12)

U

UU

U

C

C

C

C

A

AA

A

G

G

G

G

UUU Phe F

UCU Ser S

UAU Tyr Y

UGU Cys C

UUC Phe F

UCC Ser S

UAC Tyr Y

UGC Cys C

UUA Leu L

UCA Ser S

UAA

Ochre 終止終止終止終止

UGA

Opal 終止終止終止終止

UUG Leu L

UCG Ser S

UAG

Amber 終止終止終止終止

UGG

Trp

Trp

Trp

Trp

W

CUU Leu L

CCU Pro P

CAU His H

CGU Arg R

CUC Leu L

CCC Pro P

CAC His H

CGC Arg R

CUA Leu L

CCA Pro P

CAA Gln Q

CGA Arg R

CUG Leu L

CCG Pro P

CAG Gln Q

CGG Arg R

AUU Ile I

ACU Thr T

AAU Asn N

AGU Ser S

AUC Ile I

ACC Thr T

AAC Asn N

AGC Ser S

AUA Ile I

ACA Thr T

AAA Lys K

AGA Arg R

AUG Met M

ACG Thr T

AAG Lys K

AGG Arg R

GUU Val V

GCU Ala A

GAU Asp D

GGU Gly G

GUC Val V

GCC Ala A

GAC Asp D

GGC Gly G

GUA Val V

GCA Ala A

GAA Glu E

GGA Gly G

GUG Val V

GCG Ala A

GAG Glu E

GGG Gly G

A

AA

A

G

G

G

G

U

UU

U

C

C

C

C

表 2: 遺伝暗号表 各枠の中は左から、コドン、対応するアミノ酸1文字表記、アミノ酸3文字表記を表す。開始 コドンは黄色、終止コドンは赤で示してある。実際にアミノ酸を合成するときはmRNAを鋳型 とするので、ここではチミン(T)の代わりにウラシル(U)でコドンを示している。

(13)

この生物の持つ遺伝情報のセットのことをゲノム(genome: gene と染色体をあらわす chromosome とを合わせた造語)とよびますが、最近このゲノムに記された遺伝情報をすべて読んでしまおうと いう「ゲノムプロジェクト」が成果をあげています (図 10)。

1995 年に、アメリカの TIGR(The Institute for Genomic Research)によってマイコプラズマ 菌(Mycoplasma genitalium)という比較的小さな染色体をもつ細菌の遺伝子解読が終了したのを 皮切りにこれまでに 1,000 種以上の細菌ゲノムの塩基配列が決定され [6]、またヒトゲノムの全塩基 配列の決定も今世紀初頭に報告されました [7, 8]。 図 10: 国際枯草菌ゲノムプロジェクトでの各国の 担当領域 塩基配列決定技術は日進月歩であり、その速 度はこれからますます加速されると考えられま す。このように、多くの生物のゲノム塩基配列 が決定されると、その情報量は膨大なものとな り (図 11)、もはや人間が手作業で分類、管理、 利用することは不可能です。そこでこれらの情 報をコンピュータを使って大規模に解析し、新規 生物学的知見を得るとともに、創薬などに利用 しようという分野が生まれました。これがバイ オインフォマティクス(bioinformatics)[9] と 呼ばれるコンピュータを駆使した新たな学問分 野で、情報工学のみならず数学や社会学といっ たより広範な分野の研究者が参入しています。 バイオインフォマティクスから生まれた技術は、 細胞内の物質の相互作用ネットワークの解析や タンパク質の構造と機能の関係の解明といった研究に応用され、新規医薬品の開発や遺伝病治療など に応用されつつあります。また、生物進化の解明といった分野にも大きな成果をもたらしています。 バイオインフォマティクスの重要な技術の1つに相同性検索 (homology search) があります。こ れは与えられた核酸配列やアミノ酸配列の機能を、データベース中の既に機能が分かっている大量 のタンパク質のアミノ酸配列と比較することによって予測する技術です (図 12)。つまり、与えられ た配列と登録されている配列がよく似ていれば、それらのタンパク質は同様の機能を持っているで あろうと考えます。現在では BLAST というソフトウェアを用いてこの計算を行うことにより、よ り高速にかつ大量のアミノ酸配列を比較することが可能となっています [10, 11]。 近年実験技術が進歩し膨大な量のデータが蓄積されてきたため、バイオインフォマティクスはそ の重要性をさらに増しており、またシステム生物学の時代の到来 (10 節参照) により対象が配列だけ でなく遺伝子発現データなど様々な実験データにも広げられ、それらの解析技術やツールの開発が 盛んに進められています [12]。

8

遺伝子操作技術と微生物の利用

人類はそのずっと昔から微生物を利用していました。ビールやワイン、チーズ、パンなどの発酵 食品は紀元前から作られていましたし、日本においても醤油、味噌、納豆などは古くから食べられ

(14)

0 10,000,000,000 20,000,000,000 30,000,000,000 40,000,000,000 50,000,000,000 60,000,000,000 70,000,000,000 80,000,000,000 90,000,000,000 1987 1992 1997 2002 2007 年(12月) 0 10,000,000 20,000,000 30,000,000 40,000,000 50,000,000 60,000,000 70,000,000 80,000,000 90,000,000

塩基数

エントリー数

塩基数

エントリー数

図 11: 遺伝子データベース GenBank に登録されているデータ量の推移 ていました。また、破傷風や伝染病の治療法として青カビを飲むことが古くから行われていました が、これはペニシリンという糸状菌の作る抗生物質の効果です。発酵が微生物の作用によることを 発見したのはフランスの化学者パスツールで、19 世紀の後半のことでした。さらに彼は生物の自然 発生説を実験的に否定し、加熱滅菌法を確立しました。これらの業績は、微生物と発酵の関係を明 らかにしただけでなく、微生物が思いのほか普遍的に存在することを人々に印象づけました。この 発想から各種病原菌の発見がなされたといっても過言ではないでしょう。 図 13: 石油分解菌の電子顕微鏡写真 1876 年にドイツのコッホは、炭そ病の原因が微生物による ことを証明し、また 1881 年には微生物の純粋培養法を確立 しました。その後 1897 年、ドイツのブフナーは酵母の抽出液 によってアルコール発酵が起こることを示し、無細胞反応系 (in vitro 系ともいいます)を確立しました。これによって酵 素の研究が飛躍的に発展します。 近年になって日本の掘越は、高いアルカリ性環境下で生育 できる細菌を単離しました。その細菌の生産するタンパク質 分解酵素がアルカリ性でも高い活性を持つことから、それを 洗剤に添加することによってより付加価値の高い洗剤を作る など、機能性酵素の工業的価値が高められました。現在では 100 ℃以上の高温で生育できる細菌な ども見つかり、それらから様々な酵素が単離されて利用されています。これらの細菌は特殊環境微 生物と呼ばれ、石油やプラスチックを分解・合成するものなど (図 13)、さまざまな有用機能を持つ ものが見つかっています。

(15)

>ref|NP_001039301.1| FOS-like antigen 2 [Gallus gallus] Length=323

Score = 143 bits (361), Expect = 3e-32

Identities = 115/252 (45%), Positives = 155/252 (61%), Gaps = 21/252 (8%) Frame = +1

Query 133 GSFLFTAACGTGNSPHLCPEPARSRRLSPSVLF*DFCTDLAVSSANFIPTVTAISTSPDL 312 GSF ++ +G+ H PEP + F D+ S + FIPT+ AI+TS DL Sbjct 7 GSFDTSSRGSSGSPGH--PEPYSAGAAQQK---FRVDMPGSGSAFIPTINAITTSQDL 59 Query 313 QWLVQPALVSSVAPSQTRAPHPFGVPAPSAG---AYSRAGVVKTMTGGRAQSIGRRG 474

QW+VQP +++S++ +R+ HP+ P P A R GV+KT+ ++GRR Sbjct 60 QWMVQPTVITSMSSPYSRS-HPYSHPLPPLSSVAGHTALQRPGVIKTI----GTTVGRRR 114 Query 475 KVEQLSPeeeekrrirrerNKMAAAKCRNRRRELTDTLQAETDQLEDEKSALQTEIANll 654

+ EQLSPEEEEKRRIRRERNK+AAAKCRNRRRELT+ LQAET+ LE+EKS LQ EIA L Sbjct 115 RDEQLSPEEEEKRRIRRERNKLAAAKCRNRRRELTEKLQAETEVLEEEKSVLQKEIAELQ 174 Query 655 kekekleFILAAHRPACKI-PDDLGFPEEMSVASL--DLTGGLPEVATPESEEAFTLPLL 825 KEKEKLEF+L AH P CKI P++ P S+ S+ +G + P EE + L+ Sbjct 175 KEKEKLEFMLVAHSPVCKISPEERRSPPTSSLQSVRTGASGAVVVKQEPVEEEIPSSSLV 234 Query 826 NDPEPKPSVEPV 861 D + ++P+ Sbjct 235 LDKAQRSVIKPI 246

>gb|AAS67034.1| proto-oncogene protein c-FOS [Phodopus roborowski] Length=108

Score = 142 bits (357), Expect = 9e-32

Identities = 84/89 (94%), Positives = 84/89 (94%), Gaps = 1/89 (1%) Frame = +1

Query 913 FPASSRPSGSET-ARSVPDMDLSGSFYAADWEPLHSGSLGMGPMATELEPLctpvvtctp 1089 F ASSRPSGSET ARSVPDMDLSGSFYAADWEPLHS SLGMGPMATELEPLCTPVVTCTP Sbjct 1 FSASSRPSGSETTARSVPDMDLSGSFYAADWEPLHSSSLGMGPMATELEPLCTPVVTCTP 60 Query 1090 sctAYTSSFVFTYPEADSFPSCAAAHRKG 1176 SCT YTSSFVFTYPE DSFPSCAAAHRKG Sbjct 61 SCTTYTSSFVFTYPETDSFPSCAAAHRKG 89 ヒットした配列#1 ヒットした配列#2 入力配列 データベースに 登録があった類似配列 類似部分 配列情報 配列類似性に関する情報 図 12: 相同性検索の結果の例 この例では入力配列に類似した配列として、癌原遺伝子の転写因子FOSが得られており、入 力配列が転写に関わる機能を持っていることが推測される。

(16)

また様々な生物種の全ゲノム配列を読み取るゲノムプロジェクト (7 節参照) によって多くの微生 物の遺伝子解析が行われ、その成果は上記のような有用機能をもつ遺伝子の探索などにも応用され、 遺伝子資源という言葉が生まれています。このように、現在の微生物学は分子生物学の手法によっ て飛躍的にその学問的・産業的重要性が高まっています。 生物の遺伝形式は、大きく 2 種類に分類されます。ひとつは、古典的によく知られている染色体 遺伝と呼ばれるもので、1 節で述べたメンデルの法則に従う染色体由来の遺伝現象です。しかし、も うひとつメンデルの法則に従わない遺伝形式が知られています(非メンデル性遺伝)。この遺伝形式 は、細胞質遺伝とも呼ばれます。つまり、核内に存在する染色体以外の細胞質内にある遺伝子によっ て引き起こされる遺伝現象です。現在では、真核細胞ではミトコンドリアや葉緑体の比較的小さな 遺伝子、原核細胞ではプラスミドと呼ばれる DNA 分子がこの遺伝形式を司る正体であることがわ かっています。バクテリアのような原核細胞には雌雄の区別はないように感じますが、接合と呼ば れる現象が知られています。大腸菌では、F 因子と呼ばれるプラスミド性遺伝子を持つ細胞と持た ない細胞がいますが、F 因子をもつ細胞は、それを持たない細胞に近づくと F 因子の作用によって F プラスミドの授受を行い、数十の遺伝子を伝播することができます。この現象は、性をもつ細胞 の原型であると考えられています。1973 年、アメリカ・スタンフォード大学のコーエンとカリフォ ルニア大学サンフランシスコ校のボイヤーは、制限酵素と呼ばれる DNA 切断酵素を使ってプラス ミドに外来遺伝子を導入し、バクテリアを形質転換することができることを証明しました (この技 術については、12 節でも触れます)。この研究成果により、現代の遺伝子操作技術の扉が開かれま した。現在では、バクテリアだけでなく、植物や動物の形質転換にもこの技術が応用され、生物学 の進歩に貢献しています。この技術は、基礎的な生物学だけでなく、様々な医薬品や有用タンパク 質の生産にも用いられ、人間の生活にも不可欠の技術となっています。ボイヤーは後に、ジェネン テック社を創設し、ヒトインシュリンやヒト成長ホルモンなどの生産に成功し、バイオベンチャー の草分けとなっています。

9

分子生物学と分析化学

細胞中には DNA やタンパク質、代謝物質など様々な物質が存在していますが、どういう物質が どれくらい存在するのかという情報が様々な場面で重要になります。例えば日常生活では健康状態 を把握する上で血液中のグルコースの濃度を表す血糖値が糖尿病などの病気の兆候を示しうる重要 な指標になりますし、工業ではビール製造時に酵母菌の細胞内にどのような代謝物質が存在するか を調べることによって、美味しいビールを製造するためのヒントを得ることができるでしょう。さ らに分子生物学の実験では PCR6の実験で溶液中に存在する目的の DNA 断片がちゃんと増えたか を確認したいこともあるでしょう7。 分析化学はまさにこれらのような場面において、試料中の化学成分およびその量を分析する学問 分野で [13, 14]、19 世紀後半から 20 世紀初頭にかけてレントゲンによる X 線の発見や、ヴィーン による質量分析法の原理の発見などにより大幅に発展しました。そして近年でも重要な分野と位置

6ポリメラーゼ連鎖反応 (Polymerase Chain Reaction)。DNA 上の特定の部分を大幅に増やす実験手法。

(17)

溶液中の様々な物質が一定の方向へ移動 物質の性質の違いによって物質が分かれ、ピークの 面積からそれぞれの物質の濃度が得られる ピーク 図 14: 分析の原理の一例 (上)分析の原理の模式図。(下)分析結果の実例。上からメチオニンスルフォン、アスパラギ ン酸、リシンがそれぞれ検出されている。

(18)

内部標準法   ここで内部標準法を用いた物質の濃度計測法についてごく簡単に触れておきます。溶液 l におけ る物質 s の濃度およびその物質が分析計で検出されたときのピークの面積をそれぞれ xl,s, yl,s とすると、 yl,s= LlSsxl,s (1) が成立することが期待されます。但し Llと Ssはそれぞれ溶液 l と物質 s に固有の定数です。 いま標準液を ˆl, 内部標準物質を ˆs として、サンプル溶液および調べたい代謝物質を先ほどの l、 s で表します。式 1 より、 xˆl,s xˆl,ˆs/ yˆl,s yˆl,ˆs = xl,s xl,ˆs/ yl,s yl,ˆs = Sˆs Ss (2) が導かれます。標準液中の調べたい物質の濃度 (xˆl,s) および内部標準物質の濃度 (xˆl,ˆs) は通常 既知です。そしてそれに対応するピークの面積 (yˆl,s, yˆl,ˆs) を事前に調べておいて、サンプル溶 液中に濃度が xl,ˆsになるように内部標準物質を混ぜておきます。すると、分析計で計測された 調べたい物質と内部標準物質に対応するピークの面積 (yl,s, yl,ˆs) から式 2 を用いて調べたい代 謝物質の溶液中の濃度 xl,sを求めることができます。   づけられ、その成果によって現在までにクロマトグラフィー8や質量分析装置9など、分析を行うた めの様々な装置が開発されました。 分析装置の原理の一例を図 14 に示します [15]。この例では溶液中に含まれる様々な化学物質が電 気などで一定方向に引っ張られています。一定時間引っ張ったときに各物質がどの位置にくるかは もちろん実験条件 (電圧の大きさや溶液の組成など) によって異なりますが、実験条件が同一であれ ば、それらの物質の質量や電荷などの化学的性質によって決まります。そして同一の物質であれば 同一の場所に位置することになります。これは分析装置を用いると図 14(下) に示すようなピークと なってその位置が表されます。逆に異なる物質であれば、多くの場合、ピークの位置も異なります。 これによって、溶液中の互いに異なる物質を分離できるのです。 さて問題は組成未知の溶液中にどのような物質が存在するか調べるときです。このとき、存在が 疑われるいくつかの物質について分析装置を用いて分析し、各物質に対応するピークがどこで出現 するかを事前に調べておきます。測定対象の組成未知の溶液中にあらかじめ測定しておいた物質と 同じものが含まれていれば、分析装置で分離したときに、事前の測定結果と同じ位置にピークが出 現するので、それらの物質の存在を知ることができるのです。 適切な手順で測定を行うと、分析装置から出力される各物質のピークの面積はその物質の濃度に 比例するので、ピークの面積から溶液中の各物質の濃度を計算することが可能です。そこで基準と なる溶液「標準液」および基準となる物質「内部標準物質」を用意し、あらかじめ物質の濃度とピー クの面積との関係を求めておくことが行われます。これを内部標準法と呼びます [16]。 分子生物学では細胞内にどのような物質がどれくらいあるのかが問題になることが大変多く、分 析化学の技術が必要不可欠になっています。 8平面上や筒の中で物質を移動させ、移動の速さによって分離する方法。 9試料の分子をイオン化してスピードを付けて空中に飛ばし、質量・電荷比 (m/z) ごとに分けて分離する装置。

(19)

図 15: 細胞内分子間相互作用ネットワーク統合解析プラットフォーム eXpanda 細胞内のタンパク質間相互作用を表示したもの。タンパク質同士の結合が互いに密になってい て機能ユニットを形成している可能性が高い箇所の線(edge)は太く表示している。

10

システム生物学とオミックス科学

これまで述べてきたように、細胞を構成する部品として、遺伝子、タンパク質、細胞膜、脂質な どが挙げられます。従来の生物学の研究では少数の遺伝子やタンパク質の機能を詳しく調べること に重点が置かれていました。しかし最近ではこのように個々の部品の機能を詳しく調べるアプロー チの他に、粗くでもいいから全部品を統合的に調べようというアプローチが注目されています [17]。 そもそも生命は非常に複雑なシステムです。その構成要素である細胞一つをとっても膨大な数の 化学反応が組み合わさっています。これまで分子生物学は、細胞の中から個々の反応を選んで解析 を行い、それらの知識を蓄えることで進歩してきました。しかしこの方法を続けていっても、必ず しもそれらの集合体である細胞の振る舞いを再現したり、理解したりすることができるわけではあ りません10。何故なら部品を統合したときに、予想もできなかったような振る舞いが観測される可 能性があるからです。 これを分かりやすい例に例えるなら、飛行機を非常に細かい部品に分けると、ネジ、鉄板、ダイ オード、コンデンサ、ケーブルなどになってしまいます。これらの部品1つ1つを詳しく調べても 「空を飛ぶ」という現象は見えてきません。様々な部品が組み合わさり、飛行機として動き始めたと きにようやく空を飛ぶという現象が生まれます。これと同じように、生命現象を個々の部品として 理解するのではなく、部品の集まりとしてその振る舞いを理解することを目指す研究が進められて います。これをシステム生物学 (Systems biology) と呼びます。 7 節で述べたように、まず様々な生物種の全ゲノム配列を読み取るゲノムプロジェクトが行われ、 10一見複雑な現象でも、それを構成する各部分の振る舞いを理解できれば、その総体として起きる現象も説明できるとす る思考様式を還元主義と呼ぶ。

(20)

Aspartate

Aspartyl-P ASA Homoserine Homoserine-P Threonine

Aminacetone Oxaloacetate Asparagine

Lysine Methionine Isoleucine

NADPH+H+ NADP+ Pi

NADPH+H+NADP+ ATP ADP H2O Pi

NH3

NAD+ NADH+H+ GlutamateαKG NH

3ATP PPi AMP

ATP ADP - -- -1. AK I,II,III 2. ASD 3. HDH 4. HSK 5. TS 6. TDA 7. TDH 8. AATF 9. Asn-syn 10. Lys-syn 11. Lys-degr 12. Met-syn I III Aspartate

Aspartyl-P ASA Homoserine Homoserine-P Threonine

Aminacetone Oxaloacetate Asparagine

Lysine Methionine Isoleucine

NADPH+H+ NADP+ Pi

NADPH+H+NADP+ ATP ADP H2O Pi

NH3

NAD+ NADH+H+ GlutamateαKG NH

3ATP PPi AMP

ATP ADP - -- -1. AK I,II,III 2. ASD 3. HDH 4. HSK 5. TS 6. TDA 7. TDH 8. AATF 9. Asn-syn 10. Lys-syn 11. Lys-degr 12. Met-syn I III 図 16: トレオニンが化学的に合成される代謝経路 [20] 細胞内にコードされている全遺伝情報の収集が進められました。しかし遺伝情報は細胞内の個々の 部品(この場合は RNA やタンパク質) の情報にしか過ぎません。システム生物学の研究を効率よく 推進するためには、これら全遺伝情報を活用して細胞内で起こる生命現象に関する網羅的なデータ 収集が必要になります。そこで細胞内でどのような条件のときに転写が起こるかを多くの遺伝子に 関してマイクロアレイと呼ばれる装置を用いて網羅的に測定する技術開発がスタンフォード大学や アフィメトリクス社などで進められ [18]、現在でも世界中の研究機関で広く用いられています。2000 年には Curagen 社が酵母ツーハイブリッド法と呼ばれる実験手法を用いて細胞内でどのタンパク質 とどのタンパク質が結合するかを全てのタンパク質について調べました [19]。その結果、RNA の切 断11に関わるようなタンパク質の複合体などを抽出することに成功しました。これによって個々の タンパク質という部品がどのように組み合わさって生命現象を担うのかを網羅的に解析する糸口が 掴めたことになります。またこのような複雑なタンパク質間相互作用ネットワークを可視化して解 析を容易にするシステムも開発されました (図 15)[25, 26]。 細胞内で起こる重要な生命現象の1つとして、代謝があります。これはある物質を他の物質に変 換する化学反応のことで、これによって細胞の中では ATP やアミノ酸など生きてゆく上で欠かせ ない物質が生産されています。しかしその工程は時にはかなり複雑です。例えば、トレオニンとい うアミノ酸が合成される経路を図 16 に示しましたが、1 つのアミノ酸を合成するだけでも多くの物 質や反応が関わってくることが分かるでしょう。また多くの工程は未知なのです。そこでこの工程 を解明し、代謝物質がどのような条件のときにどのように生産されるかを調べる研究が世界中で行 われています。2002 年には慶應義塾大学先端生命科学研究所で多数の細胞内の代謝物質の濃度を一 斉に測定する装置 CE-MS が開発され12(図 17)、世界の注目を集めています [13]。 これらの実験技術の進歩により網羅的なデータの収集が進められ、∼オーム (-ome) という集合体 を表す言葉が生まれました。ゲノム (Genome) とはまさに遺伝子 (Gene) の集合体です。表 3 に示 すように、マイクロアレイなどによって得られる転写産物の集合体に関する情報はトランスクリプ 11正確にはスプライシング。真核生物において、RNA のイントロンと呼ばれる部位を取り除く反応のこと。 12キャピラリー電気泳動―質量分析装置。イオン性化合物に対して高速、高分離、高感度を有する。

(21)

図 17: CE-MS(キャピラリー電気泳動-質量分析装置)(左) とそこから出力される代謝物質のピー ク (右) 定義  得られる情報 解析技術 ゲノム Genome 全 DNA 配列 全遺伝子配列情報 ショットガンシーケン シングなど トランスクリプトーム Transcriptome 細胞内の全転写産物 転写単位、遺伝子発現 制御 cDNA、マイクロアレ イ、CAGE、RNA-Seq など プロテオーム Proteome 細胞内の全タンパク質 翻訳制御、細胞内局在、 リン酸化などの修飾 MALDI-TOFMS、 LC-MS、Protein Chip など メタボローム Metabolome 細胞内の全代謝物質 様々な条件下における 代謝物質プロファイル CE-MS、LC-MS、 GC-MS など 表 3: オミックス研究の例

(22)

(

2 3

)

5 5 4 4 3 3 2 2 1 1 NADPH Thr HSP HS ASA ASPP ASP V V dt d V dt d V V dt d V V dt d V V dt d V V dt d V dt d + − = = − = − = − = − = − = ( )     + ⋅ + = −     + + ⋅       + =       + + ⋅       + + ⋅ ⋅ − ⋅ ⋅ =       + + ⋅       + + ⋅ ⋅ − ⋅ ⋅ = ⋅ −     + + ⋅ + + ⋅ = T 5 HSP 5 HSP . 5 5 HSP . 4 T 4 HS 4 75 . 2 L 4 4 4 NADP 3 HS 3 NADPH 3 ASA 3 NADP 3 HS 3 3 NADPH 3 ASA 3 3 3 NADP 2 ASA 2 NADPH 2 ASPP 2 NADP 2 ASA 2 2 NADPH 2 ASPP 2 2 2 1 2 1 13 13 11 11 1 T 1 1 HSP T 1 HS HS L 1 NADP HS 1 NADPH ASA 1 NADP HS NADPH ASA NADP ASA 1 NADPH ASPP 1 NADP ASA NADPH ASPP ASPP 1 . ASP ASP ASP ASP K K V V V K K K V V K K K K K K V K K V V K K K K K K V K K V V V K L K V K V V m B F m B m F m B m F m B m L m m 図 18: トレオニン代謝を表現した数理モデル トーム情報、代謝物質の集合体はメタボロームと呼ばれ、これらを用いる研究をオミックス研究と いいます。

11

細胞のシミュレーション

細胞内で起こる多くの生命現象は非常に複雑ですが、その現象を個々の反応に分解していくと、1 つ 1 つの反応はそれほど複雑でなく、数理的に解析できる場合があります。例えば図 16 で示した代 謝経路は複雑に見えますが、1 つ 1 つの反応は図 18 のような数式で表現することができます。そこ で個々の反応を数式で表現し、細胞内物質の変動をシミュレーションすれば、複雑な生命現象の再 現や理解につながります (図 19)。 1996 年、慶應義塾大学環境情報学部は細胞内の全プロセスをシミュレーションすることを究極の 目的とした「電子化細胞(E-CELL)プロジェクト」を発足させ、E-CELL と呼ばれるシミュレータ を完成させました (図 20)[21, 22, 23]。これは、様々な細胞プロセスすべて(生合成系、エネルギー 代謝、膜輸送、転写、翻訳、複製、シグナル伝達など)に対応可能な汎用のシミュレータで、細胞 内の代謝などを表すモデルを数式として入力すると、各物質の変動をグラフィカルに表示できます。 現在実験技術はどんどん進歩しており、細胞シミュレーションに必要な実験データも揃いつつあ ります。慶應義塾大学はまず細菌の中で最も小さいサイズのゲノムを持つマイコプラズマ菌 (7 節 参照) に目を付けました。このゲノム中にコードされる 480 個の遺伝子配列を遺伝子データベース で相同性検索 (7 節参照) をすると、約 8 割は別の生物で既に知られている遺伝子と相同性があり遺 伝子機能が推測できますが、残りの 2 割程度は機能未知でした。2 割もの部品の機能が分からない とすると全体を再構成することは極めて難しくなります。しかし、網羅的な遺伝子破壊実験によっ て、これらの遺伝子のすべてが必須遺伝子というわけではないことが知られています。そこで当時

(23)

denom ] 2 ][ 1 [ ] 2 ][ 1 [ ] [        − = eq eR eF K P P S S E K K v iq mS eR eq eF iS eq mP eF eR eq mP eF eq mP eF mS eR mS eR K P S K K K P P K K K P S K K S S K K P K K K P K K S K K S K K ] 2 ][ 2 [ ] 2 ][ 1 [ ] 1 ][ 1 [ ] 2 ][ 1 [ ] 2 [ ] 1 [ ] 2 [ ] 1 [ denom 1 1 2 1 2 1 2 + + + + + + + = 3-ketoacyl-CoA thiolase Acyl-CoA dehydrogenase Enoyl-CoA hydratase 3-hydroxyacyl-CoA dehydrogenase (X)anoyl-CoA ETF(ox) 3-Oxo(X)anoyl-CoA NADH NAD+ -hydroxy(X)anoyl-CoA trans-(X)-2-enoyl-CoA ETF(red)

substance /CELL/CYTOPLASM/ATP “ATP” 12000; substance /CELL/CYTOPLASM/ADP “ADP” 14000; reactor … tt t

=

t

=

⚦⢩࠺࡯࠲߅ࠃ߮ ߘࠇߦၮߠߊ઒⺑ ↢ൻቇ࡮ ㆮવቇᎿቇ ታ㛎 ⚿ᨐߩ⸃㉼ ⚿ᨐߩ⸃ᨆ 㕒⊛ࡕ࠺࡞ߩ᭴▽ േ⊛ࡕ࠺࡞ߩ᭴▽ ࡕ࠺࡞ߩታⵝ ࠪࡒࡘ࡟࡯࡚ࠪࡦߩታⴕ 図 19: 細胞のシミュレーション研究の方法論 細胞シミュレーションは生命現象を解明する方法論の一翼に過ぎず、実際に試薬や細胞を扱う ような実験(wet)と組み合わせることによって威力を発揮する。上図のように、生化学・遺伝子 工学の実験結果をもとに仮説を立ててモデルを構築→細胞シミュレーションを行う→その結果を また実験で検証する、というサイクルを繰り返すことにより、注目している生命現象が起こるメ カニズムを効率よく解明できることが期待される。

(24)

細胞シミュレーション概説   細胞のシミュレーションをするときには、解析したい生命現象をもとに、その方法を詳細に決 めていかなければなりません。以下にいくつかの主要検討事項を挙げておきます。 均一系と非均一系 均一系とは物質が空間内に均一な濃度で存在している系であり、非均一系 は物質が空間内に局在している系です。細胞内が均一系であると仮定すると、分子 1 つ 1 つの動きを計算する必要がないため、より少ない計算量でシミュレーションを行うこと が可能です。細胞内では様々な分子が動き回っていて、分子同士が衝突することによって 反応が起こります。分子が小さくて移動の速度が速い場合、その物質は一瞬にして広が るため、濃度は均一になると仮定することができます。しかし分子が大きくてゆっくり 移動する場合や、局所的に起こる反応の速度が拡散の速度に比べて速い場合などは、細 胞内の位置による分子の濃度勾配ができてしまいます。また分子数が少ない場合、細胞 内の物質の分布が不均一になりやすくなります。このようなときは非均一系としてモデ リングしなければなりません。このような場合、モデリングには拡散方程式や分子 1 つ 1 つの動きを計算する分子動力学などが使われます。 決定論的モデルと確率論的なモデル 決定論的モデルは、ある時点の状態を与えると、その後の 全ての時点における系の状態が 1 つに決まるモデルです。それに対して確率論的なモデ ルでは次の時点で取り得る状態が複数あります。それぞれの状態への移りやすさは確率 で表されます。反応に関わる分子数が多い場合は均一系を仮定し、決定論的なシミュレー ションを行っても問題は少ないと考えられています。また決定論的なシミュレーションに は再現性があるという長所もあります。しかし分子の数が少ないときは 1 個 1 個の分子 の動きが系の振る舞いに大きな影響を与えることがあり、確率論的なモデリングが必要 になります。 常微分方程式と偏微分方程式 細胞内の物質の量や濃度などが時間に沿ってどのように変化し ていくかを数理モデルとして記述する上で微分方程式は極めて強力な表現法です。常微 分方程式は 1 つの独立変数に対する変化量を表す式です。偏微分方程式は 2 つ以上の独 立変数に対する変化量を表す式です。均一系の場合、時間に応じた各物質の変化量を定 義すればいいので、系の状態を常微分方程式だけで表現することができます。一方、非 均一系として拡散を取り入れる場合は、時間に対する物質の変化量だけでなく、細胞内 の位置による変化量も定義しなければならないため、偏微分方程式も必要となります。 一細胞モデル・細胞群モデル 一細胞モデルは一つの細胞に注目してその挙動を調べようとす るものです。細胞群モデルは、モデルを多くの細胞の平均としてシミュレーションを行う ものです。より現実に即したシミュレーションを目指すためには、一細胞モデルが適当で す。しかし、実験から得られる情報の多くは細胞群の平均値として得られます。  

(25)

図 20: E-CELL によるトレオニン代謝のシミュレーション

左上の画面にトレオニン代謝に関わる各物質の濃度などの情報が出力されている。右下の画面 には各物質の濃度の時系列変化がグラフで表されている。

(26)

リン脂質二重膜 の生成 グルコース 脂肪酸 グリセロール 解糖系 脂質生合成系 ATP ATP 127 遺伝子遺伝子遺伝子遺伝子 転写機構 ATP mRNA tRNA rRNA 翻訳機構 タンパク質 分解 リン脂質 乳酸 排出 図 21: バーチャル自活細胞の概念図

TIGR にいた Claig Venter 博士らと協力して、細胞としての自己維持のために必要最小限となるで あろう遺伝子を決定し、バーチャルな「自活細胞モデル」の構築を目指しました。そして、1997 年 に細胞が自活するために最低限必要とされる遺伝子 127 個を選び、自活細胞のモデル化に成功しま した(図 21)。 このバーチャル細胞は、膜外からグルコースを取り込んで、それを解糖系によって分解し、エネル ギー(ATP)を生産します。また、細胞膜合成のためのリン脂質合成系をもち、脂肪酸とグリセロー ルを取り込んでホスファチジルグリセロールを合成し、これが細胞膜となります。遺伝子発現のた めの転写機構(RNA ポリメラーゼなど)および翻訳機構(リボソームなど)をもち、遺伝子からタ ンパク質を合成します。タンパク質は時間とともに自然分解するようにモデル化してあるので、タ ンパク質を作り続けないと細胞は死んでしまいます。タンパク質を合成するにはエネルギー(ATP) が必要で、そのためにはグルコースが必要になります。127 個の遺伝子のうち 20 個が tRNA、2 個 が rRNA をコードする RNA 遺伝子です。残り 105 個のタンパク質遺伝子のうち、7 つの遺伝子は マイコプラズマ菌の遺伝子リストに存在しなかったので、大腸菌などの他の生物から「拝借」した ものです。E-CELL システムを用いて、このバーチャル細胞のシミュレーションを始めると、これ らの酵素反応がすべて並列13に実行され、バーチャル細胞が「代謝活動」を始めます。グラフィッ クインターフェイスを通じて、細胞内の様々な物質の増減(分子数)や特定の化学反応の活性を観 察することができます。また、シミュレーションの途中でも、ユーザーが介入して、物質の量を増 減できるようになっています。全遺伝子の発現状態が一目で見渡せるインターフェイスも用意して あります。それぞれのアイコンが各遺伝子に対応していて、転写量(mRNA の分子数)を表示しま す。マウスをクリックすることによって、特定の遺伝子をノックアウトすることも簡単にできます。 実験途中で遺伝子をノックアウトし、その細胞の振る舞いを観察するといった、現実には不可能な 13実際には擬似並列。

(27)

図 22: 細胞シミュレーション環境 E-Cell 3D (開発中) 各物質の量がどのように推移し、どの物質に変換されているかを立体的に表示している。これ により、細胞内で代謝などの様々な生化学反応がどのように起こっているかをひと目で観察する ことができる。 リアルタイムのノックアウト実験もコンピュータ上では可能です。例えば、グルコースを枯渇させ るシミュレーションを行うと、細胞は ATP を産生することができなくなり「死んで」しまいます。 しかし、その直前には ATP が増加するという興味深い現象が観察されました。E-CELL プロジェ クトの第一歩として構築した自活細胞モデルは、あくまで架空の細胞です。次なる目標として選ば れたのは、実在する細胞である「ヒト赤血球細胞」でした。赤血球は転写、翻訳、複製などを行わ ず細胞内代謝が限られているので、シミュレーションのためのモデル細胞には非常に適しています。 また、赤血球については実験データが豊富にあるため、コンピュータモデルを実際の細胞と比較し て評価することが可能です。2005 年にはヒト赤血球細胞のシミュレーションモデルのプロトタイプ 版が完成し [24]、これによって E-CELL システム上で酵素反応を意図的に阻害するなどのバーチャ ル実験を行って、遺伝性貧血症患者の赤血球の状態を再現したりすることが可能になりました。こ の他にもこれまでに大腸菌、ミトコンドリア、心筋細胞、糖尿病、イネ、神経細胞などの様々なシ ミュレーションが行われました。今後シミュレーションを用いる生物学はますます重要になってゆ くでしょう。 一方で E-Cell システムのさらなる開発も進められており、2010 年にはグラフィカル・ユーザ・イ ンターフェース (GUI) 上でシミュレーションモデルを構築できるシステム E-Cell IDE がリリース

(28)

プラスミド ゲノム

(a)

(b)

(c)

図 23: 大腸菌を用いた形質転換の基礎技術 (a)プラスミドは細胞内で複製される染色体(ゲノム)以外のDNA分子。細菌などが持ってい る。遺伝子工学ではプラスミドを、目的の遺伝子を組み込んで大腸菌などに導入するためのベク ター(目的のDNAを運ぶための核酸分子)として利用する。(b)プラスミドに目的の遺伝子を組 み込む方法。PCRで増幅した目的の遺伝子とプラスミドを制限酵素を用いて一度切断し、次にリ ガーゼなどの酵素を用いて結合させる。この操作をライゲーションという。(c)プラスミドの大腸 菌への導入。この操作を形質転換という。 され、またシミュレーション結果を分かりやすく 3 次元で表示するシステム (図 22)[27] の開発も計 画中です。

12

ゲノムのデザイン

これまで説明してきたように、細胞の中でどのようにして遺伝情報が読み取られ、またそれがど のようにして細胞内で起こる生命現象につながっているのか、その解明が着々と進められています が、その一方で生物が持つ特定の遺伝情報を積極的に利用する技術の開発も進められてきました。 例えば 8 節で少し触れましたが、特定の遺伝子をプラスミドと呼ばれる DNA に組み込み、大腸菌 の中にそのプラスミドを入れて大腸菌を増殖させた後 (目的の遺伝子がコードされているプラスミ ドも一緒に複製されます。このように目的の遺伝子のコピーを作ることを遺伝子のクローニングと いいます。)、その遺伝子を大腸菌の中で発現させる (タンパク質を合成させる) 実験操作は形質転 換 (transformation) と呼ばれる既に確立した技術になっています (図 23)。クローニングした遺伝子 は細菌によっては (枯草菌など) ゲノムに組み込むことも可能ですし、植物ゲノムへの組み込みは遺 伝子組み換え作物を作る上での基礎技術になっています14。よりヒトに近い生物であるマウスを扱 う実験室では特定の遺伝子を改変したトランスジェニックマウスが作製されています15。 また放射線や化学物質を用いて DNA 配列に変異を誘発したり、クローニングした遺伝情報を改変 する技術も開発されています。その結果として図 24 に示すように、DNA 配列が少し変わっただけ でも、タンパク質のアミノ酸配列が変わり、その活性や機能も大きく変化する可能性があるのです。 このように特定の遺伝子を自由に”切り貼り”したり、その内容を一部改変する技術はだいぶ確立 されてきていますが、さらに進んで細胞中の全ゲノムのような巨大な DNA 分子を丸ごと合成する のはしばらく前までは夢でした。DNA という高分子は、溶液に溶かした状態では物理的な損傷を 受けやすく、また、プラスミドが運べる DNA のサイズには限りがあるのです。ところが三菱化学 14アグロバクテリウムと呼ばれる土壌微生物に目的遺伝子を導入し、対象となる植物に感染させるなどの方法がある。 15様々な細胞に分化できる胚性幹細胞 (ES 細胞) に目的の遺伝子を導入し、それを受精卵に移植するなどの方法がある。

(29)

DNA

mRNA

タンパク質

タンパク質

タンパク質

タンパク質

変異

遺伝子

遺伝子

遺伝子

遺伝子

タンパク質の変異

転写

転写

転写

転写

翻訳

翻訳

翻訳

翻訳

図 24: DNA 上の変異と合成されるタンパク質への影響 DNAの遺伝子領域(コード領域)に変異が入ると、合成されるタンパク質の配列も変化するこ とがある。それがたとえ1アミノ酸でも、タンパク質の機能に大きく影響することがある。 c

(a)

(b)

(c)

(d)

<10

<200

<500

図 25: 合成ゲノムの作製法 (a)ゲノムの塩基配列を設計、(b) 有機化学的に合成したDNA断片を試験管で調製、(c)大 腸菌、酵母菌でつなぎ合わせ(d) マイコプラズマ菌に移植。人工細胞が増殖。数値は各ステッ プで扱えるゲノムサイズ(単位は1 kbp, 1,000塩基)を表す。なお、この図は文献[30]および http://www.jiji.com/に掲載されていたものを参考に作成した。

(30)

生命科学研究所は 2005 年にシアノバクテリアと呼ばれる光合成細菌 のゲノムを細かい断片に分け て効率よく全て枯草菌に導入する技術の開発に成功しました。この細胞はシアノバクテリアと枯草 菌のゲノムを併せ持ち、”シアノバチルス”と呼ばれました16[28]。また 2010 年には 11 節で紹介し た Venter 博士の率いる研究グループが全ゲノムを断片的に人工合成し、大腸菌、酵母菌でそれを組 み立ててマイコプラズマ菌に丸ごと導入することに成功しています (図 25)[29, 30]。将来的には医 薬の元となる化合物やバイオ燃料などの有用物質を作るようなゲノムをデザインし、それを人工合 成するような応用が期待されます。 新技術が次々と開発され、データ量も爆発的に増え、数年後にどんな展開を見せるのかますます 予測が難しくなってきた現在の分子生物学。しかしそんな中でこれからも数多くの新発見があるこ とは間違いなく、その中には新薬の開発につながる発見など我々の生活と関わりの深い発見も出て くるに違いありません。 16これに関連するゲノムデザインの研究は現在慶應義塾大学先端生命科学研究所で行われている。

(31)

演習問題

1. 中心教義 (central dogma) の中で、

(a) DNA の情報をもとに RNA が合成される反応を何という? (b) mRNA の情報をもとにタンパク質が合成される反応を何という? 2. 大腸菌の thr オペロンリーダーペプチドという代謝に関わるタンパク質のコード領域は catccATGaaacgcatt...ggtgcgggcTGAcgcgt のような配列になっている。但し大文字で示した部分は左は開始コドン、右は終止コドンであ る。このとき図 9 にならうと、 (a) DNA 上のこの配列の逆鎖の配列は? (b) コードされるアミノ酸配列の先頭と終わりの 3 文字は? 3. 図 24 では DNA に変異が入った結果としてタンパク質のアミノ酸配列まで変わっているが、 実際には DNA に変異が入っても合成されるアミノ酸配列が変わらない場合もある。どんな場 合か?

(32)

参考文献

[1] Alberts B et al. Molecular Biology of the Cell (4th edition) Garland Pub (2002/03)

[2] Alberts B et al., 中村桂子、松原謙一監訳「Essential 細胞生物学 (原著第 2 版)」南江堂 (2005/09) [3] G. エドリン, Gordon Edlin(著), 伊藤 文昭, 大竹 英樹, 蓑島 伸生, 井口 義夫, 清水 淑子, 清水

信義 (翻訳) 「ヒトの遺伝学」東京化学同人 (1992/04)

[4] 河合剛太、金井昭夫 (編) 「機能性 Non-coding RNA」クバプロ (2006/04)

[5] Zhang Y, Baranov PV, Atkins JF, Gladyshev VN (2005) Pyrrolysine and selenocysteine use dissimilar decoding strategies. J Biol Chem. 280(21):20740-51.

[6] Fraser CM et al.(1995) The minimal gene complement of Mycoplasma genitalium. Science 270(5235):397-403.

[7] Lander ES et al.(2001) Initial sequencing and analysis of the human genome. Nature. 409(6822):860-921.

[8] Venter JC et al.(2001) The sequence of the human genome. Science. 291(5507):1304-51. [9] 冨田勝 (監修) 斎藤輪太郎 (著) 「バイオインフォマティクスの基礎∼ ゲノム解析プログラミン

グを中心に ∼」サイエンス社 (2005/07)

[10] Altschul SF et al.(1990) Basic local alignment search tool. J Mol Biol 215(3):403-10 [11] Kent WJ.(2002) BLAT–the BLAST-like alignment tool. Genome Res. 12(4):656-64.

[12] Arakawa K, Mori K, Ikeda K, Matsuzaki T, Kobayashi Y, Tomita M(2003) G-language Genome Analysis Environment: a workbench for nucleotide sequence data mining. Bioinfor-matics 19(2):305-306 http://www.g-language.org/ [13] 冨田勝、西岡孝明 (編)「メタボローム研究の最前線」シュプリンガー・フェアラーク東京 (2003/11) [14] 津村ゆかり著「よくわかる最新分析化学の基本と仕組み」秀和システム (2009/4) [15] 志田保夫、笠間健嗣、黒野定、高山光男、高橋利枝「これならわかるマススペクトロメトリー」 化学同人 (2001/03) [16] 日本分析機器工業会編「よくわかる分析化学のすべて」日刊工業新聞社 (2001/10)

[17] Ishii N, Nakahigashi K, Baba T, Robert M, Soga T, Kanai A, Hirasawa T, Naba M, Hirai K, Hoque A, Ho PY, Kakazu Y, Sugawara K, Igarashi S, Harada S, Masuda T, Sugiyama N, Togashi T, Hasegawa M, Takai Y, Yugi K, Arakawa K, Iwata N, Toya Y, Nakayama Y, Nishioka T, Shimizu K, Mori H, Tomita M(2007) Multiple High-Throughput Analyses Monitor the Response of E. coli to Perturbations Science 316(5824):593-7

参照

関連したドキュメント

暑熱環境を的確に評価することは、発熱のある屋内の作業環境はいう

病理診断名(日本語) 英語表記 形態コ-ド 節外性 NK/T 細胞リンパ腫、鼻型 Extranodal NK/T cell lymphoma, nasal-type 9719/3 腸管症型 T 細胞リンパ腫

類内膜腺癌 Endometrioid adenocarcinoma 8380/3 明細胞腺癌 Clear cell adenocarcinoma 8310/3 粘液型腺癌 Mucinous adenocarcinoma 8480/3 中腎性腺癌 Mesonephric

4 6月11日 佐賀県 海洋環境教室 環境紙芝居上演等による海洋環. 境保全教室開催 昭和幼稚園

発行日:2022 年3月 22 日 発行:NPO法人

4 6月11日 佐賀県 海洋環境教室 環境紙芝居上演等による海洋環. 境保全教室開催 昭和幼稚園

We have investigated rock magnetic properties and remanent mag- netization directions of samples collected from a lava dome of Tomuro Volcano, an andesitic mid-Pleistocene

11 Chhen SR, Landing BH, Isaacs H, King KK, Hanson V: Solitary plasmacytoma of the larynx and upper trachea associated with systemic lupus erythematosus... Extramedullary