• 検索結果がありません。

Ⅷ.次世代シークエンサーを使って,遺伝子  発現解析を行う

 2004 年に新領域に移ったころから,ゲノムプロジ ェクトやわれわれの行った cDNA プロジェクトを通 じて,ヒトゲノムの遺伝子構造が明らかになり,また 多数の cDNA クローンが使用可能となって,10 年以 上も前に考えたノーザン法による遺伝子発現解析も実 行可能となった.ただ,ノーザン法はあまりに効率が わるく,解析は遅々としてすすまなかった.

 一方,2000 年ころに,マイクロアレイ法が遺伝子 発現解析法として登場した.この方法は,ディファレ ンシャル・ハイブリッドと同じく mRNA を標識して 発現量をみる方法で,ディファレンシャル・ハイブリ

ッドの欠点を知る筆者としては,大して食指が動かな かった.2004〜2005 年ころには,マイクロアレイの 改良がすすみ,感度も 1 桁ちょっと上がり,1,000 種 類程度だった解析できる遺伝子も 1 万種類のレベルに 達し,がんの遺伝子発現解析研究に多数使われるよう になった.

 そうなってしまうと,おもしろい実験系をもってい る研究者や臨床サンプルにアクセスできる研究者が研 究の主役を担うようになる.筆者のように技術的な面 に強味をもつ研究者は,出る幕が減ってくる.また,

マイクロアレイの改良も筆者のみるところ限界に達し ていて,それ以上の発展は見込めそうもない状況であ った.筆者は,なにか新しいよい方法がないかと,模 索を続けていた.そこに登場したのが,次世代シーク エンサーであった.2006 年のことである.

 ゲノムプロジェクトが始まった 1990 年ころのシー クエンサーの処理能力は,1 日数百塩基という状況で,

本当に 30 億塩基対あるヒトゲノム配列を,すべて決 めることができるのだろうかと疑問をもった人も多か った.かくいう筆者も,その 1 人である.cDNA プ ロジェクトが日本の柱になったのも,cDNA だとシ ークエンス決定量がおおよそ 1/60 ですむという計算 があったと思う.このような事情があったため,アメ リカのヒトゲノムプロジェクトでは,新しいシークエ ンサーの開発がプロジェクトの柱の 1 つとして組み込 まれていた.そのプロジェクトでは,従来のサンガー 法の限界を超える新しいシークエンス原理が追求され,

いくつかおもしろい成果が上がっていた.

 だた,これらの新型シークエンサーは実用機器の開 発が遅れ,2003 年のヒトゲノムの配列決定には間に 合わなかった.ヒトゲノムの配列決定は,サンガー法 を自動化した蛍光キャピラリー型のシークエンサーで,

力任せに行われたのであった.

 重要なのは,アメリカはヒトゲノム配列決定以降も,

千ドルゲノムという名のもとで,新しいシークエンサ ーの開発をすすめていて,ついに 2005〜2006 年ころ に,新型シークエンサーが実用化されたのであった.

それらは,次世代シークエンサーと呼ばれた.

 次世代シークエンサーは,サンガー法で必要だった 電 気 泳 動 法 を 解 析 に 用 い な い.こ の た め,1 つ の DNA 断片について,シークエンスできる長さは短く なるが,多数の DNA 断片を同時に読むことができる.

ヒトゲノム配列の決定に使われた蛍光キャピラリー・

シークエンサーの ABI3730XL では,1 回の運転(約 1 日 か か る)で,約 100 個 の DNA 断 片 に つ い て,

600〜1,000 塩基の長さの配列決定ができた.精度は 99.99% に上る.一方,最初に商品化された 454 と呼

ばれる次世代シークエンサーでは,配列決定できる長 さは 100〜200 塩基であるが,同時に配列決定できる DNA 断片の数は 10 万個に上った.したがって,1 回 の運転で決定できる塩基数は ABI3730XL の 100〜

200 倍になる.ただ精度は 99〜99.9% であり,配列決 定でのエラーはかなり存在した.

 次世代シークエンサーのことを国際会議で知って思 い出したのは,ヒトゲノムプロジェクトの初期に開発 された,当時,大阪大の松原謙一先生の研究室におら れた大久保公策氏のボディマップ法である.これはシ ークエンサーを mRNA の数を数える道具として使う という,きわめて贅沢な方法であったが,デジタルな 計測結果が得られ,計測のダイナミックレンジが配列 決定した DNA 断片数に比例するという特性をもつ方 法である.残念なことに,サンガー法では配列決定で きる DNA 断片数は多くないため,あまり実用的でな く,マイクロアレイなどのアナログ的計測が主流とな っていた.

 ところが,次世代シークエンサーは決定できる配列 の長さは短いものの,DNA 断片数は多い.これは,

ボディマップ法に最適である.今やヒトゲノム配列は 決定されていて,exon─intron などの遺伝子構造もわ かっている.短い配列さえ得られれば,その mRNA がどの遺伝子由来かはコンピュータで簡単にサーチで きる.mRNA から cDNA を作って,それを次世代シ ークエンサーで読めば,後はボディマップ法の原理で,

遺伝子発現解析がコンピュータ上でできるというわけ である.「これこそ,求めていた新しい遺伝子発現解 析法だ!」と次世代シークエンサーに飛びつくことに した.

 ただし 454 は,同時に配列決定できる DNA 断片数 が 10 万であった.この数は,細胞の mRNA 数が 10 万〜100 万の間にあることを考えると,まだ十分では なかった.細胞当り mRNA1 個のレベルで発現して いる遺伝子を十分の確率でみつけるためには,1,000 万個レベルの DNA 断片決定能力が欲しかった.

 そうこうしているときに,Solexa という次世代シ ークエンサーが発売されるという情報を得た.このシ ークエンサーは,配列決定できる長さはわずか 25 塩 基しかないものの,決定できる DNA 断片数は 4,000 万個に達し,ABI3730XL の 1,000 倍の総塩基配列決 定量を誇った.その 4,000 万という決定可能断片数は 遺伝子発現解析にも十分な断片数である.

 早速,機器の発売前であったが,Solexa を作って いるカルフォルニアのベンチャー企業を訪問し,初期 ロットを買うことに決めた.Solexa は世界中で引っ 張りだこで,日本に入ってきた初期ロットは 2 台で,

筆者が 1 台,ほかの 1 台は完全長 cDNA の研究で競 い合った理化学研究所の林崎良英氏のところであった.

cDNA をやっていると似た発想をするものだと,ち ょっと愉快だった.初期ロットは,車でもパソコンで もスマホでも不具合が出やすい.研究用機器はとくに そうで,日本企業だったら出荷しないような製品が出 荷されてくる.筆者は慣れっこになっていて,部品を とっかえ引っ変えしながら,3 ヵ月ぐらいで動き始め たときは幸運だと感じたものである.

 実際,データが出てみると,目の前にはみたことも ない風景が広がっていた.経産省の完全長 cDNA の 超大型プロジェクトで,150 万個の cDNA 断片の配 列情報はもっていたので,ある程度予想はしていたが,

それにしてもいきなり 4,000 万個である.発現量の低 いところは,ランダムサンプリングのゆらぎで発現量 の精度に問題が生じるが,リニアなダイナミックレン ジが 10 の 5 乗に及ぶ.アナログ計測のマイクロアレ イであると,リニアなレンジは 10 の 3 乗程度なので,

デジタルな計測の威力がまざまざとみることができた.

 遺伝子同定をコンピュータを使って行うのも,大き な強みで,解析対象のデータをヒトゲノムから,別の,

たとえば,ウイルスのデータベースにかえると,もし 解析した細胞にウイルスが感染していた場合,それか ら読まれる mRNA の発現量がわかってしまう.

 また,筆者が,がん細胞での遺伝子発現レベルに興 味をもってデータをとったとしても,得たデータを使 って数ではなく,配列の解析を行うことで,がんの遺 伝子変異を見出すことも可能である.シークエンス量 が十分あると,変異をもった遺伝子と,その正常な対 立遺伝子の発現量の比なども出すことができる.マイ クロアレイや定量 PCR は,あらかじめ決めたものし か定量できないが,配列データの集合体は,さまざま な角度から再解析が可能なのである.ゲノム科学は情 報科学だと,スローガンとしては前々からいわれてい たが,それが日常になったと改めて感慨深かった.

 ヒトゲノム配列が決定されているので,配列がある と,mRNA 量だけでなく,その mRNA に対応する ゲノム上の位置までわかる.転写開始点を知ることの できるオリゴキャップ法と次世代シークエンサーを組 み合わせることで,発現している全遺伝子の転写開始 点が一挙に,その発現量とともにわかるようになった.

 こうした,データの配列とその量と位置が同時にわ かるという特性を活かして,さまざまなゲノム解析法 が開発されている.われわれの転写開始点を網羅する 方法は TSS─seq と呼ばれているが,なになに─seq と 呼ばれるものが多数あり,ゲノム,エピゲノム,トラ ンスクリプトームなどについて,多様な解析が実用化