温帯産草本のモデル植物ミナトカモジグサ
Brachypodium as the temperate model grass
持 田 恵 一
(理化学研究所環境資源科学研究センター) (横浜市立大学木原生物科学研究所) (岡山大学資源植物科学研究所)1.はじめに
ミナトカモジグサ (Brachypodium distachyon) はイネ科イチゴツナギ亜科に属する草本 植物である。生物的特徴やここ数年で研究基盤の整備が進んだことで、温帯産草本植物 にみられる生命現象を研究するためのモデル生物として広がりを見せている。特に、草 本バイオマス作物や同じイチゴツナギ亜科に属するムギ類作物にとつて有用な遺伝子の 探索や機能解析を進める上での有用性が注目されている。本総説では、ミナトカモジグ サのモデル植物としての特徴やムギ類との比較研究について最近の知見を紹介する。モデル植物としてのミナトカモジグサ
ミナトカモジグサが最初にモデル植物として提案されたのは、2001 年のことである1。 蛍光灯の下でも生育し、自殖性で短いライフサイクル、2 倍体で小さいゲノムサイズ、 といったミナトカモジグサの生物的特徴は、モデル生物としての利便性を期待させるも のであった。未熟胚由来のカルスを用いる必要があるものの、アグロバクテリウムによ る安定した形質転換系が確立されたことから、モデル植物としての生物的特徴は満たさ れた2。 一方、その小さいゲノムサイズを活かして、高精度なリファレンスゲノムシーケンス の解読は、国際的なコンソーシアム型の解読プロジェクトによって進められた3。リファ レンスゲノム解読のために Bd21 系統が選出され、単粒法による 8 世代の自殖を繰り返 した系統がゲノム解読に用いられた。Fosmid や BAC 等の DNA ライブラリが複数作製 され、サンガー法によって推定ゲノムサイズの 9.4 倍相当が解読された。得られた配列 をアセンブルすると、217 本のスキャッフォールドに集約され、272Mb をカバーして いた。このゲノムスキャッフォールドは、遺伝地図にアンカーすることでミナトカモジ グサの 5 本染色体に対応するゲノム DNA 分子の配列情報が構築された。2010 年に公 表されたミナトカモジグサ Bd21 系統のゲノム配列情報は、約 26000 のタンパク質をコードする遺伝子が同定されており、全ゲノムの 99.6% をカバーする高精度なものである3。 リファレンスゲノムの解読をうけて、世界各地の研究機関でミナトカモジグサの研究 リソースの構築が始まった4。ミナトカモジグサのモデル植物としての用途は、2 つに 代別される。1 つは、同じイチゴツナギ亜科に分類されるコムギやオオムギといったム ギ類のモデル植物として、ムギ類の分子育種に利用価値の高い有用遺伝子を探索し、そ の機能解析を行うこととされる。デンプン性種子を形成するイネ科植物にとって、脂肪 性種子を形成するシロイヌナズナよりも種子形成機構を研究する上で利用しやすい。ま た、ミナトカモジグサとムギ類は分布域が重なり、温帯産草本の環境適応性を研究する 上では、亜熱帯産草本のイネよりも利用しやすいといえる。もう 1 つは、世界的に再生 可能エネルギー資源に対する期待が高まる中、スイッチグラスやソルガムといった大型 草本植物の藁をバイオマス資源として利用する草本作物の生産性を向上するための有用 遺 伝 子 探 索 に 利 用 す る こ と で あ る。 米 国 エ ネ ル ギ ー 省 (DOE) の JGI、EU の RENEWALL プロジェクトなどが草本バイオマス関連のミナトカモジグサ研究をサ ポートした。日本では、理化学研究所のバイオマス工学研究事業が 2010 年から立ち上 がり、ミナトカモジグサの研究基盤が総合的に開発された。 分子遺伝子学的な遺伝子探索を進める上で、変異体リソースは不可欠である。米国 USDA-ARS と英国 John Iness Center では、T-DNA タグラインの整備が進められた。 米国で整備された T-DNA タグラインについては、23000 ラインに関して DOE-JGI か ら分譲されおり T-DNA のゲノム挿入部位の FST (Flanking sequenced tag) の情報とと もに公開されている (http://jgi.doe.gov/our-science/science-programs/plant-genomics/ brachypodium/brachypodium-t-dna-collection/)5。Tillling 系 統 の 整 備 は、 フ ラ ン ス の
INRA で進められた。 変異源としてアジ化ナトリウムが用いられ、5530 系統の M2 ラ インが整備されている (http://www-urgv.versailles.inra.fr/tilling/brachypodium.htm)6。
自然集団は、環境適応性に関わる遺伝子の探索などに有用なリソースである。ミナトカ モジグサの自然集団は、USDA-ARS から分譲されており、National Plant Germplasm System (https://npgsweb.ars-grin.gov/gringlobal/search.aspx) で検索できる。ミナトカ モジグサのゲノム編集に関しては、TALEN の報告がある7。CRISPR/CAS9 を用いた 研究事例も、今後ミナトカモジグサでも報告されると期待されている。 ゲノムリソースの整備は、エコタイプのゲノムリシーケンス解析や、完全長 cDNA や RNA-seq データの収集といったトランスクリプトーム解析が進められている。エコ タイプのゲノムリシーケンス解析は、DOE-JGI の研究プログラムとして進められてお り、100 系統ほどのゲノム解読を目標としている。代表的な 6 系統のゲノム解読結果に
関しては、Bd21 系統のリファレンスゲノムと詳細な比較が行われた8。理化学研究所
では、マウスやシロイヌナズナなどの多くの生物種の完全長 cDNA 収集に利用された ビオチン化キャップトラッパー法を用いて、完全長 cDNA ライブラリの作製と配列解 読が行われた。筆者らの研究グループは、様々な生育ステージや器官、種々の環境スト レス処理を施した組織など、21 種類の RNA をプールし、完全長 cDNA ライブラリを 作製した。無作為に選んだ約 40,000 クローン (RIKEN Brachypodium FLcDNA クローン ; RBFL クローン ) について、5’および 3’の両側からサンガー法による解読を行い、 78,000EST を得て公開した9。全長 cDNA の配列情報は、遺伝子構造の正確な構造注 釈を作製する上で極めて有用である。特に完全長 cDNA が含む 5’UTR 領域の配列情報 は、 遺 伝 子 の 転 写 開 始 点 を 同 定 す る こ と を 可 能 に し て い る。 筆 者 ら は 作 製 し た RBFLcDNA の EST を用いて、ミナトカモジグサゲノム上に同定されている遺伝子の 構造注釈の修正を試みた。遺伝子構造情報の、のべ 9000 箇所あまりを修正することが でき、そのうち約 6000 箇所は、UTR に関するものであった。また、この解析により 200 箇所以上の新規転写単位も同定された。これらミナトカモジグサの完全長 cDNA に 関する情報は、RIKEN Brachypodium FLcDNA Database (RBFLDB) に集約され、公 開されている (http://brachy.bmep.riken.jp/ver.1/index.pl)。また、トランスクリプトー ム解析による網羅的な遺伝子発現情報の収集は、当初は Affymetrix 社の GeneChip に よって行われていたが、現在では、RNA-seq 法が主流になっている。木原生物学研究 所と理化学研究所の共同研究チームは、種々の植物ホルモンを処理したミナトカモジグ サの芽生えについてのトランスクリプトーム解析を RNA-seq 法によって行った。各種 植物ホルモンに応答する遺伝子を網羅的に同定するとともに、それらをシロイヌナズナ やイネの植物ホルモン応答遺伝子群と比較し、その特徴を明らかにしている10。また、 ミナトカモジグサとウイルスの相互作用とオルタナティブスプライシングの関連が RNA-seq 解析を用いて網羅的に調査されている11。 ミナトカモジグサに関する情報リソースについても整備が進んでいる。ミナトカモジ グサのゲノムシーケンスと遺伝子の構造注釈については、Ensembl Plants、MIPS、 Phytozome、NCBI RefSeq などから公開されている。DOE-JGI では、ゲノム情報や遺 伝子や構造注釈のアップデートを続けており、現在の最新バージョンはゲノム公開後 2 度目のアップデートを経ており、遺伝子数も約 32000 になっている。理学研究所は、 RBFLDB から、ゲノムシーケンスとともに完全長 cDNA 配列情報に基づいてアップデー トした遺伝子構造注釈情報を公開している。また、筆者らは、ミナトカモジグサのゲノ ム解読直後にミナトカモジグサの転写因子を網羅的に同定し、その情報をデータベース
として公開している。筆者らは、植物の 61 の転写因子ファミリーの網羅的な同定を可 能にする計算機パイプラインをミナトカモジグサゲノムに適用し、2152 個の転写因子 をコードするであろう遺伝子を同定した12。転写因子とその完全長 cDNA に関する情 報を統合して扱うことで、ミナトカモジグサの遺伝子ネットワークを研究する上での有 用なツールになると考えられる。
イチゴツナギ亜科のムギ類のゲノムリソース
ミナトカモジグサが属するイネ科イチゴツナギ亜科には、コムギ、オオムギ、ライムギ、 エンバクといったムギ類穀物を含む。特に、コムギはイネ、トウモロコシとともに世界 三大穀物の 1 つである。ムギ類は、反復配列に富むゲノムをもち、推定ゲノムサイズは、 オオムギ(4900 Mb)、パンコムギ(16500 Mb)、ライムギ(8000 Mb)、エンバク(11300 Mb)と見積もられている。 サンガー法による DNA 解読が主流であった 2000 年代初頭は、これらのムギ類穀物 の全ゲノム配列をたちまち解読することは困難であったが、EST や完全長 cDNA の大 系的な収集を進めることで、発現遺伝子に関する情報がかなり整備された。木原生物学 研究所を中心とする研究チームは、パンコムギについて様々な器官や生育時期、種々の 生育条件で発現する遺伝子を収集する EST 解析をすすめ、2009 年までに、約 56 万配 列の収集と解析を行った13-15。2016 年 1 月現在で、NCBI で公開されているパンコムギ の EST 数は、1,298,692 であり、そのおよそ半数の収集と解析に貢献したことになる。 これらの EST 配列の冗長性をなくすと、約 4 万のユニークな転写物配列に集約される。 この EST リソースは、コムギの遺伝子発現プロファイルの描出、オリゴマイクロアレ イを設計するための配列情報16,17、イネなどとの比較ゲノム解析、発現遺伝子を染色体 上にマッピングするための配列情報等に幅広く活用され、コムギのバイオリソースを充 実させるために重要な役割を演じた。また、木原生物学研究所と理化学研究所の共同研 究チームは、パンコムギの完全長 cDNA の収集と配列解読を行った。パンコムギの様々 な組織から抽出した RNA をプールし、ビオチン化キャップとラッパー法により完全長 cDNA ライブラリが作製された。パンコムギの転写単位の配列情報を網羅的に収集する ために、完全長 cDNA クローンの全長の配列を決定するプロジェクトが推進された18,19。 これまでに、1 万以上の冗長性の無いパンコムギの完全長 cDNA 配列が、この共同研究 チームから公開されている。オオムギのゲノム情報基盤も、2000 年代初頭に整備が進 められた。コムギと同様に、オオムギの多様な組織に由来する EST の網羅的な収集や 完全長 cDNA の収集と解析が進められ、以降の研究の進展に貢献した。筆者らの研究グループは、コムギとオオムギのゲノム情報を統合する取り組みを 2005 年から進めた。それまで、別々に存在していたムギ類の発現遺伝子の連鎖地図情 報 を 統 合 し た デ ー タ ベ ー ス を 初 め て 開 発 し、TriMEDB (Triticeae Mapped EST Database) として公開した20。また、木原生物学研究所と連携して、パンコムギおよび
オ オ ム ギ の 全 長 ORF に 関 す る 情 報 を 統 合 し た デ ー タ ベ ー ス を 初 め て 開 発 し、 TriFLDB(Triticeae Full-length CDS Database) として公開した。TriFLDB は、パン コムギおよびオオムギの全長 ORF について、EST の情報、タンパク質機能ドメインを はじめとする機能注釈、他の植物のオルソログ情報などを提供するムギ類で初めての統 合データベースであった21。 2012 年から 2014 年にかけて、次世代シーケンサーを活用したムギ類のゲノム解読 が格段に進展し、イチゴツナギ亜科のゲノム研究は次の局面を迎えている22。2012 年 には、Nature 誌の同一号に、パンコムギとオオムギの全ゲノム解読の論文が同時に掲 載された23,24。リバプール大学を中心とする研究グループは、パンコムギ品種 Chinese spring の全ゲノムを次世代シーケンサーの 1 つである 454 を用いてショットガン解読 を行い、ミナトカモジグサゲノムと比較することで、パンコムギの遺伝子領域の概要配 列情報を得たことを発表した。このパンコムギゲノム配列上には、94,000 から 96,000 の遺伝子が同定された。オオムギゲノム解読のための国際コンソーシアムは、オオムギ 品種 Morex の全ゲノム解読を、高密度連鎖地図、ショットガン解読、ミナトカモジグ サ等との比較ゲノム解析などを統合したアプローチによって行った。4.98 Gb あまりの オオムギゲノム領域を解読し、3.90 Gb 以上の領域を高密度連鎖地図上に位置づけた。 このゲノム配列上には、26,159 箇所の ‘high-confidence’な遺伝子が同定されている。 また、2013 年には、パンコムギの 2 倍体祖先種であるTriticum urartu とAegilops tauchiiの全ゲノム解読が北京ゲノムセンター (BGI) を中心とする研究グループから発 表され、Nature 誌の同一号に同時に掲載された25,26。これら、A ゲノムおよび D ゲノ ム祖先 2 倍体種のゲノム解読は、いずれも多様なインサート長をもつ DNA ライブラリ を作製し、Illumina 社の次世代シーケンサーを用いてショットガン解読されたものであ る。A. tauchii ゲノム上には 43,150 の、T. urartuのゲノム上には 34,879 のタンパク質 をコードする遺伝子がそれぞれ構造注釈として同定された。また、パンコムギのゲノム解 読のための国際コンソーシアム (International Wheat Genome Sequencing Consortium: IWGSC) は、2014 年に、染色体毎のショットガンシーケンスによってパンコムギの概要 ゲノム配列を解読したことを、Science 誌のコムギゲノム特集号で発表した27-29。このパ
2010 年以降、イチゴツナギ亜科に属する植物のゲノム情報は充実し、モデル植物の ミナトカモジグサとムギ類作物の間でゲノム情報を比較しながら遺伝子探索を進めるこ とが現実的になったと考えられる。
イチゴツナギ亜科の比較オミックス研究
実際に、ミナトカモジグサとムギ類作物の間でゲノム情報の比較を可能にするために は、それぞれのゲノム情報をシームレスに繋ぐ情報基盤を創る必要がある。筆者らは、 先述のミナトカモジグサの完全長 cDNA データベースである RBFLDB とムギ類の完全 長 ORF データベースである TriFLDB において、遺伝子の同祖関係に基づく統合化を 進めた。特に、ミナトカモジグサゲノムとオオムギゲノム上に双方の転写単位のマッピ ン グ を 行 い、 双 方 の 転 写 単 位 の 同 祖 遺 伝 子 関 係 を 構 築 す る こ と で、RBFLDB と TriFLDB からの相互参照を可能にした。 ミナトカモジグサをムギ類のモデルとして扱うためには、双方の生長様式に関しても 統合する必要がある。筆者らの研究グループは、ミナトカモジグサのライフサイクルの 各段階を、形態的な観察によって、ムギ類の生長ステージの規定にも用いられている BBCH コードおよび Zadoks スケールに対応づけた。ミナトカモジグサ系統 Bd21 およ び Bd3-1、コムギ品種 Chinese spring について、BBCH コードによる生長ステージあ わせを行った上で、初期生長段階の細胞状態を調べるために、ワイドターゲットメタボ ローム解析を行った。ミナトカモジグサとコムギの間で、蓄積代謝物に多くの共通点が あったことから、ミナトカモジグサがコムギなどの麦類を研究するためのモデルとして 適していると考えられた。この研究で定義したミナトカモジグサの生育スケールは、世 界中の誰もが利用できるようイメージライブラリーとしてインターネット上に公開して いる30。筆者らの研究グループが作成したイメージライブラリーは、異なる施設やプロ ジェクトで収集されたミナトカモジグサの実験データを比較や統合することにも役立 つ。今後、ミナトカモジグサとコムギの蓄積代謝物のデータ比較が進むことで、モデル 実験植物と主要作物の研究の橋渡しとして利用され、ムギ類研究の発展にも貢献すると 期待されている。まとめ
ミナトカモジグサの総合的な研究リソースや、ムギ類のゲノムリソースの充実によっ て、イチゴツナギ亜科では、モデル実験植物と主要作物の研究成果を相乗した進展が期 待される。人口増加や環境問題による食糧問題の顕在化が喫緊の課題となる中、これらのイチゴツナギ亜科において植物の生産性の向上に関わる有用遺伝子の発見は、食料問 題を解決するための有効な解決策と考えられる。
参考文献
1 Draper, J. et al. Brachypodium distachyon. A new model system for functional genomics in grasses. Plant physiology 127, 1539-1555 (2001).
2 Alves, S. C. et al. A protocol for Agrobacterium-mediated transformation of Brachypodium distachyon community standard line Bd21. Nature protocols 4, 638-649, doi:10.1038/ nprot.2009.30 (2009).
3 Initiative, I. B. Genome sequencing and analysis of the model grass Brachypodium distachyon.
Nature 463, 763-768, doi:10.1038/nature08747 (2010).
4 Brkljacic, J. et al. Brachypodium as a model for the grasses: today and the future. Plant
physiology 157, 3-13, doi:10.1104/pp.111.179531 (2011).
5 Bragg, J. N. et al. Generation and characterization of the Western Regional Research Center Brachypodium T-DNA insertional mutant collection. PloS one 7, e41916, doi:10.1371/journal. pone.0041916 (2012).
6 Dalmais, M. et al. A TILLING Platform for Functional Genomics in. PloS one 8, e65503, doi:10.1371/journal.pone.0065503 (2013).
7 Shan, Q. et al. Rapid and efficient gene modification in rice and Brachypodium using TALENs.
Molecular plant 6, 1365-1368, doi:10.1093/mp/sss162 (2013).
8 Gordon, S. P. et al. Genome diversity in Brachypodium distachyon: deep sequencing of highly diverse inbred lines. The Plant journal : for cell and molecular biology 79, 361-374, doi:10.1111/tpj.12569 (2014).
9 Mochida, K. et al. Large-scale collection and analysis of full-length cDNAs from Brachypodium distachyon and integration with Pooideae sequence resources. PloS one 8, e75265, doi:10.1371/ journal.pone.0075265 (2013).
10 Kakei, Y. et al. Transcriptome analysis of hormone-induced gene expression in Brachypodium distachyon. Scientific reports 5, 14476, doi:10.1038/srep14476 (2015).
11 Mandadi, K. K. & Scholthof, K. B. Genome-wide analysis of alternative splicing landscapes modulated during plant-virus interactions in Brachypodium distachyon. The Plant cell 27, 71-85, doi:10.1105/tpc.114.133991 (2015).
12 Mochida, K. et al. In silico analysis of transcription factor repertoires and prediction of stress-responsive transcription factors from six major gramineae plants. DNA research : an
international journal for rapid publication of reports on genes and genomes 18, 321-332,
13 Mochida, K. et al. Tissue expression map of a large number of expressed sequence tags and its application to in silico screening of stress response genes in common wheat. Molecular
genetics and genomics : MGG 276, 304-312, doi:10.1007/s00438-006-0120-1 (2006).
14 Kawaura, K., Mochida, K. & Ogihara, Y. Expression profile of two storage-protein gene families in hexaploid wheat revealed by large-scale analysis of expressed sequence tags. Plant
physiology 139, 1870-1880, doi:10.1104/pp.105.070722 (2005).
15 Ogihara, Y. et al. Correlated clustering and virtual display of gene expression patterns in the wheat life cycle by large-scale statistical analyses of expressed sequence tags. The Plant
journal : for cell and molecular biology 33, 1001-1011 (2003).
16 Kawaura, K., Mochida, K. & Ogihara, Y. Genome-wide analysis for identification of salt-responsive genes in common wheat. Functional & integrative genomics 8, 277-286, doi:10.1007/s10142-008-0076-9 (2008).
17 Kawaura, K., Mochida, K., Yamazaki, Y. & Ogihara, Y. Transcriptome analysis of salinity stress responses in common wheat using a 22k oligo-DNA microarray. Functional & integrative
genomics 6, 132-142, doi:10.1007/s10142-005-0010-3 (2006).
18 Kawaura, K. et al. Assessment of adaptive evolution between wheat and rice as deduced from full-length common wheat cDNA sequence data and expression patterns. BMC genomics 10, 271, doi:10.1186/1471-2164-10-271 (2009).
19 Ogihara, Y. et al. Construction of a full-length cDNA library from young spikelets of hexaploid wheat and its characterization by large-scale sequencing of expressed sequence tags. Genes &
genetic systems 79, 227-232 (2004).
20 Mochida, K., Saisho, D., Yoshida, T., Sakurai, T. & Shinozaki, K. TriMEDB: a database to integrate transcribed markers and facilitate genetic studies of the tribe Triticeae. BMC plant
biology 8, 72, doi:10.1186/1471-2229-8-72 (2008).
21 Mochida, K., Yoshida, T., Sakurai, T., Ogihara, Y. & Shinozaki, K. TriFLDB: a database of clustered full-length coding sequences from Triticeae with applications to comparative grass genomics. Plant physiology 150, 1135-1146, doi:10.1104/pp.109.138214 (2009).
22 Mochida, K. & Shinozaki, K. Unlocking Triticeae genomics to sustainably feed the future. Plant
& cell physiology 54, 1931-1950, doi:10.1093/pcp/pct163 (2013).
23 Brenchley, R. et al. Analysis of the bread wheat genome using whole-genome shotgun sequencing. Nature 491, 705-710, doi:10.1038/nature11650 (2012).
24 International Barley Genome Sequencing, C. et al. A physical, genetic and functional sequence assembly of the barley genome. Nature 491, 711-716, doi:10.1038/nature11543 (2012).
25 Ling, H. Q. et al. Draft genome of the wheat A-genome progenitor Triticum urartu. Nature 496, 87-90, doi:10.1038/nature11997 (2013).
26 Jia, J. et al. Aegilops tauschii draft genome sequence reveals a gene repertoire for wheat adaptation. Nature 496, 91-95, doi:10.1038/nature12028 (2013).
hexaploid bread wheat (Triticum aestivum) genome. Science 345, 1251788, doi:10.1126/ science.1251788 (2014).
28 Eversole, K., Feuillet, C., Mayer, K. F. & Rogers, J. Slicing the wheat genome. Introduction.
Science 345, 285-287, doi:10.1126/science.1257983 (2014).
29 Pennisi, E. Agriculture. Harvest of genome data for wheat growers. Science 345, 251, doi:10.1126/science.345.6194.251 (2014).
30 Onda, Y. et al. Determination of growth stages and metabolic profiles in Brachypodium distachyon for comparison of developmental context with Triticeae crops. Proceedings.