1.はじめに
世界人口は 2050 年には 90 億を超えると推計されている. この人口増をささえるには 2050 年までに現在比 170%の 食糧生産が必要とされており,年あたりでは 4400 万トン/ 年の増産が必要とされている(Tester and Langridge 2010). 最近 40 年間の食糧増産の速度はほぼ一定で 3200 万トン/ 年であったことを考えると,今後数十年間は従来比 38% 増の速度での増産が必要ということになる.このような増 産を限られた資源(土地,水,肥料など)のもとで達成す るには,植物体そのものの生産力を大幅に向上させる必要 があり,そのためには,育種の速度を高度に向上させる革 新的技術の登場と,それに基づく作物育種のイノベーショ ンが不可欠となる(Phillips 2010). 現在,育種速度を高度に向上させる技術として,ゲノム ワイドに高密度に配置された DNA マーカーをもとに優良 個体を選抜するゲノミックセレクション(Meuwissen et al. 2001)が動植物育種の世界で注目を集めている(Goddard and Hayes 2007; Heffner et al. 2009; Jannink et al. 2010; Lorenz et al. 2011).ゲノミックセレクションでは,ゲノムワイド マーカーの遺伝子型から目標形質を予測するモデルを構築 し,そのモデルを用いてゲノムワイドマーカー遺伝子型に 基づき優良個体を選抜する.ゲノミックセレクションでは 選抜の際に圃場試験で形質評価を行う必要がなく,これに より選抜のプロセスを大幅に短期化できると期待されてい る.DNA チップや次世代シークエンサーなどの登場によ り,現在,ゲノムワイドマーカーをハイスループットにジェ ノタイピングする技術の汎用化が進んでおり(Davey et al. 2011),近い将来,ゲノミックセレクションが主要な育種 技術の一つとなると考えられる.本稿では,ゲノミックセ レクションとその周辺技術について概説する.
2.作物育種におけるゲノミックセレクションの胎動
ゲノムワイドに分布する何万もの DNA マーカーを用い て個体の遺伝的能力を予測することで,表現型を計測せず とも高い精度で優良個体を選抜できることを示したシミュ レーション研究の結果が,Meuwissen ら(2001)によって 報告されたのは今から約 10 年前のことである.“ゲノミッ クセレクション(genomic selection)”と名付けられたこの 斬新な手法は,ジェノタイピングコストの抑制がマーカー 利用選抜の研究の主な目的であった当時,突拍子もないア イデアのように思われた(Meuwissen 2007).しかし,それ から 10 年も経たぬうちに,24 頭の乳牛の約 5 万箇所の DNA 多型を一度に決定できる DNA チップなどが開発さ れ,乳牛の育種においてゲノミックセレクションが実用利 用されるに至った(Hayes et al. 2009).乳牛の育種では, 娘牛の能力をもとに雄牛を評価するため,優秀な雄牛の選 抜に何年も必要とした.一方,ゲノミックセレクションで は,DNA マーカーを用いた検査により即座に優秀な雄牛 を見分けることができる.優秀な雄牛の選抜に大きな費用 と長い時間を費やしていた乳牛の育種では,ゲノミックセ レクションによって,育種プロセスを大幅に効率化・高速 化させることが可能であり,そのことによる利益は, DNA チップを用いた検査のコストをはるかに上回る (Konig et al. 2009).このことが,絵空事のようにも受け取 られた斬新なアイデアを,10 年という短期のうちに実用 化させてしまう原動力となったのである. 乳牛における成功をうけ,鶏や豚など乳牛以外の家畜に おいても,ゲノミックセレクションの研究がさかんに進め「ゲノム育種」再び.
次世代シークエンサーは新しい育種の扉を開くのか?
岩田洋佳
東京大学大学院農学生命科学(〒 113 − 8657 東京都文京区弥生 1 − 1 − 1) 要旨:食糧問題やエネルギー問題の解決のためには,作物の遺伝的能力を高速に改良する必要がある.育種 を高度に加速するための方法として,現在,ゲノミックセレクションとよばれる手法が注目を浴びている. ゲノミックセレクションでは,ゲノム全体に高密度に配置された DNA マーカーをもとに個体の遺伝的能力 を予測して,その予測値に基づき優良個体を選抜する.ゲノミックセレクションは,従来のマーカー利用選 抜に比べ,事前に QTL 解析を行う必要がないため,多数の効果の小さな QTL に支配される量的形質も改良 できるなどの利点をもつ.その一方,ゲノム全体に配置された多数の DNA マーカーを選抜に用いるので, ハイスループットジェノタイピング技術の利用が不可欠となる.本稿では,ゲノミックセレクションとその 周辺技術について概説する. キーワード:ゲノミックセレクション,ゲノムワイドマーカー,ゲノムワイドアソシエーション解析 2012 年 4 月 11 日受理 連絡責任者:岩田洋佳([email protected])られるようになった.一方,作物においてゲノミックセレ クションの利用を検討する研究は,それほど活発には行わ れてこなかった.これはおそらく,作物では優良な 1 個体 を選抜することによる利益が乳牛に比べて低いため,それ が DNA チップなどを用いてジェノタイピングするコスト を上回ることが難しいと考えられていたためかもしれな い. しかし,近年,様々な作物でゲノムワイドアソシエーショ ン研究が行われた結果,作物では家畜やヒトに比べて連鎖 不平衡の程度が高く,比較的少数の DNA マーカーで原因 遺 伝 子 を 検 出 で き る 場 合 が 多 い こ と が 分 か っ て き た (Hamblin et al. 2011).このことは,後述するように,アソ シエーション解析と同様に連鎖不平衡という現象を利用す るゲノミックセレクションにおいても追い風となる.すな わち,作物では,乳牛などと異なり,比較的少数のマーカー でもゲノミックセレクションを効果的に利用できる可能性 が高い.仮に対象選抜集団における連鎖不平衡が高く数百 マーカーでも効果的な選抜ができるのであれば,そのコス トは,現時点においても,1 個体数千円程度に抑えられる. また,次世代シークエンサーを用いた多検体ジェノタイピ ング法の一つである Genotyping By Sequencing(GBS)など を用いれば,1 個体あたりのコストが,近々に$20,将来 は$5 程度まで下げられるという(Elshire et al. 2011).仮 に 1 個体を$5 で選抜できるようになると,対象とする形 質によってはゲノミックセレクションのコストが表現型選 抜のコストをはるかに下回る.このように,作物では連鎖 不平衡が比較的高いこと,ジェノタイピングコストが,急 激に低下してきていることから,作物育種におけるゲノ ミックセレクションの利用を現実的なレベルで検討するこ とができるようになってきている. このような背景から,数年前より作物育種におけるゲノ ミックセレクションの利用に注目が集まりはじめ(Heffner et al. 2009; Jannink et al. 2010; Lorenz et al. 2011),最近では, 実データをもとにした選抜精度のバリデーションやシミュ レーションによる効率評価に関する論文がさかんに発表さ れるようになってきた.
3.ゲノミックセレクションの原理
遺伝子や DNA マーカーは染色体上に数珠つなぎに並ん でいる.そのため,染色体上で互いに近接して位置する遺 伝子や DNA マーカーは親から子に共に伝えられやすい. これが連鎖とよばれる現象である.連鎖があることにより, 育種材料を集めた集団や選抜集団などの集団内でも,互い に近くに位置する遺伝子や DNA マーカーが非独立的な状 態にある場合がある.例えば,ある DNA マーカーが AA という遺伝子型をもつ個体では,その近傍に位置する QTL が QQ という遺伝子型をもち,DNA マーカーが aa と いう遺伝子型をもつ個体では,近傍の QTL が qq という遺 伝子型をもつ傾向が強いような場合がある.このような遺 伝子座間の非独立的状態を連鎖不平衡とよぶが,この連鎖 不平衡の存在がゲノミックセレクションを可能にしてい る.すなわち,ゲノミックセレクションではゲノム全体に 多数の DNA マーカーを配置することで,いずれかのマー カーがゲノム上に散在する QTL と非独立的な関係,すな わち連鎖不平衡の関係となり,マーカーの遺伝子型をもと に“本来なら観察が難しい”QTL の状態(遺伝子型)を ある程度把握できるようになる.このようにゲノムワイド マーカーと QTL 間の連鎖不平衡の関係を利用することによ り,選抜される個体のゲノムワイドマーカーの遺伝子型を もとに,その個体の遺伝的能力(遺伝子型値 genetic value) を予測することが可能となる. 具体的には,まず,多数の品種・系統のセット,または, 選抜集団に含まれる個体や系統のセットを参照データ(ト レーニングデータとよばれる)として用いて,ゲノムワイ ドマーカー遺伝子型から遺伝子型値を予測するモデルを作 成しておく.選抜を行う際には,表現型ではなくゲノムワ イドマーカー遺伝子型を計測し,あらかじめ作成しておい た予測モデルを用いて遺伝子型値を予測する.そして,予 測された遺伝子型値をもとに優良個体の選抜を行う.した がって,例えば作物の場合,栽培試験を行って表現型を計 測しなくても,ゲノムワイドマーカーのジェノタイピング さえできれば,優良個体の選抜ができるということになる.4.ゲノミックセレクションの予測モデル
ここでは de los Campos ら(2010)に従い,ゲノミックセ レクションの予測モデルについて説明する.量的遺伝学の モデルでは,個体i
の連続的な表現型変異y
(i=1,2,…,
iN)
を,遺伝子型値g
iと環境変動ε
iの和y
i= g
i+
ε
i として捉える.ゲノムワイドマーカーを用いた予測モデル では,遺伝子型値g
iを利用可能な全てのマーカーの関数 として捉える.すなわち,上述した遺伝モデルは,y
i= g(x
i,θ)+
ε
i と表される.ここで,g(x
i,θ)
はマーカー遺伝子型x
i=(x
i1,
x
i2,…,x
iM)’
から遺伝子型値g
iを求めるための関数であ り,θ
はその関数に含まれる未知のパラメータで,データ から推定される. 表現型が観測されていない個体i’
について,その遺伝 子型値g
i’を予測するためには,まず,先述したトレーニ ングデータ(複数の個体・系統について収集されたマーカー 遺伝子型と表現型のデータ)を用いて,関数g(x
i,θ)
の 未知パラメータθ
の推定値ˆθ
を求めておく.推定値ˆθ
が得 られれば,表現型を観察していない個体i’
についても, そのマーカー遺伝子型x
i’から,その遺伝子型値g
i ’= g
(x
i’,ˆθ)
をとして予測できる. 関数g(x
i,θ)
のモデルとして,様々な統計モデルが提案 されている.Meuwissen ら(2001)が最初に提案したのは, 表現型値y
iをマーカー遺伝子型x
iに回帰する線形回帰モ デル g(x
i,θ)=
Σ
x
ijβ
j M j=1 である.このとき遺伝モデルは,y
i=
Σ
x
ijβ
j+
ε
i M j=1 と表される.相加的な遺伝効果のみを考慮したモデルでは,x
ijは 2 つの対立遺伝子をもつマーカーj
のどちらか一方 の対立遺伝子のコピー数を表す.例えば,マーカーj
が, A と C を対立遺伝子としてもつ SNP である場合,個体i
の遺伝子型が AA の場合は 0,AC の場合は 1,CC の場合 は 2 としてx
ijをスコア化する.β
jはマーカーj
において コピー数をカウントした対立遺伝子(上の例では C)の相 加的遺伝効果を表す.この線形回帰モデルをトレーニング あてはめて,パラメータの推定値ˆθ=(βˆ
1,βˆ
2,…,βˆ
M)’
を求めておけば,表現型が観測されていない個体 i’の遺伝 子型値は,gˆ
i’=
Σ
x
i’jβˆ
j M j=1 として予測できる.5.予測モデル作成のための統計手法
ゲノミックセレクションでは通常,ゲノムワイドマー カー数 M が,トレーニングデータ内のサンプル数 N をは るかに上回る.ゲノムワイドマーカー数が M のとき,上 述した線形回帰モデルのパラメータ数は M となり,パラ メータ数がサンプル数 N をはるかに上回ってしまう.す ると,通常の重回帰分析を用いてパラメータθ =(β
1,
β
2,…,β
M)
’
を推定することはできない.そこでゲノミッ クセレクションの予測モデルの作成には,重回帰分析では なく,正則化最小二乗法やベイズ回帰など,M が N に比 べてはるかに大きい場合でも適用可能な統計手法が用いら れる. 正則化最小二乗法には幾つかの手法があるが,リッジ (ridge)回帰(Hoerl and Kennard 1970)や LASSO(LeastAbsolute Shrinkage and Selection Operator; Tibshirani 1996) などがよく用いられる.ベイズ回帰にもいくつかの手法が あるが,ゲノミックセレクションでは,Mewissen ら(2001) に提案された BayesA や BayesB,Habier ら(2011)に提案 された BayesCπ,LASSO をベイズ的な解釈に基づき発展 させた Bayesian LASSO(Park and Casella 2008)などがよ く用いられる.
また,上述したような線形回帰モデルだけでなく,カー
ネル法に基づく非線形回帰モデルなども用いられる.代表 的な手法としては,機械学習(machine learning)法の一つ であるサポートベクターマシン(support vector machine : SVM)回帰(Drucker et al. 1997)や,ベイズ的アプローチ に基づく reproducing kernel Hilbert spaces(RKHS)回帰 (Gianola et al. 2006)などが挙げられる.また,非線形回 帰モデルを得る方法としては,ニューラルネットワーク (neural network)やランダムフォレスト(random forest)な
どの学習法も用いられる(Iwata and Jannink 2011). 目標形質の遺伝率の違いや遺伝様式の違い(優性程度, エピスタシスの有無),選抜集団における連鎖不平衡の程 度の違い,ゲノムワイドマーカー数やトレーニングデータ 内のサンプル数の違いなど,様々な要因によって有効な手 法は異なってくると考えられる.様々な手法の中から最良 の手法を選択するには,実データをもとにした経験的検証 が必要となる.
6.ゲノミックセレクションの利点
ゲノミックセレクションでは,選抜しようとする個体や 系統に対して圃場試験で表現型を計測・評価することなく 選抜を行うことができる.しかしそれは,表現型の計測や 評価が必要なくなることを意味していない.予測モデルを 作成するには,トレーニングデータとしてマーカー遺伝子 型と表現型のデータのセットが必要だからである. ゲノミックセレクションでは,表現型評価が必要なく なったのではなく,表現型評価と選抜を,ゲノム情報を介 して“切り分けること”ができるようになったと考えると よい.すなわち,これまでは選抜の際には必ず,選抜しよ うとする個体の表現型を評価しなければならなかった.一 方,ゲノミックセレクションでは,トレーニングデータを 用いてマーカー遺伝子型と表現型間の関係をあらかじめモ デル化しておくことで,選抜の際には表現型を評価しなく ても優良な個体や系統を見分けることができる. 選抜と表現型評価の切り分けが可能となったことによ り,ゲノミックセレクションは主に以下のような利点をも つ. (1) 環境の影響を受けやすい量的形質に対して,安定した 選抜をどこでも行えるようになる.例えば,あるスト レス環境に適応できる品種を,非ストレス環境下の一 般圃場で選抜できる. (2) 暖地,温室,グロースチャンバー等を用いて世代促進 を行いながらゲノミックセレクションを行うことで 年複数回選抜ができる.これにより遺伝的改良の速度 を高めることができる. (3) 個体単位では計測が難しい形質について,個体選抜を 行うことができる.これにより,例えば,F2世代な どの,個体選抜しかできない選抜集団において,遺伝 率の低い量的形質に対して選抜を行うことができる. (4) 表現型評価にコストや時間を要する形質については,ゲノミックセレクションを用いることによってコスト や時間を節約できる.例えば,果樹などの永年性植物 の表現型評価には通常長い時間と大きなコストを要す るが,過去の品種特性調査試験などで収集された表現 型データを利用してあらかじめ予測モデルを構築して おけば,実際の選抜は実生段階で行うことができる. ゲノミックセレクションの利点は,他にも様々考えられ る.今後,実際の育種現場で利用される中で,その特徴を 活かした利用法が提案され,様々な利点が明らかになって いくと思われる.
7. ゲノミックセレクションとマーカー利用選抜
(MAS)との比較
DNA マーカーを用いて形質を観察せずに選抜するとい うアイデアはゲノミックセレクションに始まるものではな い.従来から行われてきたマーカー利用選抜(marker assisted selection : MAS)もそれを目指した育種技術であり, 単因子支配の形質や,効果の大きな QTL の選抜に日常的 に利用されて成果をあげてきた.しかしながら MAS は, 収量などの多因子支配の量的形質の選抜への適用において はほとんど成功例がみられなかった(Bernardo 2008).ここ で MAS とゲノミックセレクションを対比することは,ゲ ノミックセレクションの特徴の理解に役立つであろう. MAS とゲノミックセレクションの違いの一つは,前者 では,あらかじめ実験交配集団を用いて QTL 解析を行う 必要があり,後者では,前述のように,親候補品種や育成 中の材料を用いて予測モデルを作成する点である.育種現 場におけるこの違いは小さくない.前者では,育種事業と は別に実験集団を育成して QTL 解析を行わなければなら ないが,後者では,育種事業で用いられている材料をその まま用いて予測モデルを作成できる.このようにゲノミッ クセレクションは MAS に比べると,より育種の現場に馴 染みやすい性質をもつ.注意すべき点は,精度の高い予測 モデルを得るためには,精度の高い表現型データを収集す る必要があることかもしれない.実際の育種においては達 観で表現型を評価している場合もあり,そのような場合に は,表現型を正確に計測するための別のエフォートを必要 とするだろう. MAS とゲノミックセレクションのもう一つの違いは, 前者では,QTL 解析をもとに選抜用マーカーを選んで利用 するのに対し,後者では,基本的に全てのマーカーを利用 して選抜を行う点である.遺伝率が低く,関与する QTL 数が多い収量のような複雑形質では,統計的有意性を基準 に選抜用マーカーを選ぶことで,効果の小さな QTL を取 り逃がしてしまう可能性が大きい.これは統計的有意性と 育種における有用性が必ずしもイコールでないことによっ て生じてくる問題である.それに対してゲノミックセレク ションでは,効果の小さな QTL を蓄積するような改良に も適用できる.このような点から,ゲノミックセレクショ ンは,収量等,関与遺伝子数の多い量的形質の改良に有効 であろうと考えられている.8. 次世代シークエンサーを用いた多検体ジェノタ
イピング
最近,RAD-seq(Baird et al. 2008)や GBS(Elshire et al. 2011)などの次世代シークエンサーを用いた多検体ジェノ タイピング法が,高密度連鎖地図作成(Amores et al. 2011 ; Chutimanitsakun et al. 2011 ; Pfender et al. 2011 ; Poland et al. 2012)やゲノムワイドマーカーを用いた集団遺伝学的解析 (Hohenlohe et al. 2010)などの研究に用いられるようになっ てきた(Davey et al. 2011 ; Rowe et al. 2011).これら手法に は,いろいろな変法があるが,基本的には,制限酵素で処 理したゲノム断片に対しサンプル毎に異なる塩基配列 (バーコード配列)をもたせたアダプターをライゲーショ ンし,そのアダプター配列に相補的なプライマーを用いて PCR 反応を行い,その生成物を次世代シークエンサーで シークエンスする(詳細は Davey et al. 2011).PCR やシー クエンスは全サンプルをプールして行うが,アダプターに 組み込まれているバーコード配列をもとに,どのサンプル に由来するシークエンスかを見分けることができる.こう して制限酵素サイトの前後の塩基配列を多検体について シークエンスできる.制限酵素サイトの前後という限られ たゲノム領域だけをターゲットにシークエンスするため に,多検体をプールしても,1 検体あたりの読み深度(read depth)を高く保つことができる.同手法では,リファレン ス配列などが無い場合でもジェノタイピング可能(Catchen et al. 2011)なため,非モデル生物における応用に特に効力 を発揮すると思われる. 次世代シークエンサーを用いたジェノタイピングは, DNA チップを用いたジェノタイピングに比較して次のよ うな利点をもつ. (1) あらかじめ SNP を発見しておく必要が無い.また, 発見された SNP をもとにアレイをデザインする必要 がない. (2) SNP 発見をあらかじめ行わないため,ascertainment bias が生じない.ascertainment bias の存在は,集団分 化程度の解析に少なからぬ影響を及ぼすことが知られ ている(例えば,Albrechtsen et al. 2010)が,ゲノミッ クセレクションにおいても予測・選抜の精度に影響す る可能性がある(岩田 未発表). 次世代シークエンサーを用いたジェノタイピングは,現 状では,実験の煩雑さや欠測の多さなどに未だ問題を残し ているようだが,近い将来,これらの問題も解決し,様々 な局面で汎用的に利用できるようになると思われる.次世 代シークエンサーのコストあたりのスループットは,現在, 5 ヶ月毎に 2 倍になっており(Stein 2010),次世代シーク エンサーを用いたジェノタイピングのコストの低下やス ループットの向上は,今後数年間のうちにますます進んで
いくと考えられる.
9.将来展望と今後の課題
ゲノミックセレクションは,世代促進技術などとの併用 により,遺伝的改良の速度を高度に加速できるポテンシャル をもつ.このようなことから,食糧問題解決のためのキーテ クノロジーのひとつと考えられている(Tester and Langridge 2010 ; Phillips 2010).また,ゲノミックセレクションによ る高速育種は,新興のバイオエネルギー作物のように,育 種の歴史が浅く,改良の余地を大きく残す植物の改良に適 していると思われる.したがって,ゲノミックセレクショ ンが,食糧問題やエネルギー問題など,今後数十年人類が 取り組まなければならない難題解決に有用な技術の一つと なる可能性も少なくない. このように近い将来ゲノミックセレクションが重要な育 種技術の一つとなる可能性は高いが,その実用化には,今後, 実証試験によるポテンシャルの検証や,理論・シミュレーショ ン研究に基づく最適な利用法の検討を進めていく必要があ る.また,精度の高い予測モデルを得るためには,結局,表 現型データの計測・評価や,表現型に影響を与える環境デー タの収集・蓄積が非常に重要となる.したがって,今後は,表 現型を高効率かつ正確に計測・評価する技術の開発(Montes et al. 2007 ; Furbank 2009 ; Walter et al. 2012)や,表現型と環 境データのモデル化(Tardieu and Tuberosa 2010)などに関 する研究についても同時に進めていくことが重要である. また,計測・収集されたデータのデータベース化や,デー タを大規模に計測するための研究コミュニティの形成など も必要となる. ゲノミックセレクションの作物育種への応用は始まった ばかりであり,そのポテンシャルは未だ十分に明らかにさ れていない.また,現在のジェノタイピングのコストは, 数千,数万の個体を毎年選抜できるレベルには無い.した がって,今すぐゲノミックセレクションを実際の育種現場 に導入することは難しいかもしれない.しかし,上述した ように近い将来,ゲノミックセレクションの汎用的利用が 実現する可能性も少なくない.現時点ではゲノミックセレ クションの導入を始めることができないとしても,ジェノ タイピングのコストが非常に安価になる将来を想定し,そ の際に利用するための材料作りや表現型データの収集な ど,いわゆる“仕込み”段階の研究を今から着々と進めて おく必要がある.
参考文献
Albrechtsen, A., F. C. Nielsen, and R. Nielsen(2010) Ascertainment biases in SNP chips affect measures of population divergence. Mol. Biol. Evol. 27:2534 − 2547. Amores, A., J. Catchen, A. Ferrara, Q. Fontenot, and J. H.
Postlethwait(2011)Genome evolution and meiotic maps by
massibely parallel DNA sequencing : spotted gar, an outgroup for the teleost genome duplication. Genetics 188:799 − 808. Baird, N. A., P. D. Etter, T. S. Atwood, M. C. Currey, A. L.
Shiver, Z. A. Lewis, E. U. Selker, W. A. Cresko, and E. A. Johnson(2008)Rapid SNP discovery and genetic mapping using sequenced RAD markers. PLoS ONE 3(10):e3376. Bernardo, R.(2008)Molecular markers and selection for
complex traits in plants : Learning from the last 20 years. Crop Sci. 48:1649 − 1664.
Catchen, J. M., A. Amores, P. Hohenlohe, W. Cresko, and J. H. Postlethwait(2011)Stacks : building and genotyping loci de novo from short-read sequences. G3 1:171 − 182.
Chutimanitsakun, Y., R. W. Nipper, A. Cuesta-Marcos, L. Cistué, A. Corey, T. Filichkina, E. A. Johnson, and P. M. Hayes(2011) Construction and application for QTL analysis of a restriction site associated DNA(RAD)likage map in barley. BMC Genomics 12:4.
Davey, J. W., P. A. Hohenlohe, P. D. Etter, J. Q. Boone, J. M. Catchen, and M. L. Blaxter(2011)Genome-wide genetic marker discovery and genotyping using next-generation sequencing. Nat. Rev. Genet. 12:499 − 510.
de los Campos, G., D. Gianola, and D. B. Allison(2010) Predicting genetic predisposition in humans: the promise of whole-genome markers. Nat. Rev. Genet. 11:880 − 886. Drucker, H., C. J. C. Burges, L. Kaufman, V. Smola, and V.
Vapnik(1997)Support vector regression machine. Adv. Neural Inf. Process. Syst. 9:155 − 161.
Elshire, R. J., J. C. Glaubitz, Q. Sun, J. A. Poland, K. Kawamoto, E. S. Buckler, and S. E. Mitchell(2011)A robust, simple genotyping-by-sequencing(GBS)approach for high diversity species. PLoS ONE 6(5):e19379.
Furbank, R. T.(2009)Plant phenomics : from gene to form and function. Funct. Plant Biol. 36:5 − 6.
Gianola, D., R. L. Fernando, and A. Stella(2006)Genomic assisted prediction of genetic value with semi-parametric procedures. Genetics 173:1761 − 1776.
Goddard, M. E., and B. J. Hayes(2007)Genomic selection. J. Anim. Breed. Genet. 124:323 − 330.
Hamblin, M. T., E. E. Buckler, and J. L. Jannink(2011) Population genetics of genomics-based crop improvement methods. Trends Genet. 27:98 − 106.
Habier, D., R. L. Fernando, K. Kizilkaya, and D. J. Garrick (2011)Extension of the Bayesian alphabet for genomic
selection. BMC Bioinformatics 12:186.
Hayes, B. J., P. J. Bowman, A. J. Chamberlain, and M. E. Goddard(2009)Invited review : Genomic selection in dairy cattle : progress and challenges. J. Dairy Sci. 92:433 − 443. Heffner, E. L., M. E. Sorrells, J. L. Jannink(2009)Genomic
selection for crop improvement. Crop Sci. 49:1 − 12. Hoerl, A., and R. Kennard(1970)Ridge regression : biased
estimation for non-orthogonal problems. Technometrics 12: 55 − 67.
Hohenlohe, P. A., S. Bassham, P. D. Etter, N. Stiffler, E. A. Johnson, and W. A. Cresko(2010)Population genomics of parallel adaptation in threespine stickleback using sequenced RAD tags. PLoS Genet. 6(2):e1000862.
Iwata, H., T. Hayashi, and Y. Tsumura(2011)Prospects for genomic selection in conifer breeding: a simulation study of Cryptomeria japonica. Tree Genet. Genomes 7:747 − 758. Iwata, H., and J. L. Jannink(2011)Accuracy of genomic
selection prediction in barley breeding programs : a simulation study based on the real SNP data of barley breeding lines. Crop Sci. 51:1915 − 1927.
Jannink, J. L., A. J. Lorenz, and H. Iwata(2010)Genomic selection in plant breeding : from theory to practice. Brief. Funct. Genomic. Proteomic. 9:166 − 177.
Konig, S., H. Simianer, and A. Willam(2009)Economic evalu-ation of genomic breeding programs. J. Dairy Sci. 92:382 − 391
Lorenz, A. J., S. Chao, F. G. Asoro, E. L. Heffner, T. Hayashi, H. Iwata, K. P. Smith, M. E. Sorrells, and J. L. Jannink(2011) Genomic Selection in Plant Breeding : Knowledge and Prospects. Adv. Agron. 110:77 − 123.
Meuwissen, T. H. E., B. J. Hayes, and M. E. Goddard(2001) Prediction of total genetic value using genome-wide dense marker maps. Genetics 157:1819 − 1829.
Meuwissen, T.(2007)Genomic selection : marker assisted selection on a genome wide scale. J. Anim. Breed. Genet. 124:321 − 322.
Montes, J. M., A. E. Melchinger, and J. C. Reif(2007)Novel
throughput phenotyping platform in plant genetic stucies. Trends Plant Sci. 12:433 − 436.
Park, T., and G. Casella(2008)The Bayesian LASSO. J. Amer. Stat. Assoc. 103:681 − 686.
Pfender, W. F., M. C. Saha, E. A. Johnson, and M. B. Slabaugh (2011)Mapping with RAD(restriction-site associated DNA)
markers to rapidly identify QTL for stem rust resistance in Lolium perenne. Theor. Appl. Genet. 122:1467 − 1480. Phillips, R. L.(2010)Mobilizing science to break yield barriers.
Crop Sci. 50:S − 99 − S − 108.
Poland, J. A., P. J. Brown, M. E. Sorrells, and J. L. Jannink (2012)Development of high-density genetic maps for barley
and wheat using a novel two-enzyme genotyping-by-sequencing approach. PLoS ONE 7(2): e32253.
Rowe, H. C., S. Renaut, and A. Guggisberg(2011)RAD in the realm of next-generation sequencing technologies. Mol. Ecol. 20:3499 − 3502.
Stein, L. D.(2010)The case for cloud computing in genome informatics. Genome Biol. 11: 207.
Tardieu, F., and R. Tuberosa(2010)Dissection and modelling of abiotic stress tolerance in plants. Curr. Opin. Plant Biol. 13: 206 − 212.
Tester, M., and P. Langridge(2010)Breeding technologies to increase crop production in a changing world. Science 327: 818 − 822.
Tibshirani, R.(1996)Regression shrinkage and selection via the LASSO. J. Roy. Statist. Soc. Ser. B 58:267 − 288.
Walter, A., B. Studer, and R. Kölliker(2012)Advanced phenotyping offers opportunities for improved breeding of forage and turf species. Ann. Bot. doi:10.1093/aob/mcs026.
Whole genome breeding : Will next-generation sequencing open the door to a new
paradigm of breeding ?
Hiroyoshi Iwata
Graduate School of Agricultural and Life Sciences, The University of Tokyo (1 − 1 − 1 Yayoi, Bunkyo, Tokyo 113 − 8657, Japan)
Summary: To resolve food problems and energy problems, it is necessary to improve the genetic potential of crops at a faster rate. Called genomic selection (GS), the selection method is getting a lot of attention as a technology accelerating breeding. In GS, the potential of plants is predicted based on whole-genome marker genotypes, and selection is performed on the predicted potential. GS has advantages over conventional marker assisted selection: (1) GS does not require QTL analysis for determining markers used for selection (2) GS has the potential to improve quantitative traits controlled by many polygenic QTL. Because GS uses a large number of DNA markers that are distributed throughout the entire genome, the use of a high-throughput genotyping technology is absolutely necessary. Here, I present an overview of GS and its related technologies.
Key words: genomic selection, genome-wide markers, genome-wide association study