- 1 -
データサイエンスの波がバイオの世界に
―AI(人工知能)とバイオテクノロジーの融合へー (敬称略) 13:00開会挨拶 上田 誠
(京都市産業観光局長) 座長 植田 充美 13:05基調講演
『
AI とスパコンが拓く新生命科学―その端緒』
宮野 悟
(東京大学医科学研究所・教授 ヒトゲノム解析センター長) 13:45『複雑な生命現象への対処法―感染症や環境問題』
植田 充美
(京都大学大学院 農学研究科 応用生命科学専攻 教授) 14:25『先端バイオ技術の醸造現場への導入と機械学習による
『
イノベーションへの期待』
山本 佳宏
(京都市産業技術研究所 京都バイオ計測センター管理者) 15:05情報提供「平成 29 年版科学技術白書の発刊について」
文部科学省科学技術・学術政策局企画評価課
15:10 休憩座長 青木 航 15:20
『微生物によるモノづくりのためのトランスオミクスデータ
『
解読をめぐって』
松田 史生
(大阪大学大学院 情報科学研究科 バイオ情報工学専攻 代謝情報工 学講座 准教授) 16:00『AI 創薬の現状と可能性』
奥野 恭史
(京都大学大学院 医学研究科 人間健康科学系専攻 臨床看護学講座 ビッグデータ医科学分野 教授) 16:40『バイオサイエンス分野における機械学習応用研究の最新動向』
西村 亨
(株式会社ハイシンク創研 フェロー) 17:20閉会挨拶 吉田 多見男
(京都市産業技術研究所研究マネジメント統括理事) 交流会 17:45~19:45 (会場:4 号館地下 1 階 バンケットホール)- 2 -
AI とスパコンが拓く新生命科学-その端緒
宮野 悟 (東京大学医科学研究所) 東大医科学研究所は 2011 年から、ヒトゲノム解析センターのスーパーコンピュータシス テム活用し、がんを対象とした全ゲノムシークエンスに基づく臨床ゲノムシークエンス体 制を構築してきた。Genomon (https://github.com/Genomon-Project)は、血液腫瘍をはじ めとしてがんゲノム研究で実績のあるデータ解析パイプラインで、WGS 解析、WES 解析、 RNA-seq 解析、SV 解析などが可視化も含めスムーズにできるようになっている。また、 Clarity LIMS などのデータマネージメントシステム、生体認証によるセキュリティ管理、 網羅的多地点カメラによる安全・データ事故管理などのシステムを構築してきた。また、 IBM の Watson for Genomics 研究用として導入し、ビッグデータを活用したゲノム変異の解 釈・翻訳が人工知能技術によりどの程度有効であるかを検証してきた。大腸がんのマルチ リージョナル全ゲノム解析始まったこのプロジェクトだが、Watson for Genomics の導入に より、Myeloid パネル解析及び全エクソーム解析を使った血液腫瘍の臨床シークエンスも1 年半以上の実績を積んできた。これらのシークエンスには、臨床シークエンス専用に用意 した HiSeq2500, NextSeq, MySeq, Ion Proton, Ion PGM などを使い、サンガー法でバリデ ーションをしてきた。Tumor Board を開催し、様々な観点からの議論も行っている。様々な ノウハウがこの 6 年ほどの間に蓄積していると考えている。がんの理解の難しさだけでな く、日本において非認可の分子標的薬の問題、パネルを使った解析の限界、WGS の重要性、 日本における治験情報の非集中化の問題、改定薬事法の障害、時間との闘いなど、様々な 課題に取り組んできた。- 4 -
複雑な生命現象への対処法-感染症や環境問題-
植田 充美 (京大院農・応用生命、京都バイオ計測センター) 日本では初めての文部科学省、厚生労働省と経済産業省の3省の枠を横断する研究機構 である「独立行政法人日本医療研究開発機構(日本版 NIH)」が稼動しはじめ、「ヘルスケ ア」の研究開発が本格化しています。研究の中身は、簡単に言うと、少子・高齢化と生活 習慣病の増加を背景に多くの生活や医療の質の向上や病気の予防と未病の早期の把握、さ らに、環境浄化を含む健康の管理と維持など、多岐にわたります。これらの研究には、時 同じく発展してきました、健康に関わる高度な分析機器の発展とナノテクノロジーの導入 による開発が駆動力となっています。ゲノム解析ありきの時代を迎え、ゲノムから読まれ た転写産物や翻訳産物であるプロテオームやメタボローム解析などの網羅的なビッグデー タとなるトランスオミックス解析が重要になってきています。 研究対象も、標的となる物質だけでなく、それを取り巻くすべての物資を網羅的に解析 して、時々刻々変化する「生命現象のありのまま」の姿をとらえる研究へとギアチェンジ し始めています。これらの新しいバイオテクノロジー研究から、新しい発見や化学物質(医 薬品など)も創製されつつあります。 本日の講演では、高齢化社会で問題となっておりますヒトと微生物の相互作用の感染症(1) や、地球上での食糧生産に影響力の高い植物と土壌微生物の相互関係(2)、さらに、農産廃 棄物の有効利用へつながる微生物の生き様(3)を分子レベルで捕らえ、便移植などの新造語 もでてきております「腸内細菌群研究」、すなわち、マイクロバイオーム研究などに進んで いくために、AI などを活用していく研究素地を提唱したいと思います。 文献(1)
Kitahara, Morisaka, Aoki et al. AMB Express, 5, 41 (2015).(2)
Tatsukami, Ueda, Scientific Reports, 6, 27998 (2016).(3)
Aburaya, Morisaka et al., AMB Express, 5, 29 (2015).- 6 -
先端バイオ技術の醸造現場への導入と機械学習によるイノベーションへの期待
山本 佳宏 (京都市産業技術研究所 バイオ計測センター) バイオ関連分析技術の進歩は著しく、ヒトの遺伝子は 30 億塩基対=3 Gbp(ギガ ベース ペア)と云われているが、1 日にその 10 倍以上の 50 Gbp 以上の解析能力を持つ装置も市販 されている。また、タンパク質解析においても 1 回の分析で 3,000 種以上のタンパク質を 分離・同定し、比較解析できる装置も利用できる状況である。これらバイオ情報を活用す る産業の代表として、抗体やタンパク質を製造する製薬企業が存在する。一方、バイオ情 報を利用して製品を製造する食品産業では、このような分析技術は有用ではあるものの、 実際の生産に活用している事例はほとんど見られない。しかしながら、バイオ技術の応用 製品である食品は一般市民を対象とする基盤産業であり、その市場規模は極めて大きく、 特に醸造製品の付加価値は極めて高い。そして京都を主産地とする清酒産業では近年、国 内外で拡大する高級清酒の需要に対応できる質・量両面の生産体制のイノベーションが求 められている状況である。 京都地域では産学公連携のプロジェクトとして京都市産業技術研究所及び京都バイオ計 測センターに設置されている先端分析装置を用い、高品質製品製造に係る清酒もろみの分 析を行うことにより、生産性・品質向上に寄与する成分の探索が行われている。併せて、 現在生産指標に用いられている成分について分析技術開発により高分解能化と低コスト化 を図り、生産現場での成分プロファイルの多項目化に取り組んでいる。この成果を融合し、 先端バイオ技術を製造現場に導入することにより、生産性・品質向上のための重要な要素 技術である工程管理の高度化を実現し、目的とする製品仕様と生産途上の仕掛品の状態を より詳細に比較することが可能となる。 この分析技術を活用し、生産のためのアクションとその結果生ずる成分プロファイルの 変化を実装することで、製造を補助する有益なアプリケーションが期待できる。目標を達 成する最適な手段を予測する方法として機械学習は極めて有効な手段であることは多くの 事例より明らかとなっている。これを有効に導入するためには、①達成目標(囲碁・将棋 の勝利条件に当たる)の明確化、②生産時のアクションの明確化が必要であり、アクショ ンによりもたらされる成分プロファイルの変化について十分な計測値を蓄積し学習データ として提供する必要がある。また、マシンパワーを有効に活用するためには計測する成分、 手段を最小化するなど解析の効率化のための整理が必須となる。 バイオ計測技術と機械学習の導入について、当初は製造現場のアクシデントを解決する ための補助手段として受動的に利用することになるだろう。しかし、将来的にはアプリケ ーションの熟成により、想像しなかったような特徴を持つ幅広い製品の生産を効率よく可 能とするなど、積極的な利用による醸造産業のイノベーションがもたらされることに大き な期待が寄せられている。- 8 -
微生物によるモノづくりのためのトランスオミクスデータ解読をめぐって
松田 史生 (阪大院情報・バイオ情報) 微生物によるモノづくりの効率化を目指し、微生物代謝経路の人為的な改変が試みられ ている。ブラックボックスだった微生物中心代謝の理解が、ゲノム情報等の蓄積で飛躍的 に進み、合成生物学的に代謝経路を「設計(design)⇒構築(built)⇒試験(test)⇒学 習(learn)」する、DBTL サイクルの構築が急がれている [1]。「設計⇒構築⇒試験」部分は 要素技術が出そろい、今後は「学習」部分、すなわち、代謝律速部位を同定し、新たな代 謝設計のアイデアを導出する方法の開拓が求められている。 代謝律速部位の同定が困難な原因は、代謝調節機構の圧倒的な理解不足にある。そこで、 我々は出芽酵母の中心代謝経路に注目して、1遺伝子欠損変異株からミカエリスメンテン 式に登場する反応速度 v、基質濃度[S]、酵素濃度[E]に対応する、代謝フラックス、代謝 物濃度、酵素発現量のトランスオミクスデータを取得し、代謝調節機構の理論的解読を試 みている[2]。システム生物学でも同様のアプローチが活発化している。 トランスオミクスデータ解読を進めるには、データ処理、可視化、データ解釈の効率化 が必要である。たとえば、クロマトグラムのピークピッキング作業は、いまだ手作業に負 う部分が大きく、データ処理最大のボトルネックとなっている。Woldegebriel らは、ニュ ーラルネットワークと深層学習を組み合わせたピークピッキングAIの構築を報告してお り[3]、機械学習技術の更なる活用が期待される。また、トランスオミクスデータ解読の最 初の一歩は、パスウェイマップ上へのデータ投影である。我々は、このデータ処理作業を 簡便化、半自動化するツール群を、システム・バイオロジー研究機構が開発している GARUDA プラットフォーム上に構築、公開した[4]。研究者がデータ解読により注力できる環境の整 備が、重要となるだろう。 トランスオミクスデータの解読作業では、まず既存の知見と照らし合わせた推論を行う。 ケモインフォマティクス分野では、以前から藤田らによる医農薬開発支援システム EMIL (Example Mediated Innovation for Lead Evolution) 等のエキスパートシステムの開発が 試みられており [5]、同様のアプローチが有効になると考えられる。そこで、我々の過去 の人力でのデータ解読例[2]をもとに、どのような推論を自動化すればいいのか、データベ ースと推論エンジンをどのように簡単、安価に作るかについて、データ解読実務者の立場 から私見を述べ、議論に付したい。[1] 近藤 昭彦・植田 充美 生物工学会誌 93(9) 522‒541.2015 [2] Matsuda et al. PLoS ONE 12(2) e0172742. 2017
[3] Woldegebriel et al. Anal. Chem., 89 (2) 1212–1221. 2017
[4] http://www.garuda-alliance.org/gadgetpack/shimadzu/ よりダウンロード可能 [5] 藤田 稔夫 CICSJ Bulletin 14(1), 1996
- 10 -
AI 創薬の現状と可能性
奥野 恭史 (京都大学 大学院医学研究科 人間健康科学系専攻) 近年、あらゆる分野において爆発的に増大し続けるビッグデータから知識発見や新たな 価値を創造する科学技術として、ビッグデータ科学が注目されている。創薬に限らず生命 科学分野においても、ハイスループット技術やオミクス計測技術の著しい進展に伴いデー タ爆発が起こり、ビッグデータ科学の研究開発が急務とされている。このように多種多様 かつ膨大なデータに直面する最中、今度はこれらビッグデータを解析する技術として人工 知能が注目されるに至っている。言うまでもなく、人工知能分野そのものは新興の分野と いう訳でないが、Google 社の Deep Learning や IBM 社のワトソンの出現により、近年の人 工知能技術のパフォーマンスと可能性にさまざまな分野が大きな期待を寄せている。 演者は、約 10 年前より人工知能・機械学習技術の創薬応用に着手してきており、活性化 合物のスクリーニングや自動分子デザインの技術開発を行ってきた。また、昨年の 11 月に、 ライフ分野を対象とした AI 開発を産学、異業種連携で進めるため、ライフ・インテリジェ ンス・コンソーシアム(LINC)を立ち上げた。LINC は、京大・理研などのアカデミアの支 援のもと、IT 業界と、製薬・化学、医療・ヘルスケア、食品のライフサイエンス分野の企 業など約 70 社・団体がタッグを組むことで、AI 戦略による保健医療分野・関連産業の振興 を目指すものである。 本講演では、演者のこれまでの具体的な研究開発を例に、AI 創薬の現状と可能性につい て紹介する。- 12 -