化学産業における分子デザイン

(1)

1．は

じめに

化学という概念は広大であり，現実世界のあらゆるものは化学から成るという見方もできる．当社に長く伝えられている「化成萬物」という言葉は，その心をよく表している．人類が土器を焼き始めたときそれは化学であったし，現代の情報科学もまた化学の進歩なくしてはあり得なかった．主役であれ脇役であれ，技術の進歩があるときには必ず化学が伴っているともいえよう．したがって，化学と計算の間には古くからの関係があるのも不思議ではない．産業化には予測と制御が必須であり，これまでも幅広く計算が用いられてきた．特に大規模化した製造では効率と安全を追求するために化学工学を中心とした物質の移動と反応を取り扱う技術が，また研究開発では原理の解明と実験回数の削減のために量子化学や分子動力学が使われてきている．しかし，化学の守備範囲はそれだけではない．例えば医薬品や肥料などもまた化学である．統計学の祖の一人であるフィッシャーが穀物と肥料を題材にしていたことからも，化学と統計の関連の深さがうかがわれる．現代の Evidence Based Medicine が統計を根拠としているように，高度に複雑な系においては統計が主要な解析手法である．広い意味での化学産業では，このように演繹的な計算と帰納的な統計が長く使われてきた歴史を有する．さて本号の特集であるマテリアルズインフォマティクス（MI）は，これらの技術の延長であり発展形であると思われる．最終的に化学は実世界において価値をもつが，その実現に至る期間を短縮し，あるいは新規なものを生み出す手助けをしてくれる計算・統計という点では，これまで数十年の位置付けと大きな差はない．一方で興味深いのは，これまでにないほど多くの，化学を専門としない研究者・技術者の参入が見られることである．この点は，シリコンバレーで言うところの“Software is eating the world”のような野望とそれを支える知の民主化や意思決定の速さ，産業界ではディジタルトランスフォーメーション（DX，詳細は付録を参照）と呼ばれるインターネット経済の影響が大きいと思われる．著者らの所属するような伝統的企業にとっては，これらの新たな動きは脅威であると同時に，再び化学が大きな発展をする絶好の機会でもあると捉えている．

2．

化学における演繹と帰納

さて，化学における演繹的手法と帰納的手法の関係について，著者らの考えを少し述べたい．横軸に漠然とした科学・技術の成熟度のようなものを，縦軸に説明能力あるいは予測能力のようなものをプロットすると，図 1 のようなイメージなのではないだろうか．すなわち演繹的手法は基礎理論と計算速度の進展とともに指数関数的な成長を示す一方で，帰納的な手法はデータや情報の蓄積とともに垂直的に立ち上がるもの

化学産業における分子デザイン

Molecular Design in Chemical Industry

磯村　　哲

株式会社三菱ケミカルホールディングス

Tetsu Isomura Mitsubishi Chemical Holdings Corporation.

[email protected], https://www.mitsubishichem-hd.co.jp/

山下　博史

（同上）

Hiroshi Yamashita [email protected], https://www.mitsubishichem-hd.co.jp/

Keywords:

materials informatics, chemoinformatics, molecular design, human computation, Bayesian inference. 「マテリアルズインフォマティクス」

図 1 演繹的手法と帰納的手法の関係．

実線：演繹的手法（理論・シミュレーション），破線：帰納的手法（データサイエンス）

(2)

の，データ量が十分になるにつれ飽和してシグモイド関数のような曲線を示す．ここで横軸を四つのフェーズに分けて考えると，最も左の領域は，演繹・帰納ともに役立たないため直感が支配している．例えばアートが当てはまるだろう．次のフェーズはデータの蓄積は未熟であり，理論はあるが計算には至らない．例えば経営のように断片的な理論が林立するような領域がここに相当する．第 3 のフェーズでは，物理・化学ベースのシミュレーションで実問題を解くには計算能力が不足しており，データからのパターン認識でわかることのほうが多い．EC サイトにおける購買行動予測などがこの典型である．最後のフェーズでは圧倒的な計算パワーで理論から導かれる厳密解が得られるため，理論的なバックボーンをもたないデータサイエンスは使われない．例えば流体などがここに相当する．なお，シミュレーションとデータサイエンスの融合であるデータ同化をこの中に位置付けるなら，第 3 のフェーズと第 4 のフェーズの境界領域に来るだろう．材料科学におけるコンピュータサイエンスはこれまで主に演繹的な手法が支配的である第 4 のフェーズを扱ってきたが，データサイエンスを導入することで手前の第 3のフェーズを発見したのが MI であるといえよう．つまり，実問題に対して理論や計算能力が不足している問題こそ，MI の格好の標的となる．

3．

創薬における分子デザイン

さて，MI は産業界で今後どう発展していくのか．そのヒントは，インフォマティクスで先行しているライフサイエンスが参考になるのではないだろうか．特に創薬化学における分子デザインは，現在 MI が置かれている状況と非常に近いと感じる．その観点から，以降の章では著者らの経験を中心に振り返ってみたい．読者にとって何らかの参考になれば幸いである．創薬化学における計算機やインフォマティクスの利用は Computer Aided Drug Design（CADD）と総称され，さらに分子動力学や量子化学などの演繹的・シミュレーション中心の手法と定量的構造活性相関（Quantitative Structure-Activity Relationship：QSAR）などの帰納的・統計的な手法とに大別される．歴史的には統計的な手法のほうが古く，1960 年代から検討が行われてきた．一方で演繹的な手法は計算機のコスト低下に伴い飛躍的な発展を遂げ，京コンピュータの存在もあって，つい数年前までは CADD といえばシミュレーションを想起させるほどの隆盛を誇った．この帰納─演繹の軸に加え，化学構造から機能を予測する問題（ここでは“順問題”と呼ぶ）と，機能を満たす構造を提示する問題（“逆問題”）との軸があり，四つの象限を形成している（表 1）．左上の象限は，いわば化学の基礎的な考え方をまっすぐ計算機にもち込んだものであり，基本原理に則って系の挙動を予測するものである．この手法は化学者にとって理解可能という利点が最も大きく，系の純粋な振舞いの予測に用いられる以外に，系の説明にも用いられる．一方で複雑な系では巨大な計算資源を要するのが短所である．この象限をそのまま右に移動し逆問題を解こうとすると計算資源は絶望的に不足するため，何らかの計算を省略する必要がある．このうち，探索領域を限定し特定の化合物プールだけを対象とするのがバーチャルスクリーニングであり，バーチャルスクリーニングをタンパク質と化合物の立体構造の形状および静電的な相性で判定するのがドッキングである．右上の象限のもう一つの方法はラテン語で「最初から」 を意味する de novo 設計といわれており，タンパク質の ポケット内に置かれた薬剤の構造を元に，細かな改変を施して機能を改善させる方法である．これは 1990 年代に華々しく提案されて以降大きなインパクトを生んでいないが，現代の MI と通ずるところが大きいのでご紹介しよう． 3·1 低分子有機化合物の場合の数 de novo 設計ソフトウェアの一つである Ludi [Böhm 92]では，タンパク質内に結合しそうなフラグメントを探索・連結することで，強固に結合し薬効が示唆される化合物の構造を提案するという機能を有していた．しかし，こうしたソフトウェアから出力される構造のバラエティには限界があり，また実際の合成に必ずしも向かないものが多く，実利用は限定的であった．そこで，一度ステップバックして，そもそも化合物の場合の数を実際に計算する研究が現れた．低分子有機化合物の数学的に可能な集合（“化学空間”）はおよそ 10 の 60 乗と見積もられる [Bohacek 96]．それに対し既知の物質はわずか 10 の 8 乗程度しか存在しないため，化学空間を把握するには十分ではなく，数学的な手法が必要となる．化学空間をより具体的に見積もるために，化合物をグラフで表現し，そのエッジラベル（単結合，二重結合な どの結合次数，正確には sp3_，sp2_{などの結合様式）を固} 定しノードラベル（C，N，O などの原子種）を網羅的に置換することで，化合物をより正確に数え上げた研究が存在する [Ogata 07]．図 2 の左は，あるタンパク質の表 1 CADD における四象限順問題逆問題演繹分子力学分子動力学量子化学バーチャルスクリーニング（ドッキング） de novo 設計（フラグメント付加）帰納 _（QSAR）定量的構造活性相関（リガンド法）バーチャルスクリーニング Inverse-QSAR

(3)

ポケットに収まった薬剤化合物である．このタンパク質ポケットに化合物が強く結合するとその機能が阻害されてより高い薬効が期待できるため，タンパク質ポケットに置かれた元々の薬剤化合物（図 2 左）のトポロジーを保ったまま網羅的にノードラベル置換し，結合強度が最大になるよう最適化した例が図 2 の右になる（注：一見すると化合物らしいが，有機化学者からはかなり無理のある構造であることが見て取れる）．こういった変換パターンを種々のトポロジー構造に対して計算機実験で試したところ，場合の数は驚くほど法則性があることがわかった．図 3 の丸プロット Non-Filterでは，化合物中の水素を含まない原子数 N に対し， およそ 10 の N/2 乗程度と見積もれる．ただし，薬剤ら しさのフィルタを入れると場合の数が減ると同時に直線性が崩れることがわかった．この関係式から MI で考慮すべき化合物数の上限を見積もることができ，例えば原子 30 個からなる化合物数は 10 の 15 乗程度と推定される．なお，この研究 [Ogata 7] には続きがあり，単に化合物を数え上げただけではない．実際に化合物を合成し，タンパク質の活性阻害試験と X 線構造解析を行った結果，元化合物と同等の活性と結合位置であることが確認されている（図 4）[Ogata 10]．この方向性の発展形の一つは，化合物グラフのトポロジーも変更する真の網羅的な数え上げである．例えば [猪口 15] ではグラフ理論と列挙アルゴリズムの技術を応用し不適切な構造をもたない化合物グラフを高速に列挙できるようにした（1 秒当たり約 77 000 個を列挙）．一方，組合せ最適化として別のアプローチも考えられる．前述の [Ogata 07] では，化合物探索の際に組合せ爆発を避けるため，化合物をフラグメントに分解し，フラグメントごとに構造の数え上げと結合強度の計算をして，その情報から結合強度が最大となる全体構造を再構築している．しかし近年の量子アニーラを用いれば，瞬時に最適解が求まる可能性がある．ごく簡単なペプチドを標的タンパク質に，ベンゼンを薬剤に見立てて検証を行った結果，確かに量子アニーラで化学構造の最適化が行えることが確認された（図 5） [Sakaguchi 16]．原子置換による結合強度（すなわち位置エネルギー）の最適化はイジングモデルに自然に落ちるため当然かもしれないが，1 000 ビット程度で現実的な有機化合物が扱えそうなことから，量子アニーラの実用という面でも可能性を感じる結果である． 3·2 データ駆動型分子設計表 1 左下の象限は QSAR として古くから検討されており，特に薬剤に共通の物性などデータが蓄積しやすい系において日常的に用いられるようになった．しかし早くから実業に根差した半面，一般的なデータサイエンスとは独自の進化を遂げる傾向にあった．近年のデータサイエンスの隆盛で QSAR は深層学習などを取り込み久々のイノベーション期にあるが，これまで分野特異的な知識が詰め込まれたつくり込みを超えるのは容易ではなく，真の進歩が起きるかは定かではない． QSARでは化合物構造の特徴表現がまずもって重要である．化合物の構造的特徴はあらかじめ定義した部分構造セットにわたってその有無を調べた結果（0/1）をフィ図 2 同一ジオミトリの原子置換．（左）タンパク質ポケットに収まった元化合物と（右）結合強度が最適になるようノードラベル置換した化合物図 5 量子アニーラによる化合物の原子置換．（a）原子タイプの情報を消した初期構造 ,（b）原子タイプを割り振った最安定構造 ,（c）2 番目に安定な構造図 3 化合物をノードラベル置換したときの場合の数．横軸は化合物の水素を除いた原子数，縦軸はノードラベル置換の場合の数（対数）．●：数学的に可能なすべての場合 ▲：“薬剤らしさ”という知識に照らして不適切な構造を除いた場合図 4 原子置換前後の X 線構造解析結果．タンパク質 JNK3 に結合した化合物の（a）元構造と（b）原子置換後の構造

(4)

ンガープリントとして表すところから始まり [Durant 02]，化学構造に含まれる部分構造をそのつど認識してハッシュ値に変換するものへと進化した [Rogers 10]．これまでに，3 000 以上の構造表現方法が開発された [Todeschini 09]．また，機械学習コミュニティでは，特徴量の次元を無限に取れるグラフカーネルが多く考案された [Kashima 03, Mahé 09, Yamashita 14]．グラフカーネルは構造情報ロスが少ないという利点があったものの，予測に重要な部分構造がその他多くに埋もれてしまうという課題があった．そして近年，化合物グラフ（入力）から特性値（出力）まで一気通貫で学習できるグラフ畳込みニューラルネットワーク [Wu 19, Xu 18] が出現し，データから予測への寄与が高い部分構造の認識を踏まえた化合物構造の特徴量作成が自動化された．しかし，ニューラルネットワークの学習では大量にデータがあることが前提であるため，データが少ない MI では，蓄積があるデータからの転移学習，シミュレーションによるデータ生成，少ないデータからの学習を可能にする少数ショット学習が重要となる．表 1 右下の象限のうち，バーチャルスクリーニング（リガンド法）では，データから学習した相関関係を因果関係の代わりに使って入手可能なあらゆる化合物について順問題を解く．結果の成否は探索対象にした化合物空間の偏りに左右される．この偏りを緩和する試みとして，反応と試薬の情報を使って網羅的に生成した大量の仮想化合物（10 の 9 乗個程度）を利用する研究がある [長谷川 15]．一方，帰納ベースで分子を組み立てるアプローチはこれまで盛り上がったとは言いづらい．Inverse-QSAR と呼ばれる研究自体は昔からあるが，構造ベースの陰に隠れていた印象である．ここまで背景が整いながら，本象限は MI のほうが先に着目されているというのは複雑なものである．図 6 は近年の研究成果であり，ベイズ推定による分子設計の考え方でもある [Ikebata 17]．前述したように [Ogata 07] から本来対象とすべき化合物空間は途方もなく広大であるため，ここでは化合物の構造発生器を用いた目的地周辺からのランダムサンプリングを用いて いる．ここで，S が化合物（原因），Y が特性（結果）， Uが望ましい特性のセットを表す．ベイズの反転公式 p（S｜Y ∈U）∝p（Y∈U｜S）p（S）を使うアプローチで は，化合物 S の実現性についての信念の分布 p（S）を データという証拠からつくられる化合物が満たすべき特 性をもつ確率の分布 p（Y∈U｜S）で更新して，満たす べき特性をもつ化合物の分布 p（S｜Y∈ U）を手にする ことができる．p（Y∈U｜S）は予測特性値と理想特性 値のずれの大きさから定義することができる．p（S）は 化学構造の文字列表記（SMILES）のパターンを既存化合物データから学習した確率的言語モデルであり，構造発生器として用いる．そして，モンテカルロ法によって p（S｜Y ∈U）からサンプリングすることで具体的な設 計化合物が得られる．妥当な構造を出すには，ルール化 したケミストの知識で p（S）に制約を入れることが肝要 である． 3·3 合成可能性の取扱いさて，以降は逆問題の鬼門である合成可能性について触れたいと思う．逆問題では，構造生成と構造評価の二つの機能が本質的である．しかし実際には，構造生成においてグラフを組み立てる技術は数学的に閉じた問題であるのに対し，現実に合成できるかどうかは数学の外側であるだけでなく，有機合成自体の技術革新によってラベルが変わり得る問題であり，さらには収率や原料・精製コストなどの状況，専門家どうしの見解の相違でもラベルが変化する．したがって，グラフ組立てと合成可能性という二つの問題は切り分けて考えるのが，長期的視座に立てば重要である．合成可能性を情報科学に取り込むにはいくつかのアプローチがある．例えば化学反応データと深層学習や強化学習を組み合わせて逆合成経路を探索する方法 [Liu 17, Segler 18]，過去に存在する化合物データ中に現れる部分構造の出現頻度とグラフ複雑度から合成可能性スコアを算出する方法 [Ertl 09]，専門家の直観を取り込む方法 [Baba 18] などである．バーチャルスクリーニングでは合成が困難な天然物由来の構造などを除外できればよかったので，どの方法でも大して問題はなかった．しかし逆問題では，これまでにない構造でありながら化学的に妥当であるという非常に困難な問題設定を強いられる．一般のデータベースに登録されている構造のほとんどが合成された，すなわち合成可能な化合物からなることを考えればなおさらである．これに対する一つの切り口は，ヒューマンコンピュテーションで専門家の能力を手続きに取り込むことであ図 6 ベイズ推定による分子設計

(5)

る（図 7）．化学者は専門家のみならず，ある程度の専門性を有する技術者の意見をうまく集約することで一定水準の回答を維持できることが示されており [Baba 18]，未知な問題に対してインフォマティクス単独で取り組むよりも大きな可能性が見えている．

4．MI の

定着と発展に向けて

MIが定着するためには，データの管理，統計モデリング，モデルの運用の三つすべてが回る必要があるが，データ管理と運用は実験化学者の近くで行うべきであり，可能なら実験化学者自身が携わるべきである．その理由は心理学的でいう保有効果が大きいと考えている．つまり，自らが使うために自分で準備したデータであれば積極的に標準化や保存を行うし，自らが予測した化学構造は実験で検証するモチベーションが上がる．モデリングの部分はデータの標準化と経験の増加に伴い，自動化できる部分が増えてデータサイエンティストの負担は下がるだろう．これが定着への道筋と考えられる．もちろんトップダウンでルール化する選択肢もあるが，イノベーティブな風土を維持促進するためには内発的動機付けがベターではないだろうか．図 8 は社内で開発した，合成化学者が実験を構想する際のアシストツールであり，マウスを用いて構造を描画するとリアルタイムで機械学習による予測物性が表示される．当然ながらプロジェクトごとに要求物性は異なるため，予測モデルの構築はデータサイエンティストが行ったうえでデプロイし，実験化学者はモデリングやシステムを意識しないで使えるようになっている．一方でデータサイエンティストと計算科学者や実験チームとのコミュニケーションを密にすることも定着とレベル向上に肝要である．そのためには背景知識やキャリアパスの多様なチームを形成し，本質的な理解を深めることが重要だろう． MIのデータサイエンスとしての側面を考えると，一般的にはデータ活用に三つの段階があると考えている（表 2）．Level 0 はデータを活用していない段階であり，数年前までの材料科学の研究開発はここに相当するだろう．Level 1 はデータとデータサイエンスを利用しているが，新規技術としての興味であって，業務フローや意思決定の根幹に関わる部分は従来と同様である．Level 2 ではデータが起点となって種々の状況判断や意思決定が行われている．近年のデータサイエンスブームの文脈では当然のように Level 2 が推奨されているが，実は基礎科学が十分に発達している場合には Level 1 のほうが質の高い判断ができるケースも往々にして存在する．重要なのは結論の正確さとそこに至る速さであって，データサイエンスはその手段であることを失念してはいけない．さて最後に，MI がさらなる発展を遂げるための制約をあげたいと思う．一般に科学技術の発展にはアカデミアが大きな役割を果たすが，ことデータサイエンスに関しては，質と難易度の高いオープンデータを生み出すという点において実験科学系ラボの果たす役割は大きい．しかし，アカデミアにおける材料科学，特に高分子系の研究室は減少する一方であり，あるいはかなりライフサイエンスに寄ることで予算を得ていることが多く，産業的に有用なデータが生み出されるような研究が幅広く行われているとは言いがたい状況である．この状況を打破し，材料科学に夢を与えることが最も重要であり，アカデミアと産業界が共に盛り上げる必要がある．MI がその牽引役になることを期待している．図 7 候補構造の妥当性を化学者に問うための UI．回答者は提示された構造を見て，文献などを調べることなく直観で化学構造の妥当性を 5 段階で回答する図 8 合成化学者のための物性予測 GUI．化学者が構造を描画・編集すると，あらかじめつくられた予測モデルを通じて物性値がリアルタイムに推算される表 2 データ利用に関する三つの段階 Level 2：データ駆動データが起点となった状況判断や意思決定 Level 1：データ利用データ解析を利用しているが，位置付けは既存の方法のサポート Level 0：データ未活用データは存在しないか，データを生かした意思決定をしていない

(6)

《付録》ディジタルトランスフォーメーション

近年ビジネス界でバズワードのように使われている「ディジタルトランスフォーメーション（DX）」という語がある．これはディジタを用いてビジネス変革を行うことを指すが，当社では MI を DXの一環と捉えており，著者らも数多くの DX プロジェクトに関わっているため，その考え方を紹介しておきたい． DXはディジタル技術とその思想を用いて企業内のあらゆる要素やシステムを変革することであるが，中心的な概念は取引コストの減少，ネットワーク効果，知の民主化，データ駆動，サイバーフィジカルシステム（CPS）などインターネット革命と重なるところが大きい．このため価値観の背景が伝統的な大企業と異なり，内部人材のみでは対応できないことから，当社ではチーフデジタルオフィサー（CDO）をはじめ多くの人材を外部から登用し，内部人材との積極的な交流を図っている． DX プロジェクトも従来の慎重かつ大規模な投資と異なり，リーンスタートアップのように小さく始め，有用性が見えてきた段階で規模を拡大するという手順を踏んでいる．プロジェクト推進にはさまざまな知識とスキルが状況に応じて必要になるため，DX 専門家は本社でチームを形成し，有機的にさまざまなプロジェクトに出入りする構造となっている． MI も同様であり，材料科学の素人であるデータサイエンティストと内部で長く材料開発に携わってきた化学者が同じプロジェクトに入ることで，これまでにないアプローチが迅速な成果に結び付いている．また，知の民主化にならい解析プログラムや UI は社内で広く利用できるようなシステムを提供している．これらを通じディジタルの思想が研究開発から広まることも期待の一つである．

◇ 参考文献 ◇

[Baba 18] Baba, Y., Isomura, T. and Kashima, H.: Wisdom of crowds for synthetic accessibility evaluation, J. Mol. Graph

Model., Vol. 80, pp. 217-223（2018）

[Böhm 92] Böhm, H. J.: The computer program LUDI: A new method for the de novo design of enzyme inhibitors, J. Comput.

Aided Mol. Des., Vol. 6, No. 1, pp. 61-78（1992）

[Bohacek 96] Bohacek, R. S., McMartin, C. and Guida, W. C.: The art and practice of structure-based drug design: A molecular modeling perspective, Med. Res. Rev., Vol. 16, No. 1, pp. 3-50 （1996）

[Durant 02] Durant, J. L., Leland, B. A., Henry, D. R. and Nourse, J. G.: Reoptimization of MDL keys for use in drug discovery, J.

Chem. Inf. Comput. Sci., Vol. 42, No. 6, pp. 1273-1280（2002） [Ertl 09] Ertl, P. and Schuffenhauer, A.: Estimation of synthetic

accessibility score of drug-like molecules based on molecular complexity and fragment contributions, J. Cheminformatics, Vol. 1, No. 8（2009）

[長谷川 15] 長谷川亜樹，藤原康広，森本元太郎，平野秀典，沖本憲明，泰地真弘人，船津公人：創薬に向けた大規模仮想化合物ライブラリの開発と高度化，第 38 回ケモインフォマティクス討論会東京，pp. 50-51（2015）

[Ikebata 17] Ikebata, H., Hongo, K., Isomura, T., Maezono, R. and Yoshida, R.: Bayesian molecular design with a chemical language model, J. Comput. Aided Mol. Des., Vol. 31, No. 4, pp. 379-391（2017）

[猪口 15] 猪口明博，磯村哲：グラフコーディングを用いたスーパーグラフ検索の効率化，第 105 回人工知能学会知識ベースシステム研究会，pp. 26-33（2015）

[Kashima 03] Kashima, H., Tsuda, K. and Inokuchi, A.: Marginalized kernels between labeled graphs, Proc. 20th Int.

Conf. on Machine Learning（ICML 2003）, Washington, DC, U.S.A., August 21-24, 2003, Fawcett, T. and Mishra, N., Eds., pp. 321- 328, AAAI Press: Chicago, IL, U.S.A.（2003）

[Liu 17] Liu, B., Ramsundar, B., Kawthekar, P., Shi, J., Gomes, J., Nguyen, Q. L., Ho, S., Sloane, J., Wender, P. and Pande, V.: Retrosynthetic reaction prediction using neural sequence-to-sequence models, ACS Cent. Sci., Vol. 3, No. 10, pp. 1103-1113 （2017）

[Mahé 09] Mahé, P. and Vert, J.-P.: Graph kernels based on tree patterns for molecules, Mach. Learn., Vol. 75, pp. 3-35（2009） [Ogata 07] Ogata, K., Isomura, T., Yamashita, H. and Kubodera,

H.: A quantitative approach to the estimation of chemical space from a given geometry by the combination of atomic species, QSAR Comb. Sci., Vol. 26, No. 5, pp. 596-607（2007） [Ogata 10] Ogata, K., Isomura, T., Kawata, S., Yamashita,

H., Kubodera, H. and Wodak, S. J.: Lead generation and optimization based on protein-ligand complementarity,

Molecules, Vol. 15, No. 6, pp. 4382-4400（2010）

[Rogers 10] Rogers, D. and Hahn, M.: Extended-connectivity ﬁngerprints, J. Chem. Inf. Model., Vol. 50, No. 5, pp. 742-754 （2010）

[Sakaguchi 16] Sakaguchi, H., Ogata, K., Isomura, T., Utsunomiya, S., Yamamoto, Y. and Aihara, K.: Boltzmann sampling by degenerate optical parametric oscillator network for structure-based virtual screening, Entropy, Vol. 18, No. 10, pp. 365-375（2016）

[Segler 18] Segler, M. H. S., Preuss, M. and Waller, M. P.: Planning chemical syntheses with deep neural networks and symbolic AI, Nature, Vol. 555, No. 7698, pp. 604-610（2018） [Todeschini 09] Todeschini, R., Consonni, V.: Molecular

Descriptors for Chemoinformatics（2 volumes）, Wiley-VCH: Weinheim（2009）

[Wu 19] Wu, Z., Pan, S., Chen, F., Long, G., Zhang, C. and Yu, P.: A comprehensive survey on graph neural networks, arXiv preprint arXiv:1901.00596（2019）

[Xu 18] Xu, K., Hu, W., Leskovec, J. and Jegelka, S.: How powerful are graph neural networks, arXiv preprint arXiv:1810.00826（2018）

[Yamashita 14] Yamashita, H., Higuchi, T. and Yoshida, R.: Atom environment kernels on molecules, J. Chem. Inf. Model., Vol. 54, No. 5, pp. 1289-1300（2014） 2019年 3 月 6 日受理

著　者　紹　介

磯村哲 1999年東京大学大学院工学系研究科化学生命工学専攻修士課程修了．同年，三菱化学株式会社入社． 2002年ゾイジーン株式会社，2007 年株式会社モレキュエンス，2012 年株式会社地球快適化インスティテュート，2017 年株式会社三菱ケミカルホールディングスに所属．ヘルスケアから素材産業まで，データサイエンスを軸としたディジタルビジネス変革に従事している．山下博史（正会員） 2001年京都大学大学院理学研究科博士後期課程化学専攻単位取得退学．2014 年博士（統計科学，総合研究大学院大学）．2001 年三菱化学株式会社，2002 年ゾイジーン株式会社，2007 年田辺三菱製薬株式会社， 2018年株式会社三菱ケミカルホールディングスに所属．2015 ∼ 18 年統計数理研究所客員准教授．分子グラフ上の逆問題に取り組んでいる．

化学産業における分子デザイン

1．は

じ め に

2．

化学における演繹と帰納

化学産業における分子デザイン

Molecular Design in Chemical Industry

磯村 哲

山下 博史

Keywords:

3．

創薬における分子デザイン

4．MI の

定着と発展に向けて

《付録》ディジタルトランスフォーメーション

◇ 参 考 文 献 ◇

著 者 紹 介

じめに

磯村　　哲

山下　博史

◇ 参考文献 ◇

著　者　紹　介