• 検索結果がありません。

機械学習を活用した界面構造探索とスペクトル解析

N/A
N/A
Protected

Academic year: 2021

シェア "機械学習を活用した界面構造探索とスペクトル解析"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

1.は

 じ め に

合金や半導体,電池,触媒などのマテリアル研究に機 械学習などの情報科学手法を組み合わせた「マテリアル ズインフォマティクス」は近年盛んに行われている.そ の歴史は比較的古く,2005 年に K. Rajan の“Materials Informatics”という記事が Materials Today 誌に掲載 され,2006 年には米国材料学会の学会誌 MRS Bulletin に“Materials Informatics”の特集号が組まれている. そ の 後,2011 年 に ス タ ー ト し た Materials Genome Initiativeプロジェクトにより,マテリアルズインフォ マティクスが特に注目されはじめた. 国内でも 2013 年にはマテリアルズインフォマティク スに関する報告書が JST-CRDS によりまとめられ,科 研費の新学術領域研究が同年に二つスタートした.最近 でも科学技術振興機構(JST)や新エネルギー・産業技 術総合開発機構(NEDO),内閣府によるプロジェクトや, 物質 ・ 材料研究機構(NIMS)による拠点形成などが行 われている. 著者らの研究グループでは,これまでシミュレーショ ンとナノ計測を用いた物質の原子・電子構造解析を行っ てきた.最近はそれら構造解析に機械学習を活用してい る.機械学習の初心者であったが,ビギナーズラックの おかげで界面構造探索とスペクトル解析に機械学習を有 効に活用することができた.本稿ではそれらの研究成果 について紹介したい.

2.

機械学習を用いた界面構造探索

元素の組合せによりつくられるさまざまな物質の中で も,固体の結晶材料はその構造や特性も古くから調べら れ,現在では Materials Project や NOMAD,Mat Navi などデータベースから構造と物性のデータを取得するこ とができる.一方で,実際に使用されている結晶材料は, 単結晶ではなく無数の結晶が異なる方位で集合した多結 晶体である.図 1 に示すように,多結晶体内部には点欠 陥(空孔,固溶),線欠陥(転位),面欠陥(表面,界面) といったさまざまな格子欠陥が存在しており,その格子 欠陥には結晶内部とは異なる原子配列が現れる.そのた め多結晶体の機械的・機能的特性は,結晶の原子構造に 加えそのような格子欠陥の構造に大きな影響を受けるこ とが知られている. 本研究が対象としている粒界は単結晶粒の相対的な

機械学習を活用した界面構造探索と

スペクトル解析

Interface Structure Determination and Spectrum Analysis Using

Machine Learning

清原  慎

東京大学生産技術研究所

Shin Kiyohara Institute of Industrial Science, The University of Tokyo.

[email protected], http://www.edge.iis.u-tokyo.ac.jp

溝口 照康

(同   上)

Teruyasu Mizoguchi [email protected], http://www.edge.iis.u-tokyo.ac.jp

Keywords:

machine learning, interface, spectrum, virtual screening. 「マテリアルズインフォマティクス」

図 1 多結晶材料中の格子欠陥の模式図.

各丸が原子に対応しており,完全結晶から崩れた構 造が現れる箇所が格子欠陥.粒界は結晶が異なる方 位で接する領域

(2)

方位差から生じる面欠陥である.粒界を構成する結晶粒 の方位や角度に関する九つの巨視的な自由度が存在する [Sutton 95].その構造を決めることは困難なため,モ デル化された対応格子(CSL:Coincidence site lattice) 理論に基づく CSL 粒界(Σ 粒界)が粒界の基礎研究で 良く用いられる. Σ粒界は粒界面の種類によって,同じ物質でも多様な 構造が現れ,その粒界構造の複雑さを Σ と数値を使って, Σ3,Σ5 や Σ17 など,Σn(n は奇数)として表す.この Σ粒界は粒界面が決まっているものの,結晶の剛体変位 と粒界端面の計四つの自由度を決定する必要がある. Σ粒界の一つ(例えば図 2 中 ΣGB1)の構造を決定 するためにγ-surface法が用いられてきた.粒界をは さんだ結晶の剛体変位を網羅的に変えた初期構造(Ini. config.)を作成し,これら一つ一つに関して第一原理計 算(DFT)や分子動力学計算(MD)を行う(図 2 中縦 の矢印).その結果,緩和構造(Opti. Config.)と,界面 エネルギー(E1, 1∼ E1, i)が得られる.この界面エネルギー が最も低い(安定 E1, min)なものが,ΣGB1の安定粒界 となる. この DFT や MD 計算によりエネルギーと緩和構造を 得るには数分∼数時間を要する.複雑な系では 1 種類の 粒界の原子構造を決定するために月単位の時間が必要と なってくる.そのため,これまで粒界に関する研究は, 一つの物質の 1 種類の粒界について議論する各個研究が ほとんどであった.粒界における多様な構造と物性との 相関性を理解するためには,精度を保ちつつ界面構造を 決定するスピードを向上させる必要がある. 一方,情報科学的視点から見ればγ-surface法による 粒界構造決定は,三次元の並進移動から構成される三次 元空間における最適値探索問題とみなすことができる. 情報科学ではこのような膨大な自由度の組合せから最 小・最大値を探索する手法が種々存在し,すでに材料科 学への応用が進みつつある.粒界構造探索では,遺伝的

アルゴリズムや Random Structure Searching などの手 法が報告されてきたが,それらの手法でも数百回の試行 計算が必要である. そこで我々はさらなる高速化を図るために機械学習を 活用した.本稿では,仮想スクリーニングとクリギング と称される情報科学手法を界面構造決定に利用した我々 の研究を紹介する. 2・1 仮想スクリーニングによる界面構造決定 仮想スクリーニング(Virtual Screening)では,まず 現在手元にあるデータベースから予測モデルを構築し, その予測モデルをもとに探索空間全体の数値や物性を予 測する.観測データがない領域に関しても予測モデルを もとに「仮想的」に物性値や性能を知ることができる. つまりすべての計算・実験を行わなくとも所望の値をも つ点(条件)を予測することが可能となる.我々はこの 手法を粒界構造決定に利用した [Kiyohara 16]. 本手法の模式図を図 3 に示す.図 2 のγ-surface法で は,すべての Σ 粒界(ΣGB1∼ ΣGBN)に対して,DFT や MD 計算を実施する必要があるが,DFT/MD 計算の 代わりに予測モデル(Prediction model)を構築するこ とができれば,効率的な粒界構造決定が実現できる. 予測モデル構築のために,いくつかの粒界(図 3 の ΣGB1,ΣGB2)に関してはこれまでと同様にγ-surface 法により構造緩和計算を行い,計算前の原子配置情報(原 子間距離や密度など)とエネルギー(E1, 1∼ E1, i,E2, 1 ∼ E2, i)の関係を機械学習によりモデル化した. 計算前の原子配列情報のみから粒界エネルギーを予 測することができるため,最安定と予測された候補構造 のみに対してのみ DFT/MD 計算を行えばよい.つまり 膨大な数の候補構造から,最安定構造を与えると予測さ れる有力候補をスクリーニングしてくれるため,シミュ レーションによる計算コストを大幅に削減することが可 能になる. 図 2 γ-surface法の概略図 図 3 仮想スクリーニング法の概略図

(3)

ここでは,面心立方構造を有する Cu の粒界に注目し た.粒界を形成する二つの結晶の回転軸により,多様な 構造が形成される.今回は最もシンプルに,両結晶とも [0 0 1]軸を回転軸としてもち,さらに対称的に結晶を傾 けた粒界([0 0 1] 軸対称傾角粒界)に対して本手法の適 用を試みた.説明変数(特徴量,記述子)には,緩和前 の候補構造における粒界近傍の第一・第二近接原子間距 離や,原子密度,最長原子間距離や最短原子間距離など 数十種類を用い,目的変数は,粒界エネルギーを用いた. 回帰には,非線形回帰法の一種であるサポートベクトル 回帰を用いた. 訓練データとして Σ 値や粒界面が異なる四つの粒界を 選択し,予測モデルを構築した.同予測モデルをテスト した後に,訓練にもテストにも用いなかった計 12 種類 の Σ 粒界に適用した.図 4(a)に予測したエネルギー を示す.同図の横軸は各粒界をつくるための回転角を用 いており,各角度において異なる Σ 粒界が現れる.縦軸 は界面エネルギーである. 回転角に対して上に凸な関係であり,エネルギーが下 がる点(cusp)の位置など,過去の報告と一致している ことがわかる. 例えば,Σ37 粒界に関して安定構造と予測された構造 を図 4(b)に示す.予測された安定構造は六員環構造 がジグザグに配列している特徴的な構造であった.これ をγ-surface法により決定した安定構造(図中白丸)と 比べてみると,良く一致していることがわかる.つまり, 仮想スクリーニングを用いた手法が非常に高精度に界面 構造を予測できていることがわかる [Kiyohara 16a]. 2・2 クリギングによる界面構造決定 次に,クリギング(Kriging)を用いた界面構造決定 プロセスの高速化について紹介する.クリギングはガウ ス過程回帰を用いた空間補完法であり,限られた観測 データから空間全体を推定する手法である.この手法を 逐次的に用いることで地球内部の資源探索を効率的に行 うことが可能である.マテリアル研究にも有効であり, シミュレーションやプロセスにも利用されている.クリ ギングにより粒界構造を決定する際には,以下の(1) ∼(5)を繰り返すことで行われる. (1)探索空間からランダムに候補構造を数個程選択し, 粒界エネルギーと構造を計算する. (2)得られた粒界エネルギーに基づいてガウス過程回 帰を行い,計算していない他の点の粒界エネルギー と分散を推定する. (3)次の式に従い,Ziが最大の点を次の探索点とする.

Zi=(GB Energycurrent min.− GB Energyi)/√σi

 GB Energycurrent min.は i 回目の探索での最小粒界 エネルギー,またGB Energyi,σiはそれぞれデータ点 iでの予測粒界エネルギーと分散を表している.つま り,この Ziが最大の点を選択するということは予 測粒界エネルギーが小さく,かつその予測精度が確 からしい点を選択するということを意味している. (4)選択した探索点に対応する候補構造に関して構造 緩和計算を行い,エネルギーを算出する. (5)粒界エネルギーが十分小さい構造が見つかるまで 上記(2)∼(4)のプロセスを繰り返す. ガウス過程回帰は粒界エネルギーの予測だけでなく, 予測値の分散(確からしさ)も算出できる.そのことを 利用して,予測粒界エネルギーが小さく,かつその予測 値が確からしい点を重点的に探索することで効率的な探 索が可能となる [Kiyohara 16b]. クリギングを酸化マグネシウム(MgO)の Σ5 に適用 した結果を図 5 に示す.γ-surface法では図 5(a)に示 すように三次元のデータ空間に 4 万個以上の候補構造が 存在する.そのような界面に関してクリギングを実施す ることで,十数回の探索(上記(1)のランダム探索 5 回を含む)により最安定構造を決定している. 図 5(a)に示すようにこの粒界は対称性の関係で等 価な最安定構造(濃い領域)が複数存在し,クリギング の探索履歴を見てみると,9,11,12,13,16 回目にお いて安定構造が発見されている.「同程度の安定構造を 5回探索したら終了する」という収束条件の関係で 16 回目にクリギングが終了した(図 5(b)).図 5(c)は クリギングにより得られた安定構造と過去の報告にある 構造(白黒点)と比べると両者は一致している.同手法 が粒界構造探索において非常に効率的であることがわか る [Kikuchi 18]. 一方で,得られた結果が Local minimum という可能 図 4 (a)仮想スクリーニングにより得られた界面エ ネ ル ギ ー と(b) Σ 37 粒界の安定構造.白丸は γ-surface法で得られた正解構造 図 5(a)に示すようにこの 粒界は対称性の関係で等価な 最安定構造(濃い青い領域)

(4)

性もある.実際には,クリギングを 10 回ほど繰り返し 行い,得られる構造やエネルギーの再現性を確認する必 要がある. 2・3 転移学習によるクリギングの高速化 次に転移学習をクリギングに組み合わせた結果につい て述べる.転移学習では,ある問題を解く際に作成した 予測モデルを関連した別の問題に再利用することでより 早く(賢く)問題を解決する手法である. クリギングでは一つの粒界構造を探索する際に予測モ デルを構築している.一つの粒界をクリギングで計算し た後に得られている予測モデルを,別の粒界に再利用で きれば,より優れた(賢い)予測モデルが構築され,ク リギングの探索効率が向上することが期待される. さまざまな粒界に予測モデルを転移するために,結合 距離や密度,結合数など,すべての界面で共通の計 74 個の幾何的情報を説明変数として使用し,74 次元空間 での予測モデル構築を行った. クリギングと転移学習を組み合わせた手法を 33 種類 の鉄の粒界に適用した.その結果を図 6 に示す.縦軸は 個別に転移学習ありの場合となしの場合の計算回数の比 を表しており,横軸は転移の順になっている.一番初め の粒界面(1 1 1)を有する Σ3 に粒界に関しては転移学 習を行うことができないので比が 1 になっているが,そ れ以降の粒界に関しては転位学習により計算回数が最大 1/5ほどに減っていることがわかる. また転移を繰り返すことで効率が良くなっている.つ まり転移することで予測モデルが“賢く”なっていると いう,まさに人工知能のような振舞いをしていることが わかる [Oda 17] また,転移学習においても得られた結果の検証のため に,数回繰り返し,得られる構造やエネルギーの再現性 を確認する必要がある.

3.

機械学習を用いたスペクトル解析

物質研究においてはさまざまな光(電子線,X 線,中 性子線など)を試料に照射し,試料中の原子・電子と照 射した光との相互作用を測定する分光分析が盛んに行わ れる.得られるデータはスペクトル状であり,光波長や, 入射,検出を変えることでスペクトルからさまざまな情 報を得ることができる. 例えば,電子線や X 線を試料に照射した際に,内殻電 子が遷移して得られる Core-loss スペクトルは,局所的 な原子構造や化学結合状態を測定できる強力な手法であ る.例えば最新の電子顕微鏡を用いることで,原子カラ ムごとの配位環境や化学結合に関する情報を抽出するこ とが可能である. 一方で,実験スペクトルから有益な情報を抽出する ためには,理論計算が必須である.しかし,一般的に Core-lossスペクトルの計算には膨大な計算時間を必要 とする.さらに近年では,Core-loss スペクトルを時間・ 図 5 (a)MgO Σ5 粒界におけるデータ空間.(b)クリギング における探索履歴.(c)クリギングで得られた粒界構 造.白丸 / 黒丸は過去に報告された構造 図 6 転移学習の利用による計算効率の向上

(5)

空間分解で測定することが可能になり,一度の測定で取 得されるスペクトルの数が急激に増加している.つまり, 膨大な数のスペクトル一つ一つを専門の研究者が理論計 算し解釈するという「研究者駆動型」のスペクトル研究 は限界を迎えつつある. そこで著者らはスペクトル解析に機械学習を利用し た.機械学習をスペクトル解析に利用した研究は古くか ら行われている.特に,化学分野で用いられる NMR の Chemical shiftをニューラルネットワークにより予測す る研究が 1990 年代にいくつか報告されている.最近で は,X 線吸収分光(XAFS)の計算スペクトルのデータ ベースも公開され,さらに XAFS 解析に機械学習を利 用した研究も報告されつつある.本稿では機械学習を活 用した core-loss スペクトルの解析法について紹介する [Kiyohara 18]. まず,「Core-loss スペクトルの解釈」について考える. 研究者が行っている「解釈」とは「スペクトルと原子構 造の相関性を見いだす」ことにほかならない.具体的に は,測定された未知物質からのスペクトルと,類似して いるスペクトルをデータベースから選択し,それらのス ペクトルに共通する物質情報(結合距離や価数など)の 特徴を発見することで,「同スペクトルが同特徴に起因 する」と解釈する.そのような研究者が実際に行ってい る手順を機械学習で模倣し,自動的に相関性を抽出する 手法を構築した. まず,今回考案した手法の概略について述べる.デー タベース内のスペクトル(図 7(a))に関して教師なし 学習の一種である階層型クラスタリングを適用して分類 する.階層型クラスタリングにより得られるデンドロ グラムと呼ばれるクラスタリング木の模式図を図 7(b) に示す. 階層型クラスタリングではスペクトル間の距離を測 り,その距離が小さいものどうしをスペクトル形状が類 似した一つのクラスタとみなしていく.これを繰り返す ことでスペクトルの階層的なグループ化を行うことがで きる. 続いてデンドログラム下部のクラスタ(図 7(b)中ク ラスタ 1 ∼ 3)に注目する.階層型クラスタリングによ りそれぞれ 2 個,4 個,3 個のスペクトルがそれぞれクラ スタ 1,2,3 に所属している.同一クラスタ内のスペク トルは互いに似た形状を有しているはずである. このクラスタ間のスペクトル形状の違いの起源となる 構造情報の違いを抽出するために,決定木分類を行った. スペクトルの各クラスタをラベルとみなすことで,各ス ペクトルにラベルを付与することができ,決定木による 分類の際に教師データとして利用することができる.決 定木分類の際の記述子として,スペクトルの解釈に実際 に使用される結合距離や配位数,価数,元素種などの構 造情報を用いた.つまり構造情報の決定木が,スペクト ル分類のラベルをもとにつくられるため,その決定木を 解析することで「スペクトル形状と構造情報の相関性」= 「解釈」を行うことが可能となる(図 7(c)). 具体的にスペクトルを 14 個準備した(図 8).今回用 いたのはさまざまな酸化物の酸素 K 端と称されるスペク トルである.手法開発を目的としているため,それらの スペクトルは理論計算により得ている.各酸化物でスペ クトル形状が異なっていることがわかる.これらのスペ 図 7 (a)スペクトルデータベース,(b)階層型クラスタリングによるスペクトルの分類,(c)スペクトルの分類結果を教師と した構造情報の決定木 図 8 解析に用いた酸素 K 端スペクトル

(6)

クトルを階層型クラスタリングにより分類した結果を図 9(a)に示す.スペクトル形状の類似度により,いくつ かのクラスタに分かれている.例えば,酸化チタン(TiO2) で結晶構造が異なる rutile と anatase は低い位置で分岐 しており,スペクトルどうしが似ていることがわかる. 今回はこのデンドログラムを四つのクラスタに分けるよ うなしきい値を用いた.クラスタ 1 ∼ 4 にはそれぞれ 5, 3,2,4 個のスペクトルが所属している.それらの分類 結果をもとに,物質の構造情報の決定木を作成した(図 9(b)).14 個のスペクトルをスペクトル分類に合うよ うに決定木を作成すると,「孤立原子状態における d 電 子を有する」,「Ⅳ族元素含む」,「Ⅰ族元素含む」が分岐 の特徴量として選ばれた.この結果から各スペクトルが 正しく解釈されていることがわかる.つまり,クラスタ 2は,「Ⅳ族元素であり」,「d 電子を有する」元素で構成 された物質からのスペクトル群であり,クラスタ 1 は, 「Ⅰ族元素ではない」が「d 電子も有さない」元素で構 成されるスペクトル群といえる. これまでに SiO2の多型から計算された 25 個のスペク トルにも同手法を適用し,すべてのスペクトルを正確に 解釈することができている.さらに,この樹形図と決定 木を利用することで,構造情報からスペクトルを「予測」 することも可能である [Kiyohara 18]. このようなスペクトルの「解釈」と「予測」に加え,さ まざまなスペクトル解析に機械学習を利用した研究を実 施中である.その成果については,近々報告予定である.

4.お

 わ り に

本稿では,機械学習を活用した界面構造探索とスペク トル解析について紹介させていただいた.著者らの研究 グループでは,5 年ほど前から機械学習を利用し始め, 試行錯誤の末に本稿で紹介したような研究成果を得るこ とができた. 機械学習は物質研究に非常に有効であり,今後の物質 研究において不可欠なツールになると確信している.化 学物質は多様で複雑に見えるが,「周期表の元素で構成さ れる」という絶対的なルールが存在しており,機械学習 でその法則をモデル化できれば,これまでにない新しい 物質や機能,物理法則の発見につながると期待している. 一方で,機械学習を専門とする研究者の物質研究への 参入はまだ少数である.ぜひ多くの人工知能関係の研究 者に参加していただき,「マテリアルズインフォマティ クス」の分野を盛り上げていただければと思う.

◇ 参 考 文 献 ◇

[Kikuchi 18] Kikuchi, S., Oda, H., Kiyohara, S. and Mizoguchi, T.: Bayesian optimization for efficient determination of metal oxide grain boundary structures, Phys. B Condens. Matter., Vol. 532, pp. 24-28(2018)

[Kiyohara 06a] Kiyohara, S., Oda, H., Miyata, M. and Mizoguchi, T.: Prediction of interface structures and energies via virtual screening, Sci. Adv., Vol. 2, pp. e1600746-e1600746(2016) [Kiyohara 06b] Kiyohara, S., Oda, H., Tsuda, K. and Mizoguchi,

T.: Acceleration of stable interface structure searching using a kriging approach, Jpn. J. Appl. Phys., Vol. 55, pp. 045502-1-4 (2016)

[Kiyohara 18] Kiyohara, S., Miyata, T., Tsuda, K. and Mizoguchi, T.: Data-driven approach for the prediction and interpretation of core-electron loss spectroscopy, Sci. Rep., Vol. 8, pp. 13548-1-12(2018)

[Oda 17] Oda, H., Kiyohara, S., Tsuda, K. and Mizoguchi, T.: Transfer learning to accelerate interface structure searches, J.

Phys. Soc. Jpn., Vol. 86, pp. 123601-1-4(2017)

[Sutton 95] Sutton, A. P. and Balluffi, R. W.: Interfaces in

Crystalline Materials, Oxford Science Publications(1995)

2019年 3 月 8 日 受理

著 者 紹 介

清原  慎 2016年東京大学大学院工学系研究科マテリアル工 学専攻修士課程修了.同年,同専攻博士課程(現在, 博士課程 3 年生). 溝口 照康 2002年博士(工学)取得の後,京都大学,東京大学, Lawrence Berkeley National Laboratoryで博士研 究員.2019 年から東京大学生産技術研究所教授(現 職).

図 9 (a)階層型クラスタリングにより得られたスペクトル の分類結果,(b)構造情報の決定木

図 1 多結晶材料中の格子欠陥の模式図.
図 9  (a)階層型クラスタリングにより得られたスペクトル の分類結果, (b)構造情報の決定木

参照

関連したドキュメント

Key Words : Local remote sensing, Image processing, Network camera,Hachigasaki Beach,

SamplingMesurment DateLocationDepth/mSR-IRFT-IR ATRSR-IR Mapping Anthozoa Octocorallia Paracorallium japonicum a)Japanese red coral1DPC-122005Off Ryukyu

機械物理研究室では,光などの自然現象を 活用した高速・知的情報処理の創成を目指 した研究に取り組んでいます。応用物理学 会の「光

の観察が可能である(図2A~J).さらに,従来型の白

そこでこの薬物によるラット骨格筋の速筋(長指伸筋:EDL)と遅筋(ヒラメ筋:SOL)における特異

[Nitanda&Suzuki: Fast Convergence Rates of Averaged Stochastic Gradient Descent under Neural Tangent Kernel Regime,

Optimal stochastic approximation algorithms for strongly convex stochastic composite optimization I: A generic algorithmic framework.. SIAM Journal on Optimization,

Dual averaging and proximal gradient descent for online alternating direction multiplier method. Stochastic dual coordinate ascent with alternating direction method