人工知能の弱点を補う物理学

(1)

1．は　じ　め　に

子供の頃の曖昧な話で恐縮だが，1960 年代に，暗算の達人とコンピュータが計算速度の競争するというテレビの番組を見たことがある．10 桁くらいの数字を数十個足し合わせるような問題だったが，けっこう良い勝負だったように記憶している．当時は，正確な計算ができることが職業としても成り立っており，例えば，アポロ計画を舞台にした映画「ドリーム」では，ロケットの軌道計算を行う計算要員として働いていた黒人女性達の人生の転換がわかりやすく描かれている [20 世紀フォックス]．それが今では，コンピュータと計算の速さを競おうなどという発想をする人は皆無であるどころか，とうとう最も頭を使う難しいゲームと思われていた囲碁において，人工知能が人間の名人を赤子の手をひねるがごとく負かしてしまうまでになった．コンピュータが苦手としていた画像認識なども最近急速に進歩し，長年の夢だった人工知能による自動運転も実用化が見えてきている．この 50 年の間のコンピュータの進化は驚異的である．その間，物理学もコンピュータのおかげで，随分と変わってきた．従来，物理学は実験物理と理論物理の二つが研究の柱だったが，1970 年代から 80 年代にかけて，計算物理という第三の柱ができた．計算物理は，非線形で多変数の時間発展方程式を与えて，計算機でそれを解くことをあたかも実験による観測の結果のように扱う研究方法である．手で解ける線形の世界とは全く異なる非線形の世界が，コンピュータによって観察され，それに伴って物理学の理論が発展し，実験による現実世界の中での検証も進んだ．粒子のような特性をもつ波であるソリトン [戸田 00] の研究が 1960 年代に進み，わずかな初期値の違いが質的な違いに至る詳細な過程を研究したカオス [合原 09] の研究が 1970 年代に，簡単な非線形効果が無限の複雑さを生み出すフラクタル [マンデルブロ 11] の研究がその後大きく展開した．非整数の値をとる次元という概念は，数学的には新しくはなかったが物理としては極めて斬新だったので，広い分野の物理学者の関心を集め，1980 年代の中頃には，素粒子から宇宙まであらゆるスケールの物理現象においてフラクタル探しの研究が進められ，さまざまな物理学の学術誌にフラクタルの研究論文が掲載されるようになった． 1990年代に入ると，フラクタルの発想の原点が，金融市場の価格変動にあったということから，物理学者の目が経済現象に向くことになった [高安 13]．現実の金融市場のデータからフラクタル性を確認するような論文 [Mantegna 95]，そのようなフラクタル性が生じる原因を仮想的な金融市場のシミュレーションによって解明する論文 [Takayasu 92] が発表され，経済物理学という新しい研究分野が誕生した．1997 年には，物理学の分野の中では最も権威のあるフィジカルレビューレター誌に経済物理の研究論文が掲載された [Takayasu 97]．経済現象も物理学の研究対象となるということで，物理学者による研究は金融市場だけでなく，企業の財務データなどにも広がっていった．詳細で膨大な経済データを解析する研究が進んだことで，人間の行動に伴うデータであっても，質と量が優れたデータがあれば，物質の現象と遜色のないような普遍性が見いだせるということがわかってきて，2000 年代になると，研究対象がさらに広がり，空港どうしを結ぶフライトのネットワークや友達関係のネットワークといったことまでが物理学者の研究対象となっていった．このような社会の中のビッグデータに関する物理学的な研究の特徴は，常識にとらわれないで与えられたデータを分析し，そこから経験的に法則性を見いだし，その経験則を説明するような数理モデルを構築し，応用に発展させるという形で研究を進めることにある．これは，コペルニクス，ガリレオ，ケプラー，ニュートン，そして，ハレーへと発展していった惑星運動に関する研究の手法そのものであり，物理学の原点回帰である．それを可能にしたのが，膨大なデータの解析と数理モデルによるシミュレーションを可能にしたコンピュータである．以下の章では，個人的な見解となるが，著者と人工知

人工知能の弱点を補う物理学

Physics Can Redeem the Weak Points of AI

高安　秀樹

ソニーコンピュータサイエンス研究所，東京工業大学

Hideki Takayasu Sony Computer Science lab. / Tokyo Institute of Technology. [email protected], https://www.sonycsl.co.jp/

Keywords:

physics, ﬁnancial market, manufacturing, hypothesis formulation. 「物理学と AI」

(2)

能との出合いを紹介し，そこから期待する今後の人工知能の発展を議論する．

2．金融市場の人工知能

立ち上がって間もない経済物理学の研究を進め，金融市場のデータ解析や数理モデルに取り組んでいた 1998 年，あるヘッジファンドから科学顧問になってくれないかと招待され，ドイツまでそのヘッジファンドの見学に行くことになった．三角形の 20 階建てくらいのビルは，真ん中が吹抜けになった特徴的な構造になっており，どの階からでも見える一番下の階の中央にコンピュータが設置されていた．元アポロ計画のコンピュータエンジニアだったというヘッジファンドの会長によれば，それはペンタゴンにある世界最高のスパコンと同等のスパコンだということだった．ロイター社などからリアルタイムで入ってくる為替市場のデータを即座に解析し，売り買いの信号を発信する人工知能であり，その指示に基づいて実際に顧客から預かった資金を運用していた．詳細な実績のレポートを聞いて，驚いた．過去十数年，ほぼ年率 8％の安定した運用実績を出しており，1 回 1 回の利益率の分布を見ても，負の値をとる確率はある程度はあるものの，分布の山が大きく正のほうにシフトしていた．金融工学が想定するように，価格の上がり下がりが過去によらずに確率 2 分の 1 ならば，このようなことは絶対に起こり得ない．自分達も金融市場の実データ解析を通して，単純なランダムとは違う変動の特性は見つけてはいたが，これほど明確に市場の予測が可能なのだということを実証したデータは見たことがなかった．「この結果を学術論文にすれば，科学の歴史に名を残すような研究として評価されますよ」と会長に進言したが，きっぱりと断られた．彼にとっては，科学で名を残すことには全く関心がなかったからだ．それもそのはず，ファンドが運用していた総額は数兆円にも上り，運用益の 3 分の 1を手数料として受け取っていたので，このスパコン 1 台で年間千億円単位のお金が彼の手元に入っていたのである．世界の主要都市の最高級のホテルのスイートルームを年間予約していつでも宿泊できるようにし，それぞれのホテルのレストランには彼専用のワインリストをつくらせている，そんな王様以上の生活をしていたのだから，論文を公開して科学の世界の名誉が仮に得られるとしても，他社が同様の方法を改良するヒントを発表するメリットはないのだ．当然，特許の出願もしていない．このヘッジファンドのデータ解析は，市場価格の変動の時系列から単純なランダムではない振舞いのうち，上昇や下降が連続しやすいトレンドを検出するという基本的な考え方に従っていた．理系の研究者を目指している大学院生レベルを数十人雇用して，競ってプログラムをつくらせ，直近の過去データで成績の良いアルゴリズムを選択して実装しているということだった．著者は，このヘッジファンドの人工知能を知ってから，最高のデータと最高のコンピュータ，それに物理学の知識と経験をつぎ込めば，常識を覆すような大きな研究成果を出すことができるはずだという確信をもち，経済物理学の研究を進めることができるようになった． 20年経った現在では，前述のヘッジファンドはすでに欧米の大手金融機関に買収され，金融市場の売買の判断を人工知能が行うことは当たり前になっている．市場のデータを分析し，チャンスが発生した瞬間にいち早く自動売買のオーダを発信するのは，人間よりも人工知能のほうが圧倒的に有利だからである．人工知能どうしがしのぎを削っている外国為替市場でのデータ解析とそれに付随する理論解析の結果が最近報告された [Kanazawa 18]．いわゆるリバースエンジニアリングで個々のディーラの戦略をある程度読み取ることができるのであるが，多くの人工知能ディーラの戦略は基本的にトレンドの発生を検出してそれを追いかけるタイプだった．おもしろいことに，トレンドを追いかけるディーラの集団行動が，物質の場合の質量による慣性と同じ効果を生み出しており，水分子の中を漂うコロイド粒子の運動方程式と同じ方程式が金融市場でも成立していることが明らかになった．ミクロな分子の世界と巨額のお金が流れる金融市場の世界で，同一の物理法則が成立しているのである．

3．半導体工場の人工知能

2005年から著者は，経済物理学のアカデミックな研究と並行して，半導体工場のデータ解析という著者にとって未知の分野の研究に着手した．半導体チップを製造する工場のデータは，著者にとっては全く新しい研究対象であり，成果を出せる自信はなかったが，最先端の半導体工場を知る絶好の機会と思い，参加することにした．当時，ソニーが新しいプレイステーションを発売するために CPU チップを大量に必要としており，IBM と東芝とともに工場を立ち上げている時期だった．半導体製造では先生役である IBM が指導する形でそれぞれの半導体工場が動き出したが，IBM には統計チームというグループがあり，現場のエンジニアがデータ解析で困ったときには助けてもらっていたという．ソニーにもそのようなお助けマンがほしい，という声が現場から上がり，経済物理の研究で経済データの独自の解析をしていた著者に声がかかったのである．毎週一度のペースでミーティングを行いデータ解析を始めたが，初めのうちは，著者からの質問は半導体製造の現場のエンジニアにとってはあまりにも初歩的だったようで，冷たい視線を感じていたが，しだいにエンジニアも即答できないような質問ができるようになり，問題の本質に迫ることができるようになっていった．半導体は，1 ロット 25 枚のウェーハを単位として，薬品を塗る・光を照射する・高温のプラズマの中に入れ

(3)

る・原子ビームを打ち込むなど数百の処理を経て，2 ∼ 3か月をかけて製造される．最終的にできたチップは一つ一つ検査を行い，所定の特性を満たさないものは，製品にはならずごみとなる．製品になったチップの比率が歩留まりであり，おおざっぱにいえば，歩留まりが 1％下がると，工場全体としては，月当たり 1 億円程度の損失となる．半導体工場のデータ解析は，歩留まりを高くすることが第一の目標となる．工場が動きだし，できたチップの特性を確認すると，特性値のバラツキが大きく，歩留まりはあまり良くなかった．IBM 流の半導体製造方法は標準的な統計学の考え方に基づいており，25 枚のウェーハの中の何枚かをサンプリングして，さらに，それらのウェーハ上の数百あるチップの中から何個かをサンプリングして，配線の幅や膜の厚さなどの工程ごとの処理の出来栄えを計測する．それらのサンプリングデータをいろいろな角度から解析したが，なかなか歩留まりが悪くなる原因に迫ることができなかった．そんな中，サンプリングではなく，全ウェーハ，全チップを検査しながら製造することはできないかという提案をしてみた．できるだけミクロな状態を正確に知りたいという物理学としては当然の発想である．検査のためのコストはかかるが，全部を観測できれば，ウェーハごとの違いが見えるし，ウェーハ内でのチップ特性の空間分布もわかるはずだと期待していた．そんなことはやったことがない，ということだったが，1 ロットだけならということで実現することができ，3 か月後に結果のデータが出てきた．そのデータを解析すると，ウェーハ番号ごとに特性値の分布の山がシフトしており，また，ウェーハ面内で中央付近と周辺部で特性値が系統的に変化しており，特徴的なパターンが見いだされた．サンプリングでは見えなかったこのような系統的な特徴のために，特性値のバラツキが想定以上に大きくなっており，歩留まりが悪くなっていたのだ．全頭検査からわかったことに基づいて装置の調整を進めていくと，しだいに歩留まりは良くなっていった．量産体制に入った頃には，歩留まりは，IBM や東芝よりも常に 10％近く高い状態を維持することができるようになっていた．業界の常識にとらわれずに詳細な観測をして，そのデータを丁寧に分析して経験則を導出することで実業での結果を出すことができたことになる．ここでの手順は，科学の方法そのものであることを注意したい．惑星運動に関し，コペルニクスが常識を疑い，ガリレオが詳細な観測をし，ケプラーがデータを解析し，ニュートンが本質を理解し，ハレーが応用した，という科学の手順をそのまま半導体工場に適用した形になっているのである． CPU製造で結果を出すことができた翌年から，熊本にできた新しいソニーのイメージセンサ半導体工場のデータ解析をすることになった．この工場は，データの観測と解析を強化した設計になっており，巨大なクリーンルームの中にある 1 000 台を超す製造装置から出てくるおよそ 100 万個の変数を常時モニタしながら全自動で半導体の製造を行うようになっていた．つまり，工場全体が一つの巨大なロボットであり，その中枢に，巨大なコンピュータシステム，人工知能が入っており，一つ一つのチップのμm単位の製造工程から工場全体まで管理しているわけである．SF の世界のような究極のものづくりを体現したこの工場でのデータ解析は，現在も継続中であるが，そこでの経験を通して，多くのことを学ぶことができた．昨今，ビッグデータというキーワードが流行っているが，この工場は，100 万個の変数を扱っているので，まさにビッグデータである．データは，詳細なほど，多いほどよいのだが，100 万個もあると，実は通常の統計解析が非常に使いにくくなる．例えば統計的に検定をするとき，有意水準 1％，などをよく使うが，変数が 100 万個あると，偶然の揺らぎでも，1 万個が 1％水準で有意になってしまう．つまり，変数が 100 万個あるなら，偶然の混入を防ぐためには，有意水準を 100 万分の 1 にする必要があるのだ．また，本当には因果関係のないような変数どうしに相関が見えてしまう擬似相関に対する処理も大変である．通常は，偏相関などで処理するが，そのためには 100 万× 100 万の偏相関行列を解かなければならないが，それは現在の最高のスパコンを使ってもできるかできないかのレベルの計算量になるので工場では使えない．というわけで，既製品の統計解析ツールは，実はビッグデータではあまり役に立たないので，かなり基本的な部分からデータ解析システムをつくっていく必要があったのだ．詳細はここでは触れられないが，必要に応じて新しいデータ解析システムをつくり，現場のエンジニアがうまく機能をすることを確認して，それを人工知能に組み込み，人工知能をより賢くしていく，というプロセスを繰り返し，工場全体が進化を続けているのが現状である．今では，ソニーはイメージセンサの製造では世界シェアのおよそ 50％を占めるようになり，他方，IBM は半導体の製造からは撤退している．著者の個人的な印象としては，物理法則に支配されているものづくりの世界では，遠回りかもしれないが地道な科学の方法を忠実に守ることこそが成功の秘訣である．

4．人工知能の弱点は物理が補う

人間の知的活動をはるかに超えた能力を発揮している人工知能であるが，その発展は，人間と比較すると極めていびつである．人工知能の中身はすべて数字での処理なので，数字で表現しやすい順番で人間の能力を超えてきているように思う．まずは，単純な計算，次に，数字の羅列である金融市場，そしてチェスや将棋・囲碁のよ

(4)

うなルールが数学的で明確なゲーム，最近になって，画像認識などがようやく実用のレベルになってきているが，文章を理解したり書いたりに関しては，まだまだ人間には及ばない．それは，画像や文章を数字で表現することが困難であることを意味している．著者は，最も人工知能が苦手としているのが物理学，特に，理論物理学ではないかと思っている．例えば，アインシュタインは，コロイド粒子が水の中でランダムに動き回る現象を，水がつぶつぶの分子から構成されていると仮定することで現象が矛盾なく説明できることを理論的に示した．そのような思考過程を，どうすれば人工知能にやらせることができるだろうか，と考えることがある．仮に，コロイド粒子の動きを映したビデオのデータを人工知能に与えたとき，その動きを数値的に解析し，ほど良く動きを近似するような適当なモデルを提案することくらいはつくり込んでおけばできるかもしれない．しかし，粒子がランダムに動くこと自体が不思議なことなのだ，ということを人工知能に教え込む方法は，皆目見当もつかない．まず，物理学の常識を教え込む必要があるのかもしれないが，それ自体非常に難しい． 例えば，古典力学の最も基本である，F＝ma，という 物体に働く力と質量と加速度の関係式があるが，これだけでもかなり難しい．物体の運動の観測データから直接 見えるのは，加速度 a だけで，この式は，直接観測でき ない力 F と質量 m を同時に定義している形式になって いる．力 F を観測しようとすると，別の現象，例えば， ばねを考えて，F ＝ kx，というばね定数とばねの変位に よって定義される F を計算すればよいが，このときのば ね定数 k は，同時にここで定義されている形式になって いる．物理学の論理は，このように定義が曖昧な概念を導入して，しかし，それが普遍的でいろいろな異なる現象で共通して使えると想定し，全体としてつじつまが合うように理論を構築するのである．エネルギー保存則のような物理学の根幹をなす概念も同様で，エネルギー保存則は初めから確認されていたわけではなく，保存するようにエネルギーの概念が拡張されていったと言っても よい．真空中の物体の運動なら mv2_/2_{は一定であるが，} 力が働く場に入ると速度 v が変化する，そこで，E＝ mv2_/2_＋_φ_{，が保存するようにポテンシャルエネルギー} φを想定しよう，というようにかなり強引に仮定を立てて，全体としての無矛盾性でその仮定の良し悪しを判断する．そこが，明瞭に定義を与えて，論理的に話を展開する数学，そしてコンピュータとの根本的な違いである．人間にとっては，常識と仮説と無矛盾性に基づく物理学の理論は何となく理解でき，理屈の通らないところは明確にわかる．そして，物理学は現実に物質の世界を最も正確に記述しているのであるから，結果は正しい，しかし，その論理展開をコンピュータのプログラムにすることは途方もなく難しいのである．人間がやれることはその仕組みがいずれ解明され，将来には，理論物理学を自在にこなす人工知能も誕生するかもしれない．しかし，それはかなり遠い未来になるのではないかと著者は思っている．もしかすると，数字から構成するような今のタイプの人工知能ではないような原理の全く異なる人工知能が必要かもしれないとすら考える．人工知能が物理を苦手とする状況が少なくとも今後しばらくは続くと想定すると，人工知能の苦手なことをサポートするために，物理学ができる人間は絶対必要である．当分の間，物質が絡む世界と人工知能を結び付ける部分は人間にしかできないことだからである．上記の半導体工場では，データだけでは話が閉じないような，物質が絡む新しいことが起こった場合，まず，人間が率先してメカニズムを解明し，それに関係する処理方法をアルゴリズム化して人工知能の機能に加えていく，というような体制をとっている．つまり，物理のわかる人間が常にそばにいて，人工知能を教育していくのである．賢くなった人工知能は，過去に事例のあるトラブルならば，見逃すことなく一瞬で答えを提示してくれるので，人間のやる仕事はかなり軽減される．例えば，従来なら，手作業で経験豊富なエンジニアが 1 週間ほどかけて解明していたトラブルの原因を，ほんの数分で人工知能が答えを出してくれるようなことが実現している．既知のことは自動的に解決してくれる代わりに，人間はさらに高度な初めてのタイプのトラブルを解いていけなければならないわけである．過去に例のないタイプの新しいトラブルを解明するには，やはり科学の基本に立ち戻る必要がある．いったん常識を捨て，観測事実を確認し，データを解析する，そして，矛盾ない説明を可能とする仮説を立て，その仮説を実証する方法を考える．仮説が実証されて初めて原因が解明されたことになる．この仮説を立てて実証するという部分は，今の人工知能には何もできないところであり，そここそ物理がわかる人間が活躍すべきところである．

◇　参　考　文　献　◇

[合原 09] 合原一幸：カオス─カオス理論の基礎と応用，サイエンス社（1990）

[Kanazawa 18] Kanazawa, K. Sueshige, T. Takayasu, H. and Takayasu, M.: Derivation of the Boltzmann equation for ﬁnancial brownian motion: Direct observation of the collective motion of high-frequency traders, Phys. Rev. Lett., Vol. 120, pp. 138301-138306（6pages）（2018）

[マンデルブロ 11] マンデルブロ，B. 著，広中平祐監訳：フラクタル幾何学，ちくま学芸文庫（2011）

[Mantegna 95] Mantegna, R. N. and Stanley, H. E.: Scaling behaviour in the dynamics of an economic index, Nature, Vol. 376, pp. 46-49（1995）

[20世紀フォックス ] http://www.foxmovies-jp.com/dreammovie/ [Takayasu 92] Takayasu, H., Miura, H., Hirabayashi, T. and

Hamada, K.: Statistical properties of deterministic threshold elements-the case of market price, Physica, A., Vol. 184, pp. 127-134（1992）

[Takayasu 97] Takayasu, H., Sato, A.-h. and Takayasu, M.: Stable infinite variance fluctuations in randomly amplified langevin

(5)

systems, Phys. Rev. Lett., Vol. 79, pp. 966-969（1997） [高安 13] 高安秀樹：経済物理学の発見，光文社新書（2013） [戸田 00] 戸田盛和：非線形波動とソリトン，日本評論社（2000） 2018年 5 月 23 日受理

著　者　紹　介

高安　秀樹名古屋大学大学院理学研究科物理学専攻，修了．理学博士．京都大学，神戸大学，東北大学を経て， 1997年よりソニーコンピュータサイエンス研究所，シニアリサーチャー．2015 年より東京工業大学特任教授兼務．統計物理学，経済物理学，ビッグデータ解析などの研究に従事．

人工知能の弱点を補う物理学

1．は じ め に