• 検索結果がありません。

人工知能の弱点を補う物理学

N/A
N/A
Protected

Academic year: 2021

シェア "人工知能の弱点を補う物理学"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

1.は じ め に

子供の頃の曖昧な話で恐縮だが,1960 年代に,暗算の 達人とコンピュータが計算速度の競争するというテレビ の番組を見たことがある.10 桁くらいの数字を数十個足 し合わせるような問題だったが,けっこう良い勝負だっ たように記憶している.当時は,正確な計算ができるこ とが職業としても成り立っており,例えば,アポロ計画 を舞台にした映画「ドリーム」では,ロケットの軌道計 算を行う計算要員として働いていた黒人女性達の人生の 転換がわかりやすく描かれている [20 世紀フォックス]. それが今では,コンピュータと計算の速さを競おうなど という発想をする人は皆無であるどころか,とうとう最 も頭を使う難しいゲームと思われていた囲碁において, 人工知能が人間の名人を赤子の手をひねるがごとく負か してしまうまでになった.コンピュータが苦手としてい た画像認識なども最近急速に進歩し,長年の夢だった人 工知能による自動運転も実用化が見えてきている. この 50 年の間のコンピュータの進化は驚異的である. その間,物理学もコンピュータのおかげで,随分と変わっ てきた.従来,物理学は実験物理と理論物理の二つが研 究の柱だったが,1970 年代から 80 年代にかけて,計算 物理という第三の柱ができた.計算物理は,非線形で多 変数の時間発展方程式を与えて,計算機でそれを解くこ とをあたかも実験による観測の結果のように扱う研究方 法である.手で解ける線形の世界とは全く異なる非線形 の世界が,コンピュータによって観察され,それに伴っ て物理学の理論が発展し,実験による現実世界の中での 検証も進んだ.粒子のような特性をもつ波であるソリト ン [戸田 00] の研究が 1960 年代に進み,わずかな初期値 の違いが質的な違いに至る詳細な過程を研究したカオス [合原 09] の研究が 1970 年代に,簡単な非線形効果が無 限の複雑さを生み出すフラクタル [マンデルブロ 11] の 研究がその後大きく展開した.非整数の値をとる次元と いう概念は,数学的には新しくはなかったが物理として は極めて斬新だったので,広い分野の物理学者の関心を 集め,1980 年代の中頃には,素粒子から宇宙まであら ゆるスケールの物理現象においてフラクタル探しの研究 が進められ,さまざまな物理学の学術誌にフラクタルの 研究論文が掲載されるようになった. 1990年代に入ると,フラクタルの発想の原点が,金 融市場の価格変動にあったということから,物理学者の 目が経済現象に向くことになった [高安 13].現実の金 融市場のデータからフラクタル性を確認するような論文 [Mantegna 95],そのようなフラクタル性が生じる原因 を仮想的な金融市場のシミュレーションによって解明す る論文 [Takayasu 92] が発表され,経済物理学という新 しい研究分野が誕生した.1997 年には,物理学の分野 の中では最も権威のあるフィジカルレビューレター誌に 経済物理の研究論文が掲載された [Takayasu 97].経済 現象も物理学の研究対象となるということで,物理学者 による研究は金融市場だけでなく,企業の財務データな どにも広がっていった. 詳細で膨大な経済データを解析する研究が進んだこ とで,人間の行動に伴うデータであっても,質と量が優 れたデータがあれば,物質の現象と遜色のないような普 遍性が見いだせるということがわかってきて,2000 年 代になると,研究対象がさらに広がり,空港どうしを結 ぶフライトのネットワークや友達関係のネットワークと いったことまでが物理学者の研究対象となっていった. このような社会の中のビッグデータに関する物理学的な 研究の特徴は,常識にとらわれないで与えられたデータ を分析し,そこから経験的に法則性を見いだし,その経 験則を説明するような数理モデルを構築し,応用に発展 させるという形で研究を進めることにある.これは,コ ペルニクス,ガリレオ,ケプラー,ニュートン,そして, ハレーへと発展していった惑星運動に関する研究の手法 そのものであり,物理学の原点回帰である.それを可能 にしたのが,膨大なデータの解析と数理モデルによるシ ミュレーションを可能にしたコンピュータである. 以下の章では,個人的な見解となるが,著者と人工知

人工知能の弱点を補う物理学

Physics Can Redeem the Weak Points of AI

高安 秀樹

ソニーコンピュータサイエンス研究所,東京工業大学

Hideki Takayasu Sony Computer Science lab. / Tokyo Institute of Technology. [email protected], https://www.sonycsl.co.jp/

Keywords:

physics, financial market, manufacturing, hypothesis formulation. 「物理学と AI」

(2)

能との出合いを紹介し,そこから期待する今後の人工知 能の発展を議論する.

2.金融市場の人工知能

立ち上がって間もない経済物理学の研究を進め,金融 市場のデータ解析や数理モデルに取り組んでいた 1998 年,あるヘッジファンドから科学顧問になってくれない かと招待され,ドイツまでそのヘッジファンドの見学に 行くことになった.三角形の 20 階建てくらいのビルは, 真ん中が吹抜けになった特徴的な構造になっており,ど の階からでも見える一番下の階の中央にコンピュータが 設置されていた.元アポロ計画のコンピュータエンジニ アだったというヘッジファンドの会長によれば,それは ペンタゴンにある世界最高のスパコンと同等のスパコン だということだった.ロイター社などからリアルタイム で入ってくる為替市場のデータを即座に解析し,売り買 いの信号を発信する人工知能であり,その指示に基づい て実際に顧客から預かった資金を運用していた. 詳細な実績のレポートを聞いて,驚いた.過去十数年, ほぼ年率 8%の安定した運用実績を出しており,1 回 1 回 の利益率の分布を見ても,負の値をとる確率はある程度 はあるものの,分布の山が大きく正のほうにシフトして いた.金融工学が想定するように,価格の上がり下がり が過去によらずに確率 2 分の 1 ならば,このようなこと は絶対に起こり得ない.自分達も金融市場の実データ解 析を通して,単純なランダムとは違う変動の特性は見つ けてはいたが,これほど明確に市場の予測が可能なのだ ということを実証したデータは見たことがなかった.「こ の結果を学術論文にすれば,科学の歴史に名を残すよう な研究として評価されますよ」と会長に進言したが,きっ ぱりと断られた.彼にとっては,科学で名を残すことには 全く関心がなかったからだ.それもそのはず,ファンド が運用していた総額は数兆円にも上り,運用益の 3 分の 1を手数料として受け取っていたので,このスパコン 1 台 で年間千億円単位のお金が彼の手元に入っていたのであ る.世界の主要都市の最高級のホテルのスイートルーム を年間予約していつでも宿泊できるようにし,それぞれ のホテルのレストランには彼専用のワインリストをつく らせている,そんな王様以上の生活をしていたのだから, 論文を公開して科学の世界の名誉が仮に得られるとして も,他社が同様の方法を改良するヒントを発表するメ リットはないのだ.当然,特許の出願もしていない. このヘッジファンドのデータ解析は,市場価格の変動 の時系列から単純なランダムではない振舞いのうち,上 昇や下降が連続しやすいトレンドを検出するという基本 的な考え方に従っていた.理系の研究者を目指している 大学院生レベルを数十人雇用して,競ってプログラムを つくらせ,直近の過去データで成績の良いアルゴリズム を選択して実装しているということだった. 著者は,このヘッジファンドの人工知能を知ってから, 最高のデータと最高のコンピュータ,それに物理学の知 識と経験をつぎ込めば,常識を覆すような大きな研究成 果を出すことができるはずだという確信をもち,経済物 理学の研究を進めることができるようになった. 20年経った現在では,前述のヘッジファンドはすでに 欧米の大手金融機関に買収され,金融市場の売買の判断 を人工知能が行うことは当たり前になっている.市場の データを分析し,チャンスが発生した瞬間にいち早く自 動売買のオーダを発信するのは,人間よりも人工知能の ほうが圧倒的に有利だからである.人工知能どうしがし のぎを削っている外国為替市場でのデータ解析とそれに 付随する理論解析の結果が最近報告された [Kanazawa 18].いわゆるリバースエンジニアリングで個々のディー ラの戦略をある程度読み取ることができるのであるが, 多くの人工知能ディーラの戦略は基本的にトレンドの発 生を検出してそれを追いかけるタイプだった.おもしろ いことに,トレンドを追いかけるディーラの集団行動が, 物質の場合の質量による慣性と同じ効果を生み出してお り,水分子の中を漂うコロイド粒子の運動方程式と同じ 方程式が金融市場でも成立していることが明らかになっ た.ミクロな分子の世界と巨額のお金が流れる金融市場 の世界で,同一の物理法則が成立しているのである.

3.半導体工場の人工知能

2005年から著者は,経済物理学のアカデミックな研 究と並行して,半導体工場のデータ解析という著者に とって未知の分野の研究に着手した.半導体チップを製 造する工場のデータは,著者にとっては全く新しい研究 対象であり,成果を出せる自信はなかったが,最先端の 半導体工場を知る絶好の機会と思い,参加することにし た.当時,ソニーが新しいプレイステーションを発売す るために CPU チップを大量に必要としており,IBM と 東芝とともに工場を立ち上げている時期だった.半導体 製造では先生役である IBM が指導する形でそれぞれの 半導体工場が動き出したが,IBM には統計チームという グループがあり,現場のエンジニアがデータ解析で困っ たときには助けてもらっていたという.ソニーにもその ようなお助けマンがほしい,という声が現場から上がり, 経済物理の研究で経済データの独自の解析をしていた著 者に声がかかったのである. 毎週一度のペースでミーティングを行いデータ解析を 始めたが,初めのうちは,著者からの質問は半導体製造 の現場のエンジニアにとってはあまりにも初歩的だった ようで,冷たい視線を感じていたが,しだいにエンジニ アも即答できないような質問ができるようになり,問題 の本質に迫ることができるようになっていった. 半導体は,1 ロット 25 枚のウェーハを単位として, 薬品を塗る・光を照射する・高温のプラズマの中に入れ

(3)

る・原子ビームを打ち込むなど数百の処理を経て,2 ∼ 3か月をかけて製造される.最終的にできたチップは一 つ一つ検査を行い,所定の特性を満たさないものは,製 品にはならずごみとなる.製品になったチップの比率が 歩留まりであり,おおざっぱにいえば,歩留まりが 1% 下がると,工場全体としては,月当たり 1 億円程度の損 失となる.半導体工場のデータ解析は,歩留まりを高く することが第一の目標となる. 工場が動きだし,できたチップの特性を確認すると, 特性値のバラツキが大きく,歩留まりはあまり良くな かった.IBM 流の半導体製造方法は標準的な統計学の 考え方に基づいており,25 枚のウェーハの中の何枚か をサンプリングして,さらに,それらのウェーハ上の数 百あるチップの中から何個かをサンプリングして,配線 の幅や膜の厚さなどの工程ごとの処理の出来栄えを計測 する.それらのサンプリングデータをいろいろな角度か ら解析したが,なかなか歩留まりが悪くなる原因に迫る ことができなかった. そんな中,サンプリングではなく,全ウェーハ,全チッ プを検査しながら製造することはできないかという提案 をしてみた.できるだけミクロな状態を正確に知りたい という物理学としては当然の発想である.検査のための コストはかかるが,全部を観測できれば,ウェーハごと の違いが見えるし,ウェーハ内でのチップ特性の空間分 布もわかるはずだと期待していた.そんなことはやった ことがない,ということだったが,1 ロットだけならと いうことで実現することができ,3 か月後に結果のデー タが出てきた.そのデータを解析すると,ウェーハ番号 ごとに特性値の分布の山がシフトしており,また,ウェー ハ面内で中央付近と周辺部で特性値が系統的に変化して おり,特徴的なパターンが見いだされた.サンプリング では見えなかったこのような系統的な特徴のために,特 性値のバラツキが想定以上に大きくなっており,歩留ま りが悪くなっていたのだ. 全頭検査からわかったことに基づいて装置の調整を進 めていくと,しだいに歩留まりは良くなっていった.量 産体制に入った頃には,歩留まりは,IBM や東芝より も常に 10%近く高い状態を維持することができるよう になっていた.業界の常識にとらわれずに詳細な観測を して,そのデータを丁寧に分析して経験則を導出するこ とで実業での結果を出すことができたことになる. ここでの手順は,科学の方法そのものであることを注 意したい.惑星運動に関し,コペルニクスが常識を疑い, ガリレオが詳細な観測をし,ケプラーがデータを解析し, ニュートンが本質を理解し,ハレーが応用した,という 科学の手順をそのまま半導体工場に適用した形になって いるのである. CPU製造で結果を出すことができた翌年から,熊本 にできた新しいソニーのイメージセンサ半導体工場の データ解析をすることになった.この工場は,データの 観測と解析を強化した設計になっており,巨大なクリー ンルームの中にある 1 000 台を超す製造装置から出てく るおよそ 100 万個の変数を常時モニタしながら全自動で 半導体の製造を行うようになっていた.つまり,工場全 体が一つの巨大なロボットであり,その中枢に,巨大な コンピュータシステム,人工知能が入っており,一つ一 つのチップのμm単位の製造工程から工場全体まで管理 しているわけである.SF の世界のような究極のものづ くりを体現したこの工場でのデータ解析は,現在も継続 中であるが,そこでの経験を通して,多くのことを学ぶ ことができた. 昨今,ビッグデータというキーワードが流行っている が,この工場は,100 万個の変数を扱っているので,ま さにビッグデータである.データは,詳細なほど,多い ほどよいのだが,100 万個もあると,実は通常の統計解 析が非常に使いにくくなる.例えば統計的に検定をする とき,有意水準 1%,などをよく使うが,変数が 100 万 個あると,偶然の揺らぎでも,1 万個が 1%水準で有意 になってしまう.つまり,変数が 100 万個あるなら,偶 然の混入を防ぐためには,有意水準を 100 万分の 1 にす る必要があるのだ.また,本当には因果関係のないよう な変数どうしに相関が見えてしまう擬似相関に対する処 理も大変である.通常は,偏相関などで処理するが,そ のためには 100 万× 100 万の偏相関行列を解かなけれ ばならないが,それは現在の最高のスパコンを使っても できるかできないかのレベルの計算量になるので工場で は使えない.というわけで,既製品の統計解析ツールは, 実はビッグデータではあまり役に立たないので,かなり 基本的な部分からデータ解析システムをつくっていく必 要があったのだ.詳細はここでは触れられないが,必要 に応じて新しいデータ解析システムをつくり,現場のエ ンジニアがうまく機能をすることを確認して,それを人 工知能に組み込み,人工知能をより賢くしていく,とい うプロセスを繰り返し,工場全体が進化を続けているの が現状である. 今では,ソニーはイメージセンサの製造では世界シェ アのおよそ 50%を占めるようになり,他方,IBM は半 導体の製造からは撤退している.著者の個人的な印象と しては,物理法則に支配されているものづくりの世界で は,遠回りかもしれないが地道な科学の方法を忠実に守 ることこそが成功の秘訣である.

4.人工知能の弱点は物理が補う

人間の知的活動をはるかに超えた能力を発揮している 人工知能であるが,その発展は,人間と比較すると極め ていびつである.人工知能の中身はすべて数字での処理 なので,数字で表現しやすい順番で人間の能力を超えて きているように思う.まずは,単純な計算,次に,数字 の羅列である金融市場,そしてチェスや将棋・囲碁のよ

(4)

うなルールが数学的で明確なゲーム,最近になって,画 像認識などがようやく実用のレベルになってきている が,文章を理解したり書いたりに関しては,まだまだ人 間には及ばない.それは,画像や文章を数字で表現する ことが困難であることを意味している. 著者は,最も人工知能が苦手としているのが物理学, 特に,理論物理学ではないかと思っている.例えば,ア インシュタインは,コロイド粒子が水の中でランダムに 動き回る現象を,水がつぶつぶの分子から構成されてい ると仮定することで現象が矛盾なく説明できることを理 論的に示した.そのような思考過程を,どうすれば人工 知能にやらせることができるだろうか,と考えることが ある.仮に,コロイド粒子の動きを映したビデオのデー タを人工知能に与えたとき,その動きを数値的に解析し, ほど良く動きを近似するような適当なモデルを提案する ことくらいはつくり込んでおけばできるかもしれない. しかし,粒子がランダムに動くこと自体が不思議なこと なのだ,ということを人工知能に教え込む方法は,皆目 見当もつかない.まず,物理学の常識を教え込む必要が あるのかもしれないが,それ自体非常に難しい. 例えば,古典力学の最も基本である,F=ma,という 物体に働く力と質量と加速度の関係式があるが,これだ けでもかなり難しい.物体の運動の観測データから直接 見えるのは,加速度 a だけで,この式は,直接観測でき ない力 F と質量 m を同時に定義している形式になって いる.力 F を観測しようとすると,別の現象,例えば, ばねを考えて,F = kx,というばね定数とばねの変位に よって定義される F を計算すればよいが,このときのば ね定数 k は,同時にここで定義されている形式になって いる.物理学の論理は,このように定義が曖昧な概念を 導入して,しかし,それが普遍的でいろいろな異なる現 象で共通して使えると想定し,全体としてつじつまが合 うように理論を構築するのである.エネルギー保存則の ような物理学の根幹をなす概念も同様で,エネルギー保 存則は初めから確認されていたわけではなく,保存する ようにエネルギーの概念が拡張されていったと言っても よい.真空中の物体の運動なら mv2/2は一定であるが, 力が働く場に入ると速度 v が変化する,そこで,E= mv2/2φ,が保存するようにポテンシャルエネルギー φを想定しよう,というようにかなり強引に仮定を立て て,全体としての無矛盾性でその仮定の良し悪しを判断 する.そこが,明瞭に定義を与えて,論理的に話を展開 する数学,そしてコンピュータとの根本的な違いである. 人間にとっては,常識と仮説と無矛盾性に基づく物理 学の理論は何となく理解でき,理屈の通らないところは 明確にわかる.そして,物理学は現実に物質の世界を最 も正確に記述しているのであるから,結果は正しい,し かし,その論理展開をコンピュータのプログラムにする ことは途方もなく難しいのである.人間がやれることは その仕組みがいずれ解明され,将来には,理論物理学を 自在にこなす人工知能も誕生するかもしれない.しかし, それはかなり遠い未来になるのではないかと著者は思っ ている.もしかすると,数字から構成するような今のタ イプの人工知能ではないような原理の全く異なる人工知 能が必要かもしれないとすら考える. 人工知能が物理を苦手とする状況が少なくとも今後し ばらくは続くと想定すると,人工知能の苦手なことをサ ポートするために,物理学ができる人間は絶対必要であ る.当分の間,物質が絡む世界と人工知能を結び付ける 部分は人間にしかできないことだからである.上記の半 導体工場では,データだけでは話が閉じないような,物 質が絡む新しいことが起こった場合,まず,人間が率先 してメカニズムを解明し,それに関係する処理方法をア ルゴリズム化して人工知能の機能に加えていく,という ような体制をとっている.つまり,物理のわかる人間が 常にそばにいて,人工知能を教育していくのである.賢 くなった人工知能は,過去に事例のあるトラブルならば, 見逃すことなく一瞬で答えを提示してくれるので,人間 のやる仕事はかなり軽減される.例えば,従来なら,手 作業で経験豊富なエンジニアが 1 週間ほどかけて解明し ていたトラブルの原因を,ほんの数分で人工知能が答え を出してくれるようなことが実現している.既知のこと は自動的に解決してくれる代わりに,人間はさらに高度 な初めてのタイプのトラブルを解いていけなければなら ないわけである. 過去に例のないタイプの新しいトラブルを解明するに は,やはり科学の基本に立ち戻る必要がある.いったん常 識を捨て,観測事実を確認し,データを解析する,そし て,矛盾ない説明を可能とする仮説を立て,その仮説を 実証する方法を考える.仮説が実証されて初めて原因が 解明されたことになる.この仮説を立てて実証するとい う部分は,今の人工知能には何もできないところであり, そここそ物理がわかる人間が活躍すべきところである.

◇ 参 考 文 献 ◇

[合原 09] 合原一幸:カオス─カオス理論の基礎と応用,サイエン ス社(1990)

[Kanazawa 18] Kanazawa, K. Sueshige, T. Takayasu, H. and Takayasu, M.: Derivation of the Boltzmann equation for financial brownian motion: Direct observation of the collective motion of high-frequency traders, Phys. Rev. Lett., Vol. 120, pp. 138301-138306(6pages)(2018)

[マンデルブロ 11] マンデルブロ,B. 著,広中平祐 監訳:フラクタ ル幾何学,ちくま学芸文庫(2011)

[Mantegna 95] Mantegna, R. N. and Stanley, H. E.: Scaling behaviour in the dynamics of an economic index, Nature, Vol. 376, pp. 46-49(1995)

[20世紀フォックス ] http://www.foxmovies-jp.com/dreammovie/ [Takayasu 92] Takayasu, H., Miura, H., Hirabayashi, T. and

Hamada, K.: Statistical properties of deterministic threshold elements-the case of market price, Physica, A., Vol. 184, pp. 127-134(1992)

[Takayasu 97] Takayasu, H., Sato, A.-h. and Takayasu, M.: Stable infinite variance fluctuations in randomly amplified langevin

(5)

systems, Phys. Rev. Lett., Vol. 79, pp. 966-969(1997) [高安 13] 高安秀樹:経済物理学の発見,光文社新書(2013) [戸田 00] 戸田盛和:非線形波動とソリトン,日本評論社(2000) 2018年 5 月 23 日 受理

著 者 紹 介

高安 秀樹 名古屋大学大学院理学研究科物理学専攻,修了.理 学博士.京都大学,神戸大学,東北大学を経て, 1997年よりソニーコンピュータサイエンス研究所, シニアリサーチャー.2015 年より東京工業大学特任 教授兼務.統計物理学,経済物理学,ビッグデータ 解析などの研究に従事.

参照

関連したドキュメント

それでは,従来一般的であった見方はどのように正されるべきか。焦点を

日頃から製造室内で行っていることを一般衛生管理計画 ①~⑩と重点 管理計画

子どもたちは、全5回のプログラムで学習したこと を思い出しながら、 「昔の人は霧ヶ峰に何をしにきてい

 このようなパヤタスゴミ処分場の歴史について説明を受けた後,パヤタスに 住む人の家庭を訪問した。そこでは 3 畳あるかないかほどの部屋に

印刷物をみた。右側を開けるのか,左側を開け

海なし県なので海の仕事についてよく知らなかったけど、この体験を通して海で楽しむ人のかげで、海を

は︑公認会計士︵監査法人を含む︶または税理士︵税理士法人を含む︶でなければならないと同法に規定されている︒.

 今日のセミナーは、人生の最終ステージまで芸術の力 でイキイキと生き抜くことができる社会をどのようにつ