1.は じ め に
研究の個人史のようなものを書いてくださいと依頼さ れ,以前に考えたこと,やってきたことを書き連ねるこ とにした.まとまりのないランダムな回想録になってし まい,読んでいただくのが気恥ずかしいものとなった. 時間に追われての原稿になり,系統的に調べることが できなかったので,記憶違いや誤解も多々あると思う. きわめて主観的な回想録と考えていただいて,誤りを許 していただけるとありがたい.また,研究上,影響を受 けた先生,先輩,同僚などについても書いてくださいと いうことで,そのような方々のお名前をあげさせていた だいた.敬称をどうするか迷ったが,指導教官の先生方 などを除いては敬称を略すこととした.記述は,私の研 究個人史になっているので,読む際の参考に私の略歴を 図 1 に示す.2.京都大学の卒業研究(1970 ~ 71 年)
京都大学に入学した直後から,いわゆる全共闘による 大学紛争が激化して,学部卒業まで,まともな試験はな かった.試験期間が近づくと,いろいろな理由を付けて ストライキを行い,試験もレポートに切り替えられた. 学部の 3 年生になっても,授業がまともに行われるのは まれだった.私はあまり政治的なほうではなかったが, 一般学生として,それなりの政治参加はしていた.デモ に参加するというので,東京大学の駒場寮に泊まったこ ともあった. 京都大学の電気系には非線形振動論の研究グループが あり,複雑系理論の Strange Attractor で有名な上田睆よし 亮 すけ 先生がおられた.授業がないので,数学好きの学生が 集まって,先生にお願いして,ポントリヤーギンの非線 形微分方程式の本を使って勉強会をしたりしていた.卒 業研究は,その関係で上田先生に指導を仰いだ.先生は, 研究のことを楽しそうに話される方で,研究者という職 業に憧れるきっかけになった. 非線形微分方程式は,解析的には解けないのでアナロ グ計算機を使って解の挙動を調べる.アナログ計算機の 計算精度は悪く,研究室の先輩の何人かは,ディジタル 計算機を使っての数値計算で細かく解の挙動を調べてい た.アナログ計算機での非線形振動の模擬実験は,解へ の収束を見守るという,時間はかかるが見ているだけと いう,暇をもて余すものであった.たばこを始めたのは, この退屈な待ち時間のゆえだった. アナログからディジタルへの切換えは,急速に進んで いた.その先端をきっていたのが,坂井利之先生の研究 室で,大学院からはその坂井研究室に移籍した.3.京都大学坂井研究室(1971 ~ 73 年)
1970年代は,情報科学,計算機工学の黎明期で,多 くの俊英が数少ない研究室におしかけていた時代であっ た.「人は情報を呼吸する」といったコピーがあり,私 「つながりが創発するイノベーション」〔第 8 回〕研 究 の 個 人 史
─言語処理,言語理解,人工知能─
A Note on My Own History of Research
─ Natural Language Processing, Natural Language Understanding and AI ─
辻井 潤一
産業技術総合研究所人工知能研究センターJun’ichi Tsujii Artificial Intelligence Research Center, National Institute of Advanced Industrial Science and Technology.
Keywords:
natural language processing, natural language understanding, machine translation, question answering, bio-NLP.1971.4 京都大学大学院修士課程入学(研究室:坂井利之教授) 1973.4 京都大学工学部助手(研究室:長尾 教授) 1979.6 京都大学大学院工学研究科助教授(研究室:長尾 教授)
1981.6 -- 1982.4 CNRS(Center National de la Recherche Scientifiquie、グルノーブル、フランス) 招聘上級研究員
1988.11 マンチェスター大学教授 (University of Manchester Institute for Science and Technology) 1992.3 ‒ 1995.6 マンチェスター大学計算言語学センター(CCL)、 センター長 1995.6 東京大学大学院理学系研究科教授 2005.7 マンチェスター大学教授(兼務) 英国国立テキストマイニングセンター(NaCTeM)、センター長(兼務) 2008.3 英国国立テキストマイニングセンター(NaCTeM)、研究担当ディレクター(兼務) 2011.4 マイクロソフト研究所(北京) 首席研究員 2015.5 産総研人工知能研究センター センター長 2016.4 マンチェスター大学 教授(兼務) 京大 15年 マ大 7年 東大16年 マ大 6年 京都大学 15年 マンチェスター大学 13年 東京大学 16年 マイクロソフト研究所 4年 人工知能研究センター 1 年 MSR 4年 AIRC 1年 図 1 略 歴
もその流れに引き寄せられて,坂井研究室で修士をする ことにした.情報処理,人工知能を取り巻く雰囲気は, 今の人工知能ブームと似たところがある. その後長く指導していただくことになる長尾 先生 は,ちょうど 2 年間のフランス留学から帰国されたとこ ろであった.後に CMU(カーネギーメロン大学)に転 出される金出武雄,京都大学で計算機アーキテクチャの 教授となる富田真司が 3 年先輩,同期には,東芝で日本 語ワープロを開発する天野真家などがいた(図 2).人 工知能学会の会長などを歴任された堂下修司先生や,機 械翻訳の専門家の杉田繁治先生も,この研究室の所属で あった. 長尾教授や金出さんが,画像処理研究を進めておら れて,優れた成果をあげておられた.この二人が,画像 処理の理論研究の徹底的なサーベイを行っておられた頃 で,机にうず高く積まれた論文の束には,圧倒された. 研究室は,廊下がギシギシと音を立てる古い木造の 2 階 にあり,京都の暑い夏には地獄であったが,金出さん, 富田さん,天野君達と過ごす時間は楽しいものであった. パターン認識の日米セミナーが京都で開催されたの も,その頃であったと思う.このセミナーでは,長尾教 授や金出さんが顔写真の認識について発表された.身び いきではなく,出色の発表であった.米国からの出席 者が強い印象を受けている様子が,セミナーの世話役の 我々にも感じ取れた.その後,金出さんは CMU に招へ いされるが,CMU の R. Reddy 教授がこのセミナーで の金出さんの発表に強い感銘を受けたのが,契機となっ たという. 金出さんは,このときのことを「顔のイメージデータ から,口,目,鼻といった部分を認識するという具体的 な課題に取り組むことで,パターン認識の理論研究だけ では得られない研究上の刺激とアイディアを得た」と話 されることが多い.理論一辺倒ではなく,具体的な問題 から研究を組み立てるという立場は,坂井,長尾,金出 に共通するもので,今も大きな影響を受けていると思う. 現在,人工知能研究センターでは,「実世界に埋め込ま れる人工知能」を標榜している.人工知能研究のための 研究ではなく,現実の社会的,科学的な問題を解く人工 知能を研究しようという表明である.
4.長尾研究室と対話研究会 (1973 ~ 88 年)
修士を終える頃,長尾教授が研究室を立ち上げると いうことで,私はその研究室助手に採用された.金出さ んをはじめとする強い画像処理の研究グループがすでに あったので,私は言語処理に専念することになった.長 尾教授からは,「言語の研究,特に意味の研究は困難で 息の長い研究になる.日の目を見るまでには時間がかか るだろうが,人間の情報処理の根幹の部分に言語的なも のが関与している.長い困難な研究となるだろうから, 焦らずに腰を落ち着けて取り組みなさい」と言われた. 知能の根幹に言語的なものがあり,言語処理研究は,人 工知能研究の本質的な部分となるという認識は,その後 の私の研究を支えるものとなった. 当時の京都大学は,奇妙な大学であった.長く続い た学園紛争の影響もあった.自由で反逆的な空気があ り,学問の細分化への抵抗と学際的な分野に強い憧れ があった.新しい学問の形をつくるという気分が,院生 や若い研究者に広がっていた.特に N.Chomsky の理論 言語学は,それまでの堅実な言語研究のアンチテーゼと して,言語学科の若い研究者をひき付けていた.また, Chomskyの認知主義や計算主義に並行して,心理学科 では,心の表象や計算を積極的に取り上げようとする認 知心理学,認知科学への興味が,若い研究者を中心にし て,湧き上がっていた. このような科学パラダイムの変革を強く自覚していた わけではないが,人工知能を標榜する長尾教授の周りに は,文学部,教育学部などの,伝統的な学問の枠組みに 飽き足らない院生,研究者が集まることになった.心理 学の梅本 堯教授が,若い研究者の認知科学への傾斜を積 極的に奨励,見守る立場をとられたことも,この集まり を助けた. 集まりが,京都大学対話研究会として活動し始め,関 西周辺の研究者が集まり出したのは,私が助手になった 1973年からしばらくしてからで,10 年近くは続いたか と思う.この研究会には,長尾先生を中心に山梨正明(認 知言語学,京都大学),田窪行則(言語学,京都大学), 坂原 茂(フランス語学,東京大学),西田豊明(人工知 能,京都大学),金水 敏(国語学,大阪大学),吉川左紀 子(心理学,京都大学),川口 潤(心理学,名古屋大学),乾 敏郎(神経回路網,京都大学)ら,その後,さまざまな 分野で活躍することになる研究者や院生が集まった.残 念ながら,当時の状況を反映してか,脳科学からの研究 者はいなかった. 月 1 ∼ 2 回集まって,一人か二人の話題提供の後,好 き勝手な議論をし,夕食とともに酒を飲み交わす会で あった.アメリカや東京の有名な研究者を俎上にあげて 批判するなど,言いたい放題の会であったが,この会を 通して理論言語学や認知心理学を随分と勉強することと なった.私なりの言語観,知能観が形成された時期であっ た.しかし,具体的な研究計画に移行できるものは少な く,しだいに思弁的な議論の空回りとなっていった.計 算機科学,言語学,心理学,哲学という個々の分野がも 図 2 左から長尾教授,金出さん,富田さん,天野君つ価値観の差も大きく,研究者はしだいに自分達の個別 分野へと回帰していった.
5.英語のトラウマ,オタワでの Coling
英語で研究発表した最初の国際会議は,76 年オタワ での国際計算言語学会(Coling)であった.電子メール や Web のない時代で,会議プログラムもない状態で日 本を出発した.発表に割り当てられる時間もわからない ので,とりあえず,たくさんのスライドを用意した. 国内では,発表の準備などせず,聴衆の反応を見て発 表内容を変えるほうがうまく発表できた.英語での発表 も同じで,スライドさえあれば何とでも調整できると, 自分の能力を過信していた. 航空管制官のストで飛行機が飛ばず,トロントからの レンタカー相乗りでオタワに着くと,会議プログラムで は,翌日に 1 時間の枠が割り当てられていた.それでも, どうしてそんなに自信があったのか不思議であるが,日 本からの参加者と一緒に食事に出かけて,酒も飲み,発 表練習もせずに寝てしまった. 1時間という長い発表,それも初めての英語での発表 を練習もせずにできるはずがない.実際,3 分ほど話し たところでうまく話せないことに気が付くと,喉はカラ カラになるし,聴衆は目に入らず,何もわからない状態 で発表を終わった.がっくりして,完全な自信喪失の状 態となった.この経験は,その後,英語発表のトラウマ として長く残った.その後,英語での発表のたびに異常 に緊張し,このままでは世界に通じないと思うように なった.これが後年,英国に行く動機となった.6.フランス,グルノーブル大学(1981 ~ 82 年)
76年の Coling は散々であったが,80 年の Coling(東 京)では,周到な準備で,発表やパネルをこなすことが できた.そのときに長尾先生から紹介されたグルノー ブル大学の B. Vauquois 教授から,フランス CNRS の 上級招へい研究者のポジションをいただき,1981 年か ら 1 年間,フランスに滞在することになった.教授は, Colingを組織する ICCL(国際計算言語学会)の会長 であった.グルノーブル大学は,長尾 をはじめ,野 崎昭弘(東京大学,国際基督教大学),石綿敏夫(国立 国語研究所,茨城大学),坂本義行(電子技術総合研究 所)など,日本の言語処理研究者の多くが滞在した場所 であった.私が勤務したのは,大学に併設された CNRS の機械翻訳研究所(GETA)である. 私は,質問応答システムという,人工知能分野の研究 課題で博士号をとった.この分野は,今も活発に研究が 行われており,その解決は人工知能の究極的なゴールの 一つとなっている.当時の実感は,テーマが大きすぎる というものであった.言語の形に関する処理(統語処理), 意味処理,言語的な意味を知識に結び付ける処理,知識 の上での推論処理といった多様な処理を,当時の乏しい 計算リソースで行う,ドンキホーテ的な挑戦であった. 研究として成立させるには,もっと焦点を絞り込む必要 があると感じていた. GETAのチームは,当時,機械翻訳研究の世界的な中核 センターであった.機械翻訳は,ある言語での文を別の 言語の文に移し替える操作で,意味や知識,その上での 推論という,いわば,目に見えない領域での処理をバイ パスする枠組みが可能な分野であった.戦線を縮小させ たいという,当時の自分の問題意識に合うものであった.7.独創性ということ
GETAの研究会に参加して,対話研究会での議論とは 全く違うことに驚いた.対話研究会では,人工知能や認 知科学という,清新ではあるがいささか怪しげな話題を 議論していた.大部分の参加者は院生や助手で,著名な 海外の研究者の議論を追いかけていた.日本の偉い研究 者を,「あの人は馬鹿だ」とか,「理解が間違っている」 とか,一人前の口をきいて,自分達は科学の新しい道を 進んでいると,独りよがり的に思っていた. ところが,GETA の研究者は,米国のスタンフォー ドや MIT の研究者が何を議論しているかは,全く気 に し て い な い. 実 際,Vauquois 教 授( 図 3) は,N. Chomskyの言語学は,表示形式の議論とそれを計算す る過程とを混同した間違った議論であると,切り捨てて いた.私が,認知科学や人工知能の立場からは重要だと 思っていた,言語能力の生得説や,能力と運用の区別と いった議論など,「時間のむだ,たわごと」だとして一 顧もしないというふうであった. このような態度は,フランス人固有の傲慢さと独善の 表れで,必ずしも,良い面ばかりではない.GETA の偏 狭さは,彼らの研究に普遍的な影響力をもたせるうえで の障害になった.また,対話研究会での議論は,若気の 至りといった面はあったが,「私」という一個の研究者 にとっては,常に立ち返る問題意識,研究を推進する原 図 3 B. Vauquois 教授動力となっている. GETAでの議論は,研究方向に対する知的なパースペ クティブには欠けていたが,焦点を絞った,詳細にまで 切り込む議論の仕方は,当時の私にはすさまじく新鮮で あった. 研究会では,なぜこの人達はこんなに嫌いあっている のだろうと思うような激しい議論をする.その議論も, 他の著名な研究者の名前を出して自己の議論を正当化す るという甘えた部分はなく,ただひたすら自らの立場の 合理性を訴えるものであった.私とほぼ同年齢で,現在 も親交がある C. Boitet も B. Vauquois 教授も等しく頑 固で,二人の議論が延々と続くのには辟へき易えきした.
論理型言語 Prolog の始祖の一人,A. Colmerauer も マルセイユにいたが,何回か Vauquois 教授,Boitet ら と訪れた.彼も,昼食中に紙のテーブルクロスに自分の アイディアを延々と書き始めるなど,やはり極めてフラ ンス的に Obsessive な研究者であった. GETAでの 1 年足らずの滞在で,表示系の理論とそれ を計算する手続きとを切り分けること,あるいは,表示 系と計算との相互の関係という,私がその後の研究を考 えるうえでの基本問題に出合ったことになる.当時の言 葉では,宣言的記述と手続き的記述,あるいは,拘束条 件と探索の問題と言い換えてもよい.また,他人の研究 を理解して解説すること,あるいは自分の研究をほかの 有名研究者の仕事で正当化することは,日本では通用し ても,世界では通用しないこと,独創性を自分の言葉で 主張することの重要性を強く認識することとなった. GETAの独創性は,構造を規定する文法とは独立に それを計算する手続き文法を明示的に規定するというこ とにあった.この方式は,文解析や翻訳という多くの部 分が意識下にある計算過程を明示的な規則として書くと いう,規則による人工知能と共通したものである.意識 下の処理過程を明示的な規則とその制御で書き表すとい う根本的な困難があった.この困難を避けるために,95 年以降の東京大学での研究グループでは,構造間の関係 を規定する拘束条件としての宣言的な文法と確率モデル を使った探索という計算過程で,手続き文法や明示的な 制御を置き換える立場をとることになった. GETAは,手続き文法のアイディアをもとに機械翻訳 システムを構築し,この特定のシステムを前提とした研 究をその後も長く続ける.独自のシステムを前提に,そ の中での問題を取り上げるという研究は,前提を共有し ない研究コミュニティには理解されず,その後,GETA の研究は孤立していくことになる.
8.Mu プロジェクト(1982 ~ 86 年)
82年に帰国した直後から,科学技術庁の機械翻訳プ ロジェクト(Mu)が長尾教授を中心に始まる.東京で は,第五世代コンピュータプロジェクトという,人工知 能の巨大プロジェクトが始まっていた.京都のプロジェ クトは,規模ははるかに小さかったが,自然言語の実態 を捉えた,本当に実用的な稼働システムをつくることを 目標としていた.抽象的で格好の良い理論の吹聴ではな く,動かすことを目指した. プロジェクトは,各企業から研究者を派遣してもらい, 常に 10 名程度の研究者,エンジニアが京都大学に滞在 した.単語並びを深層格構造へ,一つの言語の深層格構 造をもう一つの言語の格構造へ,そして,その格構造を 単語並びへ,という四つの表示系の間を写像する三つの 計算過程(原言語の解析,二言語の移行,相手言語の生成) で実現するトランスファ方式のシステムであった. 表示形をつなぐための計算過程を手続き文法として用 意するという,グルノーブルの GETA の方式を採用し, 手続きのコントロールをより豊富にして,探索過程を積 極的に取り込んだ言語(GRADE)を開発した.また, 詳細な情報を単語中心に記述することから,GETA の方 式はとらず,辞書の記述はできるだけ宣言的にし,それ を手続き的なものにコンパイルする方式をとった. GRADE開発の中心には,早逝した中村順一君(九州 工業大学,京都大学)があたった.現在,オリンピック を目指した音声翻訳システムの開発を指揮している隅田 英一郎(NICT),公立はこだて未来大学の学長になった 片桐恭弘(NTT,公立はこだて未来大学)などもプロジェ クトに参加していた. プロジェクト開始時,私は 33 歳で,企業からのメン バはそれよりも若く,京都という独特の風土の中で,ク ラブ合宿のようなプロジェクトであった.4 年という短 い期間で,企業からの研究者は 1 ∼ 2 年の期間で交代し たが,このプロジェクトは,それ以後のそれぞれの生き 方に大きな影響をもった.今でも年に数回,集まりをもっ ている. プロジェクトの個別問題を議論するミーティングは, GETAでの研究会と同様,問題の具体的な解決策を真剣 に議論するものであった.京都という狭い空間での単身 生活で,議論は深夜に及ぶことも多かった.ただ,これ らの議論は,Mu の枠組みやシステムを前提としたもの であり,GETA の研究と同様に前提を共有しないコミュ ニティには理解されないものであった. 枠組みの前提を研究コミュニティに共有させるため には,個別の研究だけでなく,枠組みを説得的に広げて いくコミュニケーション能力,前提を共有するコミュニ ティを形成していく組織力や政治力が不可欠となる.コ ミュニケーション能力,国際的な場での組織力,政治力 の欠如は,日本の研究が世界に広がらない原因であろう.9.英語のトラウマ再び,英国へ
Muは,86 年に終了する.翻訳に要する時間は長く, そのままでの実用には問題があったが,大量の論文抄録を実際に翻訳できた.シストランという長期の開発を経 た,一種の怪物的な商用システムを除くと,世界で最初 の実用的な機械翻訳システムであった.シストランは, ブラックボックス的なプログラム群の集積といった第一 世代のシステムであった.これに対して,Mu ははるか に透明性のある第二世代のシステムとして稼働した最初 のシステムであった. Muは,世界的にも大きな注目を浴び,86 年のボンで の Coling で招待講演をすることとなった.しかし,10 年前の Coling でのトラウマはまだ残っていて,かなり 前から周到な準備をして,その前日もほとんど眠らずに, 人知れず発表準備をした.Coling も 10 年間で随分と大 きな会議になっていたので,その招待講演の緊張は相当 なものであった. 37歳になり,国際会議での発表も多くなっていたが, そのたびに身を削るような準備をしなければならなかっ た.このようなコミュニケーション能力では,国際的に 通用しないという焦りがあった.ちょうどその頃,英国 のマンチェスター大学から,教授の募集が届いた.マン チェスター大学は,Mu プロジェクトに触発されたヨー ロッパのプロジェクト(Eurotra)において,英国の中 核チームであった.マンチェスター大学のチームを率い るのは,良い経験になるに違いないと,移籍を決心した. 88年,すでに 39 歳になっていた.
10.UMIST と Eurotra(1988 ~ 95 年)
移籍した UMIST(University of Manchester Institute for Science and Technology)は,現在はマンチェスター 大学と完全に一体化している.移籍した当時は,正式な 教授の任命などはマンチェスター大学全体の教授会で承 認されるが,博士や学士号も UMIST の名前で付与でき るなど,管理運営は独立していた.UMIST をマンチェ スター大学から独立した組織にした貢献者が,当時の学 長の H. Hankins 教授であった.教授は,ファーストネー ムのハロルドとみんなから敬愛を込めて呼ばれる,親切 で温厚な典型的なイギリス紳士であった. サッチャーによる大学大衆化が進む以前で,教授の数 はまだ極めて少なく,給料,待遇などについては個別に 学長とお茶を飲みながらゆっくりと話し合いをする,と いうふうであった.当初は英語が不自由で,このような 面談は苦手であったが,Hankins 教授の人柄に随分と助 けられた.
UMISTでは,CCL(Centre for Computational Linguistics)
の教授は,私と J. Sager 教授の二人で,私が Eurotra チームのリーダーを引き受け,彼が学科長と CCL のセ ンター長を引き受けた.彼の年齢のこともあり,徐々に, 学科長やセンター長の業務を引き継ぎ,91 年からは学 科長とセンター長も私が引き継いだ. 機械翻訳プロジェクト Eurotra の内部は,日本で考え ていた以上に混乱していた.ヨーロッパ全域を覆うプロ ジェクトが始まったばかりで,各国の研究レベルの差も 大きく,それぞれの国のチームが「独創的な」アイディ アを主張していて,まとまりのないものになっていた. ほとんどの国のチームが,機械翻訳システムをつくった 経験がない,夢想家的な理論家からできていた. 研究実績のある研究者が,ヨーロッパにいなかったわ けではなかった.例えば,フランスの GETA は,初期 の Eurotra には参加しリードしようとしたが失敗,主導 権が取れないまま,この巨大プロジェクトは時間のむだ であると考え,プロジェクトから去ってしまっていた. 私が UMIST チームを代表して会議に参加しても,意 味のない議論が延々と続く.あとは,個々のテーマごと にリーダーシップをとるための政治的な駆引に多くの時 間が使われた. ただ,このような会議に出席することで,英語であっ ても発言機会をうまく捉える技術は訓練された.また, 延々と声高に話す人の多くが問題の本質がわかっている わけではなく,自信をもって自分の意見を言えばよい, ということもわかってきた. UMIST時代は,日本のバブル経済崩壊の時期と重な る.しかし,日本企業は,まだ,海外の大学に研究者を 派遣する余裕をもっていた.東京大学からの院生で,帰 国後,研究室立上げに携わってくれた鳥澤健太郎(NICT) のほかにも,関根 聡(パナソニック,米国 NYU),福本 淳一(沖電気工業,立命館大学),福本文代(沖電気工業, 山梨大学),木下 聡(東芝),清野正樹(パナソニック) などが滞在し,良い仕事をしてくれた.また,UMIST 時代の学生には,V. Arranze(ELRA),S. Montegami(ピ サ大学,イタリア),J. Carrol(HP),P. Olivier(ニュー キャッスル大学),N. Collier(ケンブリッジ大学)など がいた.
11.Eurotra7
Eurotraの経験に,知的な意味がなかったわけではな い.本体プロジェクトが迷走する中で,次の研究枠組み をきっちりと議論しようという,サイドトラックのプロ ジェクトを始めることになった.このプロジェクトは, ケンブリッジにあった SRI 分室の S. Pulman(現在は, オクスフォード大学),D. Carter(現在はバイオインフ ォマティクスのサンガー研究所),ドイツのザール大学 の H. Uzskoreit(現在は,DFKI)らと,私で行ったも のである. Muで開発した GRADE は強力な記述系であったが, その意味論は必ずしも明確ではなかった.Eurotra で は,より宣言的な記述系を設計していたが,その意味論 は不明確で,これらを明確にする必要があった.これを, 当時スタンフォード大学を中心に広がりつつあった M. Kay教授(図 4)らの素性構造理論を使って明確にしようとしたのが,Eurotra7 であった.この経験は,その後, 日本に帰国後,東京大学で研究を組み立てるうえで役立 つことになる. Kay教授は,早逝した Vauquois 教授を引き継いで, ICCLの会長をした人で,1992 年,私を ICCL のメンバ に推挙してくれた.2014 年の Coling(ダブリン)から, 私が,この Kay 教授を引き継いで ICCL の会長になっ ている.
12.東京大学,三つのプロジェクト
(1995 ~ 2011 年)
UMISTでの滞在が 7 年になった頃,米澤明憲さん(東 京大学)が立ち寄られて,日本に帰りませんかと誘われ た.Eurotra7 も終わり,その頃,米澤さんの学生の鳥 澤君(現 NICT)も滞在していた.こういう若い優秀な 院生が大勢いるという環境は,魅力的であった.日本へ の帰国は 95 年,46 歳になっていた. 16年間の東京大学時代は,未来開拓プロジェクト, JSTの CREST や SORST,特別推進研究という比較的 大型のプロジェクトを継続的に遂行できた.助手の鳥 澤君と議論する中で,宣言的な文法記述とそれを使って 文を解析する計算過程は,もっと独立して考えてよいの ではないか,また,表面上違って見える宣言的な文法の 記述系(HPSG, TAG, CCG など)も,実は解の拘束条 件としては相互に変換可能ではないか,と考えるように なった. 表層の単語列と深層の意味表現という二つの表現形 の関係を記述するのに,Chomsky 理論のような変形 操作は必要なく,完全に宣言的に書ける.GETA の Vauquois教授も,表現形間の写像を宣言的に記述する 静的文法(Static Grammar)を想定し,この文法をも とにして,一つの表現形(単語の列)からもう一つの表 現形(深層の述語項関係)を計算する手続き文法を設計 するという構想をもっていた.この構想を,もっと推し 進めて,拘束条件としての文法から計算に適した探索の ためのさまざまな簡易化した文法を派生し,最適な探索 過程を設計すればよい,と考えるようになった. 宣言的な文法とそこから導出される簡易な文法の上に は確率モデルが定義できる.この確率モデル上での最適 解の探索が文解析という計算過程であると考えた.この ように考えると,探索に幅優先,縦優先,ビーム探索, A*探索などの手法を使うことで,手続き文法という計 算のための明示的な文法は不必要となる. また,文解析の最初の段階で適用される品詞タグ付け の技術を,宣言的文法から派生される品詞(スパータグ) に適用し,品詞タグ付けの段階で探索処理をすること で,後半の文解析が格段に加速できる.大規模訓練デー タからの確率モデルの推定が,鍵であった.この確率モ デルを使った探索をうまく行うと,Eurotra7 時代には, 文解析に数時間かかったのが,数十ミリ秒でできように なった.このような文解析の効率化に,計算機技術全般 の進歩が寄与していることは確かであるが,文解析にお ける計算過程の制御がうまく定式化できたことも大き い. この一連の研究は,助教であった宮尾祐介(国立情報 学研究所)を中心にして,プロジェクト研究員や大学院 生であった牧野貴樹(Google),二宮 崇(愛媛大学),松 崎拓也(名古屋大学),鶴岡慶雅(東京大学),K. Sagae(米 国 UC デービス校)らによって行われた.また,関連す る研究テーマには,狩野芳伸(静岡大学),現在 PFN で 活躍する岡野原大輔や海野裕也など,すべて名前をあげ られないほど,優秀な学生,院生が多数集まってくれた.13.言語の意味と知識の研究
言語はその意味を通して,言語外のものとつながって いる.言語外のものとは,視覚情報や記号化されていな いデータが考えられる.もう少し言語に近いものでは, 人間の心がもつ概念や知識といったものを措定してもよ い.長尾教授が,「人間の情報処理の根幹に言語的なも のがある」というのは,この概念や知識といったものの 存在を指す. 言語は,概念や知識と相互にインタラクションしてい る.言語があるから,心の中に概念が生まれる.概念が あるから,それの外部表象としての言語が生まれる.心 にある概念や知識は,言語だけでなく,明示的な記号化 が難しい感覚系からの情報がもとになって形づくられる 側面もある.言語は,心の中の概念を通して,このよう な記号的でないものともつながる. こういった錯綜した関係を思弁的にではなく,形而下 の科学や技術の対象とするためには,それ相応な準備が 必要となる.対話研究会の時代,言語学や心理学,哲学 と計算機の研究者が立ち向かおうとして苦闘したのは, この準備が十分ではなかったゆえであろう.抽象的な議 論はできても,科学や技術を駆動していくエビデンスや データが決定的に欠如していた.個人的には,博士時代 の質問応答システムや対話研究会での失敗から,研究の 現場では,意味や概念,知識,オントロジーといった用 語を使うことを極力避けてきていた. 図 4 M. Kay 教授しかし,単語並びから構造への写像を取り扱う文解析 技術は十分に成熟したという実感があった.また,大量 のテキスト集合や知識や概念の近似的な対応物(オント ロジーや構造化データベース,大規模知識グラフなど) が準備されてきたことから,「人間の情報処理の根幹」 についての研究への再挑戦を考えるようになってきてい た.その一方で,言語理解の研究は,目標を明確に規定し, 成功・失敗の評価ができる枠組みをきっちりと設定しな いと迷走するという懸念は強く,アメリカを中心に研究 されていた一般ドメインの言語理解研究には乗り切れな いでいた.
14.バイオ NLP(2000 年~現在)
そんな悩みを抱えていたとき,同僚の高木利久さん(東 京大学)から,生命科学では論文数が爆発的に増大して いること,この分野では科学者が論文から取り出したい 情報は比較的明確に定義できること,分散データベース 統合のための生命オントロジーが整理されてきていて, これが知識のテンプレートとして使えること,といった ことを教えられた. 人工知能や言語理解からは完全に独立した分野の研究 者がいて,彼らがコミュニティとして定義した情報を実 際にテキストから取り出せるかどうか,このことでシス テムの成功や失敗が明確に評価できる.このように考え, 高木さんから生命科学の研究者(大田朋子)を紹介して もらい,生命科学分野の言語処理(バイオ NLP)の研 究を開始した.言語の構造と意味,言語と知識の相互関 係といったことを研究するには,堅牢な研究リソースを 構築することが重要と考え,生命科学の標準オントロ ジー(Gene オントロジー)をもとにテキストの意味ア ノテーションのためのオントロジー(GENIA オントロ ジー)を設定し,生命医療科学のテキスト集合(Medline) から 2 000 個の論文抄録を選んで,言語構造と意味のア ノテーションを付与することにした.このコーパスは, 現在も BioNLP 分野の標準コーパスとして多くのグルー プで使われている. 研究成果も,生命科学分野での固有名認識,事象認 識,さらには,事象認識の結果を事象間の因果ネットワー ク(pathway)に構築する研究などと多岐にわたり,生 命科学分野のテキストマイニングという新しい分野(バ イオ NLP)を打ち立てることができた.一連の研究は, 東京大学でのプロジェクトの後半から本格化し,プロ ジェクトメンバの N. Collier(ケンブリッジ大学),金 進東(DBCLS),建石由佳(DBCLS),岡崎直観(東北 大学),鶴岡慶雅(東京大学),三輪 誠(豊田工業大学), S. Pyssalo(ケンブリッジ大学)らによって遂行された. また,Pathway のマイニングでは,北野宏明さん(ソ ニー研究所,SBI)とも共同して研究を進めることにも なり,現在の科学発見のための人工知能研究へと発展し ている. バイオ NLP の研究は,同僚で妻でもあるマンチェス ター大学の S. Ananiadou 教授のグループとの共同研究 でもあった.この共同研究は,英国でも評価され,英 国の e- サイエンス計画の一環として,2005 年にマン チェスター大学に国立テキストマイニングセンター (NaCTeM)が設立される.センター設立時には,セン ター長としてマンチェスター大学教授を兼任し,東京 大学退職の 2011 年まで兼任を続けることとなった.東 京大学では基盤技術の研究を行い,MIB(Manchester Interdisciplinary Bio-Centre)に埋め込まれた NaCTeM では,生命科学者という実ユーザと付き合う分業が可能 となった.NaCTeMは,ロボットサイエンティストの提唱者で
ある R. King 教授(マンチェスター大学)とも協力し, 現在,米国 DARPA の Big Mechanism のプロジェクト での Deep Reading のチームを構成している(図 5).
15.マイクロソフト研究所北京(2011 ~ 15 年)
2011年に 5 年間の特別推進研究が終了し,残り 2 年 の在職期間を考える必要があった.NaCTeM でのバイ オ NLP 研究を経験して,これからの言語処理研究では, 実際のユーザ集団を見据えて具体的な問題を解決してい く必要があると感じていた. また,日本の大学でのグループは小規模で,単独で アメリカやヨーロッパの研究チームと競争するのは難し い.私の場合,東京大学在職期間 16 年の最初の 1 年を 除く 15 年間,年間 1 億円程度のプロジェクトを実施でき, 比較的大きなグループを組織できていた.ただ,残り 2 年間,それまでの研究も一段落し,このようなグループ を維持するのは難しいという実感があった. 最後となった特別推進研究のプロジェクト期間は,そ れまでは基礎研究であった言語処理研究が,Web 検索 1,2-Diacyglycerol intracellular AKT(PKB) ALK Androgen receptor B-Raf BETA-PIX C/EBPbeta C3G CDC42 CDK2 CREB1 Ca('2+) cytosol Cyclic AMP intracellularCyclic GMP intracellular EGR1 ERK1/2 ESR1 (nuclear) Elk-1 FMO3 FRS2 GAB1 GRB2 Galectin-1 H-Ras HDBP1 HGF receptor (Met) HIF1A HSP27 IRS-1 IRS-2 JNK(MAPK8-10) K-RAS Lyn MAP2 MEK1/2 MEK4(MAP2K4) MEK6(MAP2K6) MEKK1(MAP3K1)MEKK4(MAP3K4) MLK3(MAP3K11) N-Ras NCK2 (Grb4) NO intracellular Neurofibromin PAK1 PDGF receptor PDLIM3 PDZ-GEF1 PI3K cat class IA
PIP5KI PKC PR (nuclear) Protein kinase G1 Pyk2(FAK2) R-Ras RASGRF2 RIPK4 Rac1 SHP-2 SLC36A1 SOS SP1 Shc Slc39a14 (Zip14) Tiam1 VEGFR-1 alpha-6/beta-4 integrin c-Fos c-Jun c-Kit c-Myc c-Raf-1 cPLA2 p90Rsk
AI for Big Sciences
DARPA Big Mechanism, Robot Scientist
Reading
Assembly
Robot Scientist
-‐
Conducts experiments SHP-2 SHP-2 c-Kit c-Kit HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) IRS-2 IRS-2 GAB1 GAB1 GAB1 GAB1 GAB1 HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) LynLyn PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor ShcShc VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin 1,2-Diacyglycerol intracellular AKT(PKB) ALK Androgen receptor B-Raf BETA-PIX C/EBPbeta C3G CDC42 CDK2 CREB1 Ca('2+) cytosol Cyclic AMP intracellularCyclic GMP intracellular EGR1 ERK1/2 ESR1 (nuclear) Elk-1 FMO3 FRS2 GAB1 GRB2 Galectin-1 H-Ras HDBP1 HGF receptor (Met) HIF1A HSP27 IRS-1 IRS-2 JNK(MAPK8-10) K-RAS Lyn MAP2 MEK1/2 MEK4(MAP2K4) MEK6(MAP2K6) MEKK1(MAP3K1)MEKK4(MAP3K4) MLK3(MAP3K11) N-Ras NCK2 (Grb4) NO intracellular Neurofibromin PAK1 PDGF receptor PDLIM3 PDZ-GEF1 PI3K cat class IA
PIP5KI PKC PR (nuclear) Protein kinase G1 Pyk2(FAK2) R-Ras RASGRF2 RIPK4 Rac1 SHP-2 SLC36A1 SOS SP1 Shc Slc39a14 (Zip14) Tiam1 VEGFR-1 alpha-6/beta-4 integrin c-Fos c-Jun c-Kit c-Myc c-Raf-1 cPLA2 p90Rsk 1,2-Diacyglycerol intracellular AKT(PKB) ALK Androgen receptor B-Raf BETA-PIX C/EBPbeta C3G CDC42 CDK2 CREB1 Ca('2+) cytosol Cyclic AMP intracellular
Cyclic GMP intracellular EGR1 ERK1/2 ESR1 (nuclear) Elk-1 FMO3 FRS2 GAB1 GRB2 Galectin-1 H-Ras HDBP1 HGF receptor (Met) HIF1A HSP27 IRS-1 IRS-2 JNK(MAPK8-10) K-RAS Lyn MAP2 MEK1/2 MEK4(MAP2K4) MEK6(MAP2K6) MEKK1(MAP3K1) MEKK4(MAP3K4) MLK3(MAP3K11) N-Ras NCK2 (Grb4) NO intracellular Neurofibromin PAK1 PDGF receptor PDLIM3 PDZ-GEF1 PI3K cat class IA
PIP5KI PKC PR (nuclear) Protein kinase G1 Pyk2(FAK2) R-Ras RASGRF2 RIPK4 Rac1 SHP-2 SLC36A1 SOS SP1 Shc Slc39a14 (Zip14) Tiam1 VEGFR-1 alpha-6/beta-4 integrin c-Fos c-Jun c-Kit c-Myc c-Raf-1 cPLA2 p90Rsk PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) 1,2-Diacyglycerol intracellular 1,2-Diacyglycerol intracellular ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) LynLyn PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor SHP-2 SHP-2 ShcShc VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 alpha-6/beta-4 integrin alpha-6/beta-4 integrin c-Kit c-Kit C3G C3G FRS2 FRS2 FRS2 FRS2 FRS2 FRS2 FRS2 FRS2 FRS2 FRS2 FRS2 GRB2 GRB2 IRS-1 IRS-1 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) IRS-2 IRS-2 C3G C3G
Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Galectin-1 Galectin-1 Galectin-1 Galectin-1 NO intracellular NO intracellular NO intracellular NO intracellular NO intracellular Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA
ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK GAB1 GAB1 GAB1 GAB1 GAB1 GAB1 PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) ESR1 (nuclear) ESR1 (nuclear) ESR1 (nuclear) PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 Very large conflicting
(probabilistic) network Smaller (relevant) grounded model Computational hypotheses/ wet lab Experiments controlling states of the network By A. Rzhetsky (U. Chicago)
図 5 DARPA Big Mechanism プロジェクトとロボットサイエン ティスト
との組合せで,急速に実用化されてきた時期でもあっ た.それまでは抽象論に過ぎなかった言語理解研究も, Wikipediaやより形式化の進んだ大規模知識グラフなど の出現により,実用を目指すスケールアップした研究へ と進展していた.生命科学の大規模なデータベースや 知識ベースとテキストをつなぐという,我々のバイオ NLPの研究も,この大きな流れの中にあった. このような研究には,大きなリソースが集積する企業 の研究所が良いのではないかと思い,マイクロソフト研 究所の人に可能性を打診すると,「ぜひに」ということで, 2011年に移籍することにした. マイクロソフト研究所(MSR)北京は,米国レドモ ンドの MSR に次いで大きな研究所で 200 名の研究者 と 300 名近いインターン生を抱えている.また,MSR での研究者間の交流は頻繁で,全世界で 1 000 名超の MSRの研究者がテーマごとに共同して研究を進めてい る.音声翻訳や最近話題となったチャットエージェン トなどの開発は,その大部分が開発セクションに移って いる.大規模な知識グラフの構築なども,MSR の研究 者が関与はするが,本格的な構築は,人手によるデータ Verificationなどを含めて,Web 検索の開発部門が行っ ている.これらに関係するエンジニアの数は,MSR の 研究者数をはるかに凌駕するものである.テキスト処理 の研究グループは,大規模グラフ処理やテキストへの索 引付けのグループ,検索結果のランキングを研究する機 械学習系のグループとも,緊密な協力を行っている. 特定の大規模な環境中でのシステムを研究対象とする ために,その成果の一部を切り取って一般化した論文と することには困難が伴う.これは,GETA や Mu が遭遇 したのと同質の問題で MSR の研究者間でしかわかって もらえない成果も多い.しかし,現在の言語処理や人工 知能を進めていくうえで,この種の統合した環境が不可 欠になってきている. MSR北京は,中国の有力な大学や研究所との研究協 力も多く,長期滞在する若手研究者も多い.日本人の研 究者では,現在,池内克志,福本雅朗がおられる.私と 同時期には,松下康之(画像処理,大阪大学),酒井哲 也(情報検索,早稲田大学),矢谷浩司(HCI,東京大学), 荒瀬由紀(言語処理,大阪大学),白鳥貴亮(Facebook) がおられ,それぞれに MSR がもつ恵まれたリソースと 研究環境を最大限に活用した成果を上げておられた.
16.お わ り に
産業技術総合研究所人工知能研究センター
(2015 年~現在)
2015年 5 月に産業技術総合研究所に人工知能研究セ ンターが設立され,そのセンター長を引き受けることに なった.このセンターの研究や活動は,機会を改めて書 きたいと思っている.ここでは,個人的な思いを書き留 めておきたい. 京都大学での対話研究会の時代から,人工知能の学際 的な側面は魅力的であった.当時の人工知能,認知科学 での学際研究は,理論の実証やそのためのエビデンスが ぜい弱であったために,形而上学的な抽象論に終始して いた.現在は,これに脳活動の観察が加わったことで, よりダイナミックな科学になる可能性を秘めている.た だ,人工物と自然物の差は大きく,人工知能を実現する 技術の研究と人間知能を究明する科学の研究とをどのよ うな距離感で結び付けていくかが重要であろう. 現在の人工知能を特徴づけるものに,技術のコモディ ティ化がある.プログラムやデータのオープン化によっ大学・企業とも連携した国内最大の
AI研究拠点
Artificial Intelligence Research Base with Industry-‐‑‒Academia cooperation
大学・企業とも連携した国内最大の
AI研究拠点
Artificial Intelligence Research Base with Industry-‐‑‒Academia cooperation
産総研 人工知能研究センター
Application Domains 言語理解 Text mining 行動分析 Behavior mining 産業ロボット・自動車 Industrial robots Automobile Application Domains 産 小売・流通 サービスデザイン Retail Service Design サ Service Design サ 健康・生活支援 Health care Living support社会・ビジネスへの適用
Apply to the real business and society
データ・知識融合型人工知能
Data-‐‑‒Knowledge integration AI
脳型人工知能
Brain architecture AI
知識モデル Knowledge 海馬モデル Hippocampus 基底核モデル Basal ganglia 確率関係 モデル Probabilistic relation ベイジアン ネット Bayesian net・・・ ・・・ 健 Health care Living support 健 Living support ネットワークサービス コミュニケーション Network services Communications 気象情報 文献分類 meteorology information Document classification 大脳皮質モデル Cerebral cortex 起業, 技術移転 Technology transfer業業 技術業 術術術移術術術移移移移移転転転転転 ベンチャー ベンチャ Venture Venture Venture business 企業 企業 Companies 技術移転 共同研究 Technology transfer Joint research
AI Research and Technology Platform
計画・制御 Planning Control 予測・推薦 Prediction Recommend パターン認識 Pattern recognition AI Research and Technology Platform
企画チームPlanning team ・・・
図5
AI技術の研究開発と実用化の循環
人工知能共通基盤 先進中核 モジュール 標準タスク化・ 標準データAI Platform
図 6 AI 技術の研究開発と実用化の循環て,すべて自前でシステムを構築する必要はなくなって いる.他人がつくったモジュールやデータを組み合わせ ることで,非常に素早くシステムが構築できる.この技 術やデータのコモディティ化が,技術の加速度的な進展 を支えている.個別技術や研究が,それを取り巻くシス テム全体に強く依存した GETA や Mu に見られた問題 は,かなりの程度解消されている.半面,この流動性の 良さは,Cloud 上の人工知能プラットフォームへの囲い 込みの反映でもある.日本での研究を活発化させ,人工 知能による産業や社会の活性化を図るためには,囲い込 みの少ないオープンなプラットフォームの構築が重要に なる.センターでは,基礎技術とその社会実証の間にあ るオープンなプラットフォームを重視している(図 6). 実ユーザに提供するシステムの構築には,研究の成 果である基盤技術とするもの以外に解くべき技術課題が 非常に多くある.これは,文解析の基盤技術からバイオ NLP研究に移行した際に実感したことである.プラッ トフォームを使ってシステム構築を加速し,実世界での 問題を解いていくことで新たな研究課題を見つけて定式 化していくこと,この研究とその実世界への適用のサイ クルを円滑に行うことが,今後の人工知能研究では不可 欠だと感じている. 現在の人工知能研究は,観察データの収集,シミュレー ション技術によるデータ生成,大規模グラフやその探索 技術,並列処理など,人工知能以外の計算機技術の進展 に支えられている.このような技術が集積した環境をも たないとインパクトのある研究ができない.並列処理や 大規模な計算環境でのスケジューリングを専門とする田 浦健次郎さん(東京大学)の研究グループとの共同がな ければ,生命科学分野の大規模なテキスト集合の処理は 不可能であった.マイクロソフトなど,巨大企業がもつ 集団としての技術の集積とグループを超えた共同研究の 風土を醸成していく必要がある. 個人的には,言語処理における計算のコントロール機 構に興味がある.コントロールを明示的な規則の系とし て記述する GETA や Mu の方式は,確率モデルを使っ た探索処理へと移行した.深層学習では,この探索過程 も神経網の計算に埋め込まれていく.記号や構造による 定式化が自然に見える意味処理や推論処理も,その計算 過程の多くは無意識下での非明示的な処理で実現されて いる.文解析に見られた表示系と計算過程の二重性が, より広いコンテキスで考えられる.記号や構造による自 覚的な処理と並列性が高い無意識下の処理とが,自然に 融合されていく期待がある.40 年余りの時を経て,昔, 漠然と夢想してきたことが具体的な研究として実現され ていく.いま,ワクワクとしている所以である. 2016年 6 月 13 日 受理 辻井 潤一(正会員) 京都大学大学院工学研究科修士課程修了(1973 年). 同年,京都大学助手,助教授を経て英国 UMIST 教 授(1988 年).日本に帰国し,東京大学大学院教授 (1995 年)の後,マイクロソフト研究所北京 首席 研究員(2011 年)を経て,2015 年から現職の産業 科学技術総合研究所人工知能研究センターセンター 長.この間,マンチェスター大学教授を兼任(2005 ∼ 11 年,2016 年∼).日本 IBM 科学賞(1988 年),本学会業績賞(2008 年), 紫綬褒章(2010 年),大川賞(2015 年)などを受賞.国際機械翻訳協会 会長(2003 ∼ 05 年),ACL 会長(2006 年),AFNLP 会長(2007 ∼ 08 年) などを歴任し,2014 年より ICCL 会長.ACL フェロー,情報処理学会フェ ロー,工学博士(京都大学).