研究の個人史　─言語処理，言語理解，人工知能─(<レクチャーシリーズ>つながりが創発するイノベーション〔第8回〕)

(1)

1．は　じ　め　に

研究の個人史のようなものを書いてくださいと依頼され，以前に考えたこと，やってきたことを書き連ねることにした．まとまりのないランダムな回想録になってしまい，読んでいただくのが気恥ずかしいものとなった．時間に追われての原稿になり，系統的に調べることができなかったので，記憶違いや誤解も多々あると思う．きわめて主観的な回想録と考えていただいて，誤りを許していただけるとありがたい．また，研究上，影響を受けた先生，先輩，同僚などについても書いてくださいということで，そのような方々のお名前をあげさせていただいた．敬称をどうするか迷ったが，指導教官の先生方などを除いては敬称を略すこととした．記述は，私の研究個人史になっているので，読む際の参考に私の略歴を図 1 に示す．

2．京都大学の卒業研究（1970 ～ 71 年）

京都大学に入学した直後から，いわゆる全共闘による大学紛争が激化して，学部卒業まで，まともな試験はなかった．試験期間が近づくと，いろいろな理由を付けてストライキを行い，試験もレポートに切り替えられた．学部の 3 年生になっても，授業がまともに行われるのはまれだった．私はあまり政治的なほうではなかったが，一般学生として，それなりの政治参加はしていた．デモに参加するというので，東京大学の駒場寮に泊まったこともあった．京都大学の電気系には非線形振動論の研究グループがあり，複雑系理論の Strange Attractor で有名な上田睆よし亮すけ先生がおられた．授業がないので，数学好きの学生が集まって，先生にお願いして，ポントリヤーギンの非線形微分方程式の本を使って勉強会をしたりしていた．卒業研究は，その関係で上田先生に指導を仰いだ．先生は，研究のことを楽しそうに話される方で，研究者という職業に憧れるきっかけになった．非線形微分方程式は，解析的には解けないのでアナログ計算機を使って解の挙動を調べる．アナログ計算機の計算精度は悪く，研究室の先輩の何人かは，ディジタル計算機を使っての数値計算で細かく解の挙動を調べていた．アナログ計算機での非線形振動の模擬実験は，解への収束を見守るという，時間はかかるが見ているだけという，暇をもて余すものであった．たばこを始めたのは，この退屈な待ち時間のゆえだった．アナログからディジタルへの切換えは，急速に進んでいた．その先端をきっていたのが，坂井利之先生の研究室で，大学院からはその坂井研究室に移籍した．

3．京都大学坂井研究室（1971 ～ 73 年）

1970年代は，情報科学，計算機工学の黎明期で，多くの俊英が数少ない研究室におしかけていた時代であった．「人は情報を呼吸する」といったコピーがあり，私「つながりが創発するイノベーション」〔第 8 回〕

研究の個人史

─言語処理，言語理解，人工知能─

A Note on My Own History of Research

　─ Natural Language Processing, Natural Language Understanding and AI ─

辻井　潤一

産業技術総合研究所人工知能研究センター

Jun’ichi Tsujii Artificial Intelligence Research Center, National Institute of Advanced Industrial Science and Technology.

[email protected]

Keywords:

natural language processing, natural language understanding, machine translation, question answering, bio-NLP.

1971.4 京都大学大学院修士課程入学（研究室：坂井利之教授） 1973.4 京都大学工学部助手（研究室：長尾教授） 1979.6 京都大学大学院工学研究科助教授（研究室：長尾教授）

1981.6 -- 1982.4 CNRS(Center National de la Recherche Scientiﬁquie、グルノーブル、フランス) 招聘上級研究員

1988.11 マンチェスター大学教授 (University of Manchester Institute for Science and Technology) 1992.3 ‒ 1995.6 マンチェスター大学計算言語学センター(CCL)、センター長 1995.6 東京大学大学院理学系研究科教授 2005.7 マンチェスター大学教授（兼務）英国国立テキストマイニングセンター(NaCTeM)、センター長（兼務） 2008.3 英国国立テキストマイニングセンター(NaCTeM)、研究担当ディレクター（兼務） 2011.4 マイクロソフト研究所（北京）首席研究員 2015.5 産総研人工知能研究センターセンター長 2016.4 マンチェスター大学教授（兼務）京大 15年マ大７年東大16年マ大 6年京都大学１５年マンチェスター大学１３年東京大学１６年マイクロソフト研究所４年人工知能研究センター 1 年 MSR 4年 AIRC 1年図 1　略歴

(2)

もその流れに引き寄せられて，坂井研究室で修士をすることにした．情報処理，人工知能を取り巻く雰囲気は，今の人工知能ブームと似たところがある．その後長く指導していただくことになる長尾先生は，ちょうど 2 年間のフランス留学から帰国されたところであった．後に CMU（カーネギーメロン大学）に転出される金出武雄，京都大学で計算機アーキテクチャの教授となる富田真司が 3 年先輩，同期には，東芝で日本語ワープロを開発する天野真家などがいた（図 2）．人工知能学会の会長などを歴任された堂下修司先生や，機械翻訳の専門家の杉田繁治先生も，この研究室の所属であった．長尾教授や金出さんが，画像処理研究を進めておられて，優れた成果をあげておられた．この二人が，画像処理の理論研究の徹底的なサーベイを行っておられた頃で，机にうず高く積まれた論文の束には，圧倒された．研究室は，廊下がギシギシと音を立てる古い木造の 2 階にあり，京都の暑い夏には地獄であったが，金出さん，富田さん，天野君達と過ごす時間は楽しいものであった．パターン認識の日米セミナーが京都で開催されたのも，その頃であったと思う．このセミナーでは，長尾教授や金出さんが顔写真の認識について発表された．身びいきではなく，出色の発表であった．米国からの出席者が強い印象を受けている様子が，セミナーの世話役の我々にも感じ取れた．その後，金出さんは CMU に招へいされるが，CMU の R. Reddy 教授がこのセミナーでの金出さんの発表に強い感銘を受けたのが，契機となったという．金出さんは，このときのことを「顔のイメージデータから，口，目，鼻といった部分を認識するという具体的な課題に取り組むことで，パターン認識の理論研究だけでは得られない研究上の刺激とアイディアを得た」と話されることが多い．理論一辺倒ではなく，具体的な問題から研究を組み立てるという立場は，坂井，長尾，金出に共通するもので，今も大きな影響を受けていると思う．現在，人工知能研究センターでは，「実世界に埋め込まれる人工知能」を標榜している．人工知能研究のための研究ではなく，現実の社会的，科学的な問題を解く人工知能を研究しようという表明である．

4．長尾研究室と対話研究会　（1973 ～ 88 年）

修士を終える頃，長尾教授が研究室を立ち上げるということで，私はその研究室助手に採用された．金出さんをはじめとする強い画像処理の研究グループがすでにあったので，私は言語処理に専念することになった．長尾教授からは，「言語の研究，特に意味の研究は困難で息の長い研究になる．日の目を見るまでには時間がかかるだろうが，人間の情報処理の根幹の部分に言語的なものが関与している．長い困難な研究となるだろうから，焦らずに腰を落ち着けて取り組みなさい」と言われた．知能の根幹に言語的なものがあり，言語処理研究は，人工知能研究の本質的な部分となるという認識は，その後の私の研究を支えるものとなった．当時の京都大学は，奇妙な大学であった．長く続いた学園紛争の影響もあった．自由で反逆的な空気があり，学問の細分化への抵抗と学際的な分野に強い憧れがあった．新しい学問の形をつくるという気分が，院生や若い研究者に広がっていた．特に N.Chomsky の理論言語学は，それまでの堅実な言語研究のアンチテーゼとして，言語学科の若い研究者をひき付けていた．また， Chomskyの認知主義や計算主義に並行して，心理学科では，心の表象や計算を積極的に取り上げようとする認知心理学，認知科学への興味が，若い研究者を中心にして，湧き上がっていた．このような科学パラダイムの変革を強く自覚していたわけではないが，人工知能を標榜する長尾教授の周りには，文学部，教育学部などの，伝統的な学問の枠組みに飽き足らない院生，研究者が集まることになった．心理学の梅本堯教授が，若い研究者の認知科学への傾斜を積極的に奨励，見守る立場をとられたことも，この集まりを助けた．集まりが，京都大学対話研究会として活動し始め，関西周辺の研究者が集まり出したのは，私が助手になった 1973年からしばらくしてからで，10 年近くは続いたかと思う．この研究会には，長尾先生を中心に山梨正明（認知言語学，京都大学），田窪行則（言語学，京都大学），坂原茂（フランス語学，東京大学），西田豊明（人工知能，京都大学），金水敏（国語学，大阪大学），吉川左紀子（心理学，京都大学），川口潤（心理学，名古屋大学），乾敏郎（神経回路網，京都大学）ら，その後，さまざまな分野で活躍することになる研究者や院生が集まった．残念ながら，当時の状況を反映してか，脳科学からの研究者はいなかった．月 1 ∼ 2 回集まって，一人か二人の話題提供の後，好き勝手な議論をし，夕食とともに酒を飲み交わす会であった．アメリカや東京の有名な研究者を俎上にあげて批判するなど，言いたい放題の会であったが，この会を通して理論言語学や認知心理学を随分と勉強することとなった．私なりの言語観，知能観が形成された時期であった．しかし，具体的な研究計画に移行できるものは少なく，しだいに思弁的な議論の空回りとなっていった．計算機科学，言語学，心理学，哲学という個々の分野がも図 2　左から長尾教授，金出さん，富田さん，天野君

(3)

つ価値観の差も大きく，研究者はしだいに自分達の個別分野へと回帰していった．

5．英語のトラウマ，オタワでの Coling

英語で研究発表した最初の国際会議は，76 年オタワでの国際計算言語学会（Coling）であった．電子メールや Web のない時代で，会議プログラムもない状態で日本を出発した．発表に割り当てられる時間もわからないので，とりあえず，たくさんのスライドを用意した．国内では，発表の準備などせず，聴衆の反応を見て発表内容を変えるほうがうまく発表できた．英語での発表も同じで，スライドさえあれば何とでも調整できると，自分の能力を過信していた．航空管制官のストで飛行機が飛ばず，トロントからのレンタカー相乗りでオタワに着くと，会議プログラムでは，翌日に 1 時間の枠が割り当てられていた．それでも，どうしてそんなに自信があったのか不思議であるが，日本からの参加者と一緒に食事に出かけて，酒も飲み，発表練習もせずに寝てしまった． 1時間という長い発表，それも初めての英語での発表を練習もせずにできるはずがない．実際，3 分ほど話したところでうまく話せないことに気が付くと，喉はカラカラになるし，聴衆は目に入らず，何もわからない状態で発表を終わった．がっくりして，完全な自信喪失の状態となった．この経験は，その後，英語発表のトラウマとして長く残った．その後，英語での発表のたびに異常に緊張し，このままでは世界に通じないと思うようになった．これが後年，英国に行く動機となった．

6．フランス，グルノーブル大学（1981 ～ 82 年）

76年の Coling は散々であったが，80 年の Coling（東京）では，周到な準備で，発表やパネルをこなすことができた．そのときに長尾先生から紹介されたグルノーブル大学の B. Vauquois 教授から，フランス CNRS の上級招へい研究者のポジションをいただき，1981 年から 1 年間，フランスに滞在することになった．教授は， Colingを組織する ICCL（国際計算言語学会）の会長であった．グルノーブル大学は，長尾をはじめ，野崎昭弘（東京大学，国際基督教大学），石綿敏夫（国立国語研究所，茨城大学），坂本義行（電子技術総合研究所）など，日本の言語処理研究者の多くが滞在した場所であった．私が勤務したのは，大学に併設された CNRS の機械翻訳研究所（GETA）である．私は，質問応答システムという，人工知能分野の研究課題で博士号をとった．この分野は，今も活発に研究が行われており，その解決は人工知能の究極的なゴールの一つとなっている．当時の実感は，テーマが大きすぎるというものであった．言語の形に関する処理（統語処理），意味処理，言語的な意味を知識に結び付ける処理，知識の上での推論処理といった多様な処理を，当時の乏しい計算リソースで行う，ドンキホーテ的な挑戦であった．研究として成立させるには，もっと焦点を絞り込む必要があると感じていた． GETAのチームは，当時，機械翻訳研究の世界的な中核センターであった．機械翻訳は，ある言語での文を別の言語の文に移し替える操作で，意味や知識，その上での推論という，いわば，目に見えない領域での処理をバイパスする枠組みが可能な分野であった．戦線を縮小させたいという，当時の自分の問題意識に合うものであった．

7．独創性ということ

GETAの研究会に参加して，対話研究会での議論とは全く違うことに驚いた．対話研究会では，人工知能や認知科学という，清新ではあるがいささか怪しげな話題を議論していた．大部分の参加者は院生や助手で，著名な海外の研究者の議論を追いかけていた．日本の偉い研究者を，「あの人は馬鹿だ」とか，「理解が間違っている」とか，一人前の口をきいて，自分達は科学の新しい道を進んでいると，独りよがり的に思っていた．ところが，GETA の研究者は，米国のスタンフォードや MIT の研究者が何を議論しているかは，全く気にしていない．実際，Vauquois 教授（図 3）は，N. Chomskyの言語学は，表示形式の議論とそれを計算する過程とを混同した間違った議論であると，切り捨てていた．私が，認知科学や人工知能の立場からは重要だと思っていた，言語能力の生得説や，能力と運用の区別といった議論など，「時間のむだ，たわごと」だとして一顧もしないというふうであった．このような態度は，フランス人固有の傲慢さと独善の表れで，必ずしも，良い面ばかりではない．GETA の偏狭さは，彼らの研究に普遍的な影響力をもたせるうえでの障害になった．また，対話研究会での議論は，若気の至りといった面はあったが，「私」という一個の研究者にとっては，常に立ち返る問題意識，研究を推進する原図 3　B. Vauquois 教授

(4)

動力となっている． GETAでの議論は，研究方向に対する知的なパースペクティブには欠けていたが，焦点を絞った，詳細にまで切り込む議論の仕方は，当時の私にはすさまじく新鮮であった．研究会では，なぜこの人達はこんなに嫌いあっているのだろうと思うような激しい議論をする．その議論も，他の著名な研究者の名前を出して自己の議論を正当化するという甘えた部分はなく，ただひたすら自らの立場の合理性を訴えるものであった．私とほぼ同年齢で，現在も親交がある C. Boitet も B. Vauquois 教授も等しく頑固で，二人の議論が延々と続くのには辟へき易えきした．

論理型言語 Prolog の始祖の一人，A. Colmerauer もマルセイユにいたが，何回か Vauquois 教授，Boitet らと訪れた．彼も，昼食中に紙のテーブルクロスに自分のアイディアを延々と書き始めるなど，やはり極めてフランス的に Obsessive な研究者であった． GETAでの 1 年足らずの滞在で，表示系の理論とそれを計算する手続きとを切り分けること，あるいは，表示系と計算との相互の関係という，私がその後の研究を考えるうえでの基本問題に出合ったことになる．当時の言葉では，宣言的記述と手続き的記述，あるいは，拘束条件と探索の問題と言い換えてもよい．また，他人の研究を理解して解説すること，あるいは自分の研究をほかの有名研究者の仕事で正当化することは，日本では通用しても，世界では通用しないこと，独創性を自分の言葉で主張することの重要性を強く認識することとなった． GETAの独創性は，構造を規定する文法とは独立にそれを計算する手続き文法を明示的に規定するということにあった．この方式は，文解析や翻訳という多くの部分が意識下にある計算過程を明示的な規則として書くという，規則による人工知能と共通したものである．意識下の処理過程を明示的な規則とその制御で書き表すという根本的な困難があった．この困難を避けるために，95 年以降の東京大学での研究グループでは，構造間の関係を規定する拘束条件としての宣言的な文法と確率モデルを使った探索という計算過程で，手続き文法や明示的な制御を置き換える立場をとることになった． GETAは，手続き文法のアイディアをもとに機械翻訳システムを構築し，この特定のシステムを前提とした研究をその後も長く続ける．独自のシステムを前提に，その中での問題を取り上げるという研究は，前提を共有しない研究コミュニティには理解されず，その後，GETA の研究は孤立していくことになる．

8．Mu プロジェクト（1982 ～ 86 年）

82年に帰国した直後から，科学技術庁の機械翻訳プロジェクト（Mu）が長尾教授を中心に始まる．東京では，第五世代コンピュータプロジェクトという，人工知能の巨大プロジェクトが始まっていた．京都のプロジェクトは，規模ははるかに小さかったが，自然言語の実態を捉えた，本当に実用的な稼働システムをつくることを目標としていた．抽象的で格好の良い理論の吹聴ではなく，動かすことを目指した．プロジェクトは，各企業から研究者を派遣してもらい，常に 10 名程度の研究者，エンジニアが京都大学に滞在した．単語並びを深層格構造へ，一つの言語の深層格構造をもう一つの言語の格構造へ，そして，その格構造を単語並びへ，という四つの表示系の間を写像する三つの計算過程（原言語の解析，二言語の移行，相手言語の生成）で実現するトランスファ方式のシステムであった．表示形をつなぐための計算過程を手続き文法として用意するという，グルノーブルの GETA の方式を採用し，手続きのコントロールをより豊富にして，探索過程を積極的に取り込んだ言語（GRADE）を開発した．また，詳細な情報を単語中心に記述することから，GETA の方式はとらず，辞書の記述はできるだけ宣言的にし，それを手続き的なものにコンパイルする方式をとった． GRADE開発の中心には，早逝した中村順一君（九州工業大学，京都大学）があたった．現在，オリンピックを目指した音声翻訳システムの開発を指揮している隅田英一郎（NICT），公立はこだて未来大学の学長になった片桐恭弘（NTT，公立はこだて未来大学）などもプロジェクトに参加していた．プロジェクト開始時，私は 33 歳で，企業からのメンバはそれよりも若く，京都という独特の風土の中で，クラブ合宿のようなプロジェクトであった．4 年という短い期間で，企業からの研究者は 1 ∼ 2 年の期間で交代したが，このプロジェクトは，それ以後のそれぞれの生き方に大きな影響をもった．今でも年に数回，集まりをもっている．プロジェクトの個別問題を議論するミーティングは， GETAでの研究会と同様，問題の具体的な解決策を真剣に議論するものであった．京都という狭い空間での単身生活で，議論は深夜に及ぶことも多かった．ただ，これらの議論は，Mu の枠組みやシステムを前提としたものであり，GETA の研究と同様に前提を共有しないコミュニティには理解されないものであった．枠組みの前提を研究コミュニティに共有させるためには，個別の研究だけでなく，枠組みを説得的に広げていくコミュニケーション能力，前提を共有するコミュニティを形成していく組織力や政治力が不可欠となる．コミュニケーション能力，国際的な場での組織力，政治力の欠如は，日本の研究が世界に広がらない原因であろう．

9．英語のトラウマ再び，英国へ

Muは，86 年に終了する．翻訳に要する時間は長く，そのままでの実用には問題があったが，大量の論文抄録

(5)

を実際に翻訳できた．シストランという長期の開発を経た，一種の怪物的な商用システムを除くと，世界で最初の実用的な機械翻訳システムであった．シストランは，ブラックボックス的なプログラム群の集積といった第一世代のシステムであった．これに対して，Mu ははるかに透明性のある第二世代のシステムとして稼働した最初のシステムであった． Muは，世界的にも大きな注目を浴び，86 年のボンでの Coling で招待講演をすることとなった．しかし，10 年前の Coling でのトラウマはまだ残っていて，かなり前から周到な準備をして，その前日もほとんど眠らずに，人知れず発表準備をした．Coling も 10 年間で随分と大きな会議になっていたので，その招待講演の緊張は相当なものであった． 37歳になり，国際会議での発表も多くなっていたが，そのたびに身を削るような準備をしなければならなかった．このようなコミュニケーション能力では，国際的に通用しないという焦りがあった．ちょうどその頃，英国のマンチェスター大学から，教授の募集が届いた．マンチェスター大学は，Mu プロジェクトに触発されたヨーロッパのプロジェクト（Eurotra）において，英国の中核チームであった．マンチェスター大学のチームを率いるのは，良い経験になるに違いないと，移籍を決心した． 88年，すでに 39 歳になっていた．

10．UMIST と Eurotra（1988 ～ 95 年）

移籍した UMIST（University of Manchester Institute for Science and Technology）は，現在はマンチェスター大学と完全に一体化している．移籍した当時は，正式な教授の任命などはマンチェスター大学全体の教授会で承認されるが，博士や学士号も UMIST の名前で付与できるなど，管理運営は独立していた．UMIST をマンチェスター大学から独立した組織にした貢献者が，当時の学長の H. Hankins 教授であった．教授は，ファーストネームのハロルドとみんなから敬愛を込めて呼ばれる，親切で温厚な典型的なイギリス紳士であった．サッチャーによる大学大衆化が進む以前で，教授の数はまだ極めて少なく，給料，待遇などについては個別に学長とお茶を飲みながらゆっくりと話し合いをする，というふうであった．当初は英語が不自由で，このような面談は苦手であったが，Hankins 教授の人柄に随分と助けられた．

UMISTでは，CCL（Centre for Computational Linguistics）

の教授は，私と J. Sager 教授の二人で，私が Eurotra チームのリーダーを引き受け，彼が学科長と CCL のセンター長を引き受けた．彼の年齢のこともあり，徐々に，学科長やセンター長の業務を引き継ぎ，91 年からは学科長とセンター長も私が引き継いだ．機械翻訳プロジェクト Eurotra の内部は，日本で考えていた以上に混乱していた．ヨーロッパ全域を覆うプロジェクトが始まったばかりで，各国の研究レベルの差も大きく，それぞれの国のチームが「独創的な」アイディアを主張していて，まとまりのないものになっていた．ほとんどの国のチームが，機械翻訳システムをつくった経験がない，夢想家的な理論家からできていた．研究実績のある研究者が，ヨーロッパにいなかったわけではなかった．例えば，フランスの GETA は，初期の Eurotra には参加しリードしようとしたが失敗，主導権が取れないまま，この巨大プロジェクトは時間のむだであると考え，プロジェクトから去ってしまっていた．私が UMIST チームを代表して会議に参加しても，意味のない議論が延々と続く．あとは，個々のテーマごとにリーダーシップをとるための政治的な駆引に多くの時間が使われた．ただ，このような会議に出席することで，英語であっても発言機会をうまく捉える技術は訓練された．また，延々と声高に話す人の多くが問題の本質がわかっているわけではなく，自信をもって自分の意見を言えばよい，ということもわかってきた． UMIST時代は，日本のバブル経済崩壊の時期と重なる．しかし，日本企業は，まだ，海外の大学に研究者を派遣する余裕をもっていた．東京大学からの院生で，帰国後，研究室立上げに携わってくれた鳥澤健太郎（NICT）のほかにも，関根聡（パナソニック，米国 NYU），福本淳一（沖電気工業，立命館大学），福本文代（沖電気工業，山梨大学），木下聡（東芝），清野正樹（パナソニック）などが滞在し，良い仕事をしてくれた．また，UMIST 時代の学生には，V. Arranze（ELRA），S. Montegami（ピサ大学，イタリア），J. Carrol（HP），P. Olivier（ニューキャッスル大学），N. Collier（ケンブリッジ大学）などがいた．

11．Eurotra7

Eurotraの経験に，知的な意味がなかったわけではない．本体プロジェクトが迷走する中で，次の研究枠組みをきっちりと議論しようという，サイドトラックのプロジェクトを始めることになった．このプロジェクトは，ケンブリッジにあった SRI 分室の S. Pulman（現在は，オクスフォード大学），D. Carter（現在はバイオインフォマティクスのサンガー研究所），ドイツのザール大学の H. Uzskoreit（現在は，DFKI）らと，私で行ったものである． Muで開発した GRADE は強力な記述系であったが，その意味論は必ずしも明確ではなかった．Eurotra では，より宣言的な記述系を設計していたが，その意味論は不明確で，これらを明確にする必要があった．これを，当時スタンフォード大学を中心に広がりつつあった M. Kay教授（図 4）らの素性構造理論を使って明確にしよ

(6)

うとしたのが，Eurotra7 であった．この経験は，その後，日本に帰国後，東京大学で研究を組み立てるうえで役立つことになる． Kay教授は，早逝した Vauquois 教授を引き継いで， ICCLの会長をした人で，1992 年，私を ICCL のメンバに推挙してくれた．2014 年の Coling（ダブリン）から，私が，この Kay 教授を引き継いで ICCL の会長になっている．

12．東京大学，三つのプロジェクト

（1995 ～ 2011 年）

UMISTでの滞在が 7 年になった頃，米澤明憲さん（東京大学）が立ち寄られて，日本に帰りませんかと誘われた．Eurotra7 も終わり，その頃，米澤さんの学生の鳥澤君（現 NICT）も滞在していた．こういう若い優秀な院生が大勢いるという環境は，魅力的であった．日本への帰国は 95 年，46 歳になっていた． 16年間の東京大学時代は，未来開拓プロジェクト， JSTの CREST や SORST，特別推進研究という比較的大型のプロジェクトを継続的に遂行できた．助手の鳥澤君と議論する中で，宣言的な文法記述とそれを使って文を解析する計算過程は，もっと独立して考えてよいのではないか，また，表面上違って見える宣言的な文法の記述系（HPSG, TAG, CCG など）も，実は解の拘束条件としては相互に変換可能ではないか，と考えるようになった．表層の単語列と深層の意味表現という二つの表現形の関係を記述するのに，Chomsky 理論のような変形操作は必要なく，完全に宣言的に書ける．GETA の Vauquois教授も，表現形間の写像を宣言的に記述する静的文法（Static Grammar）を想定し，この文法をもとにして，一つの表現形（単語の列）からもう一つの表現形（深層の述語項関係）を計算する手続き文法を設計するという構想をもっていた．この構想を，もっと推し進めて，拘束条件としての文法から計算に適した探索のためのさまざまな簡易化した文法を派生し，最適な探索過程を設計すればよい，と考えるようになった．宣言的な文法とそこから導出される簡易な文法の上には確率モデルが定義できる．この確率モデル上での最適解の探索が文解析という計算過程であると考えた．このように考えると，探索に幅優先，縦優先，ビーム探索， A*探索などの手法を使うことで，手続き文法という計算のための明示的な文法は不必要となる．また，文解析の最初の段階で適用される品詞タグ付けの技術を，宣言的文法から派生される品詞（スパータグ）に適用し，品詞タグ付けの段階で探索処理をすることで，後半の文解析が格段に加速できる．大規模訓練データからの確率モデルの推定が，鍵であった．この確率モデルを使った探索をうまく行うと，Eurotra7 時代には，文解析に数時間かかったのが，数十ミリ秒でできようになった．このような文解析の効率化に，計算機技術全般の進歩が寄与していることは確かであるが，文解析における計算過程の制御がうまく定式化できたことも大きい．この一連の研究は，助教であった宮尾祐介（国立情報学研究所）を中心にして，プロジェクト研究員や大学院生であった牧野貴樹（Google），二宮崇（愛媛大学），松崎拓也（名古屋大学），鶴岡慶雅（東京大学），K. Sagae（米国 UC デービス校）らによって行われた．また，関連する研究テーマには，狩野芳伸（静岡大学），現在 PFN で活躍する岡野原大輔や海野裕也など，すべて名前をあげられないほど，優秀な学生，院生が多数集まってくれた．

13．言語の意味と知識の研究

言語はその意味を通して，言語外のものとつながっている．言語外のものとは，視覚情報や記号化されていないデータが考えられる．もう少し言語に近いものでは，人間の心がもつ概念や知識といったものを措定してもよい．長尾教授が，「人間の情報処理の根幹に言語的なものがある」というのは，この概念や知識といったものの存在を指す．言語は，概念や知識と相互にインタラクションしている．言語があるから，心の中に概念が生まれる．概念があるから，それの外部表象としての言語が生まれる．心にある概念や知識は，言語だけでなく，明示的な記号化が難しい感覚系からの情報がもとになって形づくられる側面もある．言語は，心の中の概念を通して，このような記号的でないものともつながる．こういった錯綜した関係を思弁的にではなく，形而下の科学や技術の対象とするためには，それ相応な準備が必要となる．対話研究会の時代，言語学や心理学，哲学と計算機の研究者が立ち向かおうとして苦闘したのは，この準備が十分ではなかったゆえであろう．抽象的な議論はできても，科学や技術を駆動していくエビデンスやデータが決定的に欠如していた．個人的には，博士時代の質問応答システムや対話研究会での失敗から，研究の現場では，意味や概念，知識，オントロジーといった用語を使うことを極力避けてきていた．図 4　M. Kay 教授

(7)

しかし，単語並びから構造への写像を取り扱う文解析技術は十分に成熟したという実感があった．また，大量のテキスト集合や知識や概念の近似的な対応物（オントロジーや構造化データベース，大規模知識グラフなど）が準備されてきたことから，「人間の情報処理の根幹」についての研究への再挑戦を考えるようになってきていた．その一方で，言語理解の研究は，目標を明確に規定し，成功・失敗の評価ができる枠組みをきっちりと設定しないと迷走するという懸念は強く，アメリカを中心に研究されていた一般ドメインの言語理解研究には乗り切れないでいた．

14．バイオ NLP（2000 年～現在）

そんな悩みを抱えていたとき，同僚の高木利久さん（東京大学）から，生命科学では論文数が爆発的に増大していること，この分野では科学者が論文から取り出したい情報は比較的明確に定義できること，分散データベース統合のための生命オントロジーが整理されてきていて，これが知識のテンプレートとして使えること，といったことを教えられた．人工知能や言語理解からは完全に独立した分野の研究者がいて，彼らがコミュニティとして定義した情報を実際にテキストから取り出せるかどうか，このことでシステムの成功や失敗が明確に評価できる．このように考え，高木さんから生命科学の研究者（大田朋子）を紹介してもらい，生命科学分野の言語処理（バイオ NLP）の研究を開始した．言語の構造と意味，言語と知識の相互関係といったことを研究するには，堅牢な研究リソースを構築することが重要と考え，生命科学の標準オントロジー（Gene オントロジー）をもとにテキストの意味アノテーションのためのオントロジー（GENIA オントロジー）を設定し，生命医療科学のテキスト集合（Medline）から 2 000 個の論文抄録を選んで，言語構造と意味のアノテーションを付与することにした．このコーパスは，現在も BioNLP 分野の標準コーパスとして多くのグループで使われている．研究成果も，生命科学分野での固有名認識，事象認識，さらには，事象認識の結果を事象間の因果ネットワーク（pathway）に構築する研究などと多岐にわたり，生命科学分野のテキストマイニングという新しい分野（バイオ NLP）を打ち立てることができた．一連の研究は，東京大学でのプロジェクトの後半から本格化し，プロジェクトメンバの N. Collier（ケンブリッジ大学），金進東（DBCLS），建石由佳（DBCLS），岡崎直観（東北大学），鶴岡慶雅（東京大学），三輪誠（豊田工業大学）， S. Pyssalo（ケンブリッジ大学）らによって遂行された．また，Pathway のマイニングでは，北野宏明さん（ソニー研究所，SBI）とも共同して研究を進めることにもなり，現在の科学発見のための人工知能研究へと発展している．バイオ NLP の研究は，同僚で妻でもあるマンチェスター大学の S. Ananiadou 教授のグループとの共同研究でもあった．この共同研究は，英国でも評価され，英国の e- サイエンス計画の一環として，2005 年にマンチェスター大学に国立テキストマイニングセンター（NaCTeM）が設立される．センター設立時には，センター長としてマンチェスター大学教授を兼任し，東京大学退職の 2011 年まで兼任を続けることとなった．東京大学では基盤技術の研究を行い，MIB（Manchester Interdisciplinary Bio-Centre）に埋め込まれた NaCTeM では，生命科学者という実ユーザと付き合う分業が可能となった．

NaCTeMは，ロボットサイエンティストの提唱者で

ある R. King 教授（マンチェスター大学）とも協力し，現在，米国 DARPA の Big Mechanism のプロジェクトでの Deep Reading のチームを構成している（図 5）．

15．マイクロソフト研究所北京（2011 ～ 15 年）

2011年に 5 年間の特別推進研究が終了し，残り 2 年の在職期間を考える必要があった．NaCTeM でのバイオ NLP 研究を経験して，これからの言語処理研究では，実際のユーザ集団を見据えて具体的な問題を解決していく必要があると感じていた．また，日本の大学でのグループは小規模で，単独でアメリカやヨーロッパの研究チームと競争するのは難しい．私の場合，東京大学在職期間 16 年の最初の 1 年を除く 15 年間，年間 1 億円程度のプロジェクトを実施でき，比較的大きなグループを組織できていた．ただ，残り 2 年間，それまでの研究も一段落し，このようなグループを維持するのは難しいという実感があった．最後となった特別推進研究のプロジェクト期間は，それまでは基礎研究であった言語処理研究が，Web 検索 1,2-Diacyglycerol intracellular AKT(PKB) ALK Androgen receptor B-Raf BETA-PIX C/EBPbeta C3G CDC42 CDK2 CREB1 Ca('2+) cytosol Cyclic AMP intracellular

Cyclic GMP intracellular EGR1 ERK1/2 ESR1 (nuclear) Elk-1 FMO3 FRS2 GAB1 GRB2 Galectin-1 H-Ras HDBP1 HGF receptor (Met) HIF1A HSP27 IRS-1 IRS-2 JNK(MAPK8-10) K-RAS Lyn MAP2 MEK1/2 MEK4(MAP2K4) MEK6(MAP2K6) MEKK1(MAP3K1)MEKK4(MAP3K4) MLK3(MAP3K11) N-Ras NCK2 (Grb4) NO intracellular Neurofibromin PAK1 PDGF receptor PDLIM3 PDZ-GEF1 PI3K cat class IA

PIP5KI PKC PR (nuclear) Protein kinase G1 Pyk2(FAK2) R-Ras RASGRF2 RIPK4 Rac1 SHP-2 SLC36A1 SOS SP1 Shc Slc39a14 (Zip14) Tiam1 VEGFR-1 alpha-6/beta-4 integrin c-Fos c-Jun c-Kit c-Myc c-Raf-1 cPLA2 p90Rsk

AI for Big Sciences

DARPA Big Mechanism, Robot Scientist

Reading

Assembly

Robot Scientist

-‐

Conducts experiments SHP-2 SHP-2 c-Kit c-Kit HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) IRS-2 IRS-2 GAB1 GAB1 GAB1 GAB1 GAB1 HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) LynLyn PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor ShcShc VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin 1,2-Diacyglycerol intracellular AKT(PKB) ALK Androgen receptor B-Raf BETA-PIX C/EBPbeta C3G CDC42 CDK2 CREB1 Ca('2+) cytosol Cyclic AMP intracellular

Cyclic GMP intracellular EGR1 ERK1/2 ESR1 (nuclear) Elk-1 FMO3 FRS2 GAB1 GRB2 Galectin-1 H-Ras HDBP1 HGF receptor (Met) HIF1A HSP27 IRS-1 IRS-2 JNK(MAPK8-10) K-RAS Lyn MAP2 MEK1/2 MEK4(MAP2K4) MEK6(MAP2K6) MEKK1(MAP3K1)MEKK4(MAP3K4) MLK3(MAP3K11) N-Ras NCK2 (Grb4) NO intracellular Neurofibromin PAK1 PDGF receptor PDLIM3 PDZ-GEF1 PI3K cat class IA

PIP5KI PKC PR (nuclear) Protein kinase G1 Pyk2(FAK2) R-Ras RASGRF2 RIPK4 Rac1 SHP-2 SLC36A1 SOS SP1 Shc Slc39a14 (Zip14) Tiam1 VEGFR-1 alpha-6/beta-4 integrin c-Fos c-Jun c-Kit c-Myc c-Raf-1 cPLA2 p90Rsk 1,2-Diacyglycerol intracellular AKT(PKB) ALK Androgen receptor B-Raf BETA-PIX C/EBPbeta C3G CDC42 CDK2 CREB1 Ca('2+) cytosol Cyclic AMP intracellular

Cyclic GMP intracellular EGR1 ERK1/2 ESR1 (nuclear) Elk-1 FMO3 FRS2 GAB1 GRB2 Galectin-1 H-Ras HDBP1 HGF receptor (Met) HIF1A HSP27 IRS-1 IRS-2 JNK(MAPK8-10) K-RAS Lyn MAP2 MEK1/2 MEK4(MAP2K4) MEK6(MAP2K6) MEKK1(MAP3K1) MEKK4(MAP3K4) MLK3(MAP3K11) N-Ras NCK2 (Grb4) NO intracellular Neurofibromin PAK1 PDGF receptor PDLIM3 PDZ-GEF1 PI3K cat class IA

PIP5KI PKC PR (nuclear) Protein kinase G1 Pyk2(FAK2) R-Ras RASGRF2 RIPK4 Rac1 SHP-2 SLC36A1 SOS SP1 Shc Slc39a14 (Zip14) Tiam1 VEGFR-1 alpha-6/beta-4 integrin c-Fos c-Jun c-Kit c-Myc c-Raf-1 cPLA2 p90Rsk PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) 1,2-Diacyglycerol intracellular 1,2-Diacyglycerol intracellular ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) LynLyn PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor SHP-2 SHP-2 ShcShc VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 VEGFR-1 alpha-6/beta-4 integrin alpha-6/beta-4 integrin c-Kit c-Kit C3G C3G FRS2 FRS2 FRS2 FRS2 FRS2 FRS2 FRS2 FRS2 FRS2 FRS2 FRS2 GRB2 GRB2 IRS-1 IRS-1 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 MAP2 HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) HGF receptor (Met) IRS-2 IRS-2 C3G C3G

Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Cyclic AMP intracellular Galectin-1 Galectin-1 Galectin-1 Galectin-1 NO intracellular NO intracellular NO intracellular NO intracellular NO intracellular Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin Neurofibromin PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PDZ-GEF1 PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA PI3K cat class IA

ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK ALK GAB1 GAB1 GAB1 GAB1 GAB1 GAB1 PDGF receptor PDGF receptor PDGF receptor PDGF receptor PDGF receptor alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin alpha-6/beta-4 integrin MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) MEKK4(MAP3K4) ESR1 (nuclear) ESR1 (nuclear) ESR1 (nuclear) PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PR (nuclear) PDLIM3 PDLIM3 PDLIM3 PDLIM3 PDLIM3 Very large conflicting

(probabilistic) network Smaller (relevant) grounded model Computational hypotheses/ wet lab Experiments controlling states of the network By A. Rzhetsky (U. Chicago)

図 5 DARPA Big Mechanism プロジェクトとロボットサイエンティスト

(8)

との組合せで，急速に実用化されてきた時期でもあった．それまでは抽象論に過ぎなかった言語理解研究も， Wikipediaやより形式化の進んだ大規模知識グラフなどの出現により，実用を目指すスケールアップした研究へと進展していた．生命科学の大規模なデータベースや知識ベースとテキストをつなぐという，我々のバイオ NLPの研究も，この大きな流れの中にあった．このような研究には，大きなリソースが集積する企業の研究所が良いのではないかと思い，マイクロソフト研究所の人に可能性を打診すると，「ぜひに」ということで， 2011年に移籍することにした．マイクロソフト研究所（MSR）北京は，米国レドモンドの MSR に次いで大きな研究所で 200 名の研究者と 300 名近いインターン生を抱えている．また，MSR での研究者間の交流は頻繁で，全世界で 1 000 名超の MSRの研究者がテーマごとに共同して研究を進めている．音声翻訳や最近話題となったチャットエージェントなどの開発は，その大部分が開発セクションに移っている．大規模な知識グラフの構築なども，MSR の研究者が関与はするが，本格的な構築は，人手によるデータ Verificationなどを含めて，Web 検索の開発部門が行っている．これらに関係するエンジニアの数は，MSR の研究者数をはるかに凌駕するものである．テキスト処理の研究グループは，大規模グラフ処理やテキストへの索引付けのグループ，検索結果のランキングを研究する機械学習系のグループとも，緊密な協力を行っている．特定の大規模な環境中でのシステムを研究対象とするために，その成果の一部を切り取って一般化した論文とすることには困難が伴う．これは，GETA や Mu が遭遇したのと同質の問題で MSR の研究者間でしかわかってもらえない成果も多い．しかし，現在の言語処理や人工知能を進めていくうえで，この種の統合した環境が不可欠になってきている． MSR北京は，中国の有力な大学や研究所との研究協力も多く，長期滞在する若手研究者も多い．日本人の研究者では，現在，池内克志，福本雅朗がおられる．私と同時期には，松下康之（画像処理，大阪大学），酒井哲也（情報検索，早稲田大学），矢谷浩司（HCI，東京大学），荒瀬由紀（言語処理，大阪大学），白鳥貴亮（Facebook）がおられ，それぞれに MSR がもつ恵まれたリソースと研究環境を最大限に活用した成果を上げておられた．

16．お　わ　り　に

産業技術総合研究所人工知能研究センター

（2015 年～現在）

2015年 5 月に産業技術総合研究所に人工知能研究センターが設立され，そのセンター長を引き受けることになった．このセンターの研究や活動は，機会を改めて書きたいと思っている．ここでは，個人的な思いを書き留めておきたい．京都大学での対話研究会の時代から，人工知能の学際的な側面は魅力的であった．当時の人工知能，認知科学での学際研究は，理論の実証やそのためのエビデンスがぜい弱であったために，形而上学的な抽象論に終始していた．現在は，これに脳活動の観察が加わったことで，よりダイナミックな科学になる可能性を秘めている．ただ，人工物と自然物の差は大きく，人工知能を実現する技術の研究と人間知能を究明する科学の研究とをどのような距離感で結び付けていくかが重要であろう．現在の人工知能を特徴づけるものに，技術のコモディティ化がある．プログラムやデータのオープン化によっ

大学・企業とも連携した国内最大の

AI研究拠点

Artificial Intelligence Research Base with Industry-‐‑‒Academia cooperation

大学・企業とも連携した国内最大の

AI研究拠点

Artificial Intelligence Research Base with Industry-‐‑‒Academia cooperation

産総研人工知能研究センター

Application Domains 言語理解 Text mining 行動分析 Behavior mining 産業ロボット・自動車 Industrial robots Automobile Application Domains 産小売・流通サービスデザイン Retail Service Design サ Service Design サ健康・生活支援 Health care Living support

社会・ビジネスへの適用

Apply to the real business and society

データ・知識融合型人工知能

Data-‐‑‒Knowledge integration AI

脳型人工知能

Brain architecture AI

知識モデル Knowledge 海馬モデル Hippocampus 基底核モデル Basal ganglia 確率関係モデル Probabilistic relation ベイジアンネット Bayesian net･･････健 Health care Living support 健 Living support ネットワークサービスコミュニケーション Network services Communications 気象情報文献分類 meteorology information Document classification 大脳皮質モデル Cerebral cortex 起業_{, 技術移転} Technology transfer業業技術業術術術移術術術移移移移移転転転転転ベンチャーベンチャ Venture Venture Venture business 企業企業 Companies 技術移転共同研究 Technology transfer Joint research

AI Research and Technology Platform

計画・制御 Planning Control 予測・推薦 Prediction Recommend パターン認識 Pattern recognition AI Research and Technology Platform

企画チームPlanning team ･･･

図５

AI技術の研究開発と実用化の循環

人工知能共通基盤先進中核モジュール標準タスク化・標準データ

AI Platform

図 6　AI 技術の研究開発と実用化の循環

(9)

て，すべて自前でシステムを構築する必要はなくなっている．他人がつくったモジュールやデータを組み合わせることで，非常に素早くシステムが構築できる．この技術やデータのコモディティ化が，技術の加速度的な進展を支えている．個別技術や研究が，それを取り巻くシステム全体に強く依存した GETA や Mu に見られた問題は，かなりの程度解消されている．半面，この流動性の良さは，Cloud 上の人工知能プラットフォームへの囲い込みの反映でもある．日本での研究を活発化させ，人工知能による産業や社会の活性化を図るためには，囲い込みの少ないオープンなプラットフォームの構築が重要になる．センターでは，基礎技術とその社会実証の間にあるオープンなプラットフォームを重視している（図 6）．実ユーザに提供するシステムの構築には，研究の成果である基盤技術とするもの以外に解くべき技術課題が非常に多くある．これは，文解析の基盤技術からバイオ NLP研究に移行した際に実感したことである．プラットフォームを使ってシステム構築を加速し，実世界での問題を解いていくことで新たな研究課題を見つけて定式化していくこと，この研究とその実世界への適用のサイクルを円滑に行うことが，今後の人工知能研究では不可欠だと感じている．現在の人工知能研究は，観察データの収集，シミュレーション技術によるデータ生成，大規模グラフやその探索技術，並列処理など，人工知能以外の計算機技術の進展に支えられている．このような技術が集積した環境をもたないとインパクトのある研究ができない．並列処理や大規模な計算環境でのスケジューリングを専門とする田浦健次郎さん（東京大学）の研究グループとの共同がなければ，生命科学分野の大規模なテキスト集合の処理は不可能であった．マイクロソフトなど，巨大企業がもつ集団としての技術の集積とグループを超えた共同研究の風土を醸成していく必要がある．個人的には，言語処理における計算のコントロール機構に興味がある．コントロールを明示的な規則の系として記述する GETA や Mu の方式は，確率モデルを使った探索処理へと移行した．深層学習では，この探索過程も神経網の計算に埋め込まれていく．記号や構造による定式化が自然に見える意味処理や推論処理も，その計算過程の多くは無意識下での非明示的な処理で実現されている．文解析に見られた表示系と計算過程の二重性が，より広いコンテキスで考えられる．記号や構造による自覚的な処理と並列性が高い無意識下の処理とが，自然に融合されていく期待がある．40 年余りの時を経て，昔，漠然と夢想してきたことが具体的な研究として実現されていく．いま，ワクワクとしている所以である． 2016年 6 月 13 日受理辻井　潤一（正会員）京都大学大学院工学研究科修士課程修了（1973 年）．同年，京都大学助手，助教授を経て英国 UMIST 教授（1988 年）．日本に帰国し，東京大学大学院教授（1995 年）の後，マイクロソフト研究所北京首席研究員（2011 年）を経て，2015 年から現職の産業科学技術総合研究所人工知能研究センターセンター長．この間，マンチェスター大学教授を兼任（2005 ∼ 11 年，2016 年∼）．日本 IBM 科学賞（1988 年），本学会業績賞（2008 年），紫綬褒章（2010 年），大川賞（2015 年）などを受賞．国際機械翻訳協会会長（2003 ∼ 05 年），ACL 会長（2006 年），AFNLP 会長（2007 ∼ 08 年）などを歴任し，2014 年より ICCL 会長．ACL フェロー，情報処理学会フェロー，工学博士（京都大学）．

研究の個人史 ─言語処理，言語理解，人工知能─(<レクチャーシリーズ>つながりが創発するイノベーション〔第8回〕)

1．は じ め に

2．京都大学の卒業研究（1970 ～ 71 年）

3．京都大学坂井研究室（1971 ～ 73 年）

研 究 の 個 人 史

─言語処理，言語理解，人工知能─

A Note on My Own History of Research

─ Natural Language Processing, Natural Language Understanding and AI ─

辻井 潤一

Keywords:

4．長尾研究室と対話研究会 （1973 ～ 88 年）

5．英語のトラウマ，オタワでの Coling

6．フランス，グルノーブル大学（1981 ～ 82 年）

7．独創性ということ

8．Mu プロジェクト（1982 ～ 86 年）

9．英語のトラウマ再び，英国へ

10．UMIST と Eurotra（1988 ～ 95 年）

11．Eurotra7

12．東京大学，三つのプロジェクト

（1995 ～ 2011 年）

13．言語の意味と知識の研究

14．バイオ NLP（2000 年～現在）

15．マイクロソフト研究所北京（2011 ～ 15 年）

AI for Big Sciences

DARPA Big Mechanism, Robot Scientist

Reading

Assembly

Robot Scientist

-­‐

16．お わ り に

産業技術総合研究所人工知能研究センター

（2015 年～現在）

大学・企業とも連携した国内最大の

AI研究拠点

大学・企業とも連携した国内最大の

AI研究拠点

産総研 人工知能研究センター

社会・ビジネスへの適用

図５

AI技術の研究開発と実用化の循環

AI Platform

著 者 紹 介

研究の個人史　─言語処理，言語理解，人工知能─(<レクチャーシリーズ>つながりが創発するイノベーション〔第8回〕)

1．は　じ　め　に

研究の個人史

　─ Natural Language Processing, Natural Language Understanding and AI ─

辻井　潤一

4．長尾研究室と対話研究会　（1973 ～ 88 年）

-‐

16．お　わ　り　に

産総研人工知能研究センター

著　者　紹　介