1. は じ め に
1982年に開始された国家プロジェクトである第五世 代コンピュータプロジェクトは人工知能研究,広くはコ ンピュータサイエンスの日本の地位の向上に大きく貢献 した.プロジェクト開始当時はその分野では日本は欧米 に比べれば後進国であり,おしなべていえば,先進国の 後追いをしている国であった.それをこのプロジェクト は一瞬にして世界の注目を集めることに成功した功績は 極めて大きい.そして,学問的な意味においてはこのプ ロジェクトは成功したといえる.当初の約束どおり,10 年後のプロジェクト終了時には 1 000 台に及ぶ要素マシ ンからなる並列論理型推論専用コンピュータをつくり, その OS と基盤言語はいずれも並列論理型言語という画 期的なコンピュータをつくり上げたのである.そういう 具体的なゴールを達成しただけではなく,論理型プログ ラミング言語と並列推論コンピュータの両方において基 礎的・学術的に大きな貢献をした.日本が世界の研究を リードした数少ない成果の一つといえる [アーカイブ]*1. 本稿では,第五世代コンピュータプロジェクトで行わ れた論理型言語を中心とした知識表現言語研究をきっか けとして知識表現について考察して,知識表現研究のあ るべき姿を模索する.2. 論 理 型 言 語
そもそも,Prolog は言語処理における構文規則を記述 すると,それがそのままその言語の Parser になるとい う画期的なアイディアに基づいて生まれたものである. 文法は言語の(高度な)仕様といえるが,仕様を書くと 入力が仕様を満たすかどうかをチェックする実行プログ ラムになるというのであるから,Prolog が生まれた当時 は,それを知った多くの研究者には新鮮な驚きであった. 筆者も驚いた一人である.典型的なプログラムとして X がリストのメンバであるかどうかを判定するプログラム は以下のように書ける. member(X,[X| _]).member(X,[_| Y]):- member(X, Y).
Xがリストの先頭にあれば真.なければ 2 番目以降を 探し,あれば真.という実に直感と一致するプログラム となっている. 第五世代コンピュータプロジェクトはこの Prolog の 出現による論理型言語への高い関心がある時代の中で始 まった.ソフト面から見れば,並列推論エンジンとして のコンピュータを,OS を含めてすべてのソフトを論理 型言語でつくるという壮大な計画であった.そして,実 際にやってのけたことだけをもってしても素晴らしいこ とといえる. 並列論理型言語 KL1 [KL1] はそのために開発された 核言語であり並列マシンの OS である PRIMOS は KL1 で記述された.KL1 に大きな影響を与えた言語として GHC: Guarded Horn Clause [Ueda 86]をあげること ができる.名前どおり,通常の Prolog の構文の Body の前に Guard と呼ばれるプロセス生成条件節を置く構 造をしている並列論理型言語である.Or 節に置かれた Guard述語は並列に実行され,最初に真になった節の Bodyが実行される.バックトラックはサポートされな いが,データフロー的であるので,並列マシンの OS 記 述という点では効率良く実装できる言語であると高く評 価された. プログラミング言語としての論理型言語は当初は有望 ではなかった.本質的にはインタプリタ系の言語なので 効率が悪い.OS などの基本ソフトは手続き的であるの で,宣言的な論理型言語はそぐわない.この二つは大き
第五世代コンピュータプロジェクトと
知識表現,そして未来
Knowledge Representation Viewed from the Fifth Generation Computer
Systems Project and Its Future
溝口 理一郞
北陸先端科学術大学院大学サービスサイエンス研究センターRiichiro Mizoguchi Research Center for Service Science, Japan Advanced Institute of Science and Technology.
Keywords:
knowledge representation, logic, ontology, Google-proof. 「第五世代コンピュータと人工知能の未来」*1 プロジェクト全体としては成功とはいえないともいわれてい るが,それは本特集とは異なった視点から見ての話である.
な壁であったが,それも Tail recursion をはじめとする 数多くのコンパイル技術,最適化技術の導入によりかな り解決された.
3. 知識表現と推論
3・1 簡 単 な 概 観 パズル,そして論理と定理証明より人工知能研究が始 まったことから,知識表現の研究は論理とともに始まっ たといっても過言ではない.意味ネットワークが生まれ, 自然言語の意味表現などに用いられた.フレームが画像 理解から生まれ,プロダクションシステムがエキスパー トシステムの研究で用いられた.この三つの表現パラダ イムは認知科学との関連も深いことは興味深い.その 一方で,論理にはある厳密さに欠けることから,Woods [Woods 83]や Brachmann [Brachmann 85] などによっ て,知識表現の基礎的,理論的研究が行われた.その後, 理論的なサポートがある意味ネットワークの表現方式が 確立された.エキスパートシステムの隆盛とともにプロ ダクションシステムを中心にした言語が盛んに開発さ れ,同時に常識ベースの構築なども行われた.Prolog の 誕生とともに論理型言語が脚光を浴びた. このような流れと並行して,論理と推論に関する研究は 継続して行われてきている.非単調論理,Circumscription, 時間論理,様相論理,記述論理,defeasible 論理などの多 くの理論が発展してきており,それが現在でも活発な動 きとなっている. 第五世代コンピュータプロジェクト以降は,オントロ ジーが生まれ,内容指向の動きが少しあったが,計算機 処理可能な語彙としての位置付けにとどまり,深いレベ ルで影響を与えるには至っていない.そして,オントロ ジー研究は新しい知識表現を要求するはずであったが, OWL [OWL 02] に代表される現実のオントロジー記述 言語の動向は,知識表現研究として見た場合には見るべ き成果は少ない.事実上,記述論理の研究の延長線上に ある.それ以外では,曖昧さの扱い,ベイズ推論のよう な確率的な表現の問題が新しい動きとして発達した. 3・2 知識表現と論理型言語 Prologを代表とする論理型言語はかなりの高級言語 といえるため,システムの実装だけではなく,知識表 現言語としての役割ももつ点が大きな特徴となってい る.いうまでもなく,宣言型の言語であることから当然 というべきかもしれない.論理型言語は,推論エンジン 付きの知識表現言語であるとみなすことができる.その 考えに基づき,第五世代プロジェクトでは知識表現の問 題は盛んに議論された.注目すべきものとして制約指向 を導入した制約論理プログラミング言語 CIL(Complex Indeterminates Language)[Mukai 85] がある.CIL は 不定値の引数をもつ部分確定項を表現できるデータ構造 をもっていることが特徴である.これにより,論理型言 語の記述力を大幅に向上させることに成功した. 次に大量データを効率的に扱えるようにするために 演繹データベースとの結合した CRL [Yokota 88] があ る.そして,オブジェクト指向言語との結合である.そ れらすべてを統合した言語として,Quixote(キホーテ) [Yasukawa 90]が開発された. 論理型言語を知識表現言語にすることの利点と問題点 をあげよう.利点はいうまでもなく,完全で健全な推論 系がいつも控えていて,安心して推論することができる. そして,多くの研究者が高速化の研究も行っているので, 推論速度も知らないうちに上がっている. 問題点は,実はかなり深刻である.論理は推論のた めにある.表現された知識は,推論に使われて初めて意 味をもつので推論は重要であるが,その前に対象を「表 現」する必要があることを忘れてはならない.表現する には対象と概念レベルが近ければ近いほど容易になる し,正しい表現ができる可能性が高まる.論理は対象表 現にとって最適な概念レベルにあるかと問われると,答 えは「否」となる.法律の推論に適用することを考えれ ば,論理は十分対象と同じレベルにあるということがで きる.その意味で,第五世代コンピュータプロジェクト において応用例の一つとして法的推論が選択されたこと は理にかなっていた [Nitta 92].しかし,逆にいえば, 法的推論のように,論理や推論が第一義である問題以外 にはそれほど適したものではない可能性が示唆される. 第五世代コンピュータで行われた研究成果を知識表現 の立場から見ると,確かに,オブジェクト指向の考えを 導入して,論理だけではない幅広い考察は行われたとい えるが,本質は「推論」にあったといえる. 知識表現は知識を表現して推論することを前提として いることから考えると,知識と推論の二つの観点がある ことがわかる.しかし,知識表現の名前が示唆するとお り,正攻法の研究としては,推論からの発想ではなく, 知識からの発想でなければならないことはある意味で自 明のことである.知識とは何かという問いこそが真っ当 な問いなのではなかろうか? これほど自明なことがこ れまでなされてこなかったことは残念でならない.とは いうものの,これは当時の,いや,知識表現の研究が始 まってから今日までの正統的な考えであるので,第五世 代コンピュータプロジェクトに固有の問題ではない. 人工知能研究者,あるいは情報処理に携わる多くの研 究者は実問題を知らない.その重要性を本当にわかって いる人は少ない.多くの人は,推論からしか知識表現を 見ていないように思われる.残念であるが,この素晴ら しい国家プロジェクトであった第五世代コンピュータプ ロジェクトも,知識表現という観点から見れば同じ問題 を当初より抱えていた.論理では構造を表現できないの でオブジェクト指向を導入するという発想では良い知識 表現の研究になることはないであろう.この問題の解決の処方箋は何か? それは,「知能」 研究一辺倒の姿勢からの決別であろう.人工知能研究で あるから知能の研究が中心課題であることはある意味で 当然である.そして,知能の中の本質は推論にあるので, 論理や推論が研究対象になることも実に自然なことであ る.「人工知能とは」という本誌レクチャーシリーズに 連載中の記事も,多くは知能に関するものであった.し かし,そこでも述べたが [溝口 13],知能は知識がなけ れば役に立たない.この主張は面白いことにほとんどの 人は容易に受け入れる.これに反論する人はほとんどい ない.それにもかかわらず,研究の主眼は推論・論理に 向けられてしまう.一つの根本的な理由は,そこでも述 べたように,知識研究の一般性のなさにあると考えられ るが,実はもう一つ,知識自体に関する深い研究自体の 必要性の認識が甘いのではないかと邪推される.以下に 例をあげて説明する.
4. 推論をサポートする知識表現
4・1 part-of 関係と推論 推論の中で一つの重要な推論規則に推移律がある. part-of関係を例にすると,<A part-of B> and <B part-of C> → <A part-of C> という推論が妥当であるとする規則である.しかし,こ こでは part-of 関係が推移律をもつかどうかが問題にな るにもかかわらず,研究者は part-of 関係自体の検討を 避けてきたように思われる.そして実務者も,すべての part-of関係は推移律を満たすかのごとく誤解して推論 していた. 実際,part-of 関係は推移律を満たすのが当たり前の ように思える. <ピストン part-of エンジン> <エンジン part-of 自動車> ――――――――――――――――――――― <ピストン part-of 自動車> と推論され,確かに推移律が成り立つことが確認される. これには何の疑問もなかろう.しかし,一般にはそうで はない.反例をあげよう. <親指 part-of 教授> <教授 part-of 教授会> ―――――――――――――――――――― <親指 part-of 教授会> これは明らかにおかしい.したがって,part-of 関係の 中には推移律が成り立たない場合があるということであ る. 推移律が確実に満たされる part-of は事実上,functional part-ofといわれる関係だけであり,ほかの種類の part-of ではあやしいものがある.特に,推論連鎖に異種の part-ofが混在するときには満たされる場合は少ない.特に 注目すべきことは,集合とその要素の part-of(member-of)関係である.集合を要素にもつ集合を多重に考えれ ばわかるように,あるものがある集合の要素であるのは 直上の集合に限られるので,member-of 関係の推移律 は基本的に排除されている.実はこれは集合論が抱え る無視できない問題であり,その不都合を取り除くため に,mereological sum(寄せ集め的和)という member-of(part-of)関係で推移律が成り立つ新しい概念が導入 され,それを用いて基礎理論を再構築する試みすらある [藁谷 04].これまで part-of 関係の推論で問題として扱 われてこなかった主な理由は,現実に存在する part-of 関係のほとんどが functional part-of だからであると思 われる. Functional part-ofとは部分が全体に対して何らかの 機能的な貢献をしている関係をいう.エンジンが車の部 分(part)であるのは車の移動に必要な動力を供給する 機能を果たしており,それゆえ,車の部分(部品)と認 定される.このようにいうと,部分が全体に対して機能 的に何の貢献もしていないものなどないのではないかと いう疑問がわくと思われる.確かに,そう言いたくなる くらい functional part-of は主要な part-of 関係であるが, 現実にはほかにいくつかのタイプの part-of 関係がある [Winston 87].以下の例を見てみよう. <エンジン part-of 自動車> <夫 part-of 夫婦> <木 part-of 森> <一切れのパイ part-of パイ> <粘土 part-of 花瓶> 最後の一つ以外は四つとも part-of 関係であることに 異論はないであろう.最後の花瓶の例は日本人としては 「材料 -of」と言いたいところであるが,英語では気にし ないで“Amount of clay is part of a vase”ということ から part-of 関係の一種として扱われる. 最初の例はいうまでもなく functional part-of である. 夫婦の例は夫と妻にはそれぞれの機能があると見ること ができるが,それは後付けの考えであって,夫婦自体の 本質的な意味は,二人の男女が,婚姻関係に基づいて形 成する社会的な構成物であって,夫や妻が何らかの機能 を発揮しているから夫婦という全体物が存在しているの ではない.森は木を部分としてもつが,木が森の部分で あるのは,森に対しては何らかの機能を発揮しているか らではない.それぞれの木の生え方がある程度密集して いるというトポロジカルな理由が本質的である.パイの 例は,かなり特異である.部分と全体が同じカテゴリー
に属する.言い換えると,全体は,部品といえるものは もっていなくて一様な構造をしており,任意の部分は全 体と同じクラスに属するという性質をもつ(普通のもの, 車や机はそうではない).バター,水,一山の砂糖など はこのカテゴリーに属する.そして,最後の花瓶の例は, 粘土は部分というより全体である.花瓶は粘土全体と「同 じ」ものであり,まるで,花瓶は粘土の塊の特殊形のよ うにも見える.このことをオントロジー的に厳密にいえ ば,花瓶は粘土の塊の上に Stack されているといい,二 つの別の実体が同じ時空間を共有して占めるという実に 特異な存在物である. 今,部分を全体から取り除いて何が起こるか見てみよ う.エンジンを自動車から取り除くとエンジンはエンジ ンのままであるが,自動車はもう自動車として機能しな くなり,自動車とはいえないものになる.しかし,残り のものは自動車のようなものとしては存在し続ける.し かし,夫婦から夫を取り除くと,夫はただのおじさんに 戻り,夫婦は崩壊し,消滅してしまう.一方,一本の木 を森から取り除いて別の場所に植え替えても,木は木の ままであるし,森も森のままである.(円形)パイから 一切れを切り取っても,切り取ったものも残ったものも どちらもパイである.花瓶は粘土そのものであるので, 花瓶から粘土は取り除きようがない. このように,部分を取り除いた後にできる結果は,こ れらの四つはすべて異なり,花瓶のように取り除くこと すらできない場合があることがわかる.すなわち,全体─ 部分関係を表す関係は大昔から 1 種類の part-of が用い られてきたが,それが表すべき意味としては少なくとも これらの五つの異なる意味があること,そして,先に述 べた推移律が成り立つ関係と成り立たない関係がある. このように,全体─部分関係は実に多様であるにもかか わらず,それを扱う知識表現技術は未熟のままであると いうことである. このように,この世に存在するほとんどの具体物は部 分から構成されているが,部分が全体に対して果たす役 割は大きく異なり,それに応じて part-of の推移律が成 り立ったり成り立たなかったりする.その意味で,具体 物が実際にはどのようにできているのか,というオント ロジー的な視点から見た考察は,推論において本質的な 情報を与えることはもっと注目されるべきであろう. 4・2 is-a 関係と推論 is-a関係に基づく推論にも問題が存在する.多くの研 究者は,is-a 関係の推論から見た意味は属性の継承関係 と等価と考えていると思われる.それゆえ,<教師 is-a 人間>という表現に何の違和感をもたない.実 際,教師は人間がもつ属性をすべて継承するように見 える.しかし,それは厳密に考えれば,is-a の意味論に おいて<人間 is-a 動物>と完全には同等ではない. is-a関係がもたらすものは単なる属性継承だけではない からである.A さんを人間のインスタンスとする.何ら かの理由で A さんが人間のインスタンスでなくなった場 合(死ぬことを意味するので),同時に動物のインスタ ンスでもなくなる.ところが,<教師 is-a 人間> に従って,教師である A さんが転職して教師でなくなっ た場合,A さんは教師のインスタンスでなくなるが,こ の場合は人間のインスタンスでなくなるとすると A さん は死ぬことになってしまうので,A さんは人間のインス タンスであり続けなければならない.このように,イン スタンスの消滅において二つの is-a 関係は意味が異なる ということがわかる. 多くのオブジェクト指向言語では多重継承が採用され ているが,その問題点を指摘しておく. <会社 is-a 組織> <会社 is-a 人の集まり> はよく見られる is-a 階層である.これに従えば,会社は 人の集まりがもつ性質と組織がもつ性質の両方の性質を 継承する.ここまでは問題ない.実際多くの読者はそれ を支持するであろう.問題はこの次である.is-a 関係の 正しい意味論に従えば,性質の継承は「すべて」である ので,その概念がいつ変化するかという同一性基準も継 承されることになる.人の集まりという概念の identity はそれを構成するメンバが同じである間は同じとみなさ れ,一人でも異なれば別の集まりとみなされる.これも 万人が認めるところである.そして,組織は政府機関に 法人として登録することによって認定される概念である が,これは登録が変更されない間はずっと同じ組織であ り続ける.これも了解であろう.とすると,会社はこの 両方の同一性基準を継承することになるが,そうすると 問題が発生する.会社は毎年,誰かは定年で退職し,新 入社員が入ってくるが,人の集まりとしては毎年異なる ものになるが,組織としてはずっと同じものであり続け る.もちろん会社は構成人員が変化したからといってそ の identity が変化していては成り立たない.したがって, identityに関しては人の集まりから継承したら困ること になる.しかし,すべての is-a 階層表現言語(あるいは 論理)では属性の継承を区別する機能はない.したがっ て一つの概念に関して二つ以上の is-a 関係を結ぶと上述 のようなおかしなことが起こり得る.会社の場合には二 つ目の<会社 is-a 組織>のみが正しいということ になる. もうおわかりと思うが,表現の対象である世界の存 在物を深く理解しておかないと正しい推論ができないと いうことである.深く理解した結果を忠実に表現するた めには対象世界のモデルを正しくつくる必要がある.正 しいモデルができて初めて正しい推論をすることができ る.これが,知識表現においては推論と知識が両輪であ る所以である.
5. 対象モデリングとしての知識表現
5・1 知 識 の 表 現 前章において述べたように,推論という立場から見て も対象の正しいモデルの重要性が明らかになるが,本章 では純粋に対象モデリングの立場から考察してみよう. 論理・推論至上主義の立場をとると,対象モデリングと いう知識表現の根幹となる思想への意識が欠けてしまう という問題が発生するので注意が必要なのである. 知識表現という行為はある表現言語を用いた単なる実 装ではない.それは対象の分析とモデリングを伴う高度 な作業である.モデリングが含まれるがゆえに,知識表 現に関する議論は哲学的な要素も含まれることになり, 問題が難しくなる傾向がある.4 章で少し触れたように, 知識表現におけるモデリングと哲学におけるオントロ ジー研究,すなわち世界のモデリングとの関係性も考慮 しなければならない.それに加えて,専門家が日常活動 で用いている知識の表現を考えればわかるように,知識 を表現するにはまず,対象を理解して,視点を設定して, 知識を抽出して,編集して,組織化する必要がある.そ こで必要となるのが対象モデリングである.良いモデル は知識表現がアドホックになるのを防ぐことに大きく貢 献する. 5・2 分 業 これまで対象のモデリングはその領域の専門家によっ て行われてきた.そして,その結果は,人工知能研究の ほうで開発が終わっている知識表現言語を提供して,そ れを使ってコンピュータ上に実装していただくというの がこれまでの流れであったと理解している.分業である. この分業は一見うまくなされているように見えるが,実 際には問題をはらんでいる.領域の専門家は痒いところ に手が届かない汎用ツールを与えられて,四苦八苦して いる.しかし,それよりも悪いことがある.それは,人 工知能研究者が,領域の専門家が抱えている問題に触れ ることがなく,汎用の知識表現ツールを開発しさえすれ ば十分であると信じ込んでしまうことにある.これは思 考停止の一種といえる.汎用の機能,すなわち推論能力 至上主義に至る必然の道がここに見える.このような, 知識表現における領域の専門家と人工知能研究者との乖 離は,著者が 1995 年頃より訴えてきた「内容指向研究 の勧め」[溝口 96] の主眼点であった. 5・3 シンボルグランディング シンボルグランディングが重要であるといわれる.し かし,それはロボット研究以外では掛け声だけに終わっ てしまう傾向がある.シンボルグランディングが重要で あるのはそれがもつ特定の(ロボットが必要とする)意 味だけではない.それがもつ,思想的,抽象的な意義は, 少し拡大解釈すればかなり大きいことに気付く.そして, その思想は知識表現において,対象モデリングの考えを 明示的に取り込むことによって活かすことができる.い や,活かさなければ知識表現として良いものにならない. 知識表現は対象モデリングを助けるものであるべきだか らである.論理は現実に存在する個物とは相当遠い距離 を置いている.p(x)の p は任意のものであり得るが, それが実世界に近づいて,例えば,human(オブジェク ト),tall(特性),hungry(状態),run(行為)を意味 する場合に起こり得る差異を反映する推論規則を用意し ておくとすれば,それは完全とはほど遠いグランディン グであったとしてもその方向に向かった進展といえる. 5・4 論理は表現の基礎ではない 論理は推論の基礎ではあるが,知識「表現」自体の基 礎ではない.記述論理は表現言語の意味論の確立という 意味でその役割は大きいが,やはり「表現する」ことの 基礎ではない.知識表現の基礎は対象モデリングを支え るオントロジーなのである. 知識表現の歴史を振り返れば,我々は高い表現力・ 健全性・完全性・効率性のトレードオフに苦しみなが ら,合理的な推論体系の構築を目指してきたといえる. circumscription, 非単調論理,様相論理などの理論研究 も,推論の新しい世界を開きつつ,トレードオフの中庸 を見つける試みを積み重ねてきたものといえる.しかし, 高度な推論を追い求めることは推論自体の高度化に過ぎ ず,知識の妥当なモデリング手法を明らかにすることへ の貢献は大きいとはいえない.今,重要なことは,推論 と表現の役割を認識して,両者が補完しあい,協調しつ つ進むべきものなのである.それにもかかわらず,人工 知能研究者の多くは推論偏重の研究を進めてきたという ことができる. 5・5 知識表現とオントロジー 原理原則に戻って考えてみれば,知識はすべて何か に関する知識である.その「何か」は存在物それ自体と 存在物間の関係が中心となる.オントロジー工学は存在 を工学的に議論する学問であるので,存在物に関して多 くを知ることによって知識を深く理解することに貢献す る.具体的にいえば知識表現のために必須の対象理解に 貢献する. オントロジーは存在物自体を,ドメイン固有性を超越 した視点から検討して,存在物としての一般性を際立た せる形で概念化を促進する. しかし,オントロジー自体を知識表現の一種と捉える 立場は危険である.危険であるにもかかわらず,そのよ うに考える研究者は多い. オントロジーとフレームとはどこが違うのか? オントロジーと意味ネットワークとどこが違うのか? という質問をよく受けるが,このことがその一端を表している.フレームや意味ネットワークは知識表現ツール (枠組み)であり,オントロジーはたまたまそれを使っ て書かれるだけである.オントロジーはその記述手段に は依存しない.何を使って表現されても,オントロジー である.オントロジーは表現の「内容」である. オントロジーとは OWL で書いたもの. オントロジーとは対象世界を表現したものである. これも誤った理解の典型といえる.上に述べたように, オントロジーは表現の内容であるので,表現に使われた 言語に依存して定義されるようなものではない. 言語で記述したものは知識表現の一種という言明は間 違いではない.正しいともいえる.しかし,オントロジー の本質属性はそこにはない.オントロジーの本質属性は それが対象世界の根底に横たわっている概念構造を,オ ントロジー理論に則って捉えていることにある.その条 件を満たしていれば,記述に用いた言語にはその価値は 依存しない.極端にいえば表現しなくてもよい.表現し なければ有用なものにはならないが,その本質は失われ ない. 5・6 対象モデリング かなり古い文献になるが,R. Davis [Davis 93] らは知 識表現とは何かという問題に関する興味深い考察を行っ ている.そこでは,知識表現がもつ五つの役割,(1)実 世界に存在するものの代理,(2)オントロジー的基本原 則への合意(Ontological commitment),(3)知的な推 論のための理論,(4)効率的な推論実行のための媒体,(5) 人間のための表現,について詳細な議論が展開されてい る.それらを要約すると以下のようになる.コンピュー タによる処理は何らかの意味で対象のモデルをもってお り,そのモデルを構成する要素は対象世界に存在するも のに対応し,その代理として機能する.知識表現言語は それ固有の表現の枠組みをもっており,その枠になぞら えて対象世界を表現することになる.したがって,ある 表現言語を使用することはその言語作成者がもつオント ロジーに対してコミットすることを意味する.知的な推 論には論理や連想や統計的推論などさまざまなものがあ るが,それは知識表現が前提とする推論方式として規定 される.知識表現力とその推論効率とは常に背反する関 係にあり,問題に応じた最適化は重要である.最後に, 知識表現言語による表現は自然言語による表現とは異な り曖昧さがないので,ある知識を外化したものとしてそ れを人間同士のコミュニケーションにも使うことができ る. 以下では,はじめの二つを取り上げて考察を少し進 めよう.代理はあくまでも現実世界の近似であり,代理 を用いる推論が導く結論は厳密には正しくないことにな る.そこでどの程度正しくないか,何を無視したのか, その理由は何か,近似には統一した正当性の根拠はある のかなどを明らかにしておかなければならない.代理と しての表現を共有・再利用する際にはそのようなモデリ ングの際に用いられた暗黙の前提や仮定を知ることが必 要となる. 一方,意味ネットワーク,プロダクションシステム, フレームなどの知識表現方式はそれぞれ独自の視点で対 象をモデル化することを前提としている.例えば,フレー ムでは物事の典型性を属性の集まりで表現することをお のおの表現の基本原則としている.多様で複雑な実世界 は何らかのガイドは非常に有効である.何を見て,何を 無視するか,どの観点から眺めるか.それをある程度定 めるのが知識表現方式(言語)である. しかし,すべての近似が知識表現方式の選択によっ てなされるわけではない.具体例をあげると,電気回路 を集中定数系で表現するか分布定数系で表現するかとい う問題がある.前者では抵抗やコイルなどの回路部品は 入出力をもつ時間遅れのない一つのブラックボックスと みなされ,回路はそれらのトポロジカルな接続と見るこ とができる.しかし,後者では各回路部品は時間遅れを もち,内部において電磁波が伝搬する空間的な大きさを もった装置とみなされる. これらはすべて,オントロジーの問題であるというこ とができるが,上で述べたオントロジーは,最後の回路 の問題を除いて,通常,オントロジー工学でいうオント ロジーとは少し異なるので注意が必要であろう.Davis がいう知識表現方式のオントロジーは表現言語が課す表 現の「枠」のようなものである.表現対象を見るときの 「見方」に関するオントロジーである.一方,オントロジー 工学でいうオントロジーは見方に依存しない,世界の概 念構造である.このオントロジーは「枠」のような制限 は与えない. 知識表現を論じる際にもう一つ忘れてはならない事柄 に,表現のレベルの問題があるが,本稿では省略する. 興味がある読者は [溝口 03] を参照いただきたい.
6. 知識表現の将来
これまで論じてきたことは,第五世代コンピュータプ ロジェクトの論理型言語をきっかけとした,従来の考え の延長線上の知識表現の議論であった.そこで暗黙の前 提となっていたことは,表現対象が存在していて,それ をモデル化して,コンピュータ上に表現するという素直 な設定である.普通に考えればどこにも問題はないよう に見える.それを超えた何かを求めるとするとそれは何 であろうか? 一つの観点として,すでに表現されているものに注目 して,対象世界の表現の問題自体をスキップするという 考えがある.Web には SNS も blog もすべて含めて,す でに(一応)表現された途方もない量のデータが現実に 存在している.それを有効活用することに注目すると, 現実を表現する問題をスキップしてくれる.テキスト,数値データ,画像,動画が半構造化された形ですでに存 在している.後はそれをいかに処理するかが最大の関心 事と認定でき,実際,あらゆる計算手段を駆使して,新 たな計算手段を創出して,すでに存在するデータ源か ら有用な情報を取り出して活用することは大きな意味を もっている.この立場では,推論(新しい計算方式)重 視が正しい戦略であることは間違いない.しかし本稿で は,従来型の知識表現という課題から見るという立場か らはこれは対象外として議論した. しかし,ここで注意しなければならない問題がある. うっかりすると, 「すでにある Web の情報を有効活用することに注力し よう! 現実のちまちました問題の表現に苦戦するのは 時代遅れですよ」 という主張が出てこないとも限らないからである.実は, すでにそのように考えている研究者が少なからず存在し ていると思われる. この Web の有効活用の問題が必要以上に重要視され ることの副作用が心配なのである.Web という「巨大 データ源に聞く」ことによっていくつかの重要な問題を 解くことができる.その典型が IBM の Watson である. Web上の情報源を最大限に有効活用することとそれに関 する研究の意義は工学として極めて大きいので,どんど ん推進すべきであることはいうまでもない.ここで気を 付けなければならないことは,大量情報源の有効活用を 必要以上に重要視して,従来の正攻法的な手法をないが しろにすることはあってはならないということである. このことは著者がずいぶん昔からいい続けてきたこ とであるが,たまたま,Hector J. Levesque の IJCAI 2013における招待講演録 [Levesque 03] において同じよ うなことを主張しているので少し引用しておく.
We should avoid being overly swayed by what appears to be the most promising approach of the day.
と警告した後,Serial silver bulletism と命名して, The tendency to believe in a silver bullet for AI, coupled with the belief that previous beliefs about silver bullets were hopelessly naive.
と批判している.これは当たっている.この考え方をす る人が多いので*2,不必要なまでに新しい解決策が偏重 され,行き過ぎたブームが起こり,学問・技術の健全な 進歩が阻害される. 彼はそれに加えて,自然言語処理を例にとって,Winograd schema questionsを援用し次のような例題を多数あげ て議論している.
Joan made sure to thank Susan for all the help she had given. Who had given the help? _ Joan
_ Susan □
Joan made sure to thank Susan for all the help she had received. Who had received the help? _ Joan □ _ Susan その趣旨は,Google-proof*3な自然言語理解という, 同研究における本流の姿勢を見失わないようにという警 鐘を鳴らすことにある.実際,上のような質問は Google に聞いても答えは得られず,自然言語理解の本来の姿で ある,言葉の意味を理解して初めて正しく解答すること ができる問いである. Levesqueは多少 Google-proof に重点を置きすぎてい る嫌いがある.その点では著者はそれほど先鋭的な立場 はとっていない.Google(Web)の活用は少し前に述べ たように,工学として,一つの重要な課題であるので今 後推進すべきである.問題はバランスだけである.従来 からある「わかる」という人工知能の本流の研究を阻害 してはならない.両者はともに協調的に発展すべきもの である. 蛇足になるかもしれないが,知識表現研究において, 推論や論理の研究をやめてオントロジーの研究をしよう と主張しているのでは決してない.オントロジーなしの 知識表現研究の危うさを指摘しているだけである.知識 表現研究においては,推論・論理とオントロジーは車の 両輪である.両方の研究を適切なバランスのもとで行う ことによって知識表現研究は健全な進展を見せると信じ ている.
◇ 参 考 文 献 ◇
[アーカイブ ] http://www.jipdec.or.jp/archives/icot/ ARCHIVE/HomePage-J.html[Brachmann 83] Brachman, R. J.: What IS-A is and isn’t, an analysis of taxonomic links in semantic networks, IEEE
Computer, Vol. 16, No. 10, pp. 30-36(Oct. 1983)
[Davis 92] Davis, R., Shrobe, H. and Szolovits, P.: What is a knowledge representation?, AI Magazine, Vol. 14, No. 1, pp. 17-33(1993)
[KL 1] http://www.jipdec.or.jp/archives/icot/ ARCHIVE/Museum/FGCS/FGCS92jp-out/92jOUT2.pdf [Levesque 03] IJCAI 2013講演録,http://www.cs.toronto.
edu/~hector/Papers/ijcai-13-paper.pdf [溝口 96] 溝口理一郎 : 形式と内容─内容指向人工知能研究の勧め, 人工知能学会誌,Vol. 11, No. 1, pp. 50-59(1996) [溝口 03] 溝口理一郎,池田 満,來村徳信:対象 モデリングの視 点から見た知識表現,人工知能学会誌,Vol. 18, No. 2, pp. 183-192(2003) [溝口 13] 溝口理一郎:人工知能とは,人工知能学会誌,Vol. 28, *2 特にアメリカでそれが顕著に見られる. *3 これは water-proof(防水)の意味で使われている.
No. 3, pp. 486-595(2013)
[Mukai 85] Mukai, K. and Yasukawa, H.: Complex indeterminates in Prolog and its application to discourse models, New
Generation Computing, Vol. 3, No. 4, pp. 441-466(1985) [Nitta 92] Nitta, K., Ohtake, Y., Maeda, S. Ono, M. Ohsaki, H.
and Sakane, K.: HELIC-II, A legal reasoning system on the parallel inference machine, Proc. Int. Conf. of Fifth Generation
Computer Systems, pp. 1115-1124, ICTO, Tokyo(1992) [OWL 02] Web Ontology Language (OWL) Reference Version
1.0, W3C Working Draft 12 November 2002, http://www. w3.org/TR/2002/WD-owl-ref-20021112/
[Ueda 86] Ueda, K.: Guarded horn clauses, Logic Programming ’86, Wada, E. Ed., Lecture Notes in Computer Science 221, pp.168-1179, Springer(1986)
[Yasukawa 90] Yasukawa H. and Yokota, K.: Labeled Graphs as Semantics of Objects, Technical Report, TR-600, ICOT(1990) [Yokota 88] Yokota, K., Kawamura, M. and Kanaegami, A.: Overview of the knowledge based management system (KAPA), Proc. Int. Conf. on 5th Generation Computer Systems,
Tokyo, pp.252-262(1988)
[藁谷 04] 藁谷敏晴:IS-A 関係の論理システムとしてのオントロ ジー,人工知能学会人工知能基本問題研究会資料,Vol. 56, pp. 13-18(2004)
[Winston 87] Winston, M. E., Chaffin, R. and Herrmann, A.: Ataxonomy of part-whole relations, Cognitive Science, Vol. 11, pp. 417-444(1987)
[Woods 75] Woods, W. A.: What’s in a link?: Foundations for semantic networks, Bobrow, D. G., et al., Eds., Representation
and Understanding, pp.35-82, Academic Press, New York
(1975) 2014年 1 月 26 日 受理 溝口 理一郎(正会員,フェロー) 1977年大阪大学大学院基礎工学研究科博士課程修 了.大阪大学産業科学研究所助手,助教授,教授を 経て,2012 年 10 月より北陸先端科学技術大学院 大学サービスサイエンス研究センター教授.工学博 士.音声の認識・理解,エキスパートシステム,知 的学習支援システム,オントロジー工学の研究に従 事.1985 年 Pattern Recognition Society 論文賞, 1988年電子情報通信学会論文賞,1996 年本学会創立 10 周年記念論文賞, 1999年,2006 年 ICCE Best paper Awards,2005 年大川出版賞(オン トロジー工学,オーム社),2006 年本学会論文賞,2009 年本学会功績賞, 2010年教育システム情報学会論文賞,2013 年 LOD チャレンジ 2012 ラ イフサイエンス賞受賞.本会編集委員長,教育システム情報学会編集委 員長,本学会会長,Intl. AI in Education(IAIED)Soc. President, APC of AACE President,Semantic Web Science Assoc. Vice-President, J. of Web Semantics Editors-in-Chiefを歴任.現在,IEEE TLT と ACM TiiS の Associate エディタ.