• 検索結果がありません。

Algorithmic Learning Theory ofFormal Languages and its Applications

N/A
N/A
Protected

Academic year: 2021

シェア "Algorithmic Learning Theory ofFormal Languages and its Applications"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

博 士 ( 工 学 ) 高 田 裕 志

学 位 論 文 題 名

    Algorithmic Learning Theory of Formal Languages and its Applications

( 形 式 言 語 の 計 算 論 的 学 習理 論 と その 応 用 )

    学位論文内容の要旨

  機械学習,特に帰納的学習は,人工知能の研究において重要な課題のひとっである。本研究で は,具体例と質問から形式言語を帰納的に学習する問題を,理論と応用のふたっの観点から考察 する。形式言語は,プログラミング言語の設計やオートマトンなどの制御システムの設計などの 計算機科学の基礎をなす概念であり,形式言語の機械学習の方法を明らかにすることによって,

プログラミング自動合成やシステ厶自動設計などの能カをもつ知的システムを構築することが可 能となる。本研究は,(1)形式言語の効率的で実用的な学習方法に関する新しい理論的結果の提 供 , (2) 学 習 ア ル ゴ リ ズ ム の 実 用 的 な 応 用 例 の 提 供 , の2点 を 目 的 と す る 。   形 式言 語 の 学 習と し て は, 線形(linear)言語, 等行列 (equal matrix)言 語,半線 形 (semilinear)集合の 学習問題 を理論的 に考察 し,新し い学習 方法と結果を示した。まず,文 脈自由言語のサブクラスである線形言語の学習に対して,新しい学習方法を提案した。文法の導 出を制御集合という概念を用いることによって,線形言語の学習問題は正則言語の学習問題と関 係づけられる。すなわち,任意の線形言語は,非終端記号をひとっしか持たない文法(これを骨 格(skeleton)文法とよぷ)の導出を,正則な制御集合で制御することによって生成されること を示し,この事実から,線形文法は,骨格文法とその正則制御集合を同定することによって学習 することができることを明らかにした。これにより,制御集合にもとづく学習方法を提案し,決 定性有限オートマトンを学習する任意のアルゴリズムを用いて,学習アルゴリズムを構成するこ と のでき る線形文法のふたっのサブクラス,even線形文法と括弧付線形文法を明らかにした。

したがって,これらのサブクラスに対しては,従来の決定性有限オートマトンの効率良い学習ア ルゴリズムを活用することができる。

  また,並列書き換えシステムのひとっである等行列文法の学習も,制御集合によって正則言語 の学習問題と関係づけられることを示した。線形文法の場合と同様の制御集合による学習方法に よって,等行列文法に対しても,決定性有限オートマトンの任意の学習アルゴリズムを用いて,

    −128―

(2)

学習アル ゴリズ ムを構成することのできるふたっのサブクラス,even等行列文法と構造化等行 列文法を明らかにした。線形言語と等行列言語は正則言語よりも上位の言語クラス,すなわち,

正則言語を真に包含するクラスであり,制御集合を用いることによって,従来よく研究されてい た決定性オートマトンの学習方法は,正則言語よりも上位の言語クラスである線形言語,等行列 言語にも適用可能であることを明らかにした。

  次に,並列計算モデルの学習問題に焦点をあて,等行列文字や可換文法,ペトリネットなどの 並列計算 モデル の意味論的な基礎となる半線形集合の学習問題を考察した。線形(linear)集合 とは,有限の基底から生成される非負整数上の部分半群であり,半線形集合とは,線形集合の有 限和である。まず,線形集合は正の具体例だけから学習可能であるのに対し,半線形集合は正の 具体例だ けから は学習できないことを明らかにした。そして,線形集合の所属性判定問題がNP 完全であることを示し,この事実をもとに,具体例から効率良く学習するアルゴリズムを構築す ることは,線形集合に対してさえも計算量において難しいことを明らかにした。そこで,部分性 と包含性に関する質問を用いて,半線形集合のいくっかのサブクラス,特に線形集合を効率良く 学習するアルゴリズムを示した。これらの結果や学習アルゴリズムは,等行列文法,可換文法お よびペトリネットの学習問題にも適用可能である。

  これらの形式言語の学習に関する理論的結果は,さまざまな計算モデル,特に並列計算モデル の学習問題に,いくっかの肯定的・否定的な結果とともに,効率の良い実用的な学習アルゴリズ ムの構成法を与える。

  理論的に解明された学習アルゴリズムの実用的な応用として,図形言語の学習と文法指導型構 造工ディタのカスタマイズのふたっの応用例を考察した。図形言語は,統語的パターン認識で用 いられる ,ディ ジタル図 形言語と 鎖状コ ード(chaincode)図形言語のふたっのタイプの言語 を考察した。どちらのタイプの言語も等行列文法によって効果的・効率的に表現可能であり,等 行列文法の学習に関する結果と学習アルゴリズムを用いて,効率良く学習可能な図形の例を示し た。たとえば,ディジタル表現された数字や鎖状コードで表現された長方形などの図形は,等行 列文法の学習アルゴリズムを用いて,効率良く学習可能である。また,複数の概念からなる図形 の集合は,等行列文法で表現した場合,正の具体例だけから学習できないことを示すことができ た。

  また,文脈自由文法の学習アルゴリズムを用いて,文法指導型構造工ディタをカスタマイズす る方法を 示した 。文法指導型構造工ディタでは,プログラムなどのテキストに導出木を割り当 て,割り当てられた導出木にしたがって編集を行う。したがって,ユーザは文法的に正しい編集 のみが許され,編集されたプログラムには文法上の誤りはない。しかし,この利点も,導出木を,

    ―129ー

(3)

割り当てる文法が,ユーザにとって編集しやすいものである場合にのみ有効であり,そうでない 場合には,逆に欠点となってしまう。たとえば,コン パイラなどで主に用いられるLR(た)文 法などを,導出木割り当てのための文法として用いた場合には,簡単な算術式に対しても,ユー ザにとって非常に編集しにくい編集構造を割り当ててしまう。また,プリティプリントが導出木 にしたがって行われている場合には,ユーザにとって非常に読みにくい表示となってしまう。こ のような場合,従来の文法指導型構造工ディタでは,ユーザ自身が文法をカスタマイズする必要 があったが,正確に行うのには,文法に関する専門知識を必要とし,非常に困難であった。そこ で,文脈自由文法の学習アルゴリズムを用いて,ユーザと対話的に具体例と質問から文法を効率 良く カス タマ イズ する 方法 を提 案し た。 そし て,EMACS工ディ夕上に,学習機能をもつ文法 指導 型構 造エ ディ タACEを開 発し た。ACEでは ,文 法 の専 門知 識が なく ても,望ましい編集 構造をもつ具体例を作成し,それをACEに与えることによって,編集構造を規定す る文法を簡 単にカスタマイズすることが可能である。また,ACEを用いて,新しいプログラミ ング言語の 文法を,対話的に設計することも可能である。

  最後に,本論文は,線形言語,等行列言語および半線形集合に対して,効率的で実用的な新し い学習方法を明らかにした。また,図形言語の学習と文法指導型構造エディタのカスタマイズの ふたっの応用例を示し,形式言語の学習アルゴリズムが知的システム構築に有効であることを明 らかにした。

学位論 文審査の要旨 主 査    教 授    宮 本 衛 市 副 査    教 授    伊 達    惇 副 査    教 授    嘉 数 侑 昇 副査    助教授    赤間    清

  具体的事実から規則性を獲得する帰納的学習のアルゴリズムを開発することは,環境の変化に 柔 軟 に 対 応 し た 行 動 を す る 知 的 シ ス テ ム を 構 築 す る た め の 重 要 な 研 究 課 題 で あ る 。   本論文では,具体例から形式言語を帰納的に学習する問題を,理論と応用のふたっの観点から 考察し,形式言語の学習アルゴリズムを用いて知的シス テムを構築する方法を検討している。

  本論文では,はじめに,正則言語よりも上位の言語ク ラスである線形(linear)言語,等行列     ‑ 130 ‑

(4)

(equal matrix)言 語 の 学 習 問 題 を 理 論 的 に 考 察 し , 新 しい 学習 アル ゴリ ズム を提 案し てい る。そのアルゴ リズムの基礎となる考え方は,文法の導出を制御する制 御集合という概念を用い る こと によ って,線形言語,等行列言語の学習問題を正則制御 集合を発見する問題を含む3っの 部分問題に分割 して解くことである。このうち正則制御集合を発見する 問題は,従来からよく研 究されていた決 定性有限オートマトンの学習方法を利用することが可能 である。この方法で多項 式 時間 学習 可能 な文 法ク ラス を 検討 した 結果 ,線 形文 法の ふた っのサブクラス(even線形 文法 と 括弧 付線 形文法),および等行列文法のふたっのサブクラス(even等行列文法と構造化等 行列 文法)に対する 学習アルゴリズムを提案している。

  次に,並列計 算モデルの学習問題に焦点をあて,等行列文法や可換文 法,ペトリネットなどの 並列計算モデル の意味論的な基礎となる半線形集合の学習問題を考察し ている。まず,半線形集 合の真部分クラ スである線形集合が正の具体例だけから学習可能である のに対し,半線形集合は 正の具体例だけ からでは学習できないことを明らかにしている。そして ,線形集合の所属性判定 問 題がNP完 全で ある こと を示 し ,こ の事 実を もと に, 具体 例か ら効 率良 く学 習す るア ル ゴリ ズ ムを 構築 する こと は, 線形 集 合に 対してさえも計算量の点から難しいことを示している 。ま た,部分性と包 含性に関する質問を用いて,半線形集合のいくっかのサ ブクラス,特に線形集合 を効率良く学習 するアルゴリズムを与えている。さらに,半線形集合に 対するこれらの知見や学 習アルゴリズム を拡張して,等行列文法,可換文法およびぺトリネット の学習アルゴリズムを提 案している。

  本論文では, 理論的に検討した学習アルゴリズムの実用的な応用とし て,図形言語の学習と文 法指導型構造エ ディタのカスタマイズのふたっの応用例を考察している 。図形言語としては,統 語 的パ ター ン認 識で 用い られ る ,デ ィジ タル 図形 言語 と鎖 状コ ード(chain code)図形 言 語の ふたっのタイプ の言語にっいて考察している。これらの図形言語の具体 例にっいて考察し,等行 列文法によって 効果的・効率的に表現可能であり,等行列文法の学習に 関する結果と学習アルゴ リズムを用いて ,効率良く学習可能ナょ図形は何かを検討している。

  また,文脈自 由文法の学習アルゴリズムを用いて,具体例と質問から ユーザと対話的に文法指 導 型 構 造 エ デ ィ タ を カ ス タ マイ ズす る方 法を 示し てい る。 そし て,EMACSエデ ィタ 上に ,学 習 機 能 を も つ 文 法 指 導 型 構 造 エ デ ィ 夕ACEを 開 発 し て いる 。ACEは, ユー ザが 望ま しい 編集 構 造を もつ 具体 例を 作成 し, そ れをACEに与 える こと によ っ て,ユーザが文法の専門知識 を持 た なく ても ,編 集構 造を 規定 す る文 法を 簡単 にカ スタ マイ ズで きる エデ ィタ にな って い る。

    これを要す るに,本論文は,形式言語のいくっかのクラスに対する新しい帰納的学習アルゴリ ズムを提案し, それらのアリゴリズムを実際に適用したシステムを開発して有効性を確認し,学I     ―131−

(5)

,習アリゴリズムを用いて知的システムを構築するための有益な知見を得ており,情報工学の進歩 に貢献するところ大なるものがある

  よ っ て 著 者 は 博 士 ( 工 学 ) の 学 位 を 授 与 さ れ る 資 格 あ る も の と 認 め る 。

‑ 132

参照

関連したドキュメント

[r]

本節では本研究で実際にスレッドのトレースを行うた めに用いた Linux ftrace 及び ftrace を利用する Android Systrace について説明する.. 2.1

チューリング機械の原論文 [14]

0.1uF のポリプロピレン・コンデンサと 10uF を並列に配置した 100M

『国民経済計算年報』から「国内家計最終消費支出」と「家計国民可処分 所得」の 1970 年〜 1996 年の年次データ (

[r]

この場合,波浪変形計算モデルと流れ場計算モデルの2つを用いて,図 2-38

処理対象水に海水由来の塩分が含まれており,腐食