• 検索結果がありません。

博士(工学)侖 文偉 学位論文題名

N/A
N/A
Protected

Academic year: 2021

シェア "博士(工学)侖 文偉 学位論文題名"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

     博士(工学)侖   文偉 学位論文題名

Studies on Inductive Learning Theories for Real World Computing

(実世界計算のための帰納的学習理論に関する研究)

学位論文内容の要旨

  現在,情報処理 に関する研究領域の大きな関 心のーっはいかに実世界の 種々の問題に対して,

情報処理を実行す るか,すなわち,実世界計算 (Real World Computing: RWC)問題である.ここ で,情報処理に要 求される機能は時変性,あい まいさ,雑音などの不確定 性を含む問題の解決機 能で あ り, その メカ ニズ ム の展 開が 急務 で ある .RWCは 通商産業省の 大型研究プロジェクトと して 研 究遂行 中の課題であり,第6世代コ ンピュータの到達目標と位置 付けられている.従来,

RWCの問 題に 対 して は, 適応 と学 習 の機 能を 有す る情 報 処理法が有効 とされ,文部省重点領域 研究などにおいて も,特定のロボット制御問題 や組み合わせ最適化の問題 などに対してその可能 性が示されつっあ る.しかしながら,実世界に おける問題のクラスは,制 御目標や最適化対象が 陽に記述されない 場合がより一般的であり,こ れらに対しては,まだ有効 な方法論の提案はなさ れていないのが現 状である.

  本研究は実世界 計算の問題に対して,情報処 理機構そのものが試行錯誤 と経験により,問題解 決の方針を自律的 に発見するような新しい方法 論を模索したものであり, これを基にした適応的 帰納学習理論を構 築し,種々の応用問題への適 用を通して,構築した理論 の有用性と妥当性を検 証し た 成果 をま とめ たも の であ る, 論文 は3章よ り構 成 されており, 以下にその概略を示す.

  1章 は本 研 究の 背景 ,目 的, 課 題に つい て論 じ, 帰 納学 習をRWCにお いて 適用 可能とする ための原理を導い ている.そこでは,まず,実世界計算を実現する際の帰納学習法の有用性及び,

妥当性を論じてい る.次に,従来の帰納学習の 内包する三つの問題として ,対象環境の理想化に 起因する実世界問 題への適用の困難性,数理論 理学における記号表現系に 立脚する故の柔軟性の 欠如,及ぴ,教師 に依存した学習を挙げ,従来 の帰納学習に欠落する機能 として「適応」機能に 着目 し て,RWCに適 用可 能な 帰納 学 習法 構築 にお ける 「 適応」をキ― ワ―ドとして導かれた六 つの 基 本原理 (6原理)を提案している. すなわち,経験からの学習に は,1.柔軟性,2.自律 性 ,3. 反 射 性 ,4. 省 資 源 性 ,5. 学 習 性 ,6. 分 散 性 が 不 可 欠 で ある との6原 理で あ る.

  2章 は 前 章 に 提 案 し た6原 理 に 基 づ ぃ たRWCの た め の 帰 納 学 習 法の 実現 につ いて 論 じて いる . 本章は 以下に示す7節から構成され ,それぞれ,具体的な帰納学 習法における問題点を克 服した方法論の提 案を行っている.

  1節 では, まず「実例からの学習」を 実現した代表的な学習法であ る実例に含まれる情報の 期待 値 を表 わす 情報 エン ト ロピ ー量に基 づき,学習すべき概念を表現 する決定木を獲得する手 法 と し て よ く 知 られ るID3RWCへの 適 用問 題を 論じ てい る .通 常のID3は過 分叉 問題 と 適応 性の 欠 如の ため に, 直接RWCにこ れ を導 入す るこ とは 不 可能となるこ とを指摘した上で,本問 題領 域 にお いて 上述 の六 つ の原 理を 具現 化 する ため の新 しい 方 法論GA‑BDTを 提案 している.

GA‑BDTは適応探索 手法である遺伝アルゴリズム を用い,情報量基準に基づ く評価関数によって,

二元決定木空間探 索を行い,有効な決定木を生 成する手法であることから ,生成された決定木に よっ て 記述さ れたルール群は第3章で示さ れるように実世界に適用可能 であり,本手法が目的と する帰納学習であ ると主張している.

(2)

  第2節では,マルチエージ ェント系を構成する多種エ ージェント群が互いに独立し た多様な行 動 バターンを要求されるよ り複雑な環境に対して適応可 能な帰納学習法を6原理に基 づき,提案 し てい る. すな わ ち, 遺伝 的プログラミング(GP)を 導入することで,環境適応性 を保証しつ つ,島モデル を導入することでエ―ジェ ント間の共進化を実現し,各 行動バ夕一ンの多様性を実 現 し て い る . ま た , こ の よ う な 問 題 に 対 す る 評 価 法 に つ い て も 詳 細 に 検 討 さ れ て いる ,   第3節 か ら第7節 まで は, 実環 境へ の 適応 が最 も期待 される強化学習法を対象と し,6原理に 基 づぃた帰納学習法を提案 している.それに際し,まず 強化学習を実環境に適用す る場合6原理 に対して,収 束性及び,莫大なメモリ資 源の必要性とぃう問題を持つ ことが導出されている.次 に,これらニ つの問題点に対して,ラベ リングに基づく経験の再利用 法とグル―ピング法を提案 することによ り,これらの問題解決が可 能であることを明らかにして いる,さらに,従来の強化 学習において は特に困難な問題とされて いるエ―ジェント間の相互作 用を,従来のエ―ジェント による学習と ぃう立場から離れ,「場に よる学習」とぃう発想の転換 を行うことにより,実現し ている.これ により,エ―ジェントの情 報処理能カの向上,行動の最 適化,協調行動の実現が可 能であること を論じている.また,最も 困難な課題であると考えられ る自己評価型学習法である AHC強化 学 習構 造の 問題 点 を分析し,kohonenネット, 統計的な探索法,及びHeuristics導入に よ るgrament推 測に よっ て ,実 問題 に適 用で き る強 化学 習分 類シ ス テム を提 案し て いる ,   第3章 は ,6節 か ら構 成さ れ, 各節 に おい て第2章に 提案した方法論をさまざまな 工学的応用 問題に実際に 適用した場合の有用性を検 証することにより,提案原理 とそれに基づく方法論を検 証している.

  第1節では,提案したGA.BI)T手法を交通制御問題のモード選択(modeselection)に適用してい る ,交通制御問題は一般に 最適化対象が明示されておら ず,解決困難な課題である が,GA・BDT 法 によ る適 応的 に 効率 的二 元決定木の生成により本問 題が解決可能であることを明 らかにして いる.

  第2節では,提案手法によ り完全自動化工場の生産計 画を各作業ロボットがbottom‐up的に実 現し得ること を明らかにしている.この ような問題において,各ロボ ットの最適化対象は明示さ れておらず, ロボットの行動方針をGPに よって生成し,タスクの完成 度や消費したエネルギー.

経過時間など の要素も総合的に評価する ことで,柔軟かつ適応性の高 い行動パターンが生成でき ることを論じ ている.

  第3節 と 第4節 で は, 経路 計画 の典 型 的問 題と して,3自由度の棒の問題と多リン クロボット の制御問題を ,ラベリングとグルーピン グに基づく強化学習法によっ て,より少ないメモりで,

高速に最適経 路の探索ができ,解決でき ることが示されている.

  第5節では,提案した学習 的場モデルを典型的な分散 処理問題の追跡問題,多自由 度リンクの 制御問題及び 浮遊ロボットヘ適用してい る.これによって,学習適応 場モデルの分散情報処理能 カが究明され ている.

  第6節 で は, 提案 した 強 化学習分類システムによって ,筋電(EMG)義手制御が実 現されてい る .ここでは,筋電信号の 時間的,空間的に相関特性を 利用した6原理に基づく強化 学習法の適 用 に よ っ て , 複 雑 な , 時 変 的 な 筋 電 信 号 を 認 識 で き る こ と が 明 ら か に さ れ て い る ,   第4章 は 結論 を述 べた も ので ある .す なわ ち ,本 論文 は,RWCの問 題に 適用可能 な帰納学習 に おける6原理を提案し,経 路計画や生産計画問題等へ の計算機実験を通して,提案 した理論に 基づぃて構築 された情報処理機構それ自 体が試行錯誤と経験により, 最適な解を自律的に生成可 能であること ,さらに,他の問題領域分 野としての筋電義手の制御問 題と浮遊ロボットの運動制 御問題への応 用実験において,提案した 理論が制御目標や最適化対象 が陽に記述されないような 問 題に 対し ても 問 題解 決の 方針を自律的に発見するこ とのできる方法論であること を明らかに した.

18―

(3)

学位 論文審査の要旨 主査

副査 副査 副査 副査

教 授

  

嘉 教 授

  

大 教 授

  

宮 教 授

  

和 助教授

  

数 侑 昇 内    東 本 衛 市 田 充 雄 井 浩 史

学 位 論 文 題 名

Studies on Inductive Learning Theories for Real World Computing

(実世界計算のための帰納的学習理論に関する研究)

  

近年 ,実 世界 の種々 の問 題の 情報処 理に 関す る研 究が実 世界 計算 (Real World

Computing: RWC

)問題として盛んに行われている。実世界での情報処理に要求される機 能は時変性、あいまいさ、雑音などの不確定性を含む問題の解決機能であり、そのメカニ ズムの展開が急務である。従来、RWC の問題に対しては、適応と学習の機能を有する情 報処理法が有効とされ、たとえば特定の口ボット制御問題や組み合わせ最適化の問題など に対してその可能性が示されつっあるがそれらは問題設定自体明示的に記述可能なものに 限定した議論展開が主であった。しかしながら、実世界における問題のクラス、制御目標 や最適化対象が陽に記述されない場合がより一般的でありこれらに対してはまだ有効な方 法論の提案はなされていないのが現状であり、今後の発展が待たれている状況にある。

  

本論文はこのような現況にある実世界計算の問題について、情報処理機構そのものが試 行錯誤と経験により、問題解決の方針を自律的に発見するような新しい方法論の開発を目 的としたものであり、これを基にした適応的帰納学習理論を構築し、種々の応用問題への 適用を通して構築した理論の有用性と妥当性を検証した成果をまとめたものである。以下 に本研究で得られた6 つの成果とその評価を記す。

  

第一は、従来の帰納学習に欠落する機能として「適応」機能に着目して、RWC に適用 可能な帰納学習法構築における「適応」をキ―ウードとして導かれた六つの基本原理(6 原理)を明らかにしている。すなわち、経験からの学習には、1 .柔軟性、2. 自律性、

3.

反射性、4. 省資源性、5. 学習性、6. 分散性が不可欠であるとの6 原理である。ここ に示された「適応」をキィワードとした対象問題のもつ性質の分析と問題解決手法に必要 とされる要求機能の基本設計は以下に展開される本研究の根幹をなすものであり、RWC の ため の機 能学 習法の 概念 設計 ヘ多く の知 見を 提供 する役 割を 担う ものである。

  

第二に、実例に含まれる情報の期待値を表わす情報工ントロピー量に基づくID3 問題領

域において新しい方法論GA 一BDT を提案している。GAI −BDT は適応探索手法であるGA を

(4)

用い、情報量基準に基づく評価関数によって、二元決定木空間探索を行い有効な決定木を 生 成 す る 手 法で こ の ク ラ ス で は 強カ なRWC ソ ール となり うる 。提 案し たGA 一BDT 手法 は 交通制御問題のモード選択に適用し有用な結果を得ている。

  

第三に、マルチエ―ジェント系を構成する多種エージェント群が互いに独立した多様な 行動 パタ ーン を要 求さ れる複 雑な 環境 問題 クラ スに 対し 、GP を導入して環境適応性を保 証しつつ、さらに島モデルを導入することでエージェント間の共進化を実現し各行動パ夕

―ンの多様性を実現する手法を提案している。提案手法により完全自動化工場の生産計画 を 各 作 業 ロ ボ ッ ト が

bottom

up

的 に 作 成 可 能 で あ る こ と を 明 ら か に し て い る 。

  

第四に、実環境への適応が最も期待される強化学習法をクラスとした場合、そのネック となっている収束性及び莫大なメモリ資源の必要性とぃう問題に対して、ラベリングに基 づく経験の再利用法とグ´レーピング法を提案している。典型的問題としてる経路決定問題 を、ラベリングとグルーピングに基づく強化学習法によって、より少ないメモりで、高速 に最適経路の探索ができ、解決できることを示している。

  

第五に、従来の強化学習においては特に困難な問題とされているエ―ジェント間の相互 作用を従「場による学習」とぃう発想の転換を行うことにより実現している。これによル エ―ジェントの情報処理能カの向上、行動の最適化、協調行動の実現が可能であることを 論じている。提案した学習的場モデルを典型的な分散処理問題の追跡問題、多自由度リン クの制御問題及び浮遊ロボットヘ適用し、学習適応場モデルの分散情報処理能カが究明さ れている。

  

第 六 に 、 自己 評 価 型 学 習 法 で ある

AHC

強化 学習 構造の 問題 点を 分析 し,

kohonen

ネ ッ

ト、統計的な探索法,Heuristics 導入によるgradient 推測の組み合わせによって、実問題

に適 用で きる 強化 学習 分類シ ステムを提案し、筋電(EMG) 義手制御を実現している。ここ

では ,筋 電信 号の 時間 的、空 間的に相関特性を利用した6 原理に基づく強化学習法の適用

に よ っ て 、 複 雑 な 、 時 変 的 な 筋 電 信 号 を 認 識 で き る こ と を 明 ら か に し て い る 。

  

こ れを 要す るに 、著 者は 、RWC 問題 に適 用可 能な 解を 自律 的に 生成 可能 性お よび問 題

解決 方針 の自 律的 発見 性を もつ 帰納 学習 法を 提案 、検証 し、

RWC

問題 に対 して 新知見 を

得たものであり、情報工学に対して貢献することろ大なるものがある。よって著者は、北

海 道 大 学 博 士 ( 工 学 ) の 学 位 を 授 与 さ れ る 資 格 あ る も の と 認 め る 。

参照

関連したドキュメント

また 、TMS による 推論機構 においても 先の知識ベースが利用可能であることを示

ガスハイドレートは、籠状の水分子の結晶中にメタン・ブタン・二酸化炭素等を取り込ん

  

  

の工業的生産の低コスト化が期待される。また、ATP 再生だけでなくGTP 再生も

  

   これ を要 する に、 著 者は HC1 ガス 含有雰囲気での金属・合金の高温腐 食挙動に関する基礎的 知 見を 得た もの であ り 、苛 酷な 雰囲 気中 での 装置

処理が可能であると述ぺるとともに,本研究て得られた知見を基礎に開発されたク