博 士 ( 情 報 科 学 ) 米 陀 佳 祐
学 位 論 文 題 名
Studies on IN/Iethodology of Behavioral Acquisition fOr AutonomouSRObotandAppliCationtOVirtualElaStiCRObot (自律ロボットの行動獲得方法の提案およぴ仮想弾性ロボットヘの適用)
学位論文内容の要旨
本論文では,人工生物の環境への適応能カを実現するため,ロポット工学的を視点から自律ロポッ トの機械学習に取り組み,目的のタスクを遂行する制御系を獲得する方法論の確立を研究目的とす る.自律的をピヘイピアを獲得する従来の研究では,サブサンプションアーキテクチャをはじめとし た詳細を動作を事前に設計したルールベースをアプローチが主流とざれていた.しかし、対象とする ロボットの形状が複雑とをり,制御対象とをる関節数が増大するとその動作設計が困難とをる.そこ で本研究では,多数の関節によって構成される弾性ロポットに対して人工ニューラルネットワーク (ANN)の制御系を導入し,機械学習から自律的を移動行動が獲得可能であることを明らかにする,
また,多関節ロボットに複合的を自律行動を与えるための制御系の設計方法を提案し,進化計算によ る行動獲得実験から提案方法の有効性を示す.
本論文は全5章で構成しており,第1章では序論として研究背景,目的及び関連研究を紹介する.
これまで本 研究で提案してきた仮想自律ロポットAnimated Robot及びシミュレーション用物理モ デリングツールTIPS―PMを紹介する.そして,自律ロポットの行動獲得を実現するために本研究が 採用している教師をし学習及びANNの最適化アルゴリズムについて述べる.これにより,本研究で 採用する機械学習に関する基礎知識をまとめる,
第2章では,弾性ロポットの適応行動を獲得するための実験を実施し,自律分散制御によって特 的の環境に適した移動行動を獲得可能であることを示す,ここでは,障害物を考慮しをい環境におけ る追従移動タスク,障害物を設置した環境における通り抜けタスクおよび障害物回避タスクの3種 類のタスクを設定してそれぞれの環境に適応する学習実験を実施した.また.弾性ロポットが機械学 習から獲得したビヘイビアの特徴を調査し,前進移動及び停止移動における運動メカニズムを明ら かにした,これにより,本論文で対象とする弾性ロポットの妥当性を示すだけでをく,進化計算によ る学習実験によって特定の環境に適応可能であることを示した.
第3章では,複合的をタスクを達成するための制御系の設計方法を提案し,弾性ロポットヘ適用 した学習実験を実施する,自律ロボットの行動獲得において,追従移動や探索移動をどのピヘイビア は前進移動,方向転換,停止をどの複数の運動能カが複合的に要求されるビヘイビアであるため難 易度の高いタスクとされる.本研究では,追従移動や探索移動のように,タスク達成に要求される動 作が共通し た複合型タスクに注目し, あるタスクで獲得したANNを組み合わせて他のタスクの適 応行動を設計する制御方法を提案する.ここで提案する制御方法では,ある特定のタスクで獲得し たANNはそ のタスク達成に要求される動 作を潜在的に獲得しているという仮説に基づぃた設計方 法である,また,進化計算による行動獲得では,同一のタスクであっても,学習実験を複数回実施す ることで.異をる特徴を有するANNを獲得することが可能である.この探索の多様性に焦点を当て ることで設計者による詳細な手動設計を必要としをい設計方法の実現を目的としている.ここでは、
―697−
障 害 物 を 設 置 し た 環 境 に お け る 探 索 移 動 タ ス クを 設 定 し て 提案 方 法 を 適 用し た 学 習 実 験 を実 施 す る. 障 害 物 を 設置 し た 環 境 にお け る 探 索 移 動タ ス ク を 設 定し て 提 案 方 法を 適 用 し た 学習 実験 を実施 する . 探 索 移 動タ ス ク は , 障害 物 の 設 置 によ って考 慮すべ き各 センシ ング状 況にお ける適 応動 作のパ ター ン が 増 大 する た め 。 障 害物 を 考 慮 し をい 追従移 動タス クと 比べる と難易 度の高 いタス クで ある.
弾 性 ロ ポ ッ ト に 追 従 移 動 タ ス ク で 獲 得 し たANNを 組 み 合 わ せ て 探 索 移 動タ ス ク で の 学習 実 験 を 実 施し , 実 験 的 に提 案 方 法 が 有効 で あ る こ と を検 証 し た .
第4章 で は . 第3章 に て 提 案 し た 制 御 系の 設 計 方 法 に自 律 分 散 制 御を 導 入 す る こ とで 提 案 方 法 の 改 善 を 試 み た . そ し て, 第3章 と 同様 に 弾 性 ロ ポッ ト に 探 索 移動 タ ス ク を 設定 し て 学 習 実 験か ら 提 案方 法 の 有 効 性を 検 証 す る ,ま た , こ こ では ,提案 方法を 採用 した場 合及び 採用し ていを い場 合にお いて 実 験 を 実 施し . そ れ ぞ れの 実 験 で 得 られ たビヘ イピア の特 徴を分 析した .実験 では, 従来 通り直 接 学 習 を す る 場 合 及 び 提 案 方 法 を 適 用 し て 複 数 の 追 従 移 動 用のANNを 複合 化 す る 場 合で そ れ ぞ れ 学 習 実 験 を 実 施 し て 比 較 す る こ と で , 提 案 方 法が 従 来 方 法 の5分 の1程 度の 試 行 時 間 で適 応 動 作 を 獲 得 し た こ と を 確 認 し た . こ れ に よ り , 実 験 的 に 提 案 方 法 の 有 効 性 を 示 し た . 最 後 に 第5章 で は 。 本 論文 の 結 果 を まと め , 今 後 の展 望 を 述 べ る,
―698−
学位論文審査の要旨
学 位 論 文 題 名
Studies on Methodology of Behavioral Acquisition for Autonomous Robot and Application to Virtual Elastic Robot
( 自 律 ロ ボ ッ ト の 行 動 獲 得 方 法の提 案お よび 仮想 弾性 ロボ ット ヘの 適用 )
本学位論文では,人工生物の環境への適応能カを実現するため,ロボット工学的な視点から自律ロ ポットの機械学習に取り組み,目的のタスクを遂行する制御系を獲得する方法論の確立を研究目的 としている.自律的をビヘイビアを獲得する従来の研究では.サプサンプションアーキテクチャをは じめとした詳細を動作を事前に設計したルールベースをアプローチが主流とされていた.しかし,対 象とするロボットの形状が複雑とをり,制御対象とをる関節数が増大するとその動作設計が困難と をる,そこで本研究では.多数の関節によって構成される弾性ロポットに対して人工ニューラルネッ トワー ク(ANN)の 制御系 を導入 し,機械学習から自律的を移動行動が獲得可能であることを明ら かにすることを試みている.また,多関節ロボットに複合的を自律行動を与えるための制御系の設計 方 法 を 提 案 し . 進 化 計 算 に よ る 行 動 獲 得 実 験 か ら 提 案 方 法 の 有 効 性 を 示 し て い る . 本論 文は全5章で構成しており,第1章では序論として研究背景,目的及び関連研究を述べてい る.また,これまで本研究で提案してきた仮想自律ロポットAnimated Robot及びシミュレーション 用物理モデリングツールTIPSーPMを説明している,そして,自律ロボットの行動獲得を実現するた めに本 研究が 採用し ている 教師を し学習及びANNの最適化アルゴリズムについて述べている,こ れ に よ り 、 本 研 究 で 採 用 す る 機 械 学 習 に 関 す る 基 礎 知 識 を ま と め て い る . 第2章では,弾性ロボットの適応行動を獲得するための実験を実施し,自律分散制御によって特的 の環境に適した移動行動を獲得可能であることを示している,ここでは,障害物を考慮しをい環境に おける追従移動タスク,障害物を設置した環境における通り抜けタスクおよび障害物回避タスクの 3種類のタスクを設定してそれぞれの環境に適応する学習実験を実施している.また,弾性ロボット が機械学習から獲得したビヘイビアの特徴を調査し,前進移動及び停止移動における運動メカニズ ムを明らかにした.これにより,本論文で対象とする弾性ロボットの妥当性を示すだけでなく,進化 計 算 に よ る 学 習 実 験 に よ っ て 特 定 の 環 境 に 適 応 可 能 で あ る こ と を 示 し て い る . 第3章では,複合的をタスクを達成するための制御系の設計方法を提案し,弾性ロポットヘ適用 した学習実験を実施している.自律ロボットの行動獲得において,追従移動や探索移動をどのビヘイ ビアは前進移動,方向転換,停止をどの複数の運動能カが複合的に要求されるビヘイビアであるため 難易度の高いタスクとされる,本研究では,追従移動や探索移動のように,タスク達成に要求される ―699―
志 仁
二 雄
人
正
正
恵
哲
雅
川 原
木 野
本
古
栗
鈴
小
山
授 授
授 授
授
教
教 教
教 教
准
査 査
査 査
査
主 副
副 副
副
動 作 の 共 通 し た 複 合 型 タ ス ク に 注 目 し , あ るタ ス ク で 獲 得し たANNを 組 み 合 わ せ て他 の タ ス ク の 適 応 行 動 を 設計 す る 制 御方 法を提 案して いる. ここで 提案 する制 御方法 では, ある 特定の タスク で獲 得 し たANNは そ の タ ス ク 達 成 に 要 求 さ れ る 動 作 を 潜 在的 に 獲 得 し てい る と い う 仮 説に 基 づ ぃ た 設 計 方 法 で あ る. ま た , 進化 計算に よる行 動獲得 では, 同一 のタス クであ っても ,学 習実験 を複数 回実 施 す る こ と で, 異 を る 特 徴を 有 す るANNを 獲 得 す るこ と が 可 能 であ る こ と を 示 して い る . これは , こ の 探 索 の 多様 性 に 焦 点 を当 て る こ と で 設計 者 に よ る 詳細 を 手 動 設計 を必要 とし をい設 計方法 の実 現 を 目 的 と した も の で あ る. そ の た め に ,本 章 で は 第2章 と 同 様 の 追従 移 動 タ ス クを 対 象 とし た学 習 実 験 を 実 施し , 提 案 方法 の有効 性を示 してい る.こ れら から, 弾性ロ ボット に予 め追従 移動タ スク で 獲 得 し たA.NNを 組 み合 わ せ る こ とで よ り 洗 練 さ れた 制 御 系 の 設計 が 可 能 で ある こ と を 実 験的 に 検 証 し て い る,
第4章 で は 、 第3章 にて 提 案 し た 制御 系 の 設 計 方 法に 自 律 分 散 制御 を 導 入 す るこ と で 提 案 方法 の 改 善 を 試 み てい る , こ こで は,障 害物を 設置し た環境 にお ける探 索移動 タスク を設 定して 提案方 法を 適 用 し た 学 習実 験 を 実 施し ている .探索 移動タ スクは ,障 害物の 設置に よって 考慮 すべき 各セン シン グ 状 況 に お ける 適 応 動 作 のパ タ ー ン が 増 大す る た め , 障害 物 を 考 慮し ない追 従移 動タス クと比 べる と 難 易 度 の 高 い タ ス ク で あ る が , 弾 性 ロ ポ ット に 追 従 移 動タ ス ク で 獲 得し たANNを組 み 合 わ せ て 探 索 移 動 タ スク で の 学 習実 験を実 施し, 実験的 に提案 方法 が有効 である ことを 検証 してい る.ま た,
こ こ で は . 提案 方 法 を 採 用し た 場 合 及 び 採用 し て い を い場 合 に お いて 実験を 実施 し,そ れぞれ の実 験 で 得 ら れ たビ ヘ イ ビ アの 特徴分 析を行 ってい る,実 験で は,従 来通り 直接学 習を する場 合,及 び提 案 方 法 を 適 用 し て 複 数 の 追 従 移 動 用 のANNを 複 合 化 する 場 合 で そ れぞ れ 学 習 実 験 を実 施 し て 比 較 し . 提 案 方 法 が 従 来 方 法 の5分 の1程 度 の試 行 時 間 で 適応 動 作 を 獲 得で き た こ と を 確認 し て い る . こ れ に よ り .実 験 的 に 提 案方 法 の 有 効 性 を検 証 し て い る.
最 後 に 第 5章 で は , 本 論 文 の 結 果 を ま と め , 今 後 の 展 望 を 述 べ て い る . こ れ を 要す る に , 著 者は, 多関節 によっ て構 成され る複合 タスク をもつ 弾性 ロポッ トに対 して複 数 の ビ ヘ イ ビ ア を そ れ ぞ れ 獲 得 し たANNの 組 合 せ に よ る新 た を 制 御 系を 導 入 し , 機 械学 習 か ら 自 律 的 な 移 動 行 動が 獲 得 可 能で あるこ とを具 体的に 明らか にし た.従 って, 本学位 論文 は人工 生命の 技術 や 複 雑 系 工 学の 発 展 に 寄与 すると ころ大 であり ,博士 (情 報科学 )の学 位を授 与す るに値 するも のと 認 め る .
―700 ‑