• 検索結果がありません。

第 9 章 結言

9.2 今後の課題

したものにするか,あるいはこれらの考慮が不要であるような別の手法を考案することに よって,待機時間や汎用性を改善する必要がある.振動判定に関しては,現状では車輪動 作のみの場合にしか対応していないものの,脚動作においても振動は発生し得るため,全 ての動作に対応させる必要がある.

次に,環境適応に関しては,主に実験環境,および強化学習の要素を改善する必要があ る.実験環境に関しては,本研究では限定的な地形や障害物を用いて実験を行ったため,

提案システムの汎用性を示すには十分ではないと考えられる.そこで,より多様な環境を 準備することで,さらに正確な評価を行う必要がある.強化学習の要素に関しては,ロボッ トの方位の変化をさらに抑制させるための改善を行う必要がある.具体的には,状態の定 義に直前の行動によるヨー角の変化量を離散化したものを含めることや,報酬関数に方位 の変化の補正に関わる計算を含めること等が考えられる.

また,本研究ではシミュレーションを用いて理論を構築するに留まったが,今後は実機 を用いた実環境における実験を行う必要がある.そのためには,実機の製作や実機への 理論の適用,および実環境の準備を行う必要がある.さらに,実環境においては,シミュ レータ上では実験が困難であったような粉粒体環境等も準備し,実験を行うことを考えて いる.

謝辞

本研究を進めるにあたり,研究内容やその方針に関するご指導をいただきました公立は こだて未来大学システム情報科学部複雑系知能学科の三上貞芳教授に心から感謝いたし ます.

また,研究内容や研究発表に関して多くのご助言をいただきました研究室の皆様に深く お礼申し上げます.

参考文献

[1]

山下淳

,

浅間一

,

新井民夫

,

太田順

,

金子透

, ”

ロボットの移動機構に関する研究動向

,”

日本ロボット学会誌

, vol. 21, no. 3, pp. 282-292, 2003.

[2] NASA Jet Propulsion Laboratory, ”Mars Exploration Rovers,” [Online] https:

//mars.nasa.gov/mer/home/. (2019

1

14

日アクセス

).

[3]

港隆史

,

浅田稔

, ”

環境の変化に適応する移動ロボットの行動獲得

,”

日本ロボット学会 誌

vol. 18, no. 5, pp. 706-712, 2000.

[4] Y. Nishimura and S. Mikami, ”Environmental Adaptation for Wheel-legged Robot Using External Force Given to Legs,” in SICE International Symposium on Control Systems 2018, Tokyo, Japan, 2018, pp. Fr23-3-1–8.

[5] A. Chilian, H. Hirschm¨ uller and M. G¨ orner, ”Multisensor data fusion for robust pose estimation of a six-legged walking robot,” 2011 IEEE/RSJ International Conference on Intelligent Robots and Systems, San Francisco, CA, 2011, pp. 2497-2504.

[6] J. Simanek, M. Reinstein and V. Kubelka, ”Evaluation of the EKF-Based Estima-tion Architectures for Data Fusion in Mobile Robots,” in IEEE/ASME Transactions on Mechatronics, vol. 20, no. 2, pp. 985-990, April 2015.

[7] Richard S. Sutton, Andrew G. Barto,

三上貞芳

(

),

皆川雅章

(

)

強化学習

,”

森 北出版

, 2000.

[8]

小倉崇

, ”ROS

ではじめるロボットプログラミング

,”

工学社

, 2015.

[9] Open Source Robotics Foundation, ”Gazebo,” [Online] http://gazebosim.org/.

(2019

1

14

日アクセス

).

[10] DEFENSE ADVANCED RESEARCH PROJECTS AGENCY, ”DARPA Robotics Challenge (DRC) (Archived),” [Online] https://www.darpa.mil/program/

darpa-robotics-challenge. (2019

1

14

日アクセス

).

[11] Fisher, C.J., ”Using an Accelerometer for Inclination Sensing,” Application Note AN-1057, Analog Devices, Norwood, Mass., Feb. 2010.

[12]

木山昇

,

高橋利光

,

祖父江恒夫

,

相川哲盛

, ”

傾斜したスマートフォンによる自動車の

3

軸加速度算出手法

,”

情報処理学会マルチメディア

,

分散

,

協調とモバイルシンポジウ

ム 論文集

図 目 次

1.1 Mars Exploration Rover A

MER-A

[2] . . . . 2

1.2

路面が不整地のトンネル

. . . . 3

2.1

車輪型ロボットの環境適応に関する研究

[3] . . . . 4

2.2

多脚車輪型ロボットの環境適応に関する研究

[4] . . . . 5

2.3 6

脚歩行ロボットの位置推定に関する研究

[5] . . . . 6

2.4

内界センサのみを用いた位置推定に関する研究

[6] . . . . 7

3.1

強化学習の概要

. . . . 9

4.1 Gazebo

内における

6

脚車輪型ロボットの

3

次元モデル

. . . . 13

4.2

センサ軸の傾斜による重力加速度の影響

. . . . 15

4.3

停止制御後にスリップが発生する例

. . . . 16

5.1

ロボットモデルの詳細(軸等は

RViz

上で可視化)

. . . . 19

5.2

ロボットモデルの俯瞰図

. . . . 20

5.3

ロボットモデルの前面図

. . . . 20

5.4

仮想環境上に構築した不整地環境

. . . . 21

5.5

瓦礫を想定した

2

種類の障害物モデル

. . . . 22

5.6

隆起した地形を想定した障害物モデル

. . . . 22

5.7

凍結した路面を想定したモデル

. . . . 23

5.8

瓦礫を想定した

2

種類の障害物モデル

. . . . 24

5.9

斜面のモデル

. . . . 25

5.10

コントローラの操作画面

. . . . 25

6.1

各センサの座標系

. . . . 26

6.2

脚に生じる

y

軸周りのトルクの方向

. . . . 27

6.3

ローパスフィルタによる平滑化の効果

. . . . 28

6.4

ジャイロセンサの特性によるドリフト現象

. . . . 29

6.5

静止時におけるピッチ角の推定精度

. . . . 30

6.6

斜面走行時におけるピッチ角の推定精度

. . . . 30

6.7

滑り落下中の加速度の波形

. . . . 31

6.8

静止判定の有無による変位推定値の精度比較

. . . . 32

6.9

ロボットが障害物にスタックしている様子

. . . . 33

6.10

振動中の加速度の波形

. . . . 34

6.11

振動発生時の変位の推定精度(振動判定なし)

. . . . 34

6.12

振動発生時の

6

脚のトルク値

. . . . 35

6.13

振動判定実装後の変位の推定精度

. . . . 36

6.14

車輪動作時の変位の推定値(変位計測の一時停止処理なし)

. . . . 37

6.15

車輪動作時の変位の推定値(変位計測の一時停止処理あり)

. . . . 38

6.16

車輪動作を行った際の変位推定値

. . . . 39

6.17

トライポッド歩容

I

を行った際の変位推定値

. . . . 39

6.18

トライポッド歩容

II

を行った際の変位推定値

. . . . 39

6.19

トライポッド歩容

I

と車輪動作の組み合わせを行った際の変位推定値

. . . 40

6.20

トライポッド歩容

II

と車輪動作の組み合わせを行った際の変位推定値

. . . 40

6.21

クロール歩容

I

と車輪動作の組み合わせを行った際の変位推定値

. . . . 40

6.22

クロール歩容

II

と車輪動作の組み合わせを行った際の変位推定値

. . . . 41

6.23

ウェーブ歩容

I

と車輪動作の組み合わせを行った際の変位推定値

. . . . 41

6.24

ウェーブ歩容

II

と車輪動作の組み合わせを行った際の変位推定値

. . . . 41

7.1

脚の動作パターン

. . . . 45

7.2

車輪の動作パターン

. . . . 45

8.1

提案システムにおける非エピソード型学習のフロー図

. . . . 49

8.2

ロボットが獲得した方策

. . . . 50

8.3

報酬値の推移

. . . . 50

8.4

評価実験用の不整地環境におけるスタート地点

. . . . 52

8.5

学習前後におけるロボットの行動回数の平均値

. . . . 53

8.6

学習前後におけるロボットの行動回数の箱ひげ図

. . . . 53

8.7

学習前後におけるロボットのコースアウト回数の平均値

. . . . 54

8.8

学習前後におけるロボットのコースアウト回数の箱ひげ図

. . . . 54

関連したドキュメント