29_10_05.dvi

(1)

学術・技術論文

ゲーム状況に応じた意思決定を行うエアホッケーロボットの開発

松下左京

∗

並木明夫

∗

Development of Air Hockey Robot that Makes a Decision based on Game Situation

Sakyo Matsushita

∗

_{and Akio Namiki}

∗

This paper proposes a robot which can play air hockey game with a human. The robot consists of a 4-axis robot arm and a high-speed vision, and the robot is controlled based on visual information at a rate of 500 [Hz]. The robot system has the abilities to adjust the strength level and to change the strategy based on the game situation. A system designer can easily adjust these abilities by setting several specified parameters. In this paper, first, a recursive trajectory generation using continuous images from high-speed vision is explained. Secondly, the response control to adjust the strength level of the robot is explained. Thirdly, the decision-making using AHP (Analytic Hierarchy Process) is proposed. This ability enable the robot to switch the game plan. Finally, we show the data of experiments and verify the effectiveness of the system.

Key Words: Air Hockey, Response Control, AHP, High Speed Vision

1.

序論近年，ロボットのエンターテイメント分野への進出が進んでいる．エンターテイメントロボットは人間を楽しませるために，何らかのインタラクションを持つ．そのなかで最も特徴的なものは，例えばエアホッケーのような物理的インタラクションである．エアホッケーは高速性と戦略性の高さが特徴的なスポーツである．そのエアホッケーで人間と試合をするエアホッケーロボットの研究・開発の報告が，いくつかされている．セイコープレシジョン社[1]は反射動作によるもの，Bishopら[2]，牧野ら[3] は単純なタスク切り替えによるもの，Bentivegnaら[4]は学習を用いたもの，Wangら[5]はファジィ制御を用いたものを開発している．Nuvation Research社[6]はゲームモデルを用いたものを製作しているが，その動作アルゴリズムは公開されていない．対戦型ロボットの動作が単純な反射運動では，人間はすぐに飽きてしまう．人間が楽しいと感じるためには，ロボットの強さが調整できる必要がある．強さの構成要素として考えられるものは，例えば運動能力と判断能力である．これらの能力を調整することで様々なプレイヤーのレベルに対応することが可能になる．運動能力を調整すれば，反応速度を高めたり，鈍い動作をさせることができる．判断能力を調整すれば，ロボットが原 2010 年 8 月 6 日 ∗_{千葉大学大学院工学研究科}

∗_{Chiba University, Graduate School of Engineering} 本論文は提案性で評価されました．

Fig. 1 Decision making for robot

複数の行動パターンから一つを選択して実行するとき，必ず最適な選択をさせたり，必ずしもベストではない選択をさせることができる（Fig. 1）．動作の正確さや判断の傾向は，外部から調整できるほうが望ましい．そこで，制御器と判断部にそれぞれ調整用の変数を埋め込むこととする．上記のように設計者が容易に運動能力と判断能力を調整することができるエアホッケーロボットの研究例はまだ報告されていない．そこで本論文では動作フィルタとAHP（Analytic

Hi-erarchy Process）の導入により，運動能力と判断能力が調整可能なエアホッケーロボットシステムの開発を目標とする．

2.

システム

2. 1 Barrett Arm

本システムではBarrett Technology Inc製のBarrett Arm （4-DOF）[7]を使用する．アームの各関節は，ワイヤを介して

(2)

Fig. 2 Air hockey robot system

Fig. 3 Air hockey table and robot

モータに接続されている．モータがアームの土台部分に集約されているため，アーム部の質量が小さい．また，ワイヤ駆動のため各関節における摩擦が小さく，滑らかな動作が可能である．通信インターフェースにはCANが実装されている．本システムでは，Barrett Armの第2軸をプレイヤーの肩，第4軸を肘に見立てた姿勢と動作をさせる．アーム先端部にはプレイヤーが使うスマッシャと同じものを装着する． 2. 2 高速ビジョンパックを認識するために，視覚センサとしてPhotron製のペンシル型カメラを使用し，処理ボードには石井らが開発した小型高速ビジョンプラットフォームIDP Express [8]を使用する．本高速ビジョンは50∼10,000 [fps]での撮影が可能であるが，本システムでは500 [fps]での撮影を行う．このフレームレートはパックをトラッキングするために十分な速度である．解像度は，撮影が必要な範囲が収まるサイズである512×256とする．ビジョンシステムにはビジョン用計算機を1台使用し，安定で高速な画像処理を実現する． 2. 3 エアホッケー環境設定エアホッケーロボットシステムの概観をFig. 2に示す．本システムでは，ホッケー台の前（本来ならばプレイヤーが立つ位置）にBarrett Armを設置し，高速ビジョンはBarrett Arm の上方からホッケー台の中心を撮影できるように設置する．高速ビジョンはエアホッケー台に対してキャリブレーションされている．エアホッケー台とBarrett Arm，高速ビジョンの位置関係，座標系の定義をFig. 3，Table 1に示す． 2. 4 システム構成 Fig. 4にシステム構成を示す．パックを高速ビジョンで撮影

Table 1 Parameters of the air hockey robot system

Hh Height of the Hockey Table [m] 0.80

Wh Width of the Hockey Table [m] 0.92

Dh Depth of the Hockey Table [m] 1.99

Wg Width of Goal [m] 0.21

dp Puck Diameter [mm] 81.0

dp Smasher Diameter [mm] 63.0

l1 Length of Link1 [m] 0.55 l2 Length of Link2 [m] 0.42

Fig. 4 System conﬁguration

し，Vision PC で認識する．Vision PC にはGPU（

Graph-ics Processing Unit）のGeforce GTX 295が搭載されており，

CUDAによる並列演算を利用して高速なパック認識を行う．

Host PCではBarrett Armを制御するためのプログラム開発を行う．MATLABのReal Time Workshopにより最適化された実行コードは，Target PC にダウンロードされ，xPC

Target上でCAN通信を介して，リアルタイムにBarrett Arm の動作を制御する． Vision PCで得たパックの位置情報に基づき，Target PC上でロボットの打撃動作軌道を生成する．この軌道に追従するよう制御を行うことで，Barrett Armによるエアホッケーを実現する．これら一連の処理は500 [Hz]で実行される．

3.

打撃動作の実現ロボットは高速ビジョンにより認識したパックを打ち返すことでエアホッケーを実現する．本章ではパックの認識から打撃動作の生成，実現に至るまでを説明する． 3. 1 パック認識高速ビジョンの画像からパックを抽出するために，ノイズの大きさを考慮した背景差分と二値化を行う．事前に取得した各画素 (i, j)におけるノイズの幅 Δfn(i, j) と背景画像fb(i, j)

を用いると，入力f(i, j)に対するフィルタ出力f(i, j)ˆ は

ˆ

f(i, j) =

(

1 : if f(i, j) < fb(i, j) −1₂Δfn(i, j)

0 : if f(i, j) ≥ fb(i, j) −1₂Δfn(i, j)

（1）

上式によるパック抽出は，CUDAによる並列演算で高速に実行される．

式（1）により二値化された画像にはパックだけが映っている．結果画像に対し画像モーメントを計算することで，パックの重

(3)

心座標を得る．パックの重心は中心に一致するため，これをパックの中心座標として扱う． 3. 2 打撃点予測パックはホッケー台から噴き出す空気によりわずかに浮いている．そのため，パックとホッケー台間の摩擦は無視することができる程度に小さいと考えられる．そこで，パックの運動を等速直線運動と近似すれば，パックの位置座標(xp, yp)は時刻 tの一次関数として次式で表せる． xp= a1t + a0 （2） yp= b1t + b0 （3）上式より，パックの運動は四つのパラメータa1, a0, b1, b0で記述できる．これらの係数を3. 1 節で得られたパックの中心座標から逐次最小二乗法を用いて計算する．新しいデータが1サンプル取得できたとき，逐次最小二乗法によりパックの運動パラメータ a1, a0, b1, b0 を更新する．つまり，パックが毎サンプル時刻見えている場合，500 [Hz]でパックの運動状態を更新する．得られたa1, a0, b1, b0 の数値解と，事前に設定した打撃位置 y座標yphを式（2）（3）に代入することで，打撃時刻thと打撃位置x座標xph を得る． th= y ph− b0 b1 （4） xph= a1th+ a0 （5）得られた打撃位置 (xph, yph) はパックの中心座標を示す． (xph, yph)とロボットアームのスマッシャ中心とはパック半径 dpとスマッシャ半径ds の分だけギャップがある．これを考慮し，打撃時のスマッシャの中心座標として，(xsh, ysh)を新たに設定する． " xsh ysh # = " xph yph− d_p+ds 2 # （6）また，台側面の壁にパックが衝突すると反射が生じ，パックの運動方向が変化する．ここでパックと壁面の衝突は反発係数 1，摩擦係数0の理想的な衝突と仮定すると，衝突後のパックの x方向の運動は新たな係数â1, â0 により記述できる． â1= −a1 （7）

ˆa0= 2sgn(a1)xlim− a0 （8）

ここでxphの最大値がxlim，最小値が−xlimである．また，y 方向の運動は式（3）から変化しない．理想的な運動と衝突を仮定しているため，実際には誤差が生じる．しかし誤差が生じたあとも500 [fps]で高速に運動を認識するため，打撃点を再予測することで誤差の影響を小さく抑えることができる． 3. 3 打撃軌道式（6）で求めた打撃手先位置(xsh, ysh)での目標手先速度を( ˙xsh, ˙ysh)とする．防御動作をする場合，˙ysh= 0とすればよい．攻撃動作をする場合，˙ysh> 0とすればよい．つまり目標手先速度( ˙xsh, ˙ysh)は選択した動作によって決定される．打撃時刻thにおける関節角度qh，角速度 ˙qhは，それぞれ (xsh, ysh)，( ˙xsh, ˙ysh)から逆運動学により計算する．打撃動作開始時刻（打撃点予測完了時刻)t0における関節角度q0，角速度 ˙q₀から，時刻thにおける関節角度qh，角速度 ˙qhまでを滑らかに繋ぐ軌道は，時刻tの三次関数として次式を満たす． 2 6 6 6 4 qT 0 qT h ˙qT 0 ˙qT h 3 7 7 7 5= 2 6 6 6 4 1 t0 t02 t03 1 th th2 th3 0 1 2t0 3t02 0 1 2th 3th2 3 7 7 7 5 2 6 6 6 4 α0 β0 α1 β1 α2 β2 α3 β3 3 7 7 7 5 （9）上式をαi，βi(i = 0 ∼ 4)から成る係数行列について解くことで任意の打撃軌道を生成する．目標打撃軌道q_refは次式で得る． q_ref= " α0 α1 α2 α3 β0 β1 β2 β3 #2₆ 6 6 4 1 t t2 t3 3 7 7 7 5 （10）時刻t = th で，初期位置に戻るための軌道を打撃軌道と同様の手順で計算し，係数行列を更新することで軌道を切り替える．また，初期位置に到達する時刻に軌道を再度切り換え，次の打撃軌道が生成されるまで，初期位置で停止したまま待機させる．このように「待機→打撃動作→初期位置に戻る→待機」を繰り返すことでゲームを行う． 3. 4 動作制御 Barrett Armの制御には計算トルク法を用いた線形化補償とサーボ補償の二段階制御を用いる[9]．構成した制御器のブロック線図をFig. 5に示す．アームの運動方程式は次式で表せる． M(q)¨q + h(q, ˙q) + g(q) = τ （11）ここでM(q)は関節座標に関する慣性行列，h(q, ˙q)は遠心力およびコリオリ力，g(q)は重力負荷を表す．新たな入力をuq とし，次式のような非線形フィードバック補償を考える． τ = h(q, ˙q) + g(q) + M(q)uq （12）すると ¨q = uq （13）という関節変数に関する線形かつ非干渉な系を得る．現実にはモデル化誤差や摩擦などの外乱が存在し，誤差が生じるので，次式に示すサーボ補償器によって低減させる．

uq= ¨q_ref+ KD( ˙q_ref− ˙q) + KP(q_ref− q) （14）

4.

反応特性制御

エアホッケーに限らず，スポーツロボットに動きの「手加減」をさせることを考える．ロボットが目標値に良好に追従して動作しなければ，目的の動作が達成されず，結果的に「手加減」をしたと見なせる．したがって，目標軌道に対するロボットの反

(4)

Fig. 5 Computed torque method

Fig. 6 Bode diagram of transfer function from qrefto q

応特性を制御することが可能となればよい．反応特性を外部から調整するために，反応特性係数 α(0 ≤ α ≤ 1)を導入する．式（14）に反応特性係数αを適用するために，具体的な方針として次のことを考える． •反応特性係数αが0に近いほど，速度と加速度は0に近付き，位置制御の許容誤差を大きくする． •反応特性係数αが1に近いほど，良好な追従性を示す．これらの方針から，式（14）にαに関する新たな係数K1，K2， K3 を導入した次のサーボ補償を考える．

uq= K3¨qref+ KD(K2˙qref− ˙q) + KPK1(qref− q)

（15）式（13）（15）より，q_refからqまでの伝達関数を求めると Q Q_ref = K3 s2+ KDK2s + KPK1 s2+ KDs + KPK1 （16）式（16）においてK1(α) = K2(α) = K3(α) = αと仮定し， αを変化させたときのボード線図をFig. 6 に示す．Fig. 6から，αが減少するに従い，特に高周波領域においてゲインが小さくなり，位相に遅れが生じることが分かる．このことから式（16）は一種の動作フィルタと言える．K1，K2，K3とαの関係式は他の場合も考えられるが，本論文ではこの関係式を採用する．

5.

階層分析法を用いた動的な意思決定機能タスク達成の過程で選択肢が複数生じた場合，ロボットはそれらのうちから一つを選んで実行する必要があり，意思決定問題とみなすことができる．本章ではロボットの意思決定機能に状況変化や設計者の主観を反映させる手法を提案する．

Fig. 7 Evaluations on the scales which are diﬀerent

5. 1 階層分析法（AHP）エアホッケーロボットには，向かってきたパックをどのように打つか，あるいは見逃すかという意思決定をする能力が必要である．選択肢（Choice）として具体的な動作が与えられれば，設計者がそれぞれの選択肢間に相対的な評価（例えば，見逃すよりも防御するほうがふさわしいが，防御するよりも攻撃するほうがよりふさわしいという評価）をすることは容易である．このとき，評価基準（Criterion）が一つであれば，選択肢間の相対的な評価はただ一つの評価基準の尺度上で行われる．一般に一つの尺度上での相対的な評価（例えば攻撃力だけでの評価）から各選択肢の絶対的な評価を得ることは容易である．一方，評価基準が複数ある場合，各評価基準が持つそれぞれの尺度上で選択肢間の相対的な評価がそれぞれなされる（Fig. 7）．この場合，相対的な評価はそれぞれ別々の尺度上でされている（例えば攻撃力での評価と防御力での評価）ため，各選択肢の絶対的な評価を得ることは困難であり，意思決定の障害となる．つまり，エアホッケーロボットのような評価基準が複数存在する意思決定機能を設計する場合，選択肢の相対的な評価は容易である一方，絶対的な評価を得ることが困難であることが問題となる．

AHP（Analytic Hierarchy Process: 階層分析法）[10] [11] は，主観に基づく相対的な評価を，体系的に同一尺度上の絶対的な評価に置き換えることで意思決定を可能にする手法である．エアホッケーにおける動作選択問題に対し，AHPでは以下のような手順で結論を得ることができる． 1 「問題の階層構造化」問題の全体像を「総合目的」，「評価基準」，「選択肢」の関係で捉える．上記の問題では「総合目的」は「動作選択」となる．「評価基準」には様々なものが考えられるが，今回は「攻撃力」，「防御力」，「安定性」の三つを設定する．「攻撃力」とは得点を取る能力の高さ，「防御力」とは失点を防ぐ能力の高さである．「安定性」とはゲームに対する「消極性」を意味し，動きがより少ないことを善しとする評価基準である．また「選択肢」にも様々なものが考えられるが，今回はエアホッケーに最低限必要な「攻撃」，「防御」，「無視」という三つの動作を設定する．「攻撃」とは対戦相手側に向かってパックを打ち返す動作，「防御」とは単にパックの軌道を塞ぐ動作である．「無視」とは新しい目標軌道を生成せず，パックを見送る動作で

(5)

Fig. 8 AHP for air hockey ある．以上の要素を階層化したものをFig. 8に示す． 2 「ペア比較マトリックスの記述」要素間の相対的な評価をまとめて行列にしたものをペア比較マトリックスという．ここでは例として「動作選択」に関して各「評価基準」間に相対的な評価をし，ペア比較マトリックスCを作る．ペア比較マトリックスの要素は，列に対する行の重要度を表す．例えば「攻撃力は防御力よりかなり重要」ならば相対的な重要度は5とする．逆に重要でない場合は逆数を用いる．例えば「防御力は攻撃力よりかなり重要でない」ならば相対的な重要度は1/5とする．このように重要度をまとめたものは，ペア比較マトリックスCとして次式のように書ける． C1= 2 6 4 1 5 7 1/5 1 3 1/7 1/3 1 3 7 5 （17）ここで対角要素がすべて1であるのは，同じ要素同士の相対重要度を表しているからである．例えば（1,1）要素についてならば，「攻撃力（第1列）に対する攻撃力（第1行）の重要度」を示している． 3 「重みベクトルの計算」ペア比較マトリックスの最大固有値λmax(C1)に関する固有ベクトルを正規化したものを，上層要素に関する下層の重みベクトルWC₁ として扱う．すなわち，正規化した固有ベクトルの各要素は「動作選択」に関する「攻撃力」，「防御力」，「安定性」それぞれの絶対的な評価値となる． 4 「整合度の確認」ペア比較マトリックスの整合度C.I. は次式で与えられる． C.I. = λmax(C1) − m m − 1 （18） mはペア比較マトリックスの次数である．C.I. ≤ 0.1を満たしていない場合，評価に矛盾が生じているなどの理由でペア比較マトリックスC1内の整合性がとれていないことを意味する．この場合，正確な意思決定ができない可能性があるので，C.I. ≤ 0.1 を満たすようにペア比較マトリックスを設定し直す必要がある． 5 「全体の重み計算による意思決定」上術の手順 ∼2 4 ではペア比較マトリックスC1と重みベクトルWC₁ について考えたので，続いて残りのペア比較マトリックスについて考える．手順2 と同じ要領で，各「評価基準」に関する各「選択肢」のペア比較マトリックスを設定する．具体的には「攻撃力」に関する「攻撃」，「防御」，「無視」の三つの動作選択肢の相対評価をまとめて，これをペア比較マトリックスをC2 とする．同様に「防御力」に関するペア比較マトリックスをC3，「安定性」に関するペア比較マトリックスをC4とする．次に手順3，4 と同じ要領で整合性のある重みベクトルWC₂，WC₃，WC₄ を得る．これらを用いて「動作選択」に関する各「選択肢」の重みベクトルW は次式で得られる． W =hWC₂ WC₃ WC₄ i WC₁ = h w1 w2 w3 iT （19）各要素w1，w2，w3 はそれぞれ「動作選択」に関する「攻撃」，「防御」，「無視」の重みとなる．したがってw1，w2，w3 の最大要素に対応する選択肢を選ぶことが最良の選択となる． 5. 2 変数導入によるAHPのエアホッケーへの適用通常のAHPでは静的な状態における意思決定は可能であるが，動的に状態が変化する場合は状態に応じてペア比較マトリックス内の要素も変化させる必要がある．すなわち，ペア比較マトリックスは状態の関数となる． Fig. 8において，「動作選択」に関して「攻撃力」や「防御力」の重要度をどのように考えるかということには人間でいう性格が関係してくる．今回，性格に代わる意思決定の傾向を表す変数として，意思決定変数xR を設定する． xR=h Ra Rb iT （20） Ra，Rbはそれぞれ攻撃，防御の意欲を表す．するとペア比較マトリックスC1 は意思決定変数xR の関数となり，C1(xR) と表せる．一方，ゲーム状況を表す変数も存在するので，今回はこれを環境変数xE として設定する． xE=h vp da db iT （21） vp はパック速さを，da とdb はそれぞれ手先スマッシャ中心から攻撃打撃点（ysh = 0.15 [m]）または防御打撃点（ysh = 0.072 [m]）までの距離を表す．攻撃は相手に近い位置で，防御は自分のゴールに近い位置で行うほうが有効であるので，ysh についてこれらの数値を用いている．ペア比較マトリックス C2，C3，C4は環境変数xE の関数として，それぞれC2(xE)， C3(xE)，C4(xE)と表せる． 5. 3 変数を含むペア比較マトリックスの設計ペア比較マトリックスC が状態変数xの関数の場合，次式のように表現される． C(x) = 2 6 6 4 W11(x) · · · W1q(x) .. . ... ... Wq1(x) · · · Wqq(x) 3 7 7 5 , Wji(x) = Wij−1(x) (i, j = 1, 2, . . . , q) （22） q は階層モデルにおける下層の要素数である．以降，i < j についての設計方法を述べる．状態xをn個の変数を含む同次ベクトルで表す． x =h x1 x2 · · · xn 1 iT （23）

(6)

ペア比較マトリックスC を状態変数xの関数として一般的に表現することは難しい．そこで，サンプルとして（2n + 1）個の状態kx (k = 1, 2, . . . , 2n + 1)と，その状態に対応するペア比較マトリックスk Cを与えることとし（以後，左上の添え字kがついたベクトルと行列は，設計者が与えるものであることを意味する），その（2n + 1）個の組からペア比較マトリックスC(x) を近似する．k C，C(x)の要素をそれぞれk Wij， Wij(x)とすれば，それぞれのkに対し Wij(kx) =kWij (k = 1, 2, · · · , 2n + 1) （24）が条件式となる．本稿では関数Wij(x)の形について，「AHP の定義より，Wij(x) > 0を満たす」，「Wij(x)が二つの重要度の比から成る」という点に着目し，次式で与える． Wij(x) = exp(aijTx/bijTx) （25）

ここでaijとbijは定数列ベクトルである．以下にaijとbij の決定方法を述べる．

すべての(i, j)の組み合わせについて係数ベクトルaij，bij が決まれば，式（25）を用いてペア比較マトリックスC(x)を得ることができる．そこで，すべてのkについて式（24）を満たすように式（25）係数ベクトルaij，bijの要素を決めればよい．式（25）にkxを代入してから式（24）を適用し，変数を係数ベクトルaij，bij とみなせば k Wij= exp(kx T aij/kxTbij) （26）式（26）の両辺の対数をとれば，係数ベクトルの線形方程式の形に整理できる． k_xT aij= (lnk Wij)kx T bij （27）ここでk = 1, 2, . . . , 2n + 1であるから，式（27）は次のようにまとめられる． Xaij= Y bij （28） X = h 1_x 2_x _{· · ·} 2n+1_x iT _（₂₉_） Y = h y₁ y₂ · · · y_2n+1 iT （30） yk= (ln k Wij) ×kx （31）ここでX，Y ∈ (2n+1)×(n+1)，aij，bij∈ n+1である．式（28）をさらにまとめると次式となる． Zcij= 0 （32） Z = h X −Y i （33）

cij=h aijT _bijT iT _（₃₄_）

ここで Z ∈ (2n+1)×(2n+2)，cij ∈ 2n+2 であるため，式（32）から係数ベクトルcij は一意に決まらない．そこで係数ベクトルcij の任意の第l 要素を定数と考え，これを1と仮定する．係数ベクトルcij の第l要素を取り除いたベクトルを

ˆcij∈ 2n+1 とする．行列Z の第l列を取り除いた行列をZˆ

Fig. 9 Flow chart of AHP Table 2 Designed values (k_W

12,k_W 13,k_W 23) aboutk_C 1 k k_R a kRb kW12 kW13 kW23 1 0.0 0.0 1 1/3 1/3 2 0.0 1.0 1/3 1 5 3 1.0 0.0 3 5 1 4 1.0 1.0 1 7 7 5 0.6 0.8 1/1.3 3 5

Table 3 Calculated coeﬃcient vectors in C1(xR)

W12(xR) W13(xR) W23(xR) 1.851 0.661 0.139 aij −1.851 0.256 0.661 0.000 −0.256 −0.139 −0.684 0.019 0.015 bij −0.684 0.088 0.196 2.369 0.233 0.127 ∈ (2n+1)×(2n+1)_{，取り除いた第}_l_{列をベクトル}_zl _∈2n+1 とする．すると式（32）は次のように書き換えられる． ˆ Zˆcij= zl （35）行列Zˆが正則であれば，逆行列Zˆ−1を計算することで係数ベクトルˆcijが一意に定まる．行列Zˆが正則でない場合は，正則となるようにペア比較マトリックスk Cの要素を調節すればよい．得られた係数ベクトルˆcijの第l要素に1を補えば，定義式（34）のとおりに係数ベクトルaij，bijが得られる．動的に状態x が変化する場合も，設計者の主観的判断傾向を反映したペア比較マトリックスが自動生成されるため，通常のAHPの手順通りに意思決定を行うことが可能となる．変数を導入したAHPによる意思決定手法の一連の流れをFig. 9に示す．本ケースでの変数の数は，意思決定変数の関数であるC1 に関してはn = 2，環境変数の関数であるC2，C3，C4 に関してはn = 3である．またすべてのペア比較マトリックスに関して，下層の要素数はq = 3である．C1について設計した状態（意思決定変数）と式（24）をTable 2に示す．k W12は「防御力」に対する「攻撃力」の重要度，kW13 は「安定性」に対する「攻撃力」の重要度，k W23 は「安定性」に対する「防御力」の重要度をそれぞれ表す．Table 2の値と前述した手法から算出された係数ベクトルaij，bijをTable 3に示す．C2，

C3，C4 についても同様に計算している．

ここまで述べた3，4，5の全体をブロック線図で表したものをFig. 10に示す．

(7)

Fig. 10 Block diagram of all of the system

6.

実験

6. 1 基本動作に関する実験

パックの軌道から打撃点を予測し，手先の軌道を生成，制御によって実際に動作させた結果をFig. 11，Fig. 13，Fig. 14，

Fig. 15に示す． Fig. 11は攻撃動作時の動作の様子を0.1秒ごとに示した写真である．Fig. 13は攻撃動作時の軌道を，Fig. 14は防御動作時の軌道を，Fig. 15は無視動作時の軌道を表す．攻撃動作時は手先速度をy軸の正方向に出すために，前に押し出すような手先軌道となっている．防御動作時は手先速度を0にするため，押し出すような軌道とはなっていない．無視動作時は手先パックが初期位置から移動していない．また，いずれの図でも，高速ビジョンから得られたパックの位置座標を元に，パックの運動が正確に予測できている． 6. 2 反応特性係数に関する実験同一の目標軌道に対し，反応特性係数を α = {1.00, 0.5, 0.20, 0.10} （36）としたときのそれぞれの応答をFig. 12に示す． α = 1.00のときは目標値によく追従している．αが減少すると，誤差と遅れがより大きくなる．この結果は，Fig. 6のボード線図が示す傾向と一致する． 6. 3 意思決定変数に関する実験意思決定変数Ra，Rbを0から1まで，0.25きざみで変化させ，ロボットに向かって100回パックを打ち，それぞれどのような意思決定をするか観察した．100回のショットは実際のゲームで見られるような様々なショットになるよう，スピード，角度，反射回数が偏らないように打った．その実験結果をFig. 16，

Fig. 17，Fig. 18に示す．Fig. 16は異なる意思決定変数におけるの攻撃回数，Fig. 17は防御回数，Fig. 18は無視回数を濃度値で表している．傾向として，Raが大きくなるほど攻撃回数が増え，Rbが大きくなるほど防御回数が増える．しかしRa，Rbの値が近くなると，攻撃と防御の発現バランスの偏りが小さくなり，必ずしも攻撃，防御の回数は100に近づかない．また，Ra，Rbの値 (a) t = 0.0 [s] (b) t = 0.1 [s] (c) t = 0.2 [s] (d) t = 0.3 [s] (e) t = 0.4 [s] (f) t = 0.5 [s] (g) t = 0.6 [s] (h) t = 0.7 [s] (i) t = 0.8 [s] Fig. 11 Attack motion

Fig. 12 Motion by diﬀerent value of α

がいずれも小さくなると，無視の回数が増加する．この結果は，

Ra，Rbがそれぞれ攻撃と防御の意思の強さを表すと捉えても，

(8)

Fig. 13 Trajectories of the puck and the mallet (Attack motions)

Fig. 14 Trajectories of the puck and the mallet (Block motions)

(9)

Fig. 16 Frequency histogram (Attack motion)

Fig. 17 Frequency histogram (Block motion)

Fig. 18 Frequency histogram (Disregard motion)

7.

結論本論文では，以下の成果によってエアホッケーロボットシステムのエンターテインメントロボットとしての価値を向上させた．（1）反応特性係数を動作フィルタに導入することで，エアホッケーロボットの反応特性を調整可能にした．（2）意思決定変数をAHPに組み込むことで，意思決定の傾向を外部から直感的に調整可能にした．また，今後の課題として攻撃動作の改良による得点能力の向上や，動作選択肢の追加などを考えている．参考文献 [ 1 ]セイコープレシジョン：人と遊べる「エアホッケーロボット改良型」を開発，セイコープレシジョンニュースリリース，2003 年 7 月． [ 2 ] B.E. Bishop and M.W. Spong: “Vision-Based Control of an

Air Hockey Playing Robot,” IEEE Control Systems Magazine, pp.23–32, 1999.

[ 3 ]牧野道徳，根来寿，賈松敏，中後大輔，高瀬國克：“PC ベースの高速画像処理を用いたエアホッケーロボットの開発（第 2 報：ハンドアイ協調による動作システムの実装と評価）”，第 8 回システムインテグレーション部門講演会（SI2007），pp.559–560, 2007.

[ 4 ] D.C. Bentivegna, C.G. Atkeson and G. Cheng: “A Framework for Learning from Observation using Primitives,”日本ロボット学会誌，vol.22, no.2, pp.176–181, 2004.

[ 5 ] W.-J. Wang, I. Tsai, Z.-D. Chen and G.-H. Wang: “A vision based air hockey system with fuzzy control,” IEEE Int. Conf. on Control Applications, vol.2, no.4, pp.754–759, 2002. [ 6 ] Nuvation Research社，Air-HockeyBot 1000: Nuvation

intro-duces a robot that aims to top humans playing air hockey, Nuvation Current Headlines, 2008年 6 月 19 日．

[ 7 ] Barrett Technology社，URL : http://www.barrett.com [ 8 ] I. Ishii, T. Tatebe, Q. Gu, Y. Moriue, T. Takaki and K. Tajima:

“2000 fps Real-time Vision System with High-frame-rate Video Recording,” Proc. of the 2010 IEEE International Conference on Robotics and Automation (ICRA2010), pp.1536–1541, 2010. [ 9 ]吉川恒夫：ロボット制御基礎論．コロナ社，1988. [10]木村栄蔵：入門 AHP—決断と合意形成のテクニック．日科技連，2000. [11]木村栄蔵：AHP の理論と実際．日科技連，2000. 松下左京（Sakyo Matsushita） 2010年 3 月千葉大学工学部電子機械工学科卒業．同年 4 月同大学大学院工学研究科人工システム科学専攻博士前期（修士）課程に進学，現在に至る．ロボットアームの高速動作，制御，ヒューマンロボットインタラクションに興味を持つ．並木明夫（Akio Namiki） 1994年東京大学工学部計数工学科卒業．1996 年東京大学大学院工学研究科計数工学専攻修士課程修了．1999 年同専攻博士課程修了．同年日本学術振興会リサーチアソシエート．2000 年科学技術振興機構研究員．2004 年東京大学大学院情報理工学研究科システム情報学専攻講師．2008 年千葉大学大学院工学研究科准教授．多指ロボットハンド，視覚フィードバック制御，センサフュージョンの研究に従事．博士（工学）．（日本ロボット学会正会員）