第 2 章 オペラント学習機能を有する筋電識別器の設計
2.2. システム設計
2.2.3. オペラント学習機能の設計
本研究では,2.2項で述べたように,既存の筋電パターン識別器の識別結果の クラスと動作パターンを報酬による探索する,オペラント学習機能を有する筋 電識別器を提案する.ここで,加藤らによるニューラルネットワークを用いた筋 電を識別器のブロック図を図
14
に示す.ここで,特徴抽出のためのGFEはフー…
先行研究 提案システム
入力層 9×筋電チャンネル数=36 9×筋電チャンネル数=27
隠れ層 42 32
出力層 8 32
アルゴリズム バックプロパゲーション バックプロパゲーション
学習ステップ数 30,000 10,000
学習係数 0.05 0.1
リエ変換,fSGはシグモイド関数,w1,w2はニューラルネットワークの重み行列,
GPRはニューラルネットワークの出力から識別パターンを選択する関数,GH は 教示における人による判断とその入力をモデル化した関数,GBPはニューラルネ ットワークの学習を行うバックプロパゲーションである.下記関数については
3.1
項で解説するが,ここで問題となるのは,GHにおいて使用者は,把持形態に 対応する筋電パターンを既知である必要があることである.図
14
パターン識別方式における識別器の学習法これに対し,図
15
に示す本研究の提案手法では,GHにおいて使用者は把持形 態が意図したものであるか否かのみを判断すればよく,筋電パターンの探索と 選定は,オペラント学習を行う関数GMが代行する.具体的には,関数GMによ り,バックプロパゲーションの学習データXrefが修正される.ここで,buffはニ ューラルネットワークからの出力をバッファしたベクトル GTS は平滑化フィル タである.つまり,ここでGH(y)は単純なデルタ関数としてモデル化でき,使用者が意図した動作パターンをy’とすると
𝑟 = 𝐺
H(𝑜)
𝑟 = 𝛿
𝑦,𝑦′∵ { 𝛿 = 0 (𝑦 ≠ 𝑦
′) 𝛿 = 1 (𝑦 = 𝑦
′)
(1)
と表される.これにより,自身の筋電パターンに関する知識がなくとも識別器を 学習させることが可能となる.把持形態の判断の際,意図した動作と義手の動作 が異なっていた場合に,ボタンを押して負報酬rをGMに入力することで,オペ ラント条件付けを行う.2.1でも述べたが,報酬により学習を行うアルゴリズム において,報酬の正確性は学習の収束に大きく影響する.筋電パターン識別にお いては,その出力が不安定であるため,負報酬の入力タイミングをロバストなも のとする必要がある.そのため,義手が意図した動作を行っているにも関わらず 負報酬を入力してしまうことを避けるため,識別安定化フィルタ GTS を用いて 平滑化を行う.以上により,
2.1
項で抽出された課題に対して対処可能なアルゴ リズムが設計された.設計されたアルゴリズムに関して,識別安定化フィルタGTSに関しては第
3
章 において,式(2)におけるNの探索を行う.また,式(4)のオペラント学習による 識別器修正アルゴリズムGMについては,第4
章においてその理論を実験により 評価する.𝐛𝐮𝐟𝐟 = {𝑦
1, 𝑦
2, 𝑦
3, … , 𝑦
𝑁} (2)
𝐺
TS(𝐛𝐮𝐟𝐟) = 𝑜
∵ 𝑜
= {
𝑚
𝑖(𝑝
𝑖≥ 0.5) 𝑚
𝑖, 𝑚
𝑗, 𝑚
𝑘( 1
𝑐 + 1 ≤ 𝑝
𝑖, 𝑝
𝑗, 𝑝
𝑘< 0.5) 𝜙 (𝑝
𝑖< 1
𝑐 + 1 ) (p
iは動作パターンmiがbuff内に占める割合)(3)
𝐺
M(𝒙, 𝑟, 𝑦) = 𝑋
ref𝑡+1= 𝑋
ref𝑡± [ 𝒙
𝑖𝑜 ] (4)
図