学位論文に関する研究業績 学術雑誌論文(査読付き)
著者名:五十嵐 守,小山 秀紀,出江 紳一.
論文名:初期乳児期における自発運動の変化を示すパラメータについての検討
-肘屈曲伸展運動の角加速度と角躍度に着目して-
掲載誌名:脳と発達(日本小児神経学会誌) Vol.49, No.1, 15-8, 2017.
(第II章)
Author: Mamoru Igarashi, Hideki Oyama, shin-ichi Izumi.
Title: Chaos Analysis of the Sequential Transform of Spontaneous Movements at Early Infants:
Angular Acceleration of Elbow Extension- -Flexion Movements.
Journal: In proceedings of 62th GfA Spring Conference on GfA, Dortmund (Hrsg.) Work in complex systems. Digital, networked, human ?!, RWTH, Aachen, Deutschland, p. C.9.8., 2016.
(第IV章)
国内学会発表
著者名:五十嵐 守,小山 秀紀,出江 紳一.
論文名:初期乳児期における自発運動の変化を示すパラメータの検討
-肘屈曲伸展運動の角加速度と角躍度に着目して-
掲載誌:第23回システム大会抄録集,ヒトをはかるHM15-01.
日本人間工学会システム学会(東京,早稲田大学)
発表日:平成27年3月13日 (第II章)
著者名:五十嵐 守,小山 秀紀,出江 紳一.
論文名:FFTスペクトルを用いた初期乳児期の自発運動の経時的変化の検討
-肘屈曲伸展運動の角加速度と角躍度に着目して-
掲載誌:The Japan journal of Ergonomics Vol 51, Supplement, 138-9, 2016.
日本人間工学会第56回大会(東京,芝浦工業大学)
発表日:平成27年6月13日
(第III章)
a
付録1.
Root mean square (RMS):二乗平均平方根について
RMSは,時間信号の平均的な大きさ(強度)を表すために用いられる.
ある量𝑥𝑥に対して𝑁𝑁個のデータが得られたとして,各データの値を𝑥𝑥 =𝑥𝑥𝑖𝑖(𝑖𝑖= 1,2,・・・,𝑁𝑁)と置 くと,𝑥𝑥の二乗平均平方根であるRMS[𝑥𝑥]は次のように定義される.
RMS[𝑥𝑥] =�𝑁𝑁1∑𝑁𝑁𝑖𝑖=1(𝑥𝑥𝑖𝑖)2 =�𝑥𝑥12+𝑥𝑥22+・・・+𝑥𝑥𝑁𝑁2
𝑁𝑁
b
付録2.
余弦定理について
今回,肘の屈曲伸展角度を求めるため,次のような手順で算出した.
手関節部を点𝐴𝐴,肘関節部を点𝐵𝐵,肩関節部を点𝐶𝐶とする3点を結ぶ △ 𝐴𝐴𝐵𝐵𝐶𝐶を決定する.
点𝐴𝐴の対辺BCを𝑎𝑎,点𝐵𝐵の対辺 CAを𝑏𝑏,点𝐶𝐶の対辺ABを𝑐𝑐とする.
△ 𝐴𝐴𝐵𝐵𝐶𝐶の各頂点A, B, C の空間座標はそれぞれ(𝐴𝐴𝑥𝑥,𝐴𝐴𝐴𝐴,𝐴𝐴𝐴𝐴), (𝐵𝐵𝑥𝑥,𝐵𝐵𝐴𝐴,𝐵𝐵𝐴𝐴), (𝐶𝐶𝑥𝑥,𝐶𝐶𝐴𝐴,𝐶𝐶𝐴𝐴)とわかっ ているので,対辺 𝑎𝑎,𝑏𝑏,𝑐𝑐 の大きさは
| 𝑎𝑎 | =�{(𝐵𝐵𝑥𝑥 − 𝐶𝐶𝑥𝑥)2+ (𝐵𝐵𝐴𝐴 − 𝐶𝐶𝐴𝐴)2+ (𝐵𝐵𝐴𝐴 − 𝐶𝐶𝐴𝐴)2}
| 𝑏𝑏 | =�{(𝐶𝐶𝑥𝑥 − 𝐴𝐴𝑥𝑥)2+ (𝐶𝐶𝐴𝐴 − 𝐴𝐴𝐴𝐴)2+ (𝐶𝐶𝐴𝐴 − 𝐴𝐴𝐴𝐴)2}
| 𝑐𝑐 | =�{(𝐴𝐴𝑥𝑥 − 𝐵𝐵𝑥𝑥)2+ (𝐴𝐴𝐴𝐴 − 𝐵𝐵𝐴𝐴)2+ (𝐴𝐴𝐴𝐴 − 𝐵𝐵𝐴𝐴)2} で,算出される.
∠ABC を𝛽𝛽とおき,余弦定理を用いて肘関節部の角度を求めると,
𝑏𝑏2=𝑐𝑐2+𝑎𝑎2−2𝑐𝑐𝑎𝑎 𝑐𝑐𝑐𝑐𝑐𝑐𝛽𝛽 𝑐𝑐𝑐𝑐𝑐𝑐𝛽𝛽=𝑐𝑐2+𝑎𝑎2− 𝑏𝑏2
2𝑐𝑐𝑎𝑎 となり,cos𝛽𝛽の値から肘の角度にあたる∠ABCを求めた.
A
B C
c b
a 𝛽𝛽
c
付録3.
角速度・角加速度・角躍度の求め方について
本研究では,後退差分を用いて角度時系列データから,1階微分で角速度時系列データ,2 階微分で角加速度時系列データ,3階微分で角躍度時系列データを求めた.
時刻tにおける角度時系列データを
𝑓𝑓(𝑡𝑡) = (𝑥𝑥1,𝑥𝑥2,𝑥𝑥3,・・・,𝑥𝑥𝑡𝑡−2,𝑥𝑥𝑡𝑡−1,𝑥𝑥𝑡𝑡 ) とすると,
角速度時系列データ𝑓𝑓′(𝑡𝑡)は次の式で求められる.
𝑓𝑓′(𝑡𝑡) =�𝑥𝑥2− 𝑥𝑥1
𝑑𝑑𝑡𝑡 ,𝑥𝑥3− 𝑥𝑥2
𝑑𝑑𝑡𝑡 ,𝑥𝑥4− 𝑥𝑥3
𝑑𝑑𝑡𝑡 ,・・・,𝑥𝑥𝑡𝑡−3− 𝑥𝑥𝑡𝑡−2
𝑑𝑑𝑡𝑡 ,𝑥𝑥𝑡𝑡−2− 𝑥𝑥𝑡𝑡−1
𝑑𝑑𝑡𝑡 ,𝑥𝑥𝑡𝑡− 𝑥𝑥𝑡𝑡−1 𝑑𝑑𝑡𝑡 �
角加速度時系列データ𝑓𝑓′′(𝑡𝑡)は次の式で求められる.
𝑓𝑓′′(𝑡𝑡)
=�𝑥𝑥3−2𝑥𝑥2+𝑥𝑥1
𝑑𝑑𝑡𝑡2 ,𝑥𝑥4−2𝑥𝑥3+𝑥𝑥2
𝑑𝑑𝑡𝑡2 ,𝑥𝑥5−2𝑥𝑥4+𝑥𝑥3
𝑑𝑑𝑡𝑡2 ,・・・ , 𝑥𝑥𝑡𝑡−4−2𝑥𝑥𝑡𝑡−3+𝑥𝑥𝑡𝑡−2
𝑑𝑑𝑡𝑡2 ,𝑥𝑥𝑡𝑡−3−2𝑥𝑥𝑡𝑡−2+ 1𝑥𝑥𝑡𝑡−1
𝑑𝑑𝑡𝑡2 ,𝑥𝑥𝑡𝑡−2−2𝑥𝑥𝑡𝑡−1− 𝑥𝑥𝑡𝑡
𝑑𝑑𝑡𝑡2 �
角躍度時系列データ𝑓𝑓′′′(𝑡𝑡)は次の式で求められる.
𝑓𝑓′′′(𝑡𝑡)
=�𝑥𝑥4−3𝑥𝑥3+ 3𝑥𝑥2− 𝑥𝑥1
𝑑𝑑𝑡𝑡3 ,𝑥𝑥5−3𝑥𝑥4+ 3𝑥𝑥3− 𝑥𝑥2
𝑑𝑑𝑡𝑡3 ,𝑥𝑥6−3𝑥𝑥5+ 3𝑥𝑥4− 𝑥𝑥3
𝑑𝑑𝑡𝑡3 ,・・・ , 𝑥𝑥𝑡𝑡−5−3𝑥𝑥𝑡𝑡−4+ 3𝑥𝑥𝑡𝑡−3− 𝑥𝑥𝑡𝑡−2
𝑑𝑑𝑡𝑡3 ,𝑥𝑥𝑡𝑡−4−3𝑥𝑥𝑡𝑡−3+ 3𝑥𝑥𝑡𝑡−2− 𝑥𝑥𝑡𝑡−1
𝑑𝑑𝑡𝑡3 ,𝑥𝑥𝑡𝑡−3−3𝑥𝑥𝑡𝑡−2+ 3𝑥𝑥𝑡𝑡−1− 𝑥𝑥𝑡𝑡
𝑑𝑑𝑡𝑡3 �
d
付録4.
多重連鎖代入法について
はじめに
データに欠損が生じると利用可能なデータサイズが縮小してしまう.また実データと欠 測データとの間に体系的な違いがある場合,統計分析の結果に偏りを生じる恐れがでる.
欠測データを生まない最善の方法は,研究の初期段階で研究方法を丹念に設計し緻密に データを収集することであるが,実データには必ずと言って良いほど欠測データが発生す る.
実際の統計分析において何らかの形で欠測値に対応することが求められており,そこで 欠測データへの対処法の一つとして,多重代入法(Multiple Imputation)が提唱されている
(Rubin,1987).多重代入法は,不完全データを用いた統計分析が完全データを用いた統 計分析と同様に,統計的に妥当とみなされる対処法とされる.
1.欠測値と補定について
次のような欠損値を含むデータセットに対して,髙橋らは次のように説明している.
ID 身長 年齢 国籍 性別 体重
1 174 31 米国 男 62
2 161 45 米国 女 48
3 158 24 日本 女 42
4 163 52 米国 女 58
5 172 29 日本 男 70
6 153 38 日本 女 46
7 178 28 米国 男 70
8 170 44 日本 男 63
9 欠測 40 日本 男 69
(高橋らより引用)
通常,欠測値の対処法として使用されるリストワイズ除去法では,未知の欠測値を含む行 を削除し,データセットを擬似的に長方形にすることで,統計分析を可能とする.
しかし,その行の欠測を含まない変数(年齢,国籍,性別,体重)の貴重なデータも捨て 去ってしまう.
e
欠測を含む変数が何であるか分からず,データセット内に他の補助変数の情報も無い状 況であれば,欠測値は-∞から∞までのどの値をとるか,全く見当も付かないことになり,
リストワイズもしかたがないが,欠測を含む変数が「身長」であることがわかっているので,
欠測値は完全に未知ではない.年齢変数を見ると成人のデータであることがわかっている ので,ギネスの記録によれば約55㎝から272㎝の範囲に入ると推定できる.これだけの情 報があると「-∞~∞」という途方もない範囲から「55㎝から 272㎝」という有限の範囲 に候補を狭めることができる.また,他の情報変数を見ると日本人成人男性であることがわ かっているので,日本人成人男性の平均身長は170㎝,標準偏差は5.8程度で近似的に正規 分布していると考えられる.
したがって,ほぼ100%に近い確率で「140㎝から200㎝」の身長であると推定できる.
これにより「55㎝から272㎝」の範囲から「140㎝から200㎝」まで狭めることができる.
さらに日本人成人男性の身長と体重の相関データでは身長178㎝の人の平均体重が約69キ ログラムになるため,体重69キログラムの身長は178㎝ぐらいと推定できる.
このように論理や実データに基づいて欠測値の取り得る範囲を狭めてゆき,本来ならば 未 知 で あ る は ず の 欠 測 値 を 推 定 し て 合 理 的 な 値 に 置 き 換 え る 作 業 の こ と を 補 定 (imputation)と呼ぶ(de Waal, et al. 2011).
だが,体重 69 キログラムの日本人成人男性のすべてが身長 178 ㎝であるとは信じがた い.おおよそ178㎝の周辺の値であると思われるのだが,中には178㎝以上の人もいれば,
178 ㎝未満の人もいることが考えられ,合理的に 178 ㎝くらいだと推定はできるものの,
厳密には1つの値を特定することはできない.
欠測値は観測されず未知のため,補定値には常に不確実性がつきまとう.単一代入法では不 確実性に対処できないため,多重代入法の理論が提唱されてきた.
2.多重代入法について
多重代入法の基本的なメカニズムを以下に簡潔に説明する(Rubin, 1987; King et al. 2001;
高橋,伊藤,2013).
多重代入法では,観測データを条件として,欠測データの事後分布を構築し,この事後分 布から無作為抽出を行うことで,欠測値を𝑀𝑀個(𝑀𝑀> 1)のシミュレーション値に置き換える ことで,補定にまつわる不確実性を反映させた𝑀𝑀個の補定済みデータセットを別々に使用し て統計分析を行い,しかるべき手法により結果を統合し,点推定を算出している.
f
𝑀𝑀= 5の多重代入法の概要を下図に示す.
代入(mids) 解析(mira) 統合(mipo)
3.多重代入法における主要なステップ
上の図は多重代入法における 3 つの主要なステップを表している.代入(mids),解析 (mira),統合(mipo)である.多重代入法により生成した𝑀𝑀個の補定済みデータセットを別々 に使用して,𝑡𝑡検定や回帰分析などの統計分析を行い,以下のとおり推定値を統合し,点推 定値を算出する.𝜃𝜃�𝑚𝑚をパラメータ𝜃𝜃の𝑚𝑚番目の補定済データセットに基づいた推定値とする.
統合した点推定値𝜃𝜃̅𝑀𝑀は 式のとおりである.
𝜃𝜃̅𝑀𝑀= 1
𝑀𝑀 � 𝜃𝜃�𝑚𝑚 𝑀𝑀 𝑚𝑚=1
𝜃𝜃̅𝑀𝑀の分散𝑇𝑇𝑚𝑚は,次式のとおりである.𝑣𝑣̅𝑀𝑀は補定内分散の平均,𝑣𝑣�𝑀𝑀は補定間分散の平均であ る.𝜃𝜃̅𝑀𝑀の分散は,補定内分散𝑣𝑣̅𝑀𝑀と補定間𝑣𝑣�𝑀𝑀を考慮に入れたもので表される.
𝑇𝑇𝑀𝑀=𝑣𝑣̅𝑀𝑀+�1 + 1
𝑀𝑀� 𝑣𝑣�𝑀𝑀= 1
𝑀𝑀 � 𝑣𝑣𝑚𝑚
𝑀𝑀
𝑚𝑚=1
+�1 + 1 𝑀𝑀� �
1
𝑀𝑀 −1� �𝜃𝜃�𝑚𝑚− 𝜃𝜃̅𝑀𝑀�2
𝑀𝑀
𝑚𝑚=1
�
欠測値を補定する際に多変量正規分布を想定しているので,補定モデルは線形である.変 数𝑗𝑗の𝑖𝑖行の観測値𝑌𝑌�𝑖𝑖𝑖𝑖は 式より算出した補定値であり,~は適切な事後分布からの無作為抽 出を示す.また,𝛽𝛽は回帰係数,εは根本的(根源的)不確実性を表す.
incomplete data imputed data analysis data pooled data
1
2
3
4
5
1
2
3
4
5
g
𝑌𝑌�𝑖𝑖𝑖𝑖 =𝑌𝑌𝑖𝑖,−𝑖𝑖𝛽𝛽�+𝜀𝜀̃𝑖𝑖
次のデータセットは多重代入法による補定済みのデータセットを付置したものである.
身長�=𝛽𝛽�0+𝛽𝛽�1年齢
𝑖𝑖+𝛽𝛽�2国籍
𝑖𝑖+𝛽𝛽�3性別
𝑖𝑖+𝛽𝛽�4体重
𝑖𝑖+𝜀𝜀̃𝑖𝑖
を算出したものである.
ID 身長 年齢 国籍 性別 体重 補定
1
補定 2
補定 3
補定 4
補定 5
1 174 31 米国 男 62 174 174 174 174 174
2 161 45 米国 女 48 161 161 161 161 161
3 158 24 日本 女 42 158 158 158 158 158
4 163 52 米国 女 58 163 163 163 163 163
5 172 29 日本 男 70 172 172 172 172 172
6 153 38 日本 女 46 153 153 153 153 153
7 178 28 米国 男 70 178 178 178 178 178
8 170 44 日本 男 63 170 170 170 170 170
9 欠測 40 日本 男 69 184.8 174.6 178.3 177.0 173.0
(高橋らより引用)
回帰係数の算出に必要な情報は平均値,分散,共分散の情報であり,これらはすべて 𝜇𝜇 と 𝛴𝛴 に含まれているので, 𝜇𝜇 と 𝛴𝛴 が完全に既知であるならば,𝑌𝑌𝑖𝑖に基づいて真の回帰係数𝛽𝛽 を決定的に算出することができ,欠測値も決定的に補定することができる.
この場合完全データの尤度関数は,次のとおりになる.
L�𝜇𝜇,𝛴𝛴|D� ∝ � 𝑁𝑁(𝑌𝑌𝑖𝑖|𝜇𝜇,Σ)
𝑛𝑛
𝑖𝑖=1
しかしながら,ほとんどのデータセットにはほぼ常に欠測値が含まれているので,𝜇𝜇 と 𝛴𝛴 が完全に既知ではなく𝛽𝛽の推定値に関して確信を持つことができない.
そこで,観測データ𝑌𝑌𝑖𝑖,𝑜𝑜𝑜𝑜𝑜𝑜をμのサブベクトルとし𝛴𝛴𝑖𝑖,𝑜𝑜𝑜𝑜𝑜𝑜をΣのサブ行列とする.
周辺分布は正規であるので,観測データ𝑌𝑌𝑜𝑜𝑜𝑜𝑜𝑜の尤度関数は,次式になる.
L�𝜇𝜇,Σ|𝑌𝑌𝑜𝑜𝑜𝑜𝑜𝑜� ∝ � 𝑁𝑁�𝑌𝑌𝑖𝑖,𝑜𝑜𝑜𝑜𝑜𝑜 |𝜇𝜇𝑖𝑖,𝑜𝑜𝑜𝑜𝑜𝑜 ,Σ𝑖𝑖,𝑜𝑜𝑜𝑜𝑜𝑜�
𝑛𝑛
𝑖𝑖=1
h
𝛽𝛽�は通常最小二乗法における𝛽𝛽の推定値𝛽𝛽̂とは異なり,推定不確実性が存在していることを 意味している.しかし,伝統的な手法により 式を算出して事後分布から 𝜇𝜇 と 𝛴𝛴 を無作 為に抽出することは難しいといわれている(Allison PD,2002. de Waal T et al. 2011).
4.多重代入法の歴史的背景,アルゴリズムとコンピュータソフトウェアについて 4.1. 多重代入法の歴史的背景
1970年代後半には,ハーバード大学統計学科の Rubin(1978)により多重代入法の理論が 提案されていた.Rubinによって提唱されたオリジナルの多重代入理論は,ベイズ統計学の 枠組みで構築され,マルコフ連鎖モンテカルロ法(Markov chain Monte Carlo: MCMC)に基づ いていた.
MCMCのメカニズムについて
モンテカルロ法は,シミュレーション手法の1つであり,シリーズと呼ばれる一連のシ ミュレーション値を何らかの確率分布に基づいて生成するものである.
マルコフ連鎖は,𝑡𝑡 の時点におけるシリーズ内の位置から別の位置に移動する確率が,
シリーズ内の現在の位置𝜃𝜃𝑡𝑡にのみ依存するという確率過程(stochastic process)である.した がって,前期までの値𝜃𝜃𝑡𝑡 ,・・・,𝜃𝜃𝑡𝑡−1から条件付きで独立となる.
MCMC の基本的なメカニズムは,もしこの連鎖が無限に長く繰り返されたならば,対象 となる事後分布を見つけることができるという点にあるので,連鎖を繰り返し行うことに より,これらの値の基本統計量を生成することができる.
MCMC のメカニズムは,こうして得られた分布からのシミュレーション値の各々が,系 列的に相関があるにもかかわらず,最終的に,周辺分布から独立した抽出値と見なせるとい う優位点を有している(Gill, 2008).
デ ー タ 拡 大 法(Data Augmentation: DA)は ,MCMC の 計 算 ア ル ゴ リ ズ ム で あ る .
Augmentationは「拡大」という意味であるが,DA法では,データの欠測している箇所に適
当な値(初期値𝜃𝜃0)を付置することで擬似的にデータを「拡大」して一時的な完全データを作 成し,ここから繰り返し手法を用いて推定値を徐々に改善してゆく方法であり,DA 法は マルコフ連鎖を形成している.
データ拡大法の基本的メカニズムは,初期値𝜃𝜃0から観測データを条件として生成した欠 測値の分布から補定値を生成し(Imputation Step: I-step),事後分布からパラメータ値を生成 し(Posterior Step: P-step),収束するまでにこれら 2 つのステップを繰り返すものである (Little and Rubin, 2002).
I-step: 𝑃𝑃(𝑌𝑌𝑚𝑚𝑖𝑖𝑜𝑜 |𝑌𝑌𝑜𝑜𝑜𝑜𝑜𝑜 ,𝜃𝜃𝑡𝑡)に基づいて,𝑌𝑌𝑚𝑚𝑖𝑖𝑜𝑜(𝑡𝑡+1)を生成する.
P-step: 𝑃𝑃�𝜃𝜃 |𝑌𝑌𝑜𝑜𝑜𝑜𝑜𝑜 ,𝑌𝑌𝑚𝑚𝑖𝑖𝑜𝑜(𝑡𝑡+1)�に基づいて,𝜃𝜃𝑡𝑡+1を生成する.
ここで𝜃𝜃は未知のパラメータであり,𝑡𝑡は繰り返し回数を意味しており,𝑃𝑃(𝑌𝑌𝑚𝑚𝑖𝑖𝑜𝑜 |𝑌𝑌𝑜𝑜𝑜𝑜𝑜𝑜 ,𝜃𝜃𝑡𝑡)