EPSP
3.5 MEND による素量解析
図3.8: 乱数による放出確率
図3.9: シミュレーション用データ(件数)
最尤推定の計算はE-M(Expectation-Maximization)アルゴリズム[37]を用い、ディコン ボリューションにおいてヒストグラム状のデータからガウス分布で仮定したノイズの影響 を弱めていく。
最尤推定は多くの分野で用いられている方法であるが、繰り返し述べているようにこの 方法だけでは、ノイズによって起きる小さな山までを忠実に再現してしまうという欠点が ある。そこであまりにも忠実に小さな山を再現しないよう、推定をフラットにする調整を 行うため、この働きのある最大エントロピー法(MEM:Maximum Entropy Method)[41]を 参考にしたエントロピーの値を同時に用いる。
この調整は、最尤推定の式にエントロピーの値を項としてつけ加え、適合度の考えを使っ て最尤推定、エントロピーそれぞれの影響度の比率を調節することにより行われる。こう してエントロピーの項は、ノイズからくる小さな山をフラットにする役目を果たすことに なる。ノイズの多い世界でのディコンボリューション法として、この調整は適合度検定の 考えを利用して有意水準 =0:5 (50%)が経験的にも良いことが分かっている[41]。これ はシミュレーションで視覚的に求められた結果であるが、もとの信号の分布において、各
図3.10: シミュレーション用データ(確率)
サイトの放出確率を0.5 とした点に合致している。またこうした生体の場合には、50%の データについて棄却可能と考えることもできるのではないか。これらの実験結果について は次節で述べる。
3.5.2 MEND
の計算方法
もとの信号にノイズをコンボリューションし、瓶詰めされた信号のヒストグラムの振幅 をa(ai;i=1;111;N)、ノイズをg(gi;i =1;111;k;111;N)(ただしkは定数で、gkは0mV を示す)、もとの信号をs(sj;j = 1;111;N)とおくと、尤度関数Lはつぎのとおりとなる。
ここでNはヒストグラムの瓶の数である。
L= N
X
i=1 a
i log
0
@ N
X
j=1 s
j g
i0j+k 1
A
(3:4)
式(3.4)において、aiとsjおよびgiともにヒストグラムの瓶詰めの幅は同一であり、sと
gが線形に作用するものと仮定する。各aiにおけるs3g(ただし3はたたみこみを表す)の
その結果、a =logs3gより尤度Lが最大となるsjを探せば、尤もらしい値が求まること になる。
P
N
j=1 s
j g
i0j+kは離散型のたたみこみ積和である。この尤度関数の最大値を求めるため、つ
ぎのようにEMアルゴリズム[40]を用いる。
s +
j
= 1
P
N
i=1 a
i N
X
i=1 a
i h
ij
(3:5)
h
ij
= s
j g
i0j+k
P
N
j=1 s
j g
i0j+k
(3:6)
式(3.5)においてhijは事後確率的な計算になっており、式(3.6)の分子のsjは適当な小さ な値から計算を始める。s+j は初期値としてsjに再設定され、収束条件まで繰り返し計算を 行う。ここで使用したE-Mアルゴリズムは、E(Exp ectation)ステップとM(Maximization)
ステップとからなる。これはEステップで計算されたsjを、つぎのSステップで再度初期 値として設定しなおし、Mステップとして収束条件までこの計算を繰り返すものである。
この推定法によるディコンボリューションの結果は、あまりにも忠実に小さな山を再現 してしまい、もとの分布に合わない。そこでこの分布をフラットにする項を加え、より適 当な分布を求めようとするのがMENDである。フラットにするための計算としては、熱 力学から応用され、X線画像解析[41]でもよく使われる最大エントロピー法を参考にエン トロピーの値を用いる。MENDではsjの計算はつぎのとおりとなる(ただし式(3.8)は式
(3.6)に同じ)。
s +
j
=
1
P
N
i=1 a
i N
X
i=1 a
i h
ij
!
1
N
10
(3:7)
h
ij
= s
j g
i0j+k
P
N
j=1 s
j g
i0j+k
(3:8)
ここではラグランジェ乗数と似た働きをする。を0から1に増やすにつれて、エントロ ピーによる影響(フラットにする)は少なくなる。またエントロピーは通常0PNj=1
s
j log
e s
j
で表されるが、sの合計を1とするために式を変形し、0
e
N
P
N
j=1 s
j log
e s
j(∵e01e
N
= 1
N
) より最大値を求める。計算は小さいから始め、少しずつ値を増やしていく。この際、カ イ2乗検定を行い、カイ2乗の値が自由度より大きい間は を増やし、ほぼ等しくなった
ところで計算をやめる。有意水準 はこの後で検討しているように、0:05 (5%)の計算も 行っているが、0:5 (50%)が経験的によい。
また、瓶詰めされたデータを使っているための誤差をなくすためにgを離散値として計 算するつぎの式もKullmannによって提案されている。今後式(3.7)をMEND(I)、式(3.9) をMEND(II)と呼ぶ。
s +
j
= 1
M M
X
l=1 h(d
l 0v
j )
!
1
N
10
(3:9)
h(d
l 0v
j )=
s
j g(d
l 0v
j )
P
N
j=1 s
j g(d
l 0v
j )
(3:10)
式(3.10)において、d(dl;l = 1;111;M)、dlはM個の振幅の離散値を表す。またvjはsj における振幅値で、dl0vjにより計算された振幅に該当するノイズの強さがg(dl0vj)で 表される。したがって、MEND(I)式に比べてノイズの計算箇所がより精密になっている。
なお、カイ2乗検定では各区画の期待度数ができるだけ5以上となるようにしなければ ならない、という欠点を持つ。そこでここではカイ2乗検定の代わりに、コルモゴロフ−
スミルノフ検定を用いた方がより適切である。この場合は、小さい から始めて、有意水 準=0:5 のときは が0.5よりも小さい間、 を増やしていく。