MEND による素量解析 - JAIST Repository

EPSP

3.5 MEND による素量解析

図^3.8: 乱数による放出確率

図^3.9: シミュレーション用データ（件数）

最尤推定の計算はE-M(Expectation-Maximization)アルゴリズム^[37]を用い、ディコンボリューションにおいてヒストグラム状のデータからガウス分布で仮定したノイズの影響を弱めていく。

最尤推定は多くの分野で用いられている方法であるが、繰り返し述べているようにこの方法だけでは、ノイズによって起きる小さな山までを忠実に再現してしまうという欠点がある。そこであまりにも忠実に小さな山を再現しないよう、推定をフラットにする調整を行うため、この働きのある最大エントロピー法(MEM:Maximum Entropy Method)[41]を参考にしたエントロピーの値を同時に用いる。

この調整は、最尤推定の式にエントロピーの値を項としてつけ加え、適合度の考えを使って最尤推定、エントロピーそれぞれの影響度の比率を調節することにより行われる。こうしてエントロピーの項は、ノイズからくる小さな山をフラットにする役目を果たすことになる。ノイズの多い世界でのディコンボリューション法として、この調整は適合度検定の考えを利用して有意水準 ⁼^0:5 ^(50%)が経験的にも良いことが分かっている^[41]。これはシミュレーションで視覚的に求められた結果であるが、もとの信号の分布において、各

図^3.10: シミュレーション用データ（確率）

サイトの放出確率を^0.5 とした点に合致している。またこうした生体の場合には、^50%のデータについて棄却可能と考えることもできるのではないか。これらの実験結果については次節で述べる。

3.5.2 MEND

の計算方法

もとの信号にノイズをコンボリューションし、瓶詰めされた信号のヒストグラムの振幅を^a(aⁱ^;ⁱ⁼^1;¹¹¹^;^N⁾、ノイズを^g(gⁱ^;ⁱ ⁼^1;¹¹¹^;^k;¹¹¹^;^N⁾（ただし^kは定数で、^g^kは^0mV を示す）、もとの信号を^s(s^j^;^j ⁼ ^1;¹¹¹^;^N⁾とおくと、尤度関数Ｌはつぎのとおりとなる。

ここで^Nはヒストグラムの瓶の数である。

L= N

i=1 a

i log

@ N

j=1 s

j g

i0j+k 1

(3:4)

式^(3.4)において、^aⁱと^s^jおよび^gⁱともにヒストグラムの瓶詰めの幅は同一であり、^sと

gが線形に作用するものと仮定する。各^aⁱにおける^s³^g（ただし³はたたみこみを表す）の

その結果、^a ⁼^log^s³^gより尤度^Lが最大となる^sjを探せば、尤もらしい値が求まることになる。

j=1 s

j g

i0j+kは離散型のたたみこみ積和である。この尤度関数の最大値を求めるため、つ

ぎのように^EMアルゴリズム^[40]を用いる。

s +

= 1

i=1 a

i N

i=1 a

i h

(3:5)

= s

j g

i0j+k

j=1 s

j g

i0j+k

(3:6)

式^(3.5)において^hijは事後確率的な計算になっており、式^(3.6)の分子の^sjは適当な小さな値から計算を始める。^s⁺j は初期値として^s^jに再設定され、収束条件まで繰り返し計算を行う。ここで使用した^E-Mアルゴリズムは、E(Exp ectation)ステップとM(Maximization)

ステップとからなる。これは^Eステップで計算された^s^jを、つぎの^Sステップで再度初期値として設定しなおし、^Mステップとして収束条件までこの計算を繰り返すものである。

この推定法によるディコンボリューションの結果は、あまりにも忠実に小さな山を再現してしまい、もとの分布に合わない。そこでこの分布をフラットにする項を加え、より適当な分布を求めようとするのが^MENDである。フラットにするための計算としては、熱力学から応用され、^X線画像解析^[41]でもよく使われる最大エントロピー法を参考にエントロピーの値を用いる。^MENDでは^sjの計算はつぎのとおりとなる（ただし式^(3.8)は式

(3.6)に同じ）。

s +

i=1 a

i N

i=1 a

i h

(3:7)

= s

j g

i0j+k

j=1 s

j g

i0j+k

(3:8)

ここではラグランジェ乗数と似た働きをする。を⁰から¹に増やすにつれて、エントロピーによる影響（フラットにする）は少なくなる。またエントロピーは通常⁰^P^Nj=1

j log

e s

で表されるが、^sの合計を¹とするために式を変形し、⁰

j=1 s

j log

e s

j（∵^e⁰¹^e

= 1

）より最大値を求める。計算は小さいから始め、少しずつ値を増やしていく。この際、カイ²乗検定を行い、カイ²乗の値が自由度より大きい間はを増やし、ほぼ等しくなった

ところで計算をやめる。有意水準はこの後で検討しているように、^0:05 ^(5%)の計算も行っているが、^0:5 ^(50%)が経験的によい。

また、瓶詰めされたデータを使っているための誤差をなくすために^gを離散値として計算するつぎの式も^Kullmannによって提案されている。今後式^(3.7)を^MEND(I)、式^(3.9) を^MEND(II)と呼ぶ。

s +

= 1

M M

l=1 h(d

l 0v

j )

(3:9)

h(d

l 0v

j )=

j g(d

l 0v

j )

j=1 s

j g(d

l 0v

j )

(3:10)

式^(3.10)において、^d(d^l^;^l ⁼ ^1;¹¹¹^;^M⁾、^d^lは^M個の振幅の離散値を表す。また^v^jは^s^j における振幅値で、^d^l⁰^v^jにより計算された振幅に該当するノイズの強さが^g(d^l⁰^v^j⁾で表される。したがって、^MEND(I)式に比べてノイズの計算箇所がより精密になっている。

なお、カイ²乗検定では各区画の期待度数ができるだけ⁵以上となるようにしなければならない、という欠点を持つ。そこでここではカイ²乗検定の代わりに、コルモゴロフ−

スミルノフ検定を用いた方がより適切である。この場合は、小さいから始めて、有意水準⁼^0:5 のときはが^0.5よりも小さい間、を増やしていく。

ドキュメント内 JAIST Repository (ページ 45-49)