lim xx x llllll tt =logx! xx ですつまり xxが十分に大きければ llllll tt logx! ですこの式は単純な式で慣れてくれば直感的にわからないこともないのですがきちんとこれを証明するには手間がかかり途中でいくつかのテクニックを使う必要がありますこの証

(1)

3-4. 正規分布 3-4-1. 二項分布から正規分布を導く二項分布は、比率データーに関する確率分布ですから、不連続です。_{𝑛𝑛が大きくなったら、} 次第になめらかな曲線に近くなってくるでしょう。_{𝑛𝑛を無限個にすれば、完全に滑らかにな} るはずです。_{𝑛𝑛を無限大にするときに、2 つの方向が考えられます。一つは、𝑝𝑝を一定にして、} 𝑛𝑛を無限大に大きくする方向です。これが正規分布です。すでに、二項分布のところで、𝑝𝑝 を一定にしながら_{𝑛𝑛を大きくするということを試してみました。これら例からわかるように、} 次第に、左右相称になり、分散が一定の値に近づきます。二項分布の正規分布への拡張の目的の一つは、身長や体重のような、比率データーではない連続した値をとるデーターを統計的に扱うための拡張です。いくつかのグループのデータを比較して、その差の有意性を判断することを可能にするためです。拡張のもう一つの方向は、平均値_{𝑛𝑛𝑝𝑝を一定にして、} 𝑝𝑝 を小さくして𝑛𝑛を大ききしていく方向です。その結果、分布は大きく偏っていきます。これがポアソン分布です。_{𝑝𝑝を小さくすることからわかるように、ポアソン分布は極めてまれ} に起こる現象についての分析に使います。ポサソン分布は水産の世界では、たとえば、プランクトンの計数などのときに、きわめて稀な種類が、計数版の方形枠の中に現れたり現れなかったりする場合などに使います。ここでは、まず、正規分布について考えます。二項分布の正規分布への拡張。二項分布_{B(𝑛𝑛, 𝑝𝑝)で確率𝑝𝑝の現象が現れる回数 k の関数としてあらわすと。} 𝑊𝑊(𝑘𝑘) =𝑛𝑛 𝐶𝐶𝑘𝑘𝑝𝑝𝑘𝑘𝑞𝑞(1−𝑘𝑘) コンビネーション記号を書き換えて分数で表すと 𝑊𝑊(𝑘𝑘) =_{𝑘𝑘!(𝑛𝑛−𝑘𝑘)!}𝑛𝑛! 𝑝𝑝𝑘𝑘_𝑞𝑞(𝑛𝑛−𝑘𝑘)_p+q=1 これを対数にすると

logW(𝑘𝑘) = log(𝑛𝑛!) − log(𝑘𝑘!) − log(𝑛𝑛 − 𝑘𝑘)! + 𝑘𝑘 log(𝑝𝑝) + (𝑛𝑛 − 𝑘𝑘) log(𝑞𝑞) となります。こうすると、複雑な式が対数の足し算に単純化できます。掛け算の形が足し算になったためにそれぞれの項を独立して考えることができます。ここでは、_{k を連続変数（整数にか} かぎらず様々な値をとる実数）として、W(k)の形を考えるのですから、k=x と書き換えておきましょう。（一種の習慣です。ｋは様々な値をとる不連続な整数のイメージです。これに対してx は連続して様々な値をとる実数のイメージです。）

logW(𝑥𝑥) = log(𝑛𝑛!) − log(𝑥𝑥!) − log(𝑛𝑛 − 𝑥𝑥)! + 𝑘𝑘 log(𝑝𝑝) + (𝑛𝑛 − 𝑥𝑥) log(𝑞𝑞) 式17 突然ですが、

(2)

lim𝑥𝑥→∞∫ 𝑙𝑙𝑙𝑙𝑙𝑙₁ｘ 𝑡𝑡 𝑑𝑑𝑡𝑡=logx! です。つまり、_{𝑥𝑥が十分に大きければ、∫ 𝑙𝑙𝑙𝑙𝑙𝑙}𝑥𝑥 1 𝑡𝑡 𝑑𝑑𝑡𝑡 ≒logx!です。この式は単純な式で、慣れてくれば直感的にわからないこともないのですが、きちんと、これを証明するには手間がかかり、途中でいくつかのテクニックを使う必要があります。この証明をしますが、長い退屈な証明なので、そういうことが嫌いな人は、ここは適当に読み飛ばしてください。それでも問題ないと思いますが、何をしているのか理解するためには、読んでおくと参考になるかもしれません。 lim𝑥𝑥→∞∫ 𝑙𝑙𝑙𝑙𝑙𝑙₁ｘ 𝑡𝑡 𝑑𝑑𝑡𝑡 = log 𝑥𝑥! の証明この式は、 limｘ_→∞ ∫ log𝑒𝑒𝑡𝑡𝑡𝑡𝑡𝑡 ｘ１ log𝑒𝑒𝑥𝑥! = 1 の変形です。元の式の意味を考えながら、この形に持っていきます。元の式の極限記号の中 � log 𝑡𝑡𝑑𝑑𝑡𝑡 ｘ１の意味は、曲線log t と x 軸、直線 x=x に囲まれた次の図形の面積を求めるということです。図18-1, 対数の積分の極限の計算- この図に次のように、いくつかの長方形を書き加えます。 -1 -0.5 0 0.5 1 1.5 2 0 1 2 3 4

x

5 6

(3)

図18-2, 対数の積分の極限式の計算-2 この図は、以下の２つの図とlog t の曲線を重ね合わせたものです。図18-3, 対数の積分の極限式の計算-3 図18-4, 対数の積分の極限式の計算-4 図18-3 の４つの４角形の面積の合計を考えます。１つの４角形の幅は１です。そうすると、たとえば、一番左の四角形の面積は log2 ×1=log2 ですね。４つの四角形の面積の合計は log 2+log3+log4+log5 です。つまり log5!になります。

X がもっと大きくなった場合について一般化すると、面積の合計は logx!です。同じようにして、図18-4 の黄色い四角形の面積の合計は、log(x-1)!です。ここで、面積の大きさを比べると、図 18-3 の四角形の面積の合計が一番大きくて、次が ∫ log 𝑡𝑡𝑑𝑑𝑡𝑡１ｘ、で、図18-4 の四角形の面積の合計が一番小さいということに気が付きます。不等号で表すと次のようになります。 -1 -0.5 0 0.5 1 1.5 2 0 1 2 3 4 5 6

x

(4)

log(𝑥𝑥 − 1)! < � log 𝑡𝑡𝑑𝑑𝑡𝑡 ｘ１ < log 𝑥𝑥! X は１以上の整数なのだから、log 𝑥𝑥 !は正の値になります。したがって、log 𝑥𝑥 !で各辺を割っても不等号の向きは変わらないでしょう。ですから、 log(𝑥𝑥−1)! log 𝑥𝑥! < ∫ log 𝑡𝑡𝑡𝑡𝑡𝑡₁𝑥𝑥 log 𝑥𝑥! < log 𝑥𝑥! log 𝑥𝑥! 右辺が1 であることは明らかです（分母と分子が同じだから）。そこで一番左の辺について、その極限を考えます。 log(𝑥𝑥 − 1)! log 𝑥𝑥! =

log(𝑥𝑥 − 1) + log(𝑥𝑥 − 2) + ⋯ + log 1 log 𝑥𝑥!

=log 𝑥𝑥 + log(𝑥𝑥 − 1) + log(𝑥𝑥 − 2) + ⋯ + log 1 − log 𝑥𝑥_{log 𝑥𝑥!}

=log 𝑥𝑥! − log 𝑥𝑥_{log 𝑥𝑥!}

= 1 −_{log 𝑥𝑥!}log 𝑥𝑥 この式で、x が無限大に大きくなれば、式の２項目は０に近づくでしょう。このことは、私には自明のように思えますが、この辺の感覚は人によって違うかもせれません。念のために、手数をかけて証明しておきましょう。ありそうなのは、以下の証明です。証明したい内容は

lim𝑥𝑥→∞_{log 𝑥𝑥!}log 𝑥𝑥 = 0

です。

まず、以下の式がなりたつことを示します

log 𝑘𝑘! > log 𝑘𝑘 + log(𝑘𝑘 − 1) + ⋯ + log �𝑘𝑘₂� > �𝑘𝑘₂− 1)� log �𝑘𝑘₂� この式の意味は、以下の通りです。まず、_�ｋ２�ですが、ここでは、k 半分を超えない整数の意味で使っています。たとえば、k=5 の時は、_�ｋ２� = 2、k=4 の時も� ｋ２� = 2

左辺と真ん中の辺の_{log 𝑘𝑘! > log 𝑘𝑘 + log(𝑘𝑘 − 1) + ⋯ + log �}𝑘𝑘

2�のところは、部分が全体を超え

ることはないと言っているだけです。

(5)

で、これは正の数を足し合わせただけのものです。これの値が、それよりも少ない工数を足し合わせた

log log 𝑘𝑘 + log(𝑘𝑘 − 1) + ⋯ + log �𝑘𝑘_2� よりも大きいのは当然です。分かりにくいのは、右の不等式です。これは、次の図に示したことを言っているのです。黄色で示した四角形の面積の総和は、青で示した四角形の面積の総和を超えない。これで log 𝑘𝑘! > �𝑘𝑘_{2 − 1)� log �}𝑘𝑘_2� を示すことができました。図19 大小関係これをlog 𝑥𝑥 log 𝑥𝑥!に戻って考えると、x が１より大きいのでこの値は正ですから次のようになります。なお、分子が変わらずに分母により小さなものが入るので、不等号の向きは反対になります。 _{0 <} log 𝑥𝑥 log 𝑥𝑥!< log ｘ �𝑥𝑥₂−1� log𝑥𝑥₂= log 𝑥𝑥 �𝑥𝑥₂−1�(log 𝑥𝑥−log 2)= 1 �𝑥𝑥₂−1�(1−_log𝑥𝑥2 ) lim 𝑥𝑥→∞ 1 �𝑥𝑥2 − 1�(1 −log 𝑥𝑥)2 = 0 ですから、挟み撃ちの原理で、はさんでいる両側が０なのだからはさまれているものも０です。 lim 𝑥𝑥→∞ log 𝑥𝑥 log 𝑥𝑥! = 0 ということは、 lim 𝑥𝑥→∞(1 − log 𝑥𝑥 log 𝑥𝑥!) = 1 lim 𝑥𝑥→∞ log(𝑥𝑥 − 1)! log 𝑥𝑥! = 1 -1 -0.5 0 0.5 1 1.5 2 0 1 2 k/2 3 4 5 6

k

(6)

log(𝑥𝑥 − 1)! log 𝑥𝑥! < ∫ log 𝑡𝑡𝑑𝑑𝑡𝑡₁𝑥𝑥 log 𝑥𝑥! < log 𝑥𝑥! log 𝑥𝑥! = 1 で左辺もx を無限大にしたときの極限は１ですから、これも挟み撃ちの原理で。当然、∫ log 𝑡𝑡𝑡𝑡𝑡𝑡1𝑥𝑥 log 𝑥𝑥! についても limｘ_→∞ ∫ log 𝑡𝑡𝑡𝑡𝑡𝑡₁𝑥𝑥 log 𝑥𝑥! =1 です。分数の値が１ということは、分母分子が同じということですから、 lim ｘ_→∞� log 𝑡𝑡𝑑𝑑𝑡𝑡 𝑥𝑥 1 = log 𝑥𝑥! というか、x が十分大きい時 log 𝑥𝑥! ≒ � log 𝑡𝑡𝑑𝑑𝑡𝑡𝑥𝑥 1 です。長かったけど、証明終わり。ということで、式17 に戻ります。

logW(𝑥𝑥) ≒ log(n!) − log(𝑥𝑥!) − log(𝑛𝑛 − 𝑥𝑥)! + 𝑥𝑥log(𝑝𝑝) + (𝑛𝑛 − 𝑥𝑥) log(𝑞𝑞) ≒ log(𝑛𝑛!) − � log 𝑡𝑡𝑑𝑑𝑡𝑡 − �𝑛𝑛−𝑥𝑥log 𝑡𝑡𝑑𝑑𝑡𝑡 + 𝑥𝑥 log 𝑝𝑝 + (𝑛𝑛 − 𝑥𝑥) log 𝑞𝑞

1 𝑥𝑥

1

この両辺を微分します。

{log 𝑊𝑊(𝑥𝑥}′_{≒ −[log 𝑡𝑡]}₁𝑥𝑥_{+ [log 𝑡𝑡]}₁𝑛𝑛−𝑥𝑥_{+ log 𝑝𝑝 − log 𝑞𝑞} p+q=1、log1=0 ですから

{log 𝑊𝑊(𝑥𝑥}′_{≒ −[log 𝑡𝑡]}

1𝑥𝑥+ [log 𝑡𝑡]1𝑛𝑛−𝑥𝑥+ log 𝑝𝑝 − log 1 − 𝑝𝑝

≒ − log 𝑥𝑥 + log(𝑛𝑛 − 𝑥𝑥)+log 𝑝𝑝 − log(1 − 𝑝𝑝) ≒ log(𝑛𝑛 − 𝑥𝑥)𝑝𝑝_{𝑥𝑥(1 − 𝑝𝑝)} log 1 = 0ですから、この関数が０になるのは、 (𝑛𝑛−𝑥𝑥)𝑝𝑝 ｘ_{(1−𝑝𝑝)}= 1 の時です。これを解いて (𝑛𝑛 − 𝑥𝑥)𝑝𝑝 = 𝑥𝑥(1 − 𝑝𝑝) 𝑛𝑛𝑝𝑝 − 𝑥𝑥𝑝𝑝 = 𝑥𝑥 − 𝑥𝑥𝑝𝑝 𝑥𝑥 = 𝑛𝑛p となります、 𝑛𝑛、𝑥𝑥に具体的な数字を入れてみるとわかりますが、{log 𝑊𝑊(𝑥𝑥}′_{は減少関数ですから、}_logW(x) は、_{𝑥𝑥 = 𝑛𝑛p極大になります。ということは、W(x)も x=np で極大になるということです。}

(7)

この場合、極大値が一つしかありませんから、最大値になります。その値になる確率が最も高い。その値が出てくる頻度が最も高いということですね。そういう値を最頻値といいます。ところで、_{𝑛𝑛p とはいったい何でしょうか、これはすでに二項分布のところでやりました。} 試行の回数にある現象が現れる確率を掛けたものですね。例を挙げると、「正確なサイコロを振った時に、もし１が出たら１円もらえるとします。サイコロを３回振ったらいくらもらえることが期待できますか。」というような問題の時に _{3 ×}1 6= 1 2 と計算しますが、この例では、_{𝑛𝑛が 3 で、𝑛𝑛 が}1 6 𝑛𝑛𝑝𝑝が 1 2ということです。つまり、ある確率で起こる現象があって、それが現れるかどうｎ回試した時に、何回現れるかを予想した値です。これを期待値と言います。普通、期待値はμという記号で表します。実際のデーターからμを予想するときは、データーの平均値_{𝑥𝑥̅をその予測値とします。} つまり、 µ = 𝑛𝑛𝑝𝑝 です。あることが起こるということとあることが起こらない、いいかえればお互いに同時に起こることがない事象ですが、これを反事象と言います。起こらない確率を_{𝑞𝑞とすると、𝑝𝑝 + 𝑞𝑞 = 1} です。また、起こらない回数をｚとすると、_{𝑛𝑛 = 𝑥𝑥 + 𝑧𝑧} です。そこで、_{𝑝𝑝 = 1 − 𝑞𝑞、𝑥𝑥 = 𝑛𝑛 − z を式 21 にいれます。} (𝑛𝑛 − 𝑥𝑥)𝑝𝑝 ｘ_{(1 − 𝑝𝑝)}= 1 �𝑛𝑛−(𝑛𝑛−𝑧𝑧)�(1−𝑞𝑞) (𝑛𝑛−𝑧𝑧)�1−(1−𝑞𝑞)�= 1 𝑧𝑧(1−𝑞𝑞) (𝑛𝑛−𝑧𝑧)𝑞𝑞= 1 右辺が１だから、左辺の分母・分子を入れ替えて (𝑛𝑛 − 𝑧𝑧)𝑞𝑞 𝑧𝑧(1 − 𝑞𝑞) = 1 つまり、式21 と同じ形になって、 𝑧𝑧 = 𝑛𝑛𝑞𝑞 𝜇𝜇 = 𝑛𝑛𝑞𝑞 となります。右から見ても左から見ても、式の形は同じということですね。また、もともと２項分布なのですから、p を一定にして n を大きくしていけば、左右対称に近づきます。 𝑛𝑛を無限大にすれば、その分布の形も左右平等です。

(8)

つまり、期待値＝最頻値＝中央値ということです。（これは２項分布の性質でもありますね。）

次にもう一回微分します。式21 の 1 段階前の形で微分したほうが定数項が対数の外側に出ているので計算しやすいですね。

{log 𝑊𝑊(𝑥𝑥}′′_{≒ {− log 𝑥𝑥 + log(𝑛𝑛 − 𝑥𝑥) + log 𝑝𝑝 − log(1 − 𝑝𝑝) }′}

≒ {− log 𝑥𝑥}′ + {log(𝑛𝑛 − 𝑥𝑥)}′ ≒ −1_{𝑥𝑥 −}_{𝑛𝑛 − 𝑥𝑥}1 この１回と２回の微分式から、どこか一点の微分値を求めて、それを使ってTaylor 展開をしたいのです。今、わかっているのは、x=np で{log 𝑊𝑊(𝑥𝑥}′_{= 0ということです。} これを利用したいので、x=np の時の{log𝑊𝑊(𝑥𝑥}′_{′を求めます。} {log 𝑊𝑊(𝑥𝑥}′′_{≒ −}1 𝑥𝑥 − 1 𝑛𝑛 − 𝑥𝑥 {log 𝑊𝑊(𝑛𝑛𝑝𝑝}′′_{≒ −} 1 𝑛𝑛𝑝𝑝 − 1 𝑛𝑛 − 𝑛𝑛𝑝𝑝 _{≒ −}1 𝑛𝑛( 1 𝑝𝑝+ 1 1−𝑝𝑝) _{≒ −} 1 𝑛𝑛𝑝𝑝(1−𝑝𝑝) ところで、式14 で示したように、二項分布では𝑛𝑛𝑝𝑝(1 − 𝑝𝑝) = 𝜎𝜎2ですから {log 𝑊𝑊(𝑥𝑥}′′_{≒ −} 1 𝜎𝜎2 こでで、式17 を Taylor 展開します。 Taylor 展開を知っていることは、全体を理解するために必ずしも必要ではないのですが、何をやっているのかわからないと、いきなり式が書き換えられたような気がして、話についていきにくくなります。Taylor 展開とは、複雑な式を分かりやすい多項式の式に近似的に変換するテクニックです。与えられた式を何回か微分して、それらの微分式を別々の項として足し合わせる形に近似して式を扱いやすい形に変形します。Taylor 展開が何か知りたい人は、3-4-2.Taylor 展開を読んでください。 Taylor 展開の中身を知らなくても、Taylor 展開とは、式を何回か微分して、微分したものの和の形で式を近似的に簡略化することだと理解してください。ここでは２回まで微分します。

(9)

１回微分と、２回微分の結果を知っています。どこかの_{𝑥𝑥の値の近傍で考えるならば、三回} 微分以降の式の値は十分小さいので無視できます。ということで、二回微分の項まで、式17 を Taylor 展開します。どの値の近傍で Taylor 展開するかが問題になりますが、もっともなだらかで、変化が少ないと考えられるところが良いでしょう。また、わかりやすいところの方が良いでしょう。そこで考えられるのは、期待値μの近傍でTaylor 展開することです。 log 𝑊𝑊(𝑥𝑥)の一回微分の x=μにおける値、すなわち（logW(μ)’が０であることは確認ずみですね。

logW(𝑥𝑥) = log(n!) − log(𝑥𝑥!) − log(n − 𝑥𝑥)! + k log(p) + (n − 𝑥𝑥) log(q) ≒ logW(𝜇𝜇) +(log(𝜇𝜇))′_1! (𝑥𝑥 − 𝜇𝜇) +(log(𝜇𝜇))′′_2! (𝑥𝑥 − 𝜇𝜇)2

= log 𝑊𝑊(𝜇𝜇) +(log(𝑥𝑥))′′₂ (𝑥𝑥 − 𝜇𝜇)2 =log 𝑊𝑊(𝜇𝜇) +−𝜎𝜎21 2 (𝑥𝑥 − 𝜇𝜇)2 となるのですが、これを対数式でなく、もとの式に戻します。 log𝑒𝑒𝑒𝑒 = 1 ですから、これをつかって次のように変形します。著者注ちなみに、ここでe は自然対数の底として知られるもので、数学的にはネイピア数と言います。高校の数学でネイピア数とは何かしっかりとした説明を受けていない人が多いということを最近知りました。そこで、ネイピア数についての解説を（3-4-3.ネイピア数）に書いておきました。参考にしてください。しっかり理解すると、以下の説明がわかりやすくなります。なお記号の約束事として、特に断らない限り対数_{log 𝐴𝐴と書いたときのlog は} log𝑒𝑒𝐴𝐴のことで、対数はネイピア数を底とする自然対数だと理解してください。なお、対数の微分𝑡𝑡 log 𝑥𝑥 𝑡𝑡𝑥𝑥 = 1 𝑥𝑥、指数の微分 𝑡𝑡𝑒𝑒𝑥𝑥 𝑡𝑡𝑥𝑥 = 𝑒𝑒𝑥𝑥は知っているものとして話を進めます。これがわからない人は（3-4-3.ネイピア数）を読んでください。 log 𝑊𝑊(𝑥𝑥) ≒ log 𝑊𝑊(𝜇𝜇) +_2𝜎𝜎−1₂(𝑥𝑥 − 𝜇𝜇)2 = log𝑒𝑒𝑊𝑊(𝜇𝜇) +_2𝜎𝜎−1₂(𝑥𝑥 − 𝜇𝜇)2log𝑒𝑒𝑒𝑒 = log𝑒𝑒𝑊𝑊(𝜇𝜇) + log𝑒𝑒𝑒𝑒 −1 2𝜎𝜎2(𝑥𝑥−𝜇𝜇)2 = log𝑒𝑒𝑊𝑊(𝜇𝜇) + log𝑒𝑒𝑒𝑒 −1 2𝜎𝜎2(𝑥𝑥−𝜇𝜇)2

(10)

= log𝑒𝑒𝑊𝑊(𝜇𝜇)𝑒𝑒 −1 2𝜎𝜎2(𝑥𝑥−𝜇𝜇)2 となるので、対数の中だけを考えれば、 W(x) ≒ W(µ)𝑒𝑒2𝜎𝜎−12(𝑥𝑥−𝜇𝜇)2 式18 となります。数学の答えとしてはこれで良いのかもしれませんが、これではあまりよく意味がわからないし、正規分布として私たちが知っている式とも表現の仕方が違います。式に含まれているW(μ)はμが与えられば一定の値として定数になるはずですが、これがどのような値なのかは少なくとも知りたいところです。そこで、何らかの条件を与えて、W(μ) の値を求めることを考えます。すぐに気が付く条件は、この式は確率分布の式なのだから、その面積の総和は１ということです。つまり-∞から∞まで積分すれば、その値は１になるということです。ですから、_{W(µ) = Aとして A について以下の式を解けばよいことになります。} � 𝑊𝑊(𝜇𝜇)𝑒𝑒−12 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 ∞ −∞ 𝑑𝑑𝑥𝑥 = � 𝐴𝐴∞ −∞ 𝑒𝑒 −1 2 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 𝑑𝑑𝑥𝑥 = A ∫ 𝑒𝑒−12� 𝑥𝑥−𝜇𝜇 𝜎𝜎 � 2 ∞ −∞ 𝑑𝑑𝑥𝑥 ここではあまり関係がないのですが、指数のカッコの中の_�𝑥𝑥−𝜇𝜇 𝜎𝜎 �について考えておきます。この値は、期待値（母集団の平均値・中央値）と実際に得られたデーターを、標準偏差で割ったものですね。つまり、μを起点(0)としたときに、μからデーターx までの距離を表十偏差σを１単位として表したものです。つまり、正規分布するデーターをそのばらつきの大きさにかかわらず、標準化して表すときの距離ということになります。そういうことも意識しながら、 �𝑥𝑥 − 𝜇𝜇 √2𝜎𝜎� 2 = 𝑋𝑋2 と置いて、式を単純化します。 X =𝑥𝑥 − 𝜇𝜇 √2𝜎𝜎 両辺をx で微分すると 𝑑𝑑𝑋𝑋 𝑑𝑑𝑥𝑥 = 1 √2𝜎𝜎 計算の便宜上、_{dx = √2σdXと分離できるものとして、}

(11)

A ∫ 𝑒𝑒−12� 𝑥𝑥−𝜇𝜇 𝜎𝜎 � 2 ∞ −∞ 𝑑𝑑𝑥𝑥を A � 𝑒𝑒−12 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 ∞ −∞ 𝑑𝑑𝑥𝑥 = A � 𝑒𝑒 −𝑋𝑋2 ∞ −∞ √2𝜎𝜎𝑑𝑑𝑋𝑋 = √2𝜎𝜎𝐴𝐴 ∫ 𝑒𝑒∞ −𝑋𝑋2 −∞ 𝑑𝑑𝑋𝑋 式19 と変形します。これは分布の中心を０としてσを単位にした距離に変換する標準化のための作業です。つまり、この問題は、 � 𝑒𝑒∞ −𝑋𝑋2 −∞ 𝑑𝑑𝑋𝑋 の答えを出す問題という問題に還元されます。答えを先に言うと � 𝑒𝑒∞ −𝑋𝑋2 −∞ 𝑑𝑑𝑋𝑋 = √𝜋𝜋 です。一般の証明で、変数をX と書くのはあまり一般的でないので、変数を𝑥𝑥と表して説明します。 𝐼𝐼 = � 𝑒𝑒∞ −𝑥𝑥2 −∞ 𝑑𝑑𝑥𝑥 原点を中心に左右対称なので、 𝐼𝐼 2 = � 𝑒𝑒−𝑥𝑥 2 ∞ 0 𝑑𝑑𝑥𝑥 突然ですが、ここで、両辺を二乗します。 𝐼𝐼2 4 = � 𝑒𝑒−𝑥𝑥 2 ∞ 0 𝑑𝑑𝑥𝑥 × � 𝑒𝑒 −𝑥𝑥2 ∞ 0 𝑑𝑑𝑥𝑥 右辺の１番目の定積分と２番目の定積分を区別して別々に計算するものとして、２番目の定積分の変数をｙとして書き換えます 𝐼𝐼2 4 = � 𝑒𝑒−𝑥𝑥 2 ∞ 0 𝑑𝑑𝑥𝑥 × � 𝑒𝑒 −𝑦𝑦2 ∞ 0 𝑑𝑑𝑑𝑑 これは積分したものの掛け算なのですが、x とｙが互いに独立で直行しているとすれば、積分したものを掛け合わせることと、重積分することは同じ結果になります。 � 𝑒𝑒∞ −ｘ2 0 𝑑𝑑𝑥𝑥 × � 𝑒𝑒 −𝑦𝑦2 ∞ 0 𝑑𝑑𝑑𝑑 = � � 𝑒𝑒 −𝑥𝑥2 ∞ 0 ∞ 0 × 𝑒𝑒 −𝑦𝑦2 𝑑𝑑𝑥𝑥𝑑𝑑𝑑𝑑 ということです。わざわざ２つの確率分布の掛け算の形にして複雑化しています。ここだけで考えると、この作業は正規分布の記述を簡略化するためなのですが、もう少し深く考えると、この作

(12)

業によって確率分布同士の掛け算として分散を確率的に扱うことを可能にしていると言えます。作業の内容は、立体空間にできた確率分布を、新たに作った一つの軸で説明できるように書きなおすという作業です。この作業を畳み込みというようです。作業のプロセスは立体空間の体積を記述する式を作ること、その立体に新たな座標軸を作って、その座標軸での積分で体積を表現できるようにすることです。畳み込みと座標変換については、別に項を設けて説明したのでそちらを参照してください（3-4-4. 畳み込み（重積分と座標変換）。畳み込みを使って、式を変形していく流れだけを追います。 � 𝑒𝑒∞ −ｘ2 0 𝑑𝑑𝑥𝑥 × � 𝑒𝑒 −𝑦𝑦2 ∞ 0 𝑑𝑑𝑑𝑑 = � � 𝑒𝑒 −𝑥𝑥2 ∞ 0 ∞ 0 × 𝑒𝑒 −𝑦𝑦2 𝑑𝑑𝑥𝑥𝑑𝑑𝑑𝑑 = � � 𝑒𝑒∞ −(𝑥𝑥2_+𝑦𝑦2₎ 0 ∞ 0 𝑑𝑑𝑥𝑥𝑑𝑑𝑑𝑑 何をやっているのかというと、2 つの変数の積分の積を、２つの変数の積の積分として表し、それをx=rcos 𝜃𝜃、y=rsin 𝜃𝜃という極座標に変換して、θで積分するため、無理やり、x2_+y2_を作っているのです。それができたので、あらためて x = r cos 𝜃𝜃 y = r sin 𝜃𝜃 で極座標変換すると 𝐼𝐼2 4 = � � 𝑒𝑒−(𝑥𝑥 2_+𝑦𝑦2₎ ∞ 0 ∞ 0 𝑑𝑑𝑥𝑥𝑑𝑑𝑑𝑑 = � � 𝑒𝑒 −𝑟𝑟2 ∞ 0 𝜋𝜋 2 0 𝑟𝑟𝑑𝑑𝑟𝑟𝑑𝑑𝜃𝜃 まず、内側の積分_{∫ 𝑒𝑒}∞ 𝑟𝑟2 0 𝑟𝑟𝑑𝑑𝑟𝑟について 𝑟𝑟2_{= 𝑠𝑠} とおいて 2r =𝑑𝑑𝑠𝑠_{𝑑𝑑𝑟𝑟} 𝑟𝑟𝑑𝑑𝑟𝑟 =1_{2 𝑑𝑑𝑠𝑠} � 𝑒𝑒∞ −𝑟𝑟2 0 𝑟𝑟𝑑𝑑𝑟𝑟 = � 𝑒𝑒 −𝑠𝑠 ∞ 0 1 2 𝑑𝑑𝑠𝑠 =1_{2 � 𝑒𝑒}∞ −𝑠𝑠 0 𝑑𝑑𝑠𝑠 =1₂[−𝑒𝑒−𝑠𝑠_] 0 ∞

(13)

=1_{2 �−}_𝑒𝑒1_∞− �−_𝑒𝑒1₀�� =1₂{0 − (−1)} =1₂ 𝐼𝐼2 4の式に戻って 𝐼𝐼2 4 = ∫ ∫ 𝑒𝑒−𝑟𝑟 2 ∞ 0 𝜋𝜋 2 0 𝑟𝑟𝑑𝑑𝑟𝑟𝑑𝑑𝜃𝜃 = � � 𝑒𝑒∞ −𝑠𝑠 0 1 2 𝑑𝑑𝑠𝑠 𝜋𝜋 2 0 𝑑𝑑𝜃𝜃 = � 1₂ 𝜋𝜋 2 0 𝑑𝑑𝜃𝜃 =1_{2 � 𝑑𝑑𝜃𝜃} 𝜋𝜋 2 0 =1₂[𝜃𝜃]₀𝜋𝜋2 =1_{2 �}𝜋𝜋_{2 − 0�} =𝜋𝜋₄ したがって、 𝐼𝐼2 4 = 𝜋𝜋 4 𝐼𝐼2_{= 𝜋𝜋} I = √𝜋𝜋 ところで、制約条件は � 𝐴𝐴∞ −∞ 𝑒𝑒 −1 2 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 𝑑𝑑𝑥𝑥 = 1 です。式19 に戻ると A � 𝑒𝑒−12 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 ∞ −∞ 𝑑𝑑𝑥𝑥 = √2𝜎𝜎𝐴𝐴 � 𝑒𝑒 −𝑋𝑋2 ∞ −∞ 𝑑𝑑𝑋𝑋 = √2𝜎𝜎𝐴𝐴𝐼𝐼

(14)

= √2𝜎𝜎√𝜋𝜋𝐴𝐴 = √2𝜋𝜋𝜎𝜎A したがって √2𝜋𝜋𝜎𝜎𝐴𝐴 = 1 A = 1 √2𝜋𝜋𝜎𝜎 となって、A の値が決まります。もう忘れてしまったかもしれませんが W(µ) = A としたのでしたね。そこで、式18 にこの結果を戻して W(𝑥𝑥) ≒ W(µ)𝑒𝑒2𝜎𝜎−12(𝑥𝑥−𝜇𝜇)2 W(𝑥𝑥) ≒ 1 √2𝜋𝜋𝜎𝜎𝑒𝑒 −1 2𝜎𝜎2(𝑥𝑥−𝜇𝜇)2 W(𝑥𝑥) ≒ 1 √2𝜋𝜋𝜎𝜎𝑒𝑒 −1 2 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 これは正規分布の式です。平均が_{µ、分散が𝜎𝜎}2の正規分布を_{N(µ, σ)と書きあらわします。N(0, 1)の正規分布を標準正規} 分布と言います。 𝑥𝑥がN(µ, σ)に従うとき P(𝑥𝑥) = 1 √2𝜋𝜋𝜎𝜎𝑒𝑒 −1 2 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 式20 確かに_{𝑛𝑛が十分に大きければ、２項分布は正規分布に近づくことが示されました。正規分布} は二項分布の極限だと説明されることが多いと思います。確かにそうなのですが、それ以上に、２個の同じ二項分布を重ね合わせて畳み込んで４つ折りすることによって、確率の式の中に、分散という中心からの距離の尺度を持ち込んだことが大きいと思います。畳込の操作を理解すると、この感覚が納得できると思います。