• 検索結果がありません。

lim xx x llllll tt =logx! xx です つまり xxが十分に大きければ llllll tt logx! です この式は単純な式で 慣れてくれば直感的にわからないこともないのですが きちんと これを証明するには手間がかかり 途中でいくつかのテクニックを使う必要があります この証

N/A
N/A
Protected

Academic year: 2021

シェア "lim xx x llllll tt =logx! xx です つまり xxが十分に大きければ llllll tt logx! です この式は単純な式で 慣れてくれば直感的にわからないこともないのですが きちんと これを証明するには手間がかかり 途中でいくつかのテクニックを使う必要があります この証"

Copied!
14
0
0

読み込み中.... (全文を見る)

全文

(1)

3-4. 正規分布 3-4-1. 二項分布から正規分布を導く 二項分布は、比率データーに関する確率分布ですから、不連続です。𝑛𝑛が大きくなったら、 次第になめらかな曲線に近くなってくるでしょう。𝑛𝑛を無限個にすれば、完全に滑らかにな るはずです。𝑛𝑛を無限大にするときに、2 つの方向が考えられます。一つは、𝑝𝑝を一定にして、 𝑛𝑛を無限大に大きくする方向です。これが正規分布です。すでに、二項分布のところで、𝑝𝑝 を 一定にしながら𝑛𝑛を大きくするということを試してみました。これら例からわかるように、 次第に、左右相称になり、分散が一定の値に近づきます。二項分布の正規分布への拡張の 目的の一つは、身長や体重のような、比率データーではない連続した値をとるデーターを 統計的に扱うための拡張です。いくつかのグループのデータを比較して、その差の有意性 を判断することを可能にするためです。拡張のもう一つの方向は、平均値𝑛𝑛𝑝𝑝を一定にして、 𝑝𝑝 を小さくして𝑛𝑛を大ききしていく方向です。その結果、分布は大きく偏っていきます。こ れがポアソン分布です。𝑝𝑝を小さくすることからわかるように、ポアソン分布は極めてまれ に起こる現象についての分析に使います。ポサソン分布は水産の世界では、たとえば、プ ランクトンの計数などのときに、きわめて稀な種類が、計数版の方形枠の中に現れたり現 れなかったりする場合などに使います。ここでは、まず、正規分布について考えます。 二項分布の正規分布への拡張。 二項分布B(𝑛𝑛, 𝑝𝑝)で確率𝑝𝑝の現象が現れる回数 k の関数としてあらわすと。 𝑊𝑊(𝑘𝑘) =𝑛𝑛 𝐶𝐶𝑘𝑘𝑝𝑝𝑘𝑘𝑞𝑞(1−𝑘𝑘) コンビネーション記号を書き換えて分数で表すと 𝑊𝑊(𝑘𝑘) =𝑘𝑘!(𝑛𝑛−𝑘𝑘)!𝑛𝑛! 𝑝𝑝𝑘𝑘𝑞𝑞(𝑛𝑛−𝑘𝑘) p+q=1 これを対数にすると

logW(𝑘𝑘) = log(𝑛𝑛!) − log(𝑘𝑘!) − log(𝑛𝑛 − 𝑘𝑘)! + 𝑘𝑘 log(𝑝𝑝) + (𝑛𝑛 − 𝑘𝑘) log(𝑞𝑞) となります。 こうすると、複雑な式が対数の足し算に単純化できます。掛け算の形が足し算になったた めにそれぞれの項を独立して考えることができます。ここでは、k を連続変数(整数にか かぎらず様々な値をとる実数)として、W(k)の形を考えるのですから、k=x と書き換えて おきましょう。(一種の習慣です。kは様々な値をとる不連続な整数のイメージです。これ に対してx は連続して様々な値をとる実数のイメージです。)

logW(𝑥𝑥) = log(𝑛𝑛!) − log(𝑥𝑥!) − log(𝑛𝑛 − 𝑥𝑥)! + 𝑘𝑘 log(𝑝𝑝) + (𝑛𝑛 − 𝑥𝑥) log(𝑞𝑞) 式17 突然ですが、

(2)

lim𝑥𝑥→∞∫ 𝑙𝑙𝑙𝑙𝑙𝑙1x 𝑡𝑡 𝑑𝑑𝑡𝑡=logx! です。つまり、𝑥𝑥が十分に大きければ、∫ 𝑙𝑙𝑙𝑙𝑙𝑙𝑥𝑥 1 𝑡𝑡 𝑑𝑑𝑡𝑡 ≒logx!です。 この式は単純な式で、慣れてくれば直感的にわからないこともないのですが、きちんと、 これを証明するには手間がかかり、途中でいくつかのテクニックを使う必要があります。 この証明をしますが、長い退屈な証明なので、そういうことが嫌いな人は、ここは適当に 読み飛ばしてください。それでも問題ないと思いますが、何をしているのか理解するため には、読んでおくと参考になるかもしれません。 lim𝑥𝑥→∞∫ 𝑙𝑙𝑙𝑙𝑙𝑙1x 𝑡𝑡 𝑑𝑑𝑡𝑡 = log 𝑥𝑥! の証明 この式は、 limx→∞ ∫ log𝑒𝑒𝑡𝑡𝑡𝑡𝑡𝑡 x 1 log𝑒𝑒𝑥𝑥! = 1 の変形です。元の式の意味を考えながら、この形に持っていきます。 元の式の極限記号の中 � log 𝑡𝑡𝑑𝑑𝑡𝑡 x 1 の意味は、曲線log t と x 軸、直線 x=x に囲まれた次の図形の面積を求めるということです。 図18-1, 対数の積分の極限の計算- この図に次のように、いくつかの長方形を書き加えます。 -1 -0.5 0 0.5 1 1.5 2 0 1 2 3 4

x

5 6

(3)

図18-2, 対数の積分の極限式の計算-2 この図は、以下の2つの図とlog t の曲線を重ね合わせたものです。 図18-3, 対数の積分の極限式の計算-3 図18-4, 対数の積分の極限式の計算-4 図18-3 の4つの4角形の面積の合計を考えます。1つの4角形の幅は1です。そうすると、 たとえば、一番左の四角形の面積は log2 ×1=log2 ですね。4つの四角形の面積の合計は log 2+log3+log4+log5 です。つまり log5!になります。

X がもっと大きくなった場合について一般化すると、面積の合計は logx!です。 同じようにして、図18-4 の黄色い四角形の面積の合計は、log(x-1)!です。 ここで、面積の大きさを比べると、図 18-3 の四角形の面積の合計が一番大きくて、次が ∫ log 𝑡𝑡𝑑𝑑𝑡𝑡1x 、で、図18-4 の四角形の面積の合計が一番小さいということに気が付きます。不 等号で表すと次のようになります。 -1 -0.5 0 0.5 1 1.5 2 0 1 2 3 4 5 6

x

(4)

log(𝑥𝑥 − 1)! < � log 𝑡𝑡𝑑𝑑𝑡𝑡 x 1 < log 𝑥𝑥! X は1以上の整数なのだから、log 𝑥𝑥 !は正の値になります。したがって、log 𝑥𝑥 !で各辺を割っ ても不等号の向きは変わらないでしょう。ですから、 log(𝑥𝑥−1)! log 𝑥𝑥! < ∫ log 𝑡𝑡𝑡𝑡𝑡𝑡1𝑥𝑥 log 𝑥𝑥! < log 𝑥𝑥! log 𝑥𝑥! 右辺が1 であることは明らかです(分母と分子が同じだから)。 そこで一番左の辺について、その極限を考えます。 log(𝑥𝑥 − 1)! log 𝑥𝑥! =

log(𝑥𝑥 − 1) + log(𝑥𝑥 − 2) + ⋯ + log 1 log 𝑥𝑥!

=log 𝑥𝑥 + log(𝑥𝑥 − 1) + log(𝑥𝑥 − 2) + ⋯ + log 1 − log 𝑥𝑥log 𝑥𝑥!

=log 𝑥𝑥! − log 𝑥𝑥log 𝑥𝑥!

= 1 −log 𝑥𝑥!log 𝑥𝑥 この式で、x が無限大に大きくなれば、式の2項目は0に近づくでしょう。 このことは、私には自明のように思えますが、この辺の感覚は人によって違うかもせれま せん。 念のために、手数をかけて証明しておきましょう。ありそうなのは、以下の証明です。 証明したい内容は

lim𝑥𝑥→∞log 𝑥𝑥!log 𝑥𝑥 = 0

です。

まず、以下の式がなりたつことを示します

log 𝑘𝑘! > log 𝑘𝑘 + log(𝑘𝑘 − 1) + ⋯ + log �𝑘𝑘2� > �𝑘𝑘2− 1)� log �𝑘𝑘2� この式の意味は、以下の通りです。 まず、k 2�ですが、ここでは、k 半分を超えない整数の意味で使っています。たとえば、k=5 の時は、k 2� = 2、k=4 の時も� k 2� = 2

左辺と真ん中の辺のlog 𝑘𝑘! > log 𝑘𝑘 + log(𝑘𝑘 − 1) + ⋯ + log �𝑘𝑘

2�のところは、部分が全体を超え

ることはないと言っているだけです。

(5)

で、これは正の数を足し合わせただけのものです。 これの値が、それよりも少ない工数を足し合わせた

log log 𝑘𝑘 + log(𝑘𝑘 − 1) + ⋯ + log �𝑘𝑘2� よりも大きいのは当然です。 分かりにくいのは、右の不等式です。 これは、次の図に示したことを言っているのです。 黄色で示した四角形の面積の総和は、青で示した四角形の面積の総和を超えない。 これで log 𝑘𝑘! > �𝑘𝑘2 − 1)� log �𝑘𝑘2� を示すことができました。 図19 大小関係 これをlog 𝑥𝑥 log 𝑥𝑥!に戻って考えると、x が1より大きいのでこの値は正ですから 次のようになります。なお、分子が変わらずに分母により小さなものが入るので、不等号 の向きは反対になります。 0 < log 𝑥𝑥 log 𝑥𝑥!< log x �𝑥𝑥2−1� log𝑥𝑥2= log 𝑥𝑥 �𝑥𝑥2−1�(log 𝑥𝑥−log 2)= 1 �𝑥𝑥2−1�(1−log𝑥𝑥2 ) lim 𝑥𝑥→∞ 1 �𝑥𝑥2 − 1�(1 −log 𝑥𝑥)2 = 0 ですから、挟み撃ちの原理で、はさんでいる両側が0なのだからはさまれているものも0 です。 lim 𝑥𝑥→∞ log 𝑥𝑥 log 𝑥𝑥! = 0 ということは、 lim 𝑥𝑥→∞(1 − log 𝑥𝑥 log 𝑥𝑥!) = 1 lim 𝑥𝑥→∞ log(𝑥𝑥 − 1)! log 𝑥𝑥! = 1 -1 -0.5 0 0.5 1 1.5 2 0 1 2 k/2 3 4 5 6

k

(6)

log(𝑥𝑥 − 1)! log 𝑥𝑥! < ∫ log 𝑡𝑡𝑑𝑑𝑡𝑡1𝑥𝑥 log 𝑥𝑥! < log 𝑥𝑥! log 𝑥𝑥! = 1 で左辺もx を無限大にしたときの極限は1ですから、これも挟み撃ちの原理で。 当然、∫ log 𝑡𝑡𝑡𝑡𝑡𝑡1𝑥𝑥 log 𝑥𝑥! についても limx→∞ ∫ log 𝑡𝑡𝑡𝑡𝑡𝑡1𝑥𝑥 log 𝑥𝑥! =1 です。分数の値が1ということは、分母分子が同じということですから、 lim x→∞� log 𝑡𝑡𝑑𝑑𝑡𝑡 𝑥𝑥 1 = log 𝑥𝑥! というか、x が十分大きい時 log 𝑥𝑥! ≒ � log 𝑡𝑡𝑑𝑑𝑡𝑡𝑥𝑥 1 です。長かったけど、証明終わり。 ということで、式17 に戻ります。

logW(𝑥𝑥) ≒ log(n!) − log(𝑥𝑥!) − log(𝑛𝑛 − 𝑥𝑥)! + 𝑥𝑥log(𝑝𝑝) + (𝑛𝑛 − 𝑥𝑥) log(𝑞𝑞) ≒ log(𝑛𝑛!) − � log 𝑡𝑡𝑑𝑑𝑡𝑡 − �𝑛𝑛−𝑥𝑥log 𝑡𝑡𝑑𝑑𝑡𝑡 + 𝑥𝑥 log 𝑝𝑝 + (𝑛𝑛 − 𝑥𝑥) log 𝑞𝑞

1 𝑥𝑥

1

この両辺を微分します。

{log 𝑊𝑊(𝑥𝑥}′≒ −[log 𝑡𝑡]1𝑥𝑥+ [log 𝑡𝑡]1𝑛𝑛−𝑥𝑥+ log 𝑝𝑝 − log 𝑞𝑞 p+q=1、log1=0 ですから

{log 𝑊𝑊(𝑥𝑥}′≒ −[log 𝑡𝑡]

1𝑥𝑥+ [log 𝑡𝑡]1𝑛𝑛−𝑥𝑥+ log 𝑝𝑝 − log 1 − 𝑝𝑝

≒ − log 𝑥𝑥 + log(𝑛𝑛 − 𝑥𝑥)+log 𝑝𝑝 − log(1 − 𝑝𝑝) ≒ log(𝑛𝑛 − 𝑥𝑥)𝑝𝑝𝑥𝑥(1 − 𝑝𝑝) log 1 = 0ですから、この関数が0になるのは、 (𝑛𝑛−𝑥𝑥)𝑝𝑝 x(1−𝑝𝑝)= 1 の時です。これを解いて (𝑛𝑛 − 𝑥𝑥)𝑝𝑝 = 𝑥𝑥(1 − 𝑝𝑝) 𝑛𝑛𝑝𝑝 − 𝑥𝑥𝑝𝑝 = 𝑥𝑥 − 𝑥𝑥𝑝𝑝 𝑥𝑥 = 𝑛𝑛p となります、 𝑛𝑛、𝑥𝑥に具体的な数字を入れてみるとわかりますが、{log 𝑊𝑊(𝑥𝑥}′は減少関数ですから、logW(x) は、𝑥𝑥 = 𝑛𝑛p極大になります。ということは、W(x)も x=np で極大になるということです。

(7)

この場合、極大値が一つしかありませんから、最大値になります。その値になる確率が最 も高い。その値が出てくる頻度が最も高いということですね。そういう値を最頻値といい ます。 ところで、𝑛𝑛p とはいったい何でしょうか、これはすでに二項分布のところでやりました。 試行の回数にある現象が現れる確率を掛けたものですね。例を挙げると、「正確なサイコロ を振った時に、もし1が出たら1円もらえると します。サイコロを3回振ったらいくらもらえることが期待できますか。」というような問 題の時に 3 ×1 6= 1 2 と計算しますが、この例では、𝑛𝑛が 3 で、𝑛𝑛 が1 6 𝑛𝑛𝑝𝑝が 1 2ということです。つまり、ある確率 で起こる現象があって、それが現れるかどうn回試した時に、何回現れるかを予想した値 です。これを期待値と言います。普通、期待値はμという記号で表します。実際のデータ ーからμを予想するときは、データーの平均値𝑥𝑥̅をその予測値とします。 つまり、 µ = 𝑛𝑛𝑝𝑝 です。 あることが起こるということとあることが起こらない、いいかえればお互いに同時に起こ ることがない事象ですが、これを反事象と言います。起こらない確率を𝑞𝑞とすると、𝑝𝑝 + 𝑞𝑞 = 1 です。また、起こらない回数をzとすると、𝑛𝑛 = 𝑥𝑥 + 𝑧𝑧 です。そこで、𝑝𝑝 = 1 − 𝑞𝑞、𝑥𝑥 = 𝑛𝑛 − z を式 21 にいれます。 (𝑛𝑛 − 𝑥𝑥)𝑝𝑝 x(1 − 𝑝𝑝)= 1 �𝑛𝑛−(𝑛𝑛−𝑧𝑧)�(1−𝑞𝑞) (𝑛𝑛−𝑧𝑧)�1−(1−𝑞𝑞)�= 1 𝑧𝑧(1−𝑞𝑞) (𝑛𝑛−𝑧𝑧)𝑞𝑞= 1 右辺が1だから、左辺の分母・分子を入れ替えて (𝑛𝑛 − 𝑧𝑧)𝑞𝑞 𝑧𝑧(1 − 𝑞𝑞) = 1 つまり、式21 と同じ形になって、 𝑧𝑧 = 𝑛𝑛𝑞𝑞 𝜇𝜇 = 𝑛𝑛𝑞𝑞 となります。右から見ても左から見ても、式の形は同じということですね。また、もとも と2項分布なのですから、p を一定にして n を大きくしていけば、左右対称に近づきます。 𝑛𝑛を無限大にすれば、その分布の形も左右平等です。

(8)

つまり、期待値=最頻値=中央値ということです。(これは2項分布の性質でもありますね。)

次にもう一回微分します。式21 の 1 段階前の形で微分したほうが定数項が対数の外側に出 ているので計算しやすいですね。

{log 𝑊𝑊(𝑥𝑥}′′≒ {− log 𝑥𝑥 + log(𝑛𝑛 − 𝑥𝑥) + log 𝑝𝑝 − log(1 − 𝑝𝑝) }′

≒ {− log 𝑥𝑥}′ + {log(𝑛𝑛 − 𝑥𝑥)}′ ≒ −1𝑥𝑥 −𝑛𝑛 − 𝑥𝑥1 この1回と2回の微分式から、どこか一点の微分値を求めて、それを使ってTaylor 展開を したいのです。今、わかっているのは、x=np で{log 𝑊𝑊(𝑥𝑥}′= 0ということです。 これを利用したいので、x=np の時の{log𝑊𝑊(𝑥𝑥}′′を求めます。 {log 𝑊𝑊(𝑥𝑥}′′≒ −1 𝑥𝑥 − 1 𝑛𝑛 − 𝑥𝑥 {log 𝑊𝑊(𝑛𝑛𝑝𝑝}′′≒ − 1 𝑛𝑛𝑝𝑝 − 1 𝑛𝑛 − 𝑛𝑛𝑝𝑝 ≒ −1 𝑛𝑛( 1 𝑝𝑝+ 1 1−𝑝𝑝) ≒ − 1 𝑛𝑛𝑝𝑝(1−𝑝𝑝) ところで、式14 で示したように、二項分布では𝑛𝑛𝑝𝑝(1 − 𝑝𝑝) = 𝜎𝜎2ですから {log 𝑊𝑊(𝑥𝑥}′′≒ − 1 𝜎𝜎2 こでで、式17 を Taylor 展開します。 Taylor 展開を知っていることは、全体を理解するために必ずしも必要ではないのですが、 何をやっているのかわからないと、いきなり式が書き換えられたような気がして、話につ いていきにくくなります。Taylor 展開とは、複雑な式を分かりやすい多項式の式に近似的 に変換するテクニックです。与えられた式を何回か微分して、それらの微分式を別々の項 として足し合わせる形に近似して式を扱いやすい形に変形します。Taylor 展開が何か知り たい人は、3-4-2.Taylor 展開を読んでください。 Taylor 展開の中身を知らなくても、Taylor 展開とは、式を何回か微分して、微分したもの の和の形で式を近似的に簡略化することだと理解してください。ここでは2回まで微分し ます。

(9)

1回微分と、2回微分の結果を知っています。どこかの𝑥𝑥の値の近傍で考えるならば、三回 微分以降の式の値は十分小さいので無視できます。 ということで、二回微分の項まで、式17 を Taylor 展開します。どの値の近傍で Taylor 展 開するかが問題になりますが、もっともなだらかで、変化が少ないと考えられるところが 良いでしょう。また、わかりやすいところの方が良いでしょう。そこで考えられるのは、 期待値μの近傍でTaylor 展開することです。 log 𝑊𝑊(𝑥𝑥)の一回微分の x=μにおける値、すなわち(logW(μ)’が0であることは確認ずみで すね。

logW(𝑥𝑥) = log(n!) − log(𝑥𝑥!) − log(n − 𝑥𝑥)! + k log(p) + (n − 𝑥𝑥) log(q) ≒ logW(𝜇𝜇) +(log(𝜇𝜇))′1! (𝑥𝑥 − 𝜇𝜇) +(log(𝜇𝜇))′′2! (𝑥𝑥 − 𝜇𝜇)2

= log 𝑊𝑊(𝜇𝜇) +(log(𝑥𝑥))′′2 (𝑥𝑥 − 𝜇𝜇)2 =log 𝑊𝑊(𝜇𝜇) +−𝜎𝜎21 2 (𝑥𝑥 − 𝜇𝜇)2 となるのですが、これを対数式でなく、もとの式に戻します。 log𝑒𝑒𝑒𝑒 = 1 ですから、これをつかって次のように変形します。 著者注 ちなみに、ここでe は自然対数の底として知られるもので、数学的にはネイピア数と言い ます。高校の数学でネイピア数とは何かしっかりとした説明を受けていない人が多いとい うことを最近知りました。そこで、ネイピア数についての解説を(3-4-3.ネイピア数)に書 いておきました。参考にしてください。しっかり理解すると、以下の説明がわかりやすく なります。なお記号の約束事として、特に断らない限り対数log 𝐴𝐴と書いたときのlog は log𝑒𝑒𝐴𝐴のことで、対数はネイピア数を底とする自然対数だと理解してください。なお、対数 の微分𝑡𝑡 log 𝑥𝑥 𝑡𝑡𝑥𝑥 = 1 𝑥𝑥、指数の微分 𝑡𝑡𝑒𝑒𝑥𝑥 𝑡𝑡𝑥𝑥 = 𝑒𝑒𝑥𝑥は知っているものとして話を進めます。これがわから ない人は(3-4-3.ネイピア数)を読んでください。 log 𝑊𝑊(𝑥𝑥) ≒ log 𝑊𝑊(𝜇𝜇) +2𝜎𝜎−12(𝑥𝑥 − 𝜇𝜇)2 = log𝑒𝑒𝑊𝑊(𝜇𝜇) +2𝜎𝜎−12(𝑥𝑥 − 𝜇𝜇)2log𝑒𝑒𝑒𝑒 = log𝑒𝑒𝑊𝑊(𝜇𝜇) + log𝑒𝑒𝑒𝑒 −1 2𝜎𝜎2(𝑥𝑥−𝜇𝜇)2 = log𝑒𝑒𝑊𝑊(𝜇𝜇) + log𝑒𝑒𝑒𝑒 −1 2𝜎𝜎2(𝑥𝑥−𝜇𝜇)2

(10)

= log𝑒𝑒𝑊𝑊(𝜇𝜇)𝑒𝑒 −1 2𝜎𝜎2(𝑥𝑥−𝜇𝜇)2 となるので、対数の中だけを考えれば、 W(x) ≒ W(µ)𝑒𝑒2𝜎𝜎−12(𝑥𝑥−𝜇𝜇)2 式18 となります。数学の答えとしてはこれで良いのかもしれませんが、これではあまりよく意 味がわからないし、正規分布として私たちが知っている式とも表現の仕方が違います。 式に含まれているW(μ)はμが与えられば一定の値として定数になるはずですが、これがど のような値なのかは少なくとも知りたいところです。そこで、何らかの条件を与えて、W(μ) の値を求めることを考えます。すぐに気が付く条件は、この式は確率分布の式なのだから、 その面積の総和は1ということです。つまり-∞から∞まで積分すれば、その値は1になる ということです。 ですから、W(µ) = Aとして A について以下の式を解けばよいことになります。 � 𝑊𝑊(𝜇𝜇)𝑒𝑒−12 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 ∞ −∞ 𝑑𝑑𝑥𝑥 = � 𝐴𝐴∞ −∞ 𝑒𝑒 −1 2 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 𝑑𝑑𝑥𝑥 = A ∫ 𝑒𝑒−12� 𝑥𝑥−𝜇𝜇 𝜎𝜎 � 2 ∞ −∞ 𝑑𝑑𝑥𝑥 ここではあまり関係がないのですが、指数のカッコの中の𝑥𝑥−𝜇𝜇 𝜎𝜎 �について考えておきます。 この値は、期待値(母集団の平均値・中央値)と実際に得られたデーターを、標準偏差で 割ったものですね。つまり、μを起点(0)としたときに、μからデーターx までの距離を表 十偏差σを1単位として表したものです。つまり、正規分布するデーターをそのばらつき の大きさにかかわらず、標準化して表すときの距離ということになります。 そういうことも意識しながら、 �𝑥𝑥 − 𝜇𝜇 √2𝜎𝜎� 2 = 𝑋𝑋2 と置いて、式を単純化します。 X =𝑥𝑥 − 𝜇𝜇 √2𝜎𝜎 両辺をx で微分すると 𝑑𝑑𝑋𝑋 𝑑𝑑𝑥𝑥 = 1 √2𝜎𝜎 計算の便宜上、dx = √2σdXと分離できるものとして、

(11)

A ∫ 𝑒𝑒−12� 𝑥𝑥−𝜇𝜇 𝜎𝜎 � 2 ∞ −∞ 𝑑𝑑𝑥𝑥を A � 𝑒𝑒−12 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 ∞ −∞ 𝑑𝑑𝑥𝑥 = A � 𝑒𝑒 −𝑋𝑋2 ∞ −∞ √2𝜎𝜎𝑑𝑑𝑋𝑋 = √2𝜎𝜎𝐴𝐴 ∫ 𝑒𝑒∞ −𝑋𝑋2 −∞ 𝑑𝑑𝑋𝑋 式19 と変形します。これは分布の中心を0としてσを単位にした距離に変換する標準化のため の作業です。 つまり、この問題は、 � 𝑒𝑒∞ −𝑋𝑋2 −∞ 𝑑𝑑𝑋𝑋 の答えを出す問題という問題に還元されます。 答えを先に言うと � 𝑒𝑒∞ −𝑋𝑋2 −∞ 𝑑𝑑𝑋𝑋 = √𝜋𝜋 です。 一般の証明で、変数をX と書くのはあまり一般的でないので、変数を𝑥𝑥と表して説明します。 𝐼𝐼 = � 𝑒𝑒∞ −𝑥𝑥2 −∞ 𝑑𝑑𝑥𝑥 原点を中心に左右対称なので、 𝐼𝐼 2 = � 𝑒𝑒−𝑥𝑥 2 ∞ 0 𝑑𝑑𝑥𝑥 突然ですが、ここで、両辺を二乗します。 𝐼𝐼2 4 = � 𝑒𝑒−𝑥𝑥 2 ∞ 0 𝑑𝑑𝑥𝑥 × � 𝑒𝑒 −𝑥𝑥2 ∞ 0 𝑑𝑑𝑥𝑥 右辺の1番目の定積分と2番目の定積分を区別して別々に計算するものとして、2番目の 定積分の変数をyとして書き換えます 𝐼𝐼2 4 = � 𝑒𝑒−𝑥𝑥 2 ∞ 0 𝑑𝑑𝑥𝑥 × � 𝑒𝑒 −𝑦𝑦2 ∞ 0 𝑑𝑑𝑑𝑑 これは積分したものの掛け算なのですが、x とyが互いに独立で直行しているとすれば、積 分したものを掛け合わせることと、重積分することは同じ結果になります。 � 𝑒𝑒∞ −x2 0 𝑑𝑑𝑥𝑥 × � 𝑒𝑒 −𝑦𝑦2 ∞ 0 𝑑𝑑𝑑𝑑 = � � 𝑒𝑒 −𝑥𝑥2 ∞ 0 ∞ 0 × 𝑒𝑒 −𝑦𝑦2 𝑑𝑑𝑥𝑥𝑑𝑑𝑑𝑑 ということです。 わざわざ2つの確率分布の掛け算の形にして複雑化しています。ここだけで考えると、 この作業は正規分布の記述を簡略化するためなのですが、もう少し深く考えると、この作

(12)

業によって確率分布同士の掛け算として分散を確率的に扱うことを可能にしていると言え ます。作業の内容は、立体空間にできた確率分布を、新たに作った一つの軸で説明できる ように書きなおすという作業です。この作業を畳み込みというようです。作業のプロセス は立体空間の体積を記述する式を作ること、その立体に新たな座標軸を作って、その座標 軸での積分で体積を表現できるようにすることです。畳み込みと座標変換については、別 に項を設けて説明したのでそちらを参照してください(3-4-4. 畳み込み(重積分と座標変 換)。 畳み込みを使って、式を変形していく流れだけを追います。 � 𝑒𝑒∞ −x2 0 𝑑𝑑𝑥𝑥 × � 𝑒𝑒 −𝑦𝑦2 ∞ 0 𝑑𝑑𝑑𝑑 = � � 𝑒𝑒 −𝑥𝑥2 ∞ 0 ∞ 0 × 𝑒𝑒 −𝑦𝑦2 𝑑𝑑𝑥𝑥𝑑𝑑𝑑𝑑 = � � 𝑒𝑒∞ −(𝑥𝑥2+𝑦𝑦2) 0 ∞ 0 𝑑𝑑𝑥𝑥𝑑𝑑𝑑𝑑 何をやっているのかというと、2 つの変数の積分の積を、2つの変数の積の積分として表し、 それをx=rcos 𝜃𝜃、y=rsin 𝜃𝜃という極座標に変換して、θで積分するため、無理やり、x2+y2 作っているのです。 それができたので、あらためて x = r cos 𝜃𝜃 y = r sin 𝜃𝜃 で極座標変換すると 𝐼𝐼2 4 = � � 𝑒𝑒−(𝑥𝑥 2+𝑦𝑦2) ∞ 0 ∞ 0 𝑑𝑑𝑥𝑥𝑑𝑑𝑑𝑑 = � � 𝑒𝑒 −𝑟𝑟2 ∞ 0 𝜋𝜋 2 0 𝑟𝑟𝑑𝑑𝑟𝑟𝑑𝑑𝜃𝜃 まず、内側の積分∫ 𝑒𝑒∞ 𝑟𝑟2 0 𝑟𝑟𝑑𝑑𝑟𝑟について 𝑟𝑟2= 𝑠𝑠 とおいて 2r =𝑑𝑑𝑠𝑠𝑑𝑑𝑟𝑟 𝑟𝑟𝑑𝑑𝑟𝑟 =12 𝑑𝑑𝑠𝑠 � 𝑒𝑒∞ −𝑟𝑟2 0 𝑟𝑟𝑑𝑑𝑟𝑟 = � 𝑒𝑒 −𝑠𝑠 ∞ 0 1 2 𝑑𝑑𝑠𝑠 =12 � 𝑒𝑒∞ −𝑠𝑠 0 𝑑𝑑𝑠𝑠 =12[−𝑒𝑒−𝑠𝑠] 0 ∞

(13)

=12 �−𝑒𝑒1− �−𝑒𝑒10�� =12{0 − (−1)} =12 𝐼𝐼2 4の式に戻って 𝐼𝐼2 4 = ∫ ∫ 𝑒𝑒−𝑟𝑟 2 ∞ 0 𝜋𝜋 2 0 𝑟𝑟𝑑𝑑𝑟𝑟𝑑𝑑𝜃𝜃 = � � 𝑒𝑒∞ −𝑠𝑠 0 1 2 𝑑𝑑𝑠𝑠 𝜋𝜋 2 0 𝑑𝑑𝜃𝜃 = � 12 𝜋𝜋 2 0 𝑑𝑑𝜃𝜃 =12 � 𝑑𝑑𝜃𝜃 𝜋𝜋 2 0 =12[𝜃𝜃]0𝜋𝜋2 =12 �𝜋𝜋2 − 0� =𝜋𝜋4 したがって、 𝐼𝐼2 4 = 𝜋𝜋 4 𝐼𝐼2= 𝜋𝜋 I = √𝜋𝜋 ところで、制約条件は � 𝐴𝐴∞ −∞ 𝑒𝑒 −1 2 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 𝑑𝑑𝑥𝑥 = 1 です。 式19 に戻ると A � 𝑒𝑒−12 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 ∞ −∞ 𝑑𝑑𝑥𝑥 = √2𝜎𝜎𝐴𝐴 � 𝑒𝑒 −𝑋𝑋2 ∞ −∞ 𝑑𝑑𝑋𝑋 = √2𝜎𝜎𝐴𝐴𝐼𝐼

(14)

= √2𝜎𝜎√𝜋𝜋𝐴𝐴 = √2𝜋𝜋𝜎𝜎A したがって √2𝜋𝜋𝜎𝜎𝐴𝐴 = 1 A = 1 √2𝜋𝜋𝜎𝜎 となって、A の値が決まります。 もう忘れてしまったかもしれませんが W(µ) = A としたのでしたね。 そこで、式18 にこの結果を戻して W(𝑥𝑥) ≒ W(µ)𝑒𝑒2𝜎𝜎−12(𝑥𝑥−𝜇𝜇)2 W(𝑥𝑥) ≒ 1 √2𝜋𝜋𝜎𝜎𝑒𝑒 −1 2𝜎𝜎2(𝑥𝑥−𝜇𝜇)2 W(𝑥𝑥) ≒ 1 √2𝜋𝜋𝜎𝜎𝑒𝑒 −1 2 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 これは正規分布の式です。 平均がµ、分散が𝜎𝜎2の正規分布をN(µ, σ)と書きあらわします。N(0, 1)の正規分布を標準正規 分布と言います。 𝑥𝑥がN(µ, σ)に従うとき P(𝑥𝑥) = 1 √2𝜋𝜋𝜎𝜎𝑒𝑒 −1 2 �𝑥𝑥−𝜇𝜇𝜎𝜎 � 2 式20 確かに𝑛𝑛が十分に大きければ、2項分布は正規分布に近づくことが示されました。正規分布 は二項分布の極限だと説明されることが多いと思います。確かにそうなのですが、それ以 上に、2個の同じ二項分布を重ね合わせて畳み込んで4つ折りすることによって、確率の 式の中に、分散という中心からの距離の尺度を持ち込んだことが大きいと思います。畳込 の操作を理解すると、この感覚が納得できると思います。

図 18-2,  対数の積分の極限式の計算-2  この図は、以下の2つの図と log t の曲線を重ね合わせたものです。  図 18-3,  対数の積分の極限式の計算-3      図 18-4,  対数の積分の極限式の計算-4  図 18-3 の4つの4角形の面積の合計を考えます。1つの4角形の幅は1です。そうすると、 たとえば、一番左の四角形の面積は log2  ×1=log2 ですね。4つの四角形の面積の合計は log 2+log3+log4+log5 です。つまり log5!になります。

参照

関連したドキュメント

問についてだが︑この間いに直接に答える前に確認しなけれ

これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,

このような情念の側面を取り扱わないことには それなりの理由がある。しかし、リードもまた

   遠くに住んでいる、家に入られることに抵抗感があるなどの 療養中の子どもへの直接支援の難しさを、 IT という手段を使えば

としても極少数である︒そしてこのような区分は困難で相対的かつ不明確な区分となりがちである︒したがってその

これからはしっかりかもうと 思います。かむことは、そこ まで大事じゃないと思って いたけど、毒消し効果があ

自然言語というのは、生得 な文法 があるということです。 生まれつき に、人 に わっている 力を って乳幼児が獲得できる言語だという え です。 語の それ自 も、 から

 筆記試験は与えられた課題に対して、時間 内に回答 しなければなりません。時間内に答 え を出すことは働 くことと 同様です。 だから分からな い問題は後回しでもいいので