3.4.1 整列性
定義の3項目で、tを微少量∆tと考えると、
P(N(s+ ∆t)−N(s) = 0) =e−∆λt= 1−λ∆t+· · ·= 1−λ∆t+o(∆t) P(N(s+ ∆t)−N(s) = 1) =λ∆te−∆λt=λ∆t(1−λ∆t+· · ·) =λ∆t+o(∆t) P(N(s+ ∆t)−N(s)≥2) = 1−P(N(s+ ∆t)−N(s)<2) =o(∆t)
これは、微少間隔の間に2回以上の事象が同時に起きる可能性は0と考えて良い、ということ を表す、つまり、事象はすべて生起した順番に曖昧さのない順番が付けられる。これを整列性と いう。
∆tを非常に小さい数とすれば、間隔∆tの間に事象が(1回以上)起きる確率λ∆tは非常に 小さい数となる。小さい数ながらも、常に一定の確率で事象が起きようとした結果、区間[0, t]
の間に起きる事象の数N(t)はパラメータλtのポワソン分布に従うことが導かれた。一般に、事 象の起きるチャンスはたくさんあっても、その事象の起きる確率が非常に小さい場合の事象の生 起回数はポワソン分布が当てはまることが知られている。このことから、ポワソン分布は稀現象 の法則(law of rare events)とも呼ばれる。
例 3.6 工場でのラインストップ:ラインストップには様々な原因が考えられるが、それら一つ 一つは毎秒故障の可能性を抱えながら運転している、毎秒ごとに故障する確率は非常に小さいの で、故障が発生するのは非常に稀である。したがって、稀現象の法則があてはまる。
例 3.7 地震の発生:これも同様に何かのきっかけでエネルギー放出が起きるが、その可能性は 毎秒非常に小さい確率ではあるが、否定できない。
練習 3.3 A4用紙30枚の資料を作るのに6万回キーボード入力が必要であった。出来上がった 資料に20箇所のミスタイプが発見されたとしよう。一つのミスタイプは1回のミスタイプが原 因であるとして、ミスタイプする確率をいくつくらいに見積もればよいですか。最初の10ペー ジに一つもミスタイプがない確率は3分の1より大きいですか、小さいですか。
3.4.2 到着間隔の無記憶性
N(t) = 0ということは、最初の事象の到着時刻T1(事象の到着間隔Y1と言っても同じ)がt より大きいということなので、
P(T1> t) =P(Y1> t) =P(N(t) = 0) =e−λt (3.9) が成り立つ。最右辺はパラメータλの(平均λ−1の)指数分布の補分布になっている、したがっ て、T1はパラメータλの指数分布に従う。
ベルヌイ試行の性質を受け継いでいるので、次の事象がいつ起きるか、全く予測が出来ないと いう特徴がある。ある時点で、将来の事象の到着時刻を予想するとき、現実には多くの場合、直 前の事象の到着時刻からある程度予測が可能であるが、ベルヌイ試行の場合はそのような過去の 出来事が将来の動きに全く影響を与えないという特徴がある。その特徴は確率の記号を使って次 のように表すことが出来る。
P(Y > t+s|Y > s) =P(T > t) (3.10) 確率変数Y が上の式を満たすとき、Y は無記憶性を持つと言われる。
現実の問題で考えたとき、無記憶性は、コイン投げのような理想状態を除いて仮定できるケー スは考えにくいが、たとえば、iPodの壊れるまでの時間を考えてみると、半年使っていても1 年使っていても、次の1ヶ月間に故障する確率はほとんど同じと考えて良い。これはiPodの壊 れるまでの時間という確率変数が無記憶性を持っていると言えなくもない。
練習3.4 確率変数Y がパラメータλの指数分布に従っているとき、Y は無記憶性を持つことを 確かめなさい。
練習3.5 ある銀行の融資窓口には30分に1人の割合で客が到着する。客の到着がポワソン過程 に従っているとして、(1)9時から12時までに客が一人も来ない確率はいくつですか。(2)正午 を過ぎて初めての客が来るまでの平均時間はどれくらいですか。
練習3.6 客が店にパラメータ2のポワソン過程に従って到着する、単位時間は1時間とする。
このとき、30分間にちょうど1人の客が到着する確率はいくつですか
3.4.3 指数分布の特徴
無記憶性から派生する様々な特徴をまとめておく。
補題5 X, Y は互いに独立で、それぞれパラメータλ, µの指数分布に従うとき、min{X, Y}は パラメータλ+µの指数分布に従う。一般に、X1, X2, ..., Xnは互いに独立で、それぞれパラメー タλ1, λ2, ..., λnの指数分布に従うとき、min{X1, X2, ..., Xn}はパラメータλ1+λ2+...+λn の指数分布に従う。
{min(X, Y)> t}という事象はX > tかつY > tという事象と同じ。X, Y が互いに独立で あることを使って計算すると、
P(min{X, Y}> t) =P(X > t, Y > t) =P(X > t)P(Y > t) =e−(λ+µ)t (3.11)
これはmin{X, Y}がパラメータλ+µの指数分布に従うことを意味する。変数の数が増えても、
同じ考え方で証明できる。
補題6 X, Y は互いに独立で、それぞれパラメータλ, µの指数分布に従うとき、次の式が成り 立つ
P(X < Y) = λ
λ+µ (3.12)
指数分布はベルヌイ試行を離散化したもので、そのパラメータは成功する確率と同じように考 えて良い。したがって、λ:µの割合でX < Y となるかX > Y となるかが決まる、と考えて 良い。
Xに条件を付けてきちんと計算することも出来る P(X < Y) =
∫ ∞
0 e−µt×λe−λtdt= λ λ+µ
補題7 ランダム個数の指数分布の和はやはり指数分布になる。すなわち、N がパラメータ pの幾何分布にしたがい、X1, X2, ...は互いに独立にパラメータλの指数分布に従うとき、
X1+X2+...+XN はパラメータλpの指数分布に従う。
モーメント母関数を利用すると証明が容易。指数分布のモーメント母関数は E(eθX) = λ/(λ−θ)、したがって、X1+X2+...+XN のモーメント母関数がλp/(λp−θ)になることを 言えばよい。
E(eθ(X1+X2+...+XN)) =E(E(eθ(X1+X2+...+XN)|N))
=∑ (
E(eθX))n
(1−p)n−1p= pE(eθX) 1−(1−p)E(eθX)
= λp λp−θ
これはパラメータλpの指数分布のモーメント母関数なので、X1+X2+...+XNはパラメータ λpの指数分布に従う。
練習3.7 MD付きラジオは、ラジオの寿命が平均5万時間、MDの寿命が平均2万時間で、い ずれも指数分布に従っているものとする。MDが原因で故障する割合はどれくらいですか。
練習3.8 2人の係員のいる郵便局にA, B, C の3人が同時に入ってきた。A, Bが先にサービス を受けてCが待っている。サービス時間が次の場合に、Cが最後に退去することになる確率を 求めなさい。(1)どの人もきっちり3分という場合、(2)どの人も、1分、3分、5分の確率がそ れぞれ1/3ずつという離散分布にしたがっている場合、(3)平均3分の指数分布の場合。
練習3.9(続)要求サービス量は同じだが、係員の能力に差があって、二つの窓口のサービス時 間はそれぞれ平均2分、3分の指数分布に従うものとしたとき、A, BがCよりも先にサービス を終える確率を求めなさい。
3.4.4 事象の一様性
n回のコイン投げで1回だけ表が出た、表が出たのは何回目でしょう、という質問には「分か らない」というのが答え。ベルヌイ試行でも同じ、その連続化の極限も同じ。N(t) = 1、すなわ ち区間[0, t]で事象が1回だけ到着したとき、それが前半、すなわち[0, t/2]の間に到着した可能 性は5割。確率変数で表すと、
P(T1< x|N(t) = 1) = x
t, 0≤x≤t (3.13)
区間[0, t]で事象が2回到着した場合も、その到着時刻を特定することは出来ない。つまり、
回数だけからは過去の確率事象(到着時刻)を推測できない。一般的に確率変数を使ってこのこ とを表現すると、次のようになる。
U1, U2, ..., Unは[0, t]上の一様分布に従う互いに独立な確率変数。それらを小さいもの順に並 べたものを
U(1)≤U(2)≤...≤U(n)
とする。N(t) =nという条件の下で、T1, T2, ..., Tnの結合分布関数はU(1), U(2), ..., U(n)の結 合分布関数と等しい。
例3.8(現在価値)ポワソン過程に従って100万円ずつ寄付があるとすると、[0, t]区間における
寄付金の総額の現在価値の期待値は、割引率をβとすると、以下のように計算できる。
E
N∑(t)
k=1
100e−βTk
=E
E
N∑(t)
k=1
100e−βTk
¯¯¯¯
¯¯N(t)
一方、
E ( n
∑
k=1
100e−βTk )
=nE(
100e−βU1)
= 100n
∫ t
0 e−βudu t
= 100n βt
(1−e−βt)
したがって
E
N(t)∑
k=1
100e−βTk
=∑∞
n=0
100n βt
(1−e−βt)(λt)n n! e−λt
= 100λ β
(1−e−βt)
練習3.10 ポワソン過程で最初の事象が到着する時刻をT1とすると、以下の式が成り立つこと を示しなさい。どういう意味がありますか。
P(T1< x|N(t) = 1) = x t ヒント (N(t) = 1)⇔(T1≤t < T1+T2)を使って計算する。
練習3.11 2次元の場合に上の記述を確かめなさい。すなわち、パラメータλのポワソン過程 {N(t), t≥0}で1番目、2番目の事象の到着時刻をそれぞれT1, T2とする。また、U1, U2を区 間[0,1]で一様分布する独立な確率変数とし、U(1) = min{U1, U2}, U(2) = max{U1, U2}と置 く。このとき、N(1) = 2という条件の下で、(U(1), U(2))の結合分布と(T1, T2)の結合分布が一 致することを示しなさい。
練習3.12 ある銀行の窓口に3時間の間に20人来たとすると、最初の1時間の間に来た客の数 はどれくらいと推測できますか。
ヒント ある客がいつ来たか分かりますか。
3.4.5 多数の計数過程の重ね合わせ
十分に多くの計数過程を合成すると、ポワソン過程で近似することができる。この性質は、数 理統計学における中心極限定理、すなわち、任意の分布に従う確率変数の平均はほぼ正規分布で 近似できる、という事実を思い出させる。中心極限定理が数理統計学で重要な位置を占めている のと同様、ポワソン過程は、確率過程の中心的役割をはたす。
電話の通話要求の時点列はポワソン過程によって説明できるということが多くの実証研究で裏 付けられている。一人の通話要求を累積したものは計数過程と考えることが出来て、ある基地局 への通話要求は多くの加入者の通話要求、つまり計数過程の和になっていると考えると、ポワソ ン過程の近似が説明出来る。一人の通話要求はその個人にとってはある規則にしたがっているの
かもしれないが、そのようなものが不特定多数集まると、全体としてはランダムな、いつ通話要 求が来るか分からない、というパターンが生まれるということは興味深い。一般に、不特定多数 が共通の施設を使うために到着する時点列はポワソン過程でモデル化することができる。このよ うな到着過程のことをポワソン到着という。
例 3.9 不特定多数の客が限られた施設を利用するときの混雑現象を分析するための方法論は待 ち行列理論と呼ばれる。一人一人はそれぞれ自分の都合で到着時刻を選んでいるのだろうが、そ れらを多数集めて、不特定多数の客全体を考えると、ポワソン到着のような振る舞いになる。そ のため、待ち行列理論のモデルではポワソン到着を仮定することが多い。
3.4.6 ポワソン過程の合成、分解
ポワソン過程には、ポワソン過程をいくつ重ね合わせてもポワソン過程になるという性質があ る。実際、最初にどれかの事象が起きるまでの間隔は、指数分布の最小値の分布に従うので、指 数分布になる。無記憶性により、その時点から数えて次の事象が起きるまでの間隔も指数分布と なる。その時点から数えて...。つまり、事象の到着間隔が指数分布に従う計数過程なので、ポワ ソン過程になる。
確率変数を使った議論では、例えば二つのポワソン過程を重ね合わせたものがポワソン過程に なることを言うには、確率母関数を使うと簡単である。N(t), M(t)をそれぞれパラメータλ, µ のポワソン過程とすると、その和の確率母関数は
E(zN(t)+M(t)) =E(zN(t))E(zM(t)) =e−λt(1−z)e−µt(1−z)
=e−(λ+µ)t(1−z)
となる。最後の式はN(t) +M(t)がパラメータλ+µのポワソン分布に従っていることを示す。
独立増分は明らか。
練習3.13 N(t), M(t)をそれぞれパラメータλ, µの互いに独立なポワソン過程としたとき、
N(t) +M(t)が独立増分を持つ計数過程であることを証明しなさい。
パラメータλのポワソン過程で事象が到着したとき、確率pでカウントし、確率1−pで無視 する、という計数過程をN1(t)とすると、N1(t)はパラメータλpポワソン過程になる。実際、
ベルヌイ試行と同時に表が出る確率がpのコインを投げ、ベルヌイ試行が成功し、コインも表が 出た場合にのみ「成功した」とするような試行を考えれば、その試行はベルヌイ試行になるとい うことから、その連続化極限を考えれば納得できる。
無視されたものだけを計数した計数過程をN2(t)とすると、N2(t)ももちろん計数過程になる が、興味深いのは、分解されたそれら二通りのポワソン過程N1(t), N2(t)がお互いに独立であ るということである。N(t) =N1(t) +N2(t)なのだから、強い相関があると考えるのが普通だ が、そうはなっていないところが「直感」に反している(直感が「はやとちり」というだけなの だが)。実際、