第 5 章 確率変数
5.2 連続型確率変数
0.1 0.2 0.3 0.4
0 1 2 3 4 5
B(5,0.2)
0.1 0.2 0.3 0.4
0 1 2 3 4 5
B(5,0.5)
0.1 0.2 0.3 0.4
0 1 2 3 4 5
B(5,0.8)
問題
問題 5.1.1. 確率0.005で当たり(100万円がもらえる), 確率0.995ではずれの宝くじがあると する. この宝くじを買うとき, 受け取る金額の期待値を求めよ.
問題 5.1.2. サッカーのリーグ戦では試合の結果に応じて勝ち点が得られる. 勝ち点は, 負けの
とき0点, 引き分けのとき1点, 勝ちのとき3点である. AチームがBチームと試合をするとき, Aチームが負ける, 引き分ける, 勝つ確率はそれぞれ0.2, 0.3, 0.5である. Aチームがこの試合 で得る勝ち点Xの期待値を求めよ.
問題 5.1.3. あるバスケットボールの選手がフリースローを行うときの成功確率は0.8であると
する. この選手が10回フリースローを行うときの成功回数をXとする. Xの確率分布は何か.
また, Xの期待値を求めよ.
連続型確率変数 X に対しては, ある関数 f(x) ≥ 0 を定め, 任意の区間 [a, b] に対して a ≤ X ≤bとなる確率を f(x)のグラフ,直線x=a,x=b とx軸で囲まれる部分の面積で表す. こ のようなf(x)を X の確率密度関数(probability density function, 略してpdf)という. つまり 確率変数 X の確率密度関数とは,すべてのx についてf(x)≥ 0であり,またすべての a < b に対して
P(a≤X ≤b) =
∫ b a
f(x)dx (5.5)
が成り立つような関数fのことである.
0 2 4 6 8 10 12 14 16 18
0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18
a b f(x)
∫ a b
f(x) dx P(a≤ X≤ b)
=
図 5.3: 確率密度関数と確率の関係
✓ ✏
確率密度関数の定義
Xは確率変数であるとする. 関数f(x)が以下の性質を持つとき, 関数f(x)をXの確率密 度関数という.
(1) f(x)≥0
(2) x軸と曲線y =f(x)の間の面積は1
(3) 確率P(a≤X ≤b)が上図の斜線部分の面積に等しい.
✒ ✑
連続型確率変数の期待値
連続型確率変数の期待値は以下のように定義される.
期待値の定義: 連続型確率変数の場合
✓ ✏
Xは連続型確率変数であり,その確率密度関数はf(x)であるとする.Xの期待値E[X]は E[X] =
∫ ∞
−∞
xf(x)dx (5.6)
で定義される. 期待値は確率分布の平均ともいう.
✒ ✑
期待値は確率密度関数の重心になっている. Xが連続型確率変数のとき,Xの関数g(X)の期待 値については
E[g(X)] =
∫ ∞
−∞
g(x)f(x)dx (5.7)
が成り立つ.
連続型確率変数Xの分散は V[X] =E[
(X−E[X])2]
=
∫ ∞
−∞
(x−E[X])2f(x)dx (5.8)
で定義される.確率変数の分散は,確率変数のばらつきの大きさの尺度である.
連続型確率変数の場合も以下の公式が成り立つ.
✓ ✏
V[X] = E[X2]− {E[X]}2
✒ ✑
代表的な連続型確率分布
一様分布
a, bは実数で a < bであるとする連続型確率変数Xの確率密度関数が(5.9)で与えられると き, Xの確率分布を[a, b]上の一様分布と呼ばれる.
✓ ✏
一様分布
f(x) = { 1
b−a a ≤x≤bのとき
0 それ以外 (5.9)
平均: a+b
2 , 分散: (b−a)2
✒ 12 ✑
a b
1 b−a
図 5.4: 一様分布の確率密度関数
例 5.2. 円の中心に針が止めてあり, 自由に回転できるようになっている(時計の針が自由に動 くと考えて下さい). この道具を水平に置き, 針をでたらめに回転させ, 針が止まったときの針
の角度(ラジアン)をXで表す. Xのとる値は0以上2π未満であり, 確率分布は[0, 2π]上の一
様分布である.
正規分布
統計学の中でもっとも重要な連続型の確率分布は正規分布である.
✓ ✏
正規分布の定義 確率密度関数f(x)が
f (x) = 1
√ 2πσ e
−12(
x−σµ)
2(5.10)
で与えられるような確率分布を, 正規分布(normal distribution)といい, N(µ, σ2)で表す.
✒ ✑
図5.2は正規分布N(µ, σ2)の確率密度関数のグラフである。
N ( µ, σ
2)
µ µ + σ µ +2 σ µ +3 σ µ − σ
µ −2 σ µ −3 σ
1 2π σ
図 5.5: 正規分布 N(µ, σ2) の確率密度関数 X の確率密度関数が(5.10)式であるとき,
E[X] = µ (5.11)
V[X] = σ2 (5.12)
であることを示すことができる1から,正規分布 N(µ, σ2)は, 平均 µ,分散 σ2 の正規分布とよ ばれる. X の確率密度関数が(5.10)式であるとき,「X は平均 µ,分散 σ2 の正規分布に従う」
といい, X ∼N(µ, σ2) と表す. 特に, 平均 0, 分散 1 の正規分布N(0,1)は標準正規分布とよば れる.標準正規分布の確率密度関数は
f(x) = 1
√2πe−12x2 (5.13)
である2.
1この計算はこの章の付録を見よ
2関数g(x) =e−12x2 の増減表を作成し、g(x)のグラフを描くことが可能. 別紙参照.
正規分布N(µ, σ2) の確率密度関数 f(x) の性質
✓ ✏
(i)f(x) のグラフは µ を中心とするベル型. 左右対称.
(ii) 2つの点 (µ−σ, f(µ−σ)) と (µ+σ, f(µ+σ))が変曲点になっている.
(iii) 区間[µ−3σ, µ+ 3σ] にほとんどの確率がある. くわしくは, 次が成り立つ.
P(µ−σ ≦X≦µ+σ) = 0.683 P(µ−2σ≦X ≦µ+ 2σ) = 0.955 P(µ−3σ≦X ≦µ+ 3σ) = 0.997 (iv)f(x)は x=µで最大値 1
√2πσ をとる.
✒ ✑
図5.2には、異なる平均と分散を持つ正規分布の確率密度関数のグラフを図示した。
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
N(0, 1) N(4, 1)
N(0, 4)
図 5.6: 異なる平均と分散を持つ正規分布の確率密度関数
正規分布は,統計学でもっともひんぱんに使われる確率分布である. それは次の理由からであ る.
(1) 近似的に正規分布に従うと考えられる確率変数が多くあること.
例:身長, 胸囲など. 測定誤差. 観測誤差. 大規模試験の点の分布.株価の収益率(分布の中心 部分で正規分布に近いが,分布の端でずれがある. )
(2) データを生成している確率分布が正規分布のときには, 統計分析の理論的な結果が簡潔な形 で得られる.
(3) 確率変数の和の確率分布は, 足す確率変数の個数が多いときに正規分布で近似される.
正規分布にしたがう確率変数を一次式で変換したものも正規分布にしたがう. つまり,次が成
り立つ.✓ ✏
定理 5.2 (正規分布の性質1). a, b は定数であるとする.
X ∼N(µ, σ2) であるとき
aX+b∼N(aµ+b, a2σ2) が成り立つ. 特に,
X−µ
σ ∼N(0,1)
✒である. ✑
正規分布についての確率計算
確率変数 X がある値uより大きくなる確率
P(X > u) (5.14)
を求めることがよくある。(5.14)のような値を上側確率という.特に標準正規分布の上側確率 は重要なので,付表1にまとめられている.付表1には,左の縦一列(u と書いてある場所の 下)に,uの小数点第一位の値までが与えられ,上の横一行に uの小数点第二位の値が与えら れているので,たとえば u= 0.55のときには, .5 に対応する行と .05に対応する列が交差する 場所の数値 0.291 が上側確率になる. つまり,Z が標準正規分布N(0,1)にしたがうとき
P(Z >0.55) = 0.291 (5.15)
であることがわかる.
付表1を使って,標準正規分布のいろいろな確率を求めてみよう.
例題 5.2. Z ∼N(0,1) とする. このとき以下の確率を求めなさい.
(1) P(Z >1) (2) P(Z >1.96) (3) P(Z ≦1) 解答:
(1) 付表1から u= 1.00 の場所を見つけ, P(Z >1) = 0.159 (小数点第四位で四捨五入).
(2) P(Z >1.96) = 0.025(小数点第四位で四捨五入).
(3) まず P(Z ≦ 1) = 1 −P(Z > 1) と変形する. P(Z > 1) = 0.159 だからP(Z ≦ 1) = 1−0.159 = 0.841 である.
正規分布N(µ, σ2)のしたがう確率変数Xについての確率を求めるときには、標準化を使っ て求める. (定理5.2)
例題 5.3. X ∼N(50,100) とする. このとき以下の確率を求めなさい.
(1) P(X >60) (2) P(X ≦60)
解答:
(1)
P(X >60) =P
(X−50
10 > 60−50 10
)
=P
(X−50 10 >1
)
= 0.159 最後の等式は, (X−50)/10が標準正規分布にしたがうことから得られる.
(2) (1)の答えを用いる. P(X ≦60) = 1−P(X >60) = 1−0.159 = 0.841
図 5.7: 付表1:標準正規分布の上側確率
問題 5.2
問題 5.2.1.
長さ12cmのプリッツ(細い棒状のお菓子)を2つに割るとき, 折れる場所を左端からの長さ で測りXで表す. Xは[1, 11]上の一様分布にしたがうとする. 2つに折ったとき, 一方が他方 よりも1cm以上長くなる確率を求めよ.
5 章の付録 *
まず
∫ ∞
−∞
√1
2πe−12z2dz = 1 (5.16)
が成り立つことが知られている3. (5.11)の証明.以下の積分の計算で, 変数変換z = (x−µ)/σ により置換積分を行う.
E(X) =
∫ ∞
−∞
x 1
√2πσe−12(x−σµ)2 =
∫ ∞
−∞
√1
2πσ(σz+µ)e−12z2σdz
=σ
∫ ∞
−∞
√1
2πze−12z2dz+
∫ ∞
−∞
√1
2πµe−12z2dz =µ 最後の等号は, 1番目の積分が0であることと(5.16)式から得られる. ✷ (5.12)の証明
Z = (X−µ)/σ とおくとZ ∼N(0,1)である. まずZの分散V(Z)を求める. 部分積分の公式 を用いれば
V(Z) = E(Z2) =
∫ ∞
−∞
z2 1
√2πσe−12(z−σµ)2dz
= [
−z 1
√2πσe−12(z−µσ )2]∞
−∞
+
∫ ∞
−∞
z2 1
√2πσe−12(z−µσ )2dz = 0 + 1 = 1 σZ+µはN(µ, σ)に従う. X =µ+σZであるのでV(X) = σ2. ✷
定理5.2の証明 X ∼N(µ, σ2)であるとき, Xの分布関数を求める. 以下の積分の計算で, 変数 変換t= (s−b)/a により置換積分を行う. a >0であるとする.
P(aX+b≤x) =P(X ≤(x−b)/a) (5.17)
=
∫ (x−b)/a
−∞
√1
2πσe−12(t−σµ)2dt (5.18)
=
∫ x
−∞
√ 1
2πσae−12(s−aµ−baσ )2ds (5.19)
(5.19)式の被積分関数は N(aµ+b, aσ2)の確率密度関数である. したがってaX+b∼N(aµ+ b, aσ2)である. a <0の場合も同様. ✷
3重積分を用いて計算するので,証明は省略する.