確率変数と確率分布
2018.04.10
•
統計を含め、ランダムな事象を分析・制御するための科学が確率論•
「理論上起こりうること」と「それらの確率」のリストアップ(
確率分布)
が確率論の基礎1.
確率変数(random variable)
確率変数{
離散型
discrete type (飛び飛びの値)
連続型continuous type (連続的な数の集合) 2.
離散型確率変数の例(サイコロを1回振る場合)
理論上起こりうること 確率変数
(X = x i ) 1 2 3 4 5 6
それらの確率 確率分布(Pr(X = x i ) 1 6 1 6 1 6 1 6 1 6 1 6
• Pr(X = x i ) ≥ 0 (確率の値は非負)
• Σ Pr(X = x i ) = 1 (全確率の和は 1) 3.
連続型確率変数の例ルーレットの例
4.
確率密度関数連続型確率変数
X
が、a≤ X ≤ b
の値をとる確率をPr(a ≤ X ≤ b)
とするPr(a ≤ X ≤ b) = ∫ b
a f (x)dx (x min ≤ a ≤ b ≤ x max ) f (x)を確率密度関数(probability density function)
という
f (x) ≥ 0
∫ xmax
x
minf (x)dx = 1 5.
要約離散型確率変数 連続型確率変数 確率のリストアップ 確率分布
(
表)
確率密度関数 確率の非負性Pr(X = x i ) ≥ 0 f (x) ≥ 0
全確率Σ Pr(X = x i ) = 1 ∫ xmax
x
minf (x)dx = 1 6.
期待値(expectation)
と分散(variance)
E(X ) =
∑ n
i=1 Pr(X = x i ) · x i (離散型)
∫ xmax
x
minxf(x)dx (連続型)
上の例E(X ) = 1 · 1 6 + 2 · 1 6 + 3 · 1 6 + 4 · 1 6 + 5 · 1 6 + 6 · 1 6 = 3.5 7.
期待値の公式X
が確率変数のとき、Y= a + bX
も確率変数• E(Y ) = E(a +bX) = ∑ n
i=1 Pr(X = x i )· (a +bx i ) = a ∑ n
i=1 Pr(X = x i )+b ∑ n
i=1 Pr(X = x i )· x i = a+b · E(X )
• E(Y ) = E(a + bX) = ∫
(a + bx)f (x)dx = a ∫
f (x)dx + b ∫
xf(x)dx = a + bE(X ) 8.
分散(variance )
の定義1
• V ar(X ) = E[(X − E(X)) 2 ] = ∑ n
i=1 Pr(X = x i ) · (x i − E(X )) 2 = · · · = E(X 2 ) − (E(X )) 2
• V ar(X ) = E[(X − E(X)) 2 ] = ∫
(x − E(X)) 2 f (x)dx = · · · = ∫
x 2 f (x)dx − (E(X )) 2 上の例
V ar(X ) = (1 −3.5) 2 · 1 6 + (2 −3.5) 2 · 1 6 + (3 − 3.5) 2 · 1 6 + (4 − 3.5) 2 · 1 6 + (5 − 3.5) 2 · 1 6 + (6 − 3.5) 2 · 1 6 = 2.9167 9.
標準偏差(standard deviation)
√ V ar(X )
を標準偏差(standard deviation)
という 上の例:√
2.9167 = 1.7078 10.
分散の公式X
が確率変数のとき、Y= a + bX
も確率変数V ar(Y ) = V ar(a + bX) = b 2 V ar(X)
11.
正規化の例X
を確率変数とし、その期待値をµ、分散を σ 2 (σ
は標準偏差)とおく。X
を正規化normalizeした確率変数をZ
とおくと、Z = X−µ σ = σ 1 X − µ σ。
このとき、E(Z) =E( 1 σ X − µ σ ) = 1 σ E(X) − µ σ = 0
V ar(Z ) = V ar( σ 1 X − µ σ ) = σ 12V ar(X ) = σ σ22 = 1
正規化すると、期待値は0、分散は 1
となる。
= 1
正規化すると、期待値は0、分散は 1
となる。12.
離散型確率分布の例•
二項分布B(n, p)
確率分布がp k = n C k p k (1 − p) n−k(k= 0, 1, 2, . . .
)
で与えられる確率分布を二項分布(binomial distribution)という。
•
ポアソン分布 確率分布がp(k) = P (X = k) = e −λ λ k
k! (k = 0, 1, 2, · · · )
で与えられる確率分布をポアソン分布(Poison distribution)という。但し、λはパラメーターとする。
13.
連続型確率分布の例•
一様分布Unif (α, β)
•
正規分布N (µ, σ 2 )
X ˜N (µ, σ 2 )
のとき、Pr(a < X < b) =∫ b
a f (x)dx f (x) = σ √ 1 2π e −
12(
x−µσ)
2(−∞ < x < +∞) E(X ) = µ
V ar(X ) = σ 2
•
カイ二乗分布• F
分布• t
分布14.
正規分布の性質• X ˜N (µ, σ 2 )
ならば、Y = a + bX˜N (a + bµ, b 2 σ 2 )
2
• X ˜N (µ, σ 2 )
ならば、Z = X−µ σ ˜N(0, 1)
:標準正規分布(standard normal distribution)
•
標準正規分布表15.
二次元の確率分布(X, Y )
をふたつの確率変数の組とする。確率変数の組に対して確率を与えるものが結合分布。
実現値の組を
(x i , y i )
とすると、Pr(X = x i , Y = y j )
で表す。確率変数が連続型の場合には、確率密度関数
f (x, y)
で表す。16.
離散型確率分布の場合X \Y y 1 y 2 · · · y n 計
↓
x 1 f (x 1 , y 1 ) f(x 1 , y 2 ) · · · f (x 1 , y n ) f 1 (x 1 ) x 2 f (x 2 , y 2 ) f(x 2 , y 2 ) · · · f (x 2 , y n ) f 1 (x 2 )
... ... ... ... ... ...
x m f (x m , y 1 ) f (x m , y 2 ) · · · f (x m , y n ) f 1 (x m )
計→ f 2 (y 1 ) f 2 (y 2 ) · · · f 2 (y n )
• Pr(X = x i , Y = y j ) = f (x i , y j ) ≥ 0
• Σ i Σ j Pr(X = x i , Y = y j ) = 1
• E(X + Y ) = Σ i Σ j (x i + y j ) Pr(X = x i , Y = y j )
• E(XY ) = Σ i Σ j x i y j Pr(X = x i , Y = y j )
• (
同時確率分布)P (X = x i , Y = y j ) = f (x i , y j )
• (周辺確率分布)P(X = x i ) = f 1 (x i ) = Σ n j=1 f (x i , y j )
• (周辺確率分布)P(Y = y j ) = f 2 (y j ) = Σ m i=1 f (x i , y j )
• (
同時分布関数)F(x, y) = P (X ≤ x, Y ≤ y) = Σ u≤x Σ v≤Y f (u, v)
• (X
とY
の独立性)f(x i , y j ) = f 1 (x i )f 2 (y j )
• (条件つき確率)P (B|A) = P(B∩A) P (A) より、P(Y = y j |X = x i ) = f(x f1(x
i,y
ij) ) 17.
連続型確率分布の場合
(x
i,y
ij) ) 17.
X
、Y は離散型確率変数であり、XとY
の同時確率密度関数(joint probability density function)
をf (x, y)
とする。• f (x, y) ≥ 0
• ∫ +∞
−∞
∫ +∞
−∞ f (x, y)dxdy = 1 は確率密度関数の定義から明か。
•
また、確率の計算はP (a < X < b, c < Y < d) = ∫ b
a
(∫ d
c f (x, y)dy ) dx
•
領域が指定されているときにはP ((X, Y ) ∈ A) = ∫
A f (x, y)dxdy などと書くこともある。
•
同時確率分布関数はF (x, y) = P (X ≤ x, Y ≤ y) = ∫ x
−∞
∫ y
−∞ f (x, y)dydx である。
3
•
同時分布関数から同時確率密度関数を求めるにはf (x, y) = ∂x∂y ∂2 F(x, y)
を使う。
•
周辺分布関数はF 1 (x) = P(X ≤ x) = ∫ x
−∞
(∫ +∞
−∞ f (x, v)dv ) dx F 2 (y) = P (Y ≤ y) = ∫ y
−∞
(∫ +∞
−∞ f (u, y)du ) dy などである。
•
周辺分布関数から周辺確率密度関数を求めるにはf 1 (x) = F 1 ′ (x) = ∫ +∞
−∞ f (x, v)dv f 2 (y) = F 2 ′ (y) = ∫ +∞
−∞ f (u, y)du]
を使う。
18.
連続型確率変数の独立性離散型確率変数
X
とY
とが独立であるとは、P (X = x i , Y = y j ) = P (X = x i )P(Y = y j )
、が成り立つことであった。連続型確率変数の場合の独立性は、同時確率密度関数、周辺確率密度関数を用 いて
f (x, y) = f 1 (x)f 2 (y)
と表される。また、同時分布関数、周辺分布関数で表すとF (x, y) = F 1 (x)F 2 (y)
となる。19.
連続型確率変数の条件つき確率条件つき確率は