「統計学」章末の演習問題と略解
2章
問 1. 男子大学生 20 名の身長の平均を調べたところ 172cm であったという。ところが, そのうち 2 名の女子学生のデータが混入していたことが後日わかった。女子学生のデータ は 158cm, 164cm であった。男子学生 18 人の平均を求めよ。
(解) 173.22
問 2. 1 本の値段が 100 円,80 円,40 円, 20 円の 4 種類の鉛筆がある。総額 4,800 円で 4 種類の鉛筆を次のルールで買うことにする。
(1) 4種類の鉛筆を同額ずつ購入する場合,平均価格はいくらか。 (2) 4種類の鉛筆を同数ずつ購入する場合,平均価格はいくらか。 (解) (1) 4800/(12+15+30+60)=41.0 (2) 4800/(4× 20)=60
問 3. データ x1, . . . , xn が与えられたとする。 (1) 平均 x, メディアン medx,分散 Sx2 を求めよ。
(2) 実数 a, b に対して ax1+ b, . . . , axn+ b と変換したとき,それらの平均, メディア ン, 分散 を,x, medx, Sx2 を用いて表せ。
(3) xi を標準化せよ。標準化されたデータはどのような性質をもつか。
(解) (1) x = n−1∑ni=1xi, Sx2 = n−1∑ni=1(xi−x)2,メディアンについては,x1, . . . , xnを小 さい順に並べたものを x(1) <· · · < x(n)とするとき,n が奇数のときには medx = x(n+1)/2,
nが偶数のときには med = {x(n/2)+ x(n/2+1)}/2 となる。
(2) ax + b, amedx+ b, a2Sx2 (3) zi = (xi− x)/sxであり,平均は 0, 分散は 1 になる。 問 4. メディアンについては線形性は一般に成り立たない。例えば med(x1+ y1, . . . , xn+ yn) = med(x1, . . . , xn) + med(y1, . . . , yn)が成り立たない例(反例)をあげてみよ。
(解) n = 5 とし (x1, x2, x3, x4, x5) = (1, 3, 5, 7, 9), (y1, y2, y3, y4, y5) = (3,−1, 5, 0, −9) と
すると,med(x1, . . . , x5) = 5, med(y1, . . . , y5) = 0, med(x1+y1, . . . , x5+y5) = med(4, 2, 10, 7, 0) = 4となるので,5 + 0 ̸= 4 となり反例を与えている。
問 5. 期末試験の答案を40点満点で採点したところ,各人の点数 x1, x2, . . . , xn の平均 は25点,標準偏差は5点になった。
(1) これを100点満点の得点に直すため 2xi+ 20 を各人の得点とした。このとき得点 の平均と標準偏差を求めよ。
(2) 得点 axi + b の平均が50,標準偏差が10になるようにするためには,定数 a, b をどのように定めたらよいか。
(解) (1) 平均 70, 分散 10 (2) a = 2, b = 0
問 6. 小学生(4年),中学生(2年),高校生(2年)の男子体重の平均と標準偏差が 次の表で与えられているとする。
平均 標準偏差
小学生 30 4
中学生 50 10
高校生 60 11
変動係数の意味で最もバラツキの大きいのはどのグループか。 (解) 小学生 0.13, 中学生 0.2, 高校生 0.18 より,中学生
問 7. n 年間の年経済成長率を g1, g2, . . . , gn とし,年平均経済成長率を g とすると (1 + g)n = (1 + g1)(1 + g2)· · · (1 + gn)
が成り立つ。この等式を用いて,次で与えられる,昭和 40 年台前半と昭和 50 年台前半 の日本の経済成長率について,年平均経済成長率を求めよ。
昭和 41 年度: 11.35%, 42: 11.06%, 43: 13.02%, 44: 12.09% 昭和 51 年度: 5.12%, 52: 5.27%, 53: 5.05%, 54: 5.31%
(解) 上の定義式に代入すると,昭和 40 年台前半は 11.88% となり,昭和 50 年台前半は 5.19%となる。
問 8. 次のデータは,男子大学生 20 名の体重である。平均,分散,メディアン,第1四 分位点,第3四分位点を求めよ。
65 72 85 79 59 68 62 62 60 71 73 57 66 58 63 77 64 82 75 65
(解) 分位点の1つの合理的な定義の仕方は以下で与えられる。0 < α < 1 に対して, qαL=(xi ≤ x となる xiの個数が nα以上となる最小の x)
qαR=(xi ≥ x となる xiの個数が n(1 − α) 以上となる最大の x)
とおく。例えば,qαLは,xi ≤ x となる xiの個数が nα となるような x の最小値によって 与えられる。このとき,下側 100α% 点 q(α) は
qα = q
αL+ qαR
2 (1)
により定義される。この定義に従うと,q0.25 = 62, q0.75 = (73 + 75)/2 = 74, med = 65.5 となる。また平均は 68.15, 分散は 64.33 となる。
(注意) 上の分散は標本分散 (n で割ったもの) を用いた値である。統計計算ソフトウェ ア R を用いて,p.309 にあるように var( ) のコマンドで計算すると,不偏分散 (n − 1 で 割ったもの) の値が出力され,上のデータについては不偏分散の値は 67.71 となる。
問 9 分位点が本文の (2.2) で定義されているとき,順序データ x(1) < x(2) <· · · < x(n)
について次の問に答えよ。
(1) 第1四分位点 (α = 0.25) は,m を自然数とすると,n = 4m に対しては q0.25 = (x(m)+ x(m+1))/2, n = 4m + 1, 4m + 2, 4m + 3に対しては q0.25 = x(m+1) となることを 示せ。
(2) 第 3 四分位点 (α = 0.75) は,どのようになるか。 (3) q0.5 = medxとなることを確かめよ。
(解) この問題については,補足説明のファイルの中の「データの分位点」の項目を参照 せよ。そこに説明されているように,nα が自然数のときには qα = (x(nα)+ x(nα+1))/2と なり, nα が自然数でないときには nα を超える最小の自然数を [nα] と書くと qα = x([nα]) となる。これを用いると,(1) が示される。(2) については,n = 4m に対しては q0.75 = (x(3m)+ x(3m+1))/2, n = 4m + 1, 4m + 2, 4m + 3に対しては q0.25 = x(3m+1)となる。(3) につ いては,n = 2m に対しては q0.5 = (x(m)+ x(m+1))/2, n = 2m + 1に対しては q0.55 = x(m+1) となり,メディアンになる。
問 10. 次の不等式を示せ。
(1) x を算術平均とする。すべての実数 c に対して
∑n i=1
(xi− c)2 ≥
∑n i=1
(xi− x)2
が成り立つ。
(2) (やや難)xM をメディアンとする。すべての実数 c に対して
∑n i=1
|xi− c| ≥
∑n i=1
|xi− xM|
が成り立つ。∑ni=1|xi− c| を最小化する解はメディアンのみか。
(解) (1) については,∑ni=1(xi−c)2 =∑ni=1{(xi−x)+(x−c)}2 =∑ni=1(xi−x)2+n(x−c)2 と表されることからわかる。
(2)については,証明のアイデアを与えておこう。自然数 m に対して n = 2m + 1 のと き,メディアンは x(m+1)になる。このとき
2m+1∑ i=1
|x(i)− x(m+1)| = −
∑m i=1
(x(i)− x(m+1)) +
2m+1∑ i=m+2
(x(i)− x(m+1))
= −
∑m i=1
x(i)+
2m+1∑ m+2
x(i)
となる。この値と∑2m+1i=1 |x(i)− c| の値との差を求めて,その差が非負であることを示せ ばよい。例えば,x(m+1) ≤ c < x(m+2)の範囲にあるときには,
2m+1∑ i=1
|x(i)− c| = −
m+1∑ i=1
(x(i)− c) +
2m+1∑ i=m+2
(x(i)− c)
= −
m+1∑ i=1
x(i)+
2m+1∑ m+2
x(i)+ c
と書ける。従って,∑2m+1i=1 |x(i)− c| −∑2m+1i=1 |x(i) − x(m+1)| = c − x(m+1) ≥ 0 が成り立 つことがわかる。あらゆる範囲の c に対して同様の方法で不等式を示すことができる。ま た n = 2m のときにも同様にして示すことができるので確かめてほしい。ただし,この場 合,メディアンは medx = (x(m/2)+ x(m/2+1))/2となるが,最小を与える解はメディアン に限らず,x(m/2) < c∗ < x(m/2+1)を満たす c∗はすべて最小解を与えることが確かめられ る。メディアンはその代表的なものになっている。
より詳しい説明は,補足説明のファイルの中の「メディアンの性質(2)」に与えられ ている。
問 11. 正のデータ x1, . . . , xnと −1 ≤ t ≤ 1 に対して M(t) = (n−n∑ni=1xti
)1/t
とおく。 このとき,次の性質を証明せよ。
(1) M (t)は t に関して単調増加する。 (2) limt→0M (t) = Gxが成り立つ。
(解) (1) の証明には,関数の微分を使う。関数 f(x) の微分導関数を f′(x) = df (x)/dx で表す。関数の微分については基本的な説明が付録 2 で与えられているので参照するとよ
い。ax = exp{x log a} であり,(d/dx) exp{f(x)} = f′(x) exp{f(x)} となることに注意す る。従って,
d
dtM (t) = d dtexp
{1 t log
( 1 n
∑n i=1
xti)}
= d dt
{1 t log
( 1 n
∑n i=1
xti)}× exp{1 t log
( 1 n
∑n i=1
xti)}
={−1 t2 log
( 1 n
∑n i=1
xti)+1 t
∑n
i=1∑(log xi)xti n
i=1xti
}M (t)
と書けるので,不等式 t
∑n i=1
(log xi)xti ≥
∑n i=1
xtilog( 1 n
∑n i=1
xti)
が成り立てば,M(t) が t に関して単調増加することがわかる。この不等式は 1
n
∑n i=1
xtilog xti ≥( 1 n
∑n i=1
xti)log( 1 n
∑n i=1
xti) (2)
と書き直すことができる。ここで,g(x) = x log(x) とおくと,不等式 (2) は 1
n
∑n i=1
g(xti)≥ g( 1 n
∑n i=1
xti) (3)
と表されることがわかる。
そこで,不等式 (3) を示そう。まず,g(x) は凸関数である。実際,g′(x) = log(x) + 1, g′′(x) = 1/x > 0よりわかる。µ = n−1∑ni=1xti とおき, 点 (µ, g(µ)) を通り関数 g(x) に接 する直線を引いてみる。この直線を y = a(x − µ) + g(µ) とすると,g(x) が凸関数である から,すべての x に対して
g(x)≥ a(x − µ) + g(µ)
なる不等式が成り立つ。すべての点で成り立つので,i = 1, . . . , n に対して g(xti)≥ a(xti − µ) + g(µ)
となり,和をとると
∑n i=1
g(xti)≥
∑n i=1
a(xti − µ) + ng(µ) = ng(µ) となる。従って,
1 n
∑n i=1
g(xti)≥ g(µ) = g( 1 n
∑n i=1
xti) となり,不等式 (3) が成り立つことがわかる。
(2) の証明には,次のロピタルの定理を用いる。2つの関数 h(x), f(x) が x = 0 で微分 可能で,微分した関数が連続であるとする。また limx→0h(x) = 0, limx→0f (x) = 0となっ ていると仮定する。このとき,
x→0lim h(x)
f (x) = limx→0 h′(x) f′(x)
が成り立つ。 いま,
M (t) = exp{1 t log
( 1 n
∑n i=1
xti)}
と書けるので,exp{·} の中の関数に関してロピタルの定理を用いる。
limt→0
log(n1 ∑ni=1xti)
t = limt→0
∑n
i=1∑(log xi)xti n
i=1xti
=
∑n
i=1log xi
n =
1
n log(x1× · · · × xn)
= log{(x1× · · · × xn)1/n} となる。従って,
limt→0M (t) = exp{lim
t→0
1 t log
( 1 n
∑n i=1
xti)}
= exp[log{(x1× · · · × xn)1/n}] = (x1× · · · × xn)1/n となり,幾何平均に収束することがわかる。
3章
問 1. 次の度数分布について,(1) 平均,(2) メディアン,(3) 分散を求めよ。
階 級 階級値 度数
40 以上 50 未満 45 1 50 以上 60 未満 55 2 60 以上 70 未満 65 2 (解) (1) 57 (2) 57.5 (3) 56
(注意) メディアンの求め方は,本書 p.46 で説明されているように,全体の度数が 5 で あるから下から累積度数が 2.5 となる点を求めればよい。メディアンの値を x とするとメ ディアンは 50 以上 60 未満の階級に入ることがわかる。度数は面積に対応しており,こ の階級については底辺が 10 で高さが 2 の面積が度数 2 に対応する。従って底辺の長さが x− 50 の面積が 2.5 − 1 = 1.5 の度数に対応するように x の値を求めればよい。すなわち
2× x− 50 10 = 1.5
を解けばよいので,メディアンは x = 50 + 7.5 = 57.5 となる。
問 2. ある大学の学生についてアルバイトに関する調査をしたところ,1週間あたりの 収入について次のような度数分布が得られたと仮定する。収入の低い方から度数が等しく なるように4つの階級 A, B, C, D に分け,階級値は各階級における収入の平均値をとっ たものとする。このときローレンツ曲線を描き,各点の座標を与えよ。またジニ係数を求 めよ。
階級 階級値 相対度数 A 1 万円 25% B 2 万円 25% C 3 万円 25% D 4 万円 25%
(解) (0,0), (1/4, 1/10), (1/2, 3/10), (3/4, 3/5), (1,1) と結んだ折れ線がローレンツ曲線 で,ジニ係数は 0.25
問 3. 次の度数分布について,N = n1+ n2+ n3 とおいて,(1) 平均 A,(2) 分散 V を 与えよ。
階 級 階級値 度数
40 以上 50 未満 x1 n1
50 以上 60 未満 x2 n2
60 以上 70 未満 x3 n3
(解) (1) A =∑3i=1xini/N (2) V =∑3i=1(xi)2ni/N − A2
問 4. 3 つのデータ x1, x2, x3 が 0 < x1 < x2 < x3 をみたすとき,以下の問いに答えよ。 (1) 相加平均 x, 幾何平均 G, 調和平均 H の定義を与えて,その大小関係を記せ。また 標本分散 S2, レンジ R, 変動係数 CV を与えよ。
(2) x1, x2, x3 を,平均 50, 標準偏差 10 の変数 z1, z2, z3 に変換したい。変換の計算式 を記せ。
(3) x1, x2, x3 に基づいてローレンツ曲線を描くには,(0, 0), (□, □), (□, □), (1, 1) なる 4 つの点を順に結べばよい。T = x1+ x2+ x3 として □ に入るものを記せ。
(4) ジニ係数 G はどのように定義されか。何を測る尺度として利用されるか。x1, x2, x3
に基づいてジニ係数を与えよ。
(解) (1) x = (x1 + x2 + x3)/3, G = (x1x2x3)1/3, H = 3/(x−11 + x−12 + x−13 ), S2 = (x21+ x22 + x23)/3− x2, R = x3− x1, CV = S/x (2) a = 10/S, b = 50− 10x/S とおくと き, axi+ bと変換すればよい。 (3) (1/3, x1/T ), (2/3, (x1+ x2)/T ) (4) ジニ係数は不平等 度や集中度を測る尺度として用いられる。
G =(1 3−
x1
T )2
3 + (2
3 −
x1+ x2
T
)(1− 1 3
)= 2(x3− x1) 3T
問 5. k 個のデータ x1, . . . , xk が x1 ≤ · · · ≤ xk なる順序に並んでいるものとする。この ときローレンツ曲線と完全平等線とで囲まれる面積を S とすると,
2S = 1 2k∑ki=1xi
∑k i=1
∑k j=1
|xi− xj| なる等式が成り立つことを示せ。
(解) 本文 p.48, p.49, p.53, p.54 を参照せよ。
4章
問 1. 次の表は,7 本の河川の長さと流域面積のデータである。ただし,長さの単位は 10km, 面積の単位は 1000km2である。
番号 1 2 3 4 5 6 7 長さ x 26 25 30 37 8 20 12 流域面積 y 14.3 10.2 16.8 12.0 8.2 3.7 2.9
このデータをプロットせよ。x と y の相関係数を求めよ。河川の長さで流域面積を説明す る回帰直線を求めてプロットせよ。
(解) rxy = 0.67, y = 1.90 + 0.35x
データのプロットや回帰直線の描画及び回帰分析の結果の出力については,統計解析ソ フト R のスクリプト・ファイル StatisticsR.R に具体的なコードが記述されているので, それを実行することにより,回帰分析結果を表示することができる。
問 2. 2次元の変数 (x, y) のデータ (x1, y1), . . . , (xn, yn) が与えられている。 (1) x と y の相関係数 rxy を与えよ。
(2) rxy の主な性質を2点あげよ。
(3) 相関係数を用いる際の主な注意事項を2点あげよ。
(解) (1) 本文 p.60 で与えられている。(2) −1 ≤ rxy ≤ 1,|rxy| は xi, yiを axi+ b, cyi+ d に変換しても変わらないこと。(3) 見かけの相関といって,相関がないもの同士が共通す る第3の変数の影響で相関が現れてしまうこと。また外れ値の影響を受けやすく,例えば 一組だけ大きな値が入ると相関係数は1に近い値をとってしまうこと。
問 3. 2 次元のデータ (x1, y1), . . . , (xn, yn) が与えられたとして,次の問に答えよ。 (1) 相関係数 rxyについて,0 でない定数 a, b, c, d に対して,データを (ax1 + b, cy1 + d), . . . , (axn + b, cyn + d) と線形変換したときの相関係数を rax+b,cy+d とおく。このと
き,rax+b,cy+d を rxy を用いて表せ。また rax+b,cy+d の取り得る値の範囲を記せ。(2) i
番目のデータ (xi, yi) について,残差 ei を定義せよ。残差の和∑ni=1ei の値を与えよ。 (x1, e1), . . . , (xn, en)の相関係数 rxeの値を与えよ。
(解) (1) rax+b,cy+d = (ac/|ac|)rx,y, |rax+b,cy+d| ≤ 1 (2)∑ni=1ei = 0, rxe = 0
問 4. 2次元の変数 (x, y) のデータ (x1, y1), . . . , (xn, yn)が与えられ,この2つの変数の 間に線形関係 y = α + βx が認められるという。
(1) 最小2乗法について説明し,α と β の値を与えよ。
(2) 3組の変数 (x, y, z) のデータが与えられたとき,y と z の偏相関係数について説明 し,それを用いる目的について述べよ。
(解) (1) ∑ni=1(α + βxi− yi)2を最小にする α と β を求めることで,最小を与える α, β の解を a, b とすると,a = y − bx, b = Sxy/Sx2となる。(2) y と z との偏相関係数とは,y を x に回帰したときの残差 e と z を x に回帰したときの残差 d との相関係数のことで,y 及び z から x の影響を取り除いた上での相関係数を与えている。
問 5. 残差の平方和などに関する関係式が (4) で与えられている。それらの式が成り立 つことを示せ。
1 n
∑n i=1
e2i =SyySxx− S
yx2
Sxx
, 1
n
∑n i=1
d2i =SzzSxx− S
zx2
Sxx
, 1
n
∑n i=1
eidi =SyzSxx− SyxSzx Sxx
(4)
(解) p.74 で与えられている記号を用いる。ei = yi − a1 − b1xi, e = n−1∑ni=1ei = y− a1− b1x = 0より,ei− e = (yi− y) − b1(xi− x) となる。従って
1 n
∑n i=1
e2i = Sy2− 2b1Syx+ b21Sx2
となり,(4) の最初の式が得られる。次の式も同様である。最後の式は (ei− e)(di− d) = {(yi− y) − b1(xi− x)}{(zi− z) − b2(xi − x)} より
1 n
∑n i=1
eidi = Syz− b2Syx− b1Szx+ b1b2Sx2
となり,最後の式が得られる。
問 6. 偏相関が (5) の形に書けることを示せ。
ryz|x = red = √ SyzSxx− SyxSzx SyySxx− Syx2
√SzzSxx− Szx2
(5)
(解) (4) で与えられる式を p.74 の redに代入すればよい。
5章
問 1. P (A) = 0.5, P (B) = 0.3, P (A ∩ B) = 0.2 であるような2つの事象 A, B について, P (Ac), P (A∪ B), P (Ac∩ B) の確率を求めよ。
(解) P (Ac) = 0.5, P (A∪ B) = 0.6, P (Ac∩ B) = 0.1
問 2. P (A) = 0.5, P (B|A) = 0.4, P (A|B) = 0.8 であるような2つの事象 A, B につい て,P (B), P (A ∪ B), P (Bc∩ A) の確率を求めよ。
(解) P (B) = 0.25, P (A ∪ B) = 0.55, P (Bc ∩ A) = 0.3
問 3. 事象 A と B が独立であり,P (A) = 0.5, P (B) = 0.4 であるとする。このとき, P (A|B), P (A ∩ B), P (A ∪ B), P (Ac∩ Bc)の確率を求めよ。
(解) P (A|B) = 0.5, P (A ∩ B) = 0.2, P (A ∪ B) = 0.7, P (Ac ∩ Bc) = 0.3 問 4. P (Ac ∩ Bc), P (Ac ∪ Bc)を P (A ∩ B), P (A ∪ B) を用いて表せ。 (解) P (Ac∩ Bc) = 1− P (A ∪ B), P (Ac∪ Bc) = 1− P (A ∩ B)
問 5. 事象 A1, A2, A3に対して次を示せ。
P (A1∪ A2∪ A3) =P (A1) + P (A2) + P (A3)− P (A1∩ A2)− P (A2∩ A3)− P (A3∩ A1) + P (A1∩ A2∩ A3)
(解) B1 = A1 ∩ A2, B2 = A2 ∩ A3, B3 = A3 ∩ A1, C = A1 ∩ A2 ∩ A3 とすると, A1 = (A1∩ (B1∪ B3)c)∪ (B1∩ Cc)∪ (B3∩ Cc)∪ C と書ける。それぞれの集合の間の共 通集合は空集合なので,
P (A1) = P (A1 ∩ (B1∪ B3)c) + P (B1∩ Cc) + P (B3∩ Cc) + P (C)
と書ける。同様にして
P (A2) =P (A2∩ (B1∪ B2)c) + P (B1∩ Cc) + P (B2∩ Cc) + P (C) P (A3) =P (A3∩ (B2∪ B3)c) + P (B2∩ Cc) + P (B3∩ Cc) + P (C)
となる。P (A1 ∪ A2 ∪ A3) = P (A1∩ (B1 ∪ B3)c) + P (A2 ∩ (B1 ∪ B2)c) + P (A3 ∩ (B2∪ B3)c) + P (B1 ∩ Cc) + P (B2∩ Cc) + P (B3∩ Cc) + P (C)と書けるので,右辺の最初の3 つの項に上の3つの式を代入すると,
P (A1∪ A2∪ A3) =P (A1)− P (B1∩ Cc)− P (B3∩ Cc)− P (C) + P (A2)− P (B1∩ Cc)− P (B2∩ Cc)− P (C) + P (A3)− P (B2∩ Cc)− P (B3∩ Cc)− P (C) + P (B1∩ Cc) + P (B2∩ Cc) + P (B3∩ Cc) + P (C)
=P (A1) + P (A2) + P (A3)− P (B1∩ Cc)− P (B2∩ Cc)− P (B3∩ Cc)
− 2P (C)
=P (A1) + P (A2) + P (A3)− P (B1)− P (B2)− P (B3) + P (C) が成り立つ。ただし P (B1∩ Cc) + P (C) = P (B1)であることに注意する。
問 6. (6) を示せ。
P (A1∩ · · · ∩ An) = P (An | A1∩ · · · ∩ An−1)× · · · × P (A3 | A1∩ A2)P (A2 | A1)P (A1) (6) (解) B = A1 ∩ · · · ∩ An−1とおくと P (A1∩ · · · ∩ An) = P (B∩ An) = P (An|B)P (B) と なので,あとは P (B) = P (A1∩ · · · ∩ An−1)についてこの操作を繰り返していけばよい。
問 7. (7) を示せ。また (8) を示せ。
P (A) =
∑n k=1
P (A| Bk)P (Bk) (7)
P (Bj | A) =
P (A| Bj)P (Bj)
∑n
k=1P (A| Bk)P (Bk) (8) (解) Ω = B1∪ · · · ∪ Bn, Bi∩ Bj =∅, (i ̸= j), より,
A = A∩ Ω = A ∩ (B1∪ · · · ∪ Bn) = (A∩ B1)∪ · · · ∪ (A ∩ Bn) となり,(A ∩ Bi)∩ (A ∩ Bj) = ∅, (i ̸= j), より
P (A) =
∑n k=1
P (A∩ Bk) =
∑n k=1
P (A|Bk)P (Bk)
と書ける。また P (Bj|A) = P (A ∩ Bj)/P (A)に上の値を代入すればよい。
問 8. ある特定の病気について疾患の有無を調べる簡易的な検査方法がある。この方法 によると,間違えて陽性反応 (疾患があると判断) が出てしまう確率は 10% であり,一方 間違えて陰性 (疾患がないと判断) となる確率は 1% 程度の精度になっているという。その
病気にかかっているのは全体の 10% であるとする。陽性反応が出たとき,病気にかかっ ている確率を求めよ。
(解) その病気にかかっている事象を B, 陽性反応が出る事象を A をすると,病気ではな いのに間違えて陽性が出る確率は P (A|Bc) = 1/10, P (Ac|Bc) = 9/10となる。同様にし て P (Ac|B) = 1/100, P (A|B) = 99/100 となる。P (B) = 1/10, P (Bc) = 9/10より,ベイ ズの定理を用いると
P (B|A) = P (A|B)P (B)
P (A|B)P (B) + P (A|Bc)P (Bc) =
(99/100)(1/10)
(99/100)(1/10) + (1/10)(9/10)
= 99 99 + 90 =
11
21 = 0.5238
問 9. B1, B2, B3, B4と名前の付いた4つの壺から1つをランダムに選び,選ばれた壺 の中から玉を1つランダムに選ぶと仮定する。k 番目の壺 Bkには k 個の赤玉と 10 − k 個 の白玉が入っているものとする。このとき,(1) 赤玉が選ばれる確率,(2) 赤玉が選ばれ たときに,それが 4 番目の壺からとられる確率,を求めよ。
(解) P (B1) = P (B2) = P (B3) = P (B4) = 1/4,赤玉を選ぶ事象を A とすると P (A|Bk) = k/10となることがわかる。(1) P (A) = ∑4k=1P (A|Bk)P (Bk) =∑4k=1(k/10)(1/4) = 0.25 (2) P (B4|A) = P (A|B4)P (B4)/P (A) = 0.4
問 10. ある銀行において貸出審査の結果が「優」「良」「可」に分類され,それぞれの確 率が 0.2, 0.5, 0.3 であったという。また完済できたか,返済不能になったか,いずれかの 結果がわかっており,審査で「優」のランクの貸付のうち完済できた確率が 0.9,「良」の うち完済できた確率が 0.6, 「可」のうち完済できた確率が 0.4 とする。このとき,(1) 完 済できた貸付のうち,それが「優」のランクである確率を求めよ。(2) 返済不能となった 貸付のうち,それが「優」のランクである確率を求めよ。
(解) 「優」「良」「可」の事象をそれぞれ B1, B2, B3とすると,P (B1) = 0.2, P (B2) = 0.5, P (B3) = 0.3である。完済できた事象を A とすると, P (A|B1) = 0.9, P (A|B2) = 0.6, P (A|B3) = 0.4である。このとき P (A) = 0.9 × 0.2 + 0.6 × 0.5 + 0.4 × 0.3 = 0.6 に 注意する。(1) P (B1|A) = P (A|B1)P (B1)/P (A) = 0.3 (2) P (Ac) = 0.4 であるから, P (B1|Ac) = P (Ac|B1)P (B1)/P (Ac) = 0.1× 0.2/0.4 = 0.05
問 11. ある薬の服用と特定の病気の治癒の間に関係があるか否かに関心があるとする。 事象 A1, A2cをそれぞれ薬の服用,非服用とし,B1, B2をそれぞれ病気が治癒する事象, 治癒しない事象とする。いま,P (A1) = c, P (B1) = b, P (A1∩ B1) = a, P (A1∩ B2) = 1/9, P (A2∩ B1) = 4/9で与えられているとする。
B1 B2 計 A1 a 1/9 c A2 4/9 d 1− c 計 b 1− b 1
(1) 薬の服用と病気の治癒の間に因果関係がないとした場合,a, b, c, d はどのような値 をとるか。
(2) 薬の服用と病気の治癒の間には独立性が成り立っていないとする。P (A2∩ B2) = d の値を適当に与え,独立ではないときの a, b, c の値を与えよ。また,その場合の条件付 き確率 P (B1 | A1)を求めよ。
(解) (1) a = 2/9, b = 2/3, c = 1/3, d = 2/9 (2) 例えば d = 1/9 とおくと,a = 1/3, b = 7/9, c = 4/9となり, P (B1 | A1) = a/c = 3/4
6章
問 1. 準々決勝,準決勝,決勝からなるトーナメント方式で優勝を競うサッカーの大会 で,ある強豪チームが勝ち進む確率は次のように与えられているとする。
準々決勝で勝つ確率は 4/5 準決勝で勝つ確率は 3/4 決勝で勝つ確率は 1/2
このチームがトーナメント方式の中で勝利する回数を X とするとき次の問に答えよ。 (1) P (X = 0), P (X = 1), P (X = 2), P (X = 3)を求めよ。これらの和が 1 になること を確かめよ。
(2) E[X], V ar(X)の値を求めよ。
(3) 大会への参加費を 5 万円とし,賞金を 2X2万円とする。期待される利益額はいくら になるか。
(解) (1) P (X = 0) = 1/5, P (X = 1) = 1/5, P (X = 2) = 3/10, P (X = 3) = 3/10 (2) E[X] = 1.7, V ar(X) = 1.21 (3) 3.2
問 2. ある講義で使用する教科書について用意する冊数を事前に決める必要がある。聴 講学生の人数 X は {80, 100, 120} の値をとり,その確率は, P (X = 80) = 1/8, P (X = 100) = 1/2, P (X = 120) = 3/8で与えられるとする。
(1) E[X]を求めよ。
(2) 人数が多くなり追加注文した場合には 1 冊あたり 100 円の損失,また売れ残ったと きには 1 冊あたり 200 円の損失が出るという。用意する教科書の数を 80, 100, 120 とする とき,どれを選んだらよいか。それぞれの期待損失を計算して,最適な数を答えよ。
(解) (1) E[X] = 105 (2) 例えば 100 冊を用意したときの期待損失額は P (X = 80) × 200× 20 + P (X = 120) × 100 × 20 = 1250 となる。同様にして,80 冊の時の期待損失は 2,500, 120冊の時の期待損失は 3,000 より,100 冊が最適
問 3. ある人気のある食品について,1日当たりの販売数は平均 100 個,標準偏差が 10 の確率分布に従っているという。1 個の利益が 50 円のとき,1 日当たりの期待される利益 を求めよ。売れ残ると 1 個あたり 100 円の損失になるという。120 個を用意した場合,期 待される利益はいくらになるか。
(解) 1日当たりの期待利益は 5,000 円。また期待される利益は 3,000 円。標準偏差の値 は使う必要がない。
問 4. (やや難)f(k) = 1/2k+1, k = 0, 1, . . ., が確率関数になることを示せ。この分布の 平均と分散を求めよ。
(解) E[X] =∑∞k=0k/2k+1を計算する必要がある。これを計算するために,実数 a > 1 に対して
g(a) =
∑∞ k=0
1 ak =
a a− 1 を考える。この両辺を a に関して微分すると,
g′(a) = −
∑∞ k=0
k
ak+1 =− 1 (a− 1)2
となるので,a = 2 を代入すると,E[X] =∑∞k=0k/2k+1 = 1となることがわかる。 また,同様にして
g′′(a) =
∑∞ k=0
k(k + 1) ak+2 =
2 (a− 1)3
より,E[X(X + 1)] =∑∞k=0k(k + 1)/2k+1 = 4となるので,V ar(X) = 2 となる。 問 5. 確率変数 X が P [X = 1] = p, P [X = 0] = 1 − p なる確率分布をもつとする。こ のとき X2 の平均と分散を求めよ。
(解) E[X2] = 02× (1 − p) + 12× p = p, 同様に V ar(X) = p(1 − p)
問 6. 次の関数が密度関数になるように正規化定数 C を与えよ。また分布関数を求めよ。 (1) f (x) = Cx3, 0 < x < 2 (2) f (x) = Ce−|x|, −∞ < x < ∞
(解) (1) C = 1/4 (2) C = 1/2
問 7. 連続型確率変数 X について,(1) E[(X − t)2], (2) E[|X − t|] をそれぞれ最小にす る t を求めよ。
(解) (1) E[(X − t)2] = E[X2]− 2tE[X] + t2を最小にする t は t = E[X], (2) X の確率 密度関数を f(x) とすると
E[|X − t|] =
∫
|x − t|f(x)dx =
∫ t
−∞
(t− x)f(x)dx +
∫ ∞ t
(x− t)f(x)dx
=t
∫ t
−∞
f (x)dx−
∫ t
−∞
xf (x)dx +
∫ ∞ t
xf (x)dx− t
∫ ∞ t
f (x)dx と書けるので,これを t に関して微分すると
∫ t
−∞
f (x)dx + tf (t)− tf(t) − tf(t) −
∫ ∞ t
f (x)dx + tf (t) となるので,これを = 0 とおくと
∫ t
−∞
f (x)dx =
∫ ∞ t
f (x)dx が出てくる。∫t∞f (x)dx = 1−∫−∞t f (x)dxより,
∫ t
−∞
f (x)dx = 1/2 となるので,この解 t は X の分布のメディアンになる。
問 8. (やや難)X を非負の整数上で確率をもつ離散型確率変数とする。非負整数 k に 対して F (k) = P (X ≤ k) とするとき,X の期待値が次のように表されることを示せ。
E[X] =
∑∞ k=0
{1 − F (k)}
(解) E[X] =∑∞k=0kp(k) =∑∞k=0(∑k−1j=01)p(k)と書ける。ここで,0 ≤ k < ∞, 0 ≤ j ≤ k− 1 であり,k と j の順番を交換すると,0 ≤ j < ∞, j + 1 ≤ k < ∞ となる。従って
E[X] =
∑∞ k=0
(
∑k−1 j=0
1)p(k) =
∑∞ j=0
∑∞ k=j+1
p(k) =
∑∞ j=0
(1− F (j))
となる。
問 9. 記述統計で学んだチェビシェフの不等式と今回学んだ確率についてのチェビシェ フの不等式をそれぞれ導出せよ。またこれらの不等式がどのような意味で重要なのかを説 明せよ。
(解) 記述統計で学んだチェビシェフの不等式の導出は本文の p.38 で与えられており,区 間 [x − kSx, x + kSx]の範囲に全体の 1 − 1/k2以上の割合のデータが落ちることを意味す る。また確率のチェビシェフの不等式は p.106 で導出されており,区間 [µ − kσ, µ + kσ] の範囲に全体の 1 − 1/k2以上の確率が入ることを意味する。
7章
問 1. 確率変数 X の取る値を {1, . . . , N} とし,k = 1, . . . , N に対して p(k) = P (X = k) = 1/Nとする。この分布を離散一様分布という。X の平均と分散を求めよ。
(解) E[X] = (N + 1)/2, V ar(X) = (N + 1)(N − 1)/12
問 2. 殺虫剤の効き目を調べる実験を行ったところ,死亡する割合は8割であることが わかった。いま 10 匹の虫にこの殺虫剤を使用し,生き残る虫の数を X とする。
(1) X ≤ 2 となる確率を求めよ。 (2) Xに平均と分散を求めよ。
(解) (1) X ∼ Bin(10, 0.2) となるので,P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) = 0.67 (2) E[X] = 2, V ar(X) = 1.6
問 3. 2 項係数について (9) で与えられた関係式が成り立つことを示せ。
nCk = n−1Ck−1+ n−1Ck (9)
(解)
n−1Ck−1+ n−1Ck= (n− 1)! (k− 1)!(n − k)! +
(n− 1)! k!(n− k − 1)!
= n! k!(n− k)!
{ k n +
n− k n
}= nCk
問 4. 確率変数 X がポアソン分布 P o(λ) に従うとする。 (1) µ = E[X] と E[X(X − 1)] を求めよ。
(2) V ar(X) = E[X(X− 1)] + µ − µ2 となることを示し,V ar(X) を求めよ。 (解) (1) E[X] = λ, E[X(X − 1)] = λ2 (2) V ar(X) = λ
問 5. ある店には1時間当たり平均2人の客が来るという。来客数がポアソン分布に従 うとして次の確率を求めよ。(1) 1 時間に少なくとも1人の客が来る確率。(2) 1 時間に多 くても1人の客が来る確率。
(解) (1) X ∼ P o(2) より,P (X ≥ 1) = 1 − P (X = 0) = 0.86 (2) P (X ≤ 1) = P (X = 0) + P (X = 1) = 0.41
問 6. np = λ (定数) なる制約のもとで,n → ∞, p → 0 に近づけると,2項分布 B(n, p) がポアソン分布に近づくことを示せ。
(解) 本文 p.123 に与えられいる。
問 7. X が区間 (0, 1) 上の一様分布に従うとき,条件付き確率 P [{16X2− 16X + 3 < 0}|{2X > 1}] を求めよ。
(解) 16X2− 16X + 3 < 0 の解は 1/4 < X < 3/4 より
P [{16X2− 16X + 3 < 0}|{2X > 1}] =P [{1/4 < X < 3/4}|{X > 1/2}]
=P ({1/2 < X < 3/4}) P ({X > 1/2}) =
1/4 1/2 =
1 2 問 8. 確率関数 X の密度関数が
f (x) =
{ 1/(b− a) : a≤ x ≤ b のとき,
0 :その他
で与えられるとき,X は区間 [a, b] 上の一様分布に従うという。 (1) X の平均と分散を求めよ。
(2) X2 の平均と分散を求めよ。
(解) (1) E[X] = (a + b)/2, V ar(X) = (a − b)2/12 (2) E[X2] = (a2 + ab + b2)/3, V ar(X2) = (a− b)2(4a2+ 7ab + 4b2)/45
問 9. X が正規分布 N (20, 52) に従うとき,次の値を求めよ。 (1) P [X > 35], P [16 < X < 22]
(2) 上側5%点と四分位点(25%点,75%点)
(解) (1) P (X > 35) = P (Z > 3) = 1 − Φ(3) = 0.0013, ただし Z ∼ N (0, 1), P (16 < X < 22) = P (−0.8 < Z < 0.4) = Φ(0.4) − Φ(−0.8) = Φ(0.4) + Φ(0.8) − 1 = 0.4436 (2) 一般に α = P (X > xα) = P (Z > (xα − 20)/5) = P (Z > zα)より xα = 5zα+ 20なる関 係式が成り立つ。従って,α = 0.05 のときには,5z0.05+ 20 = 28.23, α = 0.25のときに は,5z0.25+ 20 = 23.35, α = 0.75のときには,5z0.75+ 20 = 16.65
問 10. 20 歳台の男性の身長が平均 170cm,標準偏差 6cm の正規分布に従うとする。182cm 以上の人は全体の何 % に相当するか。164∼176cm に入る人は全体の何 % になるか。上 側 5% 点は何 cm か。
(解) P (X > 182) = P (Z > 2) = 1 − Φ(2) = 2.28%, P (164 < X < 176) = P (−1 < Z < 1) = 2Φ(1)− 1 = 68.27%, x0.05= 6z0.05+ 170 = 179.87
問 11. (やや難)確率変数 X が正規分布 N (µ, σ2)に従うとき,Y = aX + b は N (aµ + b, a2σ2) に従うことを示せ。
(解) p.108, p.109 の内容から,X の確率密度関数 fX(x)に対して,Y = aX + b の確率 密度関数 fY(y)は
fY(y) = 1 afX
(y − b a
)
と書けることがわかる。標準正規分布の確率密度関数を ϕ(z) とすると fX(x) = 1
σϕ
(x − µ σ
)
と書けることに注意する。この分布が N (µ, σ2)である。従って Y の確率密度関数は x = (y− b)/a を代入することにより
fY(y) = 1 afX
(y − b a
)= 1 aσϕ
((y − b)/a − µ σ
)= 1 aσϕ
(y − b − aµ aσ
)
と書ける。これは Y の分布が N (aµ + b, (aσ)2)になることを意味する。
問 12. (やや難)確率変数 Z が N (0, 1) に従うとき,Z2が χ21に従うことを示せ。
(解) p.111 の平方変換を用いると X = Z2の確率密度関数は fX(x) = √1
xϕ(
√x) = √1 2πx
1/2−1exp{−x/2}
となる。ここで p.326 のガンマ関数の性質から Γ(1/2) =√πであることに注意すると, fX(x) = 1
Γ(1/2) (1
2 )1/2
x1/2−1exp{−x/2} と表される。これは χ21の確率密度関数である。
問 13. ある店に朝開店してから最初に客が来るまでの時間を X1, その時点から次の客 が来るまでの時間を X2,以下 X3, X4, . . . とする。開店した時点を時刻 0 として,時刻 t までに来店した客の人数を N(t) とするとき,N(t) = n となる確率は
P [N (t) = n] = (λt)
n
n! e
−λt, n = 0, 1, 2, . . .
なるポアソン分布に従っているという。ただし,λ は単位時間に来る客の人数である。 (1) 時刻 s までに来店する人数が 0 である確率を求めよ。
(2) 確率変数 X1 は指数分布に従い,その密度関数は fX1(s) = λe
−λs
で与えられることを示せ。 (3) s > 0, t > 0 に対して
P [X1 > s + t|X1 > s] = P [X1 > t] が成り立つことを示せ。
(解) (1) P (N(s) = 0) = e−λs, (2) P (X1 > s) = P (N (s) = 0) = e−λsより, FX1(s) =
P (X1 < s) = 1 − e−λs となる。これを s で微分すると, fX1(s) = λe
−λs となる。(3)
P [X1 > s + t|X1 > s] = P [X1 > s + t]/P [X1 > s] = e−λ(s+t)/e−λs = e−λt= P [X1 > t]
8章
問 1. 2次元の確率変数 (X, Y ) が確率分布が次の表によって与えられるとする。ただ し,X の実現値は 1, 2 とし, Y の実現値は −1, 0, 1 とし,a, b は,実数で,X の平均は 1.5 である。
X\Y −1 0 1 1 0.1 0.3 a 2 b 0.1 0.2
(1) a, b の値を求め,X の分散を計算せよ。 (2) X ≤ Y + 2 なる確率を求めよ。
(3) Cov(X, Y ) の値を求めよ。X と Y は,独立か。その理由を書け。
(4) Y =−1 を与えたときの条件付き確率 P [X ≤ Y + 2|Y = −1] を計算せよ。 (5) Y =−1 を与えたときの X の条件付き期待値 E[X|Y = −1] を求めよ。
(解) (1) a + b = 0.3, a + 2b = 0.5 を解いて a = 0.1, b = 0.2, V ar(X) = 1/4 (2) P (X ≤ Y + 2) = 0.8 (3) E[XY ] = (−1) × 0.1 + 0 × 0.3 + 1 × 0.1 + (−2) × 0.2 + 0 × 0.1 + 2 × 0.2 = 0 より Cov(X, Y ) = E[XY ] − E[X] × E[Y ] = 0 しかし,X と Y は独立ではない。例えば P (X = 1) = 0.5, P (Y = 1) = 0.3であり,P (X = 1, Y = 1) = 0.1 であるのに対して, P (X = 1)P (Y = 1) = 0.15となり,P (X = 1, Y = 1) ̸= P (X = 1)P (Y = 1) となるので, 独立でないことがわかる。(4) P [X ≤ Y + 2|Y = −1] = 1/3 (5) E[X|Y = −1] = 5/3
問 2. 2 次元の確率変数 (X, Y ) の確率分布が次の表によって与えられるとする。ただし, X と Y の実現値はいずれも 0, 1 とする。
X\Y 0 1 0 0.1 a 1 b 0.4
(1) X と Y が独立になるように a, b の値を求めたい。a と b を求めるための連立方程 式を記せ。それを解いた a, b の値を与えよ。
(2) a = 0.2, b = 0.3 とする。X, Y の平均 E[X], E[Y ] と共分散 Cov(X, Y ) の値を求め よ。条件付き確率 P [X + Y = 1|XY = 0] を求めよ。
(解) (1) (a, b) = (0.1, 0.4), (0.4, 0.1) (2) E[X] = 0.7, E[Y ] = 0.6, Cov(X, Y ) = −0.02, P [X + Y = 1|XY = 0] = 5/6
問 3. (やや難)2 つの確率変数 X, Y に対して次の事柄を示せ。 (1) E[max(X, Y )] = E[X] + E[Y ]− E[min(X, Y )] が成り立つ。 (2) Xと Y − E[Y | X] が無相関になる。
(3) Var(Y − E[Y | X]) = E[Var(Y | X)]
(解) (1) X + Y = max(X, Y ) + min(X, Y ) より,X + Y − min(X, Y ) = max(X, Y ) とな る。この両辺に期待値をとればよい。(2) Y −E[Y |X] の期待値は 0 になることに注意すると, Cov(X, Y − E[Y |X]) = E[(X − E[X])(Y − E[Y |X])] = E[X(Y − E[Y |X])] − E[X]E[Y − E[Y|X]] = E[XY ] − E[XE[Y |X]] − E[X] × 0 = E[XY ] − E[E[XY |X]] = E[XY ] − E[XY ] = 0 (3) Var(Y − E[Y |X]) = E[(Y − E[Y |X])2] = E[E[(Y − E[Y |X])2|X]] = E[Var(Y|X)]
問 4. 2つの確率変数 X, Y はそれぞれ密度関数 f(x), g(y) を持つ分布に従い,平均 E[X] = E[Y ] = µ, 分散 V ar[X] = V ar[Y ] = σ2,相関係数 Corr(X, Y ) = ρ をもつとする。
(1) (やや難)W は平均 p のベルヌーイ分布に従う確率変数とするとき,確率変数 Z = W X + (1− W )Y はどのような分布に従うか。その密度関数を求めよ。また,平均 と分散を求めよ。
(2) w を 0 ≤ w ≤ 1 なる定数とし U = wX + (1 − w)Y を考える。U の平均,分散を求 め,分散を最小にする w を与えよ。
(解) (1) FZ(z) = P (Z ≤ z) = P (W X + (1 − W )Y ≤ z) = E[P (W X + (1 − W )Y ≤ z|W )] = P (W = 0)P (Y ≤ z|W = 0) + P (W = 1)P (X ≤ z|W = 1) となる。(X, Y ) と W とは独立であり,P (W = 0) = 1 − p, P (W = 1) = p より,FZ(z) = (1− p)P (Y ≤ z) + pP (X ≤ z) となる。これを z で微分すると Z の確率密度関数 fZ(z)が得られる。実際,
fZ(z) = (1− p)f(z) + pg(z) と書ける。これより, E[Z] = µ, V ar(Z) = σ2 (2) E[U ] = µ, Var(U ) = σ2{w2+ (1− w)2+ 2ρw(1− w)}, 最小の w は微分することにより w = 1/2 と なる。
問 5. h(t) = E[{(X − µX)− t(Y − µY)}2]を考えることにより,コーシー・シュバルツ の不等式 (10) を示せ。また等号が成り立つときはどのようなときか。
{Cov(X, Y )}2 ≤ Var(X)Var(Y ), (10) すなわち,{E[(X − µX)(Y − µY)]}2 ≤ E[(X − µX)2]E[(Y − µY)2]
(解) h(t) = Var(X) − 2Cov(X, Y )t + Var(Y )t2 ≥ 0 より,判別式が ≤ 0 となる条件を 求めればよい。等号条件は,上の式から h(t) = 0 となる t0が存在する。すると h(t0) = E[{(X − µX)− t0(Y − µY)}2]≥ 0 であり,また期待値は非負であるので,中身は常に 0 にならなければならない。従って,確率1で (X − µX)− t0(Y − µY) = 0が成り立つ。
問 6. 2つの確率変数 X, Y の平均は E[X] = µ1, E[Y ] = µ2,分散は V ar(X) = σ21, V ar(Y ) = σ22とし,X と Y の共分散は Cov(X, Y ) = ρσ1σ2となっているとする。Z = X + Y , W = X− Y とおくとき,次の問に答えよ。
(1) Zと W の平均と分散を求めよ。
(2) Zと W の共分散を求めよ。また相関係数を与えよ。無相関になるための条件を求 めよ。
(解) (1) E[Z] = µ1 + µ2, V ar(Z) = σ12 + σ22 + 2ρσ1σ2, E[W ] = µ1− µ2, V ar(W ) = σ12+ σ22− 2ρσ1σ2 (2) Cov(Z, W ) = σ12− σ22より σ12 = σ22のとき無相関になる。
問 7. 2 つの確率変数 X と Y が無相関であるが独立でない例を3つあげよ。
(解) 例1:X ∼ N (0, 1), Y = X2とおくと,E[X] = 0, E[Y ] = E[X2] = Var(X) = 1 であり,Cov(X, Y ) = E[X(Y − 1)] = E[X3]− E[X] = 0 となるので無相関となるが,独 立ではない。
例2:X の確率密度関数は −1 ≤ x ≤ 1 のとき f(x) = 1/2, その他の x については f (x) = 0とする。Y = X2とおくと,E[Y ] = E[X2] = 2−1∫−11 x2dx = 2−1[x3/3]1−1 = 1/3 となる。E[X] = 0 より,Cov(X, Y ) = E[X(Y − 1/3)] = E[X3]− E[X]/3 = 0 とな無相 関となる。
例3:2 次元 (X, Y ) の確率分布を P (X = 0, Y = 1) = P (X = −1, Y = 0) = P (X = 0, Y =−1) = P (X = 1, Y = 0) = 1/4 とする。E[X] = 0 × P (X = 0, Y = 1) + 0 × P (X = 0, Y = −1) + (−1) × P (X = −1, Y = 0) + 1 × P (X = 1, Y = 0) = 0 となり,同様にし て E[Y ] = 0 となる。E[XY ] = 0 × 1 × P (X = 0, Y = 1) + (−1) × 0 × P (X = −1, Y = 0) + 0× (−1) × P (X = 0, Y = −1) + 1 × 0 × P (X = 1, Y = 0) = 0 より,Cov(X, Y ) = 0 となり無相関になる。しかし,X2+ Y2 = 1を満たしているから X と Y は独立ではない。
(例4:問1の2次元確率分布も「無相関になるが独立でない」例になっている。) 問 8. X と Y を互いに独立な確率変数でともに区間 (0, 1) に一様分布に従っていると する。
(1) 条件付き確率 P (Y > X | X > 1/2), P (Y > X | X < 1/2) を求めよ。
(2) (X, Y )を2次元の確率変数とみたとき,(X, Y ) は正方形 (0, 1) × (0, 1) 上に一様分 布すると考えられる。原点を中心に半径 1 の円で切り抜いた領域を A とすると,A = {(x, y); x2+ y2 ≤ 1, 0 < x < 1, 0 < y < 1} と表すことができる。確率変数 (X, Y ) が A に
入るとき Z = 1, (X, Y ) が A に入らないとき Z = 0 と定めると,Z はどのような分布に従 うか。ただし円周率は π とする。その平均と分散を求めよ。
(3) 上の (2) の操作を n 回独立に行うことにする。すなわち (X1, Y1), . . . , (Xn, Yn)に基 づいて Z1, . . . , Znが (2) と同じ手順で定義される。このとき,Z1 +· · · + Znの分布を与 えよ。
(4) 上の (2) で与えられる確率変数 (X, Y ) が Y > X をみたすとき W = 1, そうでない とき W = 0 と定義する。W の平均と分散を求めよ。また Z と W の相関係数を求めよ。 (解) (1) P (Y > X | X > 1/2) = (1/8)/(1/2) = 1/4, P (Y > X | X < 1/2) = (3/8)/(1/2) = 3/4 (2) Z ∼ Ber(π/4), E[Z] = π/4, V ar(Z) = (π/4)(1 − π/4) (3) Z1 +
· · · + Zn ∼ Bin(n, π/4) (4) E[W ] = 1/2, V ar(W ) = 1/4, E[ZW ] = P (Z = 1, W = 1) = P ((X, Y )∈ A ∩ B) = π/8 となる。ただし B は B = {(x, y); y > x, 0 < x < 1, 0 < y < 1} である。従って,Cov(Z, W ) = E[ZW ] − E[Z]E[W ] = π/8 − (π/4) × (1/2) = 0
9章
問 1. 母集団が N (20, 82)の正規分布に従うとき,n = 25 の無作為標本 (random sample) で標本平均 X が X ≤ 18 となる確率はいくらか。また n = 9 で X ≤ 18 となる確率は いくらか。
(解) X ∼ N (20, (8/5)2)より,P (X ≤ 18) = P (Z ≤ −1.25) = 1 − Φ(1.25) = 0.10565, n=9 のとき X ∼ N (20, (8/3)2)より P (X ≤ 18) = 1 − Φ(0.75) = 0.22633
問 2. ある工場で作られる鉄板の厚さは正規分布 N (4, 0.01) に従うという。ただし単位 は mm である。9 枚の鉄板を積み重ねたときの厚さはどのような分布に従うか。またその 厚さが 35.7mm 以上 36.6mm 以下となる確率を求めよ。
(解) 9 枚の鉄板を積み重ねたときの厚さを Y とすると,Y ∼ N (36, (0.3)2)より P (35.7 ≤ Y ≤ 36.6) = Φ(2) − Φ(−1) = Φ(2) − (1 − Φ(1)) = Φ(2) + Φ(1) − 1 = 0.81859
問 3. 500 人の消費者について合成洗剤ではなくて粉石鹸を使用している人の割合は 32%(= 160/500)であった。この調査にどの程度の誤差を見込むべきか。
(解) V ar(X) = p(1 − p)/n より,0.32 × (1 − 0.32)/500 = 0.0004
問 4. ある番組の視聴率は 20% であるという。200 人について調査した結果その番組を 見た人の割合が 0.15 以下になってしまう確率を求めよ。
(解) 中心極限定理を利用すると,X ∼ N (0.2, 0.2×0.8/200) で近似できるので,P (X ≤ 0.15) = Φ(−5√2/4) = 0.0385と近似できる。
問 5. ある市の人口は 200,000 人であり,そのうち 1/5 が未成年であるという。200,000 人の中からランダムに 100 人を選んだところ, その中に含まれる未成年者の人数が 10 人 以下である確率の近似値を求めよ。
(解) X ∼ Bin(100, 1/5) より,中心極限定理を利用すると X ∼ N (20, 100 × 0.2 × 0.8) で近似できるので,P (X ≤ 10) = 1 − Φ(2.5) = 0.0062 で近似できる。
問 6. ある生命保険会社では,ある職種の人 3,750 人と保険契約をしている。その職種 の人の 1 年間の死亡率は 1/25 であるという。このとき,1 年間の死亡数が 138 人以下とな る確率を求めよ。また,186 人以上が死亡する確率を求めよ。
(解) X ∼ Bin(3750, 1/25) より,中心極限定理を利用すると,X ∼ N (150, 122)で近似 できる。従って P (X ≤ 138) = 1 − Φ(1) = 0.1587, P (X ≥ 186) = 1 − Φ(3) = 0.0013 で近 似できる。