問1. X1, . . . , X16をN(µ, σ2)からのランダム標本とし,W =X1+· · ·+X16とおく。
W はどのような分布に従うか。また標本平均Xはどのような分布に従うか。
問2. (1) 確率変数Xを,サイコロを投げて1もしくは2の目が出たらX = 2,その他 の目が出たらX = 1と定義する。このときXの確率関数を与えよ。Xの平均E[X]と分
散Var(X)を与えよ。ただし,サイコロは各面が1/6の確率で起こるものとする。
(2) (1)の試行を独立にn回行い,それぞれの確率変数X1, . . . , Xnは, (1)のXと同様に 定義されるものとする。W =X1+· · ·+Xnとおくと,W −nはどのような確率分布に 従うか。またW の期待値E[W]と分散Var(W)を求めよ。
(3) n = 18のとき,中心極限定理を用いて,P(22≤W ≤26)となる確率の近似値を求 めよ。ただし,標準正規分布の分布関数Φ(x)を用いて表してよい。
問3. Z1, . . . , Zkは互いに独立に標準正規分布N(0,1)に従うものとする。
(1) Z1, . . . , Zkを用いて自由度kのカイ2乗分布の定義を与えよ。
(2) Ziの4次のモーメントはE[Zi4] = 3となることを示せ。
(2) 確率変数Y が自由度kのカイ2乗分布に従うとき,Y の平均E[Y]と分散Var(Y)は E[Y] =n, Var(Y) = 2n
で与えられることを示せ。
第10章「推定」
問1.ある工場で作られる鉄板の厚さは正規分布N(µ, σ2)に従うという。ただし単位は mmである。16枚の鉄板を積み重ねたときの厚さについて統計的な推測を行いたい。実際 にデータを取ってみたところ,標本平均Xと不偏分散V2の実現値がx= 4.2,v2 = (0.4)2 になったとする。µについて,信頼係数95%の信頼区間を与えよ。
問2. 年末恒例の歌番組の視聴率調査を男女に分けて行った。100人の男性をランダム 選んだところ40人が視聴しており,また100人の女性をランダムに選んだところ60人が 視聴していた。男性の視聴率について信頼係数95%の近似的な信頼区間を与えよ。
問3. 確率変数の組X1, . . . , Xnを,ポアソン分布P o(λ)に従う母集団からのランダム 標本とする。
(1) 対数尤度関数ℓ(λ)を求めよ。
(2) 尤度方程式を求め,λの最尤推定量λˆを求めよ。
(3) ˆλの期待値E[ˆλ]と分散Var(ˆλ)を与えよ。
(4) ˆλがλの一致推定量であることを示せ。
(5) nが大きいときに,信頼係数1−αのλの近似的な信頼区間を与えよ。
第11章「仮説検定」
問1. ある工場で作られる鉄板の厚さは正規分布N(µ, σ2)に従うという。ただし単位は mmである。16枚の鉄板を積み重ねたときの厚さについて統計的な推測を行いたい。工 場では平均がµ= 4になるように作られているという。標本平均Xと不偏分散V2の実現 値がx = 4.2, v2 = (0.4)2で与えられているとき,H0 : µ= 4を有意水準99%で検定した い。どのような不等式で判断することができるか。
問2. 年末恒例の歌番組の視聴率調査を男女に分けて行った。100人の男性をランダム 選んだところ40人が視聴しており,また100人の女性をランダムに選んだところ60人が 視聴していた。男女の間で視聴率に差があると判断してよいか仮説検定を行いたい。男女 の視聴率が等しいことを帰無仮説に設定するとき,どのようにして検定することができ るか。
問3. 確率変数の組X1, . . . , Xnを,ポアソン分布P o(λ)に従う母集団からのランダム 標本とする。帰無仮説がH0 : λ = 1,対立仮説がH1 : λ ̸= 1で与えられる検定を行いた い。nが大きいときに,有意水準αの近似的な検定の棄却域を求めよ。
問4. 次の表は,サイコロを30回投げたときの1から6の各出現回数である。このサイ コロは正しく作られていると考えられるか。有意水準5%で検定したい。□> □のとき に正しく作られていないと判断されるとき,それぞれの□にどのような値が入るか。計 算式のみ与え,最終的な計算結果を求める必要はない。
数字 1 2 3 4 5 6 計 回数 6 3 5 7 5 4 30
問5. 下の分割表は,喫煙と肺がんの関係を100人にアンケートをとって調べたもので ある。喫煙習慣と肺がんの間に関連が認められるか,について有意水準5%で検定せよ。
□>□のときに喫煙と肺がんの因果関係があると判断されるとき,それぞれの□にどの
ような値が入るか。計算式のみ与え,最終的な計算結果を求める必要はない。
非喫煙 喫煙 計 健康 17 3 20 肺がん 43 37 80 計 60 40 100
問6. コーヒーによる効果を調べるために,10人の男子大学生について1分当たりの指 叩きの回数を調べた。コーヒーを飲む前に測定し,コーヒーを飲んで2時間後に再度測定 した結果が次の表で与えられた。コーヒーを飲んだ後に指叩きの回数が増えるかを有意水 準5%で片側検定したい。データは正規分布に従うものとして,用いるt-分布の自由度と 棄却域を与えよ。また有意と判断できるか。
処理 1 2 3 4 5 6 7 8 9 10 飲む前 242 245 244 248 247 248 242 244 246 242 飲んだ後 246 248 250 252 248 250 246 248 245 250
問7. 検定の有意確率(P値)について説明せよ。有意確率が0.01のとき,有意水準5%
で有意になるか。
問8. 正規確率プロット(Q-Qプロット)について説明せよ。どのように利用すること ができるか。
第12章「回帰分析」
問1. 2次元データ (x1, y1), . . . ,(xn, yn)について,x1, . . . , xnを説明変数,y1, . . . , yn を 従属変数として,単回帰モデル
yi =α+βxi+εi, i= 1, . . . , n
を考える。但し,ε1, . . . , εn は互いに独立な確率変数で,各 εi が正規分布 N(0, σ2) に従 うとする。α,β, σ2 を未知パラメータとして,次の問いに答えよ。
(1) α, β の最小2乗推定量 α,b βbを求め,不偏推定量であることを示せ。
(2) σ2 の不偏推定量 ˆσ2 を与え,実際不偏推定量になっていることを示せ。
(3) βの信頼係数1−αの信頼区間を与えよ。
(4) 回帰分析は要因分析として用いられる。要因分析とは説明変数xが従属変数yの要 因になっているかを分析することで,帰無仮説 H0 :β = 0 を検定することに関心がある。
有意水準 α で検定する検定方法を与えよ。
(5) 決定係数R2を与え,その役割を説明せよ。また残差分析の役割を与えよ。
問2. 重回帰モデルy=Xβ+u, あるいは
yi =β0+β1x1i+· · ·+βpxpi+ui, i= 1, . . . , n
に関する次の問いに答えよ。ただしu1, . . . , un は互いに独立で,正規分布 N(0, σ2) に従 う誤差項とする。
(1) β= (β0, . . . , βp)⊤ の最小2乗推定量を与えよ。
(2) 多重共線性の原因と,そこからいかなる弊害が生ずるのかを説明せよ。多重共線性 を検出する方法についてのべよ。また多重共線性の影響を取り除く β の推定量としては,
どのようなものが考えられるか。
(3) 説明変数 x1, . . . , xp の数を増やした場合と減らした場合にそれぞれ生ずる問題点に ついて述べよ。この問題点を考慮した変数選択の基準として,自由度調整済み決定係数と 呼ばれるものがあるが,どのようにその問題点を修正しているかを説明せよ。
(4) 給与yを説明する変数として学歴を組み込みたい状況を考える。中卒,高卒,大卒,
大学院卒の4つの要因を分析に加えるとき,重回帰モデルの中においてどのようにモデル を表現すればよいか。
問3. 次の表はある県の15の市について人口(x)と一般行政職員数(y)を調べたデータ である。ただし人口の単位は10,000人,職員数の単位は100人である。
番号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 人口 7.7 4.7 14.4 7.8 5.3 5.2 8.1 4.6 20.0 5.7 11.2 11.1 4.0 4.9 6.6 職員数 3.4 2.1 7.1 3.9 2.7 2.7 4.4 2.6 11.5 3.3 6.6 6.7 2.5 3.1 4.3 (1) 単回帰モデルを当てはめるとき,α, β, σ2について不偏推定量による推定値を求 めよ。
(2) 決定係数R2を求めよ。
(3) xの値を横軸にとって残差をプロットし,回帰分析に問題があるかを検討せよ。
(4) βについて信頼係数95%の信頼区間を与えよ。
(5) 仮説検定H0 :β = 0 vs H1 :β ̸= 0を有意水準5%で検定せよ。
問4. 13人の親子の身長を調べ,親から子への要因分析を行ってみた。x1,x2,yをそれ ぞれ父親,母親,息子の身長とする。
(1) 最初にyをx1で説明する回帰分析をRを用いて行ったところ, 次の分析結果を得 た。父親の身長は息子の身長を説明するのに,有意水準5%で有意といえるか。
Residuals:
Min 1Q Median 3Q Max
-3.5103 -2.3164 -0.2991 1.5070 4.5070 Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) 47.8025 19.8113 2.413 0.0344
x1 0.7543 0.1192 6.328 5.61e-05
—
Residual standard error: 2.71 on 11 degrees of freedom Multiple R-squared: 0.7845, Adjusted R-squared: 0.7649 F-statistic: 40.04 on 1 and 11 DF, p-value: 5.615e-05
(2) 父親と母親の両方の身長を用いて息子の身長を説明する重回帰分析を行った結果が 以下で与えられる。母親の身長は息子の身長を説明するのに,有意水準5%で有意といえ るか。また,父親の身長も母親の身長も因果関係がないという帰無仮説はどのような検定 統計量で検定できるか。実際この検定は有意水準5%で有意といえるかについて下の結果 から判断せよ。(1)の単回帰モデルとここで与えられた重回帰モデルではどちらのモデル を選んだらよいか。その理由を述べよ。