多項分布と Pearson のカイ 2 乗統計量と多次元正規分布

K = (K₁, . . . , K_r) は多項分布に従う離散型ベクトル値確率変数であるとする. すなわち, pi >0, ∑r

i=1pi = 1 であるとし, 実数k1, . . . , kr に対して, K = (k1, . . . , kr) となる確率は,k_i がすべて非負の整数で ∑_r

i=1k_i =n のとき P(K = (k1, . . . , kr)) = n!

k₁!· · ·k_r!p^k₁¹· · ·p^k_r^r であり,それ以外のとき 0 であるとする.

例9.3 (サイコロ). 1 から 6までの目が同じ確率で出るサイコロを n 回ふったときにi の目が出た回数を K_i と表わすと, K = (K₁, . . . , K₆) はr = 6, p_i = 1/6 の多項分布にしたがう. 一般の多項分布も同様に理解できる⁵⁸.

確率の総和が 1になることは多項定理

∑

k1+···+kr=m

k₁!· · ·k_r!x^k₁¹· · ·x^k_r^r = (x₁+· · ·+x_r)^m

を使えば確認できる. 多項定理は二項定理と同様の考え方で証明される. もしくは二項定理を用いた m に関する帰納法で証明される.

K_i の平均は µ_i =np_i になる: µ_i =E[K_i] = ∑

k1+···+kr=n

k₁!· · ·k_r!p^k₁¹· · ·p^k_r^rk_i =np_i(p₁+· · ·+p_r)ⁿ⁻¹ =np_i. 3つ目の等号で多項定理を使った.

K_i の分散は σ_i² =np_i(1−p_i) になる:

E[K_i(K_i −1)] = ∑

k1+···+kr=n

k₁!· · ·k_r!p^k₁¹· · ·p^k_r^rk_i(k_i −1)

=n(n−1)p²_i(p₁+· · ·+p_r)ⁿ⁻² =n(n−1)p²_i, σ²_i =E[K_i²]−µ²_i =E[K_i(K_i−1)] +µ_i−µ²_i

=n(n−1)p²_i +np_i−n²p²_i =np_i(1−p_i).

2つ目の等号で多項定理を使った.

58確率変数の話はサイコロをふる話だと思っていると理解し易いと思う. 確率変数はプログラミングにおける「乱数」のことだと思ってもよい. 様々な分布を持つ確率変数を考えることは様々な「乱数」を考えることと同じだと思ってよい.

9.3. 多項分布とPearsonのカイ2乗統計量と多次元正規分布 57 i̸=j のとき Ki と Kj の共分散は σij =σji=−npipj になる:

σ_ij =E[K_iK_j]−µ_iµ_j = ∑

k1+···+kr=n

k₁!· · ·k_r!p^k₁¹· · ·p^k_r^rk_ik_j−µ_iµ_j

=n(n−1)pipj−n²pipj =−npipj. 3つ目の等号で多項定理を使った.

したがってベクトル値確率変数 X = (X₁, . . . , X_r)を X_i = K_i−np_i

√np_i と定めると, X_i の平均は0 になり, 分散は

p_ii = np_i(1−p_i)

np_i = 1−p_i = 1−√ p_i√

p_i になり,i̸=j のとき X_i と X_j の共分散は

p_ij =p_ji = −np_ip_j n√

p_i√p_j =−√ p_i√p_j になる. すなわち X = (X₁, . . . , X_r) の分散共分散行列 P = [p_ij]は

P =E+aa^T, a=





√p₁ ...

√p_r





の形になる. ここで E は単位行列であり, a^T は列ベクトル a の転置である. ∑_r

i=1p_i = 1 より,a は単位ベクトルになる. 列ベクトル v ∈R^r に対して,

P v =v− ⟨a, v⟩a

は a の直交補空間への v の直交射影になる(r = 3 の場合の図を描いてみよ). ここで

Euclid内積を⟨ , ⟩ と書いた. P が単位ベクトル a の直交補空間への直交射影を表現する

行列であることから, P² =P となり, P のランクが r−1になることがわかる⁵⁹.

定義9.4 (Pearsonのカイ2乗統計量). 多項分布にしたがう確率変数 K = (K₁, . . . , K_r) から定まる次の確率変数をPearsonのカイ2乗統計量と呼ぶ:

Y =

∑r i=1

X_i² =

∑r i=1

(K_i −np_i)² np_i

これはカイ2乗分布にしたがう確率変数ではない. しかし次の定理が成立している. 定理9.5. Pearsonのカイ2乗統計量はn→ ∞ で自由度r−1のカイ2乗分布にしたがう確率変数に(弱)収束する⁶⁰.

59この結果はPearsonのカイ2乗統計量がn→ ∞ でカイ2乗分布にしたがう確率変数に(弱)収束することを示すためのキーになる.

60この結果はよく使われているPearsonのカイ2乗検定の基礎になっている. このノートにこの節を追加しようと思った動機は,入門的な統計学の教科書には「nが大きなとき,どうしてPearsonのカイ2乗統計量をカイ2乗分布で近似してよいのか」に関する説明がないように見えたからである.

証明. 多次元版の中心極限定理⁶¹より,X = (X₁, . . . , X_r) は平均0, 分散共分散行列が P の多次元正規分布に(弱)収束する. したがって, X = (X₁, . . . , X_r) が平均 0, 分散共分散行列P を持つ多次元正規分布にしたがうとき,

Y =

∑r i=1

X_i²

が自由度 r−1 のカイ2乗分布にしたがうことを示せばよい. そのことを示すためには次の一般的な補題を示せば十分である.

補題9.6. ベクトル値確率変数 X = (X1, . . . , Xr) が平均 0, 分散共分散行列 P を持つ多次元正規分布にしたがうとき, P² =P かつP のランクが s ならば, Y =∑_r

i=1X_i² は自由度s のカイ2乗分布にしたがう.

証明. 一般に分散共分散行列P は実対称行列になる. P² =P ならばP の固有値は0と 1 になり,固有値1の重複度と P のランクは一致する. ゆえにある直交行列U が存在して,

U^TP U =U⁻¹P U = diag(1, . . . ,| {z }1

,0, . . . ,0).

P,U の (i, j) 成分をそれぞれ p_ij, u_ij と書き, Z_i =

∑r j=1

u_jiX_j

とおく. このとき, X = (X₁, . . . , X_r) からZ = (Z₁, . . . , Z_r) への変換は直交変換なので Y =

∑r i=1

X_i² =

∑r i=1

Z_i² が成立し, 直交行列 U の取り方より,

E[Z_iZ_l] =

∑r j,k=1

u_jiE[X_jX_k]u_kl=

∑r j,k=1

u_jip_jku_kl=

{1 (1≦i=l ≦s), 0 (その他の場合).

(&) 確率変数を成分に持つ行列まで期待値汎函数 E[ ] を拡張すると以上の計算を以下のように書くことができる:

[

Z₁ · · · Z_r ]

= [

X₁ · · · X_r ]







 Z₁

... Z_r



[

Z1 · · · Zr

]

=U^TE







 X₁

... X_r



[

X1 · · · Xr

]

U

=U^TP U = diag(1, . . . ,| {z }1

,0, . . . ,0).

61多次元版中心極限定理も1次元版中心極限定理と同様の方法で証明される. すなわち特性函数のn→ ∞ が正規分布の特性函数に収束することを示せばよい.

9.4. 第二種ベータ分布と t 分布 59

ドキュメント内 Stirlingの公式 (ページ 56-59)