• 検索結果がありません。

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

N/A
N/A
Protected

Academic year: 2021

シェア "母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,"

Copied!
15
0
0

読み込み中.... (全文を見る)

全文

(1)

11. 無作為標本 1. 基本的用語 推測統計における基本的な用語を確認する。 ① 母集団 ・調査の対象になる集団のこと。最終的に,判断の対象になる集団である。 ② 母集団の個体 ・母集団を構成する1 つ 1 つのもののこと。母集団は個体の集まりである。 ③ 個体の特性値 ・個体の特性を表す数値のこと(身長や体重など)。特性値は,変量ともいう。 ④ 有限母集団と無限母集団 ・個体の個数が有限の母集団を「有限母集団」,個体の個数が無限の母集団を「無限母集団」 という。 ⑤ 標本(サンプル) ・母集団から取り出した,いくつかの個体の集まりのこと。 ⑥ 標本抽出 ・母集団から標本を取り出すこと。 ⑦ 標本調査 ・母集団の特徴を推測するために,標本抽出を行い,抽出された標本を調べること。 ⑧ 統計的推測 ・標本を用いて母集団の性質を推測すること。 ⑨ 母集団の大きさ(サイズ) ・母集団に含まれる個体の個数のこと。これは,有限母集団に対する用語である。 ⑩ 標本の大きさ(サイズ) ・標本に含まれる個体の個数のこと。 ⑪ 無作為抽出(ランダムサンプリング) ・母集団の各個体を等しい確率で抽出する方法。 ⑫ 無作為標本(ランダムサンプル) ・無作為抽出によって選ばれた標本。 ⑬ 母集団分布 ・個体の特性値X を確率変数と考えたときの,X の確率分布のこと。 ⑭ 母平均・母分散・母標準偏差 ・ ⑬の確率変数X の平均E( X),分散V( X),標準偏差

( X)を,それぞれ,母平均, 母分散,母標準偏差という。

(2)

・母平均・母分散・母標準偏差は,Xが連続的な場合も含めて,すべての個体の特性値(X のすべての実現値)の平均・分散・標準偏差であると考えてよい。(有限母集団でXが 離散的な場合,まさにその意味になるが,そうでない場合も,このように理解してよい。) ⑮ 母数 ・母集団から定まる定数のこと。母平均,母分散,母標準偏差などは,母数である。統計 的推測では,母数を推測する。 2. 大きさ n の無作為標本の取り出し方 ● 大きさ n の無作為標本の取り出し方 母集団から大きさ n の無作為標本を取り出すとは,母集団から n 個の個体を無作為に取 り出すことである。これを「試行」と考える。 試行: 母集団 → n 個の個体

1,

2, ,

n n

1, 2, , が,大きさ n の 1 つの無作為標本である。 この取り出し方には,以下の3 通りの方法がある。 (A) 同時に取り出す方法 母集団から無作為に n 個の個体を同時に取り出す方法である。 (B) 非復元無作為抽出 非復元で個体を1 個ずつ無作為に取り出し,全部で n 個の個体を取り出す方法であ る。非復元とは,母集団から取り出した個体は母集団に戻さずに,次の個体を取り出 すことである。 (C) 復元無作為抽出 復元で個体を1 個ずつ無作為に取り出し,全部で n 個の個体を取り出す方法である。 復元とは,母集団から取り出した個体は必ず母集団に戻してから,次の個体を取り出 すことである。 (1) 標本から母集団の特徴を推測するのが統計的推測である。より良い推測を行うためには, かたよった標本ではなく,母集団をよく反映するような標本を抽出する必要がある。よく言 われるように,標本は「母集団の良い縮図」でなければならない。そのために,無作為抽出 が基本になる。 (2) 無作為抽出にすれば,どの個体の選ばれる確率も等確率になるので,「 n 個の個体を取り 出す」という行為が,確率における「試行」になる。よって,確率論が適用できる。無作為 抽出にしなければ,その行為は試行にはならず,確率計算ができない。 (3) n 個の個体の取り出し方には,3 通りの方法がある。非復元抽出では,個体を取り出すた

(3)

びに母集団から個体が減っていくので,毎回の試行は,試行として独立ではない。一方,復 元抽出では,毎回,全く同じ母集団から個体を取り出すことになるので,毎回の試行は互い に独立である。つまり,独立試行になる。 (4) 現実の標本調査は,「同時に取り出す」である。例えば,100 人の意見を調べるために, 10 人を選んでアンケート調査をする。この 10 人は,同時に取り出された人たちである。た だし,以下の(A)や(B)は数学的に面倒なので,(C)の方法を考えていく。推測統計では(C)を考 える。 ■ 例 母集団は3 枚のカードからなり,以下の図のように,カードには数字が書かれている。この とき,大きさ2 の無作為標本は,取り出し方によって,以下のようになる。 (A) 試行:無作為に 2 枚のカードを同時に取り出す ① 大きさ2 の無作為標本は右の通り ② 標本の個数: ③ 各標本が選ばれる確率:1/3 ④ 標本は「組み合わせ」 (B) 試行:大きさ 2 の標本の非復元無作為抽出 ① 大きさ2 の無作為標本は右の通り ② 標本の個数: ③ 各標本が選ばれる確率:1/6 ④ 標本は「順列」 (C) 試行:大きさ 2 の標本の復元無作為抽出 ① 大きさ2 の無作為標本は右の通り ② 標本の個数: ③ 各標本が選ばれる確率:1/9 ④ 標本は「重複順列」 1 大きさ 2 の標本 (2枚のカード) 標本抽出 母集団 2 3 3 2 3C = 6 2 3  = 9 3 3  = 大きさ2 の 無作為標本 標本が選ば れる確率 1/3 1/3 1/3 } 2 , 1 { } 3 , 1 { } 3 , 2 { 大きさ2 の 無作為標本 標本が選ば れる確率 大きさ2 の 無作為標本 標本が選ば れる確率 1/6 1/6 1/6 1/6 1/6 1/6 ) 2 , 1 ( (2, 3) ) 3 , 1 ( (3, 1) ) 1 , 2 ( (3, 2) 大きさ2 の 無作為標本 標本が選ば れる確率 大きさ2 の 無作為標本 標本が選ば れる確率 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 ) 1 , 1 ( (3, 1) ) 2 , 1 ( (3, 2) ) 3 , 1 ( (3, 3) ) 1 , 2 ( ) 2 , 2 ( ) 3 , 2 (

(4)

3. 大きさ n の標本変量 ● 標本変量の定義 (1) 母集団 の個体の特性値を で表す。この母集団に対して,次の試行T を考える。 試行 T :大きさ の標本の復元無作為抽出 (2) 大きさ の標本 に対して, 番目に取り出した個体 の特性値を で表すと,標本から特性値の組が定まる。 → 特性値の組 (3) 各 は,試行 T の結果に対して値をとる変数になるので,確率変数になる。 (4) この確率変数の組 を,大きさnの標本変量と呼ぶ。 (5) 試行 T の標本空間は,  の n 個の直積        であり, T の標本点(大きさ の無作為標本)とは,この直積の要素のことである。 (6) 母集団 の大きさがNのときは,大きさnの無作為標本の個数は n N N N N   = ● 標本変量の性質 大きさ n の標本変量 について,以下が成り立つ。 (1) 確率変数 X1, X2,, Xn は独立である。 (2) X1, X2,, Xnのいずれの確率分布も,X の確率分布(母集団分布)に等しい。 (3) (母平均) (4) (母分散) ● 標本変量に関する注意 テキストでは,標本変量 を「大きさnの無作為標本」と呼んでい るが,以下では,標本変量と呼ぶことにする。 (1) 上記のすべては自明である。前述したように,復元無作為抽出は独立試行であるから, n X X X1, 2, , が独立になることは,自明である。また,これらの確率分布が母集団分布に一致することも 自明である。確率分布が等しいので, ) ( ) ( ) ( ) (X1 E X2 E X E X E = =  = n = X n n (

1,

2,,

n) ii i X ) , , , (

1

2

n (X1, X2,, Xn) i X ) , , , (X1 X2  Xn n ) , , , (X1 X2  Xn ) ( ) ( ) ( ) (X1 E X2 E X E X E = == n = ) ( ) ( ) ( ) (X1 V X2 V X V X V = == n = ) , , , (X1 X2  Xn

(5)

) ( ) ( ) ( ) (X1 V X2 V X V X V = =  = n = となることも自明である(以下の例題を参照)。 (2) 試行 T は,「大きさ の標本の復元無作為抽出」であるが,これは, の n 個の直積から 1 つの要素を無作為に抽出する試行と同じである。 母集団 大きさ n の標本の 復元無作為抽出  ) , , , (1 2  n

(1, 2, , n) 大きさ n の無作為標本 大きさ n の無作為標本の n 個の直積 1つの要素の 無作為抽出 ) , , , (X1 X2Xn (n 個の独立な確率変数) 大きさ n の標本変量 上と下は同じ試行 (3) 統計学の解説書によっては,母集団は,個体の集まりではなく,個体の特性値の集まりを 指している場合も多い。例えば,1000 人の学生の身長が調査対象の場合,1000 人の学生で はなく,1000 個の身長の数値の集まりを母集団とする。さらに,選ばれた 10 人の学生では なく,選ばれた10 人の身長の集まりを標本と呼ぶ。これは,身長という特性値を決めれば, 関心があるのは身長のデータのみだからである。 このような考え方では,標本は,母集団から抽出された特性値xiの集まり ) , , , (x1 x2xn を意味する。 (4) ま た , 無 作 為 標 本 と い う 用 語 は , 厳 密 に は 次 の よ う に 定 義 さ れ る 。 確 率 変 数 n X X X1, 2, , が 独 立 で あ り , す べ て の Xi が 同 じ 確 率 分 布 に 従 っ て い る と き , n X X X1, 2, , を「大きさ n の無作為標本」という。テキストは,この本来の定義に従っ て説明しているが,抽象的であるので,ここではX1, X2, , Xnを標本変量と呼び,実際 に選ばれた個体の集まりを無作為標本と呼ぶことにする。 ■ 例題1 母集団を,次の数字の集まりとする。また,その数字をX で表す。 } 6 , 5 , 4 , 3 , 2 , 1 { =  この母集団に対して,次の試行を行う。 試行T:大きさnの標本の復元無作為抽出 さらに,この試行から定まる大きさ n の標本変量を (X1, X2, , Xn)とする。 (1) Xの確率分布を求めよ。 n

(6)

(2) X1, X2,, Xnは独立であることを示せ。 (3) のいずれの確率分布も, の確率分布(母集団分布)に等しいことを 示せ。 (4) 次が成立することを示せ。 ) ( ) ( ) ( ) (X1 E X2 E X E X E = = = n = ) ( ) ( ) ( ) (X1 V X2 V X V X V = =  = n = (解説) 母集団  = {1, 2, 3, 4, 5, 6} から 1 個の個体を無作為に選ぶという試行と,1 個のサ イコロを1 回投げるという試行は同じである。 さらに, から,復元で個体を 1 個ずつ無作為に取り出し,全部で n 個取り出すという試行 T は,1 個のサイコロを n 回投げるという試行と同じである。 よって,サイコロ投げで表現すれば,標本変量(X1, X2, , Xn)におけるXiとは 1 個のサイコロを n 回投げたときの,i回目に出た目の数 のことである。 従って,X1, X2, , Xnが独立であること,Xiの確率分布が次のようになることは自明 である。さらに,これはX の確率分布(母集団分布)と一致する。 i X 1 2 3 4 5 6 計 X 1 2 3 4 5 6 計 P 1 / 6 1 / 6 1 / 6 1 / 6 1 / 6 1 / 6 1 P 1 / 6 1 / 6 1 / 6 1 / 6 1 / 6 1 / 6 1 確率分布が等しいので,(4)の等式も自明になる。 ■ 例題2 3 枚のカードからなる母集団があり,数字 1 のカードは 1 枚,数字 2 のカードは 2 枚とする。 カードの数字を とし,この母集団に対して, 試行 :大きさ2 の標本の復元無作為抽出 を考え,大きさ2 の標本変量を とする。 (1) X1の確率分布,X2の確率分布, X の確率分布を求めよ。 (2) 大きさ 2 の無作為標本をすべて求めよ。 n X X X1, 2, , X X T ) , (X1 X2 1 試行 T :大きさ 2 の標本の復元無作為抽出 母集団 2 2 (1,2) カードの数字 = X ) , (X1 X2 大きさ 2 の標本 大きさ 2 の標本変量 枚目のカードの数字 1 1 = X 枚目のカードの数字 2 2 = X

(7)

(解説) 復元無作為抽出であるから,X1の確率分布も,X2の確率分布も, X の確率分布(母集団 分布)に等しいので,次のようになる。 1 2 計 1 2 計 1 2 計 1 / 3 2 / 3 1 1 / 3 2 / 3 1 1 / 3 2 / 3 1 また,大きさ2 の無作為標本の個数は 3 × 2 = 9 であり,右のようになる。 ※ 数字 2 のカードは 2 枚あるが,これらは異なる個体 なので区別する。 4. 標本平均の定義 ● 標本平均の定義 大きさ n の標本変量 から作られる式 n X X X1 + 2 +  + n を,大きさ n の標本平均といい, X で表す。すなわち, (1) X は, 試行 T :大きさ の標本の復元無作為抽出 における確率変数になる。 (2) X の実現値とは,標本 の平均値 x のことである。 (1) 標 本 平 均 の 実 現 値 と は , 標 本 か ら 定 ま る 特 性 値 の 組 を で表したとき, の平均値 のことである。すなわち, の 実現値は,抽出された標本の平均のことである。 (2) 試行 T の結果(標本点)は,大きさnの無作為標本 1 X X2 X P P P ) , , , (X1 X2  Xn

= + + + = i n i n X X X X n X 1 1 ( 1 2  ) n ) , , , (

1

2

n X (

1,

2,,

n) ) , , , (x1 x2xn x1,x2,,xn x X ) , , , (

1

2

n 大きさ2 の 無作為標本 大きさ2 の 無作為標本 ) 1 , 1 ( (2,1) ) 2 , 1 ( (2, 2) ) 2 , 1 ( (2, 2) ) 1 , 2 ( ) 2 , 2 ( ) 2 , 2 (

(8)

であり, は,各標本点に対して値が定まる変数であるので,確率変数になる。 5. 標本平均の平均と分散 復元無作為抽出の場合は,標本平均の平均や分散が容易に計算できる。 ● 定理(標本平均の平均と分散) 母平均 ,母分散 の母集団からの大きさ の標本変量 について, 次が成り立つ。(個体の特性値は X とする) (1) 標本平均 X の平均は,母平均に等しい。すなわち

= = ( ) ) (X E X E (2) 標本平均 X の分散は,母分散を標本のサイズで割ったものに等しい。すなわち n n X V X V 2 ) ( ) ( = =  (3) (大数の法則) 標本のサイズ を大きくしていけば,標本平均 の実現値は母平均 に近づいてい く。 (証明)(1)(2)の証明は容易である。 ) ( 1 ) ( 1 ) ( 1 2 n E X1 X2 Xn n X X X n E X E  = + + +      + + + =  

( ) ( ) ( )

1 2 1 E X E Xn X E n + + + = 

+ + + =  = = n n n 1 ) ( 1  また, は独立であるから, ) ( 1 ) ( 1 ) ( 1 2 2 2 1 n V X X Xn n X X X n V X V  + + +      =       + + + =  

( ) ( ) ( )

1 2 1 2 V X V X V Xn n + + + =  n n n n 2 2 2 2 2 2 2 1 ) ( 1

+

+ +

=

=

=  (3)の大数の法則も,(1)(2)より自明である。実際(1)より, の平均は,常に母平均 に一致 する。一方,(2)より,標本のサイズ を大きくしていけば, の分散 の値は0 に近づい ていくので, の実現値のばらつきがどんどん小さくなり,その実現値は平均 のまわりに集 まってくるのである。なお, のときは, である。 X2 n ) , , , (X1 X2Xn n Xn X X X1, 2,, X

n X

2/n X  1 = n X = X

(9)

■ 例 標本平均 X の平均 は,X のすべての実現値(標本の平均)の平均ことである。これが, 母平均に一致するという事実は,非常に重要である。簡単な例で確認しておこう。 いま,母集団は,数字が書かれた3 枚のカードからなり, 数字1 のカード = 1 枚 数字2 のカード = 1 枚 数字3 のカード = 1 枚 とする。カードの数字をXとし,母集団からの大きさ2 の標本変量 を考える。 従って,標本平均は ) ( 2 1 2 1 X X X = + の確率分布(母集団分布)は,当然,次のようになる。 1 2 3 計 1 従って,母平均 と母分散 は,次のとおり。(は1,2,3 の平均,

21,2,3 の分 散のことである。) ここで,X の平均や分散はすぐに分かるが,あえてその確率分布を求めて計算してみよう。 } 3 , 2 , 1 { =  とおくと, 試行 :大きさ2 の復元無作為抽出 の標本空間は   であり,標本の個数は 3  3 = 9 である。 9 個の標本点に対するX の実現値は,右の通りであり, この9 個の実現値の平均が である。 確率を求めると,例えば, となる標本点は (1,2)と(2,1)であるから, 9 2 ) 5 . 1 (X = = P この確率は,9 個の実現値における 1.5 の相対度数である。 従って, の確率分布は次のようになる。 ) ( X E ) , (X1 X2 X X P 1/3 1/3 1/3

2 2 3 1 3 3 1 2 3 1 1 ) ( =  +  +  = = E X

2 2 2 ) ( ) ( ) (X E X E X V = − =

3 2 4 ) 9 4 1 ( 3 1 2 3 1 3 3 1 2 3 1 12  + 2  + 2  − 2 = + + − = = T ) ( X E 5 . 1 = X X 母集団 1 2 3 標本 X の実現値 (1,1) 1 (1,2) 1.5 (1,3) 2 (2,1) 1.5 (2,2) 2 (2,3) 2.5 (3,1) 2 (3,2) 2.5 (3,3) 3

(10)

1 1.5 2 2.5 3 計 1 よって, 従って,確かに次が成立している。 (母平均), なお,標本平均 の確率分布を図示すれば次のようになり,正規分布のような形になってい る。そこでは,母平均

= 2での確率が最大であり,左右対称のグラフになっている。 6. 中心極限定理 (1) 母集団分布は正規分布であるとは限らないし,また,その形が想定できない場合も多い。 しかし,標本平均を考えると,どのような母集団であっても,標本のサイズをある程度大き くすれば,標本平均の分布は近似的に正規分布になるということが,以下の中心極限定理で 保証されている。この定理は,統計学における著しい結果であり,最も重要な定理である。 (2) 中心極限定理を実際に適用できるのは,大標本の場合である。大標本とは,標本のサイズ nが大きい標本のことであるが,nの値の基準値は解説書によって多少異なる。ここでは, 30  n の場合を,大標本と呼ぶことにする。 X P 1/9 2/9 3/9 2/9 1/9 2 9 1 3 9 2 5 . 2 9 3 2 9 2 5 . 1 9 1 1 ) (X =  +  +  +  +  = E 3 1 2 9 1 3 9 2 5 . 2 9 3 2 9 2 5 . 1 9 1 1 ) (X = 2  + 2  + 2  + 2  + 2  − 2 = V  = ) ( X E 標本のサイズ 母分散 = = 2 ) ( 2  X V X 0 0.1 0.2 0.3 0.4 0.5 1 1.5 2 2.5 3

(11)

● 中心極限定理 母平均 ,母分散 の母集団からの大きさ の標本変量 について, を大きくしていけば,標本平均 の確率分布は,正規分布 ( , ) 2 n N

に限りなく近づいていく。 ※ 特に,大標本(n  30)の場合は, X ~ ( , ) 2 n N

と見なしてよい。よって,このときX を標準化して n X Z

= とおくと,ZN(0,1)となる。 7. 正規母集団の標本平均 ● 定理(正規母集団の場合) 正規母集団 からの大きさ の標本変量 について,nの値に 関係がなく,標本平均Xは正規分布に従う。すなわち X ~ ( , ) 2 n N

(1) 母集団分布が正規分布をなしている場合,その母集団を正規母集団という。 (2) つまり,母集団の個体の特性値を としたとき,X の確率分布がすでに正規分布に従っ ている場合,すなわち,XN(

,

2) であるとき,この母集団を正規母集団N(

,

2) と表現する。 (3) 正規母集団に対して,復元無作為抽出を行った場合は,標本のサイズnに関係がなく,標 本平均X は正規分布に従う。 (4) 上記の定理は,正規分布の再生性から,ただちに導かれる。 のいずれの確率分布も,母集団分布N(

,

2)に等しいので, i XN(

,

2)(i =1,2,,n) よって,p.72 の定理から,とにかくX1, X2,, Xn の 1 次結合である

2 n ) , , , (X1 X2Xn n ) ( 1 2 1 X Xn X n X = + ++ ) , ( 2 N n (X1,X2,,Xn) X n X X X1, 2,,

(12)

n X n X n X n X = 1 1 + 1 2 +  + 1 は正規分布をなすので, X ~N(E(X),V(X)) 一方,p.80 の定理より,

= = ( ) ) (X E X En n X V X V 2 ) ( ) ( = =  従って, ~ となる。 ■ 例題 A 地方の中学 3 年生全体に実施されたテストの成績は 平均点 = 62.5 点, 標準偏差 = 8 点 であった。このとき,この地方の中学3 年生から無作為抽出した 100 人の平均点が 64 点以上 になる確率を求めよ。 (解説) 詳しく説明しよう。このような問題では,まず,母集団はどれであるかに注意する必要があ るが,ここでは,明らかにA 地方の中学 3 年生全体が母集団である。(従って,母集団のサイ ズは非常に大きいと判断できるので,復元の議論を適用してよい。これについては後述。) この問題は,大きさ100 の標本平均X について,確率 を求めよという問題である。 標本のサイズは n =100であるから,n  30であり,大標本である。よって,中心極限定 理により,X は正規分布 すなわち に従うと考えてよい。(正規母集団であれば,nの値に関係なく,X はこの正規分布に従って いる。) X ( , ) 2 n N   ) 64 (XP ) , ( 2 n N   ) 100 8 , 5 . 62 ( 2 N 母平均 母標準偏差 5 . 62 =  8 =  大きさ100 の標本 64  X 母集団(A 地方の中学 3 年生全体) 標本平均Xの実現値 無作為抽出 100 = n

(13)

の標準偏差は, でり, を標準化して とおくと, ~ である。よって, ) 8 . 0 5 . 62 64 ( 1 ) 64 ( 1 ) 64 (X  = − P X  = − P Z  − P 0301 . 0 9699 . 0 1 ) 88 . 1 ( 1 −  = − = = P Z 上記のような計算はワンパターンであり,結局, の確率分布が分かるわけであるから,そ れに関する確率計算はいくらでもできる。 上記の結果には,次のような意味がある。母集団から100 人抽出したとき,100 人の平均点 が64 点以上になる確率は,約 0.03 である。非常に小さな値である。大ざっぱに言えば,100 人抽出するという試行を100 回繰り返したとき,抽出した 100 人の平均点が 64 点以上になる 場合は3 回程度しか起こらないということである。100 回中 3 回程度しか起こらないような出 来事は,非常に珍しい現象である。逆に言えば,現実に行った1 回の試行で,100 人の平均点 が 64 点以上になることは,ほとんどないといってよい。このような考え方が,統計的仮説検 定の基礎になる。 8. 非復元抽出の場合 (1) 中心極限定理は復元抽出の場合の話であるが,非復元抽出ではどのようになるのだろうか。 問題は,大きさ の標本 から決まる確率変数 の独立性で ある。 (2) 母集団のサイズNが非常に大きく,標本のサイズnがそれほど大きくない場合は,非復元 抽出であっても復元抽出と考えてよい。 (3) 例えば,母集団のサイズがN = 1000であり,標本のサイズがn = 10の場合,非復元で 最初に1 個の個体 を取っても,2 個目の個体 を取るときは母集団には999 個の個体が 残っている。 3 個目の個体 を取るときは,母集団にはまだ998 個の個体が残っている。1 個目や 2 個目にどのような個体を取っても,そのことが3 個目の個体の抽出結果に大きな影響を与え るとは考えにくい。 標本のサイズもn = 10であるので,1 個の個体を取る試行を 10 回繰り返す操作は,各 回の結果が他の回には影響を与えない試行,つまり10 回の独立試行と考えてよい。よって, この非復元抽出は,復元抽出と考えてよいだろう。 もちろん,標本のサイズが300 のような大きな値になれば,300 個の個体を取る試行は, 300 回の独立試行とは考えられない。このように,標本のサイズnに比べて母集団のサイズ X 0.8 10 8 100 82 = = X 8 . 0 5 . 62 − = X Z Z N(0,1) X n (

1,

2,,

n) (X1,X2,,Xn) 1 

2 3

(14)

Nが大きい場合は,非復元抽出であっても復元抽出と考えてよく, は独立 であると見なして良い。 (4) このことを,標本の個数で確認してみよう。母集団のサイズをN,標本のサイズをnとす ると,以下のようになる。 ① 非復元抽出の場合 ・大きさ の標本 の個数は ② 復元抽出の場合 ・大きさ の標本 の個数は n n NPN であるが,ここで を計算すると, これは,nに比べてNが非常に大きいときは, の値は1 に近くなり, を示す。つまり,上記の①と②の個数がだいたい等しくなってしまい,非復元と復元の違い が少なくなるのである。 (5) 統計的推測は,一般に,無限母集団を想定して議論される。無限母集団とは母集団の個体 が無限に多くある母集団のことだが,実際には,次のような場合は,無限母集団と見なして 議論するのが普通である。 ○ 母集団のサイズが非常に大きい場合 ○ 個体が無限に多くあると考えられる場合 ○ 母集団のサイズが標本のサイズと比べて大きい場合 実用的には,有限母集団でも 母集団のサイズ ≧(標本のサイズ)× 10 を満たすときは,通常は無限母集団と考えてよい。 このような無限母集団では,非復元であっても復元の議論を適用してよい。 (6) 以下のような場合は,通常,無限母集団と見なされる。 ① 日本の全有権者が母集団であり,調査のために3000 人の有権者を標本とした場合。 ② ある物を多数回測定して得られるであろう測定データの全体を母集団とし,実際に測定 して得られた5 個の測定データが標本の場合。この場合は,母集団は,無限回測定した と仮定しての測定データの全体であると判断する。 ③ ある工場で多数生産される部品A の品質特性(厚さ,強度など)を調べるために,生産 n X X X1, 2,, n (

1,

2,,

n) NPn n (

1,

2,,

n) n N n n NP /N n n n N N n N N N N N P = ( −1)( −2){ −( −1)}       − −       −       − = N n N N 1 1 2 1 1 1  n n NP /N n n NP ≒N

(15)

される部品 A の全体,すなわち,生産された部品 A のみならず,これからも生産され るであろう部品A の全体を母集団と考えた場合。 ④ 新しく開発した血圧を下げる薬の効能を調べるために,マウスを何匹か選んで実験する 場合。この場合,実験対象となるマウスは多数であり,正確にその数が分からないのが 普通である。従って,実験対象のマウス全体を無限母集団と考える。逆に言えば,有限 母集団と見なすと,そのサイズを求めるために,マウスの数を数えなければならないこ とにもなる。 (7) 実際の標本抽出では,復元における各種の定理が使われていくが ○ 無作為抽出でない場合 ○ 無限母集団と見なされない場合 ○ 標本のサイズに比べて母集団のサイズがあまり大きくない場合 などは,各種の定理の成立が保証されない状況になる。従って,このような場合は,統計的 推測を慎重に行う必要がある。 (8) なお,統計学入門における練習問題のほとんどは,上記の意味での無限母集団を仮定して いる。従って,非復元であっても,復元の議論(中心極限定理など)を適用してよい。

参照

関連したドキュメント

この数日前に、K児の母から「最近、家でも参観曰の様子を見ていても、あまり話をし

この節では mKdV 方程式を興味の中心に据えて,mKdV 方程式によって統制されるような平面曲線の連 続朗変形,半離散 mKdV

これらの定義でも分かるように, Impairment に関しては解剖学的または生理学的な異常 としてほぼ続一されているが, disability と

Q3-3 父母と一緒に生活していますが、祖母と養子縁組をしています(祖父は既に死 亡) 。しかし、祖母は認知症のため意思の疎通が困難な状況です。

した標準値を表示しておりますが、食材・調理状況より誤差が生じる場合が

森 狙仙は猿を描かせれば右に出るものが ないといわれ、当時大人気のアーティス トでした。母猿は滝の姿を見ながら、顔に

(2)特定死因を除去した場合の平均余命の延び

「欲求とはけっしてある特定のモノへの欲求で はなくて、差異への欲求(社会的な意味への 欲望)であることを認めるなら、完全な満足な どというものは存在しない