• 検索結果がありません。

一般の確率分布のシミュレーション

ドキュメント内 i (ページ 81-86)

第 8 章 2項分布 63

11.4 一般の確率分布のシミュレーション

場合によっては,選ばれた市町村の中をいくつかのブロック(区画)に分けて,そ こからいくつかのブロックを抽出する.そして,選ばれたブロックにおける世帯 のリストを用いて,そこから世帯を抽出する.これを3段抽出法と言う.

『家計調査』では,母集団は全国の消費者世帯(ただし農林漁業世帯および単身者 世帯は除く)であり,3段抽出法を行っている.

注意すべき事は,たとえば全国の市町村のリストから市町村を抽出する際,それぞれ の市町村を等確率で選ばずに,それぞれの市町村の世帯数に比例する確率で抽出しなけ ればいけない.この方法を確率比例抽出法と言う.

11.3.3 層別抽出法

たとえば調査結果が,性別・年齢階級別・職業別等の様々な層別で異なることが,前 もって予想できるとする.このようなときに単純無作為抽出法を適用すると,たとえば ある層の標本が偶々全く選ばれない,ということが起こりえる.そこで,そうならない ように,それぞれの層から,必ずある数の標本が選ばれるように配慮する必要がある.

これを層別抽出法と言う.

たとえば,平成20年の『家計調査』では,母集団は,平成17年『国勢調査』に基 づき,二人以上の世帯が約3461万世帯,単身世帯が約1350万世帯である.層別の 方法は,たとえば中都市および小都市Aでは,家計指標と相関が高いとみられる社 会・経済指標(人口集中地区人口比率,人口増減率,第一次および第二次産業就業 者数の割合,世帯主の年齢)を組み合わせて,各層の調査対象世帯数が,できるだ け等しくなるようしている.層別の配分は,各県庁所在地およびいくつかの大都市 51 層,中都市および小都市A75 層,小都市B42層,のようにして計168 に層別を行っている.調査世帯数は全部で「わずか」8076 世帯にすぎない.

『法人企業統計』では,母集団は全国の法人企業(ただし金融・保険業は除く)で あり,それを資本金規模別に4層に層別している.平成3 年の『法人企業統計』で は,全国で 464,587の法人企業があり,そこから全部で22,523個の標本を抽出し ている.

11.4 一般の確率分布のシミュレーション

たとえば10校の学校A,B,C,...,I,Jがあり,それぞれの生徒数は100,200,· · ·,1000 名 である.総数5500 名の生徒から,50名を無作為抽出して,学力テストを実施する計画

76 第11章 モンテカルロシミュレーション がある.ただし,学校どうしは距離が離れているので,はじめに2校を抽出し,つぎに 生徒50名を抽出することにした(2段抽出法).そのためには

1. 学校 A,B,...,I,J を無作為抽出する際,それぞれを抽出する確率は 1

55, 2 55, 3

55,· · ·, 9 55,10

55 (11.1)

としなければならない.

2. この結果,たとえば学校 C,F が抽出されたとき,次は,この 2校の生徒数の合 計 900 名から50 名を無作為抽出することになる.

この例の場合に,実際に標本抽出の作業を行うには,確率分布(11.1)をもつ確率変数の シミュレーションが必要となる.

一般に,確率変数 X が確率分布

X x1 x2 · · · xk 確率 p1 p2 · · · pk

をもつ場合に,Excelを用いて,X の値をランダムに発生させてみよう.そのためには VLOOKUP関数を利用する.

1. 適当な場所,たとえばセル F1:Gk に,VLOOKUP関数が参照する表 T を作成す る.すなわち

(a) はじめに,セル E1:Ek に確率p1, p2,· · ·, pk を入力する.

(b) つぎに,セルF1:Fk に累積確率

q1 =p1, q2 =p1+p2, q3 =p1+p2+p3,· · ·, qk =p1+p2+· · ·+pk を計算する.ただし実際には,セル F1:Fk に「ひとつずらした」値

0, q1, q2,· · ·, qk1 を置く.

(c) そして,セルG1:Gk に確率変数がとる値 x1, x2,· · ·, xk

を入力する.

2. A列に,RAND() 関数を用いて,0 以上1 未満の乱数を発生させる.

11.4. 一般の確率分布のシミュレーション 77 3. セル B1 に式 =VLOOKUP(A1, F$1:G$k, 2)を入力し,それを B 列 のセル B2 以

降にコピーする.

関数VLOOKUP(z, T, 2) はつぎのように働く.

第一引数の z はひとつの数(いま考えている場合は,ひとつの乱数)である

第二引数の表 T はセル F1:Gk に作成した次の表 0 x1 q1 x2 q2 x3

... ... qk1 xk のことである

第三引数の ’2’は表T の 2 列目を指示している.

そして,

もし z < q1 であるならば,関数の値 =x1,そうではないが,

もし z < q2 であるならば,関数の値 =x2,そうではないが,

もし z < q3 であるならば,関数の値 =x3,そうではないが,

以下同様 のように働く.

問題 正しい硬貨を 5回投げるとき,表の出た回数を X とする.この試行を 10回繰 り返すシミュレーションを行え.

79

12 章 母集団比率の推定

12.1 母集団比率の区間推定

ある市における近視の人の比率 p を知りたいとする.全数調査の実施は経済的にも 時間的にも困難なので,標本調査を行うことにした.n 人の標本を抽出して視力検査を 行ったところ,標本における近視の人の比率は pˆであった.未知の母集団比率 p を標 本比率pˆを用いて推定したい.

標本は無作為抽出されたもので,標本比率は母集団比率にある程度近い値になるであ ろう.

ところが,標本比率の値はどの標本が抽出されたかに応じて変動する.だから標本比率 が母集団比率にピッタリ一致することはありえない.すなわち標本比率と母集団比率の 間に必ず 推定誤差 がある.この推定誤差の大きさは,次のようにして見積ることがで きる.

1. 標本比率 pˆを求める.

2. 標準誤差 sˆ=

p(1ˆ −p)ˆ

n を計算する(ただし n は標本数).

3. 95%の確率で,推定誤差は ±1.96×sˆである.また,99%の確率で,推定誤差は

±2.545×sˆである.

すなわち,95% の確率で,母集団比率ppˆ1.96×sˆ以上,ˆp+ 1.96×sˆ以下であ る,という風に言い表すことができる.この「何々以上、何々以下」という形で得られ た区間は,信頼度95% の信頼区間と呼ばれている.

例1 つぎは,1977年 9月 26日以降に放送されたアニメ番組(関東地区)の世帯視聴 率を高い順に並べたものである.関東地区の調査対象世帯数は 600 世帯である.1

1http://www.videor.co.jp/data/ratedata/junre/03anime.htm

1977926(オンライン調査開始)以降に放送された15分 以上の番組が対象.レギュラー番組が

対象で,タイトルが同じものは同一番組とし,最高のもの1 番組を抽出.

80 第12章 母集団比率の推定

番組名 放送日 放送時間 放送局 番組平均世帯視聴率(%) ちびまる子ちゃん 1990/10/28() 18 : 0018 : 30 フジテレビ 39.9

サザエさん 1979/9/16() 18 : 3019 : 00 フジテレビ 39.4 Dr.スランプ 1981/12/16() 19 : 0019 : 30 フジテレビ 36.9 ど根性ガエル 1979/2/23() 18 : 0018 : 30 日本テレビ 34.5 まんが日本昔ばなし 1981/1/10/() 19 : 0019 : 30 TBS 33.6 ルパン三世・最終回 1978/12/8() 18 : 0018 : 30 日本テレビ 32.5

タッチ 1985/12/22() 19 : 0019 : 30 フジテレビ 31.9

あしたのジョー 1980/3/13() 18 : 0018 : 30 日本テレビ 31.6 ドラえもん 1983/2/11() 19 : 0019 : 30 テレビ朝日 31.2 ゲゲゲの鬼太郎 1986/3/22() 18 : 3019 : 00 フジテレビ 29.6

「ちびまる子ちゃん」(1990/10/28放送)の視聴率をほぼ40% であると見なして,信 頼度95% の推定誤差を求めよ.

(解)

1. n = 600,pˆ= 0.399 である.

2. ˆs =

√0.4×(10.4)

600 = 0.02

3. したがって 95% 信頼度での誤差は±1.96×sˆ=±0.04である.

問1 ゲゲゲの鬼太郎(1986/3/22放送)視聴率をほぼ 30%であると見なして,信頼度 95% の推定誤差を求めよ.

問2 ある湖に棲む魚の数を調べたい.もちろん,すべての魚を捕獲してその数は調べ ることは不可能である.そこで,始めに魚を 100 匹捕獲し,それらに目印を付けてか ら,解き放った.その日から1週間後に,再び魚を100 匹捕獲したところ,それらのう ち 10匹に目印が付いていた.湖に住む魚の数の 95% 信頼区間を求めよ.

ドキュメント内 i (ページ 81-86)