第 8 章 2項分布 63
12.2 社会調査の実例
80 第12章 母集団比率の推定
番組名 放送日 放送時間 放送局 番組平均世帯視聴率(%) ちびまる子ちゃん 1990/10/28(日) 18 : 00∼18 : 30 フジテレビ 39.9
サザエさん 1979/9/16(日) 18 : 30∼19 : 00 フジテレビ 39.4 Dr.スランプ 1981/12/16(水) 19 : 00∼19 : 30 フジテレビ 36.9 ど根性ガエル 1979/2/23(金) 18 : 00∼18 : 30 日本テレビ 34.5 まんが日本昔ばなし 1981/1/10/(土) 19 : 00∼19 : 30 TBS 33.6 ルパン三世・最終回 1978/12/8(金) 18 : 00∼18 : 30 日本テレビ 32.5
タッチ 1985/12/22(日) 19 : 00∼19 : 30 フジテレビ 31.9
あしたのジョー 1980/3/13(木) 18 : 00∼18 : 30 日本テレビ 31.6 ドラえもん 1983/2/11(金) 19 : 00∼19 : 30 テレビ朝日 31.2 ゲゲゲの鬼太郎 1986/3/22(土) 18 : 30∼19 : 00 フジテレビ 29.6
「ちびまる子ちゃん」(1990/10/28放送)の視聴率をほぼ40% であると見なして,信 頼度95% の推定誤差を求めよ.
(解)
1. n = 600,pˆ= 0.399 である.
2. ˆs =
√0.4×(1−0.4)
600 = 0.02
3. したがって 95% 信頼度での誤差は±1.96×sˆ=±0.04である.
問1 ゲゲゲの鬼太郎(1986/3/22放送)視聴率をほぼ 30%であると見なして,信頼度 95% の推定誤差を求めよ.
問2 ある湖に棲む魚の数を調べたい.もちろん,すべての魚を捕獲してその数は調べ ることは不可能である.そこで,始めに魚を 100 匹捕獲し,それらに目印を付けてか ら,解き放った.その日から1週間後に,再び魚を100 匹捕獲したところ,それらのう ち 10匹に目印が付いていた.湖に住む魚の数の 95% 信頼区間を求めよ.
12.2. 社会調査の実例 81 とくに鹿児島県においては,平成22年度調査の場合,標本数はつぎのようである(幼 児・児童・生徒全体の約20% である).
幼稚園 小学校 中学校 高等学校 学校数 35 58 39 26
人数 1,650 27,930 17,380 21,201
その結果,たとえば,裸眼視力1.0 未満の者も比率(%)はつぎのようであった.
幼稚園 小学校 中学校 高等学校 比率 26.43 29.91 52.73 55.64 問 3 小学校の場合,信頼度95% の推定誤差を求めよ.
例3 昭和 25(1950)年の『農業センサス』では,全数調査と標本率 1/20の標本調査
の二種類の調査が行われた.その結果の一部は以下の通りであった.
総数(千戸) 専業農家数 比率(%)
全数調査 6,176 3,086 50.0
標本調査 45.0
標本調査における標本誤差を計算してみる.抽出率 1/20 であるから,標本数 n は n= 6176×1000/20 = 308800
標本比率は pˆ= 0.45であるから,
√p(1ˆ −p)ˆ
n = 0.000895 したがって信頼度95% の標本誤差は,
1.96×0.000895 = 0.00175 =約0.002
となる.すなわち,母集団比率 p は 0.45−0.002 以上 0.45 + 0.002 以下であると判断 してよい.ただし,この判断が誤りである確率は 1−0.95 = 0.05 である.ところが全 数調査によれば,母集団比率 p = 0.50 であるから,標本調査と全数調査の結果は矛盾 している.どちらが正しいのだろうか?
この両調査とも,専業農家の定義は同一で,農業以外に生産的な労働または収入があ れば兼業農家となる.
82 第12章 母集団比率の推定
• 全数調査の場合,調査票は単に「あなたの家は専業ですか兼業ですか」と聞いて,
農家の主観により専業・兼業を決めるようになっていた.当時,専業農家は誇り を持っていて,少しぐらいの兼業収入があっても専業と答えた.一方,標本調査 では別の目的もあり,現金収入を作物別に聞いていたが,農業現金収入が少ない と生活できないので,収入について聞き返していた.
• 全数調査では調査員は同じ村の人であり,一方,標本調査の調査員は統計職員で,
回答にチェックを行っていた.
この事情を考慮すると,実は標本調査の方が正確で,全数調査の回答には「偏り」があ ると判断できる.
12.2. 社会調査の実例 83 例 4 つぎのデータは 1960 ∼1979 年の出生数(千人)と出生性比である.
年度 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 出生数 1,606 1,589 1,619 1,660 1,717 1,824 1,361 1,936 1,872 1,890
性比 105.6 105.9 106.1 105.7 105.9 105.3 107.6 105.3 107.1 107.2 年度 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 出生数 1,934 2,001 2,039 2,092 2,030 1,901 1,833 1,755 1,709 1,643
性比 107.1 106.7 106.5 106.2 106.4 106.2 106.2 106.1 106.0 106.2 1966年はいわゆる「丙午の年」で,女子の出生届けが少なかったことにより,出生数 が少なく,また出性比が大きくなった.その反動で,翌年は出生数が多くなり,また出 性比が小さくなった.では1968 年以降数年間,出性比が107 を越えているが,これは 何故だろうか?
出生数等の調査は出生届を「集計」したもので,全数調査であり,標本調査ではな い.しかし,現実の社会と,同じ食生活・衛生・医療等の状態をもつ仮想の社会を考 え,その仮想社会での出生現象を考えることができる(「無限母集団」の考え方).す ると 1968 年の場合,標本数は n = 1,872,000 であり,また男子の出生の標本比率は ˆ
p= 107.1/(107.1 + 100) = 0.517 である.したがって信頼度 95% の標本誤差は,
1.96×
√
0.517×(1−0.517)
1,872,000 = 1.96×0.000365 =約0.0007
すなわちこの年の男子の出生の母集団比率は0.517−0.0007以上 0.517 + 0.0007以下で あると判断してよい(この判断が誤りである確率は0.05).
一方,比較のために通常の出生性比であった年として,たとえば1964年を見ると,男 子の出生の標本比率は105.9/(105.9 + 100) = 0.514 である.したがって,1968 年の出 生性比は明白に大きい.この原因は単なる偶然とは考えられない.実は,
1968 年から「集計」方法が変わり,地方でマークシートを作ることになっ た.1968年の結果が公表されて,性比が以上に高いことが問題となった.そ こで,厚生省がマークシートのチェックを行った結果,女子であるのに前に ある男子の枠を塗ったミスが,逆のミスよりも多かった.
このような理由で,1968 年以降数年間の出生性比の以上な高さは,「集計」ミスによる ものと考えられる.
問4 国勢調査の速報として1% 集計が発表されている.1980年の国勢調査の場合,つ ぎの比率にはどの程度の標本誤差があるかを算出せよ.
(1) 女性の比率 (2) 20歳代の比率.
ただし,総人口117,060 千人,女性人口59,467,20 歳代人口 16,882 である.
84 第12章 母集団比率の推定