128 第9章 まとめと今後の課題
近年,世論調査における調査環境は次第に困難を増す様相を呈してきた.
時系列比較のためには,それまでの調査方法である調査員調査を継続する必 要性があるにもかかわらず,調査員による調査の実施はますます困難を極める.
一方で,調査員によらない方法として郵送調査に移行する傾向が広くみられる.
このような状況において,調査員調査におけるスムーズな実査の遂行が図れる ようにすることが,また,広く行われている郵送調査において今後一層普及が 進むインターネットを取り込んだ併用調査の道を探ることが,ともに重要な問 題である.
調査員調査における対象者とのコンタクトの困難性が高まる状況の中で,エ リア・サンプリングによる調査対象者の抽出をよりスムーズに行う方法として 世帯あたりの調査適格者数の平均値による抽出法が考えられる.その抽出法を 用いて,世帯人数の分布をもとに構成した仮想的な調査区に対するシミュレー ションの結果と,実際に国勢調査区において抽出した結果について検討を行っ た.また,無作為抽出によるサンプルに対して,郵送とインターネットの併用 による実験調査を実施し,回答手段の違いによる回答の分析を通して併用調査 の有効性を探った.
以下は,エリア・サンプリングにおける二段抽出(平均値による抽出法),
ならびに郵送とインターネットの併用方式についてのまとめとしての全体的考 察である.
1. エリア・サンプリングにおける二段抽出
面接法のように調査員による調査においては,住民台帳や有権者名簿の閲覧 ができない場合に,それでも無作為抽出の必要があるときには,エリア・サン プリングを用いることになるが,現在行われているKish法や誕生日法はフィー ルド・ワークにおいて調査員と調査対象者の双方に大きな負担となる.特に,
個人情報保護法の施行以来その傾向は顕著である.この負担を極力軽減するた めに平均値による抽出法は極めて有効である.1世帯あたりの平均適格者数を もとに,世帯ごとにその数値を積み上げ,住民台帳における抽出と同様に,個 人を対象にスタート番号と抽出間隔により抽出する.そこで抽出された個人が 居住する世帯を訪問し,その世帯に調査適格者が何人いようと「世帯の中で,
年齢が上から○番目の人」に調査の協力を行えば済むからである.
なお,実際には,各世帯ごとに異なった数の適格者が居住している.この現 実に平均適格者数をあてはめれば,スタート番号や抽出間隔番目の人がその世 帯に居住していない場合があり,そのときは隣接の世帯へ移っていく.このよ
129
うにして標本の抽出は無作為に行われる.そのうえで,抽出された標本が母集 団を反映した標本となっているかどうかを検証した.
抽出結果の検証に関しては,世帯人数別の人口数の割合をもとに行ったシミ ュレーションにおいて,標本平均の標準誤差(SE)を計算し,平均値 ± SE × 1.96
(95%信頼区間)の範囲と照合したが,全国の場合では,平均値による抽出法 を用いた結果において,抽出された個人の世帯における「適格者数」に関して は10グループ中9グループで,また抽出された世帯の中での「年齢順位」に関 してはすべてのグループで,その範囲内の数値となった.世帯人数の分布に隔 たりがある2つの地域(東京都新宿区と山形県鮭川村)において,平均値によ る抽出法を用いた結果については,新宿区で「適格者数」に関しては10グルー プ中5グループで,また,「年齢順位」に関しては10グループ中8グループで 範囲内の数値となった.鮭川村でも「適格者数」に関しては10グループ中7グ ループで,「年齢順位」に関しては10グループ中9グループで範囲内の数値と なった.
次に,実際に抽出された標本がどのような抽出結果になるのかをみるために,
実際の有権者名簿からの抽出ならびにKish法による従来のエリア・サンプリン グのそれぞれと,平均値による抽出法を利用した抽出との比較を行った.その 結果は,「適格者数」については平均適格者数を用いた抽出において95%信頼 区間の範囲を外れたケースが9調査区中3調査区あったが,「年齢」「性別」
「年齢順位」については1つもなかった.特に,従来のエリア・サンプリング の場合は,「年齢」「性別」「適格者数」のいずれにおいても,95%信頼区間 を外れたケースが1件ずつあるのに対して,平均値による抽出法では,前述の とおり95%信頼区間を外れたケースは「適格者数」においてだけであった.
人為的に作り出した状況でのシミュレーションとは違い,住宅地図を用いて 実際の調査と同じ条件で抽出された平均値による抽出法による抽出結果におい て,十分に多いケースといえない今回の結果からは,従来のエリア・サンプリ ングと比べて直ちに優劣を判断することはできないが,平均値による抽出法が 従来のエリア・サンプリングに代替し得る有効な方法であると考えることがで きよう.
また,平均値による抽出法は,訪問世帯でのファースト・コンタクトにおい て,調査の協力依頼に辿り着くまでのやりとりが,従来のエリア・サンプリン グに比べ簡略化されており,調査員と調査対象者の負荷を軽減することが期待 される.さらに,従来のエリア・サンプリングにおいては,第2次抽出単位で ある世帯から調査対象者個人を選出する際の抽出確率の違いから,ウエイト補 正が必要であるとする主張があるが,平均値による抽出法では第2次抽出単位 が個人であるためウエイト補正の必要はない.回収標本の属性の構成に偏りが
130
みられる場合,ウエイト補正が他の属性の偏りを増幅する懸念があり,実際に 補正を行わないことがあるが,このような現場での混乱も排除できる.また,
標本設計に際しては,層化による標本の配分において,平均値による抽出法で は個人を第2次抽出単位とすることで,人口をもとに層化を行えばよいから,
世帯数による層化か人口による層化かという混乱はない.
以上より,今後,平均値による抽出法を利用することの意義は大きいと思わ れる.
2. 世論調査における郵送とインターネットの併用方式
世論調査においては,母集団推計を行うために無作為抽出による標本が前提 となる.無作為抽出された標本の標本平均は,標本のサイズが十分に大きけれ ば正規分布にしたがう.そこで,正規分布の性格を利用して,標本平均から前 後に標準偏差の2倍の範囲を考えれば,それが約95%を占めることが分かって いるから,「95%の信頼度で,標本調査によって得られた統計値がどれくらい の幅の標本誤差を持つ」をいうことができる.このことによって,調査結果か ら推計により得られた母集団に関する情報をもとに,たとえば,現実に対応し た施策を実施するというようなことが可能となるわけである.
本調査の結果についていえば,車の免許の保有率(74.2%)は,今回の調査設 計のもとで得た調査結果であるとともに母集団を推計する統計値であり,標本 誤差の計算式33によって母集団全員の免許の保有率は71.7%<P<76.7%(信頼 度95%)ということができる.この推計値を実際の母集団全員の免許の保有率
(76.0%)と比較すれば,その調査の正確さが確認できる.調査には,上述した 通り計算することのできる標本誤差と,調査員の不注意による調査上のミスや 回答者の誤回答などによって生じる測定誤差のように計算することのできない 非標本誤差があるが,今回の車の免許保有率の調査結果をみると測定誤差がそ れほど高くはなかったのではないかと思われる.
現在広く行われているインターネット調査の回答者(パネル)は,調査者側 からの呼び掛けに呼応した一部のインターネット・ユーザーであり,そこには サンプルの代表性がないことはしばしば指摘されてきたことである.そのよう なインターネット調査では母集団の意見を正確に捉えることはできない.これ に対して,本調査では無作為抽出によるサンプルをもとに,回答手段としてイ ンターネットを利用した.そのために,インターネット環境にない人,もしく はインターネットを通常の通信手段としていない人が存在することになり,そ
33 標本誤差(パーセント)の計算式は p-1.96
n p p(100 )
<P<p+1.96
n p p(100 )
である.pは回答率(パーセント),nは回答者数,Pは母集団でのパーセント.