• 検索結果がありません。

国勢調査の結果による JGSS の結果の改善

ドキュメント内 公的統計の現代的意義 (ページ 82-92)

民間統計調査には報告義務がないことから、公的統計のように高い品質を確保する ことが困難な場合が多い。しかし、その結果に公的統計の結果を活用することにより

73

結果の偏りを縮減することが可能となる。第2章では、国勢調査の結果により JGSS の結果の精度を向上する研究を紹介する。

JGSS は、大阪商業大学が 2000 年以降1~3年に1度、日本人の価値観、意識、

行動を包括的に把握するために約4,500人 16を対象に実施する国際比較が可能な社会 調査である。JGSS-2000では、あらかじめ設定された地域区分ごとに人口規模に比例 するように1995 年国勢調査(総務庁統計局)の調査区 17を抽出し、そこからそれぞ れ満 20~89 歳約 15 人の調査対象を無作為に抽出している。全国を6ブロック 18に 分け、各ブロック内で政令指定都市等(東京都特別区部を含む)、その他の市、町村別 に層化している。各調査地点における対象者の抽出は、選挙人名簿 19からの系統抽出 により行っている。統計調査と異なり、調査結果については、集計よりも個別データ として研究用に利用することに重点を置いている。

JGSS では、確率比例抽出法を採用しているので、観測値に抽出率の逆数を掛けて 加える線形推定の過程が単純化され、基本的には調査対象ごとの値を単に加算するだ けで属性(回答の選択肢)別構成比を推定することができる。しかし、官公庁が標本 調査により実施する統計調査では、結果の推定方法として、直近の全数調査などから 得られた人口、従業者数等を基準とする比推定が良く用いられている。標本調査であ る以上、偶然に又は実務上の制約により偏った結果が現れることがあるので、このよ うな比推定は、少しでも精度を高めるために既存の情報を活用しようという試みであ る。

一般に、単純無作為抽出を想定する線形推定に対して、層化比推定には以下の特徴 がある。

①層化の基準指標について調査対象抽出に伴う偶然の偏りと未回収による情報の損失 を一部回復することができる

②層化の基準指標について母集団との整合性を維持することが可能

③僅かではあるが偏りが発生

このような特徴を踏まえ、本章では、JGSS の個別データにおいて、国勢調査の結 果をもとに層化比推定を行うことができる比推定乗率 20を導入するための研究につ いて説明する。清水誠[27]は、第2回予備調査について、清水誠[28]は、JGSS-2000

16 第2回予備調査の調査対象は約 1,200人

17 国勢調査の調査区は基本単位区を2つ程度結合して作成されている。基本単位区とは、

住居表示実施地域においては街区を、住居表示実施地域以外の地域においては、街区に準 じた区画を単位として設定されており、そこに含まれる世帯数はおおむね25~30世帯であ る。

18 北海道・東北、関東、中部、近畿、中国・四国、九州別

19 許可されない場合は住民基本台帳

20 JGSSの個別データにおける比推定乗率の変数名は“weight”としている。

74

について個別データを用いて検証した研究であり、本章は、筆者のこの2つの研究に 基づいている。

1 海外の状況

欧米には20世紀からJGSSに相当する一般社会調査GSS(General Social Surveys) が存在する。GSS や類似の調査を見ると、オーストリアの SSO(Sozialer Survey Osterreich)、イタリアのISI(Indagine Sociale Italiana)、スペインのASEP(Analisis Sociologicos Economicosy Politicos)、ブルガリアの GSS、ポーランドのPGSS(Polish

General Social Survey)など、データセットに男女別×年齢別人口に一致させるため

の比推定乗率が付されているものがある。これらの比推定乗率は、更にその他の属性 を調整する場合もあるが、その属性は、オーストリアSSOでは地域別×共同体規模別

×就業形態別(又は職業別)に、イタリアISIでは職業別に、ブルガリアGSSでは教 育の程度別に、ポーランドPGSSでは住宅の種類別にと、調査ごとに多様である。

他方、英国にはGSSに相当する調査としてBSA(British Social Attitudes Survey) がある。このデータセットには、分析をする前に“wtfactor”を利用して抽出率と世帯 人員数に応じた換算をすべきであるとの指示があるが、比推定乗率は存在しない。ま た、ドイツのALLBUS(Allgemeine Bevolkerungsumfrage der Sozialwissenschaften) についても、旧東ドイツに偏った標本設計から全体像を適切に推計するための乗率付 データが提供されているものの、比推定乗率は付されていない。

北米では、カナダのGSSが比推定 21を系統的に実施している典型である。これは、

月ごとに電話を通じたRDD(Random Digit Dialing)などにより世帯を対象に実施 され、1996年に実施された第11期はSocial and Community Support、1998年に実 施された第12期はTime Useというように、年ごとにテーマが設けられている。特に、

1996年調査では、RDDによる通常の標本のほかに、労働力調査の終了者から選ばれ た 65 歳以上の追加標本がある。このため、各調査の個別データは、これらの2種類 の標本ごとに乗率が作成され、65歳以上については2種類の標本を結合するための調 整係数もある。RDD標本の乗率は、電話番号に基づく抽出率の逆数、抽出世帯数に対 する回答世帯数の割合の逆数、世帯内電話数の逆数、世帯人員数、労働力調査に基づ く比推定に必要な地域別×男女別×年齢階級別乗率を乗じたものとなっている。

米国の GSS の変数には、世帯単位を個人単位に換算する“ADULTS”(1975 年以 降)、黒人の超過を調整する“OVERSAMP”(1982 年)、複数の様式に基づく結果を

21 正確には、Raking比推定法、すなわち、統計表において、行方向と列方向の合計(欄

外)値を既知とした上で、原数値としてのセル値を行・列ごとに等倍して合計値に一致さ せる作業を、行・列ごとに繰り返すことによりセル値を推定する方法による。

75

調整するための“FORMWT”(1978、80、82‐85年)、ISSP(International Social

Survey Program)対象者の回答・無回答を区別するための“ISSP”が作成されている

が、比推定は行われていない。

なお、比推定をするにはベンチマークとして対応する信頼される統計が必要である が、その整備状況は国により異なるので、比推定の有無は GSS 側だけの事情ではな い点に留意が必要である。また、ベンチマークの精度が低ければ、比推定は妥当な推 計方法とは言えず、GSSとの間で分布が似ていることを確認しても意味がないという ことも念頭に置く必要がある。

2 比推定乗率の意義

このように、諸外国のGSSや類似の調査の結果を見ても、カナダやイタリアなどの いくつかの国で国勢調査や労働力調査を基にした比推定が行われている。

また、米国のGSSについては、比推定は行われていないものの、結果の分布は全数 調査などと大差がないことを確認しており、これらの調査と分布を比較・分析する視 点は重視されている。実際、JGSSについても、このような視点に基づく検証を行っ たが、調査対象抽出に伴う偶然と実地調査における調査対象者の不在や拒否などによ り年齢構成に偏りがあることがわかった。

そこで、JGSSについても調査対象の抽出に用いた地域区分を基に、男女と年齢と いう基本的な属性で区分した人口規模による比推定を試みることとした。その際、比 推定により結果がどう変化するのか、既存情報と比較してどのような特徴があるのか を基礎情報として明らかにすることとした。

3 比推定乗率の作成方法

第2回予備調査においては、2種類の比推定用乗率を作成することとし、①地域別

(6区分)×男女別(2区分)×年齢10歳階級別(6区分)、②市町村の規模別(3 区分)×東西地域別(2区分)22×男女別(2区分)×年齢10 歳階級別(6区分)の それぞれについて、有効回答数当たり人口を計算した。

JGSS-2000では、第2回予備調査と比べて有効回答数が多いことにかんがみ23、当

初、上記①と②の区分をクロスさせた精緻なものを作成することとした。つまり、地 域別(6区分)×市町村の規模別(3区分)に、男女別×年齢10 歳階級別をクロス するという調査対象の抽出方法を踏まえた分割の仕方を想定した。しかし、これでは 標本規模0となる箇所が出現し、比推定乗率の作成が困難になることから、市町村の

22 東日本は北海道・東北、関東、中部、西日本は近畿、中国・四国、九州

23 有効回答数は、第2回予備調査が 776、JGSS-2000が2,893

76

規模を大括りして市郡別とした。すなわち、地域別(6区分)×市郡別(2区分)×

男女別(2区分)×年齢10歳階級別(6区分)24に有効回答数当たり人口を計算し、

比推定用乗率とした。基準として用いた人口は、2000年10月1日国勢調査(総務庁統 計局)の総人口である。

比推定乗率、すなわち、有効回答数当たり人口は次の範囲に分布している。

最小 1.5万(中国・四国・郡部70歳代・80歳代女性)

最大 8.6万(九州・市部30歳代男性)

最大/最小 5.8倍

また、有効回答数は1区分に最低3となっている。

4 比推定の方法

比推定乗率により試算した比推定の結果を単純合算した結果と比較すると、以下の ようになる。

4.1 推定式

JGSS は確率比例抽出法を用いていることから、調査対象は等確率で抽出されてい る。単純無作為抽出法を想定して構成比を推定する方法は、標本規模を𝑛𝑛、xjyjは、

標本に含まれる観測属性で、0又は1とすると、

=

=

n=

j j n

j j x

y x p

1

ˆ

1

となる。

これに対して、作成した比推定乗率をもとに結果を推定する方法は、国勢調査の結 果を踏まえた層化推定となり、具体的には以下のようになる。

層数を𝑙𝑙、層𝑖𝑖に属する母集団の大きさを𝑁𝑁𝑖𝑖、標本規模を𝑛𝑛𝑖𝑖、𝑥𝑥𝑖𝑖𝑗𝑗と𝑦𝑦𝑖𝑖𝑗𝑗は、層𝑖𝑖に属する 観測標本の属性で、0又は1とすると、

24 70~79歳と80~89歳は統合して1区分とした。また、年齢不詳は都道府県別・男女別 に合計(市郡計)、市部についてそれぞれ按分し、郡部は合計から市部を引くことにより 計算した。

ドキュメント内 公的統計の現代的意義 (ページ 82-92)