2002年日本オペレーションズ・リサーチ学会
秋季研究発表会
1−E−12
社会調査における回答者属性データの地域集計
01102840 会津大学 出水田智子 IZUMITATomoko
〆=∑β●ノ/〟
β■=∑∂〟//
1.はじめに
世論調査などで社会的な集団の特性、意識、行
動などを標本調査として実施するときの中心的な
課題は、調査対象者の回答比率を通してその背後
の母集団全体の比率を推定することである。この
とき必要なことは、標本から得られた結果から母
集団の統計値が精度よく推定されることである。
このような推定比率の精度を決定するのは、調
査対象者の抽出方法によって生じる母比率と標本
比率の差だけではない。調査の精度は母比率と回
答比率の差で評価されるため、むしろ回収率の低
さや不完全な回答結果あるいは作業ミスなどの影
響による標本比率と回答比率の差の開きが影響す
る。さらに結果を比率で表現するために、1集計
単位あたりの標本数の大きさやばらつきによる影
響も無視できない時がある。
そこで本稿では、分析結果に含まれる調査誤差
のうち、回答者属性データの地域集計作業が母比
率推定に与える影響について計算例を基に検討す
る。
(2)
となり、各集団におけるその値の平均に等しくな
る。
集計誤差は全体を一つとして求めた(1)の結果
と、異なる単位で集計した結果を比較することで
求めることが出来る。そこで、母集団、標本、回
答を共通な属性によってL個の層に分割し集計す
ることをここでは考える。止=1,…,上のとき、層
別の母集団数、標本数、回答数を鶴、鶴、/ヵ.そ
の中の各個体の値を∂伸 ∂●伸
∂朋とすると、
集計単位別の各集団の比率はそれぞれ
p力 =∑∂封/鶴
メカ=∑∂●封/〟力
β力=∑∂封//力 (3)
となり、先ほどと同様に各層の値の平均に等しく
なる。ここで母集団における各層の構成比率をw
力=鶴/尤標本集団における構成比率をw●力=ガヵ/仇
回答集団における各層の構成比率をwヵ=/ヵ/fと
おくと、集計後に算出される母集団、標本、回答
における集計による比率の差は
2.調査誤差の定義
調査対象全体の母比率推定における調査誤差は、
以下のように標本誤差£sと非標本誤差ERの和で
定義される。
E。=ク ̄p
=(β一〆)十(〆一云)
= とs†寧R (1)
ただしノpは母比率、〆は標本比率、オは回答比
率である。母集団数、標本数、回答数をそれぞれ
爪仇/、その中の各個体の値をβi(/=1,・・・,〟、
∂●j(摩1,…,β)、∂∫(庚1,…,/)、とすると、
β=∑∂i/〝
とa・=クー∑w力β力
£a●=〆−∑w●カメム
と。=クー∑wカタ力
となる。
そこで(1)と(4)から、集計化による誤差項£a
が考慮された調査誤差の推定モデルとを以下のよ
うに定義する。
E = t(♪−∑Ⅴムβ力)−(〆−∑Ⅴ●力〆力)l
十【(Jト∑w●カメ力卜(β■−∑wカタカ)I
=(クー〆)十(ダーメ)†(∑wヵタヵー∑Ⅴ力β力)
= とs十ER†(∑wカタカー∑w力β力)
(5)
= ∈s†ER†とa
−106−
© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.
3.計算例
使用する調査データの概要は以下の通りである。
・調査目的:会津若松市市民の生活意識調査
・標本抽出方法:系統抽出法(7つの初期値)
・抽出枠:住民基本台帳記載の20歳以上の男女
・母集団数:91420(=M
・標本数:2037(=n事)
・調査方法:無記名回答による郵送
・調査時期:2001年12月
回収された解答用紙(913)のうち、回答者属性デ
ータが網羅されている有効回答h=787)を対象に、
性別や年齢など回答者属性データに関する比率を
異なる2つの地域スケール(郵便番号別、地区別)
で集計したときの推定値と真値の差を求めた。詳
細な計算結果は当日紹介する。
今回利用したデータは地域別世帯順に並んだ抽
出砕から等間隔に抽出したため、母数が不明な場
合は理論的な式を使った誤差推定ができない。今
回は行政の統計で確認した正確な母比率を用いて
誤差を得た。念のため事後的に、ランダム・サン
プリングの式に標本比率をあてはめて、近似的な
区間推定も行った(図1)。
集計単位別の母比率と、回答比率がわかれば(5)
式によって無回答などによる誤差と集計誤差を区
別できることが確認された。
4.おわりに
本稿では、標本誤差£sがある程度わかっている
ときに非標本誤差£Rと集計誤差を区別して求め
るための評価式を導出した。今回データが限られ
たため、十分な検討ができなかったので、今後さ
らにいろいろなデータで検証作業をおこなう予定
である。分散に基づく標本誤差推定では£sの符号
が不明なためにそれぞれの絶対値の和をとる場合
が多い。このため調査誤差は(1)よりも大きな値
で推定されているが、むしろ予測不可能な£Rの評
価が問題である。本来の調査目的である母集団の
真の値(例えば母比率)が既知でなければ厳密な
意味で∈s、∈い £aの3種類の誤差を回答結果か
ら分離することはできないが、今回の計算例のよ
うに補助情報などによって真の値や標本誤差が既
知の回答者属性データで非標本誤差と集計誤差を
分離することは可能である。少なくとも回答者属
性に関するクロス分析結果を地域全体に一般化す
る場合や、リサンプリング標本精度の評価におい
て利用可能であろう。今後は居住地情報の集約に
よって生じる集計誤差が調査結果にどのように影
響するか、空間データ的な視点からを検討したい。
参考文革
ⅢNHK放送文化研究所世論調査部編(1996):「世
論調査事典」,大空社.
r2】会津大学文化研究センター(2002):会津若市
における生活と文化に関するアンケート調査一基
礎集計−.会津大学文化研究センター研究年報第
8号,pp.92−158.
大戸町 計
‡山町 肘
高野町 計 湊町 朴 町北町 縛指町
一驚町 門巴町 ‡松嶋区 計
朴 計 計 計
囲l 地区別集計における男性比率の差と推定値
−107−
© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.