1
調査データ分析
analysis of survey data
第3回香川大学経済学部 堀 啓造
帰無仮説(
H
0)• 変わりない。
• (男女に)違いがない。同じだ。
• ->
連関がない。3
対立仮説(
H
1)• 変わりがある。
• (男女に)違いがある。同じでない。
• ->
連関がある。• 5%水準 (p<0.05) *
• 1%水準 (p<0.01) **
• 0.1% 水準 (p<0.001) ***
自由度の考え方
• 統計学としてきわめて重要
5
2
×
3の表の場合周辺度数は?
5割高以上 5 割未満高 それ以外
買物好き 136 28 34
買物嫌い 54 21 27
6
ある特定のセルが決まったと き
11 12 13
19
21 22 23
8
10 19 2
0 49 61 30
0
7
周辺度数が決まっていると
• 2 × 3の場合
• (2-1 )× (3-1)=2
• 自由度=2
• 3 × 6の場合
• (3-1) × (6-1)=10
• 自由度=10
自由度が決まると
χ2
値の分布が 決まる• 次の分布図
9
山口和範『よくわかる統計解析 基本と仕組み』秀和システムの
5%水準の考え方
• 分布がわかると確率がわかる。 χ2 値か らどれくらいの確率で起こったことかわ かるので稀な出来事なら H0 を棄却する
。
• 稀でないなら H0 を採択。
• 稀か稀でないかを5%基準で考える。こ れは統計学の慣習。絶対的な値の意味は ないがまあ、そんなもんです。
11
岩原信九郎『教育と心理のため の推計学』文化科学社
13
岩原信九郎『教育と心理のため の推計学』文化科学社
15
以前のデータ
sex 3(b)と ファッションの個性 のクロス表
68 40 108
63.0% 37.0% 100.0%
64 29 93
68.8% 31.2% 100.0%
132 69 201
65.7% 34.3% 100.0%
度数
sex %の 度数
sex %の 度数
sex %の 男
女 sex
合計
人と同じ 人と違う 3(b)ファッションの個性
合計
17
帰無仮説を採択した場合
• 男女とファッションの個性において連関 がない (χ2 (1)= 0.76, p>0.05 )。
•
書き方に注意。検定方法,自由度, χ2値,「 p 値または有意水準 (5% 水 準)」を明かにする。
• 5% 水準で連関がない。
対立仮説を採択した場合
• 男女とファッションの個性において有意 な連関がある (χ2 (1)= 5.76, p<0.05 )。
すなわち,男性のほうが女性に比べて人 と違うファッションをしている。
• どのようになっているかはっきり記す。
• 5% 水準で有意な連関がある。
19
4月23日課題:
χ2
検定を正 しく記せ(4月28日締め切り)
• 買物の好き嫌いと最もドキドキする買物の価格(博報堂生活総合研究所「4つの価格」2002)
百万円単 位以上 それ以下 わからな
い 計
好き 94 72 32 198
嫌い 38 36 28 102
計 132 108 60 300
2
×
3の表の場合もっともバカな買物と思うのは?
博報堂生活総合研究所調査「4つの価格」 (2002)
5割高以上 5 割未満高 それ以外
買物好き 136 28 34
買物嫌い 54 21 27
21
%を入れる
買物が好きか と 価格 のクロス表
136 28 34 198
68.7% 14.1% 17.2% 100.0%
54 21 27 102
52.9% 20.6% 26.5% 100.0%
190 49 61 300
63.3% 16.3% 20.3% 100.0%
好き 嫌い 買物が好きか
合計
5割高以上 5割未満高 その他価格
合計
期待値の計算
買物が好きか と 価格 のクロス表
136 28 34 198
125.4 32.3 40.3 198.0
54 21 27 102
64.6 16.7 20.7 102.0
190 49 61 300
好き 嫌い 買物が好きか
合計
5割高以上 5割未満高 その他価格
合計
23
χ2
検定カイ 乗検定2
7.211a 2 .027
7.121 2 .028
6.457 1 .011
300 Pearson のカイ 乗2
尤度比線型と線型による連関 有効なケースの数
値 自由度 漸近有意確 ( ) 率 両側
0 (.0%) セル は期待度数が 未満です。最小期待度数は 5 16.66 です。
a.
調整済み残差
(絶対値が2.0より大きい か?)
買物が好きか と 価格 のクロス表
136 28 34 198
2.7 -1.4 -1.9
54 21 27 102
-2.7 1.4 1.9
度数調整済み残差 度数調整済み残差 好き
嫌い 買物が好きか
5割高以上 5割未満高 その他価格
合計
25
調整済み残差と%
買物が好きか と 価格 のクロス表
136 28 34 198
68.7% 14.1% 17.2% 100.0%
2.7 -1.4 -1.9
54 21 27 102
52.9% 20.6% 26.5% 100.0%
-2.7 1.4 1.9
190 49 61 300
63.3% 16.3% 20.3% 100.0%
好き 嫌い 買物が好きか
合計
5割高以上 5割未満高価格 その他
合計
調整済み残差の計算
(覚えなくていい)
• (観測度数ー期待度数)/sqrt(期待度 数)/sqrt((1-ヨコの周辺度数/総 度数)・(1-タテの周辺度数/総度数))
• ( セル11) 2.680908
• (セル12) -1.43088
• (セル13) -1.89566
• 正規分布しているものとしてズレをチェック
。
• p=0.05 -> 1.96=2.0, p=0.01 -> 2.57 =2.6
27
調整済み残差の利用
• χ2 検定において有意な連関があった場合
,どのセルにおいて違いがあると言える のかを明らかにする。
• ただし,厳密な検定には他の方法を使う
。
• SPSS において出力され簡単に利用でき
るのでこれを使う。これを使わない場合 よりは精度が高い。
残差を含めた結果の記述
• 買物の好き嫌いとバカな買物と思う価 格には有意な連関がある( χ2(2)=7.211,
p<0.05) 。残差分析を行った結果,買物
好きは買物嫌いに比べ5割高以上の価 格をバカな買物と考える率が高い。
• (考察のところで,これは仮説に反す る(と一致する)ものである。などの 考察を加える)。
29
「わからない」と「価格をい った」群の2群に分けるとど
ういう結果になるか
買物好きか と ドキドキする買物価格 のクロス表
166 32 198
83.8% 16.2% 100.0%
74 28 102
72.5% 27.5% 100.0%
240 60 300
80.0% 20.0% 100.0%
好き 嫌い 買物好き
か 合計
価格あり わからない ドキドキする買物価格
合計
調査と実験
•
実験は独立変数をコントロールする。• 朝 コーヒーを飲ませる
• 朝 コーヒーを飲ませない
•
調査• 朝 コーヒーを飲んだ人
• 朝 コーヒーを飲まなかった人
• 調査ではほかの要因が紛れていることが普通。
Ex 朝食を食べる、食べない
• 実験ではほかの要因が紛れることをなるべく少 なくする。