URL: http://www.sal.tohoku.ac.jp/~tsigeto/statu/ 作成:田中重人 (准教授)
現代日本論演習「統計分析の基礎」
3 年生対象:2012 年度 5 セメスタ <火4>コンピュータ実習室 (文学部本館 7F 711-2) 授業コード=LB52407『講義概要』記載内容
+α
◆ 講義題目:統計分析の基礎 ◆ 到達目標:(1) 統計分析の基礎的な手法を理解する; (2) 実際に統計分析をできるようになる ◆ 授業内容:意識調査・テスト・実験などのデータはどのように分析すればいいでしょうか。この授 業では、小規模の標本調査を念頭において、統計分析の基礎的な手法を学びます。これまで統計的な 分析をおこなったことのない人を対象に、初歩から講義します。同時に、コンピュータを実際に使っ て、毎回データ分析の実習をおこないます。 ◇ 成績評価の方法:各回の授業中の課題 (50%)、中間試験 (20%)、期末レポート (30%) を合計して評 価する。 ◇ テキスト:吉田寿夫 (1998)『本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の 本』北大路書房。 卒業論文等で質問紙調査を予定している者は、 5 セメスタ開講の 現代日本論演習「質問紙法の基礎」 (金 2) および 6 セメスタ開講の 現代日本論演習「実践的統計分析法」 (火 4:大学院と合同) も受講す ることがのぞましい。授業の概要
1. イントロダクション (4/10) 2. SPSS 入門 (4/17) 3. 統計分析の基礎 (4/24) 4. 記述統計(1): クロス表の分析 (5/8~5/29) 5. 中間試験 (6/5) 6. 記述統計(2): 平均値の比較 (6/12~6/26) 7. 推測統計 (7/3~7/24) 8. 期末レポート (8/14 提出) → 9/11 以降に返却 ( )内の日付は、学期前のおおよその計画 (実際の授業の進行状況によって前後にずれることがある)受講者との連絡とフィードバック
• 毎回の課題・宿題は、コメントをつけて返却します (内容によっては再提出を求めることもあ ります)。 • 中間試験、期末レポートは、採点後に返却します。 • 課題・宿題は、特に指示のあるものをのぞき、ISTU (東北大学インターネットスクール: http://www.istu.jp) のレポート機能による提出とします。 提出期限は、原則として 授業前日 (月 曜) 正午 (12:00) です。 • ISTU には、この授業の「受講申請」をしておいてください (受講者情報の自動的登録は、履 修登録完了以降) • 研究生などで東北大ID のないかたは、所属学部の教務係に相談してみてください。 • 教員からの連絡は、ISTU「お知らせ」「掲示板」のほか、個人ブログ http://tsigeto.blog.fc2.com/blog-category-11.html (RSS フィード利用可) に出る場合があります • オフィス・アワーは定めていません。教員への相談は、適当な時間に予約をとってください。1. イントロダクション • 授業の概要・スケジュール・評価方法 • 部屋とコンピュータの使いかた • SPSS の起動 • データ行列 (データセット) • 模擬データ入力実習 2. データ配布・SPSS 入門 • データの配布 • SPSS の概要 • SPSS コマンド・シンタックス • メニューによるシンタックス作成 • 変数値の再割り当て • frequencies コマンドと度数分布表 • Excel によるグラフ作成 • 印刷 3. 統計分析の基礎 [序章] • 実験と観察 • データの記述 • データの種類 4. 記述統計 (1): 度数分布とクロス表 4.1. 度数分布表 [1 章] • 度数分布表 • パーセンタイル、中央値、四分値 • 度数分布表のグループ化 4.2. クロス表 [4 章] • クロス表表記 • 行と列の% • 周辺度数 (marginal distribution) • crosstabs コマンドとそのオプション 4.3. 無関連状態と期待度数 [4 章] • Φ係数 • 期待度数・残差・連関係数 • クロス表とグラフの書きかた 5. 中間試験 6. 記述統計 (2): 平均値の比較 6.1. 平均と分散 [2 章] • データの種類:復習 • 順序尺度と間隔尺度の変換 • 平均値 • 分散と標準偏差 • 分布と外れ値 6.2. 平均値の層別比較 [5 章] • 層別平均 • エフェクト・サイズ • 相関比から分散分析へ • 表とグラフの書きかた 7. 推測統計 7.1. 誤差の評価 [6 章] • データの記述と誤差の評価 • 標本抽出の4 段階モデル • 無作為抽出 • 非標本誤差 • 標本誤差の統計的推測 7.2. 平均値の推定 [8 章] • 平均値の点推定 • 区間推定とt 分布 • 平均値の差の区間推定 • エフェクトサイズ・相関比と区間推定 7.3. 統計的検定 [8 章] • 区間推定の簡易表記としての有意水準 • 平均値の差のt 検定 • 連関係数のχ2 検定 • 分散分析とF 検定 • 検定結果の表記 8. 期末レポート [ ] 内は、教科書の参照箇所
2012.4.10
現代日本論演習
(田中重人)
受講登録フォーム
氏名 (よみがな): 学年: 学籍番号: 所属 (文学部日本語教育学専修以外の場合): 研究内容: ・自宅でパソコンを使えますか? ある / ない ・SPSS を使った経験がありますか? ある / ない ・コンピュータ・プログラムを作成したり、プログラミングの授業を受けたりしたことが ありますか? ある / ない ある場合 → 言語名 ( ) ・つぎのうち利用したことがあるものは? ISTU / DCW / SRP 以下は採点用 4/17 4/24 5/8 5/15 5/22 5/29 6/5 6/12 6/19 6/26 7/3 7/10 7/17 7/24 宿題 課題 参加 中間 期末数学的予備知識の調査 (成績評価には関係ありません)
(1) 1 次方程式 y = 0.5x + 1.2 をグラフに書いたとき、傾き (gradient) と切片 (intercept) は それぞれいくつか。
傾き =_______ ; 切片 =______
(2) 「必要十分条件」(necessary and sufficient condition) とは何か。簡単に説明せよ。
(3) 「偏差値」はどういう目的のために使われるか。またどうやって求めるか。簡単に説 明せよ (4) つぎの数式の値を求めよ。計算のプロセスがわかるように解答すること 10
Σ
k
=
k = 1URL: http://www.sal.tohoku.ac.jp/~tsigeto/statu/ 作成:田中重人 (准教授) [現代日本論演習 統計分析の基礎] 第 1 回 (2010-04-10)
受講者の興味と数学的知識の調査
→別紙コンピュータ実習室について
入室・退室
学生証が必要 (正規の学生以外は、登録申し込みが必要。ない人は、教務係で臨時カードを借 りること)。 文学部正規学生以外 (研究生や他学部の学生など) は登録が必要。 土足・飲食・喫煙厳禁。 退出時には必要事項を紙に記入。コンピュータの起動と終了
使いはじめるときは…… • コンピュータ本体の電源を入れる • 表示されるお知らせをひととおりよむこと • キーボード右上の「NumLock」ランプがついているか確認 使い終えるときは…… • 「マイドキュメント」などに保存してある自分のファイルを削除 • 画面左下の「スタートメニュー」から「シャットダウン」を選択 • コンピュータ本体の電源が切れたことを確認 • USB スティック・メモリなどをわすれないことファイルの保存場所について
教室のコンピュータの内蔵ディスクには、個人のファイルを置いてはならない。 授業中に必要 なファイルは「マイドキュメント」フォルダに一時的に保存してよいが、 授業が終わったら自 分のスティック・メモリ等にコピーして、 内蔵ディスクのほうのファイルは削除すること。模擬データ入力実習
SPSS の起動
スタートメニューから「プログラム」→「IBM SPSS Statistics」→「IBM SPSS Statistics 19」で起動する。 (※ここで何かエラーメッセージが出るかもしれないが、気にせず「続行」 または「OK」する。) 「どのような作業を行いますか?」ときかれたら「データに入力」をチェックして「OK」。
データ入力
配布した架空の回答票をもとに、データを入力してみよう。 まず変数を定義 • 「データエディタ」ウインドウのいちばん下の「変数ビュー」タブに切り替える • 変数名を必要なだけつくる。 今回は a, b, ..., e とでもしておこう。 変数名は自分 がわかればどんなものでもよい。 日本語も使える。 なお、変数名以外のフィールドは 入力しなくてよい • 書き終わったら「データ ビュー」タブに切り替えて、 いちばん上の行に変数名がなら んでいることを確認する。 つづいてデータを入力していく。 今回は 3 人分のデータを用意してあって、変数は 5 個なので、 3×5 の行列型のデータができるはずである。 適当な名前で「マイドキュメント」内に保存してみる。 (ほかのフォルダに保存してはならな い。) 「マイドキュメント」を開いて、SPSS データファイル (なんとか.sav) ができていることをた しかめる。 このデータファイルは授業終了時に削除すること。 (次回以降の授業ではつかわないので、コ ピーしておく必要はない。) ※ この方式は SPSS でデータを入力するときのいちばん簡便な方法であるが、 大きなデータは あつかいにくいので、テキストファイルでデータを用意しておくのがふつうである。̆̆̆̆̆̆̆̆̆ 1 ̆̆̆̆̆̆̆̆̆ 2012. 4.17 ઍᣣᧄ⺰Ṷ⠌ (↰ਛ㊀ੱ) ╙ 2 ⻠ޟSPSS 㐷ޠ⋡ᰴ 1. ࠺࠲㈩Ꮣ 2. ᮡᧄ 3. SPSS ߩၮ␆⍮⼂ ̆̆̆̆̆̆̆̆̆ 2 ̆̆̆̆̆̆̆̆̆ ޣ࠺࠲ߩ㈩Ꮣޤ 1995 ᐕ SSM ⺞ᩏ B ߩ৻ㇱ ڎ ో࿖߆ࠄ 70 ᱦએਅߩᮭ⠪ࠍ ጀൻ 2 Ბήὑ ڎ ⸰㕙ធᴺ cf. (2000)ޡᣣᧄߩ㓏ጀࠪࠬ࠹ࡓޢ(ో 6 Ꮞ) ᧲੩ᄢቇ ળޕ ⺞ᩏߪ http://srdq.hus.osaka-u.ac.jp/PDF/SSM95BJ.pdf ߦ߽ࠆ ̆̆̆̆̆̆̆̆̆ 3 ̆̆̆̆̆̆̆̆̆ ڎ ᗧ⼂㗄⋡ߣၮᧄ⊛ዻᕈߦ㒢ቯ (⺞ᩏߩශߪ࠺࠲࠶࠻ߦߥ㗄⋡) ڎ 250 ࠤࠬࠍࡦ࠳ࡓߦ ڎᵹߒߥࠃ߁ߦ ڎ ᄌᢙࡌ࡞ߪ⩲㊁ (ᣣᧄᄢቇ) ᳁ߦࠃࠆ ̆̆̆̆̆̆̆̆̆ 4 ̆̆̆̆̆̆̆̆̆ ڎ Ფ࿁ߩᬺߢ߁ߩߢޔ ᔓࠇߥߎߣ (⺞ᩏ߽) ڎ ᦼᧃࡐ࠻ឭᤨߦ㒰 ̆̆̆̆̆̆̆̆̆ 5 ̆̆̆̆̆̆̆̆̆ ޣήὑޤ Უ㓸࿅߆ࠄ⸘↹ᮡᧄࠍㆬ߱㓙ߦޔ Უ㓸࿅ߦ߰ߊ߹ࠇࠆߔߴߡߩ ߩ⏕₸߇╬ߒߊߥࠆࠃ߁ߦ ߔࠆ (random sampling) Îޟ⏕₸ᮡᧄޠ(probability sample) ̆̆̆̆̆̆̆̆̆ 6 ̆̆̆̆̆̆̆̆̆ ⛔⸘⊛ߥផ᷹ߪޔ⏕₸ᮡᧄࠍ೨ឭߣߔࠆ ታ㓙ߩ⺞ᩏߢℂᗐ⊛ߥᮡᧄ߇ߢ߈ࠆߎߣߪ߹ߕߥޕ ߹ߚ⸘↹ᮡᧄߩߥ߆߆ࠄήല࿁╵߇ߢࠆߩߢޔ ήὑߢߪߥ⺋Ꮕ߇߆ߥࠄߕ⊒↢ߔࠆޕ ߎߩ⺋Ꮕߪ⛔⸘⊛ߦߪಣℂߢ߈ߥߩߢޔߦផ᷹ߔࠆ ߤߩጀࠍㆊߦઍߒߡࠆ߆ࠍᛠីߔࠆ ߅ߥߓᲣ㓸࿅ࠍኻ⽎ߦߒߚ⺞ᩏߣᲧセߔࠆ ̆̆̆̆̆̆̆̆̆ 7 ̆̆̆̆̆̆̆̆̆ ޣጀൻ 2 Ბήὑޤ ߹ߕޟὐޠࠍ (╙ 1 ᰴ) ߘߩ㓙ޔၞㇺᏒⷙᮨ╬ߢὐᢙࠍ ഀࠅᒰߡߡ߅ߊ (ጀൻ) ߘߩὐߩบᏭ߆ࠄੱࠍ (╙ 2 ᰴ) ̆̆̆̆̆̆̆̆̆ 8 ̆̆̆̆̆̆̆̆̆ ޣ࠺࠲࠶࠻ޤ ڎࠤࠤࠬ ᄌᢙ ڎᄌᄌᢙߪᄌᢙฬߢ▤ℂ ڎᄌᄌᢙฬએᄖߦޟࡌ࡞ޠ ڎ ή࿁╵ߥߤߩᰳ៊୯ (.) ̆̆̆̆̆̆̆̆̆ 9 ̆̆̆̆̆̆̆̆̆ ޣSPSS ߩ࠙ࠗࡦ࠼࠙᭴ᚑޤ ٨ ࠺࠲ࠛ࠺ࠖ࠲ ٨ࠪࠪࡦ࠲࠶ࠢࠬࠛ࠺ࠖ࠲ ٨ജࡆࡘࠕ ̆̆̆̆̆̆̆̆̆ 10 ̆̆̆̆̆̆̆̆̆ ޣࡔ࠾ࡘߣࠪࡦ࠲࠶ࠢࠬޤ ڎಽಽᨆᚻᴺࠍ߃ࠄ߱ ڎᔅᔅⷐⷐߥࠝࠝࡊࡊ࡚࡚ࠪࡦࠍᜰᜰቯ ڎޟޟ11--ޠࠍࠢ࠶ࠢ ̪ฎࡃ࡚ࠫࡦߢߪޟ⾍ࠅઃߌޠߢࠪࡦ ࠲࠶ࠢࠬࠍᚑߒߡಽᨆߩ⸥㍳ࠍᱷߒߚ߶ ߁߇ࠃᔅⷐㇱಽࠍㆬᛯߒߡታⴕߢ߈ࠆ ̆̆̆̆̆̆̆̆̆ 11 ̆̆̆̆̆̆̆̆̆ ޣജࡆࡘࠕޤ ڎ Ꮐߦ⋡ᰴޔฝߦജౝኈ ڎ ࠛ␜߽ߎߎߦࠆ ڎ 8GT ߢߪࠪࡦ࠲࠶߽ࠢࠬ␜ߐࠇࠆ ޣශޤ ڎᏀߩ⋡ᰴߢㆬᛯ ڎ 㔚Ḯߩࠇ߆ߚ ڎ ജవߩಾࠅᦧ߃ ڎ ࡚ࠫࡉߩ⏕ขࠅᶖߒ ڎ ශ೨ߦࡊࡆࡘ ڎ ࠲ࠗ࡞ශ (2 㕙, 4 㕙, ...) ̆̆̆̆̆̆̆̆̆ 12 ̆̆̆̆̆̆̆̆̆ ޣߘߩઁߩࠕࡊࡊࠤ࡚࡚ࠪࡦޤ ٨ ᢥᦠᚑ (Word) ٨ ⸘▚ (Excel) ٨ 㔚ථ (ࠕࠢࠨ) SPSS ߩജࡆࡘࠕ߆ࠄࠍ Excel ߿ Wordߦ⾍ࠅઃߌࠄࠇࠆ ̆̆̆̆̆̆̆̆̆ 13 ̆̆̆̆̆̆̆̆̆ ޣᄌᢙ୯ߩౣഀࠅᒰߡޤ ࠺࠲ࠛ࠺ࠖ࠲ߩࡔ࠾ࡘࡃࡃߢ ٨ޟޟᄌ឵ޠψޟ୯ߩౣഀࠅᒰߡޠ ψޟઁߩᄌᢙ߳ޠ ٨ᄌᄌ឵వᄌᢙߩฬ೨ࠍߟߌࠆࠆ ̆̆̆̆̆̆̆̆̆ 14 ̆̆̆̆̆̆̆̆̆ ٨ޟޟ߹ߢߩ୯ߣᣂߒ୯ޠ ٨୯୯ߩ⚵ࠍᜰᜰቯߒߚࠄޟ⛯ⴕޠޠ ٨ࠪࠪࡦࡦ࠲࠲࠶࠶ࠢࠢࠬࠬࠍࠍ⾍ઃߌߡߡታታⴕ ٨ᣂᄌᢙߩᐲᢙಽᏓࠍ⏕ ٨ 㗴߇ߥߌߌࠇ߫ޔฬ೨ࠍߟߌߡߡ ࠺ ࠺࠲࠲࠶࠶࠻࠻ࠍࠍሽ ̆̆̆̆̆̆̆̆̆ 15 ̆̆̆̆̆̆̆̆̆ ޣታ⠌ޤ ḩᐕ㦂 (Q1_2a) ࠍㆡᒰߥᐕ㦂ߦಾߞߡ ᐲᢙಽᏓࠍജߔࠆޕജࡆࡘࠕߩౝኈ ࠍሽߒߡ .spv ࡈࠔࠗ࡞ࠍឭ
̆̆̆̆̆̆̆̆̆ 1 ̆̆̆̆̆̆̆̆̆ 2012.4.24 ઍᣣᧄ⺰Ṷ⠌ (↰ਛ㊀ੱ) ╙ 3 ⻠ޟ⛔⸘ಽᨆߩၮ␆ޠ
1. ዤᐲ᳓Ḱ
2. ᐲᢙಽᏓ
3. ⚥Ⓧ㧑ߣࡄࡦ࠲ࠗ࡞
4. ࠣࡈߩ↪
̆̆̆̆̆̆̆̆̆ 2 ̆̆̆̆̆̆̆̆̆ޣ⺖㗴ޤ
ᢎ⑼ᦠ pp. 7–16 ࠍ߽ߣߦޔ
ޟ࠺࠲ߩ⒳㘃ޠߩಽ㘃ߦߟߡ
߹ߣࠃޕ
̆̆̆̆̆̆̆̆̆ 3 ̆̆̆̆̆̆̆̆̆ޣዤᐲ᳓Ḱޤ
٨Ყ₸ዤᐲ (ratio scale)
٨㑆㓒ዤᐲ (interval —)
٨㗅ᐨዤᐲ (ordinal —)
٨ฬ⟵ዤᐲ (nominal —)
(⾰⊛ᄌᢙߣ߽)
(ᢎ⑼ᦠ p. 8) ̆̆̆̆̆̆̆̆̆ 4 ̆̆̆̆̆̆̆̆̆ڎ
ߩዤᐲߩ߶߁߇
ߟ߆߃ࠆṶ▚߇⼾ን
ڎ
ߩዤᐲߪਅߩዤᐲߩ․
ᓽࠍߨ߃ߡࠆ
ψಽᨆᚻᴺߩㆬᛯ߇߭ࠈ
̆̆̆̆̆̆̆̆̆ 5 ̆̆̆̆̆̆̆̆̆⑳ߚߜ߇᷹ቯߔࠆ߽ߩߪߚߡ
㗅ᐨዤᐲએਅߢࠆ
ߩዤᐲ߳ߩᄌ឵ߦߪ
৻ቯߩℂ⺰⊛ᩮ߇ᔅⷐ
̆̆̆̆̆̆̆̆̆ 6 ̆̆̆̆̆̆̆̆̆ޣᐲᢙಽᏓޤ
Frequencies ࠦࡑࡦ࠼ޟಽᨆޠ
ψޟ⸥ㅀ⛔⸘ޠ
ψޟᐲᢙಽᏓޠ
̆̆̆̆̆̆̆̆̆ 7 ̆̆̆̆̆̆̆̆̆ജ㧦
ڎᐲ
ᐲᢙ
ڎ⋧
⋧ኻᐲᢙ 㧔㧑㧕
ڎ⚥
⚥Ⓧᐲᢙ⚥Ⓧ⋧ኻᐲᢙ
ڎᰳ
ᰳ៊୯ߩߟ߆
ᢎ⑼ᦠp. 27–31 ̆̆̆̆̆̆̆̆̆ 8 ̆̆̆̆̆̆̆̆̆ޣ⚥Ⓧ㧑ߣࡄࡦ࠲ࠗ࡞ޤ
٤ 㗅ᐨߦᗧ߇ࠆ႐วߩߺല ٤ Percentile(= 㧑ὐ) ٤ ਛᄩ୯ (median) = 50㧑ὐ ٤ ޟഀࠅಾࠇߡߒ߹߁ޠ႐วߪਛὐࠍߣࠆ (ᢎ⑼ᦠ p. 43) ٤ หߓ୯߇ਗ߱႐วߪᄙዋߩᠲ߇ᔅⷐ (ᢅᤘศ↰ኼᄦ(✬) (1990)ޡᔃℂቇߩߚߩ ࠺࠲⸃ᨆ࠹ࠢ࠾ࠞ࡞ࡉ࠶ࠢޢർᄢ〝ᦠᚱ. p. 15) ̆̆̆̆̆̆̆̆̆ 9 ̆̆̆̆̆̆̆̆̆ޣኋ㗴ޤ
(1) ኅᣖ (q44_3) ߦߟߡޔᐲᢙಽᏓ ࠍജߒޔਛᄩ୯ޔ25%ὐޔ75%ὐࠍ᳞ࠃޕ (2) ߎߩᄌᢙߪޔߤߩዤᐲ᳓Ḱߦߚࠆ߆ޕ (3) ߎߩᄌᢙࠍᲧ₸ዤᐲߣߒߡᛒ߃ࠆࠃ߁ᄌ ᢙ୯ߩౣഀࠅᒰߡࠍ߅ߎߥޔࠪࡦ࠲࠶ࠢࠬ ߣᐲᢙಽᏓࠍജߖࠃޕ 5/7 12:00 ߹ߢߦ IST U ߢឭ̆̆̆̆̆̆̆̆̆ 1 ̆̆̆̆̆̆̆̆̆ 2012.5.8 ઍᣣᧄ⺰Ṷ⠌ (↰ਛ㊀ੱ) ╙ 4 ⻠ޟࠣࡈߩ↪ޠ 1. ᄌᢙ୯ߩౣഀࠅᒰߡ (ౣ) 2. ࠣࡈࡅࠬ࠻ࠣࡓ ᐲᢙࡐࠧࡦ ̆̆̆̆̆̆̆̆̆ 2 ̆̆̆̆̆̆̆̆̆ ޣᄌᢙ୯ߩౣഀࠅᒰߡޤ ࠍᲧ₸ዤᐲߩ୯ߦഀࠅᒰߡߥ߅ߔߦߪ ψ ᄌᢙ୯ߩౣഀࠅᒰߡ ̪ SSM ⺞ᩏ࠺࠲ᚑᤨߦޔߩ୯ߪ 17: 2300 ~ 2800 18: 2800 ~ 3300 ... ߩࠃ߁ߦࠦ࠼ߐࠇߡࠆޕ ̆̆̆̆̆̆̆̆̆ 3 ̆̆̆̆̆̆̆̆̆ ޟቇᱧޠߩ႐วߪߤ߁ߔࠇ߫ࠃ߆? 1 ψ 6 2 ψ 8 3, 4, 5 ψ 11 6 ψ 14 7 ψ 17 12 ψ 9 13 ψ 12 14 ψ 14 15 ψ 16 16 ψ 18 ̆̆̆̆̆̆̆̆̆ 4 ̆̆̆̆̆̆̆̆̆ ޣࠣࡈߩ↪ޤ ٨ (table)̖̖ᱜ⏕ߥᢙ୯߇ࠊ߆ࠆ߇ޔో ߩะࠍ⺒ߺขࠆߦߪᾫ✵߇ᔅⷐ ٨ࠣࠣࡈ (graph/chart)̖̖ోߩะ߇◲ නߦ⺒ߺขࠇࠆ߇ޔᱜ⏕ߐߪ‶†ߦߥࠆ ೋᔃߩ߁ߜߪޔߣࠣࡈߩਔᣇࠍᚑߒߡ ⺒ࠎߢߊߩ߇ࠃ ̆̆̆̆̆̆̆̆̆ 5 ̆̆̆̆̆̆̆̆̆ ޣࠣࡈߣࡅࠬ࠻ࠣࡓޤ ٨ࠣࡈ̖̖ห჻ߩ㑆ߦⓨ⊕ ࠍߌࠆޕ㜞ߐ (㐳ߐ) ࠍࠃޕ ٨histogram (ᩇࠣࡈ)̖̖ᩇߩ 㑆㓒ࠍߌߥޕ㕙Ⓧࠍࠃޕ ̪❑ゲߪᐲᢙ߹ߚߪ㧑 ̆̆̆̆̆̆̆̆̆ 6 ̆̆̆̆̆̆̆̆̆ ڎㅪㅪ⛯㊂ࠍ㓏⚖ಽߌߒߚ႐ว ψ ࡅࠬ࠻ࠣࡓ ڎߘߘࠇએᄖߩ႐ว (㔌ᢔ㊂㧛 ฬ⟵ዤᐲ) ψ ࠣࡈ ̪ᐲᢙᄙⷺᒻ (polygon) ߪⶄᢙߩᄌᢙߩಽ ᏓࠍᲧセߔࠆߣ߈ߦଢޕ (ᢎ⑼ᦠ p. 32–36) ̆̆̆̆̆̆̆̆̆ 7 ̆̆̆̆̆̆̆̆̆ SPSSߢߪ histogram ߇ᦠ߈ߦߊޕ ڎ recode ߢᢛᒻߒߚߢᐲᢙಽᏓߩࡔ࠾ ࡘߢޟ࿑…ޠᜰቯޕࠣࡈࠍᦠߊ ڎࠣࡈψࠟࠪ࠳ࠗࠕࡠࠣߩޟࡅࠬ࠻ࠣ ࡓޠߢߪ╬㑆㓒ߩ㑆ߦಽഀߒߡߊࠇࠆ 䉫䊤䊐 䊍䉴䊃䉫䊤䊛 ᐲᢙ䊘䊥䉯䊮 ̆̆̆̆̆̆̆̆̆ 8 ̆̆̆̆̆̆̆̆̆ Excel ࠍ߁႐ว㧦 ڎ ᐲᢙಽᏓࠍജ (ᔅⷐߥࠄ୯ࠍౣഀࠅᒰߡ) ڎ ࠍ Excel ߦࠦࡇߔࠆ ڎ ᔅⷐߥࠄᄌᢙ୯ߩࡌ࡞ࠍߟߌࠆ (ᮮゲ↪) ڎ ࡅࠬ࠻ࠣࡓ߿ᐲᢙᄙⷺᒻߩߣ߈ߪ ਔ┵ߦᐲᢙ 0 ߩⴕࠍߟߊࠆ ̆̆̆̆̆̆̆̆̆ 9 ̆̆̆̆̆̆̆̆̆ ㅢᏱߪޔ❑ߩࠣࡈޕ ᐲᢙࡐࠧࡦߪޔ᛬ࠇ✢ࠣࡈߢឬߊޕ ࠣࡈࠍࡅࠬ࠻ࠣࡓ㘑ߦߔࠆߦߪ ڎ ࠣࡈߩߩߢฝࠢ࠶ࠢ ψޟ࠺࠲♽ߩᦠᑼ⸳ቯޠ ψޟⷐ⚛ߩ㑆㓒ޠࠍ 0 ߦߔࠆ ̪ߚ⋡߇ߘࠇࠄߒߊߥࠆߛߌߥߩߢޔᮮゲߩࡌ࡞߿㓏 ⚖ߩ⺞ᢛߪߕ߆ߒޕᧄᒰߩࡅࠬ࠻ࠣࡓࠍᦠߊߦ ߪޔࠣࡈኾ↪ߩ࠰ࡈ࠻࠙ࠛࠕࠍ߁ޕ ̆̆̆̆̆̆̆̆̆ 10 ̆̆̆̆̆̆̆̆̆ ޣታ⠌ޤ ᐕ㦂ߦߟߡ 5 ᱦೞߺߩ ࡅࠬ࠻ࠣࡓ (ࠄߒࠣࡈ) ࠍᚑߔࠆ (21-25, 26-30,… ߩࠃ߁ߦࡌ࡞ࠍߟߌࠆ) ̆̆̆̆̆̆̆̆̆ 11 ̆̆̆̆̆̆̆̆̆ ޣኋ㗴ޤ 27 ߩ㗄⋡߆ࠄ߰ߚߟࠍ߃ࠄ߮ޔ ᐲᢙࡐࠧࡦࠍឬߡᲧセߖࠃޕ ࠣࡈߦࠦࡔࡦ࠻ࠍߟߌߡឭ (ISTU ߢ 5/14 12:00 ߹ߢ)
――――――――― 1 ―――――――――
2012.5.15 現代日本論演習 (田中重人)
第 5 講「クロス表分析の基礎」
【キーワード】
行 (row) 列 (column) セル (cell)
周辺度数 (marginal frequency)
行% (row percent) 列% (column percent)
――――――――― 2 ―――――――――
【度数分布表の比較】
● データエディタのメニューで
「データ」→「ファイルの分割」
→「グループの比較」
● 度数分布表を出力
――――――――― 3 ―――――――――● 「データ」→「ファイルの分割」
→「すべてのケースを分析」
でもとにもどしておく
――――――――― 4 ―――――――――【クロス表の基本型】
質的変数 (名義尺度) 同士の関連
についての基本的な分析法
(教科書 第 4 章) ――――――――― 5 ――――――――― β α 1 2 3 合計 1 a b c a+b+c 2 d e f d+e+f 3 g h i g+h+i合計 a+d+g b+e+h c+f+i N
周辺度数 行 列 ――――――――― 6 ―――――――――
【Crosstabs コマンド】
性別×「性別による不公平」
のクロス表を書いてみよう
「分析」→「記述統計」→「クロス集計表」 ――――――――― 7 ―――――――――【行%と列%】
「クロス集計表」メニューで「セル」にパー センテージ (行・列) を追加★ 行%,列%のつかいわけは
説明→被説明の関係に対応
行→列の説明をすることが多い★ 周辺度数の%とも比較する
――――――――― 8 ―――――――――【グラフを書いてみる】
★ クロス表は帯 (積み上げ棒)
グラフで表現することが多い
SPSS ではうまくかけない。コピーして Excel に貼付けてグラフを書くのがよい★ 度数にも注意
――――――――― 9 ―――――――――【課題】
性別×適当な変数でクロス表作成、 %からわかることをコメントする。 表・グラフにコメントをつけて提出 (ISTU で 5/21 12:00 まで) 次回 (5/22) は観察室で授業̆̆̆̆̆̆̆̆̆ 1 ̆̆̆̆̆̆̆̆̆ 2012.5.22 ઍᣣᧄ⺰Ṷ⠌ (↰ਛ㊀ੱ) ╙ 6 ⻠ޟǾଥᢙޠ 1. ⥄↱ᐲ (degree of freedom) 2. ࠢࡠࠬಽᨆߩ߰ߚߟߩ♽ 3. 22 ࠢࡠࠬߩᕈ⾰ 4. Ǿଥᢙ (phi coefficient) ̆̆̆̆̆̆̆̆̆ 2 ̆̆̆̆̆̆̆̆̆
ޣ⥄↱ᐲޤ
22 ࠢࡠࠬߢߪޔㄝᐲᢙ߇ᚲਈߥࠄޔ 1 ߟߩ࡞ᐲᢙ߇߹ࠇ߫߶߆߽߹ࠆ Ǫ ǩ 1 2 ว⸘ 1 a g㧙a g 2 i㧙a h㧙i㧗a h ว⸘ i j N ̆̆̆̆̆̆̆̆̆ 3 ̆̆̆̆̆̆̆̆̆ 33 ࠢࡠࠬ㧦࡞ᐲᢙ߇ 4 ߟ߹ࠇ̖߫ Ǫ ǩ 1 2 㧟 ว⸘ 1 f 2 g 3 h ว⸘ i j m N kl ࠢࡠࠬߩ⥄↱ᐲ (degree of freedom)d.f. = (k㧙1)(l㧙1)
̆̆̆̆̆̆̆̆̆ 4 ̆̆̆̆̆̆̆̆̆ޣࠢࡠࠬಽᨆߩ 2 ߟߩ♽ޤ
٨ޟ
ޟ㧑ߩᏅޠ♽ (ᦼᓙᐲᢙߣߩᏅ)
㧩ㅪ㑐ଥᢙ
٨ࠝ
ࠝ࠶࠭Ყ♽ (ਸ਼ᴺࡕ࠺࡞)
㧩ኻᢙ✢ᒻಽᨆޔࡠࠫ࠶࠻ಽᨆ
ߎߩᬺߢขࠅߍࠆߩߪ೨⠪ߛߌ ̆̆̆̆̆̆̆̆̆ 5 ̆̆̆̆̆̆̆̆̆ޣ22 ࠢࡠࠬߩᕈ⾰ޤ
એਅޔߟ߉ߩ⸥ภᴺࠍ߁
Ǫ ǩ 1 2 ว⸘ 1 a c g 2 b d h ว⸘ i j N ̆̆̆̆̆̆̆̆̆ 6 ̆̆̆̆̆̆̆̆̆ (1) ⴕ%ߪ 1 ߦߟߡᲧセߔࠇ߫ࠃ㧦 g c h d h b g a (2) ⴕ㧑ߩᏅ߇ࡠߥࠄ%ߩᏅ߽ࡠ (3) ⴕ㧑ߩᏅ߇ 100 ߥࠄ%ߩᏅ߽ 100 (4)g=i or g=j ߥࠄⴕ㧑ߩᏅߣ%ߩᏅߪหߓ㧦 j c i a h b g a ̆̆̆̆̆̆̆̆̆ 7 ̆̆̆̆̆̆̆̆̆ (5) ߎࠇࠄએᄖߩ႐วޔⴕ㧑ߩᏅߣ%ߩᏅ ߪߜ߇߁୯ߦߥࠆ ̆̆̆̆̆̆̆̆̆ 8 ̆̆̆̆̆̆̆̆̆ ( 1) ⴕ㧑ߩᏅ㧩㧤㧑 60% 40% 100% 52% 48% 100% ( 2) ⴕߣ߽㧑ߦᏅߥߒ 52 48 100 52.0% 48.0% 100.0% 66.7% 66.7% 26 24 50 52.0% 48.0% 100.0% 33.3% 33.3% 78 72 150 52.0% 48.0% 100.0% ( 3) ⴕߣ߽ 10㧑ߩᏅ 70 30 100 70.0% 30.0% 100.0% 70.0% 60.0% 30 20 50 60.0% 40.0% 100.0% 30.0% 40.0% 100 50 150 52.0% 48.0% 100.0% ̆̆̆̆̆̆̆̆̆ 9 ̆̆̆̆̆̆̆̆̆ޣǾଥᢙޤ
22 ࠢࡠࠬߩޟㅪ㑐ޠߩዤᐲ ghij bc ad I ߎߩଥᢙߩᗧߪ? (ಽሶߛߌขࠅߒߡ⠨߃ߡߺࠃ߁)――――――――― 1 ――――――――― 2012.5.29 現代日本論演習 (田中重人) 第7 講「連関係数」 【キーワード】 連関 (association), 独立 (independence), 期待度数 (expected frequency) ――――――――― 2 ――――――――― 【φ係数の性質】 1. φ=交差積の差 / √(周辺度数の積) 2. φ= 相関係数の特殊ケース (→ 2学期授業) 3. |φ| = 行%差と列%差の中間の値 (教科書 p. 103 表 4-1 について計算してみよう) ――――――――― 3 ――――――――― 4. φ2 = 標準残差の 2 乗の総計 / N (→ 2×2 以上のクロス表に拡張できる) ――――――――― 4 ――――――――― 【期待度数とφ係数】 ※記号法は前回と同じ 独立 (無関連):a/b = c/d 期待度数 (expected frequency) 周辺度数を固定しておいて独立なクロス表 を作ったとき、各セルに入る度数: gi/N gj/N hi/N hj/N ――――――――― 5 ――――――――― 各セルの期待度数は? 100 100.0% 50 100.0% 78 72 150 52.0% 48.0% 100.0% ――――――――― 6 ――――――――― ★ 期待度数はたいてい小数になる ★ 期待度数について行%と列%を計算する と、周辺度数の%とおなじになる 観測度数 各セルに入る実際の度数 残差 (residual) 観測度数と期待度数の差 標準残差 (standardized ---) 残差/√期待度数 ex. N gi N gi a A / / − = ――――――――― 7 ――――――――― 観測度数が下記の場合、残差と標準残差は? 40 60 100 100.0% 38 12 50 100.0% 78 72 150 52.0% 48.0% 100.0% ――――――――― 8 ――――――――― χ2 (chi-square) 標準残差の平方和 各セルに入る標準残差をA, B, C, D とする ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + + + − = + + + = 2 2 2 2 2 2 2 2 1 2 hj d gj c hi b gi a N D C B A χ χ2を人数で割った値が φの2 乗 に等しい N N 2 2 2 χ φ χ φ = すなわち = ――――――――― 9 ――――――――― 【課題】 教科書の表4-1 について 期待度数・残差・標準残差・χ2 を求める ――――――――― 10 ――――――――― 【クラメールの連関係数V】 k×l 表へのφ係数の拡張 (教科書 p. 114–117) ★ k と l のうち小さいほうを m とする ★ 2×2 表と同様に期待度数・残差を求める ★ χ2を求める ★ χ2 を N と(m-1) で割って平方根をとる ) 1 ( 2 − = m N V χ ――――――――― 11 ――――――――― 【V の性質】 ★ 行・列変数が独立のときV = 0 ★ 関連が強くなると大きくなる ★ 最大値は 1 ――――――――― 12 ――――――――― 【モデルとデータの乖離】 連関係数は、モデルとデータの乖離 を表した値と解釈できる ● 特定の仮定 (モデル) の下で予測される値 (期待度数) を求める ● 実際のデータの値と比較する ● 0~1の範囲の係数になるように調整する 多くの統計手法がこのタイプに属する ――――――――― 13 ――――――――― 【SPSS で実習】 クロス表のオプションを指定: 「統計」で 「カイ2 乗」「ファイと Cramer の V」 ※「セル」で「度数」(観測/期待) と 「残差」(標準化なし/標準化)を指定することもできる ――――――――― 14 ――――――――― 【注意事項】 期待度数の小さいセルがある場合、 連関係数は適切な指標にならない → 期待度数 < 5 のセルがないか、 カイ2 乗値の表の下の警告で確認 ――――――――― 15 ――――――――― 【宿題】 つぎのひとつについてクロス表とV を出力: ・性別 (q1_1) × 性別役割意識 (q35a) ・年齢10 歳階級× 性別役割意識 (q35a) ・生活水準の変化 (q36) × 満足度 (q37) V がどれくらいか → どこに%の差があるか? ――――――――― 16 ――――――――― 【次回予告】 6/5 は中間試験をおこないます。 持ち込み可。範囲は、今日の授業内容まで。 試験後は、通常の授業をおこないます。
̆̆̆̆̆̆̆̆̆ 1 ̆̆̆̆̆̆̆̆̆ 2012.6.12 ઍᣣᧄ⺰Ṷ⠌ (↰ਛ㊀ੱ) ╙8 ⻠ޟᐔဋ୯ߣᮡḰᏅޠ 1. ዤᐲ᳓Ḱߣઍ୯ 2. ᐔဋ୯ߣᮡḰᏅߩ⸘▚ 3. ᐔဋ୯ࠍ߁ߣ߈ߩᵈᗧ㗄 4. SPSS ࠦࡑࡦ࠼ ̆̆̆̆̆̆̆̆̆ 2 ̆̆̆̆̆̆̆̆̆ ޣዤᐲ᳓Ḱߣಽᨆᴺޤ ฬ⟵ฬ⟵ψࠢࡠࠬ ฬ⟵㑆㓒ψᐔဋ୯ߩᲧセ ̆̆̆̆̆̆̆̆̆ 3 ̆̆̆̆̆̆̆̆̆ ޣઍ୯ߣᢔᏓᐲޤ ڎ ਛᄩ୯ (median) 㧙 ྾ಽᏅ (Q) (㗅ᐨዤᐲએ) ڎ ᐔဋ୯ (mean) 㧙 ᮡḰᏅ (SD) (㑆㓒ዤᐲએ) (ᢎ⑼ᦠ p. 42–51) ̆̆̆̆̆̆̆̆̆ 4 ̆̆̆̆̆̆̆̆̆ ޣᐔဋ୯ޤ ✚ࠍ࠺࠲ᢙߢഀߞߚ߽ߩ ޣᮡḰᏅޤ ᐔဋ୯߆ࠄߩᏅߩ2 ਸ਼୯ߩᐔဋ߇ޟಽᢔޠ ಽᢔߩᐔᣇᩮ߇ޟᮡḰᏅޠ ڎ ᐔဋ୯ߣᮡḰᏅߪ࠶࠻ߢ߁ ̆̆̆̆̆̆̆̆̆ 5 ̆̆̆̆̆̆̆̆̆ ڎᰴߩ࠺࠲ߩᐔဋߣSD ߪ? ୯ Ꮕ Ꮕ2 1 2 4 6 7 ᐔဋ㧩 ᐔᣇ㧩 ಽᢔ㧩 SD 㧩 (ᢎ⑼ᦠ p. 42, 48) ̆̆̆̆̆̆̆̆̆ 6 ̆̆̆̆̆̆̆̆̆ ޣ⺖㗴ޤ ᢎ⑼ᦠp. 52 ߩ✵⠌㗴 2-3 ߦߟߡޔ ห᭽ߩࠍߟߊࠅޔ ᐔဋ୯ߣᮡḰᏅࠍ⸘▚ߖࠃޕ ̆̆̆̆̆̆̆̆̆ 7 ̆̆̆̆̆̆̆̆̆ ޣSPSS ߩࠦࡑࡦ࠼ޤ ޟ⸥ㅀ⛔⸘ޠψޟᐲᢙಽᏓޠ ޟ⛔⸘ޠࠝࡊ࡚ࠪࡦߢ ޟᐔဋ୯ޠߣޟᮡḰᏅޠࠍ࠴ࠚ࠶ࠢ ޟ⸥ㅀ⛔⸘ޠψޟ⸥ㅀ⛔⸘ޠߢ߽ࠃ ̆̆̆̆̆̆̆̆̆ 8 ̆̆̆̆̆̆̆̆̆ ޣᐔဋ୯ࠍ߁ߣ߈ߩᵈᗧ㗄ޤ ڎ㗅ᐨዤᐲߩᐔဋ୯ࠍߣߞߡߩߪ ẜẜ⊛ߦߪ㑆㓒ዤᐲߩߪߕ ᷹᷹ቯߩࡐࠗࡦ࠻߇৻ቯ㑆㓒 ߣ߁2 ᧦ઙࠍߣ߽ߦḩߚߔ႐ว ̪ 2 ୯ߩᄌᢙߪ㑆㓒ዤᐲߣߺߥߖࠆ߇ޔ⧯ᐓߩᵈᗧ߇ᔅⷐޕ ̆̆̆̆̆̆̆̆̆ 9 ̆̆̆̆̆̆̆̆̆ 1 2 3 4 5 6 7 8 9 ẜᄌᢙ 㩿㑆㓒ዤᐲ䊶ᱜⷙಽᏓ㪀 ᷹ⷰ䈘䉏䈢ᄌᢙ ᷹ⷰᄌᢙ䈏ẜ ᄌᢙ䈱ዤᐲ䉕 ᤋ䈚䈩䈇䉎䈫ផ ᷹䈪䈐䉎႐ว䈱 䉂䇮㗅ᐨዤᐲ䈱 ᷹ⷰᄌᢙ䉕㑆㓒 ዤᐲ䈫䉂䈭䈚䈩 䉋䈇 ̆̆̆̆̆̆̆̆̆ 10 ̆̆̆̆̆̆̆̆̆ ౕ⊛ߦߪ ٨4 ὐએߩዤᐲ ٨ᱜᱜⷙಽᏓߦㄭૃ (ᢎ⑼ᦠ p. 53–59)㧦 නනፄᕈ ᏀᏀฝኻ⒓ᕈ (ᱡᐲ) ਛਛᄩ߳ߩ㓸ਛᐲ (ውᐲ) ࡅࠬ࠻ࠣࡓࠍឬߡᬌ⸛ߔࠆߣࠃޕ ᱜⷙಽᏓߣߩਵ㔌ᐲࠍ⛔⸘⊛ߦᬌ⸛ߔࠆᚻᴺ߽ࠆ ̆̆̆̆̆̆̆̆̆ 11 ̆̆̆̆̆̆̆̆̆ ᱡᐲውᐲߪޟᐲᢙಽᏓޠߩ ޟ⛔⸘ޠࠝࡊ࡚ࠪࡦߢᜰቯߢ߈ࠆ ᱜⷙಽᏓߩߣ߈㧜ޔ ⛘ኻ୯߇ᄢ߈ߊߥࠆ߶ߤޔᱜⷙಽᏓ߆ࠄᄖࠇࠆ ߎࠇࠄߩ᧦ઙࠍḩߚߐߥ႐วߪ ٨㕖㕖✢ᒻᄌ឵ (ᢎ⑼ᦠ p.142–144) ٨㗅㗅ߦᄌ឵ߒߚࠅਛᄩ୯ࠍߞߡಽᨆ ̆̆̆̆̆̆̆̆̆ 12 ̆̆̆̆̆̆̆̆̆ ڎᐔဋ୯ߪߪߕࠇ୯ߩᓇ㗀ࠍฃߌ߿ߔޕ ߹ࠅߦ߆ߌߪߥࠇߚࠤࠬ߇ࠆߣ߈ߪ ਅᢙ㧑ࠍขࠅߩߙߊ (⺞ᢛᐔဋ㧦ᢎ⑼ᦠ p. 46) 㗅㗅ߦᄌ឵ߒߚࠅਛᄩ୯ࠍߞߡಽᨆ ڎᏀฝኻ⒓ߢߥ࠺࠲ߢߪᐔဋ୯ࠃࠅਛᄩ୯ ߩᣇ߇ㆡಾߥઍ୯ߢࠆߎߣ߇ᄙޕ ̆̆̆̆̆̆̆̆̆ 13 ̆̆̆̆̆̆̆̆̆ ޣኋ㗴ޤ ޟ↢ᵴో⥸ḩ⿷ᐲޠ(Q37) ߦߟߡ ↵ᅚߦᐲᢙࡐࠧࡦࠍᚑߒޔߘߎߦ ᐔဋ୯ߣᮡḰᏅࠍᦠ߈ࠇߚ߽ߩࠍᚑ ISTU ߢ᧪ㅳᦐߩᱜඦ߹ߢߦࡈࠔࠗ࡞ឭ
̆̆̆̆̆̆̆̆̆ 1 ̆̆̆̆̆̆̆̆̆ 2012.6.19 ઍᣣᧄ⺰Ṷ⠌ (↰ਛ㊀ੱ) ╙ 9 ⻠ޟᐔဋ୯ߩጀᲧセޠ 1. ጀ (group ) Ყセ 2. Effect Size 3. ⋧㑐Ყ ̆̆̆̆̆̆̆̆̆ 2 ̆̆̆̆̆̆̆̆̆
ޣᐔဋ୯ߩጀᲧセޤ
߰ߚߟߩጀߩ㑆ߩᐔဋ୯ߩᲧセ
ڎᐔဋ୯ߩᏅࠍ߽ߣࠆ
(
ጀᐔဋ)
ڎᮡḰᏅࠍၮḰߦߒߡᏅࠍ⹏ଔ
(effect size
߹ߚߪ ⋧㑐Ყ)
̆̆̆̆̆̆̆̆̆ 3 ̆̆̆̆̆̆̆̆̆ޣSPSS ߩࠦࡑࡦ࠼ޤ
ޟᐔဋߩᲧセޠψޟࠣ࡞ࡊߩᐔဋޠ ᓥዻᄌᢙ㧩ᐔဋ୯ࠍ᳞ࠆᄌᢙ (㑆㓒ዤᐲ) ⁛┙ᄌᢙ㧩ጀࠍᜰቯߔࠆᄌᢙ 㧔ฬ⟵ዤᐲ㧕 ̆̆̆̆̆̆̆̆̆ 4 ̆̆̆̆̆̆̆̆̆ޣࠛࡈࠚࠢ࠻ࠨࠗ࠭ޤ
ES 㧩 ᐔဋ୯ߩᏅ㧛ᮡḰᏅ
ڎᱜᑼߦߪጀ SD ߩ㊀ߺߟ߈ᐔဋߩࠃ߁ߥ ᢙ୯ (૬ว SD) ࠍߟ߆߁ (ᢎ⑼ᦠ p. 137) ̆̆̆̆̆̆̆̆̆ 5 ̆̆̆̆̆̆̆̆̆ޣޤ
ᕈߦࠃࠆ↢ᵴో⥸ḩ⿷ᐲߩ㆑ ᐔဋ SD (ੱᢙ) ↵ᕈ 2.62 1.02 (114) ᅚᕈ 2.24 0.91 (136) ว⸘ 2.41 0.98 (250) ᐔဋߩᏅ㧩 ૬ว SD ѳ ES 㧩 ̪ ES ߪ SPSS ߢߪ⸘▚ߒߡߊࠇߥ ̆̆̆̆̆̆̆̆̆ 6 ̆̆̆̆̆̆̆̆̆ ᕈ䈮䉋䉎↢ᵴḩ⿷ᐲ䈱㆑䈇 㪇 㪈㪇 㪉㪇 㪊㪇 㪋㪇 㪌㪇 㪍㪇 㪈 㪉 㪊 㪋 㪌 ↵ᕈ ᅚᕈ ̆̆̆̆̆̆̆̆̆ 7 ̆̆̆̆̆̆̆̆̆ޣES ߩ․ᓽߣ㗴ὐޤ
ڎฦጀߩੱᢙࠍ⠨ᘦߖߕᐔဋ୯ߛߌᲧセ ¨ᄢ߈ߐ߇ߜ߇߁႐วߪ㧫 ڎ ጀ㑆ߩᲧセߛߌ ¨ ߟએߩጀࠍᲧセߒߚ႐วߪ㧫 ̆̆̆̆̆̆̆̆̆ 8 ̆̆̆̆̆̆̆̆̆ޣ⋧㑐Ყޤ
ڎฦጀߩ߇ోຬߘߩጀߩᐔဋ୯ࠍᜬߟ ⁁ᴫࠍቯߒߡ SD ࠍ᳞ࠆ ڎߎߩᗐ SD ࠍታ㓙ߩ SD ߢഀߞߚᢙ୯߇ ޟ⋧㑐Ყޠޕǯ (ࠗ࠲) ߢࠄࠊߔ ڎ ⋧㑐Ყߩ 2 ਸ਼ ǯ2 ࠍ ޟቯଥᢙޠޟಽᢔ⺑₸ޠߥߤߣ߁ ̪ ǯ2 ࠍޟ⋧㑐Ყޠߣ߁ߎߣ߽ࠆ ̆̆̆̆̆̆̆̆̆ 9 ̆̆̆̆̆̆̆̆̆ޣSPSS ࠦࡑࡦ࠼ޤ
ޟᐔဋߩᲧセޠψޟࠣ࡞ࡊߩᐔဋޠ ޟࠝࡊ࡚ࠪࡦޠߩޟ╙ ጀߩ⛔⸘ޠߢ ޟಽᢔಽᨆߣࠗ࠲ޠࠍ࠴ࠚ࠶ࠢ ڎǯߪ 0㨪1ߩ▸࿐ߩ୯ࠍߣࠅޔ ⁛┙ᄌᢙߩᓇ㗀ജࠍࠄࠊߔ ̪ ES ߪᦨዊ୯ 0ޔᦨᄢ୯п̆̆̆̆̆̆̆̆̆ 1 ̆̆̆̆̆̆̆̆̆ 2012.6.26 ઍᣣᧄ⺰Ṷ⠌ (↰ਛ㊀ੱ) ╙10 ⻠ޟಽᢔಽᨆޠ 1. ⋧㑐Ყߩᗧ 2. ࠛࡈࠚࠢ࠻ࠨࠗ࠭ߣ⋧㑐Ყ 3. ផ᷹⛔⸘ߩၮ␆ 4. 㑆ផቯ ̆̆̆̆̆̆̆̆̆ 2 ̆̆̆̆̆̆̆̆̆ ޣ⋧㑐Ყߩᗧޤ ࠆߩ୯ࠍxోᐔဋࠍMጀᐔဋࠍ m ߣߔࠆ ߣޔోᐔဋߣߩᏅᏅߪ xM( x–m) ( m–M ) ǯ㧩ߔߴߡߩxߦߟߡxm ǯ㧩ߔߴߡߩmߦߟߡmM ̆̆̆̆̆̆̆̆̆ 3 ̆̆̆̆̆̆̆̆̆ ᰴߩ࠺࠲ߩᐔဋ୯ߣ SD ߪ? 㨧1, 1,2,2,3,5,4,5,4,3㨩 2ጀߦಽഀߔࠆߣ㧦 㨧1,1,2,2㨩 {3,5,4,5,4,3} ጀᐔဋ୯ࠍߡߪࠆߣ㧦 㨧1.5,1.5,1.5,1.5㨩 {4,4,4,4,4,4} ̆̆̆̆̆̆̆̆̆ 4 ̆̆̆̆̆̆̆̆̆ ᰴߩ႐วߪߤ߁߆? 㨧1,1,2,2,3,5,4, 5,4,3㨩 ω 㨧1,2,3,5,4㨩 {1,2,5,4,3} ω 㨧3,3,3,3,3㨩 {3,3,3,3,3} ̆̆̆̆̆̆̆̆̆ 5 ̆̆̆̆̆̆̆̆̆ ǯ㧩1: ጀౝߩ߫ࠄߟ߈߇ߥ (ోຬหߓ୯) ǯ㧩0: ጀߩᐔဋ୯߇หߓ ̆̆̆̆̆̆̆̆̆ 6 ̆̆̆̆̆̆̆̆̆ ޣಽᢔಽᨆޤ ጀᐔဋ୯ࠍߡߪߡᗐಽᢔࠍ᳞ࠆಽ ᨆᴺࠍ
ޟಽᢔಽᨆޠ(ANOVA: ANalysis Of VAriance) ߣ߁ޕ 3ጀએߢᐔဋ୯ࠍᲧߴࠆ႐วߦ߽߃ࠆޕ ̆̆̆̆̆̆̆̆̆ 7 ̆̆̆̆̆̆̆̆̆ ޣES ߣǯߩ㑐ଥޤ 2 1 2 2 2 2 1 ES n n N u K K ․ߦޔ2 ጀߩᄢ߈ߐ߇หߓn1= n2ߥࠄޔ 2 2 2 1 4 ES K K ጀߩᄢ߈ߐ߇ߜ߇߃߫ޔES ߪߎࠇࠃࠅᄢ߈ߊߥࠆ ̆̆̆̆̆̆̆̆̆ 8 ̆̆̆̆̆̆̆̆̆ ̪ߎߩࠃ߁ߦES ߣǯߪߦᄌ឵ߢ߈ࠆޕ ψ ਔᣇ␜ߔߩߪ౬㐳 ̆̆̆̆̆̆̆̆̆ 9 ̆̆̆̆̆̆̆̆̆ ޣᵈᗧ㗄ޤ ጀߩᐔဋ୯ࠍಽᨆߔࠆ႐วޔ ฦጀߩੱᢙߪ৻ቯએᔅⷐ (ᦨૐ 20 ੱ?) ψࠞ࠹ࠧ⛔ว߇ᔅⷐߦߥࠆߎߣ߇ࠆ ̆̆̆̆̆̆̆̆̆ 10 ̆̆̆̆̆̆̆̆̆ ޣኋ㗴ޤ ㆡᒰߥᄌᢙߩᐔဋ୯ߩᐕ㦂ጀߦࠃࠆߜ߇ ߦߟߡޔಽᢔಽᨆࠍⴕޔ⚿ᨐߣߘࠇߦ ߟߡߩ⸃㉼ࠍឭޕ ᐕ㦂ጀߪ 3 ߟએߦಽഀߔࠆߎߣޕ (ISTUߢ᧪ㅳᦐ 12:00 ߹ߢ) ̆̆̆̆̆̆̆̆̆ 11 ̆̆̆̆̆̆̆̆̆ ޣ⸥ㅀ⛔⸘ߣផ᷹⛔⸘ޤ ⸥ㅀ⛔⸘ (descriptive statistics) 㧩࠺࠲ (ࠤࠬ)ߩ․ᓽࠍ ᢙ୯߿࿑ߦ߹ߣࠆ ផ᷹⛔⸘ (inferential statistics) 㧩⏕₸⊛ߥ⺋Ꮕࠍ⠨ᘦߒߡޔ Უ㓸࿅ߩ․ᓽࠍផ᷹ߔࠆ (ᢎ⑼ᦠ pp. 3–5) ̆̆̆̆̆̆̆̆̆ 12 ̆̆̆̆̆̆̆̆̆ ޣήὑޤ random sampling Უ㓸࿅߆ࠄ⸘↹ᮡᧄࠍㆬ߱㓙ߦޔ ߔߴߡߩߩ⏕₸߇╬ߒߊߥࠆ ࠃ߁ߦߔࠆ Îޟ╬⏕₸ᮡᧄޠ(probability sample) ̆̆̆̆̆̆̆̆̆ 13 ̆̆̆̆̆̆̆̆̆ ⴼߩߥ߆ߦ⦡ߟ߈ߩ₹߇ 60 ਁߞߡࠆ: ⿒₹: 30 ਁ 㕍₹: 30 ਁ ₹ࠍn ขࠅߒߚߣ߈ޔߘߩ⦡ߪ̖̖? ψ ో⇇߆ࠄ n ੱࠍήὑߒߚߣ߈ޔ ߘߩߥ߆ߦ ٤٤ ߩੱߪ㧑߰ߊ߹ࠇࠆ߆? ̆̆̆̆̆̆̆̆̆ 14 ̆̆̆̆̆̆̆̆̆ ޣ㑆ផቯޤ interval estimation ޟ╵߃ߪ ߚ߱ࠎ ߎߩ▸࿐ౝߦࠆޠ ω ା㗬₸ (confidence level) ࠍㆡᒰߦ⸳ቯߒߡ ା㗬㑆 (confidence interval) ࠍ᳞ࠆ ̆̆̆̆̆̆̆̆̆ 15 ̆̆̆̆̆̆̆̆̆ ⿒㕍ߩ₹߇ᄙᢙߞߚⴼ߆ࠄ 400 : ⿒₹: 240 㕍₹: 160 ⴼߩਛߩ⿒₹ߩᲧ₸ߪ? 0.6 r 1.96 л(0.60.4 / 400) ╵: 㨪 㧑 (95%ା㗬㑆) ̆̆̆̆̆̆̆̆̆ 16 ̆̆̆̆̆̆̆̆̆ ޣᲧ₸ߩ㑆ផቯޤ ᮡᧄߩⷙᮨ߇ߓࠀ߁߱ࠎᄢ߈ߊ (n > 30)ޔ Ყ₸߇߹ࠅߞߡߥ (0.1 < m < 0.9) ߣ߈ޔ 95%ା㗬㑆ߪ n m m m r 1.96u (1 ) ᮡḰ⺋Ꮕ (standard error)
̆̆̆̆̆̆̆̆̆ 1 ̆̆̆̆̆̆̆̆̆ ઍᣣᧄ⺰Ṷ⠌ (↰ਛ㊀ੱ) ╙ 11 ⻠ޟ㑆ផቯޠ(2012.7.3) 1. 㑆ផቯߩᣇᴺߣ⺰ℂ 2. ᐔဋ୯ߩ㑆ផቯ ̆̆̆̆̆̆̆̆̆ 2 ̆̆̆̆̆̆̆̆̆
ޣ㑆ផቯߩᣇᴺޤ
⏕₸ਇߩߊߓࠍ 10 ࿁߭ߚߣߎࠈޔߔߴߡ ᒰߚࠅߢߞߚޕߎߩߣ߈ޔᒰߚࠅߊߓߩ⏕₸ ߪߤࠇߊࠄߛߣ⠨߃ࠆߩ߇วℂ⊛߆?ω
น⢻ᕈߩዋߥࠤࠬࠍឃ㒰 ౕ⊛ߦߪ̖̖ ߐ߹ߑ߹ߥ⺑ࠍ┙ߡޔ ⏕₸ < 0.025 ߩ߽ߩࠍุቯߔࠆޕ ̆̆̆̆̆̆̆̆̆ 3 ̆̆̆̆̆̆̆̆̆ ޟା㗬₸ޠࠍㆡᒰߦ⸳ቯ (ㅢᏱ 95%) (㧝㧙ା㗬₸) ߩ⏕₸ࠍਔᭂߩ⽎ߦ⸳ቯ (ㅢᏱ 2.5%ߕߟ) Უ㓸࿅ߦ߅ߌࠆ୯߇ߊߟߢࠇ߫ ߎߩਔᭂ┵ࠍ㒰ߚ㑆ߦ ᷹ቯ୯߇ࠆ߆ࠍޔ✚ᒰࠅߢ⸘▚ߔࠆ ߎ߁ߒߡ᳞ߚޔᲣ㓸࿅ߦ߅ߡࠅ߁ࠆ ୯ߩ㓸ว߇ޟା㗬㑆ޠߢࠆޕ ̆̆̆̆̆̆̆̆̆ 4 ̆̆̆̆̆̆̆̆̆ ᒰߚࠆ⏕₸ 0.5 ߩߊߓࠍ 10 ࿁ᒁߚ႐ว 0.1% 1.0% 4.4% 11.7% 20.5% 24.6% 20.5% 11.7% 4.4% 1.0% 0.1% 0.0% 5.0% 10.0% 15.0% 20.0% 25.0% 30.0% 0 1 2 3 4 5 6 7 8 9 10 ̆̆̆̆̆̆̆̆̆ 5 ̆̆̆̆̆̆̆̆̆ ᮡᧄߦߟߡ⸘▚ߢ߈ࠆ⛔⸘㊂ߦߟߡߪޔ ߔߴߡ⛔⸘⊛ផ᷹߇น⢻ߢࠆ ߚߛߒޔ⸘▚ᣇᴺߪߐ߹ߑ߹ ㅢᏱޔㆡᒰߥቯࠍ⟎ߡ⸘▚ࠍ◲⇛ൻߔࠆ ̆̆̆̆̆̆̆̆̆ 6 ̆̆̆̆̆̆̆̆̆ޣᐔဋ୯ߩ㑆ផቯޤ
Უ㓸࿅ߦ߅ߌࠆᐔဋ୯ߩ 95%ା㗬㑆ߪᰴߩᑼߢ᳞ࠆޕ ߚߛߒޔᱜⷙಽᏓࠍቯ㧦 n m r 1.96uSD ̪ ޟt ⥃⇇୯ޠߪ n ߦࠃߞߡᄌൻߔࠆ߇ޔn㧪200 ߢ 1.96 ߦ ᧤ (ᢎ⑼ᦠ p. 281)ޕ ᮡḰ⺋Ꮕ t⥃⇇୯ ᮡᧄᐔဋ ̆̆̆̆̆̆̆̆̆ 7 ̆̆̆̆̆̆̆̆̆ޣSPSS ࠦࡑࡦ࠼ޤ
ޟಽᨆޠψޟ⸥ㅀ⛔⸘ޠψޟត⚝⊛ޠ ٧ޟᓥዻᄌᢙޠࠍᜰቯ ٧ࡄࡀ࡞Ꮐਅߩޟ⛔⸘ޠߛߌࠍ࠴ࠚ࠶ࠢ ̪ ା㗬₸ࠍᄌᦝߔࠆߦߪޟ⛔⸘ޠࠍㆬᛯ ̪ޟ࿃ሶޠࠍᜰቯߔࠆߣጀߦಽᨆߢ߈ࠆ ̆̆̆̆̆̆̆̆̆ 8 ̆̆̆̆̆̆̆̆̆ޣኋ㗴ޤ
ㆡᒰߥᄌᢙߩᐔဋ୯ߦߟߡޔ↵ᅚߦ㑆 ផቯࠍⴕ߁ޕ⚿ᨐߣߘࠇߦߟߡߩ⸃㉼ࠍ ᦠߡឭޕ (ISTUߢ᧪ㅳᦐ 12:00 ߹ߢ) ̆̆̆̆̆̆̆̆̆ 9 ̆̆̆̆̆̆̆̆̆ޣᦼᧃࡐ࠻ޤ
ᦼ㒢㧦8/14 (Ἣ) ឭవ㧦ISTU ޟᦼᧃࡐ࠻ޠߦࡈࠔࠗ࡞ࠍឭ ౝኈ㧦ࠢࡠࠬߣᐔဋ୯ߩᲧセߦߟߡㆡᒰߥಽᨆࠍߒߡ⚿ ᨐࠍ⸃㉼ߔࠆޕ ផ᷹⛔⸘ߩ⚿ᨐࠍࠆߎߣޕ ࿑ߪ⺒ߺ߿ߔߊᢛᒻߒޔ⺰ᢥߣߒߡߩⵙࠍᢛ߃ࠆޕ ⠨㧦 ᓟᦼߩᬺࠍฃ⻠ߒߥ⠪ߪޔ࠺࠲ߩࠦࡇࠍߔߴ ߡᶖߔࠆߎߣޕ――――――――― 1 ――――――――― 現代日本論演習 (田中重人) 第12 講「統計的検定」(2012.7.10) 1. 平均値の差の区間推定 2. 統計的検定とは 3. 平均値の差の検定 4. 有意確率 ――――――――― 2 ―――――――――