第 1 回 ガイダンス 1 受講にあたって (1)担当者 宮本 友弘(東北大学 高度教養教育・学生支援機構 准教授) 専門:心理学/教育情報学 E-mail: [email protected] (2)授業の概要(シラバス参照) (3)教材 ①授業用の Web サイトを開設しています。
http://www16.plala.or.jp/tm-home/rm2016/
(すべて半角) ②使用するソフトウェア ソフトウェア 主な用途 Excel データ入力、図表作成、基礎的な統計法(平均値、SD、t 検定など) js-STAR 直接確率計算、χ2 検定と残差分析、3 要因までの分散分析 http://www.kisnet.or.jp/nappa/software/star/ SPSS ほとんどの統計法 とくに多変量解析(因子分析、重回帰分析など) ③参考書 □田中敏・山際勇一郎(1992). ユーザーのための教育・心理統計と実験計画法―方法の理解から論文の書き方まで 教育出版 平均値、標準偏差(SD)、t 検定、分散分析、相関係数、χ2検定といった基礎的な統計法をわかりやすく解説して います。結果をどのように書くかもわかります。 □松尾太加志・中村知靖(2002).誰も教えてくれなかった因子分析 北大路書房 探索的因子分析をわかりやすく解説した本の決定版。斜交回転のことをここまでわかりやすく解説した本はないで しょう。SPSS によるやり方の記述も十分。 □小塩真司(2005).研究事例で学ぶ SPSS と Amos による心理・調査データ解析 東京図書 SPSS を使って、因子分析、重回帰分析といった多変量解析をどう行うかについて、具体的な事例(データ)を用い て解説しています。論文でどう書くかもわかります。 □村瀬洋一・高田洋・廣瀬毅士 (編)(2007). SPSS による多変量解析 オーム社 SPSS を使って、多変量解析をどう行なうかを詳しく説明しています。上記の補充として有用です。 2 研究法について (1)児童学研究科(修士論文研究)、教職研究科(課題研究)の主な種類 呼称 研究の対象となるもの 研究のまとめ方と意義 文献研究 文献 思想比較、資料発掘、今後の展望 事例研究 個別記録 個別事例の追跡と概念的記述(用語や図式) 実証研究 調査・実験等によるデータ 実態把握、探索(仮説の生成)、仮説の検証 実践研究 現場 実践の評価・改善⇒ 文献の種類 種類 具体例 注意すること 著書 出版社 論文 学会誌 紀要 報告書 市販雑誌 保育学研究(日本保育学会) 児童学研究(聖徳大学) 児童心理 日本学術会議協力学術研究団体 / 査読付 大学のレベル / 査読付 その他 学会発表 (2)論文の書式 *各研究科、指導教官によって若干異なるので注意 例) 前付け 本文 後付け 表紙(タイトル) 要約 はじめに 目次 第1 章 序論 第1 節 研究史 第2 節 本研究の目的 第2 章 研究 1 第1 節 目的 第2 節 方法 第3 節 結果 第4 節 考察 第3 章 研究 2 第1 節 目的 第2 節 方法 第3 節 結果 第4 節 考察 第4 章 全体的考察 第5 章 結論 引用文献 謝辞(後書き) 資料 (3)実証研究の進め方 1)テーマの設定 問題意識、日常的な関心など ⇒ 研究可能な形で述べること( ) ⇒ ポイント ① ②2つの関係 A B 2)仮説のタイプ ①探索型研究:理論はなく、ある事象の性質・状態を探る ②検証型研究:理論から導いた仮説が正しいかどうかを確かめる 3)研究の企画 A B 操作・設定 測定 測定 測定 ⇒ データ収集の方法 ①見る ②聞く ③何かさせる(パフォーマンスを見る)
第2回 データの種類と統計的検定の考え方 1 測定とは 構成概念(人格特性や行動傾向)→ 現象(行動や反応)→ 測定(数値やカテゴリーを割当てる)→ データ 2 尺度の種類 尺度 順序性 等間隔性 原点0 例 平均 名義尺度 × × × 賛成・反対、女子・男子など、分類名(カテゴリー) × 順序尺度 ○ × × L>M>S、優>了>可 間隔尺度 ○ ○ × 温度など (0 度の 2 倍は 0 でない) ○ 比率尺度 ○ ○ ○ 時間、体重など (0 秒の 2 倍は 0 秒) <考えてみよう> 評定尺度法によって得られたデータをどう判断するか? 3 統計的推測 通常、母集団全体を調べること(悉皆調査)は無理! → → 抽出 → → ⇒ 標本(実際の被験者)から、一定の目安(確率)に基づく判断をする 【例題 1】ある質問を 20 名に対して行った。賛成と反対の意見はどちらが多いといえるか。 表 1 回答の集計結果(人) 賛成 反対 5 15 ※データの表示:集計表の作成 <統計的検定の考え方> ①仮説を立てる 帰無仮説 :「良い」の人数と「悪い」の人数は差がない(等しい、偶然のユレ) 対立仮説 :「賛成」の人数と「反対」の人数には差がある(「賛成」の人数が「反対」の人数よりも少ない) ②帰無仮説のもとで データが起きる偶然で起こる確率(偶然確率)を計算する ※確率を表す記号は p(probability) 母集団 (研究対象全体) (サンプル) 標本
③偶然確率の大きさを評価する 0.05 を基準にする 0.05 以上・・よく起こることが起きている・偶然にすぎない ⇒ 帰無仮説を棄却できない 0.05 未満・・まれなことが起きている・・・偶然でない→意味がある ⇒ 帰無仮説を棄却 <js-STAR での分析> ①左側メニューの“1×2 表(正確二項検定)”をクリック ②表示された枠に、集計表の数値を入力 → 計算ボタンをクリック ③出力結果 [直接確率計算1×2] 観測値1 観測値2 --- 5 15 両側検定 : p=0.0414 * (p<.05) 片側検定 : p=0.0207 * (p<.05) --- <結果の書き方> 表 1 は回答別の人数を示したものである。 正確二項検定の結果、「賛成」の人数は「反対」の人数よりも有意に少 なかった(両側検定:p=.04)。 ⇒第 1 文 データの表示 ⇒第 2 文 分析結果 ①使用した分析法(正確 2 項検定) ②検定方法(両側検定) ③偶然確率(p= ) を記載して、「有意であった/なかった」「有意差があった/なかっ た」を書く。 分析結果に基づく「推論」(通常は、“考察”で書く) <補足> 同じ比率でも検定結果は異なる 良い 悪い ⇒ 良い 悪い 6(75%) 2(25%) 18(75%) 6(25%) ⇒ パーセントしか表示していない結果には注意する! 度数の表示を優先する
4 統計的方法の種類 A 独立変数 B 従属変数 方法 カテゴリー カテゴリー ノンパラメトリック法:χ2検定 カテゴリー 数量 実験計画法:t 検定、分散分析 数量 数量 多変量解析:相関係数、因子分析、重回帰分析
第3回 ノンパラメトリック検定① 1 カテゴリー・データの処理の進め方 (0)データ処理の準備 ①質問紙調査の場合 質問紙に通し番号を振る ⇒ 対象者のID とする ②データの入力 ・Excel を使用する ・対象者をタテ、変数をヨコに、一人一行の原則。 ・1 行目には変数名を入力する。 ・性別などのカテゴリー・データも、コード化して数字にしておく(例 男子:1、女子:0) ⇒ 多肢選択法(複数回答)の場合の入力に注意 例)次の中から、関心があるものすべてに○を付けてください。 1.経済の構造改革 2.景気対策 3.政治・行政の在り方 4.外向・安全保障 5.社会保障制度改革 6.環境問題 7.教育改革 8.憲法問題 9.その他( ) 10.特にない (1)データの表示:集計表の作成 対象者 条件 成績 ⇒ 各カテゴリーの人数・個数を条件ごとにカウントして、 集計表を作成カウントした数を度数、各マスをセルという ア A できた イ A できた できた できない 計 ウ A できない 条件 A 4 1 5 周辺度数 エ A できた 条件 B 2 3 5 周辺度数 オ A できた 計 6 4 10 カ B できない 周辺度数 周辺度数 総度数 キ B できた ク B できない ケ B できた コ B できない (2)データの分析:度数(比率)の差の検定
2 1×j 表の分析 【例題1】※SPSS の練習 [0]データの読み込み ①SPSS を起動する ②キャンセルをクリック ③データファイルを SPSS 画面へドラッグする ④使用するワークシートを選択 → OK をクリック
[1]正確二項検定の実行 (復習) ①分析 → ノンパラメトリック検定 → 過去のダイアログ → 2 項 ②検定変数リストに“回答2”を移動 検定比率は 0.50 → OK ③出力結果 ※値にラベルをつける ①変数ビューで、値の欄をクリックする ②値、ラベルを入力 ⇒ 追加をクリックする
[2]χ2検定の実行 (新しい内容) ①分析 → ノンパラメトリック検定 → 過去のダイアログ → カイ2乗 ②検定変数リストに“回答2”を移動 ③出力結果 回答 2 ①期待度数を求める 観測度数・・・実際に得られた度数 期待度数・・・偶然確率(母比率)のも とで予測される度数 ②観測度数と期待度数のズレを数量化す る ③自由度(df)を計算する ★ある統計量において自由に変わりうる 要素の数 ④当該のχ2 値の出現する確率を、χ2分 布から求める。 観測度数 N 期待度 数 N 残差 賛成 5 10.0 -5.0 反対 15 10.0 5.0 合計 20 検定統計量 回答 2 カイ 2 乗 5.000a 自由度 1 漸近有意確率 .025 a. 0 セル (0.0%) の期待度数は 5 以下です。必要なセル の度数の最小値は 10.0 です。 ④結果の書き方 表○は各回答の人数を示したものである。 χ2検定の結果、賛成の人数が反対の人数よりも有意に少なかった(χ2(1)=5.00,p<.05)。 ★まとめ1 カテゴリーデータの処理 (1)データの表示:集計表の作成 (2)データの分析:度数(比率)の差の検定 ①真の確率を計算する ・・・直接確率計算(2 項検定など) ②近似の確率を計算する ・・・データをχ2という統計量にして、その確率を求める ⇒ χ2 検定の制約 ・集計表の中に度数0 のセルがある ・集計表の中に期待度数5 以下のセルが、全セルの数の 20%以上ある
【例題2】小学生 69 名を対象に、先生にほめられるとしたら、どんなほめられ方を好むかを調べた。収集されたデータ (仮想)から、どんなことがいえるか。 (1)データの表示:集計表の作成 ①Excel ファイルを SPSS に読み込む ※Excel ファイルを SPSS の画面にドラッグすればよい ②分析 → 記述統計 → 度数分布表 ③「ほめられた方」を選択 → 中央の矢印をクリック → OK をクリック ④度数分布表の出力 → ここから・・・ 表○ タイトル 名前発表 能力賞賛 努力賞賛 賞状授与 (2)データの分析 ①分析 → ノンパラメトリック検定 → 過去のダイアログ → カイ2 乗 ※注意! データはすべて数字の方がよい ・・・「変換」 変数ビューで、値にラベルをつけるといよい ②「ほめられ方2」を選択 → 中央の矢印をクリック → OK をクリック ③出力 読み取るべき情報は? (3)結果をまとめる 表○は、
第4回 ノンパラメトリック検定② 1 クロス集計表 i×j 表の分析 【例題 3】肺がんの患者 60 名と、健常者 90 名を無作為に選び、喫煙について調べた。収集されたデータ(仮想データ) からどんなことがいえるか。 ※例題 32 データをダウンロード(肺がん患者:1、健常者:2 / 喫煙:1、非喫煙:2) (1)データの表示と分析 0)Excel ファイルを SPSS に読み込む → 読み込んだら、変数ビューで、各変数の値にカテゴリー名を付けること 1)クロス集計表の作成とχ2 検定の実行 ①分析 → 記述統計 → クロス集計表 を選択 ② “肺がん”を「行」、“喫煙”を「列」に移動する ③「統計量」をクリック 「カイ 2 乗」にチェックを入れたら、続行をクリック ④“セル”をクリック 期待度数にもチェックを入れる チェックを入れる ⇒ 続行をクリック ⇒ ②の画面で OK をクリック ここをクリック して移動
⑤クロス集計表の出力 肺がん と 喫煙 のクロス表 喫煙 合計 喫煙 非喫煙 肺がん 肺がん患者 度数 52 8 60 期待度数 40.0 20.0 60.0 調整済み残差 4.2 -4.2 健常者 度数 48 42 90 期待度数 60.0 30.0 90.0 調整済み残差 -4.2 4.2 合計 度数 100 50 150 期待度数 100.0 50.0 150.0 ⑥χ2検定の結果 カイ 2 乗検定 値 自由度 漸近有意確率 (両側) 正確有意確率 (両側) 正確有意確率 (片側) Pearson のカイ 2 乗 18.000a 1 .000 連続修正b 16.531 1 .000 尤度比 19.467 1 .000 Fisher の直接法 .000 .000 線型と線型による連関 17.880 1 .000 有効なケースの数 150 a. 0 セル (.0%) は期待度数が 5 未満です。最小期待度数は 20.00 です。 b. 2x2 表に対してのみ計算 ⑦χ2検定が有意の場合の下位検定 ★残差分析・・・どのセルが、χ2値の有意性に貢献したかを判定する方法 各セルの観測度数と期待度数の差(残差)を調整した値(調整済み残差)をみる □有意かどうか 有意な残差は定数として決っている 残差の絶対値>1.96 ⇒ p<.05 残差の絶対値>2.58 ⇒ p<.01 □符号:ズレの方向 プラスか、マイナスか。 (2)結果をまとめる ①集計表と、残差分析の結果の表を作成する 表1 表 2 残差分析の結果(調整済み残差) 喫煙 非喫煙 喫煙 非喫煙 肺がん患者 肺がん患者 健常者 健常者
②文章を記述する 表 1 は肺がん患者と健常者における喫煙と非喫煙の人数を集計したものである。 χ2の結果、人数の偏りは有意であった(χ2 (1)=18.00, p<.01)。 残差分析を行った結果、表 2 にみられるように、肺がん患者では喫煙者が多く、 健常者では喫煙者が多かった。 ①データの表示 ②χ2検定の結果の記述(主分析) ③残差分析の結果の記述(下位分析) ★χ2検定の制約 ・集計表の中に度数 0 のセルがある ・集計表の中に期待度数 5 以下のセルが、全セルの数の 20%以上ある 【例題 4】不安障害のある 21 名に対して、心理療法 A、あるいは、心理療法 B を実施し、改善の有無について調べた。 収集されたデータ(仮想データ)からどんなことがいえるか。 ※(心理療法 A:1、心理療法 B:2 / 改善あり:1、改善なし:2) (1)集計表の作成 改善あり 改善なし 心理療法 A 心理療法 B (2)結果をまとめる 【例題 5】ある小学校の保護者に道徳教育の必要性(必要を 1、不要を 2)について 2 回調査した。1 回目と 2 回目の間 に、担当教員による道徳教育の目的や実際についての説明があった。得られたデータからどんなことがいえるか。 このままχ2検定を実行すると・・・ 表1 道徳教育に対する意見の変化(人) 説明前 \説明後 必要 不要 必要 不要 ・・・対象者のデータが「対応している」ことに注意する。
⇒ マクネマーの法(マクニマーの検定)を行う 分析 → ノンパラメトリック検定 → 過去のダイアログ → 2 個の対応サンプルの検定 を選択 変数 1 に事前 変数 2 に事後 を投入する McNemar にチェックを入れる p<.01 なので、有意である ⇒ どういう意味か? 対応があるデータどうしの変化に注目して、分析している。 変化のないセルには注目しない。 表 2 態度が変化した者の人数(人) 必要→不要 不要→必要 5 20 この 5 人と 20 人の差を検定している。マクネマーの法は1つの考え方であり、新しい方法ではない。 結果のまとめ(例) 態度が変化した者を集計し(表 2)、正確二項検定を行なった結果、「不要」から「必要」へ変化した者の人数が、そ の逆の人数より有意に多かった(両側検定:p=.004)。 担当教員の説明は、道徳教育を不要と考える保護者の意識を変容させる効果があるといえる。
第5 回 数量データの要約:記述統計量 1 数量データの処理の流れ (1)データ表示 手順1 ヒストグラムの作成 手順2 記述統計量(M、SDなど)の計算・・・記述統計 手順3 作表・作図・・・注意:統計概念の記号として用いる文字は、イタリックとする (2)データ分析: t 検定、分散分析など・・・推測統計 2 データ表示 【例題 6】大学生 15 名に単語を 12 個提示した後、すぐに再生テストを行った。 手順1・2 ヒストグラムの作成と記述統計量の計算 (1)SPSS の操作 ①分析 → 記述統計 → 度数分布 ②変数を投入する ③統計量を指定する ④ヒストグラムを選択する (2)ヒストグラムのチェック ①極端値(データ全体の分布から大きくはずれている値)のチェック 不良値であることが多い 研究者側の要因 手続きの失敗(教示の不徹底、材料の不備など) 場面統制の失敗(他者の介入、騒音、停電など) 被験者側の要因 知的原因(既有知識、専門技能、誤解、理解不足など) 情意的原因(興奮、反発、無関心、心理的防衛など) 身体的原因(疲労、睡眠不足、近視、難聴など)
②分布形のチェック(正規分布かどうか?):数量データとして処理をするための前提条件 正規分布 ⇒ 数量データの処理は適用 できない。平均が代表値にな らない。 カテゴリー・データとして処 理。 ⇒ 統計的にチェックする方法もある ①分析 → 記述統計 → 探索的 ②従属変数を投入する ③正規性の検定とプロットにチェックを入れる ④出力結果 ★コルモゴロフ・スミルノフの検定(K-S検定)とシャピロ・ウィルク検定(S-W検定) データの分布と、正規分布とのズレが、有意かどうかを検定する・・・適合度の検定ともいう。 人数が少ない場合は、S-W検定を使用する。 この場合の確率は、K-S検定がp=.200、S-W検定がp=.119なので、有意でない。 つまり、データの分布は、正規分布とズレていない ⇒ 正規分布とみなせる ということ。 ⇒ 統計的な結果と、ヒストグラムなどの視覚的な結果を総合して判断する。
(3)記述統計量 再生数 1)代表値(分布の中心的位置を示す) ①平均値 ②中央値(メディアン) データを順番に並べてちょうど真ん中になるケースの値 累積%が 50%に該当する値。極端値の影響が少ない。 ③最頻値(モード) もっとも度数の多い値 2)散布度(データの散らばりの程度を表す) ①標準偏差 ②分散 ③最大値、最小値 度数 有効 15 欠損値 0 平均値(M) 7.33 中央値(メディアン Me) 7.00 最頻値(モード Mo) 7 標準偏差 1.799 分散 3.238 歪度(わいど) 1.119 歪度の標準誤差 .580 尖度(せんど) 2.090 尖度の標準誤差 1.121 最小値 5 最大値 12 3)歪度と尖度 歪度:分布の左右対称性を表す ①歪度=0:左右対称 ②歪度<0:右に偏った分布 ③歪度>0:左に偏った分布 尖度:分布のとんがり具合を表す ①尖度=0:正規分布と同程度 (3もある) ②尖度<0:正規分布よりもへん平 ③尖度>0:正規分布よりも尖っている (参考) 4)平均を用いてはならない場合 ①データが数量でない場合:順序尺度の場合に注意 ②データの中に極端値が存在する場合 ③データの分布が正規分布とみなせない場合
5)標準偏差(SD:Standard Deviation)とは何か? 各データが、平均からどの程度ズレているかを表す。 標準偏差の求め方 ⇒ 標準偏差(分散)の求め方は2通りあるので注意! 実際値・・・標本の標準偏差 推定値・・・母集団の標準偏差(不偏推定値) → → 抽出 → → ↓ ↓ 母 数 統計量(実際値) ⇒ データの実際値(分母がN)と、母集団の推定値(分母が N-1)のどちらを採用? どちらか一方を一貫して用いるなら支障はない。 (参考 1)標準偏差と平均をみれば分布の見当がつく(あくまでも簡便法) 例)1~5 までの 5 段階評定データ 平均 SD 平均-SD 平均+SD 正規分布 3.25 1.16 2.09 4.41 L 型分布 2.17 1.28 0.89 3.45 J 型分布 3.83 1.28 2.55 5.11 (参考 2)SPSS での記述統計量の別の求め方 分析 → 記述統計 → 記述統計 母集団 (研究対象全体) (sample) 標本 推定
【例題 7】大学生 40 名(男子 20 名、女子 20 名)に単語を 12 個提示した後、すぐに再生テストを行った。 手順 1 ヒストグラムのチェック どうやって男女別にヒストグラムを描くか? ①データ → ファイルの分割 ②「グループごとの分析」をチェックし、「グループ化変数」に性別を投入する。 ※「グループの比較」でもよい。 出力結果が異なる。 ⇒ 以後の分析は、すべて男女別に行なわれる。 手順 2 平均と SD を計算する ※手順 1 の指定を解除しておく(「全てのケースを分析」に戻す) ①分析 → 平均の比較 → グループの平均 ②「独立変数」に性別、 「従属変数」に再生数 を投入 ③必要に応じて、統計量を選択する ③出力 ※このまま Excel にコピーすると便利。
手順3 作表・作図 ①作表 平均と標準偏差を表にまとめる(作表による統計量の掲載) 表○ 各テストの平均と標準偏差(点) 男 女 人数→
N
平均→M
SD→SD
②作図 図○ 男女別の平均再生数⇒ どうやってアンテナを出すか? ①グラフを作成する ②次にグラフツールのレイアウト → 誤差範囲 で ↓ ③ 折れ線グラフの場合 棒グラフの場合 ④ユーザー設定 で値を指定