• 検索結果がありません。

やすだ社会学研究法 a( 2014 年度秋学期担当 : 保田 ) クラスター分析 ( 1): 考え方 クラスター分析の目的と魅力クラスター分析 ( cluster analysis) は いくつかの変数から構成される多数のケースを類似性の高いグループ ( クラスター ) にまとめる 分類 のための技

N/A
N/A
Protected

Academic year: 2021

シェア "やすだ社会学研究法 a( 2014 年度秋学期担当 : 保田 ) クラスター分析 ( 1): 考え方 クラスター分析の目的と魅力クラスター分析 ( cluster analysis) は いくつかの変数から構成される多数のケースを類似性の高いグループ ( クラスター ) にまとめる 分類 のための技"

Copied!
16
0
0

読み込み中.... (全文を見る)

全文

(1)

クラスター分析 - 1 - 社 会 学 研 究 法 a( 2014 年 度 秋 学 期 担 当 :保 田や す だ) 「 ク ラ ス タ ー 分 析 ( 1): 考 え 方 」 ■ ク ラ ス タ ー 分 析 の 目 的 と 魅 力 ク ラ ス タ ー 分 析 ( cluster analysis ) は 、 い く つ か の 変 数 か ら 構 成 さ れ る 多 数 の ケ ー ス を 類 似 性 の 高 い グ ル ー プ( ク ラ ス タ ー )に ま と め る「 分 類 」の た め の 技 法 で あ る 。人 間 は 、 多 く の 場 合 、 最 終 的 に 何 ら か の グ ル ー プ 枠 組 み で 物 事 を 理 解 し よ う と す る ( 例 : こ の 人 の 性 格 は ○ ○ タ イ プ だ 、 こ の 授 業 は 私 と 関 係 の な い 種 類 の 授 業 だ 、 こ の 国 の 政 治 制 度 は 独 裁 制 だ 、 等 )。 そ の 意 味 で 、 ク ラ ス タ ー 分 析 の 志 向 は ま っ た く 自 然 な も の と い え る 。 具 体 的 に は 、 い く つ か の 変 数 ( 質 問 項 目 ) に 対 し て ク ラ ス タ ー 分 析 を 適 用 す れ ば 、 そ の 回 答 パ タ ー ン が 総 合 的 に 近 い 人 々 同 士 を 同 じ グ ル ー プ に す る 分 類 方 法 を 提 案 し て く れ る 。 直 感 に 頼 り が ち な 分 類 手 続 き を 客 観 的 に 行 え る 利 点 も さ る こ と な が ら 、 分 析 者 が 考 え て も い な か っ た 分 類 枠 組 み を 発 見 で き る 可 能 性 が 、 ク ラ ス タ ー 分 析 の 魅 力 で あ る 。 ( 教 材 ) 「 学 生 の 恋 愛 観 に 関 す る 調 査 」の 問 13 調 査 対 象:関 西 大 学 学 生( 2014 年 度 計 量 社 会 学 Ⅰ 受 講 生 + 保 田 ゼ ミ 1 期 生 )+ 大 阪 大 学 学 生( 2014 年 度 統 計 学 A-I 受 講 生 ) 計 188 名 → 教 材 で は 関 大 1 年 生 49 名 に 限 定 調 査 時 期 : 2014 年 6 月 調 査 方 法 : 講 義 受 講 者 へ の 集 合 調 査 調 査 主 体 : 保 田 ゼ ミ 2 期 生 問13 理想の恋人を思い浮かべたときに、以下の項目をどれくらい重視しますか。例のよう に、重視する度合いを面積の大きさで表現してください。すべての項目を記入する必 要はありません。 ①.顔の良さ ②.スタイル ③.ファッション ④.頭の良さ ⑤.性格の良さ ⑥.ユーモア ⑦.将来性 ⑧.趣味が合うか ⑨.価値観が合うか ⑩.その他(具体的に: ) (例) この例の場合、面積の大きな1,5,9は重視する度合 いが高く、2,4,6,8は、そこまで重視しないというこ とになる。また、描かれていない3,7,10に関しては全 く重視しないということになる。 回答スペース ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

(2)

クラスター分析 - 2 - ■ 自 分 で 分 類 し て み よ う グ ル ー プ へ の 「 分 類 」 は 、 日 常 的 に お こ な わ れ る 作 業 で あ る が 、 我 々 は 何 を 基 準 に グ ル ー プ の 線 引 き を し て い る の だ ろ う か 。「 学 生 の 恋 愛 観 に 関 す る 調 査 」の 結 果 の 一 部( n= 49) を も と に 、 分 類 の 考 え 方 を 改 め て 見 直 し て み よ う 。 話 を 簡 単 に す る た め に 、 2 つ の 変 数 だ け を 取 り 扱 う こ と に す る 。問 13 で は「 理 想 の 恋 人 に 求 め る 条 件 」と し て 9 つ の 項 目 を ど の 程 度 重 視 す る か を 得 点 化 し て い る が 、 そ の う ち 「 顔 の 良 さ 」 と 「 性 格 の 良 さ 」 の 2 つ で 散 布 図 を 描 く と 下 の よ う に な る ( 図 1)。 こ の 散 布 図 を も と に 、 人 々 を 分 類 し て み よ う 。 ( 練 習 ) 1.自 分 の 感 覚 で 3 つ の グ ル ー プ( ク ラ ス タ ー )に 分 け る こ と を 考 え て 、そ れ ぞ れ の グ ル ー プ を 線 で 囲 っ て み よ う 。( メ ン バ ー が 1 人 し か い な い グ ル ー プ が あ っ て も よ い ) 2. 自 分 が 作 っ た そ れ ぞ れ の グ ル ー プ ( ク ラ ス タ ー ) に 名 前 を 付 け て み よ う 。 3.作 業 の 結 果 を 、周 り の 人 の 分 類 と 比 べ て み よ う 。分 け 方 が 違 っ た 場 合 、線 の 引 き 方 に つ い て ど う 考 え 方 が 違 っ た の か 、 話 し 合 っ て み よ う 。 図 1 「 顔 を 重 視 」 と 「 性 格 を 重 視 」 の 散 布 図

(3)

クラスター分析 - 3 - ■ 連 結 す べ き か 、 し な い べ き か グ ル ー プ ( ク ラ ス タ ー ) の 作 り 方 に は 、 当 然 い ろ い ろ な 考 え 方 が あ る が 、 基 本 的 に は 、 近 く の 人 た ち を 同 じ グ ル ー プ に 分 類 し よ う と し た は ず で あ る 。 ク ラ ス タ ー 分 析 も ま っ た く 同 じ 発 想 で 、 人 々 の 間 の 正 確 な 距 離 ( distance) を 計 算 し て 、 分 類 の 仕 方 を 考 え る 。 し か し 、 距 離 を 基 準 に す る と い う 方 針 が 決 ま っ て い て も 、 誰 と 誰 の 連 結 を 優 先 し て グ ル ー プ を 作 る か 、 連 結 の 判 断 を す る こ と は 意 外 と 難 し い 。 た と え ば 、 あ る 2 人 を 連 結 す る か ど う か は 、 彼 ら の 距 離 だ け で な く 、 彼 ら の 周 り に も っ と 距 離 の 近 い 他 人 が い る か ど う か に も か か っ て く る だ ろ う ( 他 に も っ と 近 い 人 が い れ ば 、 そ ち ら と 連 結 し て グ ル ー プ を 作 る 方 が よ い )。あ る い は 、近 い 人 同 士 を ど ん ど ん 連 結 し て い く と 、そ れ ぞ れ の 連 結 に は 無 理 が な く て も 、 結 果 と し て で き あ が っ た グ ル ー プ が 非 常 に 大 き な 範 囲 に 広 が っ て し ま い 、 端 っ こ の 人 同 士 は 似 て も 似 つ か な い 、 と い う こ と に な っ て し ま う か も し れ な い 。 ク ラ ス タ ー 分 析 で は 、 ど の 部 分 を 優 先 的 に 連 結 す べ き か を 1 つ ず つ 計 算 し て 、 小 グ ル ー プ 同 士 の 連 結 を 徐 々 に 進 め て い く 。し か し 、上 記 の よ う に 、そ の 判 断 は 単 純 で は な い の で 、 分 析 者 は そ の 判 断 基 準 の 設 定 を さ ま ざ ま に 変 更 す る こ と が で き る 。 統 計 分 析 ソ フ ト は 、 そ れ ぞ れ の 判 断 基 準 に 応 じ た 、 複 数 の 「 正 し い 」 分 類 結 果 を 出 し て く れ る 。 代 表 的 な 連 結 基 準 は 、 以 下 の 3 つ で あ る ( 図 2)。 平 均 連 結 ( average linkage) は 連 結 し よ う と す る 小 グ ル ー プ の 間 で す べ て の 個 体 間 の 組 み 合 わ せ で 距 離 を 調 べ て 、 そ の 平 均 距 離 が 小 さ い よ う な 連 結 を 優 先 す る 。 近 く に 見 え る も の は ど ん ど ん 連 結 し て 、 お お ら か な グ ル ー プ を 作 り や す い 。 こ れ に 対 し て 完 全 連 結 [ 最 遠 接 法 ]( complete linkage; furthest neighbor) の 考 え 方 は 、 グ ル ー プ に 所 属 す る ど の 個 体 を 取 っ て も 距 離 が 近 い と い う 完 全 性 を 要 求 す る 。す な わ ち 、も っ と も 遠 い 個 体 間 で も 距 離 が 小 さ く な る よ う な 連 結 を 優 先 す る 。 こ ち ら は 、 グ ル ー プ が む や み に 大 き く な る こ と を 避 け る 判 断 基 準 と い え る 。 ま た 、 ウ ォ ー ド 法 ( Ward’s method) は 、 グ ル ー プ 内 で の 各 ペ ア の 距 離 の 合 計 が 大 き く 膨 ら ま な い よ う に 連 結 を 進 め る 。 や や 理 解 し に く い が 、 数 学 的 に は 上 の 2 つ の 基 準 を 両 方 加 味 し た バ ラ ン ス の よ い 判 断 基 準 で あ る 。 た だ し 、 か な り 保 守 的 な 基 準 な の で 、 あ ま り 意 味 の な い 小 さ な グ ル ー プ を た く さ ん 作 っ て し ま う こ と も あ る 。 平 均 連 結 完 全 連 結 [ 最 遠 接 法 ] ウ ォ ー ド 法 図 2 3 つ の 連 結 基 準 の 模 式 図

(4)

クラスター分析 - 4 - こ れ ら の 連 結 の 基 準 の う ち ど れ を 採 用 す る か は 、 理 念 的 に は 分 析 者 の 目 的 に 応 じ て 決 め る べ き だ が 、 実 際 的 に は 、 そ れ ぞ れ 試 し た 上 で 、 有 意 義 な 意 味 が 読 み 取 れ る 分 類 を し て く れ た 基 準 を 採 用 す る こ と が 多 い 。 分 類 の 価 値 は 、 結 局 、 そ の 分 類 が ど れ だ け 示 唆 に 富 ん で い る か ( 他 の こ と を 考 え る た め に 役 立 つ か ) で 決 ま る か ら で あ る 。 ( 練 習 ) 下 の 図 は 、 実 際 に ク ラ ス タ ー 分 析 を お こ な っ て 3 つ の ク ラ ス タ ー に 分 け た 結 果 で あ る 。 一 方 は 、「 平 均 連 結 」に よ る ク ラ ス タ ー で 、も う 一 方 は「 完 全 連 結 」に よ る ク ラ ス タ ー で あ る 。ど ち ら が ど ち ら か 予 想 し て み よ う 。( ウ ォ ー ド 法 で の 分 類 は 平 均 連 結 と 同 じ 結 果 に な っ た の で 省 略 ) 図 3a ( 平 均 連 結 ・ 完 全 連 結 ) の 結 果 図 3b ( 平 均 連 結 ・ 完 全 連 結 ) の 結 果 ※ 加 工 し た デ ー タ や 必 要 な ア ウ ト プ ッ ト の 保 存 用 の メ デ ィ ア を 持 参 す る よ う に 。 関 大 My ボ ッ ク ス で 、 大 学 の Z ド ラ イ ブ に 自 宅 か ら も ア ク セ ス し て も よ い 。 「 関 西 大 学 IT セ ン タ ー 関 大 My ボ ッ ク ス 」 http://www.itc.kansai-u.ac.jp/services/webstorage.html ※ 資 料 や デ ー タ は Web 上 に も 置 い て い る の で 、 必 要 に 応 じ て 復 習 す る こ と 。 「 保 田 時 男 の ペ ー ジ 」 http://www2.itc.kansai-u.ac.jp/~tyasuda/ ※ 自 宅 の PC へ の SPSS の イ ン ス ト ー ル 方 法 は 下 記 を 参 照 。 「 関 西 大 学 IT セ ン タ ー ダ ウ ン ロ ー ド ス テ ー シ ョ ン 」 http://www.itc.kansai-u.ac.jp/services/downloadstation.html

(5)

クラスター分析 - 5 - 社 会 学 研 究 法 a( 2014 年 度 秋 学 期 担 当 :保 田や す だ) 「 ク ラ ス タ ー 分 析 ( 2): SPSS で 実 践 」 ■ SPSS で や っ て み よ う 前 回 は 、 散 布 図 を 見 な が ら 、 ク ラ ス タ ー 分 析 の 考 え 方 に つ い て 学 習 し た 。 今 回 は SPSS を 操 作 し て 、実 際 に ク ラ ス タ ー 分 析 の 結 果 を 出 力 し な が ら 、一 通 り の 手 続 き を 経 験 し よ う 。 ク ラ ス タ ー 分 析 の 操 作 ① メ ニ ュ ー か ら 、 分 析 ➜ 分 類 ➜ 階 層 ク ラ ス タ ② 分 類 の た め に 用 い る 変 数 群 を す べ て [ 変 数 ] 欄 へ ( ②’ 結 果 を ケ ー ス 番 号 以 外 で 示 す 場 合 は 、 ラ ベ ル の 変 数 を [ ケ ー ス の ラ ベ ル ] 欄 へ ) ③ 作 図 ボ タ ン を 押 し て 、 一 番 上 の [ デ ン ド ロ グ ラ ム ] に チ ェ ッ ク し て 続 行

(6)

クラスター分析 - 6 - ④ 方 法 ボ タ ン を 押 し て 、[ ク ラ ス タ 化 の 方 法 ] を 選 択 し て 続 行 平 均 連 結 → [ グ ル ー プ 間 平 均 連 結 法 ] 完 全 連 結 → [ 最 遠 隣 法 ] ウ ォ ー ド 法 → [ Ward 法 ] ( ④’ す べ て の 変 数 を 標 準 化 し て か ら 分 析 す る と き は 、[ 標 準 化 ] で [ Z 得 点 ] を 選 択 ) ( ⑤ 各 ケ ー ス が ど の ク ラ ス タ ー に 分 類 さ れ た か を 、変 数 で 保 存 す る と き は 、保 存 ボ タ ン を 押 し て 、[ 単 一 の 解 ] を 選 び 、 自 分 が 採 用 す る [ ク ラ ス タ の 数 ] を 入 力 ) ⑥ 元 の 窓 で O K ボ タ ン

(7)

クラスター分析 - 7 - ■ デ ン ド ロ グ ラ ム の 読 み 方 ク ラ ス タ ー 分 析 の 結 果 は 、ふ つ う デ ン ド ロ グ ラ ム[ 樹 状 図 ]( dendrogram)と 呼 ば れ る ト ー ナ メ ン ト 表 の よ う な 図 式 で 表 さ れ る ( 図 4)。 1 人 だ け で 1 グ ル ー プ ( 全 員 別 グ ル ー プ ) と い う 左 端 の 状 態 か ら 始 め て 、右 に 進 む に つ れ て ど こ と ど こ を 連 結 し て い く の が 自 然 か を 、 順 に 表 現 し て い る ( 最 後 に は 全 て が 連 結 さ れ て 1 つ だ け の グ ル ー プ に な る )。 グ ル ー プ の 個 数 が 決 ま っ て い る な ら ば 、 そ の 数 に な る よ う に 区 切 り 線 を 引 い て 、 誰 が ど の グ ル ー プ に 分 類 さ れ る の か を 確 認 で き る 。 ま た 、 枝 が 長 い こ と は 連 結 す る こ と が 困 難 で あ る こ と を 示 し て い る の で 、 こ れ を 参 考 に 適 切 な グ ル ー プ 数 を 模 索 す る こ と も で き る 。 枝 が 長 く な っ て い る と こ ろ は ( 統 計 的 に は ) 区 別 を 重 視 し な け れ ば な ら な い 分 類 、 枝 が 短 い と こ ろ は ひ と ま と ま り に す る こ と に 抵 抗 が 少 な い 分 類 で あ る 。 下 図 の 場 合 、 枝 の 長 さ だ け で 考 え れ ば 、5~ 6 個 の グ ル ー プ に 分 類 す る の が よ さ そ う で あ る 。そ れ 以 上 に 分 類 の 数 を 増 や す と 急 に 細 か い ( 枝 の 短 い ) 分 類 に な っ て し ま う か ら で あ る 。 図 4 デ ン ド ロ グ ラ ム の 例 ( 平 均 連 結 ) 3 つ の グ ル ー プ に 分 け る 場 合 の 区 切 り 線 連 結 が 困 難 な ほ ど 枝 が 長 い

(8)

クラスター分析 - 8 - ( 練 習 ) 1.前 ペ ー ジ の 図 4 は 、「 性 格 を 重 視 」「 顔 を 重 視 」の デ ー タ を 、平 均 連 結 で ク ラ ス タ ー 分 析 し た 結 果 で あ る 。 前 回 の 図 3b の 散 布 図 で の 線 引 き と 、 こ の デ ン ド ロ グ ラ ム が 対 応 し て い る こ と を 確 認 し よ う 。 2. 自 分 で SPSS を 操 作 し て 、 図 4 と 同 じ デ ン ド ロ グ ラ ム を 出 力 し よ う 。 3. か り に 、 も っ と 細 か い 分 類 を 採 用 し て グ ル ー プ ( ク ラ ス タ ー ) を 5 個 に す る な ら ば 、 ど の よ う な 分 類 に な る か 。出 力 し た デ ン ド ロ グ ラ ム を 読 み 取 っ て 、下 の 散 布 図 に グ ル ー プ 分 け の 区 切 り 線 を 描 こ う 。 4.設 定 を「 ウ ォ ー ド 法 」に 変 更 し て デ ン ド ロ グ ラ ム を 出 力 し 、そ の 結 果 か ら( 枝 の 長 さ を 参 考 に し つ つ )自 分 が 適 切 だ と 思 う ク ラ ス タ ー の 数 を 決 め よ う 。そ し て 、そ の ク ラ ス タ ー を 下 の 散 布 図 に 描 こ う 。

(9)

クラスター分析 - 9 - ■ グ ル ー プ ( ク ラ ス タ ー ) の 特 徴 を 記 述 す る ク ラ ス タ ー 分 析 に 使 用 し た 変 数 の 数 が 2 個 し か な い 場 合 に は 、 析 出 さ れ た グ ル ー プ ( ク ラ ス タ ー ) の 特 徴 は 、 散 布 図 で 簡 単 に 確 認 で き る 。 し か し 、 多 く の 変 数 を 用 い た 場 合 は 、 多 次 元 空 間( 3 次 元 、4 次 元 、… … )の の 散 布 図 の 中 で グ ル ー プ 分 け を し て い る こ と に な る の で 、 我 々 は 視 覚 的 に そ の グ ル ー プ の 特 徴 を 捉 え る こ と は で き な い 。 そ の 場 合 は 通 常 、各 変 数 の 平 均 値 な ど を 用 い て 、そ れ ぞ れ の グ ル ー プ の 特 徴 を 記 述 す る 。 平 均 値 は 表 に ま と め て も よ い し 、 直 感 的 に 訴 え た け れ ば グ ラ フ に ま と め て も よ い 。 ま た 、読 み 取 っ た 特 徴 か ら 各 グ ル ー プ に は 分 析 者 が 名 前 を 付 け る こ と が 多 い 。「 第 1 ク ラ ス タ ー は 、… … と い う 特 徴 が あ る の で 、顔 偏 重 タ イ プ と 名 付 け ま し た 。第 2 ク ラ ス タ ー は 、 バ ラ ン ス タ イ プ で 、 … … 」 と い っ た よ う に 名 前 が 付 い て い る と 、 分 類 の 結 果 が 他 人 に も わ か り や す い 。 た だ し 、 名 前 に 引 っ 張 ら れ て 実 際 の 特 徴 と は 異 な る 意 味 を 感 じ て し ま う こ と も あ る の で 、 命 名 は 慎 重 に お こ な お う 。 「 恋 人 に 重 視 す る 条 件 」の 9 つ の 項 目 を す べ て 活 用 し た ク ラ ス タ ー 分 析 で 例 を 示 そ う 。9 項 目 の 変 数 群 な の で 、 9 次 元 空 間 で の 距 離 か ら グ ル ー プ 分 け を 考 え て い る こ と に な る 。 一 番 無 難 な ウ ォ ー ド 法 を 用 い た と こ ろ 、 そ の デ ン ド ロ グ ラ ム は 図 5 の よ う に な っ た 。 枝 の 長 さ で 考 え る と 、 3~ 7 個 程 度 の ク ラ ス タ ー が 適 切 そ う だ が 、 今 回 は 5 つ と し て み た 。 図 5 9 変 数 の ク ラ ス タ ー 分 析 で の デ ン ド ロ グ ラ ム ( ウ ォ ー ド 法 )

(10)

クラスター分析 - 10 - 5 つ の ク ラ ス タ ー ご と に 各 変 数 の 平 均 点 を 算 出 す る と 、 表 1 の よ う に な っ た 。 図 6 は こ れ を レ ー ダ ー チ ャ ー ト に 表 わ し た も の で あ る 。 直 感 的 に は 、 表 よ り も こ ち ら の 方 が わ か り や す い 。平 均 点 を よ く 見 て 、そ れ ぞ れ の グ ル ー プ に「 趣 味 共 有 型 」「 ル ッ ク ス 型 」「 享 楽 型 」 「 バ ラ ン ス 型 」「 性 格 オ ン リ ー 型 」と い う 名 前 を 付 け た 。一 番 人 数 が 多 い の は バ ラ ン ス 型( 20 人 ) で 、 他 は 横 並 び で あ る 。 性 格 を 第 一 に あ げ な が ら も 他 も そ れ ぞ れ 大 切 と い う バ ラ ン ス 重 視 の 学 生 が 、 や は り 一 番 多 い よ う で あ る 。 ル ッ ク ス 型 は 顔 や ス タ イ ル を 重 視 す る 傾 向 が 突 出 し て い る 。 趣 味 共 有 型 と 享 楽 型 は 価 値 観 と 性 格 を 重 視 す る 点 で 似 て い る が 、 前 者 は 趣 味 を 通 じ て 、 後 者 は ユ ー モ ア を 通 し て の 交 流 を 重 視 し て い る 。 性 格 オ ン リ ー 型 は と に か く 性 格 重 視 で あ る が 、も し か す る と 具 体 的 な 理 想 の イ メ ー ジ が わ い て い な い の か も し れ な い 。 表 1 ク ラ ス タ ー 別 の 各 変 数 の 平 均 点 ク ラ ス タ ー 1 ( 趣 味 共 有 型 ) ク ラ ス タ ー 2 ( ル ッ ク ス 型 ) ク ラ ス タ ー 3 ( 享 楽 型 ) ク ラ ス タ ー 4 ( バ ラ ン ス 型 ) ク ラ ス タ ー 5 ( 性 格 オンリー型 ) 顔 の 良 さ 148 279 71 85 92 ス タ イ ル 92 191 35 66 84 フ ァ ッ シ ョ ン 46 89 45 64 42 頭 の 良 さ 27 48 52 74 76 性 格 の 良 さ 273 177 307 203 465 ユ ー モ ア 37 31 200 96 80 将 来 性 26 55 19 77 78 趣 味 が 合 う か 300 30 145 97 49 価 値 観 が 合 う か 207 34 265 154 136 分 類 ケ ー ス 数 6 6 8 20 7 図 6 ク ラ ス タ ー 別 の レ ー ダ ー チ ャ ー ト 0 100 200 300 400 顔の良さ スタイル ファッション 頭の良さ 性格の良さ ユーモア 将来性 趣味が合うか 価値観が合う か クラスター1 0 100 200 300 400 顔の良さ スタイル ファッション 頭の良さ 性格の良さ ユーモア 将来性 趣味が合うか 価値観が合う か クラスター2 0 100 200 300 400 顔の良さ スタイル ファッション 頭の良さ 性格の良さ ユーモア 将来性 趣味が合うか 価値観が合う か クラスター3 0 100 200 300 400 顔の良さ スタイル ファッション 頭の良さ 性格の良さ ユーモア 将来性 趣味が合うか 価値観が合う か クラスター4 0 100 200 300 400 顔の良さ スタイル ファッション 頭の良さ 性格の良さ ユーモア 将来性 趣味が合うか 価値観が合う か クラスター5

(11)

クラスター分析 - 11 - ( 練 習 ) 表 1 と 同 じ 数 値 が 読 み 取 れ る ま で の 操 作 を SPSS で 再 現 し て み よ う 。 ( 1) 9 個 の 変 数 で ウ ォ ー ド 法 の ク ラ ス タ ー 分 析 を 実 行 ( 2) デ ン ド ロ グ ラ ム か ら 5 個 の ク ラ ス タ ー が 適 切 と 読 み 取 る ( 3) 各 ケ ー ス が ど の ク ラ ス タ ー に 属 す る の か を 示 す 変 数 を 作 成 ( 4) 作 成 さ れ た グ ル ー プ 分 け の 変 数 を 使 っ て 、 グ ル ー プ 別 の 平 均 値 を 算 出

(12)

クラスター分析 - 12 - ■ ( 参 考 ) 関 連 す る SPSS の 操 作 グ ル ー プ 別 に 平 均 点 を 出 力 ク ラ ス タ ー 分 析 で 、 グ ル ー プ ご と に 平 均 点 を 算 出 す る た め に は 、 ま ず そ れ ぞ れ の ケ ー ス が 何 個 目 の グ ル ー プ ( ク ラ ス タ ー ) に 属 す る か を 示 す 変 数 を 作 成 し な け れ ば な ら な い 。 ク ラ ス タ ー 分 析 を 実 行 す る 際 に オ プ シ ョ ン 指 定 を す れ ば 、 こ の 変 数 は 「 CLU...」 と い っ た 変 数 名 で 自 動 的 に 作 成 さ れ る ( p.6 の ⑤ )。 あ と は こ の 変 数 を 使 っ て 、 ふ つ う に グ ル ー プ 別 に 平 均 値 を 出 力 す る 命 令 を 出 せ ば よ い 。 ① メ ニ ュ ー か ら 、 分 析 ➜ 平 均 の 比 較 ➜ グ ル ー プ の 平 均 ② グ ル ー プ 分 け に 使 う 変 数 ( CLU...) を [ 独 立 変 数 ] へ 。 平 均 値 を 出 す 変 数 群 ( ク ラ ス タ ー 分 析 に 使 っ た 一 連 の 変 数 ) を [ 従 属 変 数 ] へ 。 ③ オ プ シ ョ ン ボ タ ン を 押 し て 、 集 計 し た い 統 計 量 を [ セ ル 統 計 量 ] に 選 択 し て 続 行 ( 必 要 な ら ば 、 平 均 以 外 に も い ろ い ろ な 統 計 量 を 、 グ ル ー プ 別 に 集 計 で き る ) ④ 元 の 窓 で O K ボ タ ン

(13)

クラスター分析 - 13 - 散 布 図 を 描 く 2 変 数 だ け で ク ラ ス タ ー 分 析 を す る 場 合 に は 、 あ ら か じ め 散 布 図 で 各 ケ ー ス の 位 置 関 係 を 把 握 し て お く と 、 結 果 が 理 解 し や す い 。 ① メ ニ ュ ー か ら 、 グ ラ フ ➜ レ ガ シ ー ダ イ ア ロ グ ➜ 散 布 図 /ド ッ ト ② [ 単 純 な 散 布 ] を 選 択 し て 、 定 義 ボ タ ン ③ [ Y 軸 ] 欄 と [ X 軸 ] 欄 に そ れ ぞ れ の 変 数 を 移 動 ( ④ 散 布 図 の 印 を 個 人 識 別 す る 場 合 、 オ プ シ ョ ン ボ タ ン を 押 し て 、[ 図 表 に ケ ー ス ラ ベ ル を 表 示 ] に チ ェ ッ ク し て 続 行 ) ( 個 人 識 別 を ケ ー ス 番 号 以 外 で 示 し た い 場 合 、ラ ベ ル の 変 数 を[ ケ ー ス の ラ ベ ル ]欄 へ ) ⑤ 元 の 窓 で O K ボ タ ン

(14)

クラスター分析 - 14 - 社 会 学 研 究 法 a( 2014 年 度 秋 学 期 担 当 :保 田や す だ) 「 ク ラ ス タ ー 分 析 ( 3): 発 展 」 ■ 非 階 層 的 ク ラ ス タ ー 分 析 以 上 の 説 明 で ク ラ ス タ ー 分 析 の 一 連 の 手 続 き が 使 え る 状 態 に な っ た( は ず )。た だ 、ク ラ ス タ ー 分 析 は 「 分 類 」 の 技 法 で あ り 、 分 類 の 仕 方 は 多 種 多 様 で あ る か ら 、 ク ラ ス タ ー 分 析 に は も っ と い ろ い ろ な 側 面 か ら 発 展 の 可 能 性 が 残 さ れ て い る 。 比 較 的 よ く 知 ら れ る 側 面 を い く つ か 紹 介 し て お こ う 。 こ の 講 義 で 扱 っ た ク ラ ス タ ー 分 析 は 、 全 ケ ー ス が ば ら ば ら の ク ラ ス タ ー と い う 状 況 か ら 出 発 し て 、 距 離 の 近 い も の を 順 次 連 結 し て い く デ ン ド ロ グ ラ ム を 用 い た 方 法 で あ っ た 。 こ の よ う な ク ラ ス タ ー 分 析 を 、と く に 階 層 的 ク ラ ス タ ー 分 析( hierarchical clustering)と 呼 ぶ 。 異 な る ア プ ロ ー チ と し て 、 ク ラ ス タ ー の 個 数 を 自 分 で 指 定 し て や り 、 適 当 な 初 期 分 類 か ら 1 ケ ー ス ず つ ク ラ ス タ ー 間 を 移 動 さ せ な が ら よ り 適 切 な 分 類 に 近 づ い て い く 非 階 層 的 ク ラ ス タ ー 分 析( non-hierarchical clustering)が あ る 。階 層 的 ク ラ ス タ ー 分 析 は 、ケ ー ス 数 が 少 な く 、 個 別 の ケ ー ス の 所 属 先 や ま と ま り 方 を 記 述 し た い 場 合 に 向 い て い る 。 逆 に 、 非 階 層 的 ク ラ ス タ ー 分 析 は 、 ケ ー ス 数 が 多 く 、 個 別 の ケ ー ス よ り も 全 体 と し て ど の よ う な 特 徴 の ク ラ ス タ ー が 形 成 さ れ た か を 記 述 し た い 場 合 に 向 い て い る 。 非 階 層 的 ク ラ ス タ ー 分 析 で は 、 通 常 、 小 さ な 数 の ク ラ ス タ ー か ら 順 に 徐 々 に ク ラ ス タ ー の 数 の 設 定 を 大 き く し て い き 、 分 類 が 過 剰 に な っ た と こ ろ で 止 め て 、 直 前 の ク ラ ス タ ー 数 を 採 択 す る 。 SPSS で は「 分 析 ➜ 分 類 ➜ 大 規 模 フ ァ イ ル の ク ラ ス タ 」の メ ニ ュ ー で 非 階 層 的 ク ラ ス タ ー 分 析 が 実 行 で き る 。基 本 的 に 、「 ク ラ ス タ ー の 個 数 」を 自 分 で 指 定 し て や る 以 外 は 、階 層 的 ク ラ ス タ ー 分 析 と 同 様 で あ る 。 デ ン ド ロ グ ラ ム は 作 る こ と が で き な い の で 、 ク ラ ス タ ー 別 の 各 変 数 の 平 均 値 が 自 動 的 に 出 力 さ れ 、 各 ク ラ ス タ ー の 内 容 を 記 述 し て く れ る 。 ■ 変 数 の 標 準 化 ク ラ ス タ ー 分 析 で は 、 ケ ー ス 間 の 距 離 を 基 準 に し て 分 類 を 考 え る の で 、 分 析 す る 変 数 群 の 分 散 ( ば ら つ き 具 合 ) に は 気 を 遣 う 必 要 が あ る 。 か り に 使 用 し た 変 数 の う ち 1 つ だ け が 分 散 ( ば ら つ き 具 合 ) が 大 き い 変 数 だ っ た り す る と 、 そ の 変 数 の 値 だ け が 距 離 に 大 き く 影 響 し て し ま う か ら で あ る 。 こ の た め 、 ま っ た く 内 容 の 異 な る ( 分 散 の 異 な る ) 変 数 群 で 分 析 を 行 う 際 に は 、各 変 数 を 平 均 値 0、標 準 偏 差 1 の 得 点( z ス コ ア )に 標 準 化 し て か ら 分 析 に 使 う こ と が 多 い 。 た と え ば 、 勤 続 年 数 と 年 収 で ク ラ ス タ ー 分 析 を す る と 、 勤 続 年 数 は ± 10 年 く ら い の ば ら つ き な の に 対 し て 、年 収 は ±1,000,000 円 く ら い の ば ら つ き が あ る た め 、 年 収 の 方 が 分 類 の 仕 方 に 大 き な 影 響 を お よ ぼ し た り す る こ と が あ る 。 こ の 授 業 で は 、 同 じ 尺 度 の 変 数 だ け を 使 っ た の で 、 標 準 化 は 考 え な か っ た 。 ■ 距 離 の 測 り 方 日 常 で 「 距 離 」 と 言 え ば 、 ふ つ う 定 規 で 測 れ る 長 さ の こ と で あ る が 、 数 学 的 に は こ れ を ユ ー ク リ ッ ド 距 離 と 呼 ぶ 。 ク ラ ス タ ー 分 析 で 距 離 を 観 察 す る の は 、 ケ ー ス 間 の 類 似 性 、 非

(15)

クラスター分析 - 15 - 類 似 性 を 調 べ る た め で あ る か ら 、必 ず し も ユ ー ク リ ッ ド 距 離 に こ だ わ る 必 要 は な い 。実 際 、 標 準 的 に は 、 平 方 ユ ー ク リ ッ ド 距 離 と 呼 ば れ る 測 り 方 が 用 い ら れ る こ と が 多 い 。 こ れ は ユ ー ク リ ッ ド 距 離 の 2 乗 で あ る 。 こ ち ら を 採 用 し た 方 が 、 平 均 距 離 を 算 出 し た り す る 際 に 、 そ の 離 れ 具 合 を 加 速 度 的 に 評 価 す る こ と に な っ て 、 ふ つ う は 望 ま し い 。 そ の 他 に も 多 種 多 様 な 距 離 概 念 が 存 在 す る 。 こ の 講 義 で は 、 標 準 の 平 方 ユ ー ク リ ッ ド 距 離 を 用 い て 分 析 を お こ な う こ と に す る の で 、 あ ま り 深 入 り す る 必 要 は な い が 、 そ う い う 別 の 考 え 方 も あ る と い う こ と を 知 っ て お こ う 。 連 結 の 基 準 の 設 定 と 同 じ よ う に 、 理 念 的 に は 、 分 析 者 の 考 え に マ ッ チ す る 距 離 概 念 を 選 択 し て 採 用 す べ き で あ る が 、 実 際 的 に は 、 分 析 結 果 と に ら み 合 っ て 、 よ く 意 味 の わ か ら な い 分 類 が 示 さ れ た と き に 、 距 離 概 念 の 設 定 を 変 更 し て 、 結 果 が 変 わ ら な い か 試 し て み た り す る こ と が 多 い 。 ■ 使 用 し た 変 数 以 外 で の ク ラ ス タ ー の 記 述 こ の 講 義 で は 、 そ れ ぞ れ の ク ラ ス タ ー の 特 徴 を 記 述 す る 際 に 、 使 用 し た 変 数 の 平 均 値 を 参 照 す る 方 法 を 紹 介 し た 。 同 じ よ う に 、 分 析 に 「 使 用 し て い な い 」 変 数 の 平 均 値 も 、 当 然 算 出 す る こ と が で き る 。 た と え ば 、 平 均 学 年 と か 、 女 子 学 生 の 割 合 ( 男 子 を 0、 女 子 を 1 と し た ダ ミ ー 変 数 の 平 均 値 ) で 、 各 ク ラ ス タ ー の 特 徴 を 記 述 で き る 。 こ の よ う な 記 述 は 、 分 類 の た め に 使 っ た 変 数 ( こ の 科 目 へ の 関 心 理 由 ) が 他 の 変 数 と ど う 関 係 し て い る の か を 読 み 取 る た め に 、 非 常 に 便 利 で あ る 。 手 軽 な 方 法 な の で 、 有 効 に 活 用 し て ほ し い 。 ■ よ い 分 類 と は ? ク ラ ス タ ー 分 析 で は 、 い ろ い ろ な 分 類 の 可 能 性 が 示 さ れ る の で 、 結 局 、 ど の 分 類 の 仕 方 が よ い の か 迷 っ て し ま う 場 合 も 多 い 。 そ の と き に は 、 改 め て 、 な ぜ 分 類 が し た い の か を 思 い 出 し て み よ う 。 ク ラ ス タ ー 分 析 を お こ な う べ き 状 況 は 、 大 き く 分 け て 2 つ あ る 。 1 つ は 、 だ い た い 分 類 の 仕 方 は 想 像 が つ く の だ け れ ど も 、 具 体 的 に ど の ケ ー ス が ど の グ ル ー プ に 属 す る の か を 知 り た い と い う 場 合 で あ る 。 匿 名 の 回 答 者 デ ー タ の 場 合 、 こ の よ う な 関 心 は 起 こ ら な い は ず で あ る が 、 た と え ば 記 名 式 調 査 で あ る と か 、 あ る い は 都 道 府 県 が ケ ー ス 単 位 に な っ て い る デ ー タ の よ う に 、 何 ら か の 匿 名 で な い 意 味 の あ る 個 体 が 1 ケ ー ス を 表 わ し て い る 場 合 、 こ の よ う な 関 心 が あ り え る 。 も う 1 つ は 、 そ も そ も ど ん な 分 類 の 仕 方 が 考 え ら れ る の か 、 想 像 が つ か な い 、 あ る い は 自 己 流 の 分 類 で は し っ く り 来 な い 、 と い う よ う な 場 合 で あ る 。 こ の よ う な と き 、 ク ラ ス タ ー 分 析 は 、 統 計 と い う 客 観 的 基 準 に よ っ て 、 主 観 的 に は 把 握 し に く い よ う な 分 類 の 仕 方 を 見 つ け 出 し て く れ る 。 だ か ら 、 新 し い 、 そ し て 納 得 の い く 分 類 の 仕 方 に 出 会 え れ ば 、 そ れ は よ い 分 類 で あ り 、 そ の ク ラ ス タ ー 分 析 は 成 功 で あ る 。 デ ン ド ロ グ ラ ム を 眺 め て い る だ け で は よ い 分 類 か ど う か は 判 断 で き な い 。 使 用 し た 変 数 や そ れ 以 外 の 変 数 で 、 ク ラ ス タ ー の 特 徴 を 記 述 す る ( 平 均 値 を 出 す ) こ と で 、 何 か 訴 え て く る も の が あ る 分 類 方 法 が な い か 、 よ く 探 索 、 吟 味 し よ う 。

(16)

クラスター分析 - 16 - ■ ク ラ ス タ ー 分 析 の 手 順 の ま と め ( 階 層 的 ) ク ラ ス タ ー 分 析 の 一 般 的 な 手 順 を 、 改 め て ま と め て お く ( 1) ク ラ ス タ ー の 連 結 法 の 選 択 ま ず 、ク ラ ス タ ー の 連 結 法 を そ れ ぞ れ 選 択 す る( 必 要 が あ れ ば 、上 記 の「 距 離 の 測 り 方 」 も 選 択 す る )。と く に 理 由 が な け れ ば 、ウ ォ ー ド 法 か ら 始 め る の が 堅 実 な こ と が 多 い 。実 際 的 に は 、 い ろ い ろ と 試 し て み て 納 得 で き る 結 果 を 事 後 的 に 採 用 す る 。 ( 2) ク ラ ス タ ー 数 の 選 択 ク ラ ス タ ー の 連 結 過 程 は 、デ ン ド ロ グ ラ ム に 表 さ れ る 。ど の 個 数 で ク ラ ス タ ー を 切 れ ば 、 ど の よ う な ク ラ ス タ ー が 形 成 さ れ る か は 一 目 瞭 然 な の で 、 納 得 の い く 個 数 で ク ラ ス タ ー を 切 っ て 、 ク ラ ス タ ー の 数 を 決 め る 。 距 離 が 離 れ て い る ク ラ ス タ ー を 連 結 す る 際 に は 、 デ ン ド ロ グ ラ ム の 枝 も 長 く な る よ う に 表 現 さ れ て い る の で 、 基 本 的 に は 枝 の 長 い 分 類 は 残 す よ う に 考 え れ ば よ い 。 ( 3) 読 み 取 る べ き ポ イ ン ト ・ 各 ク ラ ス タ ー の 特 徴 ( 使 用 し た 変 数 の 平 均 値 の 比 較 ) ・ 各 ケ ー ス が ど の ク ラ ス タ ー に 所 属 し て い る か ・ よ り 適 切 な 分 類 方 法 は な い か 模 索 ・ 析 出 さ れ た ク ラ ス タ ー と 他 の 変 数 の 関 係 ( 他 の 変 数 の 平 均 値 の 記 述 な ど ) < 参 考 文 献 >

Landau, Sabine and Brian S. Everitt, 2004, A Handbook of Statistical Analyses Using SPSS, Chapman & Hall/CRC.

村 瀬 洋 一 ・ 高 田 洋 ・ 廣 瀬 毅 士 , 2007, 『 SPSS に よ る 多 変 量 解 析 』 オ ー ム 社 . 小 田 利 勝 , 2007, 『 ウ ル ト ラ ・ ビ ギ ナ ー の た め の SPSS に よ る 統 計 解 析 入 門 』 プ レ ア デ ス 出 版 .( ← SPSS で の デ ー タ 分 析 を 学 習 す る た め に 、 絶 対 お す す め ! ) * * * 小 課 題 * * * Web ペ ー ジ (http://www2.itc.kansai-u.ac.jp/~tyasuda/) か ら 「 小 課 題 用 デ ー タ 」 を ダ ウ ン ロ ー ド し て 、大 学 生 の 幸 福 感 の 軌 跡 に つ い て 、ク ラ ス タ ー 分 析 を お こ な い 、「 小 課 題 提 出 フ ァ イ ル 」の レ ポ ー ト を 完 成 さ せ な さ い 。( 10 月 28 日 提 出 、1 回 遅 れ ま で は 減 点 で 受 け 取 り ま す )

参照

関連したドキュメント

Bでは両者はだいたい似ているが、Aではだいぶ違っているのが分かるだろう。写真の度数分布と考え

テキストマイニング は,大量の構 造化されていないテキスト情報を様々な観点から

前章 / 節からの流れで、計算可能な関数のもつ性質を抽象的に捉えることから始めよう。話を 単純にするために、以下では次のような型のプログラム を考える。 は部分関数 (

実際, クラス C の多様体については, ここでは 詳細には述べないが, 代数 reduction をはじめ類似のいくつかの方法を 組み合わせてその構造を組織的に研究することができる

析の視角について付言しておくことが必要であろう︒各国の状況に対する比較法的視点からの分析は︑直ちに国際法

これら諸々の構造的制約というフィルターを通して析出された行為を分析対象とする点で︑構

※ CMB 解析や PMF 解析で分類されなかった濃度はその他とした。 CMB

 千葉 春希 家賃分布の要因についての分析  冨田 祥吾 家賃分布の要因についての分析  村田 瑞希 家賃相場と生活環境の関係性  安部 俊貴