3.1.2 階層的クラスター分析の方法
(1)階層的クラスター分析の考え方
クラスター分析とは、「一群の対象のどれとどれが類似しているかを見 つけだすために用いられるさまざまな数学的方法の総称」52)である。変数 間の関係についての情報から出発して、変数間に意味のあるまとまり(ク ラスター)を見つけだそうとする多変量解析のひとつである。
クラスター分析はさまざまな分野に広く応用53)されており、分析の目的 や用途に応じて、いろいろな方法が提唱されている。学校教育に関連する
ものでは、藤田54)らが、ソシオメトリックデータに対する新しい手法とし て提案している。また、小川55)は、児童生徒の分類手段として教授方略立 案に際しての有効性を明らかにしている。しかし、観察・実験のカリキュ
ラム分析への応用について発表されたものはない。
このようなクラスター分析の1つに、分析結果が樹形図(デンドログラ ム)で表される階層的クラスター分析がある。この分析法は、対象間の非類 似度を手がかりにして,樹形図あるいはデンドログラム(dendrogram)と呼 ばれる樹状の分類構造を構成することを目的とする。
この樹形図を適当な断面で切ることにより、1〜n個の任意個数のクラ スターを得ることができる。このとき、枝の先端に近いところで切断して できる少数の構成単位からなるクラスターは、その枝のついている、より 大きい枝の根元のところで切断してできる、多数の構成単位からなるクラ スターにそのまま含まれる。すなわち、樹形図のいろいろな断面で切って できるクラスターは小分類、中分類、… 、大分類という階層的構造に なっている。
第3章 階層的クラスター分析による生徒実験の分析
このように分析結果が樹形図で表されることにより、どの変数が近い関 係にあり同一のクラスターに属しているか、また非類似度がいくつのとき
に、複数のクラスターがより上位のクラスターにまとめられるかを視覚的 に把握することができる利点がある。
(2) 分析の手順
階層的クラスター分析は、次のようなステップによって行われる。
① 初期状態として、n個の個体が1個でそれぞれクラスターとなって いるとする。このとき、クラスター数kはnである。
②クラスター間の非類似度を後述する方法によって求める。
③ k個のクラスターの中でもっとも非類似度の小さい対を求め、それ を一つのクラスターに融合する。これによりクラスター数kはk−1 となる。クラスター数が1、すなわち、全個体で一つのクラスターと なった場合には必要な情報を出力して終了する。それ以外の時には、
②へもどる。
このアルゴリズムによって各個体は順々に融合されていく。一度融合さ れた個体は、後のステップにおいて分離されることはなく階層構造をもっ ている。この特徴から 階層的クラスター分析 と呼ばれている。
(3)非類似度の考え方
次の表のようなm変量のデータが得られているとき、個体間の非類似度 を表す量としては、一般にユークリッド平方距離や標準化ユークリッド平 方距離が用いられる。
3−1 r1個体のm変量観測値
変量
個体
X1 X2
■ ■ ■ ● ●Xm
1 X11 X21
o ■ ■ o ●Xm1
2
X12 X22
■ ● ● ● ■Xm2
: : : :
n Xln X2n
● ● ● ● ■Xmn
(.1)ユークリッド平方距離(squared Euclidean distance)
個体iとjとの非類似度dijを
dijニΣ(Xki−Xkj)2
k=1 により定義する。
(2)標準化ユークリッド平方距離
(standardized squared Eucl idean distance)
個体iとjとの非類似度dijを
ロdij=Σ(Xki−Xkj)2/Sk2
k=1
により定義する。 Sk2は変量Xkの分散を表す。
また、分析するデータが名義尺度で与えられる場合、次のような一致係
数が使われる。例えば、(0,1)のデータの場合、個体iとi につい
て各項目で(0,1)の出現度数を調べて一致係数を算出する。一致係数=(0,0), (1,1)となる変量数/全変量数
第3章 階層的クラスター分析による生徒実験の分析
(3) 階層的クラスター分析の諸方法
クラスター(p)とクラスター(q)を融合してできる新しいクラス
ターをクラスター(t)とする。それぞれのクラスターの構成単位の数をnp、nq、nt(nt=np+nq)とする。別の任意のクラスターをク
ラスター(r)とし、融合する前のクラスター(p)、クラスター(q)との非類似度をdpr、 dqr、融合してできる新しいクラスター(t)との 非類似度をdtrとすると、階層的クラスター分析には、クラスター間の非 類似度dtrの決め方によって次ような方法がある。
(1)最短距離法
(nearest neighor method または singule−linkage clustering method 略して SLINK ともいう)
2つのクラスター間の非類似度が最も小さい値をクラスター間の距離と
する。すなわち,
dtr=min (dpr, dqr)
と定義する。
(2)最長距離法
(furthest neighbor method または complete linkage clustering method 略して CLINK ともいう)
2つのクラスター間の非類似度が最も大きい値をクラスター間の距離と
する。すなわち,
dtr=max (dpr, dqr)
と定義する。
(3)群平均法
(group averge method または unweighted pair−group metod using arithmetic averages略してUPGMAともいう)
2つのクラスター間の非類似度の平均的な値をクラスター間の距離とす
る。すなわち,
dtr=(npdpr十nqdqr)/(np+nq)
と定義する。
(4)重心法(centroid method)
2つのクラスターの重心間の非類似度をクラスター間の距離とする。
すなわち,
dtr={np/(np十nq)}dpr十{nq/(np十nq)}dqr
一{npnq/(np十nq)2}dpqと定義する。
(5)メジアン法
2つのクラスターの代表点の非類似度をクラスター問の距離とし,重心 法を単純化したものである。すなわち,
dtr=(1/2)dpr十(1/2)dqr一(1/4)dpq
と定義する。
(6)ウオード法(Ward method)
クラスターを融合したときに生ずる融合前と融合後のクラスター内偏差 平方和の増分を非類似度とし、最も小さいクラスターから融合していく。
まず、クラスター(p)に含まれるi番目の対象を考え,その変量Xj
に関する観測値をXji(P)とし、クラスター(p)内の偏差平方和の 合計Spを算出する。Spは
Sp=ΣΣ(Xji(P)一Xj(P))2
」・1i・1
と表される。このとき、全体のクラスター内平方和Sはクラスター数をK とすると
第3章階層的クラスター分析による生徒実験の分析
S=ΣSp
j・1 である。
そこで、クラスター(p)とクラスター(q)を融合してクラスター
(t)をつくるとき,クラスター内平方和の合計の増分を△Spqとおくと
△Spqは次式で表される。
エ
△Spq={npnq/(np+nq)}Σ(Xj(P)一Xj(q))2 j=1
ウオード法では、クラスター内平方和ができるだけ小さいことを望まし
いと考え、クラスターの融合による平方和の増分ASpqが最も小さい
(p)と(q)を融合しようとする。
そのため、非類似度dpqとしてこの△Spqを用いる。
2つのクラスター(p)と(q)を融合してつくられたクラスター(t)
と別のクラスター(r)を融合するときの平方和の増分△Strすなわち
非類似度dtr は,dtr=AStr= {ntnr/ (nt+nr) } £ (xj (t) 一xj (r)) 2
すなわち
と定義される。
m ヂ1
= {(np十nr)/(nt十nq)} ASpr
+ {(nq+nr)/(nt+nq)} ASqr 一 {nr/(nt十nq)} ASpq
dtr == {(np十nr)/(nt+nq)} dpr
+ {(nq+nr)/(nt+nq)} dqr 一 {nr/(nt+nq)} dpq3.1,3 階層的クラスター分析による生徒実験の分析方法
(1) 分析項目の選定
昭和44年版中学校学習指導要領理科では、基本理念に探究の過程を重 視した目標観を示し、基本的な科学概念を重視する立場と科学の方法を習 得させる立場から科学的な見方・考え方や自然観を育てるように内容項目 の選定がなされている。
そこで、生徒実験を分析する観点に、科学の方法としての探究の技法と 基本的な科学概念を取り上げることにする。
探究の技法については、SAPAのプロセススキルや44年越中学校指
導書理科編に示された科学の方法56)などを参考に、次の14項目を決定し た。また、基本的な科学概念についても同様に、前記の指導書等57)を参考 に次のような項目を決定した。A 探究の技法による分析項目
観察する・・・・… 五感を用いて、物や状況の性質を見分けたり名 付たりする。
測定する・・・・… 長さ、質量、時間などを測る簡単な装置を使用 する。
数を用いる・・・… 測定値の処理や数式にあてはあて計算する。
空間時間に関連づける・自然事象を時間と空間とに関連付けて把握する。
分類する・・・・… 収集した情報を分類し、体系的に整理する。
図やグラフに表す… 測定結果を図表にまとめたり、グラフで示す。
推論する・・・・… いろいろな観察の結果から、1つあるいはいく
第3章階層的クラスター分析による生徒実験の分析
予測する・・…
データを解釈する・
条件を制御する・・
操作的に定義する・
モデルを利用する
仮説を設定する・・
実験する・・…
つかの結論を推論する。
・・ マ察した出来事の測定点の間を内挿したり、測 定点の範囲を越えて外挿したりして予測する。
・・ fータの表やグラフの示す情報から、推論や仮 説を導き出す。
・・ 件を意図的に一定にしたり、変えたりする。
・・ ??A物、物の性質などを適切に示す操作的定 義を作成する
… 五感で直接認知できない未知な構造や機構を、
既知の具体的な物でおきかえて説明する
・・ マ察事項を一般化したり、観察事項を説明する 仮説を作成したりする。
・・ タ験の計画立案を生徒自身が行い、実験する。
B 基本的な科学概念による分析項目
物質概念、エネルギー概念、生命概念、時間・空間概念、
巨視的物質概念、微視的物質概念、
力学的エネルギー概念、熱的エネルギー概念、
光・音のエネルギー概念、化学的エネルギー概念、
電気的エネルギー概念、
保存概念、
多様性と同一性の概念、生命と連続の概念、
物質交代とエネルギー概念、構造と機能の概念、
相対性の概念、循環性の概念、歴史性の概念