• 検索結果がありません。

階層的クラスター分析

N/A
N/A
Protected

Academic year: 2021

シェア "階層的クラスター分析"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

階層的クラスター分析

記述統計的なコマンドは心理系のところに多そうだから"psych"を読み込む library(psych)

library(stats) library(proxy)

#データを読み込む。environmentのimport data setを使う。次に以下のようにdatとdata frameに入れる。

dat<-pt dat

#後のことも考えて標準化する。この場合、データが数値データであれば、(data-平均)/標準偏差 だから以下のコ マンドで標準化できる

ndata<-scale(dat)

#コンピュータの計算能力を超えるので、数字を丸める cdata<-100*(ndata)

rdata<-round(cdata) rdata

#後で見たくなりそうだから、総当たり相関行列も作る。

cordat<-cor(rdata)

write.table(cordat,"ptcor.csv",sep=",")

#マハラノビス距離の計算

mdist<-proxy::dist(rdata, method="mahalanobis") edc<-hclust(mdist,method="ward.D")

edc

plot(edc,hang=-1,main="mahalanobis-ward")

#念のためユークリッド距離によってデンドログラムをつくる。クラスターの結合はWard法を用いる。データが

標準化してあっても、項目間の相関性があれば、マハラノビス距離の結果と違うはず。

edist<-dist(rdata)

edc<-hclust(edist,method="ward.D") plot(edc,hang=-1,main="euclid-ward")

#データー分布を視覚化してみたいので、古典的な多次元尺度法で2次元プロットする。

mcmd<-cmdscale(mdist) plot(mcmd)

text(mcmd)

#クラスターの仕分け (mclster<-cutree(edc,k=6))

(2)

(eclster<-cutree(edc,k=6))

#データの書き出し

write.table(mclster,"clustermah.csv",sep=",") write.table(eclster,"clustereuc.csv",sep=",")

#非階層的クラスタ分析

kmeans(mdist, 6, iter.max = 200, nstart = 1, algorithm = c("Hartigan-Wong"))

mclsep<-kmeans(mdist, 6, iter.max = 100, nstart = 1, algorithm = c("Hartigan-Wong"))

#データの書き出し

write.table(mclsep$cluster,"categorymah.csv",sep=",")

参照

関連したドキュメント

これらのことから、 次期基本計画の改訂時には高水準減量目標を達成できるように以

砂質土に分類して表したものである 。粘性土、砂質土 とも両者の間にはよい相関があることが読みとれる。一 次式による回帰分析を行い,相関係数 R2

CN 割り込みが発生した場合、ユーザーは CN ピンに対応する PORT レジスタを読み出す

そのような発話を整合的に理解し、受け入れようとするなら、そこに何ら

名の下に、アプリオリとアポステリオリの対を分析性と綜合性の対に解消しようとする論理実証主義の  

このように資本主義経済における競争の作用を二つに分けたうえで, 『資本

前章 / 節からの流れで、計算可能な関数のもつ性質を抽象的に捉えることから始めよう。話を 単純にするために、以下では次のような型のプログラム を考える。 は部分関数 (

絡み目を平面に射影し,線が交差しているところに上下 の情報をつけたものを絡み目の 図式 という..