最近検索した

検索結果がありません。

タグ

検索結果がありません。

ドキュメント

検索結果がありません。

アップロード

ホーム学校トピック

ログイン

JUSE-StatWorks/V5　ユーザーズマニュアル

シェア "JUSE-StatWorks/V5　ユーザーズマニュアル"

N/A

N/A

Protected

学年: 2021

Info

ダウンロード

Protected

Academic year: 2021

シェア "JUSE-StatWorks/V5　ユーザーズマニュアル"

Copied!

53

0

0

53

0

0

読み込み中.... (全文を見る)

今ダウンロードする ( 53 ページ )

全文

(1)

主成分分析ＰＡＲＴ９

第

１

章

第１章主成分分析

1．1 主成分分析とは ■目的主成分分析はたくさんの変数があるデータ表のもつ情報を要約し，データの裏にある構造を探索することを目的にしており，サンプルの特徴づけや製品のポジショニングなどに有用な手法です．例えば，ｎ個の対象（サンプル）について，多数個のｐ変数ｘ1，ｘ２，…，ｘｐのデータが観測されているとき，その対象の特徴をできるだけ少数の総合指標ｚ（これを主成分と呼ぶ）で記述したり，もとの変数間の相関関係を分析したりするための代表的多変量解析手法になります．下記のように主成分を元の変数の線形結合で表し，その分散を最大になるように係数 aiを決めますが，この係数が固有ベクトルとなります．なお，xi は基準化した値です．ｚ＝ a1・x1＋a2・x2＋・・・＋ap・xp ただし，係数 aiの２乗和が 1.0 このような主成分ｚを求めることは，空間上ではデータが最も散らばっている方向（直線平面）を探していることと同じになります．これは，ある点から直線平面への距離の２乗和を最小にするという条件で求めることができます．また，２番目以降の主成分はそれまでに得られている主成分とはすべて無相関であるという条件のもとで求め，このように求めた主成分を順に，第 1 主成分，第 2 主成分，・・・などと呼んでいます． ■活用場面・現象を表す特性値や要因がたくさんある場合，複雑なデータを要約し考えやすくする・サンプル（人や部品）の特徴をみるために散布図上にマッピングする・重回帰分析やクラスター分析の前処理として利用する・アンケート調査分析や人間の感性データ，顧客満足度などの分析，商品のポジショニング，グルーピングなど，単純集計やクロス集計では捉えられない視点から観察することができる．例えば「①収集データからお客様を区分けして，これからねらうべきターゲット層を絞り込む」，「②商品を区分けして，ねらいの商品コンセプトや問題点を絞り込む」，「③自社と他社情報から，自社の強みや弱みを分析しアクションを考える」，「④顧客満足度調査，アンケート調査を実施して，課題となる顧客をグルーピングして，グループ別の要望を抽出し分析する」 ■データ入力形式主成分分析で扱えるデータ形式は，変数×サンプルの２元表で，多変量データ表と呼ばれているものです．本システムで扱えるのは，サンプル名が 1 個，量的変数が 2～256 個までです.必要に応じて，層別のための質的変数も入力します．（質的変数を用いると，主成分得点散布図や同時布置図のプロットで，記号が質的変数のカテゴリーで区別され表示されます．）なお，データ表に欠測値があるサンプルはマスクされ，解析対象データから除かれます． (顧客) [サンプル名] (フロント) ［量的変数］ (清潔) ［量的変数］ … (性別) ［質的変数］ 1 3 4 … 男 2 5 5 … 男 3 3 2 … 男 : : : : : 1.1 主成分分析とは

(2)

■機能構成機能解析操作内容変数の指定解析に用いる変数を指定する．出発行列（1.4）出発行列（相関係数行列，分散共分散行列）を指定する．主成分数固有値の大きさによって主成分が元の変数の何個分の情報を持っているかを確認する．固有値主成分数変更解析で用いる主成分の数を変更する．強調表示基準値より大きい固有値や累積寄与率を強調表示する．オプション強調表示の On/Off と基準値の設定．固有ベクトル固有ベクトルの大きさ，符号で主成分軸の意味を掴む．出発行列出発行列を変更する．強調表示出発行列が相関係数行列の場合に，相関係数の絶対値が大きいものを着色する．基準化データ変数ごとに基準化したデータを確認する．強調表示基準値より大きい値を着色する．変数登録基準化データをワークシートに登録する．（別の解析で使えるようになる）オプション強調表示の基準値や画面に出力するサンプルの基準値を設定する．因子負荷量因子負荷量因子負荷量グラフ・因子負荷量の大きさ，符号で主成分軸の意味を掴む．・因子負荷量散布図で変数の関係を確認する．主成分数変更解析で用いる主成分の数を変更する．符号反転選択した変数の因子負荷量の符号を反転し，解釈をしやすくする．ソート因子負荷量でソートを行う．軸名称主成分の名称を設定する．変数登録因子負荷量をワークシートに登録する．（別の解析で用いることができるようになる）強調表示強調表示の On/Off．大きな値の因子負荷量を着色することによって，主成分の解釈をしやすくする．オプション表示する統計量や強調表示の基準値を設定する．軸の回転規準化バリマックス回転を行う．回帰分析主成分を説明変数とした回帰分析を行う．散布図行列因子負荷量の散布図一覧を確認する．拡大選択した散布図を拡大表示する．オプション散布図の並び順を変更したり，特定のプロットをマーキングして，プロットの位置関係を比較しやすくする．因子負荷量散布図データ探索選択した範囲内にあるプロットの項目名の表示/ 非表示を設定する． 1.1 主成分分析とは

(3)

主成分分析ＰＡＲＴ９

第

１

章

軸の回転規準化バリマックス回転や指定した角度の回転を行う．軸名称主成分の名称を設定する．軸の変更 X 軸と Y 軸を変更する．オプション目盛や表示する項目名を設定する．三次元図軸の変更因子負荷量の三次元図の軸となる主成分を変更する．累積寄与度累積寄与度グラフ各主成分の元の変数に対する寄与度を表示し，主成分と元の変数の関連性を確認する．主成分得点主成分得点主成分得点グラフ主成分得点散布図でサンプルの関係を確認する分散変更主成分得点の分散をλか 1.0 に設定する．変数登録主成分得点をワークシートに登録する．（別の解析で用いることができるようになる）サンプル名指定表示に使用するサンプル名を指定する．強調表示強調表示の On/Off．絶対値が基準値以上の主成分得点だけを出力して，サンプルの解釈をしやすくする．オプション出力する主成分得点や強調表示の基準値を設定する．クラスター分析求まった主成分得点を用いてクラスター分析を行う．回帰分析主成分を説明変数とした回帰分析を行う．散布図行列主成分得点の散布図一覧を確認する．拡大選択した散布図を拡大表示する．オプション散布図の並び順を変更したり，特定のプロットをマーキングして，位置関係を比較しやすくする．主成分得点散布図データ探索指定した範囲内のプロットの番号表示やマーキングを設定する．層別/ 層別解除質的変数を指定し，層別散布図で各カテゴリの特徴を把握する．サンプル名指定表示に使用するサンプル名を指定する．軸の変更 X 軸と Y 軸を変更する．オプション目盛や表示する項目名を設定する．また，マスクしたデータを散布図に表示することができる．クラスター分析求まった主成分得点を用いてクラスター分析を行う．マーキング表示マーキング設定をしたプロットを強調表示する．三次元図軸の変更主成分得点の三次元図の軸となる主成分を変更する．係数主成分得点を求めるための，元の変数に対する係数を確認する．同時布置図同時布置図行列因子負荷量または固有ベクトルと主成分得点の同時布置図（得点布置図）により，サンプルの特徴を変数の位置関係と重ねて解釈する． 1.1 主成分分析とは

(4)

拡大選択した散布図を拡大表示する．オプション散布図の並び順を変更したり，特定のプロットをマーキングして，位置関係を比較しやすくする．同時布置図データ探索指定した範囲内のプロットの番号表示やマーキングを設定する．層別/ 層別解除質的変数を指定し，層別散布図で各カテゴリの特徴を把握する．サンプル名指定表示に使用するサンプル名を指定する。軸の変更 X 軸と Y 軸を変更する．オプション目盛や表示する項目名を設定する．ワークシート上でマスクしたデータがあれば，散布図に表示することができる．クラスター分析求まった主成分得点を用いてクラスター分析を行う．マーキング表示マーキング設定をしたプロットを強調表示する． 1．２手法の選択選択方法［手法選択］-［多変量解析］-［主成分分析］ 1．３変数の指定種類変数の数操作解析対象量的変数 2～256 解析対象(x)とする変数を選択して「解析対象」リストの左側の[>]ボタンをクリック．サンプル名サンプル名 1（0 可）サンプル名をリストより選択．サンプル名を指定した場合，散布図のプロット点に表示することができます．なお，層別に用いる変数はここでは指定せず，解析結果の散布図画面において指定します． 1．４出発行列 1.4.1 出発行列の指定手法「主成分分析」の起動後や，「出発行列」タブで，出発行列を指定できます．変数間の測定単位が異なっている場合には相関係数行列を選択します．分散共分散を出発行列にする場合は，各変数のデータが共通の単位をもっている場合に限ります． 1．５主成分数固有値タブでは，第 k 主成分が元の変数の何個分の情報量を持っているかを示します．出発行列が相関係数行列の場合，固有値の合計は変数の数と同じになります．第 k 主成分の寄与率は，（第 k 主成分の固有値/ 元の変数の数）で計算され，第 k 主成分が全体のもつ情報のどの程度を要約したかを示す指標です．例えば，第 1 主成分の固有値の値が 2.7 で寄与率が 0.39 であれば，第 1 主成分が元の変数の 2.7 個分の情報を持っており，全体の持つ情報の 39%を要約していることが分かります． 1.1 主成分分析とは 1.2 手法の選択 1.3 変数の指定 1.4 出発行列 1.5 主成分数

(5)

主成分分析ＰＡＲＴ９

第

１

章

1.5.1 解析で用いる主成分の数の決定 ■起動方法ツールボタン「主成分数変更」クリック．累積寄与率が 80%以上の主成分まで，固有値が 1.0 以上の主成分までなどが，どこまでの主成分を用いるかを決める目安となります．一般的には上位数個の主成分がその後の解析で用いられます．ただし，寄与率が低い主成分でも，元の変数の特異な特徴を有していることがあるので，こちらを重要視する場合もあります． 1.5.2 固有ベクトルの確認 ■起動方法タブ「固有ベクトル」クリック．固有ベクトルは，その主成分を定める際の基準化した変数に対する係数で，主成分に対する各変数のウェイト（重み）を表しています．例えば，上図からは，主成分 1 の主成分得点=0.499×フロント（基準化） +0.432×清潔（基準化）+…+0.494×総合満足度（基準化）が読み取れます．よって固有ベクトルの要素の値の正負や絶対値の大きさを，他の要素と相対的に比較することにより，主成分の解釈が可能です． 1.5.3 主成分得点の係数の確認 ■起動方法タブ「係数」クリック．係数タブでは，主成分得点を特性値（ｙ）にして，元の変数（x1,x2，…）の線形結合として得られる係数を確認できます．例えば，上図からは，主成分 1 の主成分得点=-5.770+0.293×フロント +0.251×清潔+…+0.319×総合満足度が読み取れます．ただし，元の変数の係数そのものには意味がないので，通常，この係数は主成分の解釈には用いず，基準化した変数の係数である固有ベクトルの方を解釈に用います． 1．６因子負荷量因子負荷量は主成分と元の変数との相関係数で -1.0～1.0 の値を取ります．因子負荷量の値の大きさや符号（正負）から，変数間の関係や主成分軸を解釈することができます．第 k 主成分の寄与率は，（第 k 主成分の固有値/ 元の変数の数）で計算され，第 k 主成分が全体のもつ情報のどの程度を要約したかを示す指標です．累積寄与度は現在使っている主成分までで，元の変数の情報をどの程度持っているかを示す指標です．～因子負荷量と固有ベクトルの違い～因子負荷量は，主成分と元の変数との相関関係で，固有ベクトルとほぼ同等な意味を持ちつつ，要素の値としても意味を持ちます．ただし，因子負荷量は固有ベクトルの各要素を固有値の平方根倍したものなので，固有ベクトルの各要素の比例関係は因子負荷量でも成り立ちます．固有ベクトルと因子負荷量は解釈しやすい方を使ってください． 1.5 主成分数 1.6 因子負荷量

(6)

1.6.1 符号反転 ■起動方法変数の列を選択してから，ツールボタン「符号反転」クリック．初期設定では，各主成分の因子負荷量は絶対値最大の数値が正になるように調整してありますが，因子負荷量の符号を反転しても数学的な意味は変わりません．そこで，軸の解釈が分かりやすいように因子負荷量の符号を反転させることがあります． 1.6.2 強調表示 ■起動方法 1．ツールボタン「強調表示」クリック． 2．強調表示の基準値や色を変更したい場合は，ツールボタン「オプション」内で設定する．大きな値の因子負荷量を着色することによって，主成分の解釈をしやすくします． 1.6.3 因子負荷量散布図 ■起動方法タブ「散布図行列」クリック．主成分間の因子負荷量を散布図で表します．以下の方法で特定の 1 つの散布図を拡大できます．・散布図をダブルクリックする・散布図を選択してから「拡大」ボタンを押す・散布図を選択してから「因子負荷量散布図」タブに移る因子負荷量の散布図の目盛は縦軸,横軸とも-1.0 ～1.0 となっており，図上に半径 1.0 の円弧が描かれています.円周に近くプロットされる変数ほど該当する主成分にとっては寄与が大きく，相関が強く重要なものであるとみなされます. 各プロット間の距離（近さ加減）や方向などの位置関係の認識も重要です．変数同士のグルーピングなどに利用することもできます. 散布図の中心近傍にあるプロット，項目については，取り上げる主成分軸を変えて確認してみて下さい． 1.6.4 データ探索 ■起動方法 1．散布図上で探索したいデータを矩形で囲む 2．ツールボタン「データ探索」クリック． 1.6 因子負荷量

(7)

主成分分析ＰＡＲＴ９

第

１

章

矩形で囲まれた範囲内にあるデータの座標（x,y）が表示されます．そのデータの項目名を非表示にしたい場合は「項目表示/解除」を押します． 1.6.5 三次元図 ■起動方法タブ「三次元図」クリック 3 つの主成分の関係を確認するために，因子負荷量や主成分得点の三次元図を表示できます．回転ボタンを押したり，マウスでドラッグすることにより，三次元図を回転できます． 1．７主成分得点主成分得点の値を求め，その値を一覧表や散布図にしてグルーピングを行い，サンプルの特徴を固有技術的に考えます．各主成分において主成分得点の絶対値が大きい特徴的なサンプルに注目することが大切です．そのためには出力基準値を変更したり強調表示を行います． 1.7.1 出力サンプルの絞り込み ■起動方法 1．ツールボタン「オプション」クリック． 2．出力基準値を設定する． 1 つでも出力基準値以上の値を持った主成分があるサンプルが出力されます．なお，ここで出力したサンプルのみが，散布図上に表示されます．サンプル数が 99 以下の場合は，0.0，サンプル数が 100 以上の場合は 2.0 などの基準値を使って，特徴的なサンプルを確認するとよいでしょう． 1.7.2 強調表示 ■起動方法 1．ツールボタン「強調表示」クリック． 2．強調表示の基準値や色を変更したい場合は，ツールボタン「オプション」内で設定する．大きな値の主成分得点を着色することによって，サンプルの解釈をしやすくします． 1.7.2 主成分得点の分散の変更 ■起動方法ツールボタン「分散変更」クリック．主成分得点の分散を主成分の固有値λにするか 1.0 にするかを設定します．ここで，分散を 1.0 にした場合は因子負荷量，分散をλにした場合は固有ベクトルが，同時布置図にベクトル表示されます． 1.6 因子負荷量 1.7 主成分得点

(8)

1.7.3 主成分得点散布図 ■起動方法タブ「散布図行列」クリック．主成分間の主成分得点を散布図で表します．散布図の拡大方法は，「因子負荷量散布図」とほぼ同様です．主成分得点散布図では，サンプルのグルーピングや特徴付け，外れ値のサンプルなどを検討します．グラフの初期目盛は，Ｘ軸，Ｙ軸の主成分得点のうち，絶対値が最大の値を共通の目盛として設定しています． 1.7.4 データ探索 ■起動方法 1．散布図上で探索したいデータを矩形で囲む 2．ツールボタン「データ探索」クリック．矩形で囲まれた範囲内にあるデータの座標（x,y）が表示されます．そのデータの番号を表示したい場合は「番号表示/解除」を押します． 1.7.5 探索したデータのマーキング ■起動方法 1．散布図上で探索したいデータを矩形で囲む 2．ツールボタン「データ探索」をクリックし，「マーキング」ボタンを押す． 3．ツールボタン「マーキング」クリック 1.7 主成分得点

(9)

主成分分析ＰＡＲＴ９

第

１

章

1.7.6 層別 ■起動方法 1．ツールボタン「層別」クリック． 2．層別に用いる質的変数を選択する．主成分得点の散布図を任意の質的変数で層別することによって，データのバラツキの要因分析ができます． 1.7.7 軸の回転主成分は総合指標を表わしますが，総合指標にはびます）が含まれる場合があります．このとき，軸を，（総合指標である主成分ではなく）それらのサブ指標にとった方が，軸の意味付けやそれに基づくサンプルの特徴付けをし易い場合があります．主成分軸の回転を行うことにより，このような（サブ指標に対応した）軸が得られ，データの解釈がし易くなる可能性があります．例えば，変数「50M 走（m/秒）」，「走り幅跳び（cm）」，「背筋力（kg）」，「握力（kg）」に対して主成分分析を行うと，下図の因子負荷量散布図が得られます． 1.0 -1.0 -0.5 0.0 0.5 -1.0 -0.5 0.0 0.5 1.0 1.0 -1.0 -0.5 0.0 0.5 -1.0 -0.5 0.0 0.5 1.0 背筋力握力５０Ｍ走走り幅跳び背筋力握力５０Ｍ走走り幅跳び主成分2 主成分1 因子負荷量散布図この因子負荷量散布図より，例えば，第一主成分軸（横軸），第二主成分軸（縦軸）は，それぞれ以下のような意味を持つ軸として解釈できます；第一主成分軸：総合的な運動能力第二主成分軸：筋力が優れているか，走力が優れているか一方，規準化バリマックス回転により，軸の回転を行うと，下図の因子負荷量散布図が得られます． 1.0 -1.0 -0.5 0.0 0.5 -1.0 -0.5 0.0 0.5 1.0 1.0 -1.0 -0.5 0.0 0.5 -1.0 -0.5 0.0 0.5 1.0 背筋力握力５０Ｍ走走り幅跳び背筋力握力５０Ｍ走走り幅跳び因子2 因子1 回転後の因子負荷量散布図この回転後の因子負荷量散布図より，例えば，回転後の横軸，縦軸は，それぞれ以下のような意味を持つ軸として解釈できます；横軸：走力の優劣縦軸：筋力の優劣 1.7 主成分得点

(10)

釈したい場合は回転前の軸（主成分軸）を使用するのが好ましく，“総力”・“筋力”という 2 つのサブ指標でデータを解釈したい場合は回転後の軸を使用するのが好ましいということになります．回転後の軸は“主成分”を表しません．そのため本システムでは，便宜上，回転後の軸を“因子”と表記します． 1.7.8 規準化バリマックス回転 ■起動方法 1．ツールボタン「軸の回転」クリック． 2．回転の種類で「規準化バリマックス回転」を選択し，回転させる主成分を左下のリストから，右下のリストに移動させる．規準化バリマックス回転では，回転後の因子負荷量の分散が最大となるように主成分軸を回転（直交回転）します．因子負荷量の分散を大きくするということは，各軸に対し，その軸と関係が強い観測変数はより強くなるように，関係が弱い観測変数はより弱くなるようにすることを意味します．よって，規準化バリマックス回転により，各観測変数が特定の軸とのみ強い関係を持つ傾向を持つような，シンプルな構造が得られます．なお，指定した主成分（右側のリストの主成分）に対し，「回転」列のチェックを外すと，その主成分は回転せずにそのまま回転後の結果表示画面に出力されます． 1.7.9 角度を指定した回転 ■起動方法 1．因子負荷量散布図のツールボタン「軸の回転」クリック． 2．回転の種類で「角度の指定」を選択し，角度を入力する．因子負荷量散布図の 2 つの主成分軸の組み合わせに対し，ユーザーが指定した角度だけ軸を回転します．このとき，「プレビュー」ボタンを押すと，回転後の因子負荷量散布図を確認できますなお，角度の指定による回転を行う場合，回転できる主成分は，因子負荷量散布図の横軸，縦軸の 2 つの主成分のみです．それ以外の主成分を指定することも可能ですが，回転はできません．別の 2 つの主成分を回転させたい場合は，一旦「散布図行列」タブに戻り，回転させたい 2 軸を持つ散布図を選択してから，「因子負荷量散布図」を表示して，同様の操作を行います． 1．８同時布置図主成分得点の散布図上に，因子負荷量(主成分得点の分散が固有値λの場合)を，中心からの矢印で重ね描きした同時布置図を表示します．主成分得点の分散を 1.0 に設定していた場合は，主成分得点の散布図上に固有ベクトルを重ね書きします．同時布置図上のサンプルや変数の相対的な位置関係によって，サンプルの特徴を解釈します． 1.7 主成分得点 1.8 同時布置図

(11)

主成分分析ＰＡＲＴ９

第

１

章

①サンプルの主成分得点の大きさや符号（正負）により，サンプルの性質を解釈する．なお，原点付近にあるサンプルは取り上げた主成分からは平均的な性質である．一方，原点から離れているサンプルや変数は，取り上げた主成分による説明力が強い． ②近傍にあるサンプル同士は似たような性質を持っている． ③原点に対して反対側に位置するサンプル同士は，異なる（反対の）性質を持っていることになる． ④取り上げたサンプルの近傍に変数（固有ベクトルの矢印）がプロットされている場合にはそのサンプルは，変数と近い性質を持っている．（ある変数のベクトルを原点の反対方向まで延ばし，いくつかのサンプルをその直線上に垂直におろした（投影した）場合の原点からの距離と変数の位置関係で性質を解釈できる） ⑤以上の結果に対し，固有技術的な考察を加え解釈する必要がある． 1.8.1 固有ベクトルの表示（分散の設定） ■起動方法ツールボタン「分散の設定」クリック．主成分得点の分散を主成分の固有値λにするか 1.0 にするかを設定します．ここで，分散をλにした場合は因子負荷量，分散を 1.0 にした場合は固有ベクトルが，同時布置図にベクトル表示されます． 1.8.2 データ探索主成分得点の「データ探索」を参照． 1.8.3 層別 ■起動方法 1．ツールボタン「層別」クリック． 2．層別に用いる質的変数を選択する．同時布置図の解釈のポイントに加えて， ⑥あるカテゴリのマークが同時布置図上のどの辺に分布しているか．（分布の状態に偏りはないか） ⑦あるカテゴリのマークの分布が，変数（矢印）との関係で偏っていないか． ⑧固有技術的に見て，上記による特徴はどう解釈できるか．などを考察します． 1．９他の解析手法との連携解釈のし易さ等の理由から，観測データではなく，主成分得点もしくは回転後の因子得点を用いて回帰分析やクラスター分析を行うことがありますが，本システムでは・主成分（因子）を説明変数とした回帰分析・クラスター分析による主成分得点（因子得点）に基づくサンプルの分類を実行することができます．機能利用できるシステム画面回帰分析因子負荷量因子負荷量グラフ主成分得点主成分得点グラフクラスター分析主成分得点主成分得点グラフ主成分得点散布図同時布置図なお，途中に，説明変数として指定した主成分（因子）の主成分得点（因子得点）をワークシートに登録するかどうかの確認メッセージが表示されます． 1.8 同時布置図 1.9 他の解析手法との連携

(12)

主成分得点（因子得点）をワークシートに登録しておくことにより，次回，改めて主成分分析を経ずに，ワークシート上の主成分得点（因子得点）を使用して，直接回帰分析やクラスター分析などのその他の解析を行う時に行うことができ便利です． 1.9.1 回帰分析 ■起動方法 1．ツールボタン「回帰分析」クリック． 2．回帰分析の目的変数とする変数 1 個と，説明変数とする主成分（因子）からを指定．主成分（軸の回転後の場合は因子）を説明変数とする回帰分析を行うことができます．本機能については回帰分析の章をご覧ください． 1.9.2 クラスター分析 ■起動方法 1．ツールボタン「クラスター分析」クリック． 2．サンプルの分類で使用する主成分（軸の回転後の場合は，因子と呼ぶ）を指定． 3．階層的クラスター分析，非階層的クラスター分析（k-means 法）のどちらかを指定．主成分得点もしくは回転後の因子得点を用いて，階層的クラスター分析や非階層的クラスター分析（k-means 法）により，サンプルの分類（クラスタリング）を行うことができます．本機能については，クラスター分析の章をご覧ください．解析対象サンプルが 256 より多い場合は階層的クラスター分析は指定できませんまた，クラスター分析でクラスタ情報をワークシートに保存しておくと，主成分得点散布図や同時布置図散布図上でクラスタ情報で層別し，クラスタリング結果を確認することができます． 1.9 他の解析手法との連携

(13)

数量化Ⅲ 類ＰＡＲＴ９

第

２

章

第２章数量化Ⅲ類

２．１数量化Ⅲ類とは ■目的数量化Ⅲ類とは，質的データの主成分分析とも呼ばれ，変数相互間の相関構造を分析したり，総合特性値を求めるための手法です．本システムでは，アイテムカテゴリ型，０－１型，クロス表型の３つのタイプのデータに対して解析することができます． ■活用場面・多数の特性値間に内在する構造を解析する・サンプルの相対的な布置を確認し分類する・新しい合成指標の作成する等 ■データ入力形式本システムでは，3 つのデータ形式を扱います．データ形式変数属性入力形式１アイテムカテゴリ型質的変数入力形式２０－１型量的変数入力形式３クロス表型量的変数アイテムカテゴリ数は最大 600（ただし，１変数あたりカテゴリ数は，最大 24）となっています．なお，データ表に欠測値があるサンプルはマスクされ，解析対象データから除かれます．入力形式１：アイテムカテゴリ型データ（アンケート調査結果のまとめの例）変数名 No 番号［サンプル名］質問１［質的変数］質問２［質的変数］質問３［質的変数］質問４［質的変数］１ 1 1 1 1 3 2 2 1 2 2 2 3 3 1 4 2 1 4 4 1 3 2 3 5 5 1 2 1 2 ・・・・・・・・・・・・解析する場合には，システム内でバート表に展開してから計算されます． 2.1 数量化Ⅲ類とは

(14)

入力形式２：０－１型データ（椅子要求品質データ）変数名 No 番号［サンプル名］スムーズに作業できる［量的変数］収納が容易である［量的変数］処分が容易である［量的変数］清潔である［量的変数］････１Ａ 1.0 0.0 0.0 0.0 ･･ 2 Ｂ 0.0 0.0 0.0 0.0 ･･ 3 Ｃ 1.0 0.0 0.0 1.0 ･･ 4 Ｄ 0.0 0.0 0.0 1.0 ･･ 5 Ｅ 1.0 1.0 0.0 0.0 ･･・・・・・・・・・・・・・・入力形式３：クロス表型データ（年代と好きな食品の関係数）変数名 No 年代［サンプル名］食品Ａ［量的変数］食品Ｂ［量的変数］食品Ｃ［量的変数］食品Ｄ［量的変数］････１２０代 7.0 6.0 13.0 13.0 ･･ 2 ３０代 3.0 1.0 14.0 6.0 ･･ 3 ４０代 10.0 1.0 6.0 5.0 ･･ 4 ５０代以上 2.0 0.0 1.0 4.0 ･･・・・・・・・・・・・・・・解析対象データがクロス表型の場合には，そのままの解析も，クロス表をバート表に展開した表に対しての解析も可能です． ■機能構成数量化Ⅲ類の機能の多くは主成分分析とほぼ同等のものとなります．各機能については主成分分析の章を参照してください．機能解析操作内容変数の指定解析に用いる変数を指定する．成分数固有値固有値の大きさによって成分が元の変数の何個分の情報を持っているかを確認する．成分数変更解析で用いる成分の数を変更する．固有ベクトル固有ベクトルの大きさ，符号で成分軸の意味を掴む．並び替え並び替えられた原データ表を確認する．これによって，データパターンの類似や差異を確認する．（２.4）バート表データ形式がアイテムカテゴリ型の場合に，質的変数の各カテゴリの度数をマトリックス形式に表示する．変数登録バート表の結果をワークシート上に登録する．（別の解析で使えるようになる）変数スコア変数スコア表変数スコアグラフ・変数スコアの大きさ，符号で成分の意味を掴む．・変数スコア散布図で変数の関係を確認する．成分数変更解析で用いる成分の数を変更する．分散変更変数スコアやサンプルスコアの分散をλか 1.0 に設定する． 2.1 数量化Ⅲ類とは

(15)

数量化Ⅲ 類ＰＡＲＴ９

第

２

章

符号反転選択した成分の変数スコアの符号を反転し，解釈をしやすくする．（初期表示では，成分ごとに絶対値が大きいものを正としている）変数登録変数スコアをワークシートに登録する．（別の解析で用いることができるようになる）オプション変数スコアの絶対値が基準値以上のセルを着色する．散布図行列変数スコアの散布図一覧を確認する．拡大選択した散布図を拡大表示する．オプション散布図の並び順を変更したり，特定のプロットをマーキングして，プロットの位置関係を比較しやすくする．変数スコア散布図データ探索選択した範囲内にあるプロットの項目名の表示/ 非表示を設定する．成分名称成分の名称を設定する．オプション目盛や表示する項目名を設定する．三次元図軸の変更変数スコアの三次元図の軸となる成分を変更する．累積寄与度累積寄与度グラフ各成分の元の変数に対する寄与度を表示し，成分と元の変数の関連性を確認する．オプション表示形式やグラフ名称を変更する．サンプルスコアサンプルスコア表サンプルスコアグラフサンプルスコア散布図でサンプルの関係を確認する分散変更変数スコアやサンプルスコアの分散をλか 1.0 に変更する．変数登録サンプルスコアをワークシートに登録する．（別の解析で用いることができるようになる）サンプル名指定表示に使用するサンプル名を指定する．強調表示強調表示の On/Off．絶対値が基準値以上の主成分得点だけを出力して，サンプルの解釈をしやすくする．オプション出力するサンプルや強調表示の基準値を設定する．散布図行列サンプルスコアの散布図一覧を確認する．拡大選択した散布図を拡大表示する．オプション散布図の並び順を変更したり，特定のプロットをマーキングして，位置関係を比較しやすくする．サンプルスコア散布図データ探索指定した範囲内のプロットの番号表示やマーキングを設定する．層別/ 層別解除質的変数を指定し，層別散布図で各カテゴリの特徴を把握する．サンプル名指定表示に使用するサンプル名を指定する．軸の変更 X 軸と Y 軸を変更する．オプション目盛や表示する項目名を設定する．また，マスクしたデータを散布図に表示することができる．マーキング表示マーキング設定をしたプロットを強調表示する． 2.1 数量化Ⅲ類とは

(16)

三次元図軸の変更サンプルスコアの三次元図の軸となる成分を変更する．マスクデータ予測ワークシート上で前もってマスクしたサンプルデータに対し，既に求めてある成分式で計算し，プロットする．特異データの一時的な除去とその再配置，複数グループ（例えば男女）の対比分析，判別時利用法など種々な応用事例に使える．同時布置図同時布置図行列変数スコアとサンプルスコアの同時布置図により，サンプルの特徴を変数の位置関係と重ねて解釈する．拡大選択した散布図を拡大表示する．オプション散布図の並び順を変更したり，特定のプロットをマーキングして，位置関係を比較しやすくする．同時布置図データ探索指定した範囲内のプロットの番号表示やマーキングを設定する．層別/ 層別解除質的変数を指定し，層別散布図で各カテゴリの特徴を把握する．サンプル名指定表示に使用するサンプル名を指定する．軸の変更 X 軸と Y 軸を変更する．オプション目盛や表示する項目名とサンプル名を設定する．グループを設定すると，グループことにプロットを結線することができる．マーキング表示マーキング設定をしたプロットを強調表示する．２．２手法の選択選択方法［手法選択］-［多変量解析］-［数量化Ⅲ類］２．３変数の指定種類変数の数操作解析対象量的変数 2～1000（0-1 型，クロス表型）または質的変数 2～1000（総計 600 アイテムカテゴリ内）（アイテムカテゴリ型）解析対象(x)とする変数を選択して「解析対象」リストの左側の[>]ボタンをクリック．サンプル名サンプル名１（0 可）サンプル名をリストより選択．サンプル名を指定した場合，散布図のプロット点に表示することができます．なお，層別に用いる変数はここでは指定せず，解析結果の散布図画面において指定します．２．４並び替え ■起動方法「成分数」グループの「並び替え」タブクリック．数量化Ⅲ類では，チェック（1 の値）が対角線上に集まるように行と列をうまく並び替え，反応の似た変数や反応の似たサンプルが近くになるように配置しています.これにより，サンプルや変数のグルーピングを行います. 本画面では，右上のリストで指定した成分について，並び替えられた原データ表が確認できます．データ構造が近いサンプルや変数は近くに位置づけられ，サンプルや変数のグループ化に重要な情報を与え 2.1 数量化Ⅲ類とは 2.2 手法の選択 2.3 変数の指定 2.4 並び替え

(17)

数量化Ⅲ 類ＰＡＲＴ９

第

２

章

ます．２．５同時布置図 ■起動方法「同時布置図」グループクリック．変数スコアとサンプルスコアを１画面上に布置し，サンプルと変数，カテゴリの対応関係など相互関係を観察することができます．変数スコア，サンプルスコアにおいて，各成分軸の正，負の意味を考慮して下さい．なお，オプションで，結線処理を「する」に設定すると，変数間あるいは同一アイテムのカテゴリ間を線で結ぶことによって，同一グループのパターンを観察することができます．線で結ぶ変数に対し，同一グループ番号（１以上）を入力すると，次図のように該当するカテゴリのみ結線した同時布置図が表示されます．例えば年代順，男女，アンケートの回答コード順など結線すると他のプロットとの比較が容易に行えます． 2.4 並び替え 2.5 同時布置図

(18)

因子分析ＰＡＲＴ９

第

３

章

第３章因子分析

３．１因子分析とは ■目的因子分析は，心理学における統計的方法として発達し，その後，マーケティング，医学，生物学，経済学，教育学などに応用されるようになりました．その根本的な考えは，種々な現象も，さまざまな変動における少数個の潜在因子によって説明されるという原則的な理解にもとづいています．すなわち，２つの変数x_jとx_kとの間に相関があるのは，その両者に影響を及ぼすいくつかの共通因子があるからであり，その相関が完全に±１にならないのは，両変数それぞれ個別に影響を及ぼす独自因子があると考えます．因子分析の目的は，この少数個の潜在因子を探索しようとするものです．因子分析では，得られたデータと潜在因子との間に統計モデルを想定します．すなわち(すでに標準化済)p 個の変数xi*(i＝1,…, p)は，m個の共通因子 f1, f2,…, fmおよび独自因子，εi(i＝1,…, p)の線形結合で表現されます．因子モデル式は x1*＝ a11f1 + a12f2 +…+ ak1fk +…+ am1fm +ε1 x2*＝ a12f1 + a22f2 +…+ ak2fk +…+ am2fm +ε2 : x_p*_＝_a 1pf1 + a2pf2 +…+ akpfk +…+ ampfm +εp です．ここで，a_kj(k＝1,…, m; j＝1,…, p) は変数x_j*_{の潜在的な共通因子}_f kに対する係数で，因子負荷量(行列) と呼ばれています．また，各サンプルk{k＝1,…, n} に対する f1 ， f2 ,…, fｍの値 f1k, f2k,…, fｍkを求め，因子得点と呼びます． f_1k＝ b11・x1* + b12・x2* +…+ b1p・xp* f_2k＝ b₂₁・x₁*₊_b 22・x2 *_+…+_b 2p・xp* : f_mk＝ b_m1・x₁*₊_b m2・x2 *_+…+_b mp・xp* {ここで，(b_ij)＝ A・ R-1_, A＝(A_ij）：因子負荷量行列，R：元データの相関行列} このモデルにおいて実際に観測されるのは左辺のx_i*_{だけであり，右辺の因子負荷量}_a kj(k＝1,…, m; j＝1, …, p），共通因子 f1, f2,…, fm，独自因子ε1,ε2,…, εpはすべて未知であり，種々の仮定の下に求めることになります．因子分析と比較される主成分分析では， f1 ＝ c11・x1 + c12・x2 +…+ c1m・xm f₂ ＝ c₂₁・x₁ + c₂₂・x₂ +…+ c_2m・x_m : fp ＝ cp1・x1 + cp2・x2 +…+ cpm・xm として，主成分得点f1, f2,…, fpが求められるが，（顕在）変数x1, x2,…, xmの線形結合で表現されます．本システムでは各変数の因子負荷量や各変数の独自因子の大きさを推定する方法として主因子法，及び最尤法で行なっていますが，どの方法を使うかによって結果が大きくかわることも少なくありません．また，因子軸の回転は規準化バリマックス回転を用いています．因子分析では事前に共通因子の数（成分の数）を指定する必要があり，因子分析の結果は，共通因子の数によって大幅に変わります．共通因子の数の目安として固有値の大きさが１以上の因子の数を指定するのも一つの方法です．いずれにせよ独自因子の大きさの推定方法と共通因子の数によって，結果が異なることを 3.1 因子分析とは

(19)

踏まえ，適切な使い方をする必要があります． ■活用場面・現象を表す特性値がたくさんある場合，少数個の潜在因子を見つける・サンプル（人や部品）の特徴をみるために散布図上にマッピングする等 ■データ入力形式本システムで扱えるのは，サンプル名が１個，量的変数が 2～256 個までです.必要に応じて，層別のための質的変数も入力します．（質的変数を用いると，因子得点散布図や同時布置図のプロットで，記号が質的変数のカテゴリーで区別され表示されます．）なお，データ表に欠測値があるサンプルはマスクされ，解析対象データから除かれます． (サンプル名) [サンプル名] (ﾌﾛﾝﾄ-ｽﾑｰｽﾞさ) ［量的変数］ (ﾌﾛﾝﾄ-係の対応) ［量的変数］ … (食事―係の対応) ［質的変数］サンプル 1 4 4 … 4 サンプル 2 3 2 … 3 サンプル 3 4 4 … 3 : : : : : ■機能構成因子分析の機能の多くは主成分分析とほぼ同等のものとなります．各機能については主成分分析の章を参照してください．機能解析操作内容変数の指定解析に用いる変数を指定する．解析条件の設定（3.4）因子負荷量の推定方法や因子の数，収束判定基準値を設定する．因子数固有値の大きさによって因子が元の変数の何個分の情報を持っているかを確認する．固有値因子数変更解析で用いる因子の数を変更する．（3.5）軸の回転回転の有無（回転なしか，規準化バリマックス回転）を設定．（3.7）固有ベクトル固有ベクトルの大きさ，符号で軸の意味を掴む．出発行列強調表示出発行列を確認する．相関係数の絶対値の大きなものは着色できる．基準化データ変数ごとに基準化したデータを確認する．オプション出力するサンプルや強調表示の基準値を設定する．変数登録規準化データをワークシートに登録する．（別の解析で使えるようになる）係数因子得点を求めるための，元の変数に対する係数を確認する．因子負荷量（3.6）因子負荷量因子負荷量グラフ・因子負荷量の大きさ，符号で軸の意味を掴む．・因子負荷量散布図で変数の関係を確認する．因子数変更解析で用いる因子の数を変更する．符号反転選択した変数の因子負荷量の符号を反転し，解釈をしやすくする．ソート因子負荷量でソートを行う．因子名称因子の名称を設定する．変数登録因子負荷量をワークシートに登録する．（別の解 3.1 因子分析とは

(20)

因子分析ＰＡＲＴ９

第

３

章

析で用いることができるようになる）軸の回転回転の有無（回転なしか，規準化バリマックス回転）を設定．（3.7）強調表示強調表示の On/Off．大きな値の因子負荷量を着色することによって，因子の解釈をしやすくする．オプション表示する統計量や強調表示の基準値を設定する．回帰分析因子を説明変数とした回帰分析を行う．散布図行列因子負荷量の散布図一覧を確認する．拡大選択した散布図を拡大表示する．オプション散布図の並び順を変更したり，特定のプロットをマーキングして，プロットの位置関係を比較しやすくする．因子負荷量散布図データ探索選択した範囲内にあるプロットの項目名の表示/ 非表示を設定する．因子名称因子の名称を設定する．軸の変更 X 軸と Y 軸を変更する．オプション目盛や表示する項目名を設定する．三次元図軸の変更因子負荷量の三次元図の軸となる因子を変更する．累積寄与度累積寄与度グラフ各因子の元の変数に対する寄与度を表示し，因子と元の変数の関連性を確認する．オプション表示形式やグラフ名称を設定する．因子得点因子得点因子得点グラフ因子得点散布図でサンプルの関係を確認する変数登録因子得点をワークシートに登録する．（別の解析で用いることができるようになる）サンプル名指定表示に使用するサンプル名を指定する．強調表示強調表示の On/Off．絶対値が基準値以上の因子得点だけを出力して，サンプルの解釈をしやすくする．オプション出力する因子得点や強調表示の基準値を設定する．クラスター分析求まった因子得点を用いてクラスター分析を行う．回帰分析因子を説明変数とした回帰分析を行う．散布図行列因子得点の散布図一覧を確認する．拡大選択した散布図を拡大表示する．オプション散布図の並び順を変更したり，特定のプロットをマーキングして，位置関係を比較しやすくする．因子得点散布図データ探索指定した範囲内のプロットの番号表示やマーキングを設定する．層別/ 層別解除質的変数を指定し，層別散布図で各カテゴリの特徴を把握する．サンプル名指定表示に使用するサンプル名を指定する．軸の変更 X 軸と Y 軸を変更する． 3.1 因子分析とは

(21)

オプション目盛や表示する項目名を設定する．また，マスクしたデータを散布図に表示することができる．クラスター分析求まった因子得点を用いてクラスター分析を行う．マーキング表示マーキング設定をしたプロットを強調表示する．三次元図軸の変更因子得点の三次元図の軸となる因子を変更する．同時布置図同時布置図行列因子負荷量と因子得点の同時布置図により，サンプルの特徴を変数の位置関係と重ねて解釈する．拡大選択した散布図を拡大表示する．オプション散布図の並び順を変更したり，特定のプロットをマーキングして，位置関係を比較しやすくする．同時布置図データ探索指定した範囲内のプロットの番号表示やマーキングを設定する．層別/ 層別解除質的変数を指定し，層別散布図で各カテゴリの特徴を把握する．サンプル名指定表示に利用するサンプル名を指定する．軸の変更 X 軸と Y 軸を変更する．オプション目盛や表示する項目名を設定する．ワークシート上でマスクしたデータがあれば，散布図に表示することができる．クラスター分析求まった因子得点を用いてクラスター分析を行う．マーキング表示マーキング設定をしたプロットを強調表示する．３．２手法の選択選択方法［手法選択］-［多変量解析］-［因子分析］３．３変数の指定種類変数の数操作特性値量的変数 2～256 特性値(x)とする変数を選択して「特性値」リストの左側の[>]ボタンをクリック．サンプル名サンプル名１（0 可）サンプル名をリストより選択．サンプル名を指定した場合，散布図のプロット点に表示することができます．なお，層別に用いる変数はここでは指定せず，解析結果の散布図画面において指定します．３．４解析条件の指定因子負荷量を推定するための代表的な方法として，「主因子法」，「最尤法」が選択できます．初期値は主因子法，因子数 3，反復計算の収束条件 0.0001 となっています．但し，変数の数が 2 個の場合は，因子数は 2 に設定されます．・主因子法因子の抽出に際して相関係数行列または残差行列の共通性に対する寄与が最大になるように因子を求める方法．・最尤法尤度関数が最大化になるように因子負荷量を推定する方法． 3.1 因子分析とは 3.2 手法の選択 3.3 変数の指定 3.4 解析条件の指定

(22)

因子分析ＰＡＲＴ９

第

３

章

両方法とも，反復計算して解を求めています．一般的に最尤法の方が推定精度が良くなりますが，データによっては（残差分散が負になり）不適解になることがあります．そういう場合は主因子法を用います．また，ここで設定する因子数は，反復計算をするにあたっての初期値です．解析にいくつの因子を使用するかは，求まった固有値の方を参考にします．３．５因子数の変更 ■起動方法 1．「因子数」グループの「固有値」タブクリック． 2．ツールボタン「因子数の変更」クリック．「固有値」タブでは，解析に使用する因子数を変更することができます．因子の数を決める場合，固有値が 1.0 より大きい値の数を参考にします．３．６因子負荷量 ■起動方法「因子負荷量」グループの「因子負荷量」タブクリック．因子負荷量は元の変数 x と仮想的な共通因子 f の間の相関係数のことです．共通度（各変数ごとの因子負荷量の２乗和）が大きい程，共通因子で説明される割合が大きくなります．この値は，元の変数 x を目的変数，仮想的な共通因子ｆ１，ｆ２，…，ｆｎを説明変数と考えたときの重相関係数の２乗（Ｒ２_{）に等しくなりま} す．また，寄与率は全体の分散の和の中で占める各因子の割合を示します．寄与率の和が全体の中で占める共通因子によって説明される割合を表しています．もとの変数に対し，各因子の因子負荷量や残差分散，共通度が表示され，各因子には２乗和と寄与率も計算されます．なお，規準化バリマックス回転後の残差分散は表示されません．各因子の解釈は，因子負荷量の符号と大きさによって解釈します．また，得られた因子負荷量行列のままで解釈しにくい場合は，規準化バリマックス回転を行います．本システムでは初期表示で，規準化バリマックス回転を行っています．３．７軸の回転 ■起動方法 1．「因子数」グループの「固有値」タブか，「因子負荷量」グループの「因子負荷量」タブクリック． 2．ツールボタン「軸の回転」クリック．規準化バリマックス回転を行うか，回転を行わないかを設定します．因子分析の解には，因子軸の回転による不安定性があるので，解釈のしやすいように座標軸を回転することがあります．因子の解釈のためには，いくつかの変量の因子負荷量の絶対値が大きく，残りの変量の因子負荷量がゼロに近い形が理想的なので，そのような因子負荷量を多く得るために，直交回転としての規準化バリマックス回転を行います．規準化バリマックス回転では，回転後の因子負荷量の分散が最大となるように軸を回転（直交回転）します．因子負荷量の分散を大きくするということは，各軸に対し，その軸と関係が強い観測変数はより強くなるように，関係が弱い観測変数はより弱くなるようにすることを意味します．よって，規準化バリマックス回転により，各観測変数が特定の軸とのみ強い関係を持つ傾向を持つような，シンプルな構造が得られます．規準化バリマックス回転については主成分分析の「軸の回転」の項も参照してください． 3.4 解析条件の指定 3.5 因子数の変更 3.6 因子負荷量 3.7 軸の回転

(23)

(24)

判別分析・数量化Ⅱ ＰＡＲＴ９

第

４

章

第４章判別分析・数量化Ⅱ類

４．１判別分析･数量化Ⅱ類とは ■目的判別分析は説明変数 x１，x２，…，xＰから目的変数 y を，もっとも良く予測(あるいは判別)する式を求めるための手法です．この予測式を判別関数と呼び，データの性質によって線形(一次) 判別関数または二次判別関数がよく用いられます．回帰分析では目的変数は量的データであるのに対し，判別分析は目的変数が質的データすなわちカテゴリです．また，判別分析では説明変数が量的データのみであるのが一般的ですが，本システムでは数量化Ⅱ類を加味し，説明変数として量的データと質的データいずれも扱える量質混合型の判別分析を行えるのが特徴です．（二次判別関数については第 5 章をご覧ください．）なお，説明変数が全て質的データの場合は数量化 Ⅱ類と同じ判別結果(各サンプルの判別)が得られます．各手法と本システムの表記対応関係，制限事項判別分析数量化Ⅱ類本システム表記制限事項目的変数または群変数外的基準目的変数または群変数質的変数目的変数の群(カテゴリ) 外的基準のカテゴリ目的変数の群 ( カテゴリ) ２～４群説明変数アイテムまたはアイテム変数説明変数量的変数質的変数説明変数のカテゴリアイテム・カテゴリ説明変数のカテゴリ最大 24 カテゴリアイテム・カテゴリ数アイテム・カテゴリ数アイテム・カテゴリ数最大 600 アイテムカテゴリ ■活用場面・製造条件から製品の合否を予測する(2 群の判別分析) ・試験成績からタイプを分類する(2～4 群の判別分析) ・症状から検査データから不具合モードの診断する(2～4 群の判別分析) 等 ■データ入力形式下表のような 2 元表形式のデータを入力します．目的変数は質的変数です．2 群の判別分析をおこなう場合はカテゴリを 2 種類，3～4 群の判別分析を行う場合は 3～4 種類を入力してください.説明変数は最大 255 個まで指定でき，量的変数，質的変数いずれを入力しても解析が行えます．なお，判別分析で解析できる総アイテムカテゴリ数は 600 種類までです．質的変数の各カテゴリ，各サンプルのサンプル名には適当な名称を入力しておくと解析時に識別し易くなります．欠測値のあるサンプルあるいはマスクされているサンプルは解析時に除かれます． (サンプル名) [サンプル名] (電流) ［量的変数］ (電圧) ［量的変数］ (速度) ［量的変数］ (欠陥の有無) ［質的変数］ 1 128 32 86 なし 2 135 31 95 あり 3 126 29 92 なし : : : : : 4.1 判別分析･数量化Ⅱ類とは

(25)

■機能構成本システムにおける判別分析・数量化Ⅱ類は以下のような機能で構成されています．機能内容変数選択判別関数群間の別れ具合や誤判別率を確認しながら，判別関数に取り入れる説明変数を検討します．一般的判定ジャックナイフ判定実測値と判別関数で求めた予測値を集計表やグラフなどで比較します．比較方法として一般的判定やジャックナイフ法判定を使い，各サンプルの判別結果の正誤を吟味します．また，3，4 群の判別分析では次元の減少による正準判別分析の結果から群の分かれ具合を確認します．予測得られた判別関数に任意値を指定し，予測値を計算します．４．２手法の選択選択方法［手法選択］-［多変量解析］-［判別分析・数量化Ⅱ類］４．３判別関数を求める判別関数に取り込むべき説明変数はどれか，その判別関数の判別率はどの程度あるかなどを検討します． D^2(2 群間のマハラノビスの平方距離)，D^2 の差(この説明変数を判別関数に取り込む場合，あるいは外す場合のマハラノビスの平方距離の変化量)，誤判別率，F 値(この説明変数を判別関数に取り込む前後での分散比)，判別係数(この説明変数の判別係数．一番上の行の数値は定数項)などの情報をもとに，変数選択をおこないます．選択されている変数行の左端には「IN」が表示されます．また，現在選択されている説明変数を取り入れた場合の判別関数の良さを判断する基準として，マハラノビスの平方距離(D)^2(判別効率)と誤判別率が表示されます．一般に説明変数が多く取り込まれた場合は判別効率が過大に評価されてしまうため，説明変数の数の影響を除いた (D')^2(自由度調整判別効率)，判別関数に有用でない説明変数を取り込んだ時の影響を除いた (D'')^2(自由度二重調整判別効率)も表示されます．ツールボタン内容昇順ソート D^2，D^2 の差，Ｆ値の列を選択状態にしてからこのボタンを押すと，その列の値が小さい順に説明変数を並び替えます降順ソート D^2，D^2 の差，Ｆ値の列を選択状態にしてからこのボタンを押すと，その列の値が大きい順に説明変数を並び替えます変数番号順ソート説明変数の並び順を変数指定画面で指定した順番に並び替えます変数増減法指定された分散比（Ｆ）の基準値をもとに，説明変数を自動的に判別関数に取り込みます．全変数選択変数指定された全ての変数を判別関数に取り込む．全解除判別関数に取り込まれた変数を全て解除し，初期状態に戻る． 4.2 手法の選択 4.3 判別関数を求める

(26)

判別分析・数量化Ⅱ ＰＡＲＴ９

第

４

章

4.3.1 判別関数に取り込む変数の検討「有用な説明変数は取り入れる」，「判別率を下げてしまう説明変数は外す」ことで判別関数の構成内容を検討します．手動選択をおこなう場合，Ｆ値(分散比)や群間の距離などを参考に，対話的に変数を一つずつ選択します．どの説明変数を選択すれば良いかの判断基準としては，一般的には「D^2(群間の距離)が大きい説明変数」，「Ｆ値の大きい説明変数」などがあります．また，判別関数の良さの判断基準としては「誤判別率が許容できる程度かどうか」があります．また実務面から見た場合，まずは「固有技術に照らして選ばれた説明変数とその判別係数の大きさや符号の向き(±)が納得のいくものかどうか」を確認することが重要です．誤判別率が下がらない場合は，判別関数を構成する重要な特性(説明変数)が使われていないことも考えられますので，データを追加してから再び解析を行って下さい．統計的に精度の高い判別関数を得るためには多くの説明変数が必要となる場合がありますが，実際に判別関数を使う段階になると，それらの説明変数について「データをとりやすいかどうか」，「コストはどの程度かかるか」なども大切な判断基準です．誤判別率の許容範囲とこれら実際上の制約条件を加味しながら，どこまで変数選択を行うかを検討して下さい． 3 群，4 群の判別においては，変数を選択した場合の各２群間の距離の変化量やこれらの距離の計が表示されます．変数選択の方法として， (1) 距離の計の大きい変数から選択する方法 (2) 各変数に対して２群間の距離の変化量に注目し，さらにその距離が大きい変数から選択する方法(リスクを最小化するためのミニマックス法) などがあります．４．４判別関数を確認する「判別関数」タブでは，求まった判別関数や各種統計量を表示します．４．５サンプルの判定をおこなう一般的判定かジャックナイフ判定かで，サンプルを判定します．ｎ個のサンプルから１個を除いたｎ－１個のサンプルにもとづいて，判別関数を計算します．その関数に，除いたサンプルの値を代入して，正しく判別されるかどうかを調べます．１番目のサンプルからｎ番目のサンプルまでを１つずつ，順次除いて計算します．このようにｎ個のサンプルからｎ－ｍ（ここではｍ＝１）個のサンプルを取り出して解析する方法を一般的にジャックナイフ法判定といいます．１つずつ除くので，「１つ取っておき法（leaving-one-out-method）」とも呼ばれます．通常の一般的判定方法（判定関数を計算したデータについて判定力を評価）に比して，ジャックナイフ法のほうが，誤判別の個数が多くなる傾向があります．その差は，判別関数に含まれるパラメータ（変数の数）が増えると大きくなります．通常の方法では，本当は判別に役立たない変数を取り入れても，誤判別の個数が減少する場合が少なくありませ 4.3 判別関数を求める 4.4 判別関数を確認する 4.5 サンプルの判定をおこなう

(27)

ん（個数が変化しないことはあっても増加することはない）．それに対しジャックナイフ法では，無意味な変数を入れると誤判別率が増加します．４．５．１誤判別表正答/誤答の数と比率を表示します．表側(行)が観測された群，表頭(列)が予測された群となります．ここでは，・現在の判別関数で誤判別率がどの程度なのか・どちらの群に誤まって判別されてしまうケースが多いのかを確認し，許容できる程度かどうかを判断します．「正常」か「異常」かの２群を判別する場合，「正常であるのに異常であると誤判別する」と「異常であるのに正常であると誤判別する」では後者の方が危険であり，これが少なくなるような判別関数を得ることが重要であると言えます．単に誤判別率の大小を評価するのではなく，個々の判別傾向についても誤判別表で確認して下さい．４．５．２サンプル表示各サンプルについて，各群の重心との距離，確率値，判別の結果などを一覧表示します． 2 群の判別では判別スコアも同時表示されます．「確率%」列が淡色表示されているサンプルは，『どの群の重心とも大きく離れているため判別しにくいサンプルである』ことを示しています(確率 1%以下)．４．５．３スコアのヒストグラム群間の距離や観測値の分布の重なり具合が確認できます．４．６次元の減少を伴う判別分析目的変数が 3～4 群の場合，「次元の減少を伴う判別分析」をおこなうことができます．一般的な判別分析では，各サンプルについて各群の重心からのマハラノビス距離の平方距離を求め，最も近い群に判別するような判別関数を求めました．次元の減少を伴う判別分析は，群内の分布がｐ次元の無相関標準正規分布になるような変換を行い，各群の相互位置が最も鮮明になるような軸を求めて判別をおこないます．機能内容連関図正準変量スコアのグラフを表示し，どの程度判別できているかをグラフで確認します．3 群の場合の連関図（散布図）では判別線や判別円を表示することもできます．正準変量スコア各サンプルの実測値と予測値，正準変量 Z のスコアを表示します．係数判別関数の係数を表示します．カテゴリスコアグラフ説明変数として質的変数が選択されている場合に，変数ごとに各カテゴリのスコア値を長さで示します．初期状態では，各変数について最初のカテゴリを 0 として他のカテゴリのスコアを相対的に表示します． 4.5 サンプルの判定をおこなう 4.6 次元の減少を伴う判別分析

(28)

判別分析・数量化Ⅱ ＰＡＲＴ９

第

４

章

４．７判別関数を使って任意サンプルを判別する求めた判別関数を使い，任意値による判別結果の確認(判別や予測)，検証用データによる判別関数の頑健性の確認などに利用します．任意値を使った対話的な計算を行う場合は (1)任意値による判別判別関数の頑健性を検証するために検証用データを使った自動計算を行う場合は (2)マスクデータによる判別をおこないます． (1)任意値による判別各説明変数に任意の値を入力します．入力対象セルをクリックすると画面左上にはその説明変数の最小値，平均値，最大値が表示されますので参考にします．ツールボタン[計算開始]をクリックすると，判別関数による予測値，判別スコアが表示されます．なお，Excel から説明変数の値をコピーすることも可能です． (2)マスクデータによる判別画面右上のリストで「マスクデータ予測」を選択します． 4.7 判別関数を使って任意サンプルを判別する

(29)

(30)

二次判別関数ＰＡＲＴ９

第

５

章

第５章二次判別関数

５．１二次判別関数とは ■目的「線形判別関数」は各群の分散共分散行列が等しいと仮定して導出されています．そのため，判別関数に取り入れた説明変数によってその仮定が成り立たたない場合，線形判別関数では良い判別結果が得られない可能性があります．一方「2 次判別関数」は各群の分散共分散行列が異なると仮定して導出されています．本システムでは，変数選択画面において，判別関数に説明変数を取り入れた後各群間の分散が等しいかどうかを検定し，線形/2 次いずれが推奨されるかを表示します（この機能は説明変数が全て量的変数の場合にのみ使用できます）．「等分散性検定」タブの「判定」メッセージを確認し，線形判別関数，2 次判別関数どちらで分析を続けるか検討します．なお，判定は等分散性検定を有意水準 5%で計算した結果にもとづいています．5%以外の任意の有意水準で検討したい時は，「P 値 < 任意の有意水準」の場合は「違いがありそうである」，「P 値 > 任意の有意水準」の場合は「違いがあるとは言えないようである」と読み取ることができます．機能については「判別分析・数量化Ⅱ類」の章も合わせて参照してください． 5.1 二次判別関数とは

参照

今ダウンロードする ( PDF - 53 ページ - 5.41 MB )

Outline

ＡＩＤ(多段層別分析) 非階層的クラスター分析（k-means 法）階層的クラスター分析 SD 法（SD プロファイル）

関連したドキュメント

著者中山和也, 佐南谷葉月, 岡本一将, 尾? 咲耶,

３次元的な線量評価が重要であるが１），現在 X 線フィルム２）を用いた２次元計測が主流であり，３次元的評

モンゴル国ドンゴイン・シレー遺跡の三次元記録

Osawa Takashi, 2017, The position and significance of the inscription and site of Dongoin Shiree of the Eastern Mongolia in the Archaeological and Historical research

張力を適正にするアライメントを再調整する正規のプーリに取り替える正規のプーリに取り替える

Q7

タイムズカーレンタル貸渡約款第 1 章総則第 1 条 ( 約款の適用 ) 1. タイムズモビリティ株式会社 ( 以下当社といいます ) は本約款の定めるところにより貸渡自動車 ( 以下レンタカーといいます ) を借受人に貸し渡すものとし借受人はこれを借り受けるものとしますなお本約

借受人は、第 18

2 次元 FEM 解析モデルを添図 2-1 に示す。なお，2 次元 FEM 解析モデルには，地震観測時点の建屋の質量状態を反映させる。.

章番号ページ番号変更後変更前

まとめ資料変更箇所リスト

章番号ページ番号変更後変更前

学習資料をアップロードして、すべてのドキュメントをダウンロードしてください。

あなたのドキュメントは、123deta JP で共有され、学習を支援するために充実されます。

関連したドキュメント

Microsoft Word 　Ⅱ本文-1(P1からP10）

Microsoft Word 　Ⅱ本文-1(P1からP10）

47

0

0

第７章ロボットシステムでの総合評価実験

第７章ロボットシステムでの総合評価実験

29

0

0

企業予算論の新展開（1）

企業予算論の新展開（1）

14

0

0

経済研究所 / Institute of Developing

経済研究所 / Institute of Developing

20

0

0

Theoretical Study of the Many-Electron State and Hund’s Rules in Spherical Artiﬁcial Atoms

Theoretical Study of the Many-Electron State and Hund’s Rules in Spherical Artiﬁcial Atoms

123

0

0

自閉症の哲学的探求 ― 新たなパースペクティブの形成を巡って ―

自閉症の哲学的探求 ― 新たなパースペクティブの形成を巡って ―

16

0

0

令和２年度第１回枚方市都市計画審議会議案書

令和２年度第１回枚方市都市計画審議会議案書

35

0

0

地表プロセスと環境変動を測る時間軸の設定

地表プロセスと環境変動を測る時間軸の設定

5

0

0