• 検索結果がありません。

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

N/A
N/A
Protected

Academic year: 2021

シェア "1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

1

1

多変量解析の基本的な概念

多変量解析の基本的な概念

1.1 多変量解析の目的

人間のデータは多変量データが多いので多変量解析が有用 <表1.1 脂質異常症患者の TC と TG と重症度> 症例No. TC TG 重症度 1 220 100 0 2 230 150 1 3 240 150 2 4 240 250 1 5 250 200 3 6 260 150 3 7 260 250 2 ◎……◎……◎    ◎ ○……○……○  →◎ ¦  ¦  ¦  ¦ ¦  ¦  ¦  ¦ ○……○……○  →◎ ¦  ¦  ¦  ¦ ¦  ¦  ¦  ¦ ○……○……○  →◎ ◎ 要約値 ○……○……○  →◎ ¦  ¦  ¦  ¦ ¦  ¦  ¦  ¦ ○……○……○  →◎ ¦  ¦  ¦  ¦ ¦  ¦  ¦  ¦ ○……○……○  →◎ 総合的評価・考察 総合的評価・考察 特性 概括評価 特性 概括評価 症 例 症 例 主 治 医 の 主 観 主 治 医 の 主 観 単変量解析 客観的規準のある要約 多変量解析 客観的規準のない要約 知識・直感 知識・直感 単変量解析の場合 多変量解析の場合

(2)

・多変量データまたは多特性データ…お互いに関連のある多種類のデータ ・単変量解析…1 種類のデータ、または原因も結果も 1 種類のデータを要約するための手法 例:平均値の推定と検定、相関係数、回帰直線等 ・多変量解析…多変量データまたは多特性データを総合的に要約するための手法 例:重回帰分析、判別分析、ロジスティック回帰分析等 <多変量解析の特徴> ・多種類のデータを数学に基づいて総合的に要約するため、結果に主観が入りにくい。 ・理論が複雑で理解しにくい。 ・結果が複雑で解釈しにくい。 ・信頼性の高い結果を得るためには例数が沢山必要。

・データの質を敏感に反映する→GIGO( ガイゴウ) : garbage in garbage out( ゴミを入

れればゴミが出る!) 多変量解析は 単変量解析では得られないような素晴らしい結果を得るためのものではなく 単変量解析で良い結果が得られている時に それらの結果を客観的に要約するための手法 人間は多くの機能が複雑に絡み合った有機システム 医学・薬学分野で用いられるデータは人間から得られるものが多い 本質的に多変量データまたは多特性データと考えられる

(3)

1.2 多変量データの要約と多変量解析

概括評価項目は多変量データをカンピュータで総合した要約値の一種 ・概括評価項目 表1.1 の重症度は、総コレステロール(TC)とトリグリセリド(TG)の持つ情報を主治医が要約して 概括評価したもので、平均値と同じような要約値の一種。 <概括評価項目の作り方> (1) 各項目の平均値または合計…重症度相当の概括評価項目 平均値:z1=TC+ TG 2 =0.5×TC+ 0.5×TG 図1.1 で、z1軸つまり45 度の傾きを持つ直線 x2=x1に各プロットから垂線を下し、原点 100 200 300 100 200 300 図 1.1 TC と TG の散布図 0 (250,200) TC TG x1 z1軸 z1 z3軸 z3 x2 225 225 25 -25

(4)

図1.1 で、z1軸つまり45 度の傾きを持つ直線 x2=x1に各プロットから垂線を下し、原点 からその点までの距離に√2 を掛けた値になる。 例:表1.1 の No.5 のデータ: z1=250+ 200=450=

2252+2252×

2 ※図1.1 の z1軸とz3軸は目盛の間隔がx1軸やx2軸の√2 倍になる。そこで z1の長さを√2 で割ると x1軸 やx2軸と同じ単位になる。したがってz1は本質的には平均値と考えることができる。 (2) 各項目の重み付け合計…項目の重要度を考慮した重症度相当の概括評価項目 z2=1×TC+ 0.5×TG 例:表1.1 の No.5 のデータ:z2=250+0.5×200=350 (3) 各項目の差または符号付き合計…タイプまたはプロフィールを表す概括評価項目 z3=TC−TG=1×TC+ (−1)×TG 図1.1 で、z3軸つまり-45 度の傾きを持つ直線 x2=-x1に各プロットから垂線を下し、原 点からその点までの距離に√2 を掛けた値になる。 例:表1.1 の No.5 のデータ: z3=250−200=50=

252+ 252×

2 z3:正で絶対値が大きい…TC 型(IIa 型) z3:絶対値が小さい…中間型(IIb 型) z3:負で絶対値が大きい…TG 型(IV 型) 人間が判定した概括評価項目も、概括評価項目に相当する検査項目も 近似的に「y=b0+b1・x1+…+bp・xp」という形式で表すことができる この係数b0~bpを人間はカンピュータで決め、自然は科学法則によって決めている 多変量解析はこの係数b0~bpを数学的に推測するための手法

(5)

1.3 多変量解析の分類

多変量解析は外的基準の有無によって2 種類に大別できる ・内的基準…説明変数(独立変数)=原因項目。表 1.1 の TC と TG。 ・外的基準(基準変数)…目的変数(従属変数)=結果項目。表 1.1 の重症度。 ・潜在変数…直接観測可能ではなく、色々なデータの変動パターンを通して間接的に推測される 変数。原因にも結果にもなる。 <多変量解析手法の分類> 手法名 目的変数 説明変数 潜在変数 名義尺度 計量尺度 名義尺度 計量尺度 名義尺度 計量尺度 重回帰分析 - 1 - 多数 - - 共分散分析 - 1 多数 多数 - - 分散分析 - 1 多数 - - - 数量化I 類 - 1 多数 - - - 正準相関分析 - 多数 - 多数 - - 判別分析 1 - - 多数 - - ロジスティック回帰分析 1 - - 多数 - - 数量化II 類 1 - 多数 - - - 多変量解析 予測・判別の問題 概括評価基準の分析 データの内部構造の分析 概括評価基準の設定 外的基準がある場合 外的基準がない場合 重回帰分析、判別分析 ロジスティック回帰分析等 医学・薬学分野向きの手法 主成分分析 クラスター分析等 心理学・社会学分野向きの手法

(6)

0 1 0 1 × × × × × × × × × × × × × × × × × × × × × × × × 0 1 1 0 0 1 1 0 ● × × × × × × 1 0 ● ●● ● ● ● ● ●● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● ● ● ● ● ●● ● ● ●● ● ● ● ●● ● ●●● ●●● ● ● ● ● ● ● 図 1.2 各種多変量解析手法の関係 基準変数が ない時 正準相関分析 重回帰分析 主成分分析 因子分析 数量化III 類 数量化III 類 数量化II 類 分散分析 共分散分析 数量化I 類 判別分析 ロジスティック回帰分析 クラスター分析 説明変数が 名義尺度の時 説明変数が 潜在変数の時 名義尺度の時説明変数が 基準変数が 名義尺度の時 基準変数が 名義尺度の時 基準変数も 名義尺度の時 説明変数も 名義尺度の時 基準変数が 名義尺度の潜在変数

参照

関連したドキュメント

分分析の解説の 16章から構成されている 9

拡張 Hensel 構或とは、 与式から一意に定まる “Newton 多項式 ”

4 ばそれ らを含む最小の半群 も一致す る。従 って、比較す る方法 として、そ れ らの解析 関数芽の福井不変量 の半群 が一致す るな らば、 それぞれの福

多変量データ 多変量データ を分析する 統計手法の総称 総称 講義資料@慶応大学 2005.5.6 by

第三は、農耕地、海岸砂地から林地を含む多様な生息環境とそこでのアリ群集の対応を SOM によ り解析し、群集のパターンとアリの種の類別化を試みた。用いたデータは福岡市内の

参考文献 • 足立浩平(2006)多変量データ解析法-心理・教育・社会系のための入門- ナカニシヤ 出版 • 加藤剛(2013)

重回帰分析とは?

 年齢差と地域差の存在は,単純集計からはもちろんのこと,一般的な共通語化の方