• 検索結果がありません。

講義内容

N/A
N/A
Protected

Academic year: 2021

シェア "講義内容"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

1

多変量解析

2009年度後期 羽石 秀昭(はねいし)

講義内容:

・統計解析の基礎

・重回帰分析 (Multiple Regression Analysis)

+情報量基準 (information Criterion)

・主成分分析 (Principal Component Analysis)

成分分析 (

p

p

y

)

・判別分析 (Discriminant Analysis)

・検定・分散分析

参考書籍: 参考書籍: 1.基本統計学 宮川公男 著 有斐閣 2,678円 2.情報量基準による統計解析入門 鈴木儀一郎 著 講談社 2,718円 3.情報量統計学 坂元,石黒,北川 著 共立出版 3,760円 4 多変量解析法 奥野 久米 芳賀 吉澤 著 講義日程 10月 7 ,14,21,28 11月 4 11 18 25(中間テスト) 4.多変量解析法 奥野,久米,芳賀,吉澤 著 日科技連 2,800円 5.多変量解析概論 塩谷 著 朝倉書店 3,708円 11月 4,11,18,25(中間テスト) 12月 2(休講),9,16 1月 13,20,27 2月 3(期末テスト)

2

回帰分析とはどのようなものか ~単回帰について~

1つの変数xから,1つの変数yを推定する. x:説明変数 例) 勤続年数と年収の関係を分析する.

y

=

ax

+

b

直線で関係式を表現する. y = 22.05x + 275.2 R² = 0.972 800 900 y:目的変数

y

ax

+

b

600 700 800 y

勤続年数, x

年収, y

300 400 500 年収, y

2

325

4

350

6

400

0 100 200

8

425

10

475

12

575

17

700

0 0 10 20 30 勤続年数, x

17

700

20

750

23

775

26

800

26

800

(2)

回帰分析とはどのようなものか ~重回帰について~

2つ以上の変数x

,x

,...から,1つの変数yを

推定する

推定する.

例) 最低気温(y)と緯度(x

),標高(x

)の関係

+

+

y

最低気温 各地のデータ(サンプル)から 回帰係数a a a を決定する 3 2 2 1 1

x

a

x

a

a

y

=

+

+

平面で近似 回帰係数a1,a2,a3を決定する. 2

x

標高 1

x

緯度 緯度

4

主成分分析とはどのようなものか

互いに相関のある多種類の変数を,互いに無相関な少数個の変数に要約する.

k

1

:サンプルの分散が最大の方向

k

2

:2番目に分散が大きい方向

k1 k2

x

=

α

1 1

k

+

α

2 2

k

2

x

k1

x

α

1 1

k

+

α

2 2

k

x

α

1 1

k

k1

k2

M次元空間の場合も同様:

1

x

M

x

本授業での表記の約束

原則として

・ベクトル量は太字

本授業での表記の約束

x

1

x

2

x

・スカラー量は細字

で表す

x

(3)

~応用事例 RGBカラー画像を2バンドで表す~

オリジナル画像

デモソフトで表示

=

1 1 1

G

R

x

1 1 1

B

G

x

2

x

x

3 1

x

RGB空間での画素値の分布

・・・ ・・・ Program name:PCAdemoRGB.m

6

~応用事例 RGBカラー画像を2バンドで表す~(つづき)

第1および第2主成分のみ

RGB空間での画素値の分布

(4)

~応用事例 RGBカラー画像を1バンドで表す~

第1主成分のみ

RGB空間での画素値の分布

8

~応用事例 RGBカラー画像を1or 2バンドで表す~

第1および第2主成分 み オリジナ カラ 画像 第1および第2主成分のみ オリジナルカラー画像 第1主成分のみ 第1主成分のみ

(5)

判別分析とはどのようなものか

x

例)内視鏡画像からの自動診断

診断のついている

画像群

正常

x

2

画像から特徴量x

1

,x

2

(色

形など)を抽出

正常

異常

判別関数を決定

x

1

x

2 プロット

(色,形など)を抽出

異常

異常

ax

1

+

bx

2

+ =

c

0

判別関数を決定

x

1

x

1

x

2

新しい画像がきたとき:

特徴量を算出

判別関数により,正常,異常を判断.

判別関数により,正常,異常を判断.

10

1変数の統計量・変数の標準化

1変数の統計量 n個のサンプル(標本)の観測値xが 変数の標準化(基準化,正規化:normalization ) n個のサンプル(標本)の観測値xが と得られているとする. 観測値{xi}を以下の式により変換することを 標準化という. n

x

x

x

1

,

2

,...,

・平均(1次の統計量) mean

u

i

=

x

i

m

σ

・分散(2次の統計量)(母集 団の分散の推定値ではなく,サ ンプル自体の分散) 標準化されて得られる変数uiは平均が0, 標準偏差が1である. たとえば度数分布で考えると 各自導出のこと variance たとえば度数分布で考えると

σ

度数 度数 ・標準偏差(分散の平方根. ただし正の値のみを扱う) t d d d i ti

x

m

0

0

u

σ

u

= 1

σ

もとの観測値 標準化された観測値 standard deviation もとの観測値 標準化された観測値

(6)

2変数間の相関・共分散

1つのサンプルにつき2つの観測値(x1i,x2i)が得られるものとする. それぞれの平均値が,

m

n

i

x

i

m

n

x

n i i n 1 1 1 2 2 1

1

1

=

=

= =

,

例)10人の体重と身長の関係 体重 x2 のとき, i=1 i=1 体重, x2 m2 n

1

身長, x1 m1

=

=

n i i i

m

x

m

x

n

1 2 2 1 1 12

(

)(

)

1

σ

を2つの変数の共分散(covariance)という. x の変化のしかたとx の変化のしかたに もし,以下のようなら共分散は小さい 体重, x2 x1の変化のしかたとx2の変化のしかたに 相関があれば,共分散の絶対値は大きくなる. 相関がまったくなければ共分散は0となる. m2 身長, x1 m1

12

手計算による演習

例題1 2変数をもつ3つのサンプル,

(1,1),(2,2),(3,3)をグラフにプロットしなさい.

また,各変数の平均と,共分散を求めなさい.

例題2

2変数をもつ4つのサンプル,

(1,1),(3,1),(1,3),(3,3)をグラフにプロットしなさい.また,

各変数

平均と

共分散を求めなさい

各変数の平均と,共分散を求めなさい.

(7)

多変数の統計量

サンプル(標本)データ あるいは,まとめて 11 1n

x

x

⎡ ⎤

⎢ ⎥

x

11

x

12

"

x

1n

X

原則として ・ベクトルは太字小文字

本授業での表記の約束

平均ベクトル

x

2 11 1 1 21 2

...,

n n n

x

x

=

⎢ ⎥

=

⎢ ⎥

⎣ ⎦

x

x

=

n n

x

x

x

21 22 2 1 12 11

"

X

・行列は太字大文字 で表す 平均ベクトル 2

( )

( )

=

+

+

+

=

=

= n n i i n

x

n

n

m

m

1 1 2 1 1

1

)

(

1

x

x

x

m

"

c

この方 向

x

1 共分散行列 各変数とも 平均を0にしてから

( )

= i i

x

n

n

m

1 2 2

1

c

22

c

向 の分散 共分散行列 各変数とも,平均を0にしてから 相関を計算して得られる行列 2

1

1

(

)

(

)(

)

n n

x

m

x

m x

m

11

c

この方向の分散 1 1 1 1 2 2 11 12 1 1 2 21 22 1 1 2 2 2 2

(

)

(

)(

)

1

1

(

)(

)

(

)

i i i i i n n i i i

x

m

x

m x

m

c

c

n

n

c

c

x

m x

m

x

m

n

n

= =

=

= ⎢

C

1 1 1

1

(

)(

)

i i n t i i i

n

n

n

= = =

=

x

m x

m

14

相関係数

相関係数

=

n

x

i

m

x

i

m

r

1

(

1 1

)(

2 2

)

1

2

1

2

(

)

(

)

n n

x

m

x

m

σ

=

σ

=

ただし 標準化した変数の相関

= i

n

1

σ

1

σ

2 1 1 1 1 2 1 2 2

(

i

) ,

(

i

)

i i

x

m

x

m

n

n

σ

σ

= =

検証

=

=

n i i i n i i i

u

u

n

m

x

m

x

n

r

1 2 1 1 2 2 2 1 1 1

)

(

)

1

(

1

σ

σ

検証

2 1

0,

i i

x

ax

b

a

b

=

+

ただし

は定数.

− ≤ ≤

1

r

1

相関係数の取りうる範囲: = = i i

n

n

1

σ

1

σ

2 1

ただし

a

0,

b

 は定数.

のとき,rを計算せよ.

x

2

x

2

x

2

x

2

x

1

x

1

x

1

x

1

r

= −1

r

= 0

r

= 1

0

< <

r

1

正の相関 相関なし 負の相関 正の相関

(8)

共分散行列の例

3.5 Uncorrelated data 3 Correlated data 1.5 2 2.5 3 1.5 2 2.5 0 5 0 0.5 1 x2 0 0.5 1 x2 -1 0 1 2 3 4 5 -1 -0.5 x1 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 -0.5 x1 共分散行列 共分散行列

1

.

0964

0

.

1011

0

.

5149

0

.

5100

相関係数

r

= −

0.224

相関係数

r

=

0.922

8924

.

0

1011

.

0

5225

.

0

5100

.

0

16

多変数の共分散行列

一般にd変数の場合の共分散行列は

=

= n

= i n i i n i i di d n i i i n i i

m

x

m

x

m

x

m

x

m

x

m

x

m

x

m

x

1 2 2 2 1 2 2 1 1 1 1 1 1 1 1 2 2 1 2 1 1

)

(

)

)(

(

)

)(

(

)

)(

(

)

(

1

"

C

=

= = = = n i di d n i di d i i i i i i

m

x

m

x

m

x

n

1 2 1 1 1 1 2 2 1 2 2 1 1

)

(

)

)(

(

)

(

)

)(

(

#

%

#

C

(k,l)成分はk番目の変数とl番目の変数の間の共分散を意味する.

i 1 i 1

c

kl

x

ki

m

k

x

li

m

l i n

=

=

(

)(

)

1

⎡c

11

0

"

0

もし,すべての変数が互いに無相関なら 共分散行列は対角行列になる. (対角要素は,各変数の分散を表す)

=

c

n

0

0

1

22 11

%

%

#

#

%

C

0

"

0

c

dd

参照

関連したドキュメント

第1条

2(1)健康リスクの定義 ●中間とりまとめまでの議論 ・第

・ 改正後薬機法第9条の2第1項各号、第 18 条の2第1項各号及び第3項 各号、第 23 条の2の 15 の2第1項各号及び第3項各号、第 23 条の

第1章 防災体制の確立 第1節 防災体制

区分別用途 提出の有無 ア 第一区分が半分を超える 第一区分が半分を超える 不要です イ 第一区分が半分を超える 第二区分が半分以上 提出できます

年度 2013 2014 2015 2016 2017 2018 2019.

   縮尺は100分の1から3,000分の1とする。この場合において、ダム事業等であって起業地

第1章 総論 第1節 目的 第2節 計画の位置付け.. 第1章