• 検索結果がありません。

L P y P y + ɛ, ɛ y P y I P y,, y P y + I P y, 3 ŷ β 0 β y β 0 β y β β 0, β y x x, x,, x, y y, y,, y x x y y x x, y y, x x y y {}}{,,, / / L P / / y, P

N/A
N/A
Protected

Academic year: 2021

シェア "L P y P y + ɛ, ɛ y P y I P y,, y P y + I P y, 3 ŷ β 0 β y β 0 β y β β 0, β y x x, x,, x, y y, y,, y x x y y x x, y y, x x y y {}}{,,, / / L P / / y, P"

Copied!
16
0
0

読み込み中.... (全文を見る)

全文

(1)

最小二乗法

浅川伸一

2005

年 5 月 16 日

1

基本仮定

y = Xβ + ² (X ={x1, x2, . . . , xp}). yを従属変数, X ={x1, x2, . . . , xp} を独立変数, β を回帰係数, ² を誤差項または残差 という. 仮定 1 E (²) = 0. 仮定 2 V (²) = σ2I. 仮定 3 rank (X) = p. 仮定 4 誤差項 ²i はそれぞれ独立に N ¡ 0, σ2¢に従う.

2

解法

2.1

最小 2 乗解

誤差の 2 乗和 |²|2 を最小にする. |²|2 = (y− Xβ)0(y− Xβ) = y0y− 2β0X0y + β0(X0X) β, だから |²|2 ∂β =−2X 0y + 2X0 = 0 X0 = X0y これを解いて, bβ =¡X0X¢−1X0y.

2.2

別解 1. ベクトル幾何学的解法

誤差項 ² は回帰モデルによって説明されない部分である. この ² のノルムを最小にするよに β を定め る. すなわち |²|2 =|y − Xβ|2 → min. これは L (X) 上へ y を射影することに相当する. この射影は X¡X0X¢−1X0y によって与えられる. これによってy = X bb β = X¡X0X¢−1X0y. すなわち b β =¡X0X¢−1X0y. b βを β の最小 2 乗推定量 という.

(2)

X によって張られる線形部分空間 L (X) への射影行列 X¡X0X¢−1X0 を P と表現すれば回帰式は y = P y + ², となる. さらに ² = y− P y = (I − P ) y, すなわち, 回帰式を射影行列による独立変数ベクトルの分解 y = P y + (I− P ) y, と考えることができる.

2.3

別解 2.

誤差ベクトルと予測ベクトルy = Xβb とは直交するからその内積は 0 である. ((Xβ)· (y − Xβ)) = 0 β0X0y− β0X0 = 0. これを解いて, bβ =¡X0X¢−1X0y. 平均偏差ベクトル n個のデータからなる n 次元ベクトル x = (x1, x2, . . . , xn)0, y = (y1, y2, . . . , yn)0 の個々 の要素から平均値を引いたベクトルを平均偏差ベクトルという.      x1− x x2− x .. . xn− x     ,      y1− y y2− y .. . yn− y     , この平均偏差ベクトルの意味を考える. すべての要素が 1 であるベクトル 1 = ( n個 z }| { 1, 1, . . . , 1 )0よって張られる部分空間 L (1) への射影行列をつくると P = 1 (101)−110=    1/n · · · 1/n .. . . .. ... 1/n · · · 1/n    となる. この射影行列に右から y を乗ずると, P y = (y, y, . . . , y)0 となる. したがって, 平均偏 差ベクトルは, y− y1 = y − P y = (I − P ) y すなわち, 平均偏差ベクトルとは L (1) の補空間 への射影ベクトルである. この平均偏差ベクトルの長さの 2 乗|x|2 をデータ数で割ったものは 1 n|x| 2 = 1 n(x, x) = 1 n n X 1 (x− x)2= s2x, 平均偏差ベクトルをもちいると x と y との相関係数は rxy = Sxy SxSy = (x· y) |x| |y| = cos θxy

3

単回帰

説明変数, 被説明変数とも 1 個の場合を単回帰という. 回帰モデルは y = xβ + ² である.

(3)

3.1

最小 2 乗解

i 番目のデータを yi = β xi+ α + ²i (i = 1, 2, . . . , n) yi− y = β (xi− x) + ²i (i = 1, 2, . . . , n), とする. 実測値 yi と予測値 βxi+ αとの差の 2 乗 (yi− βxi− α) 2 = ²2i を全データについて加算した 2 乗和 n X i (yi− βxi− α) 2 = n X i ²2i = Q, を, 回帰パラメータ α, β についてそれぞれ偏微分して 0 とおく,   ∂Q ∂α ∂Q ∂β   =µ −2 P(y i− βxi− α) −2Pxi(yi− βxi− α) ¶ = µ0 0 ¶ µ Py i −βPxi −nα Px iyi −βPx2i −α Px i ¶ = µ0 0 ¶ . これを α, β について解くと, α = y− βx. さらに, X xiyi− β X x2i − (y − βx) nx = 0 β³Xx2i − n (x)2´ = Xxiyi− nxy βns2x = nsxy β = sxy s2 x .

3.2

ベクトル幾何学的解法

平均偏差ベクトルを用いれば b β = (x0x)−1x0y = P (x− x) (y − y) P(x − x)2 = Sxy S2 x . あるいは, 平均偏差ベクトルを用いなくても, すべての要素が 1 である n 次元ベクトル (1) をもちいて X = (1, x)0 とする. さらに, β = (α, β) を用いて改めて回帰方程式を y = Xβ + ², とおく, このとき b β = (X0X)−1X0y = µ101 10x 10x x0x−1µ10y x0y ¶ = µ n Px Px Px2 ¶−1µ Py Pxy

(4)

= 1 nPx2− (Px)2 µ Px2 Px Px n ¶ µ Py Pxy ¶ = 1 n2S2 x µn¡ S2 x+ x2 ¢ −nx −nX n ¶ µ Py Pxy ¶ = 1 S2 x µS2 x+ x 2 −x −x 1 ¶ µ y Sxy+ xy ¶ = 1 S2 x µy¡ S2 x+ x2 ¢ − x (Sxy+ xy) Sxy+ xy− xy. ゆえに µα β ¶ =   ySxy S2 x x Sxy S2 x . つまり yi = α + βxi+ ²i = y− βx + βxi+ ²i, あるいは, yi− y = β (xi− x) + ²i. データから平均値を引いた値の回帰と定数 α を含めた回帰は同じものである. この場合, α = y− βx で ある.

4

パラメータの推定

4.1

回帰係数の期待値

すでに見たとおり, 回帰係数 bβ の最小 2 乗推定量は,¡X0X¢−1X0y で与えられる. (X0X)−1X0= C とおけば, bβ = Cyである. 統計量が Cy の形に書けるとき, 線形推定量であるという. y が確率変数であ ることから, その線形推定量 bβも確率変数となって, 期待値を導出できる. b β = (X0X)−1X0y = (X0X)−1X0(Xβ + ²) = β + (X0X)−1X0². これをもちいて, E³βb´ = E³β + (X0X)−1X0²´ = E (β) + E³(X0X)−1X0²´ = E (β) + (X0X)−1X0E (²) = β. あるいは, E³β= (X0X)−1X0E (y) = (X0X)−1X0Xβ = β. つまり, 標本回帰パラメータは母集団回帰パラメータに一致する. すなわち, 最小 2 乗推定量の bβは不偏 推定量でもある.

(5)

4.2

回帰係数の分散

回帰係数 bβの期待値は, 不偏推定量であるが, 分散は不偏推定量とはならない. V ³βb´ = E³βb− β´ ³βb− β´0 = E · (X0X)−1X0²n(X0X)−1X0²o0 ¸ = Eh(X0X)−1X0²²0X (X0X)−1i = (X0X)−1X0E (²²0) X (X0X)−1 = (X0X)−1X0σ2IX (X0X)−1 = σ2I (X0X)−1X0X (X0X)−1 = σ2(X0X)−1. 仮定 4. ²i∼ N ¡ 0, σより, ² ∼ N¡0, σ2I¢ゆえに, b β∼ N³β, σ2(X0X)−1´, をえる. これをもちいて, 回帰係数の推定, 検定を行うことが可能となる. そのためには, 母数 σ2の推定値 を求めなければならない.

4.3

残差の推定

従属変数の実測値 y と予測値y = Xβb との差 e = y− byを残差という. 誤差項 ² は測定不可能な母数 であり, ² はその推計値である. 誤差 ² とその分散 σ2 には次の性質がある. 以下では L³X´ への射影 行列を I− X¡X0X¢−1X0 = PXと表す. PXrank PX = tr PX = tr In− tr X¡X0X¢−1X0 = n− tr (X0X)−1X0X = n− tr Ip= n− p. 1. E (e) = 0. e = hI− X¡X0X¢−1X0iy = hI− X¡X0X¢−1X0i(Xβ + ²) = hI− X¡X0X¢−1X0i² = PX². E (e) = P XE (²) = 0. 2. Cov³e, bβ´= 0. Cov³e, bβ´ = EhPX²²0X (X0X)−1i = PXE (²²0) X (X0X)−1 = PXσ2IX (X0X)−1 = σ2PXX (X0X)−1 = 0.

(6)

3. V (e) = σ2hI− X¡X0X¢−1X0i. ||e||2 = ee0=³y − X bβ´0³y− X bβ´ = y0y− 2bβ0X0y + bβ0X0X bβ = y0y− bβ0X0y = y0hI− X¡X0X¢−1X0iy, のように書けるので, 誤差分散は, V (e) = E (ee0) = PXE (²²0) PX = PXσ2IPX = σ2PXPX = σ2PX. 別解. 一般に 2 次形式 x0Ax = tr Axx0 が成り立つから E (e0e) = tr P Xσ 2I = σ2tr P X = σ2(n− p) . 従って, σ2の不偏推定量は s2e= e 0e n− p, で与えられる. 4. X0e = 0. すなわち, ²∼ N¡0, σ2I¢のとき e∼ N¡0, σ2PX¢= N³0, σ2hI− X¡X0X¢−1X0, に従う.

4.4

別解

以上のことをベクトル表記を用いずに求めることを考える. 一般の場合の求めるのは複雑になるので, こ こでは単回帰の場合のみ記す. yi = β xi+ α + ²i (i = 1, 2, . . . , n) yi− y = β (xi− x) + ²i (i = 1, 2, . . . , n), において, 標本回帰パラメータ a,b から母集団回帰パラメータ α, β を推定する. 仮定: E (²i) = 0, V (²i) = σ2². すなわち Y ¡ α + β x, σ²2 ¢

(7)

1. 回帰パラメータ b の期待値 b = sxy sx = 1 n P(x i− x) (yi− y) 1 n P (xi− x) 2 . 上式に, yi− y = β (xi− x) + ²i を代入すると b = sxy sx = 1 n P (xi− x) (β (xi− x) + ²i) 1 n P(x i− x) 2 = β 1 n P (xi− x) 2 +1nP²i(xi− x) 1 n P(x i− x) 2 = β + 1 n P(x i− x) 1 n P (xi− x) 2²i. ゆえに E(b) = E Ã β + 1 n P (xi− x) 1 n P(x i− x) 2²i ! = E (β) + 1 n P(x i− x) 1 n P (xi− x) 2E (²i) = β. 2. 回帰パラメータ a の期待値 E(a) = E (y− bx) = E (y) − E (bx) = E (y)− xE(b) = E (y)− βx. ところで, x,y は, 母集団において y = α + βx + ² となるから E (y) = E (α + βx + ²) = E (α) + E (βx) + E (²) = α + βx. 従って E (α) = α + βx− βx = α. 3. 回帰パラメータ b の分散の期待値 V (b− β) = E (b − β)2 = E Ã β + 1 n P(x i− x) 1 n P(x i− x)2 ²− β !2 = E Ã 1 n P(x i− x) 1 n P (xi− x) 2² !2 .

(8)

P(x i− x) は定数とみなして, = E ( 1 n2 P (xi− x) 2 ²2+ 2n1Pi6=jP(xi− x) (xj− x) ²² 1 n P(x i− x) 2 1 n P(x i− x) 2 ) = (x1−x)2 n2 E ¡ ²2 1 ¢ +(x1−x)2 n2 E ¡ ²2 2 ¢ +· · · + (xn−x)2 n2 E ¡ ²2 n ¢ n 1 n P (xi− x) 2o2 = 1 n2 P (xi− x) 2 n 1 n P(x i− x) 2o2 σ²2 = P(x i− x) 2 nP (xi− x)2 o2σ 2 ² = σ 2 ² P (xi− x) 2. 4. 回帰パラメータ a の分散 V (a) = V (y− bx)

= V (y) + V (bx)− 2Cov (y, bx)

= σ 2 ² n + σ2² P(x i− x) 2x 2 − 2E [(y − E (y)) (b − β) x] = σ 2 ² n + σ2 ² P (xi− x) 2x 2 = Ã 1 n+ x2 P(x i− x) 2 ! σ²2. 5. 残差分散 s2e = 1 n X (yi− byi) 2 = 1 n X {yi− (α + βxi)} 2 = 1 n X {yi− (y − βx + βxi)} 2 = 1 n X {(yi− y) + β (xi− x)} 2 = Sy2− 2βSxy+ β2Sx2 = Sy2− 2Sxy S2 x Sxy+ µS xy S2 x ¶2 S2x = Sy2S 2 xy S2 x = Sy2S 2 xs2yrxy2 S2 x = Sy2¡1− rxy2 ¢. ゆえに V (e0e) = n n− 2s 2 y ¡ 1− rxy2 ¢.

(9)

5

区間推定

,

検定

整理すると, 回帰モデル y = Xβ + ² において y∼ N¡Xβ, σ2I¢, rank X = p の最小 2 乗推定量 bβ =¡X0X¢−1X0yは, 正規分布 N³β, σ2(X0X)−1´にしたがう. b βの分散共分散は, 誤差分散 σ2の不偏推定量 s2をもちいて, s2(X0X)−1と推定される. すなわち, 個々 の回帰係数 bβi の標準偏差(y が確率変数であるために, 回帰係数の推定値も確率変動する)は (X0X)−1 の個々の要素を¡aij¢とすれば, saii となる.

5.1

相関係数の検定

独立変数の 2 乗和を y0y = (y + e)b 0(y + e)b = yb0y + eb 0e = βb0X0X bβ + e0e = y0X¡X0X¢−1X0y + y0hI− X¡X0X¢−1X0iy = y0P y + y0(I− P ) y, ³P = X¡X0X¢−1X0´. と分解すれば, 総変動平方和 y0yは, 説明変数 X によって説明される変動平方和(右辺第 1 項)と残差 平方和(右辺第 2 項)とに分解できることを意味する. さらにそれぞれの自由度でわったものは χ2 分布 する. ここに, 右辺第 1 項のランクは p であり, 第 2 項のランクは n− p である. 一般に x∼ N (0, I) のとき x0xを k 個の 2 次形式の和として x0x = x0Q1x + x0Q2x +· · · + x0Qkx, と表すと, In = Q1+ Q2+· · · + Qk, Rn = L (Q1)⊕ L (Q2)⊕ · · · ⊕ L (Qk) , ならば, x0Qixはたがいに独立に自由度 niの χ2(ni)分布に従う. このことをコクラン Cochran の定理という. 以上の議論から,  q βb− β σ2(X0X)−1   2 は, 自由度 p の χ2 分布にしたがう. β = 0 を検定することを考え た場合. もし母集団において β = 0 ならば(すなわち帰無仮説 H0: β = 0を仮定すれば), 上式に β = 0 を代入して, à b β σ (X0X)12 !2 = à (X0X)12¡X0X¢−1X0y σ !2 = ³¡ X0X¢−1X0y´0(X0X)¡X0X¢−1X0y σ2 = y 0X (X0X)−1(X0X)¡X0X¢−1X0y σ2 = y 0X¡X0X¢−1 X0y σ2 = y0PXy σ2 ,

(10)

は, 自由度 p の χ2 分布にしたがう. (β6= 0 ならば χ2 分布ではない). 同様に, e0e σ2 = ³ y− X bβ´ 2 σ2 = y0hI− X¡X0X¢−1X0iy σ2 = y0PXy σ2 , は, 自由度 n− p の χ2 分布であるから, 帰無仮説 H 0: β = 0のもとでは, 両式の比は F 分布に従う. さ らに, y0X¡X0X¢−1X0y p e0e n− p = b y0by y0y p e0e y0y (n− p) = R2 p 1− R2 n− p , のように変形できる. すなわち, この式によって相関係数の検定が可能となる. 単回帰の場合の別解 y = 1α + xβ + ², であるから, 帰無仮説 H0: β = 0ならばコクランの定理より, y0x (x0x)−1x0y e0e n− 2 = (y0x)2 x0x Sy2 ¡ 1− r2xy ¢ n− 2 , は自由度 1,n− 2 の F 分布である. F 分布と t 分布との関係より y0x |x| Sy q 1− r2 xy n− 2 = SxSyrxy n− 2 SxSy q 1− r2 xy =rxy n− 2 q 1− r2 xy , は自由度 n− 2 の t 分布に従う.

5.2

回帰係数の検定

個々の回帰係数については, (X0X)−1 の i 番目の対角要素を aii と表記すると βbi− βi σ√aii ∼ N ¡ 0, 12¢, e0e σ2 = (n− p) s2 e σ2 ∼ χ 2(n − p) だから, βbi− βi se aii ∼ t (n − p), である. このことを利用して回帰係数の有意 性検定が可能となる. 単回帰の場合は, H0: β = 0として, Syrxy Sx s nSy2 ¡ 1− rxy2 ¢ n− 2 s 1 nS2 x = rxy n− 2 q 1− r2 xy , となる. つまり, 単回帰の場合の回帰係数の検定は相関係数の検定と一致する.

(11)

5.3

回帰係数の区間推定

個々の回帰係数の信頼区間は, 検定の項と同様に, βbi− βi se aii ∼ t (n − p), より P ï¯ ¯ ¯ ¯ b βi− βi se aii ¯ ¯ ¯ ¯ ¯≤ t α/2 n−p ! = 1− α, だから, βi= bβi± t α/2 n−pse aii, で与えられる. 一方, 複数の回帰係数全体の信頼区間の同時推定は, W = ³ b β− β´0(X0X)−1³βb− β´ σ2 ± p e0e σ2 ± (n− p) = ³ b β− β´0(X0X)−1³βb− β´ σ2 ± p (n− p) s2e σ2 ± (n− p) = ³ b β− β´0(X0X)−1³βb− β´ p s2 e , が自由度 p, n− p の F 分布にしたがうことと, 一般に, ·³ b β− β´0x ¸2 x0(X0X)−1x ³ b β− β´0(X0X)−1³βb− β´, が成り立つことから, b β0x± q p Fα p,n−px0(X0X)−1x,

5.4

予測値の区間推定

説明変数 x = xaが得られたとき, 対応する従属変数は ya= x0aβ + ²a, と予測できる. また, E (bya) = E (ya) = x0aβ, V (bya) = x0aE ³ b β´xa= σ2x0a(X0X) −1x a. すなわち, 予測の誤差 ya− bya=−x0a ³ b β− β´+ ²a,

(12)

は正規分布 N³0, σ2hxa(X0X)−1xa+ 1 i´ にしたがう. これは, e 0e σ2 = (n− p) s2e σ2 と独立だから, ya− bya se q xa(X0X)−1xa , は自由度 n− p の t 分布にしたがう. ya の 100 (1− α) % の信頼区間は, P µ |ya− bya| ≤ t α/2 n−pse q xa(X0X)−1xa+ 1 ¶ = 1− α. ya=bya± t α/2 n−pse q xa(X0X)−1xa+ 1 , で与えられる.

5.5

応用例. t 検定

ここでは通常の t 検定が回帰分析の特殊な場合であることを示そう. 2 群のデータを 1 つのベクトルと して次のように表現する. y =                 x11 −X x12 −X .. . ... x1n1 −X x21 −X x22 −X .. . ... x2n2 −X                 , X ={x1, x2} =                1 0 1 0 .. . ... 1 0 0 1 0 1 .. . ... 0 1                . ここに, y は, データから全体の平均を引いた平均偏差ベクトルである. X は, 1 と 0 だけからなる n1+ n2 行 2 列の行列であり, このような行列を計画行列 と呼ぶことがある (n1,n2 はそれぞれの群のデータ数). たとえば, X の第 1 列は, データが 1 番目の群に属するとき 1 をとり, そうでなければ 0 であるベクトル である. データを上記のように表現し, 正規回帰モデルの仮定 1∼ 4 が成り立っているとする. このようにする と, t 検定を適用すべきデータが, 回帰モデルの表現を与えられることが分かる. すなわち, y = Xβ + ², あ るいは, L (X) への射影行列³P = X¡X0X¢−1X0´を用いて, y = P y + (I− P ) y と表現可能である. これによって, 2 群の母平均値の差の検定は, 回帰モデルにおける回帰式の有意性検定と同一であることが 導かれた. コクランの定理より, y0y σ2 = y0P y σ2 + y0(I− P ) y σ2 において, 右辺の各項は それぞれ独立に χ2 分布に従うから,  帰無仮説 H 0: β = 0のもとでは, y0P y σ2 1 y0(I− P ) y σ2 n− 2 は自由度 1, n− の F 分布に従い, その開平は自由度 n − 2 の t 分布となる.

(13)

さて, X¡X0X¢−1X0 は次のようになる.               1/n1 1/n1 · · · 1/n1 1/n1 1/n1 · · · 1/n1 .. . ... . .. ... 1/n1 1/n1 · · · 1/n1 0 0 1/n2 · · · 1/n2 .. . . .. ... 1/n2 · · · 1/n2               したがって, y = P y + (I− P ) y =                 x1− X x1− X .. . x1− X x2− X x2− X .. . x2− X                 +                 x11− x1 x12− x1 .. . x1n1− x1 x21− x2 x22− x2 .. . x2n2− x2                 , である. 上式に左から y0を乗じた場合, y0P y = n1 ¡ x1− X ¢2 + n2 ¡ x2− X ¢2 = n1 ³ x21+ X2− 2x1X ´ + n2 ³ x22+ X2− 2x2X ´ = n1x21+ n1X 2 − 2n1x1X + n2x22+ n2X 2 − 2n2x2X = n1x21+ n2x22+ (n1+ n2) X 2 − 2 (n1x1+ n2x2) X = n1x21+ n2x22+ (n1+ n2) µn 1x1+ n2x2 n1+ n2 ¶2 −2 (n1x1+ n2x2) n1x1+ n2x2 n1+ n2 = n1x21+ n2x22 (n1x1+ n2x2) 2 n1+ n2 = 1 n1+ n2 © (n1+ n2) n1x21+ (n1+ n2) n2x22 −n2 1x 2 1− n 2 2x 2 2− 2n1n2x1x2 ª = 1 n1+ n2{n 2 1x 2 1+ n 2 2x 2 2+ n1n2x21+ n1n2x22 −n2 1x 2 1− n 2 2x 2 2− 2n1n2x1x2} = n1n2 n1+ n2 ¡ x21+ x22− 2x1x2 ¢ = n1n2 n1+ n2 (x1− x2) 2 . 一方, y0(I− P ) y = n1 X i (x1i− x1) 2 + n2 X i (x2i− x2) 2 = n1S12+ n2S22,

(14)

であるから, 結局, t = q n 1n2 n1+n2(x1− x2) s n1S12+ n2S22 n1+ n2− 2 = s x1− x2 n1+ n2 n1n2 · n1S21+ n2S22 n1+ n2− 2 . この式は, 2 群の母平均値の差の t 検定の公式そのものである. 同様の方法を用いれば, 3 群以上の平均値間の差の検定, すなわち 1 要因の分散分析を導くことは容易で ある. すなわち, 1 と 0 とからなる計画行列 X の列数を水準数だけ用意すればよい. この意味において分 散分析(さらに実験計画法も)は回帰分析の自然な拡張とみなすことができる. ツマリ回帰分析ト通常ノ統計的推論トハ同一ノ用語デ統一的ニ説明デキマシタトサ, メデタシ, メデタシ.

(15)

6

演習問題

つぎのデータは Fisher,R.A. による 3 種類のアヤメのデータの一部である.このデータを用いて以下の 設問に答えなさい.解答欄の数値は小数点以下第 3 位を四捨五入して第 2 位まで記入すること. がくの長さ がくの幅 花弁の長さ 花弁の幅 種 48 30 14 3 Setosa 51 38 16 2 Setosa 53 37 15 2 Setosa 50 33 14 2 Setosa 47 32 13 2 Setosa 50 36 14 2 Setosa 46 34 14 3 Setosa 57 44 15 4 Setosa 44 29 14 2 Setosa 48 31 16 2 Setosa 61 28 47 12 Versicolor 57 29 42 13 Versicolor 65 28 46 15 Versicolor 55 25 40 13 Versicolor 64 29 43 13 Versicolor 63 33 47 16 Versicolor 55 26 44 12 Versicolor 57 28 45 13 Versicolor 56 30 41 13 Versicolor 60 22 40 10 Versicolor 58 27 51 19 Verginica 79 38 64 20 Verginica 72 36 61 25 Verginica 69 32 57 23 Verginica 65 32 51 20 Verginica 74 28 61 19 Verginica 64 32 53 23 Verginica 60 30 48 18 Verginica 63 25 50 19 Verginica 56 28 49 20 Verginica 1. Verginicaのデータ (データ数 10) について, がくの長さとがくの幅とのデータから,花弁の長さを予 測したい.がくの長さを x1,がくの幅を x2,花弁の長さ y とそれぞれ表記する.X ={x1, x2} の データから回帰式は y = Xθ + ², と表記できる. ここで ² は誤差ベクトルである. (a) θの推定値は ˆ θ = (X0X)−1X0y である.実際にデータから計算すると θ = となる. (b) がくの長さ x1 に対応する回帰係数 θ1 の 95% 信頼区間を求めよ (c) がくの長さと花弁の長さとの相関係数を求めなさい

(16)

(d) 上で求めた相関係数の母相関係数が 0 であるか否かを検定しなさい 2. 3種類のアヤメのがくの長さ, 花弁の長さ, 花弁の幅 に差異が認められるか,分散分析をおこなって 確認しなさい. 以下に適切な数値または語句を補うことで解答すること. (a) がくの長さ データの分散分析表 平方和 自由度 平方和/自由度 F 効果 残差 F0.05( , ) = ,であるから、がくの長 さ は 3 種類のアヤメによって差異が [ ]といえる. (b) 花弁の長さ データの分散分析表 平方和 自由度 平方和/自由度 F 効果 残差 F0.05( , ) = ,であるから、花弁の長 さ は 3 種類のアヤメによって差異が [ ]といえる. (c) 花弁の幅 データの分散分析表 平方和 自由度 平方和/自由度 F 効果 残差 F0.05( , ) = ,であるから、花弁の幅 は 3 種類のアヤメによって差異が [ ]といえる.

参照

関連したドキュメント

In the second section, we study the continuity of the functions f p (for the definition of this function see the abstract) when (X, f ) is a dynamical system in which X is a

We study a Neumann boundary-value problem on the half line for a second order equation, in which the nonlinearity depends on the (unknown) Dirichlet boundary data of the solution..

Lang, The generalized Hardy operators with kernel and variable integral limits in Banach function spaces, J.. Sinnamon, Mapping properties of integral averaging operators,

のようにすべきだと考えていますか。 やっと開通します。長野、太田地区方面  

Algebraic curvature tensor satisfying the condition of type (1.2) If ∇J ̸= 0, the anti-K¨ ahler condition (1.2) does not hold.. Yet, for any almost anti-Hermitian manifold there

In this paper, for each real number k greater than or equal to 3 we will construct a family of k-sum-free subsets (0, 1], each of which is the union of finitely many intervals

Global transformations of the kind (1) may serve for investigation of oscilatory behavior of solutions from certain classes of linear differential equations because each of

Some of the known oscillation criteria are established by making use of a technique introduced by Kartsatos [5] where it is assumed that there exists a second derivative function