• 検索結果がありません。

数値実験による線形回帰における多重共線性の影響力評価

N/A
N/A
Protected

Academic year: 2021

シェア "数値実験による線形回帰における多重共線性の影響力評価"

Copied!
24
0
0

読み込み中.... (全文を見る)

全文

(1)

論 文

数値実験による線形回帰における

多重共線性の影響力評価

竹 内 秀 一

Assessment of the Influence of Multicollinearity in Linear Regression

through Simulation Studies

Hidekazu TAKEUCHI

The presence of multicollinearity is a major problem of linear regression that cannot be ignored. The presence of multicollinearity results in abnormalities in the data structure of the linear regression model and in the correlative relationship between explanatory variables in particular, causing the results of data analysis to lack stability. The use of ridge regression is one method of handling cases that are thought to have this kind of strong multicollinearity. This method makes it possible to somewhat limit multicollinearity, in terms the condition number. However, in order to use ridge regression, it is necessary to consider the assessment of the influence of individual observations in the linear regression as a preliminary analysis of the data. Without confirming the way in which the dependency of the data structure on the value of the condition number is expressed in the results of the linear regression, it is impossible to carry out a proper data analysis.

Accordingly, the representative influence measures of Cookʼs distance and likelihood distance are adopted in order to investigate from a condition number standpoint the problem of assessing the influence(resulting from multicollinearity)of individual observations on the linear regression. Assessment of influence based on the leverages and residuals of the individual observations, which are the basic elements making up the various influence measures, is an investigation of what effects changes in the value of the condition number have. Because it is difficult to change the value of the condition number when actual data is used, simulation studies using artificial data structures are carried out. Simulation studies, for which five typical condition number cases are established, are carried out and the extent to which the influence measures vary is investigated. Moreover, the characteristics of the cut-off points at which the

(2)

influence of individual observations on two representative influence measures is judged to be large are compared from a point of view relating to changes in the value of the condition number.

1.はじめに

線形回帰(linear regression)において,多重共線性(muticollinearity)の存在は無視する ことができない大きな問題である。多重共線性が存在すると,線形回帰モデルにおけるデー タ構造,とりわけ説明変数間の相関関係に異常が生じ,データ解析の結果が安定性を欠く (回帰係数の推定値や残差の分布などに大きなぶれが生じる)ことになる。 この多重共線性の強さを測る尺度規準の 1 つとして,条件数(condition number)がある。 一般には,条件数の値が大きいと,線形回帰で用いる説明変数間に多重共線性が強く現れる 傾向がみられる。多重共線性が強いと考えられる場合の対処方法の 1 つとして,Hoerl and Kennard[3]によって提案されたリッジ回帰(ridge regression)を適用することがある。リ ッジ回帰を適用することにより,条件数の値に基づく多重共線性の強さをある程度抑えるこ とができるのである。 しかしながら,リッジ回帰を適用するためには,事前のデータ解析として,線形回帰にお ける個々の観測値の影響力評価について検討しておく必要がある。データ構造が条件数の値 に依存することにより,線形回帰の結果(回帰係数の推定値や残差の分布など)にどのよう な効果として現れるのかを確認しておかなければ,適切なデータ解析ができないのである。 つまり,リッジ回帰を適用したことにより,条件数を基にして考える多重共線性の強さがど のように調整されたのか(緩和されるのかされないのか)ということについて,個々の観測 値に分解してその原因を見つけ出すことができないのである。 そこで,条件数の視点から多重共線性が及ぼす線形回帰における個々の観測値の影響力評 価の問題点を調べるために,代表的な診断統計量(influence measure)である Cook の距離 (Cookʼs distance)および尤度距離(likelihood distance)を取り上げる(Nurunnabi, Imon and Nasser[4]などを参照)。それぞれの診断統計量を構成する基本要素である個々の観測値の てこ比および残差(誤差)に基づく影響力評価が,条件数の値の変化によりどのような効果 をもたらすのかを調べる。実データでは条件数の値を変化させることが困難であるので,竹 内[10]と同じ人工的なデータ構造を利用して数値実験を行う。この数値実験では,典型的 な 5 つの条件数のケースを設定している。それぞれのケースについて 10,000 回のシミュレ ーションを行い,その結果から算出された診断統計量の変動の度合いを調べる。また,代表 的な 2 つの診断統計量に対して,個々の観測値のもつ影響力が大きいと判定する打切り点 (cut-off point あるいは calibration point)の特徴についても,条件数の値の変化に関する観点

(3)

から比較をする。 本論文の構成は以下のとおりである。第 2 節では線形回帰およびリッジ回帰における各種 の基本的な統計量を与える。また,リッジ回帰における統計量の特別な場合が通常の線形回 帰における統計量であることを利用して,Cook の距離および尤度距離に関する各種の統計 量も定義する。第 3 節において,説明変数行列に基づく条件数の値により 5 つのデータ構造 を設定し,その設定されたケースに対して数値実験を行う。第 4 節は全体のまとめと今後の 課題である。

2.定義

本節では,線形回帰モデルにおける各種の基本的な統計量を与える。つぎに,線形回帰は, リッジ回帰の特別な場合として含まれるので,リッジ回帰における診断統計量として Cook の距離および尤度距離を定義した上で,それぞれの特別な場合として線形回帰における診断 統計量を与える。また,それら 2 つの診断統計量の関係式も示す。さらに,これら 2 つの診 断統計量に基づく個々の観測値の影響力を評価するために,それぞれの打切り点を与える。 最後に,多重共線性を測る一つの尺度規準として条件数を定義する。 2.1 線形回帰およびリッジ回帰 ここでは,線形回帰モデルとして, y = Xβ+ε を考える。このとき,y は n×1 の目的変数ベクトル,X は n×p のフルランクの説明変数行 列,β は p×1 の回帰係数ベクトル,そして ε は n×1 の誤差ベクトルであり,正規分布 N (0, σI ) に従うものとする。ただし,Iは n 次の単位行列を表す。また,β の最小 2 乗推 定量(線形回帰においては最尤推定量とも一致)は β=(X′X) X′y として得られ,誤差分散 σの不偏推定量は σ=e′e(n−p) となる。ただし,「 ′ 」は行列あるいはベクトルの転置を

表し,e は残差ベクトルであり,e=y−Xβ=(I−H)y である。このとき,H は説明変数行

列 X から構成されるハット行列(hat matrix)H=X(X′X)

X′ であり,その第 i 対角成分 h

がてこ比である。このてこ比については,1n≤h<1 とする。さらに,残差ベクトル e の第

i 成分 eを標準化した t=e(σ1−h) を標準化残差(内的スチューデント化残差)とし,t

を第 i 成分とする標準化残差ベクトルを t=[diag(I−H)] eσ とする。ただし,diag(A)

は正方行列 A の対角成分のみを取り出し,非対角成分をすべて 0 にした行列を表す。 線形回帰の 1 つの代替的方法としてリッジ回帰がある(Hoerl and Kennard[3]や Groβ[2]

(4)

などを参照)。リッジ回帰における回帰係数ベクトル β の推定量(以下,リッジ推定量)を, リッジパラメータ k(≥0) を導入することにより, β≡ (X′X+kI )X′y と定義する。すると,最小 2 乗推定量の場合と同じく,残差ベクトル eは,e=y−Xβ= (I−H)y となる。ただし,リッジ回帰におけるハット行列 Hは H=X(X′X+kI)X′ で あり,その第 i 対角成分 hがリッジ回帰におけるてこ比である。このとき,0<h<1 であ る。 また,第 i 番目の観測値を除去したときの回帰係数ベクトル β の最小 2 乗推定量は β= (XX)Xy と定義される。ただし,添字の (∙) は n 個の観測値の中から除去される観測値の番号を表す。 通常の最小 2 乗推定量の場合と同様に,第 i 番目の観測値を除去したときのリッジ推定量は β = (XX+kI)Xy となる。σの不偏推定量 σの場合についても,第 i 番目の観測値を除去したときの推定量 σ を σ = y(I −H)y n−p−1 = y y−yX(XX)Xy n−p−1 = n−p−t n−p−1 σと定義する。さらに,標準化残差 tの定義式において,σ の代わりに,この σを用いた残 差として t=e{σ

1−h を利用することもある。tはスチューデント化残差(外的スチ ューデント化残差)と呼ばれる。このとき,tおよび tの関係式は, t= t

n−p n−p−1+t (2. 1) となる。 特に,k=0 とすれば,β=β,β =β,あるいは H=H など,リッジ回帰において定義 される統計量が通常の線形回帰の統計量を包含していることがわかる。 2.2 診断統計量

通常の線形回帰における尤度距離(Cook and Weisberg[1]を参照)をリッジ推定量に基づ く診断統計量として拡張したものを定義する。この尤度距離は,代表的な診断統計量である Cook の距離とも関連するのでその定義式も示す。

(5)

の距離 CDは,Takeuchi[5]によって提案された通常の線形回帰における Cook の距離を拡 張することにより導入され, CD(β −β )′(X′X+kI)(X′X)(X′X+kI)(β−β) pσ= {s(c+d) (2. 2) と与えられる(Takeuchi[6]を参照)。ただし,cは c=Π  t

p の第 i 成分であり,このと き,Π=diag(H)[diag(I−H)]であり,この第 i 対角成分が,π=h(1−h) である。同様 に,dは d=Π

u

p の第 i 成分であり,このとき,u=[diag(I−H)] (e−e)σ であり, この第 i 成分が uである。最後に,sは S=diag(I−H)[diag(I−H)]の第 i 対角成分で あり,s=(1−h)(1−h) である。特に,k=0 のとき,つまり,線形回帰においては,竹内 [10]などから CD= CD= c となる。 (2. 2)式で与えられるリッジ推定量に基づく Cook の距離 CDにおいては,β−β の中 に挟まれる行列の選び方によっていくつかの定義式が考えられるが,ここでは,βの分散共 分散行列 Var(β)=σ(X′X+kI )(X′X)(X′X+kI)の逆行列を選ぶものとする(たとえば,

Walker and Birch[11]を参照)。

つぎに,リッジ推定量に基づく尤度距離 LDを以下のように定義する(竹内[9]を参照)。 LD≡ 2[L(β)−L(β)] (2. 3) ただし,通常の線形回帰における最小 2 乗推定量の場合と同じく, L(β):β が βのときの対数尤度 および L(β ):β が β のときの対数尤度 とする。(2. 3)式を(2. 2)式の Cook の距離 CDを利用して表現すると, LD= n log T+T1 n n−p

h  h pCD +2s (t+u)u

+n

T1 −1



1+ u′diag(I−H)u n−p

(2. 4) となる。ただし, T= n n−1 ∙n−p−t n−p であり,hは H=(H)の第 i 対角成分であり,それに uは u=[diag(I−H)] (ee)σ の第 i 成分である。ここで,e=(I −H)y である。特に,k=0 のとき,つまり,線 形回帰においては,

(6)

LD= LD= n log T+T1 np n−p CD+n

T1 −1

である。 したがって,尤度距離は Cook の距離の関数として表現できる。特に,通常の線形回帰の 場合,個々の観測値の影響力評価においては,定数を除き,残差の関数である Tに関する項 による効果が,Cook の距離とは別途,追加的に反映されることがわかる。 2.3 診断統計量の打切り点 診断統計量の打切り点を定義する。まず,通常の線形回帰における尤度距離については, 竹内[7]において導入されている打切り点として, LD> 4n ∙ 4n+p(n−p) (n−p)(n−p+4) (2. 5) がある。(2. 5)式は,h=pn(てこ比がバランスした状態)で  t>2(外れ値)となる場合 を影響力の大きい観測値であるとみなすことを判断基準としている。 これに対して,通常の線形回帰における Cook の距離については,竹内[8]において導入 されている打切り点として, CD> n−p−21 (2. 6) が示されているが,これは,標準化残差 tに基づいて導かれているため,(2. 5)式の尤度距 離の打切り点と単純に比較することができない。そこで,(2. 5)式と同等に扱うことのでき る打切り点とするために,(2. 6)式を修正し,付録 A のようにして導いた CD> 4 n−p+3 (2. 7) を利用する。 2.4 条件数 説明変数間の多重共線性を測る尺度はいくつかあるが,代表的な尺度規準として,説明変 数行列 X に基づいた X′X の条件数を定義しておく。X′X の最大固有値 δと最小固有値 δ の比,つまり,条件数=δδとして定義する。 通常は,X の特異値の比である

δδ を条件数に用いるが,本論文では,竹内[10]と関 連した検討をするために,上記の固有値の比に着目する。条件数の値が大きくなると多重共 線性が高い(強い)と判断され,説明変数行列の構造としては不安定であるとみなされる。

(7)

よって,条件数の値が大きくなると通常の線形回帰よりもリッジ回帰を適用することが望ま しいデータ構造をもっているともいえる。

3.数値実験

多重共線性を測る尺度規準として導入した条件数に基づく検討をするために,いくつかの データ構造を与える。本論文では,竹内[10]と同じ人工的なデータ構造について検討する ため,条件数としてつぎの 5 つのケースを設定する。条件数 I のケースとしては条件数が 1229.24(竹内[10]における条件数 I の実験 No. 7)の場合を,条件数 II のケースとしては条 件数が 430.59(同条件数 II の実験 No. 1)の場合を,条件数 III のケースとしては条件数が 146.49(同条件数 III の実験 No. 1)の場合を,条件数 IV のケースとしては条件数 58.43(同条 件数 IV の実験 No. 7)の場合を,そして条件数 V のケースとしては条件数 22.96(同条件数 V の実験 No. 1)の場合を,それぞれ設定する。そして,竹内[10]と同じ説明変数行列 X を利 用し,誤差ベクトル ε の標準偏差 σ については,標準的なケースである標準偏差として σ=1.00 を適用する(バラツキの極端に大きいケースである標準偏差 σ=5.00 の場合および 極端に小さいケースである標準偏差 σ=0.01 については除外する)。したがって,竹内[10] と同じ設定の数値実験とするために,観測値数 n=30 および説明変数の数 p=5(定数項を 除く)として,説明変数行列 X は上記の 5 つのケースに固定する。また,目的変数ベクトル y については,説明変数行列の最大固有値 δに対する固有ベクトルを回帰係数ベクトル β に代入し,平均 0 で標準偏差 σ=1.00 となる正規乱数を生成して誤差ベクトル ε として加え る。各ケースとも説明変数行列に基づくてこ比は固定し,目的変数ベクトルを正規乱数の利 用により生成して,30 個の観測値を構成する。5 つのケースについて 30 個の観測値(実質的 には目的変数のみ)の生成を 10,000 回ずつ繰返すシミュレーションを行うことになる。なお, 参考までに,竹内[10]の数値実験において,平均 0 で標準偏差 σ=1.00 の正規乱数を生成し た場合の誤差ベクトル ε に基づく計算結果を,付録 B の表 B. 1 から表 B. 5 に示しておく。 線形回帰における観測値の影響力を調べるために,上記 5 つのケースに対して数値実験を 行った結果をまとめたものが,表 3. 1(条件数 I のケース)から表 3. 5(条件数 V のケース) である。いずれも,10,000 回のシミュレーション結果から,観測値ごとのてこ比(「h」:これ は 10,000 回のシミュレーションにおいて同じ値で一定),診断統計量の「平均」,その「標準 誤差」,これらに関する「変動係数」( =「標準誤差」/「平均」),それに打切り点を超過した 回数(「超過数」)が,2 つの診断統計量 CDおよび LD(診断統計量の定義式とシミュレーシ ョンにより算出された数値結果を区別するために「s」を右肩に付けた)について算出されて いる。ここで,「平均」は個々の観測値について算出された診断統計量 10,000 回分の平均で あり,「標準誤差」はその診断統計量の標準誤差である。また,打切り点の値は,5 つのすべ

(8)

てのケースにおいて n=30 および p=5+1(定数項)=6 は同じであるので,Cook の距離につ いては(2. 7)式から 0.148 であり,尤度距離については(2. 5)式から 1.964 である。なお, 表内の小数表示の数値は,紙面の都合で,小数第四位を四捨五入しているため,「変動係数」 の数値表記が「標準誤差」「平均」を単純に計算した数値とは異なる場合がある。実際の数 値計算においては小数第十五位まで(正確には有効数字が 15 桁で)算出してあり,その個別 の結果を小数第三位までの表記に直している。このため,数値表記上の丸め誤差が大きくな っている場合があり,一見すると数値的なズレがかなり大きいように思われるかもしれない が,変動係数の数値自体に誤りはない。 表 3. 1 から表 3. 5 までに共通する特徴は,シミュレーションにより算出された Cook の距 離 CDと尤度距離 LDを比較すると,前者は変動係数が一定値(約 1.3)で安定しているが, 後者は 1~3 の間で観測値ごとにかなりばらついている点である。この原因は,両者の関係 式からもわかるように,LDが CDの項に加えて,標準化残差 tの関数である Tの項があ るため,残差の効果による影響をより強く受けているためであると考えられる。よって,線 形回帰における観測値の影響力評価を行う場合には,こうした残差による効果の差異が強く 現れることを考慮する必要がある。 つぎに,打切り点の超過数については,CDの打切り点を(2. 7)式で与えられるように従 来よりも少し大きめ(影響力評価の点からは評価基準を緩め)に変更したが,(2. 5)式で与 えられる LDの打切り点の場合よりも超過数の回数がすべての条件数のケースにおいて平 均的には多くなっている(表 3. 6 を参照)。また,超過数のばらつきである標準偏差も LD の打切り点の方が CDの打切り点よりも小さいので安定しているといえる。個々の観測値 の目的変数を構成する誤差(項)については両者とも同じ乱数の値を用いているので,打切 り点については,CDがこれでも厳しいと考えるのか,LDが緩いと考えるのかについて, 厳密な検討を要する。ただ,観測値数 n=30 の 5% 程度が影響力の大きい観測値であると仮 定すると,1 個か 2 個程度が検出されれば適正であると考えられるので,超過数の回数の多 い観測値数が少ない LDの打切り点の方が妥当な評価をしているといえる。 さらに,詳しく検討するために,表 3. 7 および表 3. 8 のように「超過数」のみを取り出し, てこ比に基づく比較(広い意味では,条件数に基づく比較を含む)ができるように大小順に 並べ替える。観測値ごとの目的変数を構成する誤差の入り方はすべて同一の確率分布(ここ では正規分布)であるので,残差の効果については同等であると想定できる。つまり,この 数値実験における個々の観測値の影響力の大きな差異が生じる原因は,基本的にてこ比の値 の大小によるものであると仮定する。超過数は各観測値とも繰返した 10,000 回中に,何回打 切り点を超過したかの回数であるので,10,000 回中で超過数が 1,000 回を超えると 10% 超過 している,つまり影響力が大きい観測値であると判定された比率(確率)がシミュレーショ ンにおいて 10% を超えるということになる。一つの目安として,10%(超過数が 1,000 回)

(9)

を超える場合を比較してみると,条件数 I のケースでは CDが 8 個(てこ比の順位で上位 8 位まで)と LDが 3 個であり,以下同様に,条件数 II のケースでは 6 個と 3 個,条件数 III の ケースでは 8 個と 3 個(てこ比の順位で第 3 位となる観測値は 10% 未満なので除外),条件 数 IV のケースでは 8 個と 2 個,そして条件数 V のケースでは 10 個と 4 個となっている。ケ ースにより若干のばらつきはあるが,概ね CDが約 30% の観測値数である 8 個を,LDが 10% の 3 個を,それぞれ影響力の大きい観測値であると判定している。影響力評価の判定規 準を厳しくして,超過数が 5% を超える場合に変更すると,概ね CDが約 50% の観測値数 である 14 個を,LDが 30% の 9 個を影響力の大きい観測値と判定する。したがって,CD の打切り点が確率 10% であり,LDの打切り点が確率 5% である場合に対応しているとも みなせ,観測値の影響力が大きいと判定する打切り点としては Cook の距離が尤度距離より も厳しく判定することがわかる。CDと LDは,診断統計量として観測値の影響力の大きさ を測る視点が異なるので,どちらが良いとか悪いとかは議論できないが,単純な打切り点に 基づく影響力評価を行った場合には,このような大きな差異があることに注意を要すること がわかる。 最後に,条件数に着目した別の視点から,表 3. 7 および表 3. 8 を検討してみる。これらの 表の各超過数の右に「*」が付いているのは,てこ比の大小順と超過数の回数の大小順におい て順位が異なるものであることを示している。これをみると,条件数が小さくなる(条件数 I のケースから条件数 V のケースの順)につれて,大小順が異なる観測値が増える傾向にあ ることがわかる(ただし,条件数 IV のケースでは減っている)。特に,てこ比の値が大きい (てこ比の順位が上位の)観測値において,条件数が小さくなると超過数との対応関係にずれ が数多く生じている。これは,多重共線性が原因であると考えられる。条件数 I や条件数 II のケースのように条件数の値が大きい場合は,てこ比の値が大きい観測値がそのまま影響力 の大きい観測値として判定されるが,条件数 III から条件数 V までのケースのように条件数 の値が約 150 以下になるような場合は,てこ比の値の大きさだけではなく残差の大きさによ る効果も反映されるため,てこ比の値の大小だけで観測値の影響力評価をすることができな いことが読み取れる。つまり,条件数の数値が概ね 400 を超えるような場合には,てこ比に よる影響力が強くなり過ぎる可能性が高いことを示しているので,リッジ回帰などの手法を 適用することにより,てこ比の影響力を適度に調整する必要があるといえる。こうした改善 あるいは改良をしなければ,データ解析における観測値の影響力評価を説明変数行列の主要 な成分であるてこ比からの視点だけで判定してしまう危険性が高くなる。各観測値のもつて こ比および残差の効果をバランス良く取り上げ,適切な影響力評価をするためにも,条件数 の値が大きいケースについては最大限の配慮をする必要があるといえる。

(10)

0.279 121 1.336 0.034 0.026 0.133 24 636 1.675 0.929 0.555 1,203 1.308 0.078 0.060 0.265 CD No. 表 3. 1 シミュレーションの結果(条件数 I のケース) 0.108 0.392 26 162 2.194 0.594 0.271 86 1.331 0.032 0.024 0.124 25 181 2.011 0.562 1 超過数 変動係数 標準誤差 平均 超過数 変動係数 標準誤差 平均 h LD 2.022 0.568 0.281 152 1.344 0.035 0.026 0.138 27 1,423 1.653 1.583 0.958 2,471 1.320 0.142 0.333 267 1.352 0.043 0.032 0.161 2 224 1.875 0.625 0.333 278 1.319 0.043 0.033 0.165 1.332 0.045 0.034 0.170 29 524 1.745 0.913 0.523 976 1.310 0.073 0.055 0.248 28 187 0.018 0.098 4 806 1.734 1.150 0.663 1,535 1.331 0.096 0.072 0.302 3 237 2.204 0.735 208 2.097 0.600 0.286 153 1.352 0.035 0.026 0.135 30 267 1.998 0.698 0.349 328 1.970 0.634 0.322 253 1.344 0.041 0.030 0.153 5 107 2.175 0.457 0.210 14 1.326 0.024 1.321 0.053 0.040 0.195 7 1,278 1.652 1.480 0.896 2,261 1.344 0.134 0.100 0.375 6 253 9 83 2.281 0.424 0.186 2 1.323 0.020 0.015 0.085 8 337 1.770 0.695 0.392 518 0.556 1,126 1.338 0.079 0.059 0.258 10 862 1.752 1.229 0.701 1,653 1.323 0.100 0.076 0.305 0.016 0.087 11 626 1.777 0.987 1.814 0.755 0.416 616 1.333 0.057 0.042 0.203 12 102 2.154 0.427 0.198 0 1.327 0.021 1.323 0.060 0.045 0.216 14 406 1.771 0.778 0.439 685 1.307 0.059 0.045 0.210 13 388 16 154 2.018 0.523 0.259 88 1.326 0.032 0.024 0.126 15 365 1.852 0.804 0.434 647 0.784 1,960 1.346 0.116 0.086 0.342 17 276 1.876 0.659 0.351 356 1.321 0.046 0.035 0.174 0.019 0.101 19 122 3.115 0.662 0.213 6 1.347 0.023 0.017 0.093 18 1,032 1.745 1.367 1.757 0.765 0.435 689 1.309 0.059 0.045 0.212 20 121 2.075 0.458 0.220 18 1.322 0.025 1.327 0.069 0.052 0.238 21 381 23 760 1.733 1.093 0.631 1,436 1.339 0.092 0.069 0.295 22 483 1.880 0.938 0.499 874

(11)

0.226 21 1.340 0.026 0.019 0.104 24 183 2.078 0.578 0.278 133 1.333 0.035 0.026 0.136 CD No. 表 3. 2 シミュレーションの結果(条件数 II のケース) 0.020 0.107 26 79 2.872 0.500 0.174 0 1.365 0.017 0.013 0.072 25 132 2.134 0.483 1 超過数 変動係数 標準誤差 平均 超過数 変動係数 標準誤差 平均 h LD 1.690 1.375 0.814 2,073 1.335 0.120 0.090 0.350 27 151 2.278 0.537 0.236 36 1.352 0.027 0.349 312 1.315 0.045 0.034 0.171 2 279 1.934 0.697 0.361 365 1.336 0.047 0.035 0.173 1.321 0.064 0.049 0.225 29 309 1.950 0.733 0.376 440 1.349 0.050 0.037 0.181 28 1,110 0.052 0.238 4 657 1.749 0.995 0.569 1,216 1.339 0.081 0.061 0.265 3 240 1.950 0.680 241 1.819 0.605 0.332 266 1.309 0.042 0.032 0.161 30 458 1.767 0.829 0.469 801 1.763 1.172 0.665 1,538 1.333 0.096 0.072 0.302 5 502 1.876 0.934 0.498 922 1.344 0.070 1.325 0.089 0.068 0.293 7 398 1.823 0.773 0.424 650 1.345 0.058 0.043 0.204 6 826 9 331 2.006 0.794 0.396 460 1.345 0.052 0.039 0.187 8 719 1.678 1.036 0.618 1,430 0.510 959 1.338 0.072 0.054 0.247 10 178 1.865 0.524 0.281 125 1.293 0.034 0.027 0.137 0.013 0.070 11 509 1.778 0.907 2.310 0.456 0.197 4 1.331 0.021 0.016 0.085 12 94 2.408 0.417 0.173 0 1.338 0.017 1.333 0.129 0.097 0.372 14 94 2.726 0.508 0.186 2 1.359 0.018 0.013 0.074 13 107 16 455 1.866 0.873 0.468 794 1.350 0.065 0.048 0.224 15 1,231 1.668 1.434 0.860 2,207 0.343 323 1.345 0.045 0.034 0.172 17 387 1.783 0.790 0.443 712 1.324 0.060 0.045 0.212 0.170 0.507 19 266 1.943 0.655 0.337 313 1.344 0.044 0.033 0.164 18 253 2.078 0.712 1.748 0.805 0.461 776 1.297 0.063 0.049 0.226 20 2,262 1.599 2.364 1.478 3,602 1.338 0.228 1.343 0.063 0.047 0.220 21 407 23 141 2.126 0.529 0.249 67 1.340 0.030 0.023 0.122 22 443 1.871 0.861 0.460 732

(12)

0.655 1,544 1.323 0.095 0.072 0.306 24 146 2.266 0.557 0.246 57 1.354 0.029 0.021 0.112 CD No. 表 3. 3 シミュレーションの結果(条件数 III のケース) 0.069 0.296 26 480 1.787 0.847 0.474 811 1.323 0.065 0.049 0.224 25 785 1.669 1.093 1 超過数 変動係数 標準誤差 平均 超過数 変動係数 標準誤差 平均 h LD 1.743 0.975 0.559 1,118 1.317 0.078 0.059 0.256 27 751 1.773 1.127 0.636 1,431 1.350 0.093 0.342 317 1.318 0.044 0.034 0.168 2 108 2.085 0.441 0.212 11 1.326 0.024 0.018 0.096 1.321 0.031 0.023 0.122 29 1,095 1.699 1.354 0.797 2,041 1.333 0.117 0.088 0.344 28 607 0.051 0.234 4 504 1.685 0.833 0.494 925 1.308 0.069 0.053 0.245 3 247 1.851 0.634 166 2.192 0.597 0.273 104 1.326 0.033 0.025 0.133 30 149 2.090 0.541 0.259 71 2.136 0.463 0.217 20 1.333 0.025 0.018 0.101 5 444 1.674 0.798 0.477 868 1.295 0.066 1.328 0.044 0.033 0.165 7 1,081 1.698 1.356 0.799 2,002 1.339 0.118 0.088 0.347 6 118 9 487 1.774 0.893 0.503 938 1.318 0.070 0.053 0.242 8 251 1.913 0.641 0.335 286 0.751 1,948 1.313 0.111 0.085 0.346 10 131 2.131 0.493 0.231 26 1.321 0.027 0.020 0.109 0.038 0.184 11 990 1.605 1.205 2.082 0.737 0.354 291 1.345 0.045 0.034 0.166 12 329 1.908 0.736 0.386 457 1.328 0.051 1.341 0.145 0.108 0.396 14 305 1.915 0.740 0.386 466 1.323 0.051 0.039 0.189 13 249 16 216 1.943 0.601 0.310 219 1.340 0.040 0.030 0.154 15 1,404 1.691 1.625 0.960 2,477 0.595 1,290 1.339 0.085 0.063 0.272 17 140 2.222 0.541 0.244 51 1.338 0.028 0.021 0.114 0.028 0.146 19 112 2.145 0.470 0.219 18 1.304 0.024 0.019 0.100 18 677 1.792 1.067 2.037 0.449 0.221 17 1.317 0.025 0.019 0.103 20 191 1.970 0.592 0.300 164 1.325 0.038 1.328 0.043 0.032 0.161 21 120 23 276 1.832 0.642 0.350 360 1.329 0.046 0.035 0.173 22 240 2.031 0.687 0.338 271

(13)

0.244 58 1.353 0.028 0.021 0.113 24 248 1.957 0.654 0.334 289 1.344 0.043 0.032 0.163 CD No. 表 3. 4 シミュレーションの結果(条件数 IV のケース) 0.063 0.275 26 90 2.235 0.436 0.195 3 1.320 0.021 0.016 0.089 25 148 2.274 0.554 1 超過数 変動係数 標準誤差 平均 超過数 変動係数 標準誤差 平均 h LD 2.350 0.485 0.207 0 1.331 0.022 0.017 0.089 27 626 1.729 1.013 0.586 1,283 1.309 0.083 0.414 590 1.342 0.056 0.042 0.199 2 484 1.800 0.883 0.491 911 1.336 0.069 0.051 0.237 1.343 0.039 0.029 0.147 29 937 1.717 1.248 0.727 1,770 1.338 0.107 0.080 0.325 28 116 0.047 0.224 4 269 1.954 0.716 0.366 387 1.320 0.049 0.037 0.183 3 360 1.900 0.786 597 1.768 0.958 0.542 1,083 1.338 0.076 0.057 0.253 30 229 2.218 0.688 0.310 201 2.192 0.559 0.255 66 1.339 0.030 0.023 0.120 5 424 1.926 0.866 0.450 718 1.333 0.062 1.342 0.060 0.045 0.214 7 954 1.690 1.228 0.727 1,766 1.351 0.108 0.080 0.326 6 157 9 120 2.316 0.505 0.218 13 1.339 0.024 0.018 0.094 8 412 1.799 0.779 0.433 680 0.809 2,036 1.328 0.119 0.090 0.350 10 596 1.715 0.955 0.557 1,146 1.314 0.078 0.060 0.263 0.018 0.099 11 1,109 1.663 1.346 1.692 1.307 0.773 1,969 1.333 0.114 0.086 0.342 12 110 2.322 0.507 0.219 20 1.333 0.024 1.339 0.079 0.059 0.260 14 539 1.806 0.932 0.516 985 1.351 0.073 0.054 0.243 13 1,048 16 209 1.966 0.584 0.297 168 1.331 0.037 0.028 0.141 15 617 1.775 0.989 0.557 1,120 0.400 533 1.334 0.054 0.041 0.197 17 347 1.903 0.774 0.407 534 1.326 0.054 0.041 0.192 0.023 0.126 19 449 1.849 0.856 0.463 772 1.346 0.064 0.047 0.219 18 343 1.886 0.754 1.965 0.688 0.350 325 1.348 0.046 0.034 0.169 20 160 2.055 0.526 0.256 80 1.350 0.032 1.297 0.057 0.044 0.208 21 261 23 207 2.013 0.587 0.291 148 1.352 0.036 0.027 0.138 22 397 1.737 0.741 0.427 633

(14)

0.321 252 1.341 0.041 0.031 0.156 24 193 2.026 0.595 0.294 149 1.346 0.037 0.027 0.141 CD No. 表 3. 5 シミュレーションの結果(条件数 V のケース) 0.088 0.349 26 722 1.734 1.059 0.611 1,346 1.328 0.087 0.066 0.282 25 243 1.949 0.625 1 超過数 変動係数 標準誤差 平均 超過数 変動係数 標準誤差 平均 h LD 1.998 0.718 0.359 362 1.353 0.047 0.035 0.174 27 1,058 1.758 1.401 0.797 2,006 1.330 0.118 0.785 1,986 1.332 0.116 0.087 0.349 2 182 1.984 0.535 0.270 106 1.345 0.033 0.025 0.130 1.326 0.083 0.063 0.274 29 141 2.263 0.540 0.238 40 1.329 0.027 0.020 0.108 28 280 0.017 0.090 4 1,695 1.621 1.806 1.114 2,906 1.330 0.169 0.127 0.433 3 1,033 1.714 1.345 1,101 1.699 1.372 0.807 2,000 1.339 0.120 0.089 0.348 30 657 1.701 0.993 0.583 1,269 1.750 1.128 0.645 1,480 1.340 0.093 0.069 0.291 5 115 2.110 0.430 0.204 1 1.321 0.022 1.332 0.049 0.037 0.185 7 191 1.906 0.571 0.299 168 1.318 0.038 0.028 0.145 6 773 9 119 2.197 0.521 0.237 38 1.323 0.027 0.021 0.110 8 278 1.859 0.683 0.368 422 0.346 348 1.325 0.045 0.034 0.170 10 239 2.037 0.696 0.342 269 1.335 0.044 0.033 0.163 0.057 0.251 11 274 1.847 0.639 1.875 0.751 0.400 522 1.346 0.055 0.041 0.198 12 567 1.816 0.976 0.538 1,073 1.320 0.075 1.332 0.025 0.019 0.099 14 172 1.926 0.523 0.272 99 1.308 0.033 0.025 0.132 13 350 16 138 2.044 0.485 0.237 44 1.330 0.028 0.021 0.113 15 142 2.260 0.509 0.225 20 0.273 106 1.320 0.034 0.025 0.134 17 760 1.698 1.079 0.636 1,468 1.309 0.091 0.069 0.293 0.045 0.215 19 252 1.901 0.652 0.343 317 1.318 0.045 0.034 0.170 18 160 1.955 0.533 1.870 1.101 0.589 1,243 1.344 0.084 0.063 0.274 20 399 1.808 0.792 0.438 680 1.326 0.060 1.331 0.040 0.030 0.153 21 661 23 80 2.361 0.402 0.170 0 1.329 0.017 0.013 0.070 22 206 1.945 0.607 0.312 205 783.7 697.5 CD 条件数 V 387.6 439.4 LD 表 3. 6 打切り点の超過数 CD LD CD LD CD 条件数 IV 条件数 III 条件数 II 条件数 I 714.2 標準偏差 418.8 676.2 426.6 686.6 448.1 709.3 433.0 692.4 平均 LD CD LD 287.8 618.1 349.8 729.8 445.8 809.3 353.1

(15)

0.122 0.133 154* 88 0.126 0.146 24 183* 133* 0.136 0.154 181 121 0.133 0.161 504 607 条件数 I 677 順位 751 785 1,095* 990* 1,081* 1,404 LD 超過数 表 3. 7 シミュレーションの結果(てこ比に基づく総括表)前半 0.101 0.103 26 0.109 151* 36 0.107 0.112 162* 86 0.124 0.114 25 0.122 141* 67 1 247* LD 超過数 CD 超過数 h 276 LD 超過数 CD 超過数 h 329* 305* 480* 444* 条件数 II 487 107 4 0.085 107* 14 0.098 0.096 27 0.100 132 21 0.104 0.101 121* 18 0.372 1,278 2,261 0.375 216 2 240 2,262 3,602 0.507 251* 1,423 2,471 0.392 249* 102 0* 0.087 29 94 2 0.074 122* 6 0.093 28 0.305 146* 4 140* 1,110 2,073 0.350 149 1,032 1,960 0.342 166 3 191 1,231 2,207 94* 0 0.070 83 2* 0.085 30 79* 0 0.072 719 1,430 0.293 112 806 1,535 0.302 118 5 120 826 1,538 0.302 131 862 1,653 636 1,203 0.265 2,477 7 CD 超過数 657 1,216 0.265 760 1,436 0.295 6 108 9 1,431 502 922 0.238 1,544 626 1,126 0.258 2,041* 8 1,948* 509 959 0.247 2,002* 0.225 483 874 0.238 938* 10 925* 407* 776* 0.226 1,118 524 976 0.248 1,290 0.216 360 11 457 466 811 868 458* 801* 443* 732 0.220 271 381* 689* 0.212 286 12 291 455* 794* 0.224 317 365* 647* 388* 616 0.203 71 14 104 387* 712 0.212 164 406* 685* 0.210 13 219 16 20* 331 460 0.187 17* 337 518 0.195 26 15 57* 398* 650 0.204 51* 0.173 h 267 328 0.170 条件数 III 17 309 440 0.181 11 276 356 0.174 18* 0.161 0.306 19 0.344 253* 323 0.172 0.346 224* 278 0.165 0.347 18 0.396 279 365 266* 313* 0.164 0.245 253* 253 0.153 0.256 20 0.272 240* 312* 0.171 0.296 237* 267 187* 152* 0.138 0.189 21 0.224 0.234 0.242 23 0.165 178* 125* 0.137 0.166 208* 153* 0.135 0.168 22 0.173 241* 266 0.161 0.184

(16)

表 3. 8 シミュレーションの結果(てこ比に基づく総括表)後半 0.130 160 80 0.126 24 172* 99* 0.132 207 148 0.138 条件数 IV 順位 0.113 26 138* 44 0.113 157 66 0.120 25 182* 106* 1 LD 超過数 CD 超過数 h LD 超過数 CD 超過数 h 条件数 V 141* 40* 0.108 110* 20 0.099 27 119* 38* 0.110 148 58 0.349 1,048 1,969 0.342 2 1,695 2,906 0.433 1,109 2,036 0.350 116* 0* 0.089 29 142* 20 0.099 120* 13 0.094 28 0.325 4 1,033* 1,986* 0.349 954 1,766* 0.326 3 1,058* 2,006 80 0 0.070 90 3* 0.089 30 115 1 0.090 760* 1,468* 0.293 626 1,283 0.275 5 1,101* 2,000* 0.348 937 1,770* 617* 1,120 0.260 7 773* 1,480* 0.291 596* 1,146 0.263 6 9 657* 1,269 0.274 597* 1,083 0.253 8 722 1,346 0.282 0.251 484 911 0.237 10 661* 1,243 0.274 539 985 0.243 0.224 11 567 1,073 350 522 0.198 449* 772* 0.219 12 399 680 0.215 424* 718* 397 633 0.208 14 278* 422 0.185 412 680 0.214 13 16 274 348 0.170 360 590 0.199 15 280* 362 0.174 0.163 347* 534* 0.192 17 252 317 0.170 343* 533* 0.197 0.169 19 243* 252 0.156 269 387 0.183 18 239* 269 191* 168 0.145 248 289 0.163 20 206 205 0.153 261 325 229 201 0.147 21 23 160* 106 0.134 209 168 0.141 22 193* 149 0.141

(17)

4.まとめと今後の課題

本論文では,線形回帰における影響力評価について,人工的なデータに基づく数値実験に より検討を行った。具体的には,代表的な診断統計量として Cook の距離 CDおよび尤度距 離 LDの 2 つを取り上げ,てこ比と残差(誤差)の影響力の評価が条件数の値の変化に対し てどのような効果を与えるのかを検討した。10,000 回のシミュレーション結果から算出され た Cook の距離 CDおよび尤度距離 LDの比較においては,観測値の影響力が大きいと判 定する打切り点としては Cook の距離が尤度距離よりも厳しく判定することが判明した。ま た,条件数については,その値が大きい場合には,てこ比の値により影響力の大きさが過大 評価されてしまう可能性があるという問題点が浮き彫りになった。条件数の値が大きい場合 には,リッジ回帰等を適用することにより,てこ比の効果を適度に調整する(抑える)必要 性があることもわかった。 今後の課題としては,線形回帰における観測値の影響力評価において上記のような問題点 を念頭に置き,リッジ回帰における影響力評価を適正に行うことを考える必要がある。とり わけ,個々の観測値の影響力評価を行う場合に,条件数の値が大きいケースにおいてはリッ ジ回帰を適用することにより,どの程度の影響力が調整されるのかを検討したい。

付録 A:(2. 7)式の導出

線形回帰における Cook の距離の打切り点を導出する。線形回帰における Cook の距離は, 第 2 節の定義式から CD= c= 1 p ∙ h  1−ht(A. 1) と書き直すことができる。標準化残差 tおよびスチューデント化残差 tの関係式は,(2. 1) 式のように表されるので,(A. 1)式の Cook の距離の表現を tを用いて表せば CD= n−p p ∙ h  1−ht n−p−1+t (A. 2) となる。 (A. 2)式に対する打切り点を尤度距離の場合(竹内[7]を参照)と同じく,h=pn(て こ比がバランスした状態)で, t>2(外れ値)という場合で設定する。これらを(A. 2)式 に代入すれば,Cook の距離の打切り点は CD> n−pp ∙1−pn ∙pn 2  n−p−1+2 = n−p+34

(18)

となり,(2. 7)式を導くことができる。 (2. 6)式と(2. 7)式の大小関係を調べると, n−p > 113 の場合であれば,(2. 7)式の打切り点が(2. 6)式よりも大きな値になる。つまり,個々の観 測値の影響力を調べるときに,(2. 7)式の打切り点の方が(2. 6)式よりも大きな値になるの で,影響力の大きい観測値であると判定する割合が小さくなる緩い打切り点ということにな る。

付録 B:線形回帰分析の結果

付録として,5 つの条件数のケースそれぞれについて,標準偏差 σ=1.00 のケースのみに 線形回帰を適用した場合の計算結果を参考までに提示する。

(19)

0.046 0.956 1.346 0.133 24 0.177 0.023 1.018 0.624 0.265 k=0 No. 表 B. 1 線形回帰分析の結果(条件数 I のケース) 0.392 26 0.031 0.002 1.030 0.322 0.124 25 0.392 1 LD CD T t h 0.185 0.024 0.995 0.959 0.138 27 0.047 0.004 1.033 −0.201 0.004 1.029 0.350 0.161 2 0.017 0.000 1.034 −0.015 0.165 0.987 −1.046 0.170 29 1.549 0.167 0.903 1.744 0.248 28 0.098 4 0.066 0.007 1.030 −0.318 0.302 3 0.041 0.100 0.013 1.012 −0.714 0.135 30 0.286 0.037 0.128 0.017 1.010 0.752 0.153 5 0.152 0.020 0.988 1.041 1.019 0.599 0.195 7 7.060 0.611 0.771 2.474 0.375 6 9 0.269 0.029 0.952 −1.382 0.085 8 0.112 0.014 0.323 0.794 −2.360 0.258 10 0.018 0.000 1.034 −0.049 0.305 0.087 11 3.910 0.210 0.028 1.006 −0.813 0.203 12 0.051 0.006 1.017 0.632 1.034 0.060 0.216 14 0.044 0.004 1.030 −0.305 0.210 13 16 0.074 0.009 1.018 −0.625 0.126 15 0.018 0.000 0.024 1.023 −0.526 0.342 17 0.255 0.034 0.993 −0.979 0.174 0.101 19 0.017 0.000 1.034 −0.013 0.093 18 0.183 0.396 0.052 0.985 1.071 0.212 20 0.018 0.000 1.034 0.114 0.942 −1.464 0.238 21 23 0.897 0.113 0.965 −1.272 0.295 22 0.945 0.112

(20)

0.001 1.032 −0.232 0.104 24 0.018 0.000 1.034 0.059 0.136 k=0 No. 表 B. 2 線形回帰分析の結果(条件数 II のケース) 0.107 26 0.018 0.000 1.033 −0.158 0.072 25 0.022 1 LD CD T t h 0.466 0.062 1.005 −0.833 0.350 27 1.530 0.099 0.821 2.227 0.028 1.000 0.897 0.171 2 0.160 0.021 1.008 −0.781 0.173 1.021 −0.569 0.225 29 0.017 0.000 1.034 0.034 0.181 28 0.238 4 1.979 0.207 0.886 1.855 0.265 3 0.208 3.358 0.207 0.755 2.546 0.161 30 0.121 0.016 0.379 0.051 1.004 −0.839 0.302 5 0.037 0.003 1.032 0.242 1.028 0.378 0.293 7 0.378 0.049 0.985 −1.074 0.204 6 9 0.195 0.026 1.005 −0.824 0.187 8 0.083 0.010 0.296 0.801 −2.327 0.247 10 0.040 0.004 1.028 0.384 0.137 0.070 11 3.572 0.096 0.013 0.999 −0.910 0.085 12 0.027 0.002 1.026 0.433 1.017 0.643 0.372 14 0.018 0.000 1.033 −0.154 0.074 13 16 0.431 0.056 0.984 −1.079 0.224 15 0.305 0.041 0.002 1.032 −0.222 0.172 17 0.124 0.016 1.019 −0.600 0.212 0.507 19 0.032 0.003 1.031 0.278 0.164 18 0.027 0.097 0.012 1.024 −0.500 0.226 20 0.093 0.011 1.032 −0.250 1.005 0.829 0.220 21 23 0.028 0.002 1.031 0.285 0.122 22 0.242 0.032

(21)

0.035 1.014 −0.692 0.306 24 0.017 0.000 1.034 −0.034 0.112 k=0 No. 表 B. 3 線形回帰分析の結果(条件数 III のケース) 0.296 26 0.072 0.008 1.027 −0.419 0.224 25 0.263 1 LD CD T t h 0.345 0.046 1.000 −0.896 0.256 27 0.578 0.076 0.988 1.040 0.024 1.004 0.843 0.168 2 0.292 0.033 0.954 1.364 0.096 0.948 −1.418 0.122 29 0.554 0.074 0.998 −0.919 0.344 28 0.234 4 0.560 0.072 0.977 −1.155 0.245 3 0.179 0.067 0.008 1.020 0.572 0.133 30 0.412 0.046 0.143 0.019 0.991 1.003 0.101 5 0.018 0.000 1.034 −0.040 1.013 0.708 0.165 7 0.931 0.120 0.976 1.165 0.347 6 9 1.612 0.170 0.896 −1.789 0.242 8 0.125 0.016 0.037 1.016 −0.646 0.346 10 0.065 0.008 1.017 −0.637 0.109 0.184 11 0.275 5.855 0.279 0.671 2.904 0.166 12 0.143 0.019 1.013 −0.711 1.027 −0.427 0.396 14 0.018 0.000 1.034 0.049 0.189 13 16 0.175 0.023 1.001 −0.878 0.154 15 0.156 0.020 0.007 1.030 −0.336 0.272 17 0.231 0.029 0.976 1.165 0.114 0.146 19 0.039 0.004 1.025 0.473 0.100 18 0.064 0.017 0.000 1.034 −0.038 0.103 20 0.114 0.015 1.012 −0.729 1.015 −0.678 0.161 21 23 0.150 0.020 1.010 0.759 0.173 22 0.112 0.015

(22)

0.094 0.842 2.113 0.113 24 1.069 0.105 0.895 1.796 0.163 k=0 No. 表 B. 4 線形回帰分析の結果(条件数 IV のケース) 0.275 26 0.032 0.003 1.026 −0.431 0.089 25 1.312 1 LD CD T t h 0.017 0.000 1.034 0.065 0.089 27 0.050 0.005 1.031 0.279 0.007 1.027 −0.424 0.199 2 1.591 0.167 0.895 −1.798 0.237 1.028 −0.392 0.147 29 0.237 0.032 1.018 −0.627 0.325 28 0.224 4 0.276 0.036 0.992 −0.988 0.183 3 0.065 0.592 0.076 0.976 −1.160 0.253 30 0.043 0.004 0.180 0.024 0.990 −1.016 0.120 5 0.955 0.111 0.936 1.515 1.012 0.724 0.214 7 1.410 0.171 0.943 −1.454 0.326 6 9 0.024 0.001 1.031 −0.275 0.094 8 0.179 0.024 0.001 1.034 −0.120 0.350 10 0.082 0.010 1.027 0.404 0.263 0.099 11 0.026 0.169 0.022 1.024 0.504 0.342 12 0.021 0.001 1.032 0.216 0.995 0.963 0.260 14 0.980 0.116 0.941 −1.472 0.243 13 16 0.122 0.016 1.009 0.770 0.141 15 0.410 0.054 0.001 1.033 0.188 0.197 17 0.100 0.013 1.021 −0.567 0.192 0.126 19 0.075 0.009 1.026 −0.438 0.219 18 0.026 0.205 0.027 1.000 0.898 0.169 20 0.025 0.001 1.032 0.238 0.957 −1.345 0.208 21 23 0.544 0.060 0.937 1.500 0.138 22 0.653 0.079

(23)

0.000 1.034 −0.111 0.156 24 0.221 0.029 0.989 1.026 0.141 k=0 No. 表 B. 5 線形回帰分析の結果(条件数 V のケース) 0.349 26 0.353 0.047 1.003 −0.848 0.282 25 0.019 1 LD CD T t h 0.217 0.029 0.999 0.908 0.174 27 0.017 0.000 1.034 0.007 0.105 0.984 −1.084 0.349 2 0.180 0.024 0.993 −0.976 0.130 1.034 −0.082 0.274 29 0.032 0.003 1.028 0.373 0.108 28 0.090 4 5.119 0.536 0.853 −2.054 0.433 3 0.805 0.276 0.037 1.017 −0.643 0.348 30 0.020 0.000 1.427 0.167 0.930 1.560 0.291 5 0.025 0.002 1.030 0.316 1.030 −0.306 0.185 7 0.026 0.001 1.032 −0.229 0.145 6 9 0.600 0.058 0.914 1.675 0.110 8 0.039 0.004 0.032 0.994 −0.968 0.170 10 0.062 0.007 1.025 −0.472 0.163 0.251 11 0.242 0.119 0.015 1.018 −0.612 0.198 12 6.422 0.420 0.710 2.744 1.017 −0.641 0.099 14 0.157 0.021 0.999 −0.908 0.132 13 16 0.154 0.020 0.993 −0.978 0.113 15 0.059 0.007 0.000 1.034 0.127 0.134 17 0.081 0.009 1.029 −0.371 0.293 0.215 19 0.636 0.073 0.942 1.465 0.170 18 0.019 0.031 0.002 1.033 −0.184 0.274 20 0.168 0.022 1.013 −0.700 0.936 1.509 0.153 21 23 0.017 0.000 1.034 0.009 0.070 22 0.615 0.069

(24)

参 考 文 献

[1] Cook, R. D. and Weisberg, S.(1982), Residuals and Influence in Regression, New York: Chapman and Hall.

[2] Groβ, J.(2003),Linear Regression, Berlin: Springer.

[3] Hoerl, A. E. and Kennard, R. W.(1970),Ridge regression: biased estimation for nonorthogonal problems, Technometrics, 12, 55-67.

[4] Nurunnabi, A. A. M., Imon, A. H. M. R. and Nasser, M.(2011), A diagnostic measure for influential observations in linear regression, Communications in Statistics ― Theory and

Methods, 40, 1169-1183.

[5] Takeuchi, H.(1991),Detecting influential observations by using a new expression of Cookʼs distance, Communications in Statistics ― Theory and Methods, 20, 261-274.

[6] Takeuchi, H.(1994), Sensitivity analysis with an extension of Cookʼs distance in ridge regression, Journal of the Japan Statistical Society, 24, 221-236.

[7] 竹内秀一(2005a),線形回帰分析における尤度距離による影響力評価,人文自然科学論集, 119 号,19-30. [8] 竹内秀一(2005b),線形回帰分析における部分影響力評価,人文自然科学論集,120 号,53-64. [9] 竹内秀一(2007),リッジ回帰における尤度距離による影響力評価,人文自然科学論集,123 号,3-16. [10] 竹内秀一(2011),数値実験に基づくリッジパラメータの推定量の比較,人文自然科学論集, 130 号,71-93.

[11] Walker, E. and Birch, J. B.(1988),Influence measures in ridge regression, Technometrics, 30, 221-227(Correction 30, 469-470).

表 3. 8 シミュレーションの結果(てこ比に基づく総括表)後半 0.130160800.12624 172*99*0.1322071480.138条件数IV順位 0.11326 138*440.113157660.12025182*106*1 超過数LD超過数CDh超過数LD超過数CDh条件数V 141*40*0.108110*200.09927119*38*0.110148580.3491,0481,9690.34221,6952,9060.4331,1092,0360.350 116*0*0.

参照

関連したドキュメント

It is suggested by our method that most of the quadratic algebras for all St¨ ackel equivalence classes of 3D second order quantum superintegrable systems on conformally flat

Keywords: continuous time random walk, Brownian motion, collision time, skew Young tableaux, tandem queue.. AMS 2000 Subject Classification: Primary:

Kilbas; Conditions of the existence of a classical solution of a Cauchy type problem for the diffusion equation with the Riemann-Liouville partial derivative, Differential Equations,

This paper develops a recursion formula for the conditional moments of the area under the absolute value of Brownian bridge given the local time at 0.. The method of power series

Then it follows immediately from a suitable version of “Hensel’s Lemma” [cf., e.g., the argument of [4], Lemma 2.1] that S may be obtained, as the notation suggests, as the m A

Our method of proof can also be used to recover the rational homotopy of L K(2) S 0 as well as the chromatic splitting conjecture at primes p &gt; 3 [16]; we only need to use the

In this paper we focus on the relation existing between a (singular) projective hypersurface and the 0-th local cohomology of its jacobian ring.. Most of the results we will present

We study the classical invariant theory of the B´ ezoutiant R(A, B) of a pair of binary forms A, B.. We also describe a ‘generic reduc- tion formula’ which recovers B from R(A, B)