多変量線形モデルにおける一様最小危険不偏推定量の
許容性ならびに非許容性
野田一雄*小野英夫**平川孝三郎***
1.はじめに
多変量線形モデル
Y=XB十E, (1.1)
ただし,Y=(Yl, Y2,…, Yn) はn×m行列標本で X:既知n×pデザイン行列,
B:未知p×mパラメータ行列,
E=(el, e2,…, e。) :n×m誤差行列〜Nn. m(0, G⑧y)
とし,
G:既知n×n正定値行列,
V:未知m×m正定値行列
とするものを考える。p×mパラメータ行列Bの空間をBによって記す。また, m×m 未知正定値行列Vの空間をq(m×m)によって表す。
既知t×n行列Sが与えられると,SXBの一様最小危険不偏推定量SXB,ただし B=(x G−ix)⊃x G−iy
とし, A一はAA−A=Aを満たす任意の一般逆行列(g−inverse)とするものが考えら れる。ここで,SXBのt×m行列推定量D(γ)の損失関数としては,
LCm((B, v), D(Y))
=(D(y)−SXB)Cm(D(r)−SXB) , (1.2a)
LC,((B,の, D(Y))
=(D(Y)−SXB) C,(D(Y)−SXB), (1.2b)
を考えることにする。ただし,CmとC,は,それぞれ既知m×m正定値行列およびt×t 正定値行列とする。また,
L((B,γ),D(γ))=(D(r)−8朋)V−1(D(y)一(SXB) (1.2C)
*理工学部 数学研究室,**理工学部 数学研究室,***理工学部 数学研究室
をもD(Y)の損失関数として考える。このようなD(y)の損失を評価するために,対称 行列Aが非負定値のときA>1Oと記し,このような行列Aの空間に半順序を導く。また,
Aが正定値のときには,A>0と記す。上のような損失関数のそれぞれに対応するD(y)
の危険関数は,
R。m((B, v), D)−EB.。[L。。(8,γ), D(y))],
RC,((B,の, D)=EB. v[LC・(B, v), D(Y))],
R((B,v), D)=EB, Tr[L(B, v), D(Y))]
(1.3a)
(1.3b)
(1.3c)
として与えられる。ただし,これら危険関数は有限値をとるものとし,またこれを満たす ものとして推定量D(Y)の空間Dを考える。
関連する文献としては,James−Stein(1961)がスカラー2次損失関数のもとで,ベク トル標本y〜Np(μ, Ip)がμの推定量として,ρ≦2のとき許容的, p≧3のとき非許容 的であることを示した。Johnstone(1988)は,同じモデルのもとで2次損失の不偏推定 量pを考え,これがある2次損失関数のもとでp≦4の場合許容的であることを示した。
また,Wu(1993)は, Johnstoneの同様な結果が一般の線形モデルにおいて成立するこ とを示した。Xie(1993)は,多変量線形モデルにおいて(1.2a)に類似する損失関数の もとで,線形推定量に限定してそれらの許容性を議論した。
この論文では,上記モデル(1.1)において,SXBの一様最小危険不偏推定量 D*(Y)== SXBの許容性ならびに非許容性を与えられている行列の次数や階数との関係
で解明する。その場合,Noda−Wu(1998)の方法とその一部結果を適用する。
次の第2節では,取扱う推定量の許容性の定義を与え,上記D*(y)の許容性を議論す る。また,そのための補題を準備する。第3節では,D*(γ)の非許容性を示す。最後の 第4節では,D*(y)の許容性を示す場合(第2節)に適用されたJames−Stein定理を,
位置パラメータのピットマン推定量を用いずに直接証明する方法を与える。
2.推定量D (Y)の許容性
第1節で定義されたモデル(1.1)のもとでB∈Bに対しSXBのある推定量Do(γ)∈
Dの最適性は,危険関数(1.2a)(1.2b)あるいは(1.2c)より取扱かう対称行列の空間 の半順序を基にして評価される。すなわち,危険関数(1.2a)の場合を考えると,一っの 推定量Do(Y)∈bは損失関tw Lc。((B, y), D(γ))(1.2a)のもとで,次のような推定 量Di(y)∈bが存在しないならば,許容的であるという。ここで, D,(Y)∈Dは,す べての(B,γ『)∈B×or(m×m)およびすべての定数ベクトルα∈Rtに対し
a Rc((B, v), D,)α≦α Rc((B, y), D。)α
m m
(2.1)
を満たし,またある(Bo, Vo)∈B×or(m×m)とある定数ベクトルao∈Rtが存在して
α 6R,.((B。, V。), Dl)<α 6R。m((B。, Y。), D。)α。 (2・2)
を満たすとする。同様に,Do(Y)∈Dの損失関tw LC ((B,γ), D(y)), L((B,γ),
D(y))のもとでの許容性が定義される。
いま,
r=rank X, q=rank(SX)
とおく。
定理2.1 n>rを仮定する。SXBの推定量1プ(Y)=SXBは、 m≦2のとき,損失関
数L(L((B,V), D(Y))(1.2a)およびL((B, V), D(Y))(1.2c)のいずれのもとでも 許容的である。また、D (Y)は,σ≦2のとき,損失関数LC ((B, V), D(Y))(1.2b)の
もとで許容的である。
この結果を証明するために,最初に次の補題を準備する。
補題2.2Am=(al, a2,…, a.)を次数mの任意の正則定数行列とする。このとき、
SXBの推定量D(Y)∈bが損失関数(1.2b)のもとで許容的であるための十分条件は、
すべてのai, i=1,2,…, m,にっいてスカラー損失関数
ic,((B, v), D(Y)ai)
=ω(Y)ai−SXBai) c,(D(Y)ai−SXBai)
i= 1, 2, … , m, (2.3)
のもとで,すべてのD(Y)aiがSXBaiの許容的推定量であることである。
証明 Do(γ)∈bをSXBの別の推定量とし,すべてのB∈B, V∈qについて
Rc,((B, v), Do)x〈RCt((B,の, D)
を満たし,したがって,すべてのB∈B,V∈orおよびすべてのiについて
RC,((B, v), Dotzi)〈x, RCt((B,の, Dai)
i= 1, 2, … , m (2.4)
を満たすものとする。
一方,各損失関数(2.3)はD(y)aiの狭義凸関数である。そこで,あるB。∈B,
Vo∈qが存在して,すべてのaiについて
PB。 v,(D・(γ)α・≒D(r)α・)>o ,
i= 1, 2, … , m (2.5)
と仮定する。このとき,
D,(Y)一÷D(r)+炉。(r)
とおくと,(2.4)によってすべてのaイについて
RC,((Bo, Vo),1)lai)
<芦・((B。,v。), Dai)+tRC,((B。, v。), W、)
苧・((B。, v。),D・、)+]声((B。, v。),D・、)
=敏(B。,v。)Dα、)
が成立する。しかし,このことはD(Y)aiが許容的であることに矛盾する。すなわち、
仮定(2.5)を設定することはできないから、すべてのaiについて D。(y)αごD(r)ai P。, v−・.・.B∈B, V∈q
が成立し,したがって
[D。(y)−D(r)]Am=O P。, fa.s.B∈B,γ∈or がしたがう。よって
D。(Y)−D(r) PB. v−a.S.B∈B, V∈or を得る。
同様な議論から,次の補題が得られる。
補題2.3A,=(α1, a2,…, at)を次数tの任意の正則定数行列とする。このとき,損失 関数(1.2a)および(1.2c)のいずれかのもとでD(y)∈DがSXBの許容的推定量であ るための十分条件は,それぞれ,すべてのαi,i=1,2,…, tにっいてスカラー損失関数 LCm((B,γ), al D(Y))
=(afD(r)一α;s朋)Cm(afD(r)一α;㎜)
i= 1, 2, … , t (2.6)
および
L((B,v), a;D(Y))
一(αfD(r)一α;8xβ)v−1(α;o(r)−al S」脇)
i= 1, 2, … , t (2.7)
のいずれかのもとで,すべてのa;D(Y)がα逗狙の許容的推定量であることである。
Noda−Wu(1998)のLemma 2.2の証明と同様な方法で,次の補題が示されるが,内 容はShinozaki定理(Shinozaki,1975)の拡張になっている。
補題2.4 D(Y)∈Dを損失関数(1.2a)もしくは(1.2b)のもとでSXBの許容的推定 量とする。ただし(]m≧0,Cm≒0, C,≧0, q≒0とする。このとき, D(Y)は,そ れぞれ損失関数
(D(Y)−SXB) A,(P(y)−SXB)
もしくは
(P(Y)−SXB)Am(D(Y)−SXB)
のもとでSXBの許容的推定量であ。ただしA,, Amはそれぞれt次, m次の対称行列で A,≧0,Am≧0, A,≒0, Am≒0であり
R(A,)⊂R(c,),R(Am)⊂R(Cm)
を満たすものとする。ここで、s×t行列Aに対しR(A)はAのrange space,すなわち R(A)={Ax l工∈Rt}
を表す。
さらに,次の補題を得る。
補題2.5各Vo∈qを任意に固定するとき,損失関数(1.2a)もしくは(1.2b)のもとで D(Y)∈DがSXBの許容的推定量であると仮定する。すなわち,すべてのB∈Bにつ
いて
RC,((B, Vo), Do)≦RC,((B, Vo), D),
あるBo∈Bおよびある定数ベクトルao∈Rmが存在して
α急配q((B,1%),Do)αo<a 6RCt((B,1石),」D)αo, (2.9b)
あるいはすべてのB∈Bについて
Rc.((B, Vo), Do)≦RCm((B, Vo), D),
あるBo∈Bおよびある定数ベクトルαo∈Rtが存在して
α6 Rcm((B,1「ζ),1)o)αo<a6」Rcm(B,1%), P)αo (2.9a)
を満たすSXBの推定量Do(Y)∈bは存在しないと仮定する。このとき, D(Y)は損失 関数(1.2a)あるいは(1.2b)のもとでSXBの許容的推定量である。
証 明 損失関数(1.2b)の場合は損失関数(1.2a)の場合と同様であるから,損失関数
(1.2a)のもとでD(Y)が許容的であることを示す。このためには,もしも他の推定量 Do(Y)∈Dが存在して、すべての(B,の∈B×qに対し
RCm((B,の, Do)≦Rc。((B, V), D)
を満たせば,すべての(B,V)∈B×orについて PB, v(1)o(Y)=D(Y))=1
が成立することを示せば十分である。
これに対し,ある(Bo, Vo)∈B×, 1・tが存在して PB。. T5(Do(Y)≒D(y))>0
であると仮定しよう。このとき、定数ベクトルbo(≒0)∈Rtが存在して,
(Bo, Vo)∈B×砂について
PB。+v。(b6 Do(Y)≒b6 D(Y))
=PB。. v。(b6{Do(Y)−D(Y)}≒O)>0・
したがって,SXBの推定量
D,(Y)一÷{D。(y)+D(r)}
が考えられる。ここで,すべての異なったt×m行列A,,A2および0<α<1を満たす すべての実数αに対し
[αAi+(1一α)A2−SXB] C。[αAi+(1一α)A2−SXB]
≦α[A「SXB]Cm[A,−SXB]
+(1一α)[A,−SXB]Cm[A,−SXB]
かっ
[αb拓i+(1一α)b6A,−b6SXB。]Cm[α砲1+(1一α)b6A、一 b6SXB。]
〈α[b拓1−b6SXB。]Cm[b6A,−b6SXB。]
+(1一α)[b6A2−b6SXB。]Cm[砲,一 b6SXB。]
が成立することに注意する。したがって,Dl(y)の定義より,すべての(B,の∈B×cy について
R。.((B,の,D1)x〈R。m((B,γ),1))
かっ
bPtc.((Bo, VO), D,)bo
== EBo, ve[ii−bP・(r)+†ゆ(y)一・b6SXB・]Cm
・[tbP・(r)+−1−b6D(r)一・b6SXB・]
<÷b輪((B。, V。),D。)b。+tbPt。.((B。, V。), D)b。
≦baR。。((B。, Ve), D)b。
が従う。とくに,すべてのB∈Bに対し
R。。((B,Vo), DI)≦R。。((8,%), D)
かっ
b露(L((Bo, VO),1)1)bo〈bgec.((Bo, VO), D)bo
が成立する。しかしながら,上の二っの不等式は,D(y)の損失関数(2.9a)のもとでの 許容性に矛盾する。よって、補題2.5は証明された。
さらに,Lehmann(1983)のLemma 4.3.2(p.269)と上の補題2.5より,次の補題を
得る。
補題2.6 (S,(Y),S2(Y))を(B, V)∈B×qに関する結合十分統計量とし、 S,(y)を 任意のVo∈cyを固定するときB∈Bに関する十分統計量とする。また,それぞれSl, s2 の可測関数であるD(S,),T(S2)がSXB(B∈B), V∈qの推定量であるとし,独立に 確率分布PB, v, Pvに従うとする。このとき, Vo∈orを任意に固定しT(S2)を用いない
ときにSXBの推定量D(S,)が損失関数(2.9a)あるいは(2.9b)のもとで許容的であれ ば,V∈qを固定しないでT(S2)を用いてもD(S,)は損失関数(1.2a)あるいは(1.2b)
のもとで許容的である。
定理2.1の証明 補題2.5および補題2.6によって,不等式(2.9a)もしくは(2.9b)の 表現において,D (Y)の許容性を示せば十分である(補題2.7および第3節を見よ)。し たがって,任意にVo∈cyを固定する。
まず,モデル(1.1)の変換を次のように考える。n×r行列Pを
R(G−1/2x)=R(P), P P=1,
を満たすようにとる。SGi/2Pの特異値分解を考え,次数t, xの直交行列Q, wをとり SG /2P −Q(69)w,
A=diag(λ1, Z2,…, Zσ) (2.10)
とする。Gram−Schmidt直交化と列基本変形によって, p×p正則行列Tが存在して G−1/2X ==(P O )T
n×r n×@一γ)
と表すことができる。したがって G /2X(X G− X)−X G−1/2=PP
と表され,これによって
rank(SX)=rank(SG /2PP G−1/2X)
≦rank(SGi/2P)=rank(SGi/2G一1/2X(X,G一1X)−X G−i/2P)
≦rank(SX)
が成立する。よって
rank(SGi/2P)=rank(SX)=q.
以上の準備のもとに,モデル(1.1)を σ一G−1/2yv。−1/2,
ε=G−1/2EVoi/2,
γ一TBV。一[/2
と変換する。このとき
σ〜ハXn, m(Pγ,」ら⑧Im),
ε〜Nn. m(0, In⑧lm).
Uの確率密度関数は
S(u)一(・・)一・m/・e・p[−t・・{(・−P・)t(・−P・)}]
一(・・)一一・xp[−S・・{u ・}]
・・xp[−t・・{一・(P ・) r+(P・)t(P・)}]
(2.11)
(2.12)
(2.13)
と表される。
よって,定理の仮定n>γのもとで,Vo∈qが固定されているとき,
P U=P Gザ1/2YVO−i/2
は,γに関して完備十分統計量であり,したがってパラメータB∈Bに関し完備十分統 計量である。さらに,r×m行列として
Z=(Zl, z2,…,9,)
=WP U=WP G−i/2 YVO−1/2,
θ=(θ1,θ2,… ,er)
= WP G−1/2×BVo− /2 (2.14)
とおく。このとき,Vo∈orが固定されているもとで, ZはBに関して完備十分統計量で ある。これを補題として次のようにまとめておく。
補題2.7 Vo∈or(m×m)が固定されているとき,(2.14)で与えられる統計量Zは B∈Bしたがってθに関し完備十分である。ただし,n>rと仮定する。
さて、SXBの推定量
D°(Y)=sxB=SX(X G X)−X G−iY −Q(63)zv。 /2
の損失を考える。まず,損失(1.2a)にっいて LCm((B, Vo), D (Y)) ・
=(SXB−SXB)Cm(SXB−SXB)
=SG I/2PP G−i/2(y−XB)Cm(Y−XB) G−1/2PP G−i/2S
(2.15)
一
Q(AOO O)VVP G− /2(r一狙)Cm(r一朋) G−1/知 (63) Q ・
ここで,
F−Q(63)VVP G /2 (2.16)
とおくと,
L・。((β,v。),D (γ))
=(FY−liTXB)Cm(17Y−RXB)
=(FγV,一 /2−FXB VO /2)VO I/2C㌫ Vei/2(FYV,一 /2−EXB Vo−1/2) .
損失(1.2b)については,
LC・((B, Vo), D (y))
ハ
=(SXB−SXB) Ct(SXB−SXB)
= (FY−FXB> C ,(FY 一 FXB)
一(V。 /2) FrV。−1/2−FXBV。−1/2)C,(FyV。−1/2−FXBV。−1/2)V。 /2.
(2.17a)
(2.17b)
上の計算によって,D (Y)=Fγの損失関数(1.2a)もしくは(1.2b)のもとでの許容 性を示すことは,FXB Vo−1/2の推定量としてのFyVo−!/2の(2.17a)もしくは(2.17b)の もとでの許容性を示すことと対等である。よって,D (Y)のLc.のもとでの許容性を 示す・とは・Q(68)・の推魍Q(63)Zの損失
Q(AOO O)(Z一θ)V。 /2C.・V。 /2(Z一θ) (63) Q (・.18・)
のもとでの許容性を示すことと対等である。一方、D (Y)のLCtのもとでの許容性を示 す・とは,Q(A OO O)θの擬量Q(68)Zの損失
(V。 /2y(Z−・) (63〕卿(63)(Z一θ)V。 /2 (・.18b)
のもとでの許容性を示すことと対等である。
ここで,補題2.4,補題2.5の適用を考えると,D (Y)の(1.2a)もしくは(1.2b)の もとでの許容性を示す・とは,Q(A OO O)Zの損失
Q(68)(z一θ)(z−e) (63) Q
(2.19a)
もくしは
(V。 /2) (Z−e)t(A, 9) Q Q(63)(Z一θ)V。 /2
(2.19b)
のもとでの許容性を示すことで十分である。
いま,Zの可測関数として表され危険力・有随をとると・ろのQ(A OO O)θの推題の
空間をz「)。によって表す。D (Y)がBに関するしたがってθに関する完備十分統計量Z の可測関数であ・・とに瀧すると,Q(63)θの推定量Q(69)Zの(・・19・)もしくは
(・.19b)のもとでの許容性を示す・とt・, Q(68)・の擬量Q(63)Zの損失関数
[(D(z)一(68)e][D(z)(68)θ]
D(z)∈勾 (2.20a)
もしくは
[(D(z)一(63)θ] [D(z)(68)θ]
D(z)∈勾 (2.20b)
のもとでの許容性を示すことと対等である。
ここで,
Zl−(91, X,,…, Zq), Z、一(Zq+1, Zq.,,…, Zr),
θ1=(θ1,θ2,… ,θ・), θ2=(θ,+1,θ・+2,… ,θr),
とおき,
Z=(Zl, Z2),,θ=(θ1,θ2)
と書くことにする。このとき,
(2.21)
(五〇〇〇)z−(ぜ),(63)θ一(五8{)
と表される。さらに,(2.21)に対応して Zo=(Z1,0) ,θo=(θ1,0)
とおくと,
(2.22)
(AOO O)z−(68)z。一(五ぎ1),
(AOO O)e−(S 3)θ。一(五8{)
と表され・・よ・て,Q(63)・の推題Q(69)Zを考え・代りに・その繊を考慮 に入れると,(63)・。の推趨(完)z,・de考え・・とができ・・したが・て・Aの対 触素・i,−i−1,い,q,が正であ・・とに注意すると, Q(A OO O)zよ娘・・擬量
を見出すためには,m×q行列Dl(Z)の可測関数として
(AOO O)(D1ら「))。9q
の形をした(AOO O)e。の推題の空恥1(⊂bz)を,損失関数
[(63)(D,SZ))一(;3)・。][(63)(D,5Z))一(38)θ。]
(2.23a)
もしくは
[(AOO O)(D,SZ))一(66)θ。] [(63)(D,6Z))一(68)e。]
(2.23b)
のもとで考えることができる。
ところが, この問題のためには,
(D sz))一(五8;)一(;昆)[(ノ「1τ(z))一(6)]
(2.23a)
が成立す・から・(AOOIr−q)(6f)の推定量(鵠(D,6Z))の改良を損撒
[AO(0 1,−q)(呼))一(ち乳)㈲][(;乳)(㌣))一(;乳)(6)]
(2.24a)
もしくは
[(z9..q)(D 6z))一(6乳)(6)]鵬昆)(刀,6z))一(6乳)(6)]
(2.24b)
のもとで考え・・とができ・・したが・て瀦局定理の証明のためには,(θ;0)の推題
㈲の損失関数
[(DI陥))一(6)][(D,6z))一(6)]
(2.25a)
もくしは
[(D,6z))一(6)] [(D,6z))一(6)]
(2.25b)
のもとで許容性を示せば十分である。
まず,損失関数(2.25a)の場合を考える。補題2.3の適用を考え,補題2.3における行
列A,として単位行列・r−(el,・e、,..。のをとり, i・=1,2,…, rについて・(㈲の 推趨・;(《)の許容性をスカラー損失
[・(㈲一・;(6)][・;(後)一・;(6)] (・・26・)
を考え・.・・mes−S・…定理(第・節参照)によれe・・, m x〈・のとき洛el(後)は対応
す・各損失(・.26・)のもとで許容的であ・。よ・て,樋・.3・t・よ・て,㈲は,
勿≦2のとき,損失(2.25a)のもとで許容的である。
次に,損失関数(2.25b)の場合を考える。補題2.3における行列Amとして単位行列
Im=(el, e2,_, em)をとり,補題2.3の適用を考える。すなわち, i=1,2,_, mにっ いて(θ10)e、 ・Dre定量㈲・ρ損失
[(後)・、・一(6)・i] [(後)ei−(6)ei] (・・26b)
のもとでの許容性を考え・.再び・・mes−S・…定理により,各㈲・、垣≦・のとき,
損失(・.26b)のもとで許容的であ・.よ・舗題・.3・t・より,q〈一・のとき,㈲1ま
損失(2.25b)のもとで許容的である。
以上によって,、D (Y)の損失関数(1.2a)もしくは(1.2b)のもとでの許容性が示され
た。
D (Y)の損失関数(1.2c)のもとでの許容性については,モデル(1.1)の変換(2.11)
によって損失(1.2c)が
Q(AOO O)(Z一θ)(Z一θ) (;3) Q〃 (・・27)
と表されることに注目する。この形は(2.19a)と同じであるから,この場合のD (y)の 許容性は,(2.19a)以降の議論と同様になる。
以上により,定理2.1の内容はすべて証明された。
3.推定量D (y)の非許容性について
この節では,
1) (Y)=・sxB=SX(X G− Xγ x G−1/2 Y
−SGi/2PP G−1/2y−Q(63)IVP G−1/2r (・.1)
の非許容性を損失関数
L。((B,y), D(γ))=(D(y)−SXB)Cm(D(r)−SXB) (3.2a)
m もくしは
LC・((B, γ),1)(r)) = (」0(r)−S2【B) q(1)(r)−SXB) (3.2b)
のもとで考える。また,損失関数
1ン((B, V), D(】r)) = (D(Y)−SXB)1ゾー1(1)(】r)−SXB)ノ (3.2c)
についても考える。
G−1/2y〜∧㍍(G−1/2XB,1。⑧V), V∈qであるから,
PI・ G−1/2y〜N。. rn(PP G /2XB, PP ⑭v), v∈or,
であり,PP … PR(C−1!・X),つまりPP はG−i/2γのr次元空間R(G−i/2X)への正射影変 換を表す。さらに,
VVP G−1/2y・…WP PP G /2y〜N,. m(WP G−1/2XB,1,⑧・V).
そこで,m×m行列として,
^ 1
(G−i/2γ一PP G−i/2 yり (G−1/2 y−PP G−i/2 Y)
v=
n−r
−iilr}(G /2r) (ln−PP )(G−1〆・r)
とおくと,PP G−1/2 Yと0とは独立であり,
ハ
(n−v)V〜 VVm(n一γ, V). (3.3)
したがってまた,WP G−i/2 Yと0、およびfiと曾とは独立である。さらに,もしも n>rであれば,(B,V)は(B, V)∈B×cyに関し結合完備十分統計量であることがわ
かる。
以上の準備のもとで,r×m行列として
WP G−1/2XB−(dl, d、,_, d,) =D,
WP G−1/2xfi 一 WP G /2r−(∂,,∂,,_,∂,) 一・b (3.4)
とおき,さらに
アヨ
Hr−di・g([∂1∂−1∂1]−1,土) (3.5)
とおく。このとき,di, i=1,2,_, r,は独立でNm(di, V), V∈orに従う。(D, Y)
は(B,V)∈B×orに関し結合完備十分統計量である。そこで, cを適当な定数として SXBの推定量
D。(r)−Q(63)(lr−2・flr)b
−Q(AOO O)…g(1−・・[alO−1∂1]一 ・・・・……・・)(a,・・a・・・・・…a・) (・・6)
を作・.D (Y)−Q(63)b…)損失関数(1・2・)のもとでの非許容性を示すため・…
の推定量Do(Y)を用いる。
D (Y),1)o(γ)の危険を考える場合,変換()k/2a《によってC駕2∂ 〜Nm(cA12di,
cxi2 vcini2)であるから,はじめからCmを単位行列Imとして一般性を失わない。さらに,
直交変換yKγによって π=KeVKy,γ∈q,
が対角行列であるようにする。ここで,KvはV∈orに依存するm×m直交行列である。
このとき,
ム
D=DKv, D=DKv
と記せば,
ム
D〜Nr. m(D,1.㊦ u).
また,
令一κ諒κ。ニ 1(G−1/・】rK。)・(1。−PP )(G−i/・YκV)
n一γ
とおけば,
ム ム
V−1= K妥γ一iKv,(n−r)V〜VV.(n一γ,の
ム ム
であり,DとVは独立である。さらに,
π一…g([∂伊∂1]一 ,・・,・・,…,・)
とおけば,
Hr=Hr
である。最後に,
91 ==u−i/2dTl, {il=v−1/豆1
とおき,K,を平均値(g{9i)/2のボアッソン分布をもっ確率変数とする。 v, v を
VEqのそれぞ撮・1・駄の固有値とす・.vを臆の蹴・を・〉去を満たす任
意の実数とする。
(B×〈)a−
{(B・ v−)∈B…?/・ ・・一・・〉…
1 1
−E
十2 α m−2+2K,
1Vl
び び 1
v −v 2[1+(m−・)E 1
m−2十2K,
(3.7)
とおく。以上の準備のもとで,
定理3.1 パラメータ(B,V)の空間を(B×or)。に限定する。 このとき,
ハ
3≦m<n−r−m+1であれば,SXBの推定量D (Y)=SXBは損失関数(1.2a)のも とで非許容的である。
証 明 D (y)およびDo(Y)の危険の差を求めるたあに,
A=EB, v(D−D)(刀一D)
−EB, v[(4−2c耳)b−D][(1,−2cHr)b−D]
−4・E。, v[Hh(b−D) ]−4c2E。. v[HhDHr] (3.8)
とおく。このとき,すべての(B,V)∈B×orに対し
R。。((B,v),Dつ一R。。((丑,γ),D。)
−Q(63)A(6 9) Q (3.・)
と表される。D,Dの代りに万,万を用いるとAは
エ ム A=EB, v(D−D)(D−D)
−E。。[(lr−2・互)万一万][(lr−2・互)カー万]
−4・E。, v[ ム ム HP(D−D) ]−4c2E。, v[励毎]
−4・d・a・( エ エ み磯≡ll)一一・)
⊇十儲毛rq・一・) (3・・ )
と表される。
よって,危険差(3.9)の評価を求めるためには,
ム ム
ム ム
An−・・尻・畿:L・・2E・・ ti(∂{詩 (3・1・)
を評価すればよい。ここで,Arnold(1981)のLemma 17.11の証明(p.320)および
Lemma 18.8(p.333)によれば,
エ ム
(n一詩;害1∂−X;一・−m+1(・)
となり,(a; v.−i∂、)/[(n−r)−1∂f令一i∂,]と∂、は独立である。したがって
ム ム
坊儲≡;ll−n一㌶+1・
妬撰≡;1:)一@一鵠≡…+3)
を得る。これらの項を用いると,(3.10)は次のように表される。
An−・碗 撰;;:)場陪多1))
一…E・. ・(ム ムd;rlば{エ ム エd;γ一 ば1)2E・, ・((∂{警ミ乞ア)
一・⊇恥(V.−1/2∂1) 1ζ(1ζ一1/2∂,−1ζ一1/2∂1 (V.−1/2∂1) (1ζ一1/2∂,))
一・c2−k =tzzzitl24xtzzz−r−m+;1(rnir m+3)場・鵠霊;;霧・
Arnold(1981)のLemma 11.3とその証明(p.161)を適用すると,
ム ム
パ
恥鵠三ll)一吟・9{γ碧「免)
−vE。, v−1ll(v 9{−Sty㌍ar(91−91)
9191
十・∂;(v −lmA,Agl gl)元+1−(glv ・i)巧・∂{量一・{γ(弓晋)]
となり,
1 1 E・・ ・錨1=㌃一2+2K,・
パ
E・・ ・¥:1!1一 = −dili(E 2κ「9;9i m−2+2K,)・1
を得る。したがって,
ム ハ
妬晋;著一vE・・ ・s;(V −lmA,Agl 91)9 +・㌃鶉K,
_vgj(γ一lmノ )ELE 2κ, . 9191 m−2−1−2K,
さらに,
ぬ
E・・ ti(∂{誤アーvE・・ ・as
−{恥∂1(v −lm(gl 9i)2)転副
パ
−vE・・ ・g;(y 一輪パ (9; 9i)2)9 +砿_去,K.
上の2式によって,
41−・酋慨・_痘
+・ごト嵜)二元呉一警,K,]
2(n−r−m十1)(n−r−m十3)
1 −4c
vE (n−r)2
m−2十2KI
, 一・μ一彿吉当=勿+3)vE・・ ・gi(γ −lm(gl 9i)2)9
を得る。いま,m≧3, n−r−m+1>0のもとで,すなわち3≦m<n−r+1のもとで,
定数cを
n−r
(3.11)C=
2(n−r−m十3)α
と特殊化す・・ただし・・は・〉÷舗たす任意の実数であ・・かくして,M〈一・<
n−r+1のもとで,(3.11)により
dll− 9≡1≡鵠[・(m−・)−i]砿_転
+(≡器率メ(ξ評一拓
一・・{(v −lmgl 9i)免E_費、司
>0.
ハ
91(v −lm)91
(gl 9i)2
(3.12)
ただし,第2項の評価は次の補題3.1による。
かくして,すべての(B,γ)∈(B×or)。, vについて RCm((B, V),1プ)−Rc。(B,γ)・Do)
−Q(AOO O)A(63) Q 〉1 o・
すなわち
RCm((B,の, Do)≦Rc.((B・V)・1プ)・
さらに,ql∈RtをQの第1列ベクトルとすると,
q([RCm((B,の, Do)−Rc.((B, V),1プ)]ql − −qlQ(A OO O)A(63)ρ qi−一λIAI,<o・
かくして,損失関数(1.2a)のもとでDo(γ)はD (Y)の改良であり, D°(γ)の非許容 性が示された。
補題3.1定理3.1の条件のもとで,(B,V)∈(B×⑳。, vについて
ハ パ
・E・・9{(V −lm∂巨、)9 一一i}EB. vr°{(ξ;欝91
−・gl(v lm9; 9i)91E_顎,ic 1・・ (・・13)
証 明 (3.13)の左辺の第3項は 一・gl(v −lm9; 9i) IE_顎,K、
一一2−gl(v硲一lm9;91)91+E(m−2)gl(写計)91㌃一吉2瓦・
よって,定理3.1の条件のもとで
ハ
・恥9;(v −lm磁)9 −tE・・ ・a{(i:i il3)9
_2.gl(v −lm )911.E 2K,
91 91 m−2十2K,
〉一・(÷−1)恥繋L÷(1−i)妬・畿晋
一・(÷−1濡1+・(m−・)(f−1濡1E_楡
一・(L1
−(! :L−i
)[1−(m−・)E 1
m−2十2K,
1
﹈
)[÷E
m−2十2K, 一
・]〉一・・
系3.2 3≦m〈n−r+1のもとで,SXBの推定量D (y)=SXBは損失関数(1.2c)
のもとで非許容的である。
証 明 1プ(Y)の損失(1.2c)は L((B,V),1プ(Y))
−Q(AOO O)@−D)v− (D−D)t(6 9) Q
−Q(AOO O)(bv−1/2−DV−1/2)(Dv−1/2−DV /2) (69) Q
と表される。したがって,K.を平均値(V−1/2d1) (V i/2d1)/2をもっボアッソン分布に従 う確率変数として,D (y)とDo(γ)の危険の差∠の最初の対角要素は,仮定のもとで
パ
dll 一・・恥砦学)−4c2E・, ti(lli−il;iifsii
−4−E l
n−r m−2十2K.
一…(n−T−m+1)(n−r−m+3 (n−r)2 )E_吉,K.
となる。この場合,cを (m−2)(n一γ)
c=
2(n一γ一m十3)
とおけば,(3.14)は次のように表される。
All =(m−2)2(n−r−m+1 (n−r−m十3))㌃吉、K.・・
したがって,これによって定理3.1の証明と同様にが(y)の非許容性が示される。
最後に,損失関数(1.2b)の場合にっいて述べる。
定理3.2パラメータγの空間を%={VlV∈酩Vは対角行列である}に限定する。
このとき3≦q<r<nであれば,SXBの推定量1) (Y)=SXBは損失関数(1.2b)の もとで非許容的である。
証 明 D (y)の損失(1.2b)は,定理3.1の証明に用いられた表記によれば
LC,((B, v), D (Y))
一(D−D) (A. 9) Q c,Q(舌3)(D−D)
と表される。ここで,次のように置く。
c−(s ;8)一(A. 9) 9・c,Q(69).
ただしC,;はq×q正定値行列とする。また,
fi−WP G−1/・r−(Bl)・
D−WP G− /2XB−(Bl)
ハ パ
とおく。ただし,DlとDlはそれぞれq×m小行列であり, D2とD2は(r−q)×m小行
ハ
列である。 ここで,D〜ハ膓.一(D,1,⑧V)であり, (D,のは, n>xのとき
(B,V)∈B×cyに関し完備十分であることを想起しよう。したがって, D (Y)の非許容 性は(D,V)を通して考えることができる。補題2.4において, C,の代りに
Q(ノ仁2001、−q)Q
をとり,re題 2.4を適用すれば, D (y)の非許容性はC,;=Iqとして考えることができる。
このとき,D (y)の損失は tiq((B, v),(D))
一@−D) (68γ⑭(6 g,−q)(6 9、.q)Q Q(68)(b−D)
一(b−D) (33)(b−D)
=(D1−Dl)ノ(D「Dl)
と表される。そこで
ハ D,=(Ul,α2,..., Um),1)1=(ξ1,ξ2,...,ξ.)
とおくと,Ui〜Nq(ξ,,毛)である。 Pの推定量として,
T−(S 、)T・一(tl・・・・・・……・・Um)・
tl−(1−fi−iii− ・)Ul
を考える。
かくして・Tが損失関鋤のもとでbより良L・・と・したが・てQ(AOO O)Tが
D (γ)−Q(28)fiより良い・とを損失関数(1.・b)のもとで示す.実際, A・n・ld
(1981)のLemma 11.3(p.161)により,(B, V)∈B×%に対し Rlq((B,の, D)=E兄垣((B, v, D)=qV .
かっ
Rlq((B, v), T)
一ぐ『下栖一り
一qd・・g(Vl「[・・(q−・)一・2] E,一,1,r・勉…・ Vmm)
と表される。ただし,Vll, V22,_, VmmはV∈%の対角要素であり, K は平均値 II e, 2/2をもっボアッソン分布に従う確率変数である。
ここで,q≧3であれば,
c=q−2
とおくと,すべての(み,の∈B×%について
Rlq((B, v), T)−Rlq((B, v), i))
一一q(q−・)2…g(E,一,1,]Ri;一・ o,…・・)
<0.
これより定理3.2の成立をみることができる。
4.James−Stein定理の直接証明
第2節に適用されたJames−Stein定理(1961)は,位置パラメータのPitman推定量の 許容性を論じることとして与えられている。本節では,比較的一般化されたベイズ推定量
(comparative generalized Bayes estimator,略してCGBE)の列を考案し、これによっ て直接次のようなJames−Stein定理を証明する方法を述べる。
定理4.1(James−Stein,1961)X 一 Np(μ, Ip)とする。もしもp≦2であれば, Xは損 失関数
L(μ,d(X))=(d(X)一μ) (d(X)一μ) (4.1)
のもとでμ∈RPの許容的推定量である。ここで, d(X)∈RPはμ∈RPの推定量を表す。
この定理を証明するために,次のような準備をする。ボレル集合M⊂Rρをμの空間,
BMをM上のボレルσ一集合族とする。可測空間(M, BM)の上に事前測度ξが与えら れたとする。μ∈Mの推定量dE(X)は,その危険が
v (μ,dξ)−EbL・(P, dξ(X))〈。。 ξ一a・e・μ∈M,
を満たし,すべてのμの推定量d(X)について
4(d(X),d,(X))−f、,[・(μ,の一・(μ,d,)]ξ(ψ)≧0 (4・2)
が満たされるならば,ξに関するCGBEという。
Wu(1993)は, Ping(1982)の着想をもとにして,次に述べる2っの補題を与えた。
補題4.1dξ(X)をすべてのμ∈Mに対しr(μ, dξ)<。。が満たされるμ∈Mの推定量 とする。もしも,(M,BM)の上の事前測度の列{昂とこれに対応する列{dta(X)}が あって,各dfr(X)はμ∈MのCGBEで
lim Ae.(de(X), dξn(X))=0, (4.3)
n→oo
lim inf 9,(A)≧ξ(A),A∈jBM, (4.4)
n→oo
を満たすならば,dξ(X)はξに関して殆んど許容的である。すなわち,すべてのμ∈M に対し
r(μ,d)x〈r(μ,dξ)
を満たすμの推定量d(X)が存在するならば,
ξ({μ1μ∈M,r(μ,d)<r(μ,dξ)})=o が成立する。
補題4.2 ξをBハfの上の事前測度とし,L(μ, d(X))をμ∈Mを任意に固定するとき d(X)の狭義の凸関数とする。また,互。(A)>0であるようなすべてのμo∈Mとすべて
のA∈豆3Mについて
ξ({μ1μ∈M,互(A)>0})>0 (4.5)
とする。このとき,μ∈Mのある推定量d(X)がξに関し殆んど許容的であれば,d(X)
はまたμ∈Mの許容的推定量である。
以上の準備のもとで目的の解決にとりかかる。
定理4.1の証明 M=RPとする。ξを(M, BM)の上のルベーグ測度とし,(M,隔r)
の上の事前測度毛,k=2,3,…をm>−2として
毛(dμ)=[9k(μ)コmξ(dμ) (4.6)
によって定義する。ただし
f,,[・、ω]m(・・)−e・xp[t(x−・) (x−・)]du
として
da(x)=(dai(x)・dft,(x)・…dq,(x))
とおく。
分子は,
L,μ、[・、ω]m(・・)−e・xp[−S(x−・) (x−・)]d・
−f。, Xi[・・ω]m(・・)−9・xp[−t(x−・) (・一・)]dp
−fRP[・・ω]m(・・)−eG}・xp[−S(・一・・)r(・一・)]d・・
となり,右辺の第2項は
兎か[・・(・)]m−1£、・・ω(・・) e・xp[一†(・一・)t(・一・)]d・・
と表される。ここで
静)一 {::鷺)燈㌔
かっ
9k(μ)=9[h,(μ)],
・(・)一 {∵ぷ㌔:
h・(・)
十(・1・g・k)一・1・・⑭霧1ξ〈尼
とする。ここで,関数gはJohnstone(1988)が工夫したものの特殊な形になっている。
簡便のため,dμ=ξ(吻)と記す。
いま,毛に対し各iについて
L,μ・[・・(・)]m(・・)−e・xp[一丁(x−・)t(x−・)]d・・
輪(x)=
(4.7)
(4.8)
(4.9)
豊一[一(21・gh)−1☆…]・・,(・U)
一一(1・gk)一 瀞、ω
である。ただし,Ah={μ11<μ勉くk2}とおき, IA,(μ)はA,の定義関数とする。
そこで,
∫(x)−fRP[9k(・)]m(・・)−e・xp[−t(x−・) (・一・)]d・
とおくと
輪= ∫(x)
一¥ts(), i−1,2,…, P・ (・・1・)
と表される。
ここで,dE,(X)は姦に関するCGBEであることに注意する。次に,庇(X)の危険にっ いて考える。すなわち,
・(μ,da)=Ep(da(x)一μ) (da(x)一μ)
鶉)1(x−・)
碑劔蜘)]m一量・・(・)(・・)一;e・p[一÷(・一・y(・一・)司
一
Ep(x−・y(x−・)+Ep[
肝・y[dE,(xf(x))]+E・・[Lf(x)]一・d・(x) …(x)・
ここで,Xの周辺分布にっいての期待値をEfによって表すと,
f,,Ep〔∫(x)]一 ift(x) (x一μ)9,(dp)
一耶α)]一蔭(x)・[一鶉)]
=一局[∫(X)]−2dft(X) dE,(X)
を得る。よって,(4.2)の定義に基づいて
AE,(X,夜(X))=Ef[f(X)]−2乏(X) 乏(X)・
いま,
Ef[∫(X)]−2[dqi(X)]2
=f.,[f(X)]−2[転ω]ケω∂エ1砒2…dXp
(4.11)
(4.12)
コーシー・シュヴァルッ不等式を用いて(4.12)の右辺を評価する。すなわち
[f。・m[蜘)]m→&9k(・)(・・)−e・x・[−t(・一・)t(x−・)固 一f,,一 . _ . _ d泌 fRP[9・(・)]m(・・)−e・xp[一†(x−・) (x−・)]d・・
一くf。,fRP{m[9・(・)]m−1}2(・・)−e・xp[−S(・一μ) (x−・)]dwdx
晶蜘)]2(…)−e・x・[−t(・一μ) (・一・)]de × de.
f.P[9・・(・t)]m(・・)−e・xp[−t(・一・)t(x一μ)]d・・
ここで,m=2とおくと,最後の式は
・f.p[嘉(・)]㌃(・・)−e・x・[−S(x−・)t(・一・)]・・]d・・
一・f.p[∂ 9k(μ毎∫)]2d・・
したがって、kに独立な定数Bがあって,各iにっいて(4.12)の右辺は
Ef[∫(x)]−2[輪(x)]2
・64(1・9・)竜読なω吻
一〈64(1・9〃)−2f。,(μ石)一 dPt
−B(1・gh)−2f、k rP−3dr
と評価される。もしも,ρ≦2であれば,
B(1・9・le)−2f、k rP−3dr−0(le→・・).
さらに,すべてのA∈BMについて
lim在(A)=ξ(A)
k→o。
が成立することが,事前測定姦の定義(4.6)よりただちに導かれる。
かくして,補題4.1によって,Xはμ∈Mの殆んど許容的な推定量であることが示さ れた。ところが,損失関数L(μ,d(X))はd(X)に関し狭義の凸関数である。また,
几。(A)>0を満たすすべてのμo∈MとすべてのA∈BM について
ξ({μ「P.(A)>0}>0
が成立する。したがって,補題4.2によってXは許容的である。
かくして,定理4.1の証明は完結された。
献 日 文厄
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
Arnold, S.F.(1981). The Theory of Linear Models and Multivariate Analysis,
John Wiley and Sons, New York.
James, W. and Stein, C.(1961). Estimation with quadratic loss, Proc. Fourth Berkeley Symp. Math. Statist. Prob., Berkeley and Los Angeles, Univ. of California Press,2,361−379.
Johnstone,1.(1988). On inadmissibility of some unbiased estimates of loss,
Statistical Decision Theory and Related Topis IV,361−379, Gupta, S.S. and Berger,
J.D. Eds.,Springer−Verlag.
Lehmann, E.L.(1991). Theory of Point Estimation, Wadsworth and Brooks,
Pacific Grove.
Noda, K. and Wu, Q.G.(1998). Admissibility and r−−minimaxity of loss estimators in multivar三ate linear mode1, to appear in Systems Science and Mathematical Science,11.
Ping, C.(1982). Adlnissibility of simultaneous estimation of several parameters,
J.Sys. Sci. and Math. Scis.2(3),176−195.
Shinozaki, N.(1975). Astudy of generalized inverse of matrix and estimation with guadratic loss. Ph.D. thesis submitted to the Keio University.
Wu, Q.G.(1993). Inadmissibility and adlnissibility results for unbiased loss estimators based on Gauss−Markov estimators, Acta Mathematicae Applicatae Sinica 9,281−288.
Xie, M.(1993). All admissible linear estimates of the mean matrix,
J.MultiVariate Anal. 44,220−226.