• 検索結果がありません。

PDF 測度論的確率論 2015 Kengo Kato

N/A
N/A
Protected

Academic year: 2018

シェア "PDF 測度論的確率論 2015 Kengo Kato"

Copied!
9
0
0

読み込み中.... (全文を見る)

全文

(1)

非負行列とマルコフ・チェインの収束

作成:加藤賢悟1  非負行列とは成分がすべて非負実数の行列のことを指す.本ノートの目標は,非負行列 に関する基本的な定理であるPerron-Frobenius定理を証明することである.経済学にお

いては,Perron-Frobenius定理は産業連関分析に応用され,かつては大きな関心をもたれ

てたいたようである(二階堂 (1959)を参照せよ).そのほかに,有限状態空間上の強既約 マルコフ・チェインの定常分布への収束の証明にも応用される.Perron-Frobenius定理は 最近になって,Googleが運営するPageRankの性能保証に応用されているが判明し,再 び脚光を浴びている印象である(Bryan and Leise (2006)を参照せよ).

本論に入る前に,いくつかの定義を紹介する.既に述べたように,成分がすべて非負実 数の行列を 非負行列 と呼ぶ.行列Aが非負行列であることを,A ≥ Oと書く.また成 分がすべて正実数の行列を 正行列 と呼ぶ.Aが正行列であることを,A > Oと書く.非 負ベクトル,正ベクトルに関しても同様に定義する.同じサイズの行列A, Bに対して, A − B ≥ OならA ≥ B,A − B > OならA > Bと書く.数ベクトルに対しても同様の 記法を用いる.以下,とくに断らなければ,行列はすべてn次実正方行列とし,ベクトル はRnのベクトルとする.∥ · ∥をRnの標準ノルムとする:∥x∥2= xtx.また1を並べた Rnのベクトルを1と書く:1= (1, . . . , 1)t.

Perron-Frobenius定理

まず非負行列に対するPerron-Frobenius定理を証明する.

定理 1 (非負行列に対するPerron-Frobenius定理). 任意の非負正方行列Aに対して,次 の性質をみたす非負固有値λ(A)が存在する.

(1) λ(A)に属する固有ベクトルとして非負ベクトルをとれる.

(2) Aのそのほかの固有値の絶対値はλ(A)を超えない.

定理1のλ(A)をAのFrobenius根 と呼ぶ.一般に固有値の絶対値の最大値をスペクト ル半径と呼ぶが,(2)よりFrobenius根λ(A)はAのスペクトル半径に等しい.

定理 1の証明に移る.まず次の補題を示す.

補題 1. Aを非負正方行列とし,あるx≥ 0に対して,(I − A)x > 0とする.このとき (I − A)は正則であり,

(I − A)−1 = I + A + A2+ · · ·

と展開できる.ただし,右辺は成分ごとの収束を意味する.とくに,(I − A)−1≥ O.

1東京大学大学院経済学研究科.〒113-0033東京都文京区本郷7-3-1. E-mail: [email protected].

(2)

証明. (I − A)x = yを書き直すと,

x= Ax + y = A(Ax + y) + y = A2x+ (I + A)y

= · · · = ANx+ (I + A + · · · + AN −1)

| {z }

=BN

y

と展開できる.BN = (b(N )ij )とおくと,各(i, j)に対して,数列(b(N )ij )N ∈Nは単調非減少で あり,nj=1b(N )ij yj ≤ xi (i = 1, . . . , n)をみたす.yは正ベクトルより,b(N )ij はN に関し て有界なので,N → ∞のとき収束する:BN → B. このとき(I − A)BN = I − AN → I より,(I − A)B = Iを得る.ゆえに(I − A)は正則であり,(I − A)−1= B.

定理 1の証明. 集合M (A) ⊂ (0, +∞)を

M (A) = {ρ > 0 : (ρI − A)は正則 & (ρI − A)−1 ≥ O}

と定義すると,ρ > 0に対して(ρI − A)x > 0なるx ≥ 0が存在すれば,補題 1より ρ ∈ M (A).逆に(ρI − A)−1≥ Oなら,任意のy> 0に対してx= (ρI − A)−1y≥ 0と おくと,(ρI − A)x = y > 0となる.ゆえに,ρ > 0に対して,

ρ ∈ M (A) ⇔ ∃x ≥ 0 s.t. (ρI − A)x > 0.

ここで,十分大きなρ > 0に対してはρ1 > A1となるから,M (A) ̸= ∅.そこで, λ = inf M (A)

とおいて,λがAのFrobenius根になることを示す.

ステップ 1. まずM (A) = (λ, +∞)となることを示す.ρ ∈ M (A), µ > ρ なら, (ρI − A)x > 0なるx≥ 0に対して,(µI − A)x = (µ − ρ)x + (ρI − A)x > 0だから,µ ∈ M (A).ゆえにM (A)は[λ, +∞)か(λ, +∞)のいずれかである.いま,仮にあるx≥ 0に対 して(λI − A)x > 0なら,λx ≥ (λI − A)x > 0より,x> 0となる.y= (λI − A)x (> 0) とおくと,0 < ϵ < min1≤i≤nyi/xi(≤ λ)に対して,{(λ−ϵ)I −A}x = (λI −A)x−ϵx > 0 となるが,このときλ − ϵ ∈ M (A)となり,λの定義に反する.従って,λ /∈ M (A)だか ら,M (A) = (λ, +∞)を得る.

ステップ 2. あるx≥ 0, x ̸= 0が存在して,Ax = λxとなることを示す.ρN ↓ λなる 数列ρN をとる.このとき(ρNI − A)−11̸= 0より,

ϵN = 1/∥(ρNI − A)−11∥, xN = ϵNNI − A)−11

とおくと,xN ≥ 0, ∥xN∥ = 1, (ρNI − A)xN = ϵN1.ここで集合{x ∈ Rn : ∥x∥ = 1} はコンパクトだから,Boltzano-Weierstrassの定理より,xN は収束部分列xNk をもつ: xNk → x ≥ 0, ∥x∥ = 1. いま

NkI − A)xNk = ϵNk1

(3)

の左辺の各成分はk → ∞のとき収束するので,ϵNkも収束する:ϵNk → ϵ. ゆえに (λI − A)x = ϵ1

が成り立つ.λ /∈ M (A)より,ϵ > 0はありえないので,(λI − A)x = 0を得る.

ステップ 3. 最後に,µをAの任意の固有値としたとき,|µ| ≤ λを示す.zをµに 属する固有ベクトルとすると,Az = µzより,nk=1ajk|zk| ≥ |µ||zj| (j = 1, . . . , n).

|z| = (|z1|, . . . , |zn|)tとおくと,(|µ|I − A)|z| ≤ 0. このとき(|µ|I − A)は特異か,正 則だとしても(|µ|I − A)−1 ≥ Oにはならない(∵ 仮に(|µ|I − A)−1 ≥ Oなら,|z| = (|µ|I − A)−1(|µ|I − A)|z| ≤ 0となり矛盾).ゆえに|µ| /∈ M (A)より,|µ| ≤ λを得る.

Frobenius根はANのN → ∞のときの漸近挙動に関する閾値を与える.

1. ρ > λ(A)なら,N → ∞のとき,(A/ρ)N → O. 一方,0 < ρ < λ(A)なら,(A/ρ)N の成分のうち少なくとも1つは+∞に発散する.

証明. ρ > λ(A)なら,(ρI − A)−1= ρ−1(I − ρ−1A)−1 ≥ O. ゆえに補題1をA/ρに適用 して,(A/ρ)N → O.一方,0 < ρ < λ(A) = λなら,Ax = λxなるx≥ 0をとると,

A ρx=

λ ρx,

( A ρ

)N

x=( λ ρ

)N

x.

(λ/ρ)N → +∞より,(A/ρ)N の成分のうち少なくとも1つは+∞に発散する. ρ = λ(A) = λのときは,(A/λ)N は収束するとは限らない.例えば,

A = (0 1

1 0 )

とすると,Aの固有値は±1だから,そのFrobenius根は1であるが,N が奇数のとき AN = A, Nが偶数のときAN = I2となるから,AN はN → ∞とき収束しない.しかし ある正整数mに対してAmが正行列になれば,(A/λ)Nはある行列に収束する.その前に 正行列に対するPerron-Frobenius定理を証明する.

定理 2 (正行列に対するPerron-Frobenius定理). Aが正行列なら,λ = λ(A)に対して, 次の(1)–(4)が成り立つ:

(1) λ > 0.

(2) λに属する固有ベクトルとして,正ベクトルx> 0をとれる.

(3) Aのそのほかの固有値の絶対値はλより小さい.

(4) λに属する固有空間は1次元である.

(4)

証明. (1). ρ > 0を十分小さくとると,(ρI − A)のある行の成分はすべて負になる.この とき任意のx≥ 0に対して,(ρI − A)xのその行に対応する成分は正になりえない.ゆえ にρ /∈ M (A)より,λ ≥ ρ > 0.

(2). x ≥ 0をλに属する非負固有ベクトルとすると,

x= Ax λ > 0.

(3). AtはAと同じ固有値の組をもつ正行列であるから,λ(At) = λ(A)となる.y> 0 をλに属するAtの正固有ベクトルとする.いま仮に|µ| = λなるAの固有値µが存在す るとして,µ = λを示す.zをµに属するAの固有ベクトルとする.|z| = (|z1|, . . . , |zn|)t とおくと,|µ||z| ≤ A|z|より,

|µ|yt|z| ≤ ytA|z| = (Ay)t|z| = λyt|z|. (*) (*)の両辺は等号が成立して,y> 0より,|µ||z| = A|z|となる.さらに,A > Oである から,z1, . . . , znはすべて同じ偏角θをもつ:z = e|z|. w = e−iθzとおくと,wはµに 属するAの非負固有ベクトルである:Aw = µw, w ≥ 0. ゆえに,

λytw= ytAw = µytw. y> 0, w ≥ 0より,ytw> 0だから,µ = λを得る.

(4). zをλに属する任意の固有ベクトルとする:Az = λz. w = x − czなるベクト ルを考えると,Aw = λwとなる.そこでcをwの1つの成分が0となり,かつw≥ 0 となるように選ぶ.仮にw̸= 0なら,wはλに属する固有ベクトルとなるが,このとき w= Aw/λ > 0となり,矛盾が生じる.ゆえにw= 0,すなわち,z= cx.

Aが正行列という仮定は緩めることができる.

2. A ≥ Oはある正整数mに対してAm > Oをみたすとする.このときλ = λ(A)に 対して,定理 2の(1)–(4)が成り立つ.

証明. λ(Am) = λm > 0より,λ > 0.またx≥ 0をλに属するAの固有ベクトルとする と,Ax = λx, Amx= λmx. ゆえにx= Amx/λm > 0. 次にµをλとは異なるAの任意 の固有値とし,zをµに属する固有ベクトルとすると,Az = µz, Amz= µmz. Am > O より,|µ|m = |µm| < λmだから,|µ| < λ. 最後にwをλに属する任意の固有ベクトルと すると,Amw= λmw. いまAm> Oよりwはxのスカラー倍になる.

定理 3. A ≥ Oはある正整数mに対してAm > Oをみたすとする.またλ = λ(A)とお く.このとき次をみたす一意な正ベクトルの組x, y > 0が存在する:

Ax = λx, Aty= λy, ytx= 1, lim

N →∞

( A λ

)N

= xyt.

(5)

証明. (At)m = (Am)tより,λに属するAtの固有空間の次元は1である.ゆえにAx = λx, Aty = λy, ytx = 1をみたす正ベクトルの組x, y > 0が一意に存在する.あとは limN →∞(A/λ)N = xytを示せばよい.

まずm = 1とする.このときA > Oだから,c > 0を十分小さく選んで,Ac = A−cxyt> Oとできる.すると(λI − Ac)x = {(λI − A) + cxyt}x = cx > 0より,λ > λ(Ac). ゆ

えに ( Ac

λ )N

→ O.

いまB = A − λxytとおくと,B2 = (A − λxyt)(A − λxyt) = A2− λ(xytA + Axyt) + λ2x(ytx)yt= A2−λ2xyt. 帰納的にBN = AN−λNxytを得る.一方,B = Ac−(λ−c)xyt とも表せて,Acx= (λ − c)x, Atcy= (λ − c)yを用いると,BN = ANc − (λ − c)Nxytと なる.ゆえに

( B λ

)N

=( Ac λ

)N

( λ − c λ

)N

xyt→ O

より, ( A

λ )N

=( B λ

)N

+ xyt→ xyt を得る.

mが一般の正整数のときは,λ(Am) = λm, Amx = λmx, (Am)ty = λmy より, (Amm)N → xytが成り立つ.Nをmで割った商をqN,余りをrN とおくと,

( A λ

)N

=( A

m

λm )qN

×( A λ

)rN

.

ここで,(Amm)qN → xytより,∆N = (Amm)qN − xytとおくと,(Amm)qN = xyt+ ∆N, ∆N → O. 一方,0 ≤ rN ≤ k − 1だから,∆N(A/λ)rN → O. ゆえに

( A λ

)N

= xyt×A

rN

λrN + ∆N ( A

λ )rN

= xyt+ ∆N( A

λ )rN

→ xyt を得る.

マルコフ・チェイン

Perron-Frobenius定理の応用として,強既約マルコフ・チェインの定常分布への収束を

証明する.n次非負正方行列P = (pij)が 確率行列 (stochastic matrix)であるとは,

n j=1

pij = 1, i = 1, . . . , n

(6)

が成り立つことを言う.確率行列Pに対して,{1, . . . , n}に値をとる確率変数列X0, X1, . . . , XN, . . . が推移行列P をもつ マルコフ・チェイン(Markov chain)であるとは,

P(XN +1= j | XN = iN, . . . , X0= i0)

= P(XN +1= j | XN = iN) = piNj, ∀i0, , . . . , iN, j ∈ {1, . . . , n}; ∀N = 0, 1, 2, . . . が成り立つことを言う.マルコフ・チェインは一期先の値が現在の値 のみ に依存して確 率的に決まる数学モデルである.本ノートではマルコフ・チェインのいろいろな例や一般 論を紹介する余裕はないので,これらのことに関心がある場合は,適当な文献(例えば, Billingsley (1995)のSection 1.8)を参照すること.

マルコフ・チェイン(XN)に対して,初期値X0の分布を 初期分布(initial distribution) と呼ぶ.X0は{1, . . . , n}に値をとるので,X0の分布はRnのベクトル

ν = (ν1, . . . , νn)t= (P(X0 = 1), P(X0= 2), . . . , P(X0= n))t と同一視できて,νは

ν ≥ 0, νt1= 1 (1)

をみたす.(1)をみたすベクトルを 確率ベクトル (stochastic vector)と呼ぶ.初期分布が 決まると,XN の分布は

P(XN = j) =

iN

1

P(XN = j | XN −1= iN −1)P(XN −1= iN −1)

=

iN1,im2

P(XN = j | XN −1= iN −1)P(XN −1| Xm−2 = im−2)P(Xm−2= im−2)

= · · · =

iN

1,...,i1,i0

P(XN = j | XN −1= iN −1) · · · P(X1 = i1| X0 = i0)P(X0 = i0)

=

iN

1,...,i1,i0

piN1j· · · pi0i1νi0 =

i0,i1,...,iN

1

νi0pi0i1· · · piN1j

と計算できる.最右辺はνtPN の第j行だから,N → ∞のときのXNの挙動を調べるに

は,PNのN → ∞のときの挙動を調べればよい.なお,任意の確率ベクトルと確率行列

に対して,それらを初期分布と推移行列にもつマルコフ・チェインの存在が知られている (Billingsley, 1995, Theorem 8.1).

確率ベクトルπがP の 定常分布 (stationary distribution)であるとは, πtP = πt

が成り立つことを言う.推移行列が定常分布πをもつとき,πをマルコフ・チェインの定 常分布と呼ぶ.また確率行列P が 強既約(strongly irreducible)であるとは,ある正整数 mに対して,Pm > Oとなることを言う.推移行列が強既約なとき,マルコフ・チェイン を強既約と呼ぶ.

(7)

定理 4. 強既約な確率行列P = (pij)に対して,一意な定常分布π= (πi) > 0が存在して, N → ∞のとき,

PN → 1πt (*)

が成り立つ.さらに(*)の収束は指数的に速い:ある0 < c ≤ 1が存在して,

1≤i,j≤nmax |(P

N)

ij− πj| ≤ (1 − c)⌊N/m⌋, ∀N ≥ m (*2) が成り立つ.ただし,⌊a⌋はaを超えない最大の整数である.

証明. Pは確率行列だから,P 1 = 1より,固有値1とそれに属する固有ベクトル1をも つ.さらにP の任意の固有値µに対して,µに属する固有ベクトルをx = (x1, . . . , xn)t として,P x = µxの第i行を比較すると,

|µ| · |xi| ≤

n j=1

pij|xj| ≤ max

1≤j≤n|xj|

n j=1

pij = max

1≤j≤n|xj|.

左辺を1 ≤ i ≤ nに関して最大値をとって,|µ| ≤ 1を得る.ゆえにP のFrobenius根は 1であるから,定理3より,一意な定常分布π > 0の存在と収束(*)が従う.次に(*2)を 示す.P= 1πtとおくと,π > 0よりP> Oである.

P P= P 1πt= 1πt= P, PP = 1πtP = 1πt= P に注意する.いま

c = min

1≤i,j≤n(P m)

ij/(P)ij > 0

とおくと,(Pm)ij ≥ c(P)ij (∀i, j)であり,jに関して和をとると,c ≤ 1である.c = 1な らPm = Pであり,このとき任意のN ≥ mに対して,PN = PN −mPm= PN −mP= Pとなる.ゆえにc < 1の場合を考える.ここで

Q = 1 1 − c(P

m− cP)

とおくと,Qも確率行列であり,QP= PQ = Pをみたす.このとき(Q − P)N = QN − Pとなるから,左辺の成分の絶対値はすべて1以下である.さらに

Pm− P= (1 − c)(Q − P),

PN m− P= (Pm− P)N = (1 − c)N(Q − P)N であるから,

1≤i,j≤nmax |(P

N m)

ij− (P)ij| ≤ (1 − c)N

(8)

を得る.行列A = (aij)に対して,∥A∥ = maxi,j|aij|と定めると,PN +1− P = P (PN − P)なる関係より,

(PN +1− P)ij =

k

pik(PN − P)kj ≤ (

k

pik )

∥PN − P= ∥PN − P.

ゆえに,

N 7→ ∥PN − P

は単調非増加であるから,∥PN − P≤ (1 − c)⌊N/m⌋を得る.

定理4の意味を述べる.(XN)を初期分布ν,推移行列Pをもつマルコフ・チェインとす ると,XNの分布はRnの横ベクトルと同一視すると,νtPNである.いまマルコフ・チェ インが強既約なら,一意な定常分布πが存在して,N → ∞のとき,

νtPN → νtt= πt

となる.πはνによらず決まるから,これは初期分布に関わらずXNの分布が定常分布π に収束することを意味する.さらにその収束は指数的に速い:

1≤j≤nmax |P(XN = j) − πj| ≤ (1 − c)⌊N/m⌋, N ≥ m.

もちろん具体的なマルコフ・チェインに対しては,定数cの値も重要になってくるが,そ の精密な評価にはまったく異なったテクニックが必要である.詳細はSaloff-Coste (1997) を参照せよ.なお(*2)の証明はSaloff-Coste (1997, Theorem 2.1)の証明を参考にした.

コメント

非負行列をカバーしてるいる線形代数の教科書はそれなりにある.例えば,斎藤(1966), 竹内(1966),Horn and Johnson (1990),室田・杉原 (2013)などである.そのほかだと, 二階堂(1959, 1961)が非負行列を詳細に扱っている.Perron-Frobenius定理の経済学にお ける意義に関しては二階堂(1959)が参考になる.本ノートの前半部分は竹内 (1966)を参 考にした.

なお,定理2はより一般に既約な非負行列に対して成り立つ.既約性の定義はいくつか あるが,非負正方行列Aが既約であるとは,各(i, j)に対して,ある正整数mが存在して, (Am)ij > 0となることを言う.mは(i, j)に依存してよい.定理 2の直前に現れる行列の 例は,既約であるが,Am> Oとなるmは存在しない(従って,既約なだけでは定理3は 成り立たない).ただ議論が複雑になるのを避けるために,既約な場合のPerron-Frobenius 定理は扱わなかった.詳細は前述の参考文献を参照されたい.

(9)

参考文献

Billingsley, P. (1995). Probability and Measures (3rd edition). Wiley.

Bryan, C. and Leise, T. (2006). The 25,000,000,000 eigenvector: the linear algebra behind Google. SIAM Review 48 569–581.

Horn, R.A. and Johnson, C.R. (1990). Matrix Analysis. Cambridge University Press. Saloff-Coste, L. (1997). Lectures on finite Markov chains. In: ´Ecole d’ ´Et´e de Probabilit´es

de Saint-Flour XXVI (Lecture Notes in Mathematics 1665), Springer, 301–413. 斎藤正彦.(1966).「線型代数入門」.東京大学出版会.

竹内啓.(1966).「線形数学」.培風館.

二階堂副包.(1959).「現代経済学の数学的方法」.岩波書店. 二階堂副包.(1961).「経済のための線型代数」.培風館. 室田一雄・杉原正顯.(2013).「線形代数II」.丸善出版.

参照

関連したドキュメント

Tschinkel, Height zeta functions of toric bundles over flag varieties, Selecta Math. Tate, Fourier analysis in number fields, and Hecke’s zeta-functions, 1967 Algebraic Number

Saito, Kato homology of arithmetic schemes and higher class field theory, Documenta Math. Saito, Kato conjecture and motivic cohomology over finite

2 E-LOCA を仮定した場合でも,ECCS 系による注水流量では足りないほどの原子炉冷却材の流出が考

地震 想定D 8.0 74 75 25000 ポアソン 海域の補正係数を用いる震源 地震規模と活動度から算定した値

   騒音:伝播 ぱ

・ 津波高さが 4.8m 以上~ 6.5m 未満 ( 津波シナリオ区分 3) において,原

年度 2013 2014 2015 2016 2017 2018 2019.

炉心損傷 事故シーケンスPCV破損時期RPV圧力炉心損傷時期電源確保プラント損傷状態 後期 TW 炉心損傷前 早期 後期 長期TB 高圧電源確保 TQUX 早期 TBU