非負行列とマルコフ・チェインの収束
作成:加藤賢悟1 非負行列とは成分がすべて非負実数の行列のことを指す.本ノートの目標は,非負行列 に関する基本的な定理であるPerron-Frobenius定理を証明することである.経済学にお
いては,Perron-Frobenius定理は産業連関分析に応用され,かつては大きな関心をもたれ
てたいたようである(二階堂 (1959)を参照せよ).そのほかに,有限状態空間上の強既約 マルコフ・チェインの定常分布への収束の証明にも応用される.Perron-Frobenius定理は 最近になって,Googleが運営するPageRankの性能保証に応用されているが判明し,再 び脚光を浴びている印象である(Bryan and Leise (2006)を参照せよ).
本論に入る前に,いくつかの定義を紹介する.既に述べたように,成分がすべて非負実 数の行列を 非負行列 と呼ぶ.行列Aが非負行列であることを,A ≥ Oと書く.また成 分がすべて正実数の行列を 正行列 と呼ぶ.Aが正行列であることを,A > Oと書く.非 負ベクトル,正ベクトルに関しても同様に定義する.同じサイズの行列A, Bに対して, A − B ≥ OならA ≥ B,A − B > OならA > Bと書く.数ベクトルに対しても同様の 記法を用いる.以下,とくに断らなければ,行列はすべてn次実正方行列とし,ベクトル はRnのベクトルとする.∥ · ∥をRnの標準ノルムとする:∥x∥2= xtx.また1を並べた Rnのベクトルを1と書く:1= (1, . . . , 1)t.
Perron-Frobenius定理
まず非負行列に対するPerron-Frobenius定理を証明する.
定理 1 (非負行列に対するPerron-Frobenius定理). 任意の非負正方行列Aに対して,次 の性質をみたす非負固有値λ(A)が存在する.
(1) λ(A)に属する固有ベクトルとして非負ベクトルをとれる.
(2) Aのそのほかの固有値の絶対値はλ(A)を超えない.
定理1のλ(A)をAのFrobenius根 と呼ぶ.一般に固有値の絶対値の最大値をスペクト ル半径と呼ぶが,(2)よりFrobenius根λ(A)はAのスペクトル半径に等しい.
定理 1の証明に移る.まず次の補題を示す.
補題 1. Aを非負正方行列とし,あるx≥ 0に対して,(I − A)x > 0とする.このとき (I − A)は正則であり,
(I − A)−1 = I + A + A2+ · · ·
と展開できる.ただし,右辺は成分ごとの収束を意味する.とくに,(I − A)−1≥ O.
1東京大学大学院経済学研究科.〒113-0033東京都文京区本郷7-3-1. E-mail: [email protected].
証明. (I − A)x = yを書き直すと,
x= Ax + y = A(Ax + y) + y = A2x+ (I + A)y
= · · · = ANx+ (I + A + · · · + AN −1)
| {z }
=BN
y
と展開できる.BN = (b(N )ij )とおくと,各(i, j)に対して,数列(b(N )ij )N ∈Nは単調非減少で あり,∑nj=1b(N )ij yj ≤ xi (i = 1, . . . , n)をみたす.yは正ベクトルより,b(N )ij はN に関し て有界なので,N → ∞のとき収束する:BN → B. このとき(I − A)BN = I − AN → I より,(I − A)B = Iを得る.ゆえに(I − A)は正則であり,(I − A)−1= B.
定理 1の証明. 集合M (A) ⊂ (0, +∞)を
M (A) = {ρ > 0 : (ρI − A)は正則 & (ρI − A)−1 ≥ O}
と定義すると,ρ > 0に対して(ρI − A)x > 0なるx ≥ 0が存在すれば,補題 1より ρ ∈ M (A).逆に(ρI − A)−1≥ Oなら,任意のy> 0に対してx= (ρI − A)−1y≥ 0と おくと,(ρI − A)x = y > 0となる.ゆえに,ρ > 0に対して,
ρ ∈ M (A) ⇔ ∃x ≥ 0 s.t. (ρI − A)x > 0.
ここで,十分大きなρ > 0に対してはρ1 > A1となるから,M (A) ̸= ∅.そこで, λ = inf M (A)
とおいて,λがAのFrobenius根になることを示す.
ステップ 1. まずM (A) = (λ, +∞)となることを示す.ρ ∈ M (A), µ > ρ なら, (ρI − A)x > 0なるx≥ 0に対して,(µI − A)x = (µ − ρ)x + (ρI − A)x > 0だから,µ ∈ M (A).ゆえにM (A)は[λ, +∞)か(λ, +∞)のいずれかである.いま,仮にあるx≥ 0に対 して(λI − A)x > 0なら,λx ≥ (λI − A)x > 0より,x> 0となる.y= (λI − A)x (> 0) とおくと,0 < ϵ < min1≤i≤nyi/xi(≤ λ)に対して,{(λ−ϵ)I −A}x = (λI −A)x−ϵx > 0 となるが,このときλ − ϵ ∈ M (A)となり,λの定義に反する.従って,λ /∈ M (A)だか ら,M (A) = (λ, +∞)を得る.
ステップ 2. あるx≥ 0, x ̸= 0が存在して,Ax = λxとなることを示す.ρN ↓ λなる 数列ρN をとる.このとき(ρNI − A)−11̸= 0より,
ϵN = 1/∥(ρNI − A)−11∥, xN = ϵN(ρNI − A)−11
とおくと,xN ≥ 0, ∥xN∥ = 1, (ρNI − A)xN = ϵN1.ここで集合{x ∈ Rn : ∥x∥ = 1} はコンパクトだから,Boltzano-Weierstrassの定理より,xN は収束部分列xNk をもつ: xNk → x ≥ 0, ∥x∥ = 1. いま
(ρNkI − A)xNk = ϵNk1
の左辺の各成分はk → ∞のとき収束するので,ϵNkも収束する:ϵNk → ϵ. ゆえに (λI − A)x = ϵ1
が成り立つ.λ /∈ M (A)より,ϵ > 0はありえないので,(λI − A)x = 0を得る.
ステップ 3. 最後に,µをAの任意の固有値としたとき,|µ| ≤ λを示す.zをµに 属する固有ベクトルとすると,Az = µzより,∑nk=1ajk|zk| ≥ |µ||zj| (j = 1, . . . , n).
|z| = (|z1|, . . . , |zn|)tとおくと,(|µ|I − A)|z| ≤ 0. このとき(|µ|I − A)は特異か,正 則だとしても(|µ|I − A)−1 ≥ Oにはならない(∵ 仮に(|µ|I − A)−1 ≥ Oなら,|z| = (|µ|I − A)−1(|µ|I − A)|z| ≤ 0となり矛盾).ゆえに|µ| /∈ M (A)より,|µ| ≤ λを得る.
Frobenius根はANのN → ∞のときの漸近挙動に関する閾値を与える.
系1. ρ > λ(A)なら,N → ∞のとき,(A/ρ)N → O. 一方,0 < ρ < λ(A)なら,(A/ρ)N の成分のうち少なくとも1つは+∞に発散する.
証明. ρ > λ(A)なら,(ρI − A)−1= ρ−1(I − ρ−1A)−1 ≥ O. ゆえに補題1をA/ρに適用 して,(A/ρ)N → O.一方,0 < ρ < λ(A) = λなら,Ax = λxなるx≥ 0をとると,
A ρx=
λ ρx,
( A ρ
)N
x=( λ ρ
)N
x.
(λ/ρ)N → +∞より,(A/ρ)N の成分のうち少なくとも1つは+∞に発散する. ρ = λ(A) = λのときは,(A/λ)N は収束するとは限らない.例えば,
A = (0 1
1 0 )
とすると,Aの固有値は±1だから,そのFrobenius根は1であるが,N が奇数のとき AN = A, Nが偶数のときAN = I2となるから,AN はN → ∞とき収束しない.しかし ある正整数mに対してAmが正行列になれば,(A/λ)Nはある行列に収束する.その前に 正行列に対するPerron-Frobenius定理を証明する.
定理 2 (正行列に対するPerron-Frobenius定理). Aが正行列なら,λ = λ(A)に対して, 次の(1)–(4)が成り立つ:
(1) λ > 0.
(2) λに属する固有ベクトルとして,正ベクトルx> 0をとれる.
(3) Aのそのほかの固有値の絶対値はλより小さい.
(4) λに属する固有空間は1次元である.
証明. (1). ρ > 0を十分小さくとると,(ρI − A)のある行の成分はすべて負になる.この とき任意のx≥ 0に対して,(ρI − A)xのその行に対応する成分は正になりえない.ゆえ にρ /∈ M (A)より,λ ≥ ρ > 0.
(2). x ≥ 0をλに属する非負固有ベクトルとすると,
x= Ax λ > 0.
(3). AtはAと同じ固有値の組をもつ正行列であるから,λ(At) = λ(A)となる.y> 0 をλに属するAtの正固有ベクトルとする.いま仮に|µ| = λなるAの固有値µが存在す るとして,µ = λを示す.zをµに属するAの固有ベクトルとする.|z| = (|z1|, . . . , |zn|)t とおくと,|µ||z| ≤ A|z|より,
|µ|yt|z| ≤ ytA|z| = (Ay)t|z| = λyt|z|. (*) (*)の両辺は等号が成立して,y> 0より,|µ||z| = A|z|となる.さらに,A > Oである から,z1, . . . , znはすべて同じ偏角θをもつ:z = eiθ|z|. w = e−iθzとおくと,wはµに 属するAの非負固有ベクトルである:Aw = µw, w ≥ 0. ゆえに,
λytw= ytAw = µytw. y> 0, w ≥ 0より,ytw> 0だから,µ = λを得る.
(4). zをλに属する任意の固有ベクトルとする:Az = λz. w = x − czなるベクト ルを考えると,Aw = λwとなる.そこでcをwの1つの成分が0となり,かつw≥ 0 となるように選ぶ.仮にw̸= 0なら,wはλに属する固有ベクトルとなるが,このとき w= Aw/λ > 0となり,矛盾が生じる.ゆえにw= 0,すなわち,z= cx.
Aが正行列という仮定は緩めることができる.
系 2. A ≥ Oはある正整数mに対してAm > Oをみたすとする.このときλ = λ(A)に 対して,定理 2の(1)–(4)が成り立つ.
証明. λ(Am) = λm > 0より,λ > 0.またx≥ 0をλに属するAの固有ベクトルとする と,Ax = λx, Amx= λmx. ゆえにx= Amx/λm > 0. 次にµをλとは異なるAの任意 の固有値とし,zをµに属する固有ベクトルとすると,Az = µz, Amz= µmz. Am > O より,|µ|m = |µm| < λmだから,|µ| < λ. 最後にwをλに属する任意の固有ベクトルと すると,Amw= λmw. いまAm> Oよりwはxのスカラー倍になる.
定理 3. A ≥ Oはある正整数mに対してAm > Oをみたすとする.またλ = λ(A)とお く.このとき次をみたす一意な正ベクトルの組x, y > 0が存在する:
Ax = λx, Aty= λy, ytx= 1, lim
N →∞
( A λ
)N
= xyt.
証明. (At)m = (Am)tより,λに属するAtの固有空間の次元は1である.ゆえにAx = λx, Aty = λy, ytx = 1をみたす正ベクトルの組x, y > 0が一意に存在する.あとは limN →∞(A/λ)N = xytを示せばよい.
まずm = 1とする.このときA > Oだから,c > 0を十分小さく選んで,Ac = A−cxyt> Oとできる.すると(λI − Ac)x = {(λI − A) + cxyt}x = cx > 0より,λ > λ(Ac). ゆ
えに ( Ac
λ )N
→ O.
いまB = A − λxytとおくと,B2 = (A − λxyt)(A − λxyt) = A2− λ(xytA + Axyt) + λ2x(ytx)yt= A2−λ2xyt. 帰納的にBN = AN−λNxytを得る.一方,B = Ac−(λ−c)xyt とも表せて,Acx= (λ − c)x, Atcy= (λ − c)yを用いると,BN = ANc − (λ − c)Nxytと なる.ゆえに
( B λ
)N
=( Ac λ
)N
−( λ − c λ
)N
xyt→ O
より, ( A
λ )N
=( B λ
)N
+ xyt→ xyt を得る.
mが一般の正整数のときは,λ(Am) = λm, Amx = λmx, (Am)ty = λmy より, (Am/λm)N → xytが成り立つ.Nをmで割った商をqN,余りをrN とおくと,
( A λ
)N
=( A
m
λm )qN
×( A λ
)rN
.
ここで,(Am/λm)qN → xytより,∆N = (Am/λm)qN − xytとおくと,(Am/λm)qN = xyt+ ∆N, ∆N → O. 一方,0 ≤ rN ≤ k − 1だから,∆N(A/λ)rN → O. ゆえに
( A λ
)N
= xyt×A
rN
λrN + ∆N ( A
λ )rN
= xyt+ ∆N( A
λ )rN
→ xyt を得る.
マルコフ・チェイン
Perron-Frobenius定理の応用として,強既約マルコフ・チェインの定常分布への収束を
証明する.n次非負正方行列P = (pij)が 確率行列 (stochastic matrix)であるとは,
∑n j=1
pij = 1, i = 1, . . . , n
が成り立つことを言う.確率行列Pに対して,{1, . . . , n}に値をとる確率変数列X0, X1, . . . , XN, . . . が推移行列P をもつ マルコフ・チェイン(Markov chain)であるとは,
P(XN +1= j | XN = iN, . . . , X0= i0)
= P(XN +1= j | XN = iN) = piNj, ∀i0, , . . . , iN, j ∈ {1, . . . , n}; ∀N = 0, 1, 2, . . . が成り立つことを言う.マルコフ・チェインは一期先の値が現在の値 のみ に依存して確 率的に決まる数学モデルである.本ノートではマルコフ・チェインのいろいろな例や一般 論を紹介する余裕はないので,これらのことに関心がある場合は,適当な文献(例えば, Billingsley (1995)のSection 1.8)を参照すること.
マルコフ・チェイン(XN)に対して,初期値X0の分布を 初期分布(initial distribution) と呼ぶ.X0は{1, . . . , n}に値をとるので,X0の分布はRnのベクトル
ν = (ν1, . . . , νn)t= (P(X0 = 1), P(X0= 2), . . . , P(X0= n))t と同一視できて,νは
ν ≥ 0, νt1= 1 (1)
をみたす.(1)をみたすベクトルを 確率ベクトル (stochastic vector)と呼ぶ.初期分布が 決まると,XN の分布は
P(XN = j) = ∑
iN
−1
P(XN = j | XN −1= iN −1)P(XN −1= iN −1)
= ∑
iN−1,im−2
P(XN = j | XN −1= iN −1)P(XN −1| Xm−2 = im−2)P(Xm−2= im−2)
= · · · = ∑
iN
−1,...,i1,i0
P(XN = j | XN −1= iN −1) · · · P(X1 = i1| X0 = i0)P(X0 = i0)
= ∑
iN
−1,...,i1,i0
piN−1j· · · pi0i1νi0 = ∑
i0,i1,...,iN
−1
νi0pi0i1· · · piN−1j
と計算できる.最右辺はνtPN の第j行だから,N → ∞のときのXNの挙動を調べるに
は,PNのN → ∞のときの挙動を調べればよい.なお,任意の確率ベクトルと確率行列
に対して,それらを初期分布と推移行列にもつマルコフ・チェインの存在が知られている (Billingsley, 1995, Theorem 8.1).
確率ベクトルπがP の 定常分布 (stationary distribution)であるとは, πtP = πt
が成り立つことを言う.推移行列が定常分布πをもつとき,πをマルコフ・チェインの定 常分布と呼ぶ.また確率行列P が 強既約(strongly irreducible)であるとは,ある正整数 mに対して,Pm > Oとなることを言う.推移行列が強既約なとき,マルコフ・チェイン を強既約と呼ぶ.
定理 4. 強既約な確率行列P = (pij)に対して,一意な定常分布π= (πi) > 0が存在して, N → ∞のとき,
PN → 1πt (*)
が成り立つ.さらに(*)の収束は指数的に速い:ある0 < c ≤ 1が存在して,
1≤i,j≤nmax |(P
N)
ij− πj| ≤ (1 − c)⌊N/m⌋, ∀N ≥ m (*2) が成り立つ.ただし,⌊a⌋はaを超えない最大の整数である.
証明. Pは確率行列だから,P 1 = 1より,固有値1とそれに属する固有ベクトル1をも つ.さらにP の任意の固有値µに対して,µに属する固有ベクトルをx = (x1, . . . , xn)t として,P x = µxの第i行を比較すると,
|µ| · |xi| ≤
∑n j=1
pij|xj| ≤ max
1≤j≤n|xj|
∑n j=1
pij = max
1≤j≤n|xj|.
左辺を1 ≤ i ≤ nに関して最大値をとって,|µ| ≤ 1を得る.ゆえにP のFrobenius根は 1であるから,定理3より,一意な定常分布π > 0の存在と収束(*)が従う.次に(*2)を 示す.P∞= 1πtとおくと,π > 0よりP∞> Oである.
P P∞= P 1πt= 1πt= P∞, P∞P = 1πtP = 1πt= P∞ に注意する.いま
c = min
1≤i,j≤n(P m)
ij/(P∞)ij > 0
とおくと,(Pm)ij ≥ c(P∞)ij (∀i, j)であり,jに関して和をとると,c ≤ 1である.c = 1な らPm = P∞であり,このとき任意のN ≥ mに対して,PN = PN −mPm= PN −mP∞= P∞となる.ゆえにc < 1の場合を考える.ここで
Q = 1 1 − c(P
m− cP∞)
とおくと,Qも確率行列であり,QP∞= P∞Q = P∞をみたす.このとき(Q − P∞)N = QN − P∞となるから,左辺の成分の絶対値はすべて1以下である.さらに
Pm− P∞= (1 − c)(Q − P∞),
PN m− P∞= (Pm− P∞)N = (1 − c)N(Q − P∞)N であるから,
1≤i,j≤nmax |(P
N m)
ij− (P∞)ij| ≤ (1 − c)N
を得る.行列A = (aij)に対して,∥A∥∞ = maxi,j|aij|と定めると,PN +1− P∞ = P (PN − P∞)なる関係より,
(PN +1− P∞)ij =∑
k
pik(PN − P∞)kj ≤ (
∑
k
pik )
∥PN − P∞∥∞= ∥PN − P∞∥∞.
ゆえに,
N 7→ ∥PN − P∞∥∞
は単調非増加であるから,∥PN − P∞∥∞≤ (1 − c)⌊N/m⌋を得る.
定理4の意味を述べる.(XN)を初期分布ν,推移行列Pをもつマルコフ・チェインとす ると,XNの分布はRnの横ベクトルと同一視すると,νtPNである.いまマルコフ・チェ インが強既約なら,一意な定常分布πが存在して,N → ∞のとき,
νtPN → νt1πt= πt
となる.πはνによらず決まるから,これは初期分布に関わらずXNの分布が定常分布π に収束することを意味する.さらにその収束は指数的に速い:
1≤j≤nmax |P(XN = j) − πj| ≤ (1 − c)⌊N/m⌋, N ≥ m.
もちろん具体的なマルコフ・チェインに対しては,定数cの値も重要になってくるが,そ の精密な評価にはまったく異なったテクニックが必要である.詳細はSaloff-Coste (1997) を参照せよ.なお(*2)の証明はSaloff-Coste (1997, Theorem 2.1)の証明を参考にした.
コメント
非負行列をカバーしてるいる線形代数の教科書はそれなりにある.例えば,斎藤(1966), 竹内(1966),Horn and Johnson (1990),室田・杉原 (2013)などである.そのほかだと, 二階堂(1959, 1961)が非負行列を詳細に扱っている.Perron-Frobenius定理の経済学にお ける意義に関しては二階堂(1959)が参考になる.本ノートの前半部分は竹内 (1966)を参 考にした.
なお,定理2はより一般に既約な非負行列に対して成り立つ.既約性の定義はいくつか あるが,非負正方行列Aが既約であるとは,各(i, j)に対して,ある正整数mが存在して, (Am)ij > 0となることを言う.mは(i, j)に依存してよい.定理 2の直前に現れる行列の 例は,既約であるが,Am> Oとなるmは存在しない(従って,既約なだけでは定理3は 成り立たない).ただ議論が複雑になるのを避けるために,既約な場合のPerron-Frobenius 定理は扱わなかった.詳細は前述の参考文献を参照されたい.
参考文献
Billingsley, P. (1995). Probability and Measures (3rd edition). Wiley.
Bryan, C. and Leise, T. (2006). The 25,000,000,000 eigenvector: the linear algebra behind Google. SIAM Review 48 569–581.
Horn, R.A. and Johnson, C.R. (1990). Matrix Analysis. Cambridge University Press. Saloff-Coste, L. (1997). Lectures on finite Markov chains. In: ´Ecole d’ ´Et´e de Probabilit´es
de Saint-Flour XXVI (Lecture Notes in Mathematics 1665), Springer, 301–413. 斎藤正彦.(1966).「線型代数入門」.東京大学出版会.
竹内啓.(1966).「線形数学」.培風館.
二階堂副包.(1959).「現代経済学の数学的方法」.岩波書店. 二階堂副包.(1961).「経済のための線型代数」.培風館. 室田一雄・杉原正顯.(2013).「線形代数II」.丸善出版.