.
.
.. .
.
.
Perturbation method for determining the group of
invariance of hierarchical models
清 智也1 青木 敏2 竹村 彰通1
1東京大学 2鹿児島大学
概要
例:2× 3分割表 p11 p12 p13 p21 p22 p23 (pij ≥ 0, ∑ i;jpij = 1).独立性:pij = aibj ⇔ log pij = αi+ βj.
(log pij) (αi) (βj)
行を入れ替えても,独立という構造は不変.(置換(1, j)↔ (2, j))
概要
構造が不変に保たれない置換の例:
行の構造だけは保たれている. 独立モデル以外の場合も考えてみる.
概要
m元分割表:(pi1´´´im)∈ R I1ˆ´´´ˆIm. 対数線形モデル:(log pi1´´´im)∈ L, ここでLは線形部分空間. 例:独立モデルではL ={(αi+ βj)}. 置換群 SI1ˆ´´´ˆIm. .Problem (Aoki & Takemura 2008, J. Symbolic Comput.)
. . . .. . . . 部分空間Lを不変に保つような部分群G⊂ SI1ˆ´´´ˆImを決定せよ. マルコフ基底を調べる上でも重要. 本講演では,階層モデルに対する結果を示す.
詳細は→Sei, T., Aoki, S. and Takemura, A. (2009). Perturbation method for determining the group of invariance of hierarchical models, Advances in Applied Mathematics, 43 (4), 375–389.
目次
. . . 1 背景:マルコフ基底 . . . 2 不変群 (setwise stabilizer) . . . 3 階層モデル . . . 4 主定理と例 . . . 5 数独分割表 . . . 6 まとめ 清 智也 (情報理工) 計算代数統計学の展開 2009/11/27 5 / 31背景:マルコフ基底
マルコフ基底
対数線形モデルのマルコフ基底について簡単に復習する. セル集合 I =∏mj=1Ij, Ij = {1, . . . , Ij}. (pi)i2I:I上の確率分布. 対数線形モデルpi = ∏K k=1q Ak(i) k (⇔ (log pi)∈ span(Ak)) ファイバーF(t) = {x | ∑iAk(i)xi = tk} を連結にするのがマル コフ基底. Remark: 対数線形モデルは多項式環の準同型と見なせる: K[p] 3 ∏ i pxi i 7→ ∏ k ( q P iAk(i)xi k ) ∈ K[q]. この準同型の核(トーリックイデアル)がマルコフ基底に対応する. グレブナー基底計算に帰着(Diaconis & Strumfels 1998).背景:マルコフ基底
マルコフ基底(例)
2元分割表の独立モデルのマルコフ基底を確認しておく. ファイバー=十分統計量が与えられた下での可能な分割表の集合 独立モデルの十分統計量はxi+とx+jだったので, F({ri}, {cj}) = {{xij} | xi+ = ri, x+j= cj}. move: 十分統計量が等しい2つの分割表の差. F({ri}, {cj})は,次のmove だけで動き回ることができる: M(i, i0, j, j0) = j j0 i +1 −1 i0 −1 +1 つまり,集合{M(i, i0, j, j0)} がマルコフ基底(の1つ). 行・列の入れ替えを考えると,本質的にはM(1, 2, 1, 2)のみ.背景:マルコフ基底
階層モデルのマルコフ基底
階層モデルは対数線形モデルの特殊ケース(後で定義). 例:条件付独立モデル {{1, 2}, {2, 3}} log pijk = αij+ βjk マルコフ基底M = (zijk)は,あるj0について (zijk)j=j0 = → k ↓ i 1 −1 −1 1 , (その他のセルは零)というものだけ考えればOK. 分解可能モデルなら同様に求まる(Dobra 2003他).分解可能でないモデルはとても難しい(Aoki & Takemura 2003 他)
背景:マルコフ基底
階層モデルのマルコフ基底
例:無3因子交互作用モデルlog pijk = αij + βjk+ γik.
Table: 3× 3 × K 分割表に対する一意最小マルコフ基底と簡約グレブナー
基底の個数 (Aoki & Takemura 2003)
K 3 4 5 6 7 # unique minimal MB 81 450 2670 10665 31815 # reduced GB 110 622 3240 12085 34790 # orbits in the MB 4 5 6 6 6 → 水準を並べ替えても異なるマルコフ基底は6個だけ. 記憶領域の軽減.
不変群 (setwise stabilizer)
不変群
セル集合 I =∏mj=1Ij, Ij = {1, . . . , Ij}. 対数線形モデル(log pi)i2I ∈ L. セルの置換全体を SI と書く.SI ={g : I → I | one to one}. g ∈ SI は自然にRI へ作用する: (gx)i = xg`1(i). 左からの作用である:g(hx) = (gh)x. 線形部分空間 Lにも g は作用する: gL := {gx | x ∈ L}. Lの不変群(setwise stabilizer) GL := {g ∈ SI | gL = L}. 清 智也 (情報理工) 計算代数統計学の展開 2009/11/27 10 / 31不変群 (setwise stabilizer)
不変群
不変群 GL ={g ∈ SI | gL = L} は,Lの構造を不変に保つ. マルコフ基底の記憶領域軽減に有用.
.
Problem (Aoki & Takemura 2008再掲)
. . . .. . . . いろいろなモデル Lに対し,GLを決定せよ. Remark GL = GL?.ここでL? ={x | ∑ ixiyi = 0, y ∈ L}(双対空間). 対数線形モデルの場合 L? = ker A. モデル Lのmove(特にマルコフ基底)は ker A の元であるから, GL は不変なマルコフ基底を定める.
不変群 (setwise stabilizer)
既存の結果
完全独立モデルの場合(F = {{1}, . . . , {m}}),不変群は直積群 と因子の入れ替えから生成される(Aoki & Takemura, JSC2008):
GL = ( SI1 × · · · × SIm, (τjj0)Ij=I0j ) ただしτjj0 : (· · · , ij,· · · , ij0,· · · ) 7→ (· · · , ij0,· · · , ij,· · · )は因子 の入れ替えである. また同論文では, .
.
. 1 無 3 因子交互作用モデル(F = {{1, 2}, {1, 3}, {2, 3}}) ..
. 2 Hardy-Weinbergモデル( /∈ 階層モデル) についても不変群を求めている. 清 智也 (情報理工) 計算代数統計学の展開 2009/11/27 12 / 31不変群 (setwise stabilizer)
例
2元独立モデル log pij = αi+ βj. |I1| 6= |I2|の場合,不変群はGr(∆) = SI1× SI2,つまり行置換, 列置換の直積となる. 行置換:階層モデル
階層モデルの定義
例えば Lauritzen (1996). m: 分割表の因子数.m元分割表. Ij ={1, . . . , Ij}: 第j因子の水準集合 (j = 1, . . . , m). I =∏m j=1Ij: セルの集合. ∆: [m] = {1, . . . , m}の単体的複体.交互作用全体. F := red(∆): ∆のファセット.生成集合. ——————————————————— 例えば,m = 3, ∆ ={∅, {1}, {2}, {3}, {1, 2}, {2, 3}}のとき, F = {{1, 2}, {2, 3}}. 1 2 3 清 智也 (情報理工) 計算代数統計学の展開 2009/11/27 14 / 31階層モデル
階層モデルの定義
. Definition . . . .. . . . 生成集合 F で指定される階層モデルとは,次の対数線形モデルである: (log pi)∈ LF := ∑ D2F LD, LD :={iDのみに依存するベクトル} .例えばm = 3, F = {{1, 2}, {2, 3}}のとき log pijk= αij+ βjk.
1
2
3
主定理と例
定理のための準備
1
:
wreath product
不変群 GF の具体系を主定理として述べる. まず準備をする. (SI1)I2 ={g : I 2→ SI1} =「I2に応じてI1を置換」 代数学では(SI1)I2 × S I2をwreath product(環積)と呼ぶ. より一般に,半順序集合Pに対して,∏2P(SI) A() をgeneralized wreath productという.ただしA(ρ)はρの先祖集合. 例:P = {1, 2, 3}, 1 < 2, 3 < 2のとき,(SI1)I2× SI2× (SI3)I2. 条件付き独立モデルlog pi1i2i3 = αi1i2+ βi2i3 を不変に保つ.
主定理と例
準備
2
:
pseudofactor poset
生成集合族F に付随した半順序集合Pを定義する.1
2
3
4
5
6
{1} {2} {5,6} {3} {4} 同値関係 i∼ jdef⇔ (∀D ∈ F (i ∈ D ⇔ j ∈ D)). P := [m]/ ∼.擬因子, pseudofactor. ρ, ρ0 ∈ P に対してρ≤ ρ0 def⇔ (∀D ∈ F (ρ ⊂ D ⇒ ρ0 ⊂ D)).主定理と例
準備
2
:
pseudofactor poset
Remark.
.
.
.1 pseudofactor poset P はintersection poset Q より情報が粗い:
F P Q 1 2 3 {1} {2} {3} {1,2} {1,3} {2,3} 1 2 3 φ 一般には単射準同型P → Q が存在する. .
.
.2 pseudofactor poset にならないposetが存在する:
. Problem (数学的興味) . . . .. . . .
posetが pseudofactor posetとなるための条件は?
主定理と例
主定理
すぐ例を出します. . Theorem (主定理) . . . .. . . . F を生成集合の族とするとき,下記正則条件の下で,不変群GF はリー ス積で表わされる. GF = ∏ 2P (SI)IA().ρ はpseudofactor poset, A(ρ)はρの先祖集合.
正則条件1:ID := ∏j2DIj (D∈ F) は互いに異なる. 正則条件2:高々一つのjを除いてIj ≥ 3.
主定理と例
例
1
m = 3, F = {{1, 2}, {2, 3}}. (条件付き独立モデル) 1 2 3 {1} {2} {3} 主定理より,不変群は GF = (SI1)I2 × S I2× (SI3)I 2. 清 智也 (情報理工) 計算代数統計学の展開 2009/11/27 20 / 31主定理と例
例
2
同一視できるマルコフ基底が増える例. m = 5, F = {{1, 3}, {2, 4}, {3, 4, 5}}とする.1
2
3
4
5
{1} {2} {5} {3} {4} これは分解可能モデル.不変群は GF = (SI1)I3× (S I2)I 4 × S I3× SI4× (SI5)If3;4g主定理と例
例
2 (
つづき
)
m = 5, F = {{1, 3}, {2, 4}, {3, 4, 5}}. GF = (SI1)If3g× (SI2)If4g× SI3 × SI4 × (SI5)I3;4. 次の2つのmoveはマルコフ基底に必ず含まれる (indispensable) M1 = (11111)(12211)− (12111)(11211), M2 = (11112)(12211)− (12112)(11211). M1とM2は,直積群の下では同一視できないが,不変群の下では同 一視できる. 「(i3i4) = (11)のときに限りi5 = 1, 2を置換する」 M1 = (11111)(12211)− (12111)(11211), M2 = (11112)(12211)− (12112)(11211). 清 智也 (情報理工) 計算代数統計学の展開 2009/11/27 22 / 31主定理と例
例
3
主定理は,グラフィカルでなくても成り立つ. m = 6, F = {{1, 4, 5}, {2, 5, 6}, {3, 4, 6}}. ({4, 5, 6} /∈ F). 1 2 3 4 5 6 {1} {2} {3} {4} {5} {6} GF = (SI1)If4;5g × (S I2)If5;6g × (SI3)If4;6g × SI4 × SI5 × SI6数独分割表
数独分割表
数独は9× 9分割表上のパズル. 各行,各列,各3× 3ブロックは1∼ 9の数字を唯一持つ. 1 2 3 4 5 6 7 8 9 4 5 6 7 8 9 1 2 3 7 8 9 1 2 3 4 5 6 2 3 1 5 6 4 8 9 7 5 6 4 8 9 7 2 3 1 8 9 7 2 3 1 5 6 4 3 1 2 6 4 5 9 7 8 6 4 5 9 7 8 3 1 2 9 7 8 3 1 2 6 4 5数独不変群(Russell & Jarvis 2006)
大きい 3 行の並べ替え. 小さい 3 行の並べ替え. 大きい 3 列の並べ替え. 小さい 3 列の並べ替え. 転置.
数独分割表
数独分割表
数独の解は34× 9分割表(xijklc)で定義できる (Lawrence lifting). 「ファイバー」xij++c = xi+k+c= x++klc= xijkl+ = 1.
階層モデルに対応. F = {{1, 2, 5}, {1, 3, 5}, {3, 4, 5}, {1, 2, 3, 4}}. 1 2 3 4 5 主定理の正則条件は満たさないが,不変群の部分集合は求まる: SI1× (SI2)I1 × S I3× (SI4)I 3 × S I5. 転置以外の並べ替えは自動的に求まった.
数独分割表
証明の概略
. Theorem (再掲) . . . .. . . . 正則条件の下で,GF =∏2P(SI)IA(). (包含関係⊃は常に成立.) 証明の道筋 ..
. 1 一般に次の等式が成り立つ(Bailey et al. 1983 からの帰結) : ∩ D2F GfDg = ∏ 2P (SI)IA() ..
. 2 よって,G F ⊂ ∩ D2FGfDgを示せば十分. ..
. 3 D0 = argmin D2F|ID| とし,GF ⊂ ∩ D2FnfD0gGfDg を示す. ..
. 4 またG F ⊂ GfD0gを示す.帰納法により証明完了. ステップ3, 4 でperturbation methodを用いる. 例で説明する. 清 智也 (情報理工) 計算代数統計学の展開 2009/11/27 26 / 31数独分割表
証明の概略
(
簡単ケース
1/3)
例として,I1× I2分割表の独立モデルF = {{1}, {2}} の不変群が GF = SI1 × SI2(直積群)で与えられることを証明してみる. I1 < I2とする.(例えばI1= 2, I2= 4) 次の分割表を考える(perturbation) x = 1 0 0 0 1 0 0 0 このとき,任意のg∈ GF に対して gx = 1 0 0 0 1 0 0 0 , 0 1 0 0 0 1 0 0 , · · · , 0 0 0 1 0 0 0 1 のいずれかであることが示せる.これを確認してみよう.数独分割表
証明の概略
(
簡単ケース
2/3)
分割表gxの中の「1」が縦に並んでいることを示す. もし,1が縦に並んでいなければ,一般性を失わずに gx = 1 ∗ ∗ ∗ 0 ∗ ∗ ∗ . (1) 一方,gx ∈ L = {(αi+ βj)}だから gx = α1+ β1 α1+ β2 α1+ β3 α1+ β4 α2+ β1 α2+ β2 α2+ β3 α2+ β4 1行目と2行目の差を取ると (gx)1·− (gx)2· = α1− α2 α1− α2 α1− α2 α1− α2 (2) (1), (2)よりgxの1行目が全部1となり,矛盾. 清 智也 (情報理工) 計算代数統計学の展開 2009/11/27 28 / 31数独分割表
証明の概略
(
簡単ケース
3/3)
ここまでで示したこと:g ∈ GF ならば g : 1 0 0 0 1 0 0 0 7→ 1 0 0 0 1 0 0 0 ,· · · , 0 0 0 1 0 0 0 1 これは g∈ Gf2g を意味する.あとは g∈ Gf1g が言えればよい. gは,部分空間N := LF ∩ L>f2g を不変に保つ.特に g −1 −1 −1 −11 1 1 1 ∈ N である(perturbation).これはg ∈ Gf1gを意味する. (証明終)まとめ
まとめと課題
まとめ 階層モデルの不変群を,正則条件のもとで決定した. 今後の課題は 定理の条件を緩めること.階層モデル以外の場合.e.g. structural zero, HSM,... pseudofactor poset の特徴づけ.
ありがとうございました.
まとめ
Bibliography
S. Aoki & A. Takemura (2003). Minimal basis for a connected Markov chain over 3ˆ 3 ˆ K contingency tables with fixed two-dimensional marginals. Aust. N. Z. J. Stardust., 45 (2), 229–249.
S. Aoki & A. Takemura (2008). The largest group of invariance for Markov bases and toric ideals. J. Symbolic Com-put., 43 (5), 342–358.
R. A. Bailey, C. E. Praeger, C. A. Rowley & T. P. Speed (1983). Generalized wreath products of permutation groups. Proc. London Math. Soc., 47 (3), 69–82. D. A. Cox. (2007). Gr¨obner basis tutorial. Part II. A sampler from recent
developments. (available from Cox’s homepage).
A. Dobra (2003). Markov bases for decomposable graphical models, Bernoulli, 9 (6), 1093–1108.
R. Fontana & M.-P. Rogantin (2008). Indicator function and sudoku designs, in press.
E. Russel & F. Jarvis (2006), Mathematics of Sudoku II, Preprint.
T. Sei, S. Aoki & A. Takemura (2008). Perturbation method for determining the group of invariance of hierarchical models, Advances in Applied Mathematics, 43 (4), 375–389. (arXiv:0808.2725v2)