著者 田中 靖人
雑誌名 經濟學論叢
巻 65
号 1
ページ 151‑164
発行年 2013‑07‑20
権利 同志社大學經濟學會
URL http://doi.org/10.14988/00027378
【論 説】
構成的数学による近似的なNash 均衡の存在証明
田 中 靖 人
概 要
本稿では近似的なBrouwerの不動点定理を用いて,プレイヤーの最適反応 が多価関数であるような戦略型ゲームにおける近似的なNash 均衡の存在を構 成的に,Bishop による構成的数学(Bishop & Bridges [1], Bridges & Richman [2], Bridges & Vˆıt¸a˘ [3])の観点から,証明する.近似的なNash 均衡とは各プレイヤー が選ぶ戦略がε> 0 の範囲で互いに最適反応(そのような戦略を近似的な最適反 応と呼ぶ)になっているような状態である.さらに,戦略が連続的に表され,
利得関数が擬凹性(quasi-concavity)を満たすゲームにおける近似的なNash 均 衡の存在を構成的に証明する1).
1 は じ め に
Brouwer の不動点定理が構成的に証明できないことはよく知られている2). したがって多価関数(あるいは対応)に関する角谷の不動点定理も,プレイヤー
1) 本 稿 は 拙 著“A proof of the existence of approximate Nash equilibrium in strategic game with multi-valued optimal responses by Sperner's lemma: A constructive analysis”, Mathematical Modelling and Applied Computing, Vol. 2, Research India Publications, 2011, pp. 309―319.に基づき主要定理の 証明を改良するとともに,新たな分析(戦略が連続的に表されるゲームにおける近似的なNash 均衡の分析)を追加したものである.この研究は科学研究費補助金基盤研究(C)20530165の 補助を受けている.
2) Kellogg et. al.[5]がBrouwerの不動点定理の「構成的」な証明を与えているとされるが,Bishop による構成的数学([1],[2],[3])の観点からは「構成的」な証明ではない.定理の1 次元のケー ス,すなわち中間値の定理が構成的に証明できないことを言えば十分であろう([2],[4]参照).
の最適反応が多価関数であるような戦略型ゲームにおけるNash 均衡の存在 も構成的に証明できない.一方,Brouwer の不動点定理の証明に用いられる
Sperner の補題は構成的に証明可能である.最近このSperner の補題を用いて
近似的なBrouwer の不動点定理(近似的な不動点の存在)の証明が与えられて
いる(Dalen[4],Veldman[6]参照)(近似的な不動点とは不動点に近い点ではなく不 動点の条件を近似的に満たす点である).不動点定理の構成的な証明とは,具体的 に不動点を見つけられるような証明でなければならない.「不動点が存在しな いと仮定すると矛盾が生じる.だから不動点は存在する」という背理法によ る証明は構成的な証明ではない.
本稿では近似的なBrouwer の不動点定理を用いて,プレイヤーの最適反応 が多価関数であるような戦略型ゲームにおける近似的なNash 均衡の存在を 構成的に証明する.近似的なNash 均衡とは各プレイヤーが選ぶ戦略が ε>0 の範囲で互いに最適反応(そのような戦略を近似的な最適反応と呼ぶ)になってい るような状態である.
さらに,戦略が連続的に表され,利得関数が擬凹性(quasi-concavity)を満た すゲームにおける近似的なNash均衡の存在を構成的に証明する.
2 戦略型ゲームにおける近似的なNash 均衡
n人のプレイヤーがそれぞれm個の純粋戦略の選択肢を持つ戦略型ゲーム を考える.m,nは2 以上で有限な正の整数である.そのようなゲームを有限 戦略型ゲームと呼ぶ.プレイヤーiの純粋戦略の集合をSiで示し,個々の純 粋戦略をsijで表す.各プレイヤーの混合戦略は純粋戦略の集合上の確率分布 で定義され,piで表される.すべてのpiの集合をPiで表す.Piはコンパクト かつ凸である.
構成的数学において集合がコンパクトであるとは,全有界(totally bounded)
かつ完備(complete)であることを意味する.まず集合の有限可算性(finite
enumerability)と集合に対するε-近似とを説明する.ある集合Sにつ いて有限な自然数Nと{1, 2, … , N }からSの上への(onto)写像が存 在するときSは有限可算(finitely enumerable)であると言う.そのとき S は高々N個の要素を持つ(ちょうどN個の要素を持つ場合は有限(finite)
であると言う).集合Sに対するε-近似とは,各々のp∈Sについて
|p-q|<εを満たす点qを含むようなSの部分集合である.|p-q|
はpとqとの距離を表す.各ε>0についてSの有限可算な ε-近似 が存在するときSは全有界(totally bounded)である.そのときSのすべ ての点がSの有限可算な部分集合に含まれる点のいずれかの近くにあ る.完備性はすべてのコーシー列(Cauchy sequence)が収束することを 意味する.
プレイヤーiが戦略sijを選ぶ確率はpijで表され,各iについて∑mj=1 pij=1 が成り立つ.すべてのプレイヤーの混合戦略の組をプロフィールと呼びpで 表す.p=( p1, p2, … , pn) はn×m個の成分を持つベクトルであるがその内
n(m-1)個の成分が独立である.すべてのpの集合はm-1次元単体のn個
の積であるから凸であり,n(m-1)次元の単体と同相(homeomorphic)である.
m-1次元単体のn個の積を(Δm-1)nで,n(m-1)次元単体をΔn(m-1)で表す.
Δn(m-1)からその空でない(inhabited)部分集合の集合への多価関数(対応)
Fのグラフを次のように定義する.
G(F)=∪p∈Δn(m-1){p}×F(p)
G(F)が閉集合であれば,Fは閉グラフを持つと言う.それは次のことを意 味する.
ql∈F(pl)を満たす点列( pl)l≥ 1,(ql)l≥ 1をとると,pl→pのとき,ある q∈F(p)についてql→qである.
それに対して以下の条件が満たされるときFは一様に閉グラフを持つと言う.
ql∈F(pl) ,q′l∈F(p′l)を満たす点列(pl)l≥1,(ql)l≥1,(p′l)l≥1,(q′l)l≥1をとると,
|pl-p′l|→0のとき,任意のqlと,あるq′lについて|pl-q′l|→0,か つ任意のq′lと,あるqlについて|ql-q′l|→0である.
|pl-p′l|→0および|ql-q′l|→0の意味は次の通りである.
|pl-p′l|→0は,任意のδ>0に対してl≥l0のときに|pl-p′l|<δ であるようなl0が存在することを意味し,|ql-q′l|→0は,任意の ε>0に対してl≥l′0のときに|ql-q′l|<ε であるようなl′0が存在す ることを意味する.
q∈F(p)で,pとqを定点とし,点列(p′l)l≥1={p, p, …}と(q′l)l≥1={q, q, …}
をとる.|pl-p′l|=|pl-p|→0ならば|ql-q′l|=|ql-q|→0である,言 い換えるとpl→pならばql→qであるから,一様に閉グラフを持つという 性質は通常の閉グラフ性を意味する.
(Δm-1)nからその空でない部分集合の集合への一様に閉グラフを持つ多価関
数は,Δn(m-1)からその空でない集合の集合への一様に閉グラフを持つ多価関
数に1対1に対応する.n=m=2のときの(Δm-1)n(四角形ABCD)と Δn(m-1)
(三角形ABE)の関係を第 1 図に描いてある.点FはHに,GはIに対応する.
プレイヤーiのプロフィールpにおける期待利得をπi(p)で表し,またその プロフィールにおいて戦略sijを選んだときの期待利得をπi(sij , p-i)で表すと,
πi(p)は次のように書ける.
πi(p)= ∑
{j : pij>0}pijπi(sij , p-i)
p-iはプロフィールpにおけるi以外のプレイヤーの戦略の組を表す.各プ レイヤーの利得が有限であると仮定すると,期待利得は各プレイヤーの純粋 戦略の集合上の確率分布について線形であるから一様連続な関数である.
関数fが一様連続であるとは,任意のε>0に対して|x-y|<δ のと
きに|f(x)-f(y)|<εとなるようにδ>0を選ぶことができるという
ことである.
ε>0としてp-iに対するプレイヤーiの近似的な最適反応の集合ABRi( p-i) を次のように定義する.
すべてのp′i∈PiについてABRi( p-i)={pi|πi(pi, p-i)> πi(p′i, p-i)-ε,ε>0}
各プレイヤーは与えられた他のプレイヤーの戦略の組に対して近似的に最 適反応となる混合戦略(純粋戦略を含む)の一つを選ぶ.すべてのプレイヤー がそれぞれの近似的に最適反応である戦略を選んでいる状態を近似的な Nash 均衡と呼ぶ.すべてのプレイヤーの近似的な最適反応の集合は次のように表 される.
ABR(p)=(ABR1(p-1), ABR2(p-2), … , ABRi(p-i), … , ABRn(p-n)) ABRは(Δm-1)nからその部分集合の集合への多価関数である.ABR(p)が凸で あることを確認する.そのためには各iについてABRi(p-i)が凸であることを 示せば十分である.pi∈ABRi(p-i),p′i′∈ABRi(p-i)と仮定すると,
A B
C
D E
F G H I
第 1 図 (Δm-1)nとΔn(m-1)の関係
すべてのp′i∈Piについて πi(pi, p-i)> πi(p′i, p-i)-ε,
すべてのp′i∈Piについて πi(pi′′, p-i)> πi(p′i, p-i)-ε が成り立つ.
0 ≤λ≤ 1とする.πi(p)は線形であるから すべてのp′i∈Piについて
λπi(pi , p-i)+(1-λ)πi(p′i ′, p-i)=πi(λpi+(1-λ)p′i ′, p-i)>πi(p′i , p-i)-ε が得られる.したがってλpi+(1-λ)p′i ′∈ABRi(p-i)となるからABRi(p-i)は 凸である.
次に,ABR(p)が一様に閉グラフを持つことを示す.まずABRi(p-i)について考
える.点列(pl)l≥1=((pi , p-i)l)l≥1,(p′l)l≥1= ((p′i , p′-i)l)l≥1をとり,各lについて (pi)l∈ABRi((p-i)l),(p′i)l∈ABRi((p′-i)l)であるとする.πi(pi, p-i) の一様連続 性により|(p-i)l-(p′-i)l|→0のとき,|πi((pi)l , (p-i)l)-πi((pi)l ,(p′-i)l)|→0,
|πi((p′i)l , (p-i)l)-πi((pi ′)l , (p′-i)l)|→0である.ε1>ε2> · · · >εl→0を満た す数列(εl)l≥1をとるとl≥Lのときに
πi((pi)l ,(p′-i)l)> πi((pi)l ,(p-i)l)-εl, πi((p′i)l , (p-i)l)> πi((p′i )l , (p′-i)l)-εl
が成り立つようなLが存在する.
一方ABRi(p-i)の定義により
πi((pi′)l , (p′-i)l)>πi((pi)l ,(p′-i)l)-εl
であるから
πi((p′i)l , (p-i)l)>πi((pi)l ,(p-i)l)-3εl
が得られる.εl→0のとき|πi((p′i)l , (p-i)l)-πi((pi)l ,(p-i)l)|→0なので 十分大きなlについてp′l∈ABRi(p-i)となり,ある˜pi∈ABRi(p-i)について
|(p′i)l-˜pi|→0となるので,ABRi(p-i)は一様に閉グラフを持つ.この結果 はすべてのiについて成り立つのでABR(p) は一様に閉グラフを持つ.
以上の準備のもとに次の定理を証明する.
定理 1.有限戦略型ゲームには近似的なNash 均衡が存在する.
証明.Δをn(m-1)次元単体とする.Δのl次の分割を考える.2次元の 場合の分割が第 2 図に表されている.Fを(Δm-1)nからその部分集合の集 合へのコンパクトかつ凸値で一様に閉グラフを持つ多価関数であるとする.
Δの十分に細かい分割を考え,一様連続な関数fl:Δ→Δ を以下のよう に定義する.pが,l次分割されてできたΔの単体(小単体)の頂点ならば,
あるq∈F(p)についてfl(p)=qとし,それ以外のp∈Δ については各単体
の頂点,p0l, p1l, … , pnl, におけるflの値の凸結合によってfl(p)を定義する.
∑n(m-1)i=0 λi=1,λi≧0とすると
p=∑
i=0 n(m-1)
λipilとして fl(p)= ∑
i=0 n(m-1)
λifl(pil)
である.flは明らかに一様連続であるから[4],[6]によって近似的な不動 点を持つ.近似的な不動点の一つをp*とすると任意のε
2>0について
第 2 図 2次元単体の分割
0 1
2
1 1 0 0
0 2
2 2
1 1 2 1
0 0 1
0 2
1
|p*-fl(p*)|<ε 2
を満たすp*∈Xが存在する.Sperner の補題と近似的なBrouwer の不動点定 理の証明は田中[7]を参照していただきたい.そこでの後者の証明は[4]
の証明を整理したものである.
Δの分割の列(Δl)l≥ 1を考え,分割によって作られる小単体の頂点間の距離 の列((|pil-pjl|)l≥ 1), i≠j,について|pil-pjl|→0であるとする.そのときF が一様に閉グラフを持つことにより,任意のqil∈F(pil)と,あるqil∈F(pjl)に ついて|qil-qlj|→0であり,かつ任意のqlj∈F(pjl)と,あるqil∈F(pil)に ついて|qil-qlj|→0である.p*=∑n(m-1)i=0 λipilと表せるから,i≠jについて
|pli-plj|→0ならば各iについて|pil-p*|→0なので,任意のqil∈F(pil) について,あるq*i∈F(p*) があって|qil-q*i|<ε
2が成り立つ.iによって,す なわちpilによってq*iは異なるかもしれないが,F(p*)が凸であることによって q*= ∑
i=0 n(m-1)
λiq*i∈F(p*)
が成り立つ.各iについて|qil-q*i|→0であり,
fl(p*)=∑
i=0 n(m-1)
λifl(pil)=∑
i=0 n(m-1)
λiqil
であるから|fl(p*)-q*|→0である.したがって十分に大きなlについて
|fl(p*)-q*|<ε 2 が成り立ち,|p*-fl(p*)|<ε
2なので
|p*-q*|<ε (1)
が得られる.これは |p*-F(p*)|<ε であることを意味する.
|p*-F(p*)|=infq*∈F(p*)|p*-q*|
であるが,F(p*)がコンパクトであることによってこの下限が存在する.
この結論はΔが単体ではなく,単体と同相であるコンパクトな距離空間で あっても成り立つ.次の節で用いるのはそのような場合の結果である.
FをABR,p*をプロフィールとすると任意のδ>0について
|p*-ABR(p*)|<δ
が成り立つ.p*=(p*1, p*2, … , p*n) とするとこれは,各iについて |p*i-ABRi( p*-i)|<δ
を意味する.πi(pi , p-i) の一様連続性によってτ>0とε>0に対して すべてのp′i∈piについてπi( p*i , p*-i)>πi(p′i , p*-i)-τ-ε
が得られる.τの値はδの値に対応して決められる.よって各p*i は各プレ イヤーの近似的な最適反応であり,p*は近似的なNash 均衡である.
3 戦略が連続的で利得関数が擬凹(quasi-concave)であるゲームの 近似的なNash 均衡
前節の定理と同様の手法を用いて戦略が連続的で利得関数が擬凹(quasi-
concave)であるようなゲームの近似的なNash 均衡の存在を構成的に証明する.
n人のプレイヤーがいて各プレイヤーの戦略の選択肢は無限にある.プレイ ヤーiの戦略の集合をSi , i=1, 2, … , nとする.Siはm次元ユークリッド空 間Rmのコンパクトで凸な部分集合である.プレイヤーiの戦略をsiで,す べてのプレイヤーの戦略の集合をS=Πni=1Si で,すべてのプレイヤーのプロ フィール(戦略の組)をs=(s1, s2, … , sn)で,そしてi以外のすべてのプレイヤー の戦略の組をs-iで表す.S はnm次元ユークリッド空間Rnmのコンパクトで 凸な部分集合であるから,これはnm次元単体Δnmと同相である.
プレイヤーiの利得関数πi(si, s-i)は一様連続かつ擬凹(quasi-concave)な関 数であるとする.利得関数の擬凹性は次のように表現される.
定義 1.(擬凹性(quasi-concavity)).πi(si , s-i)は任意のsi , s′i∈Si , δ>0に ついて次の条件を満たすとき擬凹である.
πi(λsi+(1-λ)s′i , s-i)> min(πi(si , s-i), πi(si ′, s-i))-δ.
各プレイヤーは,ε>0について次の条件を満たす戦略の一つsiを選ぶ.
すべてのsi′∈Si に対して πi(si , s-i)> πi(si ′, s-i)-ε
そのような戦略si がプレイヤーiのs-iに対する近似的な最適反応である.
プレイヤーiの近似的な最適反応の集合をABRi(s-i)で表す.
πi(si , s-i)が一様連続で,Siが全有界であるからsupπi(si , s-i)が存在する.
したがって,あるs*i ∈Siとε
2についてπi(s*i , s-i)>supπi(si , s-i)-ε 2が 成り立つ.Siの全有界性によって,任意のδ>0,t∈Siに対して少 なくとも一つのtiについて|ti-t|<δが成り立つような有限可算なSi に対するδ-近似{t1, t2, … , tn}が存在する.πi(si , s-i)の一様連続性 により|ti-s*i |<δのときに|πi(ti , s-i)-πi(s*i , s-i)|<ε
2となるよう なδ>0があるからπi(ti, s-i)>supπi(si, s-i)-εを満たす少なくとも 一つのtiを見つけることができる.
プロフィールがs であるときのすべてのプレイヤーの近似的な最適反応は S=(s1, s2, . . . , sn)からその空でない部分集合の集合への多価関数として次のよ うに定義される.
ABR(s)=(ABR1(s-1), ABR2(s-2), … , ABRm(s-m)).
近似的なNash 均衡はすべてのプレイヤーが互いに近似的な最適反応となる戦
略を選んでいる状態である.
ABR(s)が前節の定理における同様の関数と同じ条件を満たすことを示そう.
1.ABR(s)は凸である.
s, s'∈ABR(s) とし,s=(s1, s2, … , sn),s'=(s′1, s′2, … , sn′)と表す.利得関数 が擬凹であることより,各プレイヤーiについて
πi(λsi+(1-λ)si ′, s-i)>πi(si, s-i)-δ または
πi(λsi+(1-λ)si ′, s-i)>πi(s′i, s-i)-δ を得る.si , s′i∈ABRi(s-i)であるから
すべてのs′i′∈Siについてπi(λsi+(1-λ)s′i , s-i)>πi(s′i ′, s-i)-δ-εとなる.
δ>0は任意であるからλsi+(1-λ)si ′はプレイヤーiのs-iに対する近似的 な最適反応でありABR(s)は凸集合である.
2.ABR(s)は一様に閉グラフを持つ.
ABRi(s-i)について考える.si(l)∈ABRi(s-i(l)),s′i (l)∈ABRi(s′-i(l))を 満たすプレイヤーi以外の戦略の組の列(s-i(l))l≥ 1,(s′-i(l))l≥ 1とプレイヤー iの戦略の列(si(l))l≥ 1,(s′i (l))l≥ 1をとり|(s-i(l)-s′-i(l)|→0であるとする と,πi(si , s-i)の一様連続性によって|πi(si(l), s-i(l))-πi(si(l), s′-i(l)|→0,
|πi(s′i (l), s-i(l)-πi(s′i (l), s′-i(l))|→0である.ε1>ε2>· · · εl→0を満た す数列(εl)l≥ 1をとるとl≥Lのときに
πi(si(l), s′-i(l))>πi(si(l), s-i(l))-εl, πi(s′i (l), s-i(l))>πi(s′i (l), s′-i(l))-εl
が成り立つようなLが存在する.
一方ABRi(s-i)の定義により
πi(s′i (l), s′-i(l))>πi(si(l), s′-i(l))-εl
であるから
πi(s′i (l), s-i(l))>πi(si(l), s-i(l))-3εl
が得られる.εl→0のとき|πi(s′i (l), s-i(l))-πi(si(l), s-i(l))|→0なので十分 大きなlについてs′i (l)∈ABRi(s-i)となり,ある˜si∈ABRi(s-i)について|(s′i (l)
-˜si|→0が成り立つから,ABRi(s-i)は一様に閉グラフを持つ.この結果は すべてのiについて成り立つのでABR(s)は一様に閉グラフを持つ.
以上によって任意のδ>0について
あるs ∈ ABR(s*)について|s-s*|< δ を満たすs*=(s*i , s*-i)が存在する.それは
あるsi∈ABRi(s*-i)について|si-s*i |<δ (2)
を意味する.πi(si , s-i) はsiについて一様連続であるから(2)は,τ>0と ε>0に対して
すべてのsi ′∈siについてπi(s*i , s*-i)> πi(si ′, s*-i)-τ-ε
であることを意味する.τの値はδの値に対応して決められる.δ は任意 なのでs*i はプレイヤーiのs*-iに対する近似的な最適反応であるから,近似
的なNash 均衡の存在が証明された.したがって次の定理が得られた.
定理 2.戦略が連続的に表され,利得関数が擬凹性を満たす戦略型ゲームに は近似的なNash 均衡が存在する.
前節で分析した有限戦略型ゲームにおける混合戦略はこの節のゲームで考 えたユークリッド空間のコンパクトで凸な部分空間の点である.また,期待 利得関数は混合戦略について線形であるから擬凹性を満たしている.したがっ て,有限戦略型ゲームのNash 均衡の存在はこの節の結果の特殊ケースである.
参考文献
[1]Bishop E. and D. Bridges (1985) Constructive Analysis, Springer.
[2] Bridges D. and F. Richman (1987) Varieties of Constructive Mathematics, Cambridge University Press.
[3] Bridges D. and L. Vˆıt¸a˘ (2006) Techniques of Constructive Mathematics, Springer.
[4] van Dalen D.(2011) “Brouwer’s ε-fixed point from Sperner’s lemma,” Theoretical Computer Science, vol. 412, No. 28, pp. 3140―3144, http://dx.doi.org/10.1016/j.tcs.2011.04.002.
[5] Kellogg R. B., T. Y. Li and J. Yorke (1976) “A constructive proof of Brouwer fixed-point theorem and computational results,” SIAM Journal on Numerical Analysis, vol. 13, pp.
473―483.
[6] Veldman W. (2009) “Brouwer’s approximate fixed point theorem is equivalent to Brouwer’s fan theorem,” in Logicism, Intuitionism and Formalism, edited by S.
Lindström, E. Palmgren, K. Segerberg and Stoltenberg-Hansen, Springer.
[7] 田中靖人(2012)「近似的な角谷の不動点定理の構成的数学による証明と近似的な ミニ・マックス定理について」『経済学論叢』(同志社大学)第64巻3号,pp.127―
147.
(たなか やすひと・同志社大学経済学部)
The Doshisha University Economic Review, Vol.65 No.1 Abstract
Yasuhito TANAKA, A Constructive Proof of the Existence of Approximate Nash Equilibrium in Finite Strategic Game
We constructively prove the existence of approximate Nash equilibrium in a finite strategic game from the viewpoint of Bishop-style constructive mathematics.
An approximate Nash equilibrium is a state in which all players choose their approximate best responses to strategies of other players. In addition, we prove the existence of approximate Nash equilibrium in a game with continuous strategies and quasi-concave payoff functions.