著者田中靖人

(1)

著者田中靖人

雑誌名經濟學論叢

巻 65

号 1

ページ 151‑164

発行年 2013‑07‑20

権利同志社大學經濟學會

URL http://doi.org/10.14988/00027378

(2)

【論　説】

構成的数学による近似的なNash 均衡の存在証明

田　中　靖　人　　

概　要

　本稿では近似的なBrouwerの不動点定理を用いて，プレイヤーの最適反応が多価関数であるような戦略型ゲームにおける近似的なNash 均衡の存在を構成的に，Bishop による構成的数学（Bishop & Bridges ［1］, Bridges & Richman ［2］, Bridges & Vˆıt¸a˘ ［3］）の観点から，証明する．近似的なNash 均衡とは各プレイヤーが選ぶ戦略がε> 0 の範囲で互いに最適反応（そのような戦略を近似的な最適反応と呼ぶ）になっているような状態である．さらに，戦略が連続的に表され，

利得関数が擬凹性（quasi-concavity）を満たすゲームにおける近似的なNash 均衡の存在を構成的に証明する^1）．

1　は　じ　め　に

　Brouwer の不動点定理が構成的に証明できないことはよく知られている^2）．したがって多価関数（あるいは対応）に関する角谷の不動点定理も，プレイヤー

1）　本稿は拙著“A proof of the existence of approximate Nash equilibrium in strategic game with multi-valued optimal responses by Sperner's lemma: A constructive analysis”, Mathematical Modelling and Applied Computing, Vol. 2, Research India Publications, 2011, pp. 309―319.に基づき主要定理の証明を改良するとともに，新たな分析（戦略が連続的に表されるゲームにおける近似的なNash 均衡の分析）を追加したものである．この研究は科学研究費補助金基盤研究（C）20530165の補助を受けている．

2）　Kellogg et. al.［5］がBrouwerの不動点定理の「構成的」な証明を与えているとされるが，Bishop による構成的数学（［1］，［2］，［3］）の観点からは「構成的」な証明ではない．定理の1 次元のケース，すなわち中間値の定理が構成的に証明できないことを言えば十分であろう（［2］，［4］参照）．

(3)

の最適反応が多価関数であるような戦略型ゲームにおけるNash 均衡の存在も構成的に証明できない．一方，Brouwer の不動点定理の証明に用いられる

Sperner の補題は構成的に証明可能である．最近このSperner の補題を用いて

近似的なBrouwer の不動点定理（近似的な不動点の存在）の証明が与えられて

いる（Dalen［4］，Veldman［6］参照）（近似的な不動点とは不動点に近い点ではなく不動点の条件を近似的に満たす点である）．不動点定理の構成的な証明とは，具体的に不動点を見つけられるような証明でなければならない．「不動点が存在しないと仮定すると矛盾が生じる．だから不動点は存在する」という背理法による証明は構成的な証明ではない．

　本稿では近似的なBrouwer の不動点定理を用いて，プレイヤーの最適反応が多価関数であるような戦略型ゲームにおける近似的なNash 均衡の存在を構成的に証明する．近似的なNash 均衡とは各プレイヤーが選ぶ戦略が ε＞0 の範囲で互いに最適反応（そのような戦略を近似的な最適反応と呼ぶ）になっているような状態である．

　さらに，戦略が連続的に表され，利得関数が擬凹性（quasi-concavity）を満たすゲームにおける近似的なNash均衡の存在を構成的に証明する．

2　戦略型ゲームにおける近似的なNash 均衡

　n人のプレイヤーがそれぞれm個の純粋戦略の選択肢を持つ戦略型ゲームを考える．m，nは2 以上で有限な正の整数である．そのようなゲームを有限戦略型ゲームと呼ぶ．プレイヤーiの純粋戦略の集合をS_iで示し，個々の純粋戦略をs_ijで表す．各プレイヤーの混合戦略は純粋戦略の集合上の確率分布で定義され，p_iで表される．すべてのp_iの集合をP_iで表す．P_iはコンパクトかつ凸である．

　　　構成的数学において集合がコンパクトであるとは，全有界（totally bounded）

かつ完備（complete）であることを意味する．まず集合の有限可算性（finite

(4)

enumerability）と集合に対するε-近似とを説明する．ある集合Sについて有限な自然数Nと{1, 2, … , N }からSの上への（onto）写像が存在するときSは有限可算（finitely enumerable）であると言う．そのとき S は高々N個の要素を持つ（ちょうどN個の要素を持つ場合は有限（finite）

であると言う）．集合Sに対するε-近似とは，各々のp∈Sについて

|p－q|＜εを満たす点qを含むようなSの部分集合である．|p－q|

はpとqとの距離を表す．各ε＞0についてSの有限可算な ε-近似が存在するときSは全有界（totally bounded）である．そのときSのすべての点がSの有限可算な部分集合に含まれる点のいずれかの近くにある．完備性はすべてのコーシー列（Cauchy sequence）が収束することを意味する．

　プレイヤーiが戦略s_ijを選ぶ確率はp_ijで表され，各iについて∑^mj＝1 pij＝1 が成り立つ．すべてのプレイヤーの混合戦略の組をプロフィールと呼びpで表す．p＝( p1, p2, … , pn) はn×m個の成分を持つベクトルであるがその内

n(m－1)個の成分が独立である．すべてのpの集合はm－1次元単体のn個

の積であるから凸であり，n(m－1)次元の単体と同相（homeomorphic）である．

m－1次元単体のn個の積を(Δ^m－1)ⁿで，n(m－1)次元単体をΔ^n(m－1)で表す．

　Δ^n(m－1)からその空でない（inhabited）部分集合の集合への多価関数（対応）

Fのグラフを次のように定義する．

　　　　G(F)＝∪p∈Δ^n(m－1){p}×F(p)

　G(F)が閉集合であれば，Fは閉グラフを持つと言う．それは次のことを意味する．

　　　 ql∈F(p_l)を満たす点列( p_l)_{l≥ 1}，(ql)_{l≥ 1}をとると，pl→pのとき，ある q∈F(p)についてql→qである．

(5)

　それに対して以下の条件が満たされるときFは一様に閉グラフを持つと言う．

　　　 ql∈F(pl) ，q′l∈F(p′l)を満たす点列(pl)l≥1，(ql)l≥1，(p′l)l≥1，(q′l)l≥1をとると，

　|pl－p′l|→0および|q_l－q′l|→0の意味は次の通りである．

　q∈F(p)で，pとqを定点とし，点列(p′l)_l≥1＝{p, p, …}と(q′l)_l≥1＝{q, q, …}

をとる．|pl－p′l|＝|pl－p|^→0ならば|ql－q′l|＝|ql－q|^→0である，言い換えるとp_l→pならばq_l→qであるから，一様に閉グラフを持つという性質は通常の閉グラフ性を意味する．

　(Δ^m－1)ⁿからその空でない部分集合の集合への一様に閉グラフを持つ多価関

数は，Δ^n(m－1)からその空でない集合の集合への一様に閉グラフを持つ多価関

数に1対1に対応する．n＝m＝2のときの(Δ^m－1)ⁿ（四角形ABCD）と Δ^n(m－1)

（三角形ABE）の関係を第 1 図に描いてある．点FはHに，GはIに対応する．

　プレイヤーiのプロフィールpにおける期待利得をπi(p)で表し，またそのプロフィールにおいて戦略sijを選んだときの期待利得をπi(sij , p_－i)で表すと，

πi(p)は次のように書ける．

　　　　πⁱ(p)＝ ∑

{j : pij＞0}p_ijπi(s_ij , p_－i)

　p－iはプロフィールpにおけるi以外のプレイヤーの戦略の組を表す．各プレイヤーの利得が有限であると仮定すると，期待利得は各プレイヤーの純粋戦略の集合上の確率分布について線形であるから一様連続な関数である．

(6)

　　　関数fが一様連続であるとは，任意のε＞0に対して|x－y|<δ のと

きに|f(x)－f(y)|＜εとなるようにδ＞0を選ぶことができるという

ことである．

　ε＞0としてp_－iに対するプレイヤーiの近似的な最適反応の集合ABRi( p_－i) を次のように定義する．

　すべてのp′i∈PiについてABRi( p_－i)＝{pi|πi(pi, p_－i)＞ πi(p′i, p_－i)－ε,ε＞0}

　各プレイヤーは与えられた他のプレイヤーの戦略の組に対して近似的に最適反応となる混合戦略（純粋戦略を含む）の一つを選ぶ．すべてのプレイヤーがそれぞれの近似的に最適反応である戦略を選んでいる状態を近似的な Nash 均衡と呼ぶ．すべてのプレイヤーの近似的な最適反応の集合は次のように表される．

　　　　ABR(p)＝(ABR1(p_－1), ABR₂(p_－2), … , ABRi(p_－i), … , ABRn(p_－n)) ABRは(Δ^m－1)ⁿからその部分集合の集合への多価関数である．ABR(p)が凸であることを確認する．そのためには各iについてABRi(p_－i)が凸であることを示せば十分である．pi∈ABRi(p－i)，p′i′∈ABRi(p－i)と仮定すると，

A B

C

D E

F G H I

第 1 図　(Δ^m－1)ⁿとΔ^n(m－1)の関係

(7)

　　　　すべてのp′i∈P_iについて　πi(p_i, p－i)＞ πi(p′i, p－i)－ε，

　　　　すべてのp′i∈Piについて　πi(pi′′, p_－i)＞ πi(p′i, p_－i)－ε が成り立つ．

　0 ≤λ≤ 1とする．πi(p)は線形であるからすべてのp′i∈P_iについて

　　λπi(p_i, p_－i)＋(1－λ)πi(p′i ′, p_－i)＝πi(λp_i＋(1－λ)p′i ′, p_－i)＞πi(p′i , p_－i)－ε が得られる．したがってλp_i＋(1－λ)p′i ′∈ABR_i(p－i)となるからABR_i(p－i)は凸である．

　次に，ABR(p)が一様に閉グラフを持つことを示す．まずABR_i(p－i)について考

える．点列(p_l)_l≥1＝((p_i, p_－i)_l)_l≥1，(p′l)_l≥1＝ ((p′i , p′－i)_l)_l≥1をとり，各lについて (p_i)l∈ABR_i((p－i)l)，(p′i)l∈ABR_i((p′－i)l)であるとする．πi(p_i, p－i) の一様連続性により|(p－i)_l－(p′－i)_l|→0のとき，|πi((p_i)_l, (p_－i)_l)－πi((p_i)_l,(p′－i)_l)|→0，

|πi((p′i)l , (p－i)l)－πi((pi ′)l , (p′－i)l)|^→0である．ε1＞ε2＞ · · · ＞εl→0を満たす数列(εl)_l≥1をとるとl≥Lのときに

　　　　πi((p_i)l ,(p′－i)l)＞ πi((p_i)l ,(p－i)l)－εl，　　　　πi((p′i)_l, (p_－i)_l)＞ πi((p′i )_l, (p′－i)_l)－εl

が成り立つようなLが存在する．

　一方ABR_i(p_－i)の定義により

　　　　πi((pi′)l , (p′－i)l)＞πi((p_i)l ,(p′－i)l)－εl

であるから

　　　　πi((p′i)l , (p－i)l)＞πi((p_i)l ,(p－i)l)－3εl

が得られる．εl→0のとき|πi((p′i)_l, (p_－i)_l)－πi((p_i)_l,(p_－i)_l)|→0なので十分大きなlについてp′l∈ABR_i(p－i)となり，ある˜p_i∈ABR_i(p－i)について

|(p′i)_l－˜p_i|→0となるので，ABRi(p_－i)は一様に閉グラフを持つ．この結果はすべてのiについて成り立つのでABR(p) は一様に閉グラフを持つ．

　以上の準備のもとに次の定理を証明する．

(8)

定理 1．有限戦略型ゲームには近似的なNash 均衡が存在する．

証明．Δをn(m－1)次元単体とする．Δのl次の分割を考える．2次元の場合の分割が第 2 図に表されている．Fを(Δ^m－1)ⁿからその部分集合の集合へのコンパクトかつ凸値で一様に閉グラフを持つ多価関数であるとする．

Δの十分に細かい分割を考え，一様連続な関数f^l：Δ^→Δ を以下のように定義する．pが，l次分割されてできたΔの単体（小単体）の頂点ならば，

あるq∈F(p)についてf^l(p)＝qとし，それ以外のp∈Δ については各単体

の頂点，p0^l, p1^l, … , pn^l, におけるf^lの値の凸結合によってf^l(p)を定義する．

∑^n(m－1)_i＝0 λi＝1，λi≧0とすると

　　　　p＝∑

i＝0 n(m－1)

λipi^lとして　f^l(p)＝ ∑

i＝0 n(m－1)

λif^l(pi^l)

である．f^lは明らかに一様連続であるから［4］，［6］によって近似的な不動点を持つ．近似的な不動点の一つをp*とすると任意のε

2＞0について

第 2 図　2次元単体の分割

0 1

2

1 1 0 0

0 2

2 2

1 1 2 1

0 0 1

0 2

1

(9)

　　　　|p*－f^l(p*)|＜ε 2

を満たすp*∈Xが存在する．Sperner の補題と近似的なBrouwer の不動点定理の証明は田中［7］を参照していただきたい．そこでの後者の証明は［4］

の証明を整理したものである．

　Δの分割の列(Δl)_l_{≥ 1}を考え，分割によって作られる小単体の頂点間の距離の列（(|pi^l－pj^l|)l≥ 1), i≠j，について|pi^l－pj^l|→0であるとする．そのときF が一様に閉グラフを持つことにより，任意のq_i^l∈F(p_i^l)と，あるq_i^l∈F(p_j^l)について|qi^l－q^lj|→0であり，かつ任意のq^lj∈F(pj^l)と，あるqi^l∈F(pi^l)について|qi^l－q^lj|^→0である．p*＝∑^n(m－1)_i＝0 _λ_ipi^lと表せるから，i≠jについて

2が成り立つ．iによって，すなわちpi^lによってq*iは異なるかもしれないが，F(p*)が凸であることによって　　　　q*＝ ∑

i＝0 n(m－1)

λiq*_i∈F(p*)

が成り立つ．各iについて|q_i^l－q*i|→0であり，

　　　　f^l(p*)＝∑

i＝0 n(m－1)

λif^l(p_i^l)＝∑

i＝0 n(m－1)

λiq_i^l

であるから|f^l(p*)－q*|^→0である．したがって十分に大きなlについて

　　　　|f^l(p*)－q*|＜ε 2 が成り立ち，|p*－f^l(p*)|＜ε

2なので

　　　　|p*－q*|＜ε （1）　　

が得られる．これは　　　　|p*－F(p*)|＜ε であることを意味する．

(10)

　　　　 |p*－F(p*)|＝infq*∈F(p*)|p*－q*|

であるが，F(p*)がコンパクトであることによってこの下限が存在する．

　この結論はΔが単体ではなく，単体と同相であるコンパクトな距離空間であっても成り立つ．次の節で用いるのはそのような場合の結果である．

　FをABR，p*をプロフィールとすると任意のδ＞0について

　　　　|p*－ABR(p*)|＜δ

が成り立つ．p*＝(p*1, p*₂, … , p*n) とするとこれは，各iについて　　　　|p*i－ABRi( p*－i)|＜δ

を意味する．πi(p_i, p_－i) の一様連続性によってτ＞0とε＞0に対して　　　すべてのp′i∈piについてπi( p*i , p*－i)＞πi(p′i , p*－i)－τ－ε

が得られる．τの値はδの値に対応して決められる．よって各p*_iは各プレイヤーの近似的な最適反応であり，p*は近似的なNash 均衡である．

3　戦略が連続的で利得関数が擬凹（quasi-concave）であるゲームの近似的なNash 均衡

　前節の定理と同様の手法を用いて戦略が連続的で利得関数が擬凹（quasi-

concave）であるようなゲームの近似的なNash 均衡の存在を構成的に証明する．

n人のプレイヤーがいて各プレイヤーの戦略の選択肢は無限にある．プレイヤーiの戦略の集合をS_i, i＝1, 2, … , nとする．Siはm次元ユークリッド空間R^mのコンパクトで凸な部分集合である．プレイヤーiの戦略をsiで，すべてのプレイヤーの戦略の集合をS＝Πⁿi＝1S_i で，すべてのプレイヤーのプロフィール（戦略の組）をs＝(s1, s2, … , sn)で，そしてi以外のすべてのプレイヤーの戦略の組をs_－iで表す．S はnm次元ユークリッド空間R^nmのコンパクトで凸な部分集合であるから，これはnm次元単体Δ^nmと同相である．

　プレイヤーiの利得関数πi(s_i, s_－i)は一様連続かつ擬凹（quasi-concave）な関数であるとする．利得関数の擬凹性は次のように表現される．

(11)

定義 1．（擬凹性（quasi-concavity））．πi(s_i, s－i)は任意のs_i, s′i∈S_i, δ＞0について次の条件を満たすとき擬凹である．

　　　　πi(λs_i＋(1－λ)s′i , s_－i)＞ min(πi(s_i, s_－i), πi(si ′, s_－i))－δ．

　各プレイヤーは，ε＞0について次の条件を満たす戦略の一つsiを選ぶ．

　　　　すべてのsi′∈Si に対して πi(s_i, s_－i)＞ πi(si ′, s_－i)－ε

そのような戦略si がプレイヤーiのs_－iに対する近似的な最適反応である．

プレイヤーiの近似的な最適反応の集合をABR_i(s_－i)で表す．

　　　 πi(s_i, s－i)が一様連続で，S_iが全有界であるからsupπi(s_i, s－i)が存在する．

したがって，あるs*_i∈Siとε

2についてπi(s*_i, s_－i)＞supπi(s_i, s_－i)－ε 2が成り立つ．S_iの全有界性によって，任意のδ＞0，t∈S_iに対して少なくとも一つのt_iについて|t_i－t|＜δが成り立つような有限可算なS_i に対するδ－近似{t₁, t₂, … , t_n}が存在する．πi(s_i, s－i)の一様連続性により|t_i－s*i |＜δのときに|πi(t_i, s_－i)－πi(s*_i, s_－i)|＜ε

2となるようなδ＞0があるからπi(t_i, s－i)＞supπi(s_i, s－i)－εを満たす少なくとも一つのt_iを見つけることができる．

　プロフィールがs であるときのすべてのプレイヤーの近似的な最適反応は S＝(s1, s2, . . . , sn)からその空でない部分集合の集合への多価関数として次のように定義される．

　　　　ABR(s)＝(ABR1(s_－1), ABR2(s_－2), … , ABRm(s_－m))．

近似的なNash 均衡はすべてのプレイヤーが互いに近似的な最適反応となる戦

略を選んでいる状態である．

　ABR(s)が前節の定理における同様の関数と同じ条件を満たすことを示そう．

　1．ABR(s)は凸である．

　s, s'∈ABR(s) とし，s＝(s1, s₂, … , sn)，s'＝(s′1, s′2, … , sn′)と表す．利得関数が擬凹であることより，各プレイヤーiについて

(12)

　　　　πi(λs_i＋(1－λ)si ′, s－i)＞πi(s_i, s－i)－δ または

　　　　πi(λs_i＋(1－λ)si ′, s－i)＞πi(s′i, s－i)－δ を得る．si , s′i∈ABRi(s_－i)であるから

すべてのs′i′∈S_iについてπi(λs_i＋(1－λ)s′i , s－i)＞πi(s′i ′, s－i)－δ－εとなる．

δ＞0は任意であるからλs_i＋(1－λ)si ′はプレイヤーiのs_－iに対する近似的な最適反応でありABR(s)は凸集合である．

　2．ABR(s)は一様に閉グラフを持つ．

　ABR_i(s－i)について考える．s_i(l)∈ABR_i(s－i(l))，s′i (l)∈ABR_i(s′－i(l))を満たすプレイヤーi以外の戦略の組の列(s_－i(l))_{l≥ 1}，(s′－i(l))_l_{≥ 1}とプレイヤー iの戦略の列(s_i(l))l≥ 1，(s′i (l))l≥ 1をとり|(s－i(l)－s′－i(l)|^→0であるとすると，πi(s_i, s_－i)の一様連続性によって|πi(s_i(l), s_－i(l))－πi(s_i(l), s′－i(l)|→0，

|πi(s′i (l), s－i(l)－πi(s′i (l), s′－i(l))|^→0である．ε1＞ε2＞· · · εl→0を満たす数列(εl)_l_{≥ 1}をとるとl≥Lのときに

　　　　πi(s_i(l), s′－i(l))＞πi(s_i(l), s－i(l))－εl，　　　　πi(s′i (l), s_－i(l))＞πi(s′i (l), s′－i(l))－εl

が成り立つようなLが存在する．

　一方ABR_i(s_－i)の定義により

　　　　πi(s′i (l), s′－i(l))＞πi(s_i(l), s′－i(l))－εl

であるから

　　　　πi(s′i (l), s－i(l))＞πi(s_i(l), s－i(l))－3εl

が得られる．εl→0のとき|πi(s′i (l), s_－i(l))－πi(s_i(l), s_－i(l))|→0なので十分大きなlについてs′i (l)∈ABR_i(s－i)となり，ある˜s_i∈ABR_i(s－i)について|(s′i (l)

－˜s_i|→0が成り立つから，ABRi(s_－i)は一様に閉グラフを持つ．この結果はすべてのiについて成り立つのでABR(s)は一様に閉グラフを持つ．

(13)

　以上によって任意のδ＞0について

　　　　あるs ∈ ABR(s*)について|s－s*|＜ δ を満たすs*＝(s*_i , s*－i)が存在する．それは

　　　　あるs_i∈ABR_i(s*_－i)について|s_i－s*i |＜δ （2）　　

を意味する．πi(s_i, s－i) はs_iについて一様連続であるから（2）は，τ＞0と ε＞0に対して

　　　　すべてのsi ′∈s_iについてπi(s*_i, s*－i)＞ πi(si ′, s*－i)－τ－ε

であることを意味する．τの値はδの値に対応して決められる．δ は任意なのでs*_iはプレイヤーiのs*－iに対する近似的な最適反応であるから，近似

的なNash 均衡の存在が証明された．したがって次の定理が得られた．

定理 2．戦略が連続的に表され，利得関数が擬凹性を満たす戦略型ゲームには近似的なNash 均衡が存在する．

　前節で分析した有限戦略型ゲームにおける混合戦略はこの節のゲームで考えたユークリッド空間のコンパクトで凸な部分空間の点である．また，期待利得関数は混合戦略について線形であるから擬凹性を満たしている．したがって，有限戦略型ゲームのNash 均衡の存在はこの節の結果の特殊ケースである．

参考文献

［1］Bishop E. and D. Bridges (1985) Constructive Analysis, Springer.

［2］ Bridges D. and F. Richman (1987) Varieties of Constructive Mathematics, Cambridge University Press.

［3］ Bridges D. and L. Vˆıt¸a˘ (2006) Techniques of Constructive Mathematics, Springer.

［4］ van Dalen D.(2011) “Brouwer’s ε-fixed point from Sperner’s lemma,” Theoretical Computer Science, vol. 412, No. 28, pp. 3140―3144, http://dx.doi.org/10.1016/j.tcs.2011.04.002.

［5］ Kellogg R. B., T. Y. Li and J. Yorke (1976) “A constructive proof of Brouwer fixed-point theorem and computational results,” SIAM Journal on Numerical Analysis, vol. 13, pp.

(14)

473―483.

［6］ Veldman W. (2009) “Brouwer’s approximate fixed point theorem is equivalent to Brouwer’s fan theorem,” in Logicism, Intuitionism and Formalism, edited by S.

Lindström, E. Palmgren, K. Segerberg and Stoltenberg-Hansen, Springer.

［7］田中靖人（2012）「近似的な角谷の不動点定理の構成的数学による証明と近似的なミニ・マックス定理について」『経済学論叢』（同志社大学）第64巻3号，pp.127―

147.

（たなか　やすひと・同志社大学経済学部）

(15)

The Doshisha University Economic Review, Vol.65 No.1 Abstract

Yasuhito TANAKA, A Constructive Proof of the Existence of Approximate Nash Equilibrium in Finite Strategic Game

　　We constructively prove the existence of approximate Nash equilibrium in a finite strategic game from the viewpoint of Bishop-style constructive mathematics.

An approximate Nash equilibrium is a state in which all players choose their approximate best responses to strategies of other players. In addition, we prove the existence of approximate Nash equilibrium in a game with continuous strategies and quasi-concave payoff functions.

著者 田中 靖人