特別研究報告書
N
人非協力ゲームに対するロバスト
Nash
均衡問題と解の一意性
指導教員 福嶋雅夫 教授 林 俊介 助手
京都大学工学部情報学科 数理工学コース
平成15年4月入学 平成19年3月卒業
西村 亮一
平成19年1月31日提出
N
人非協力ゲームに対するロバスト
Nash
均衡問題と解の一意性西村 亮一 摘要
非協力ゲームとは,各プレイヤーが他のプレイヤーとは独立に意思決定する状況をモデル化した ものであり,その重要な均衡概念として知られるのがNash均衡である.Nash均衡は,各プレイ ヤーがゲームのルールについて完全な知識,すなわち,ゲームのすべてのパラメータや各プレイ ヤーのコスト関数などの情報を持ち,それ自体がプレイヤーの共通認識であるという前提の下で意 味をもつ.しかし,現実の問題においては,その前提が満たされるとは限らない.そこで,ゲーム のルールについてプレイヤーが不確実な情報しかもたない情報不完備ゲームをモデル化することが 重要になってくる.これまで情報不完備ゲームに対して多くの研究がなされてきたが,本報告書で は,その中でも特に各プレイヤーが不確実な情報の下で,ロバスト最適化と呼ばれる概念に基づい て自分の戦略を決定することを仮定したモデルを考える.このモデルにおいて起こり得る均衡状態 をロバストNash均衡といい,その均衡点を求める問題をロバストNash均衡問題という.
本報告書では,まず,既存のロバストNash均衡の概念をより一般化し,プレイヤーの数がN人 で,各プレイヤーのコスト関数(利得関数)が自分の戦略に関して非線形な場合に対して,ロバス トNash均衡を定義する.さらに,コスト関数や戦略集合に対する凸性とコンパクト性の仮定のも とで,ロバストNash均衡解の存在性を示す.さらに,ロバストNash均衡問題を等価な一般化変 分不等式問題に変換することにより,ロバストNash均衡解が一意に存在するための十分条件を与 える.特に,各プレイヤーのコスト関数が二次の項を含み,不確実性を表す集合が二次のノルムを 用いて表されるロバストNash均衡問題を二次錐相補性問題として再定式化できることを示す.二 次錐相補性問題に対するアルゴリズムを用いた数値実験を行い,ロバストNash均衡解の性質を調 べる.
目次
1 序論 1
2 定式化 2
3 ロバストNash均衡解の存在 3
4 ロバストNash均衡解の一意性 5
5 ロバストNash均衡問題の二次錐相補性問題への定式化 8 5.1 相手の戦略の評価に不確実性がある場合 . . . 9 5.2 コスト関数に不確実性がある場合 . . . 12
6 数値実験 15
6.1 ロバストNash均衡解とコスト関数値の関係 . . . 16 6.2 不確実性集合の大きさとロバストNash均衡解の関係 . . . 18
7 結論 23
1
序論私たちは,個人,または企業などの組織において,様々な意思決定を行っている.私たちの意思決定は,他の 人々の意思決定に影響を及ぼし,同様に他の人々の意思決定は,私たちの意思決定に影響を及ぼす.ゲーム理 論は,経済や社会における様々な意思決定を数理的な方法論を用いて分析する理論である[18].Nash [16, 17]
は非協力ゲームを最初に定義し,それに対して均衡解(Nash均衡解)の概念を提示した.Nash均衡解は,各 プレイヤーはゲームのルールについて完全な知識,すなわち,ゲームのすべてのパラメータや各プレイヤーの コスト関数などの情報を持ち,またそれ自体がプレイヤーの共通認識であるという前提の下で意味をもつ.こ の前提を情報完備という.しかし,現実の問題において,情報完備の前提が満たされるとは限らない.そこ で,ゲームのルールについてプレイヤーが不完全な知識しか持っていない情報不完備ゲームが多くの研究者に よって研究されている.
Harsanyi [13, 14, 15]は,情報不完備ゲームを定式化した.その定式化では,不確実な情報の下での意思決
定に対して,それらの真の値を確率分布の形で予想し,各プレイヤーはその確率分布のもとでの期待値を最適 化するというベイジアン仮説を採用した.さらに,確率分布に対するある仮定の下で,情報不完備ゲームを変 換してベイジアンゲームを定義した.ベイジアンゲームは,情報不完備ゲームから定義されるゲームである が,ベイジアンゲームの構成要素に関しては完全な知識をもつ情報完備ゲームである.情報不完備ゲームとベ イジアンゲームは,プレイヤーにとって戦略上の観点からは同値であると見なせる.
Aghassi and Bertsimas [1]やHayashi, Yamashita, and Fukushima [11]は,情報不完備ゲームに対して,ベイ ジアンゲームの仮定を緩和して確率分布を用いないモデルを提案した.彼らのモデルでは,各プレイヤーがロ バスト最適化[4, 5, 6]を行うことにより自分の戦略を決定することが仮定されている.ここで,ロバスト最 適化とは,不確実なパラメータを含むが,そのパラメータが少なくともある範囲内(不確実性集合)に入っ ていることが期待できる最適化問題に対して,その範囲内で起こり得る最悪のケースを想定して最適化を行 うものである.各プレイヤーがロバスト最適化を行った結果起こり得る均衡状態をロバストNash均衡とい う.また,そのような均衡点を求める問題をロバストNash均衡問題という.Aghassiら[1]は,N人のプレ イヤーがそれぞれ線形計画問題(Linear Programming : LP)を解くようなゲームを考え,それに対してロバス トNash均衡*1を定義した.さらに,不確実性集合が凸多面体である問題に対して,ロバストNash均衡解を 求める方法を提案した.Hayashiら[11]は,Aghassiら[1]とは独立に,双行列ゲームに対してロバストNash 均衡の概念を定義した.彼らは,不確実性集合がユークリッドノルムやフロベニウスノルムを用いて表される という仮定の下で,各プレイヤーの解くべき最適化問題を二次錐計画問題(Second-Order Cone Programming : SOCP)[2]として再定式化し,その結果,ロバストNash均衡問題が二次錐相補性問題(Second-Order Cone Complementarity Problem : SOCCP)に帰着されることを示した.なお,Aghassiら[1]のモデルでは,各プレ イヤーが解くべき最適化問題に含まれる行列やベクトルのみに不確実性が仮定されているのに対し,Hayashi ら [11]は,他のプレイヤーの戦略にも不確実性が存在する場合も取り扱っている.
本報告書では,Hayashi [11]らの取り扱った問題を拡張して,N 人非協力ゲームに対するロバストNash均 衡の概念を定義する.特に,解の存在性を示すにあたって,Aghassiら[1]やHayashiら [11]は,各プレイ ヤーのコスト関数(利得関数)が自分の戦略に対して線形な場合のみを考えたが,本報告書ではコスト関数が 自分の戦略に関して凸な関数を考える.そして,適当な仮定の下で,ロバストNash均衡解が一意に存在する
*1Aghassiらの論文ではロバスト最適化均衡と書かれているが,実質的に同じものである.
ことを示す.また,Hayashiら[11]が提案した手法を用いて,各プレイヤーのコスト関数が自分の戦略に関し て2次の項を含むようなロバストNash均衡問題をSOCCPに再定式化する.
本報告書の構成は,次の通りである.第2節では本報告書で扱うゲームを定式化し,ロバストNash均衡の 概念を定義する.第3節でロバストNash均衡解の存在条件を示す.第4節では適当な仮定の下で,ロバスト Nash均衡解が一意に存在することを示す.第5節では,いくつかのケースに対して,ロバストNash均衡問
題をSOCCPに再定式化する.第6節で,それらの問題に対する数値実験を行ってロバストNash均衡解の性
質を調べる.
本報告書を通じて,以下の表記法を用いる.集合X に対して,X のすべての部分集合の集合をP(X)と 表す.ℜn+は各成分が非負であるようなn次元実ベクトルの集合を表す.すなわち,ℜn+ := {x ∈ ℜn | xi ≥ 0(i =1, . . . ,n)}である.ベクトルx ∈ ℜn に対して,∥x∥ :=√
xTx はユークリッドノルムを表す.行列 M ∈ ℜn×m に対して,∥M∥F :=(∑n
i=1
∑m
j=1(Mi j)2)1/2はフロベニウスノルムを表す.
2
定式化本報告書では,N 人のプレイヤーが,それぞれ自らのコスト関数を最小化しようとする非協力ゲームを考え る.各プレイヤーi∈ {1, . . . ,N}に対して,xi ∈ ℜmi をプレイヤーiの戦略,集合Si ⊆ ℜmi を許容戦略集合,
fi :ℜm1× · · · × ℜmN → ℜをコスト関数とする.また,表記を簡単にするために,以下の記号を導入する.
x :=(xj)Nj=1 x−i :=(xj)Nj=1,j̸=i
m :=
∑N i=1
mi m−i :=m−mi
S−i :=
∏N j=1,j̸=i
Sj
情報完備の前提が満たされるならば,各プレイヤーi は他のN −1人のプレイヤーの戦略x−i を固定した 次の最小化問題を解くことによって,自らの戦略を決定する.
minimize
xi
fi(xi,x−i) subject to xi ∈Si
(1)
各プレイヤーi ∈ {1, . . . ,N}に対して,xi ∈argminxi∈Si fi(xi,x−i)が成り立つとき,点(x1,x2, . . . ,xN)を Nash均衡解と呼ぶ.すなわち,各プレイヤーがそれぞれ戦略x1,x2, . . . ,xN をとるとき,どのプレイヤーも 戦略を変える動機を持たないことを意味する.Nash均衡解の概念が意味をもつためには,各プレイヤーが自 分以外のN−1人の相手の戦略,あるいは,自分のコスト関数を正確に評価できなければならない.しかし,
実際の問題においては,時間による変化や推定誤差などのため,情報に不確実性が存在する.そこで本報告書 では,不確実な情報をもったゲームを考える.
以下では,不確実な情報をもつN 人非協力ゲームに対して,ロバストNash均衡解を定義する.各プレイ
ヤーi ∈ {1, . . . ,N}がとる行動に対して次の3つの前提条件が成り立っているものとする.
1. プレイヤーiのコスト関数は,パラメータui ∈ ℜνi に依存して,fiui :ℜmi × ℜm−i → ℜと表される.
しかし,プレイヤーiはそのパラメータuiを厳密には推定できず,空でない集合Ui ⊆ ℜνi に含まれて いると予想する.
2. プレイヤーi は他のN−1人のプレイヤーの戦略x−i を正確に知っているが,実際にコスト関数の値 が計算されるときには,他者の戦略はx−i+δx−i のようにδx−i だけの「ずれ」を含んだ形で評価され る.しかし,プレイヤーiはδx−i の値を事前に知ることはできず,xˆ−i :=x−i+δx−i が,空でない集 合X−i(x−i)に含まれていると予想する.
3. プレイヤーiは条件1,2の下で起こり得る最悪のケースを想定し,そのコストを最小化しようとする.
このとき,プレイヤーiが想定する最悪のコストを表す関数 f˜i :ℜmi × ℜm−i →(−∞,+∞]は次のように定 義できる.
f˜i(xi,x−i):=sup{fiuˆi(xi,xˆ−i)| ˆui ∈Ui,xˆ−i ∈ X−i(x−i)} (i =1, . . .N) (2) さらに,各プレイヤーi∈ {1, . . . ,N}が解くべき最小化問題は以下で表される.
minimize
xi
f˜i(xi,x−i) subject to xi ∈Si
(3)
以上の準備の下で,ロバストNash均衡解を定義する.
定義2.1. 関数 f˜i が(2)で定義されているとする.さらに,ある戦略の組(x1, . . . ,xN)∈ S1× · · · ×SN が,
xi ∈argminxi∈Si f˜i(xi,x−i) (i =1, . . . ,N)を満たしている,すなわち,ゲーム(3)のNash均衡解になってい るとする.このとき,戦略の組(x1, . . . ,xN)をゲーム(1)のロバストNash均衡解という.
3
ロバストNash
均衡解の存在本節では,ロバストNash均衡解が存在するための十分条件を与える.そのために,まず,点-集合写像の連 続性を定義する[9, P.89].なお,前節の前提条件2の中で与えられているX−i(·)は,点-集合写像とみなせる ことに注意する.
定義3.1.
1. 点-集合写像 A : U → P(X)が点u ∈ U のまわりで一様有界であり,さらにuk → u,xk → x かつ xk ∈ A(uk)(k=1,2, . . . )であるような任意の点列{uk} ⊆U ,{xk} ⊆X に対してx∈ A(u)が成立する とき,点uにおいて上半連続であるという.
2. 点-集合写像A : U →P(X)がuk →u ∈U となる任意の点列{uk} ⊆Uとx∈ A(u)を満たす任意の 点x ∈ Xに対して,xk → xかつxk ∈ A(uk)(k≥k0)であるような整数k0>0と点列{xk} ⊆ Xが存 在するとき,点uにおいて下半連続であるという.
3. 点-集合写像 A : U →P(X)がu ∈U において上半連続かつ下半連続であるとき,点uにおいて連続 であるという.
以下では,前節の条件1,2で与えられているX−i(·)とUi および関数 fui,集合Si (i =1, . . . ,N)に対して,
次の仮定が満たされているとする.
仮定1.
(a) Gi(xi,x−i,ui):= fiui(xi,x−i)で定義される関数Gi :ℜmi × ℜm−i × ℜνi → ℜは,任意の点(xi,x−i,ui) で連続である.
(b) 任意のx−i ∈ ℜm−i において,点-集合写像X−i :ℜm−i →P(ℜm−i)は連続であり,X−i(x−i)は空でない コンパクト集合である.
(c) Ui ⊆ ℜνi は,空でないコンパクト集合である.
(d) Si は空でないコンパクト凸集合である.また,x−i,ui を任意に固定したとき,関数 fiui(·,x−i):ℜmi → ℜ はSi上で凸である.
この仮定1(a)–(c)より,f˜i はすべての(xi,x−i)∈ ℜmi × ℜm−i において有限値をとり,連続となる.また,
すべてのi ∈ {1, . . . ,N}に対して次の補題が成り立つ.
補題3.1. 仮定1が成り立つとする.このとき,任意に固定したx−i ∈S−iに対して,関数 f˜i(·,x−i):ℜmi → ℜ はSi 上で凸である.
証明. プレイヤーi ∈ {1, . . . ,N}を任意に選び,他者の戦略x−i ∈S−i を任意に固定する.さらに,表記の簡 単のため,変数,集合,関数を以下のように書き直す.
y :=xi, wˆ :=(ˆui,xˆ−i)T, gwˆ(y):= fiuˆi(xi,xˆ−i), W :=Ui ×X−i(x−i)
ここで,x−i は定数,xˆ−i はパラメータとみなしていることに注意する.このとき,以下で定義される関数
˜
g :ℜmi → ℜが凸であることを示せばよい.
˜
g(y):=sup{gwˆ(y)| ˆw∈W} (4) 仮定1より,任意のwˆ ∈Wに対して,gwˆ はSi 上で凸である.さらに,(4)より,任意のy∈Siおよびwˆ ∈W に対して,gwˆ(y)≤ ˜g(y)が成り立つ.よって,gwˆ(y)のwˆ ∈W に対する連続性(仮定1(a))と,W のコンパ クト性(仮定1(b)(c))から,任意のy∈Si に対して,
w(y)∈arg max{gwˆ(y)| ˆw∈W}
が存在する.ここで,任意のy1,y2∈ Si とα∈[0,1]に対して,y3:=(1−α)y1+αy2∈Si とおくと,
˜
g(y3)=gw(y3)(y3)
≤(1−α)gw(y3)(y1)+αgw(y3)(y2)
≤(1−α)gw(y1)(y1)+αgw(y2)(y2)
=(1−α)g˜(y1)+αg˜(y2)
を得る.これは,g˜がSi 上で凸であることを示している.
次の補題は,N人の非協力ゲームに対するよく知られた結果である.
補題 3.2. [3, Theorem 9.1.1] N 人の非協力ゲームにおいて,各プレイヤーi ∈ {1, . . . ,N}のコスト関数 θi :ℜmi × ℜm−i → ℜが任意の点(xi,x−i)∈Si ×S−i において連続であり,さらにx−i ∈ S−i を任意に固定 したとき,関数θi(·,x−i)がSi 上で凸であるとする.また,戦略集合Si は,空でないコンパクト凸集合であ るとする.そのとき,このゲームは少なくとも一つのNash均衡解をもつ.
この2つの補題から,ゲーム(1)におけるロバストNash均衡解の存在定理が得られる.
定理3.1. 仮定1が成り立つとする.このとき,ゲーム(1)は少なくとも一つのロバストNash均衡解をもつ.
証明. 補題3.1より,f˜i(·,x−i)はSi上で凸である.また,f˜i は連続関数である.よって,補題3.2から,ゲー ム(3)はNash均衡解をもつ.これは,定義2.1から,ゲーム(1)が少なくとも一つのロバストNash均衡解を もつことを示している.
4
ロバストNash
均衡解の一意性前節では,ロバストNash均衡解が存在するための十分条件を考えた.しかし,情報完備ゲームにおける Nash均衡解と同様,ロバストNash均衡解は一般に複数存在し,そのすべてを知るのは困難である.ところ が,情報完備ゲームにおけるNash均衡解は,ある条件の下で一意に存在することが知られている.実際,
Rosen [19]は各プレイヤーの利得関数が連続的微分可能な情報完備ゲームに対して,解が一意に存在するため
の条件を与えた.そこで示されている条件は,ゲームを等価な変分不等式問題(Variational Inequality Problem
: VIP)に変換したときに,そのVIPに含まれる写像が狭義単調性をもつことにほかならない.そこで,本節
では,ロバストNash均衡解が一意に存在するための十分条件について考える.具体的には,Nash均衡問題,
及びロバストNash均衡問題とそれぞれ等価な変分不等式問題を導く.次に,VIPに対する結果を用いて,ロ バストNash均衡解の一意性を考える.なお,本節では簡単のため,各プレイヤーのコスト関数 fiui は連続的 微分可能であると仮定する.
変分不等式問題VIP(F,S)とは,ベクトル値写像 Fと空でない閉凸集合Sが与えられたとき,次の条件を 満たすベクトルx∈Sを求める問題である[7].
⟨F(x),y−x⟩ ≥0 ∀y∈S (5) 変分不等式問題は,ベクトル方程式や相補性問題,最適化問題などを含む幅広いクラスの問題である.実際,
S= ℜnとするとVIP(5)はベクトル方程式F(x)=0と等価であるし,S = ℜn+とするとVIP(5)は非線形相 補性問題x ≥0,F(x)≥0,xTF(x)=0と等価である.VIP(F,S)については,写像F が以下で定義される狭 義単調性をもつとき,解は存在すれば一意であることが知られている.
定義4.1. ベクトル値写像F :ℜn→ ℜnと空でない凸集合S⊆ ℜnが与えられているとする.このとき,任 意のx,y∈S(x̸=y)に対して
⟨x−y,F(x)−F(y)⟩ ≥(>)0
が成り立つならば,写像FはSにおいて単調(狭義単調)であるという.
定理4.1. [9,定理5.4]ベクトル値写像Fを連続写像,Sを空でない閉凸集合とする.そのとき,FがSにお
いて狭義単調であれば,変分不等式問題(5)の解は存在すれば一意である.
さらに,Fが微分可能であれば,その導関数を調べることにより,Fの狭義単調性をチェックできる.
定理4.2. [9,定理2.67] F :ℜn → ℜnを連続的微分可能なベクトル値関数とする.このときF が狭義単調で
あるための十分条件は,∇F(x)が任意のxに対して正定値になることである.
さて,ゲーム(1)において,x−i ∈ S−i を任意に固定した関数 fi(·,x−i)が連続的微分可能とし,Si は空で ない閉凸集合であるとしよう.このとき,F とSを次のように定めると,ゲーム(1)に対するNash均衡問題 はVIP(5)と等価になる.
x :=(xi)i=1,...,N
F(x):=(
∇i fi(xi,x−i))
i=1,...,N (6)
S :=S1× · · · ×SN
ここで,∇i fi は,プレイヤーiの戦略xiのみを変数と見たときの関数 fi の勾配∇xi fi を意味している.従っ て,定理4.1より,(6)で定められるFがSにおいて狭義単調ならば,ゲーム(1)のNash均衡解は存在すれ ば一意である.さらに,補題3.2の仮定が成り立てば,Nash均衡解の存在も保証される.
もし,(2)で定義される f˜iが微分可能であれば,ロバストNash均衡問題も上と同様に等価なVIPへと再定 式化できる.しかし,たとえ fiui が微分可能であっても,f˜i は微分可能であるとは限らない.そこで,微分 不可能な凸関数に対して,劣微分写像と呼ばれる点-集合写像を定義し,ロバストNash均衡問題を,ベクト ル値写像の代わりに点-集合写像を用いた一般化変分不等式問題(Generalized Variational Inequality Problem :
GVIP)に再定式化することを考える.
一般化変分不等式問題GVIP(F,S)とは,点-集合写像Fと空でない閉凸集合Sに対して,次のように定義 される問題である.
Find x∈S
such that ξ ∈F(x)
⟨ξ,y−x⟩ ≥0, ∀y∈ S
(7)
GVIPについてもVIPと同様,点-集合写像が以下で定義される狭義単調性をもつとき,解は存在すれば一 意であることが知られている[8].
定義4.2. 点-集合写像A :ℜn→P(ℜn)と空でない凸集合S ⊆ ℜnが与えられているとする.このとき,任 意のx,y∈S(x̸=y)とξ ∈ A(x), η∈ A(y)に対して,
⟨x−y, ξ−η⟩ ≥(>)0
が成り立つならば,点-集合写像 AはSにおいて単調(狭義単調)であるという.
定理4.3. 点-集合写像F :ℜn →P(ℜn)がSにおいて狭義単調であれば,GVIP(7)の解は,存在すれば一意 である.
ロバストNash均衡問題をGVIPに再定式化する.まず,凸関数に対して劣微分写像を定義する.
定義4.3. 凸関数 f :ℜn→ ℜに対して,以下のように定義される集合∂f(x)⊆ ℜnを f の点xにおける劣微 分という.
∂f(x)= {ξ ∈ ℜn| f(y)− f(x)≥ ⟨ξ,y−x⟩(∀y∈ ℜn)}
劣微分写像とは,任意の点x∈ ℜnに関数 f の劣微分∂f(x)を対応させる点-集合写像である.
点-集合写像F :ℜm → P(ℜm)と集合S を次のように定義すると,ロバストNash均衡問題はGVIP(7)と 等価になる.
F(x):=(
∂if˜i(xi,x−i))
i=1,...,N (8)
S :=S1× · · · ×SN
ここで,∂if˜i は,プレイヤーiの戦略xi のみを変数と見たときの関数 f˜i の劣微分∂xi f˜iを意味している.
仮定1が成り立つとき,定理3.1よりロバストNash均衡解が存在するので,それと等価なGVIP(7)にも 解が存在する.したがって,定理4.3より,(8)で定義される点-集合写像F が狭義単調であれば,ロバスト Nash均衡解は一意に存在することがわかる.
次に,Fが狭義単調となるための条件を与える.仮定1に加えて,次の仮定を満たす場合を考える.
仮定2.
(a) 集合Ui は唯一の要素からなる.
(b) コンパクト集合Y−i ⊆ ℜm−i が存在して,X−i(x−i)=x−i+Y−i と書ける.
(c) 任意に xi を固定した関数 fiui(xi,·) : ℜm−i → ℜはアフィンである.すなわち,ある関数gi :ℜmi → ℜ, hi : ℜmi → ℜm−i が存在して,fiui(xi,y−i) := gi(xi)+hi(xi)Ty−i と書ける.さらに,任意の y−i ∈Y−i に対して,θi(xi):=h(xi)Ty−i で定義される関数θiはSi 上で凸である.
仮定2(a)より,本節では,関数 fiui (i =1, . . . ,N)を単に fi と書くことにする.また,仮定2(b)(c)より,
f˜i(xi,x−i)= max
ˆ
x−i∈X−i(x−i) fi(xi,xˆ−i)
= max
δx−i∈Y−i
fi(xi,x−i+δx−i)
= fi(xi,x−i)+ max
δx−i∈Y−i
hi(xi)Tδx−i (9)
と書くことができる.
補題4.1. 仮定2が成り立っているとする.このとき,F が狭義単調であれば,(8)で定義される点-集合写像 Fも狭義単調である.
証明. ψi(xi):=maxδx−i∈Y−i hi(xi)Tδx−i とおく.このとき,(9)より,f˜iのxi についての劣微分は以下で表 される.
∂if˜i(xi,x−i)= ∇ifi(xi,x−i)+∂ψi(xi)
また,F(x)は以下で表される.
F(x)=F(x)+∂ψ1(x1)× · · · ×∂ψN(xN)
関数ψiは,仮定2(c)より凸であるから,その劣微分写像∂ψi はSi 上で単調である[9,定理2.68].すなわち,
任意のxi,yi ∈ Siとξ˜i ∈∂ψi(xi),η˜i ∈∂ψi(yi)に対して,
⟨xi−yi,ξ˜i− ˜ηi⟩ ≥0
が成り立つ.よって,任意のx,y∈Sとξ ∈F(x), η∈F(y)に対して,
⟨x−y, ξ−η⟩ = ⟨x−y,F(x)−F(y)⟩ +
∑N i=1
⟨xi −yi,ξ˜i − ˜ηi⟩>0
が成り立つ.したがって,Fは狭義単調である.
以上の補題より,ロバストNash均衡解の一意性に関する次の定理を得る.
定理4.4. 仮定1および仮定2が成り立つとする.このとき,(6)で定義されるF が狭義単調であれば,ロバ ストNash均衡解は一意に存在する.
証明. 仮定1と定理3.1より,ロバストNash均衡解は存在する.さらに,補題4.3,補題4.1により,ロバス トNash均衡解は一意である.
5
ロバストNash
均衡問題の二次錐相補性問題への定式化本節では,各プレイヤーが混合戦略をとり,各々のコスト関数が自分の戦略に関する凸2次関数で表される ゲームを考える.特に,コスト関数のパラメータや相手の戦略の評価値に対する不確実性集合がユークリッド ノルムやフロベニウスノルムを用いて表せるようなある種のゲームに対して,ロバストNash均衡問題が二次 錐相補性問題(SOCCP)として定式化できることを示し,その解の存在性や一意性を議論する.
一般に,SOCCPとは次の条件を満たすベクトル(ξ, η, ζ)∈ ℜl× ℜl× ℜνを求める問題である.
K∋ξ ⊥η∈K, G(ξ, η, ζ)=0 (10)
ただし,G :ℜl× ℜl× ℜν → ℜl× ℜν は与えられた関数であり,ξ ⊥ηは,ξTη=0を意味する.また,Kは,
Klj = {(ζ1, ζ2)∈ ℜ×ℜlj−1| ∥ζ2∥ ≤ζ1}で定義されるlj 次元の二次錐Klj を用いてK=Kl1×Kl2×· · ·×Klm で定義される閉凸錐である.SOCCPに対しては,平滑化法や再定式化法などのアルゴリズムが提案されてい る[10].本報告書では,特に次の二次錐相補性条件を満たすベクトルζ を求める問題を考える.
K∋Mζ+q ⊥Nζ+r∈K, Cζ =d (11) ここで,ζ ∈ ℜl+τ は変数で,M,N ∈ ℜl×(l+τ), q,r ∈ ℜl,C ∈ ℜτ×(l+τ),d ∈ ℜτ は定数である.新しい変数 ξ, η∈ ℜlを用いて,次のように関数G :ℜ3l+τ → ℜ2l+τを定義すれば,SOCCP(11)はSOCCP(10)と等価で ある.
G(ξ, η, ζ):=
ξ −Mζ −q η−Nζ −r
Cζ−d
本節では,各プレイヤーi ∈ {1, . . . ,N}のコスト関数 fi が行列Ai ∈ ℜmi×mi,Bi j ∈ ℜmi×mj,および,ベク トルci ∈ ℜmi を用いて,
fi(xi,x−i)= 1
2(xi)TAixi+(xi)T
∑N
j=1,j̸=i
Bi jxj+ci
(12)
= 1
2(xi)TAixi+(xi)T(Bix−i +ci)
と表される場合を考える.ここで,Bi ∈ ℜmi×m−i は Bi =[
Bi 1 · · · Bi(i−1) Bi(i+1) · · · Bi N]
を表す.以下では,行列Ai は半正定値であるとし,戦略は混合戦略,すなわち戦略集合S−i が Si = {xi |xi ≥0, eTm
ixi =1} (13)
と表される場合を考える.ただし,emi =(1,1, . . . ,1)T ∈ ℜmi である.このとき,Si は空でないコンパク ト凸集合であることに注意する.また,2節で用いたコスト関数のパラメータui はvec(Ai),vec(Bi j),j =
1, . . . ,N,j ̸= i およびci を並べたベクトルと見なすことができる.ここで vec(·)はm 個の列ベクトル
p1c, . . . ,pmc からなる行列P ∈ ℜn×m からnm-次元のベクトル((pc1)T, . . . , (pmc)T)T を生成するオペレーター である.
5.1
相手の戦略の評価に不確実性がある場合この節では,各プレイヤーがコスト関数の値を計算するときに,その関数に含まれるパラメータは正確に推 定できるが,N −1人の相手プレイヤーの戦略の評価値が不確実性を含む場合を考える.そこで,すべての i ∈ {1, . . . ,N}に対して,次の仮定をおく.
仮定3.
(a) X−i(x−i)= {x−i +δx−i | ∥δxj∥ ≤ρi j, emT
jδxj =0(j ̸=i)}
(b) Ui = {ui}
仮定3(a) において,条件emT
jδxj = 0 は,eTm
j(xj +δxj) = 1かつ emT
jxj = 1による.また,ρi j(i,j = 1,2, . . . ,N,j ̸=i)は与えられた非負の実数である.
この仮定の下で,次の定理が成り立つ.
定理5.1. 各プレイヤーのコスト関数と戦略集合がそれぞれ(12)と(13)で与えられ,仮定3が成り立つとす る.このとき,ロバストNash均衡解が少なくとも一つ存在する.
証明. コスト関数が(12)で与えられているので,仮定1(a)は成り立つ.また,仮定3が成り立つとき,仮定
1(b)(c)が成り立つことは明らかである.さらに仮定1(d)は,Ai ≽ Oおよび混合戦略であることから成り立
つ.よって,仮定1をすべて満たすので,定理3.1よりロバストNash均衡解が存在する.
さらに,解の一意性に関して,次の定理が成り立つ.
定理5.2. 各プレイヤーのコスト関数と戦略集合がそれぞれ(12)と(13)で与えられ,仮定3が成り立つとす る.そのとき,
A1 B12 · · · B1N B21 A2 ...
... ... ...
BN 1 · · · AN
≻O (14)
が成り立つならばロバストNash均衡解は一意である.