• 検索結果がありません。

西村 亮一   Nash 均衡問題と解の一意性 N 人非協力ゲームに対するロバスト

N/A
N/A
Protected

Academic year: 2021

シェア "西村 亮一   Nash 均衡問題と解の一意性 N 人非協力ゲームに対するロバスト"

Copied!
27
0
0

読み込み中.... (全文を見る)

全文

(1)

特別研究報告書

N

人非協力ゲームに対する

ロバスト

Nash

均衡問題と解の一意性

指導教員 福嶋雅夫 教授      林 俊介 助手     

京都大学工学部情報学科 数理工学コース

平成15年4月入学 平成19年3月卒業

西村 亮一

平成19年1月31日提出

(2)

N

人非協力ゲームに対する

ロバスト

Nash

均衡問題と解の一意性 

西村 亮一 摘要

非協力ゲームとは,各プレイヤーが他のプレイヤーとは独立に意思決定する状況をモデル化した ものであり,その重要な均衡概念として知られるのがNash均衡である.Nash均衡は,各プレイ ヤーがゲームのルールについて完全な知識,すなわち,ゲームのすべてのパラメータや各プレイ ヤーのコスト関数などの情報を持ち,それ自体がプレイヤーの共通認識であるという前提の下で意 味をもつ.しかし,現実の問題においては,その前提が満たされるとは限らない.そこで,ゲーム のルールについてプレイヤーが不確実な情報しかもたない情報不完備ゲームをモデル化することが 重要になってくる.これまで情報不完備ゲームに対して多くの研究がなされてきたが,本報告書で は,その中でも特に各プレイヤーが不確実な情報の下で,ロバスト最適化と呼ばれる概念に基づい て自分の戦略を決定することを仮定したモデルを考える.このモデルにおいて起こり得る均衡状態 をロバストNash均衡といい,その均衡点を求める問題をロバストNash均衡問題という.

本報告書では,まず,既存のロバストNash均衡の概念をより一般化し,プレイヤーの数がN で,各プレイヤーのコスト関数(利得関数)が自分の戦略に関して非線形な場合に対して,ロバス Nash均衡を定義する.さらに,コスト関数や戦略集合に対する凸性とコンパクト性の仮定のも とで,ロバストNash均衡解の存在性を示す.さらに,ロバストNash均衡問題を等価な一般化変 分不等式問題に変換することにより,ロバストNash均衡解が一意に存在するための十分条件を与 える.特に,各プレイヤーのコスト関数が二次の項を含み,不確実性を表す集合が二次のノルムを 用いて表されるロバストNash均衡問題を二次錐相補性問題として再定式化できることを示す.二 次錐相補性問題に対するアルゴリズムを用いた数値実験を行い,ロバストNash均衡解の性質を調 べる.

(3)

目次

1 序論 1

2 定式化 2

3 ロバストNash均衡解の存在 3

4 ロバストNash均衡解の一意性 5

5 ロバストNash均衡問題の二次錐相補性問題への定式化 8 5.1 相手の戦略の評価に不確実性がある場合 . . . 9 5.2 コスト関数に不確実性がある場合 . . . 12

6 数値実験 15

6.1 ロバストNash均衡解とコスト関数値の関係 . . . 16 6.2 不確実性集合の大きさとロバストNash均衡解の関係 . . . 18

7 結論 23

(4)

1

序論

私たちは,個人,または企業などの組織において,様々な意思決定を行っている.私たちの意思決定は,他の 人々の意思決定に影響を及ぼし,同様に他の人々の意思決定は,私たちの意思決定に影響を及ぼす.ゲーム理 論は,経済や社会における様々な意思決定を数理的な方法論を用いて分析する理論である[18]Nash [16, 17]

は非協力ゲームを最初に定義し,それに対して均衡解(Nash均衡解)の概念を提示した.Nash均衡解は,各 プレイヤーはゲームのルールについて完全な知識,すなわち,ゲームのすべてのパラメータや各プレイヤーの コスト関数などの情報を持ち,またそれ自体がプレイヤーの共通認識であるという前提の下で意味をもつ.こ の前提を情報完備という.しかし,現実の問題において,情報完備の前提が満たされるとは限らない.そこ で,ゲームのルールについてプレイヤーが不完全な知識しか持っていない情報不完備ゲームが多くの研究者に よって研究されている.

Harsanyi [13, 14, 15]は,情報不完備ゲームを定式化した.その定式化では,不確実な情報の下での意思決

定に対して,それらの真の値を確率分布の形で予想し,各プレイヤーはその確率分布のもとでの期待値を最適 化するというベイジアン仮説を採用した.さらに,確率分布に対するある仮定の下で,情報不完備ゲームを変 換してベイジアンゲームを定義した.ベイジアンゲームは,情報不完備ゲームから定義されるゲームである が,ベイジアンゲームの構成要素に関しては完全な知識をもつ情報完備ゲームである.情報不完備ゲームとベ イジアンゲームは,プレイヤーにとって戦略上の観点からは同値であると見なせる.

Aghassi and Bertsimas [1]Hayashi, Yamashita, and Fukushima [11]は,情報不完備ゲームに対して,ベイ ジアンゲームの仮定を緩和して確率分布を用いないモデルを提案した.彼らのモデルでは,各プレイヤーがロ バスト最適化[4, 5, 6]を行うことにより自分の戦略を決定することが仮定されている.ここで,ロバスト最 適化とは,不確実なパラメータを含むが,そのパラメータが少なくともある範囲内(不確実性集合)に入っ ていることが期待できる最適化問題に対して,その範囲内で起こり得る最悪のケースを想定して最適化を行 うものである.各プレイヤーがロバスト最適化を行った結果起こり得る均衡状態をロバストNash均衡とい う.また,そのような均衡点を求める問題をロバストNash均衡問題という.Aghassi[1]は,N人のプレ イヤーがそれぞれ線形計画問題(Linear Programming : LP)を解くようなゲームを考え,それに対してロバス Nash均衡*1を定義した.さらに,不確実性集合が凸多面体である問題に対して,ロバストNash均衡解を 求める方法を提案した.Hayashi[11]は,Aghassi[1]とは独立に,双行列ゲームに対してロバストNash 均衡の概念を定義した.彼らは,不確実性集合がユークリッドノルムやフロベニウスノルムを用いて表される という仮定の下で,各プレイヤーの解くべき最適化問題を二次錐計画問題(Second-Order Cone Programming : SOCP[2]として再定式化し,その結果,ロバストNash均衡問題が二次錐相補性問題(Second-Order Cone Complementarity Problem : SOCCP)に帰着されることを示した.なお,Aghassi[1]のモデルでは,各プレ イヤーが解くべき最適化問題に含まれる行列やベクトルのみに不確実性が仮定されているのに対し,Hayashi [11]は,他のプレイヤーの戦略にも不確実性が存在する場合も取り扱っている.

本報告書では,Hayashi [11]らの取り扱った問題を拡張して,N 人非協力ゲームに対するロバストNash 衡の概念を定義する.特に,解の存在性を示すにあたって,Aghassi[1]Hayashi [11]は,各プレイ ヤーのコスト関数(利得関数)が自分の戦略に対して線形な場合のみを考えたが,本報告書ではコスト関数が 自分の戦略に関して凸な関数を考える.そして,適当な仮定の下で,ロバストNash均衡解が一意に存在する

*1Aghassiらの論文ではロバスト最適化均衡と書かれているが,実質的に同じものである.

(5)

ことを示す.また,Hayashi[11]が提案した手法を用いて,各プレイヤーのコスト関数が自分の戦略に関し 2次の項を含むようなロバストNash均衡問題をSOCCPに再定式化する.

本報告書の構成は,次の通りである.第2節では本報告書で扱うゲームを定式化し,ロバストNash均衡の 概念を定義する.第3節でロバストNash均衡解の存在条件を示す.第4節では適当な仮定の下で,ロバスト Nash均衡解が一意に存在することを示す.第5節では,いくつかのケースに対して,ロバストNash均衡問

題をSOCCPに再定式化する.第6節で,それらの問題に対する数値実験を行ってロバストNash均衡解の性

質を調べる.

本報告書を通じて,以下の表記法を用いる.集合X に対して,X のすべての部分集合の集合をP(X) 表す.n+は各成分が非負であるようなn次元実ベクトルの集合を表す.すなわち,n+ := {x ∈ ℜn | xi ≥ 0(i =1, . . . ,n)}である.ベクトルx ∈ ℜn に対して,x∥ :=√

xTx はユークリッドノルムを表す.行列 M ∈ ℜn×m に対して,MF :=(n

i=1

m

j=1(Mi j)2)1/2はフロベニウスノルムを表す.

2

定式化

本報告書では,N 人のプレイヤーが,それぞれ自らのコスト関数を最小化しようとする非協力ゲームを考え る.各プレイヤーi∈ {1, . . . ,N}に対して,xi ∈ ℜmi をプレイヤーiの戦略,集合Si ⊆ ℜmi を許容戦略集合,

fi :ℜm1× · · · × ℜmN → ℜをコスト関数とする.また,表記を簡単にするために,以下の記号を導入する.

x :=(xj)Nj=1 xi :=(xj)Nj=1,j̸=i

m :=

N i=1

mi mi :=mmi

Si :=

N j=1,j̸=i

Sj

情報完備の前提が満たされるならば,各プレイヤーi は他のN −1人のプレイヤーの戦略xi を固定した 次の最小化問題を解くことによって,自らの戦略を決定する.

minimize

xi

fi(xi,xi) subject to xiSi

(1)

各プレイヤーi ∈ {1, . . . ,N}に対して,xi ∈argminxiSi fi(xi,xi)が成り立つとき,点(x1,x2, . . . ,xN) Nash均衡解と呼ぶ.すなわち,各プレイヤーがそれぞれ戦略x1,x2, . . . ,xN をとるとき,どのプレイヤーも 戦略を変える動機を持たないことを意味する.Nash均衡解の概念が意味をもつためには,各プレイヤーが自 分以外のN−1人の相手の戦略,あるいは,自分のコスト関数を正確に評価できなければならない.しかし,

実際の問題においては,時間による変化や推定誤差などのため,情報に不確実性が存在する.そこで本報告書 では,不確実な情報をもったゲームを考える.

以下では,不確実な情報をもつN 人非協力ゲームに対して,ロバストNash均衡解を定義する.各プレイ

ヤーi ∈ {1, . . . ,N}がとる行動に対して次の3つの前提条件が成り立っているものとする.

1. プレイヤーiのコスト関数は,パラメータui ∈ ℜνi に依存して,fiui :ℜmi × ℜmi → ℜと表される.

(6)

しかし,プレイヤーiはそのパラメータuiを厳密には推定できず,空でない集合Ui ⊆ ℜνi に含まれて いると予想する.

2. プレイヤーi は他のN−1人のプレイヤーの戦略xi を正確に知っているが,実際にコスト関数の値 が計算されるときには,他者の戦略はxi+δxi のようにδxi だけの「ずれ」を含んだ形で評価され る.しかし,プレイヤーiδxi の値を事前に知ることはできず,xˆi :=xi+δxi が,空でない集 Xi(xi)に含まれていると予想する.

3. プレイヤーiは条件1,2の下で起こり得る最悪のケースを想定し,そのコストを最小化しようとする.

このとき,プレイヤーiが想定する最悪のコストを表す関数 f˜i :ℜmi × ℜmi(−∞,+∞]は次のように定 義できる.

f˜i(xi,xi):=sup{fiuˆi(xi,xˆi)| ˆuiUi,xˆiXi(xi)} (i =1, . . .N) (2) さらに,各プレイヤーi∈ {1, . . . ,N}が解くべき最小化問題は以下で表される.

minimize

xi

f˜i(xi,xi) subject to xiSi

(3)

以上の準備の下で,ロバストNash均衡解を定義する.

定義2.1. 関数 f˜i (2)で定義されているとする.さらに,ある戦略の組(x1, . . . ,xN)S1× · · · ×SN が,

xi ∈argminxiSi f˜i(xi,xi) (i =1, . . . ,N)を満たしている,すなわち,ゲーム(3)Nash均衡解になってい るとする.このとき,戦略の組(x1, . . . ,xN)をゲーム(1)のロバストNash均衡解という.

3

ロバスト

Nash

均衡解の存在

本節では,ロバストNash均衡解が存在するための十分条件を与える.そのために,まず,点-集合写像の連 続性を定義する[9, P.89].なお,前節の前提条件2の中で与えられているXi(·)は,点-集合写像とみなせる ことに注意する.

定義3.1.

1. -集合写像 A : UP(X)が点uU のまわりで一様有界であり,さらにuku,xkx かつ xkA(uk)(k=1,2, . . . )であるような任意の点列{uk} ⊆U ,{xk} ⊆X に対してxA(u)が成立する とき,点uにおいて上半連続であるという.

2. -集合写像A : UP(X)ukuU となる任意の点列{uk} ⊆UxA(u)を満たす任意の xXに対して,xkxかつxkA(uk)(kk0)であるような整数k0>0と点列{xk} ⊆ Xが存 在するとき,点uにおいて下半連続であるという.

3. -集合写像 A : UP(X)uU において上半連続かつ下半連続であるとき,点uにおいて連続 であるという.

以下では,前節の条件1,2で与えられているXi(·)Ui および関数 fui,集合Si (i =1, . . . ,N)に対して,

次の仮定が満たされているとする.

(7)

仮定1.

(a) Gi(xi,xi,ui):= fiui(xi,xi)で定義される関数Gi :ℜmi × ℜm−i × ℜνi → ℜは,任意の点(xi,xi,ui) で連続である.

(b) 任意のxi ∈ ℜmi において,点-集合写像Xi :ℜmiP(ℜmi)は連続であり,Xi(xi)は空でない コンパクト集合である.

(c) Ui ⊆ ℜνi は,空でないコンパクト集合である.

(d) Si は空でないコンパクト凸集合である.また,xi,ui を任意に固定したとき,関数 fiui(·,xi):ℜmi → ℜ Si上で凸である.

この仮定1(a)–(c)より,f˜i はすべての(xi,xi)∈ ℜmi × ℜmi において有限値をとり,連続となる.また,

すべてのi ∈ {1, . . . ,N}に対して次の補題が成り立つ.

補題3.1. 仮定1が成り立つとする.このとき,任意に固定したxiSiに対して,関数 f˜i(·,xi):ℜmi → ℜ Si 上で凸である.

証明. プレイヤーi ∈ {1, . . . ,N}を任意に選び,他者の戦略xiSi を任意に固定する.さらに,表記の簡 単のため,変数,集合,関数を以下のように書き直す.

y :=xi, wˆ :=(ˆui,xˆi)T, gwˆ(y):= fiuˆi(xi,xˆi), W :=Ui ×Xi(xi)

ここで,xi は定数,xˆi はパラメータとみなしていることに注意する.このとき,以下で定義される関数

˜

g :mi → ℜが凸であることを示せばよい.

˜

g(y):=sup{gwˆ(y)| ˆwW} (4) 仮定1より,任意のwˆ ∈Wに対して,gwˆ Si 上で凸である.さらに,(4)より,任意のySiおよびwˆ ∈W に対して,gwˆ(y)≤ ˜g(y)が成り立つ.よって,gwˆ(y)wˆ ∈W に対する連続性(仮定1(a))と,W のコンパ クト性(仮定1(b)(c))から,任意のySi に対して,

w(y)∈arg max{gwˆ(y)| ˆwW}

が存在する.ここで,任意のy1,y2Si α∈[0,1]に対して,y3:=(1−α)y1+αy2Si とおくと,

˜

g(y3)=gw(y3)(y3)

(1−α)gw(y3)(y1)+αgw(y3)(y2)

(1−α)gw(y1)(y1)+αgw(y2)(y2)

=(1−α)g˜(y1)+αg˜(y2)

を得る.これは,g˜Si 上で凸であることを示している.

次の補題は,N人の非協力ゲームに対するよく知られた結果である.

補題 3.2. [3, Theorem 9.1.1] N 人の非協力ゲームにおいて,各プレイヤーi ∈ {1, . . . ,N}のコスト関数 θi :ℜmi × ℜm−i → ℜが任意の点(xi,xi)Si ×Si において連続であり,さらにxiSi を任意に固定 したとき,関数θi(·,xi)Si 上で凸であるとする.また,戦略集合Si は,空でないコンパクト凸集合であ るとする.そのとき,このゲームは少なくとも一つのNash均衡解をもつ.

(8)

この2つの補題から,ゲーム(1)におけるロバストNash均衡解の存在定理が得られる.

定理3.1. 仮定1が成り立つとする.このとき,ゲーム(1)は少なくとも一つのロバストNash均衡解をもつ.

証明. 補題3.1より,f˜i(·,xi)Si上で凸である.また,f˜i は連続関数である.よって,補題3.2から,ゲー (3)Nash均衡解をもつ.これは,定義2.1から,ゲーム(1)が少なくとも一つのロバストNash均衡解を もつことを示している.

4

ロバスト

Nash

均衡解の一意性

前節では,ロバストNash均衡解が存在するための十分条件を考えた.しかし,情報完備ゲームにおける Nash均衡解と同様,ロバストNash均衡解は一般に複数存在し,そのすべてを知るのは困難である.ところ が,情報完備ゲームにおけるNash均衡解は,ある条件の下で一意に存在することが知られている.実際,

Rosen [19]は各プレイヤーの利得関数が連続的微分可能な情報完備ゲームに対して,解が一意に存在するため

の条件を与えた.そこで示されている条件は,ゲームを等価な変分不等式問題(Variational Inequality Problem

: VIP)に変換したときに,そのVIPに含まれる写像が狭義単調性をもつことにほかならない.そこで,本節

では,ロバストNash均衡解が一意に存在するための十分条件について考える.具体的には,Nash均衡問題,

及びロバストNash均衡問題とそれぞれ等価な変分不等式問題を導く.次に,VIPに対する結果を用いて,ロ バストNash均衡解の一意性を考える.なお,本節では簡単のため,各プレイヤーのコスト関数 fiui は連続的 微分可能であると仮定する.

変分不等式問題VIP(F,S)とは,ベクトル値写像 Fと空でない閉凸集合Sが与えられたとき,次の条件を 満たすベクトルxSを求める問題である[7]

F(x),yx⟩ ≥0 ∀yS (5) 変分不等式問題は,ベクトル方程式や相補性問題,最適化問題などを含む幅広いクラスの問題である.実際,

S= ℜnとするとVIP(5)はベクトル方程式F(x)=0と等価であるし,S = ℜn+とするとVIP(5)は非線形相 補性問題x ≥0,F(x)≥0,xTF(x)=0と等価である.VIP(F,S)については,写像F が以下で定義される狭 義単調性をもつとき,解は存在すれば一意であることが知られている.

定義4.1.  ベクトル値写像F :n→ ℜnと空でない凸集合S⊆ ℜnが与えられているとする.このとき,任 意のx,yS(x̸=y)に対して

xy,F(x)F(y)⟩ ≥(>)0

が成り立つならば,写像FSにおいて単調(狭義単調)であるという.

定理4.1. [9,定理5.4]ベクトル値写像Fを連続写像,Sを空でない閉凸集合とする.そのとき,FSにお

いて狭義単調であれば,変分不等式問題(5)の解は存在すれば一意である.

さらに,Fが微分可能であれば,その導関数を調べることにより,Fの狭義単調性をチェックできる.

定理4.2. [9,定理2.67] F :n → ℜnを連続的微分可能なベクトル値関数とする.このときF が狭義単調で

あるための十分条件は,F(x)が任意のxに対して正定値になることである.

(9)

さて,ゲーム(1)において,xiSi を任意に固定した関数 fi(·,xi)が連続的微分可能とし,Si は空で ない閉凸集合であるとしよう.このとき,F Sを次のように定めると,ゲーム(1)に対するNash均衡問題 VIP(5)と等価になる.

x :=(xi)i=1,...,N

F(x):=(

i fi(xi,xi))

i=1,...,N (6)

S :=S1× · · · ×SN

ここで,i fi は,プレイヤーiの戦略xiのみを変数と見たときの関数 fi の勾配xi fi を意味している.従っ て,定理4.1より,(6)で定められるFSにおいて狭義単調ならば,ゲーム(1)Nash均衡解は存在すれ ば一意である.さらに,補題3.2の仮定が成り立てば,Nash均衡解の存在も保証される.

もし,(2)で定義される f˜iが微分可能であれば,ロバストNash均衡問題も上と同様に等価なVIPへと再定 式化できる.しかし,たとえ fiui が微分可能であっても,f˜i は微分可能であるとは限らない.そこで,微分 不可能な凸関数に対して,劣微分写像と呼ばれる点-集合写像を定義し,ロバストNash均衡問題を,ベクト ル値写像の代わりに点-集合写像を用いた一般化変分不等式問題(Generalized Variational Inequality Problem :

GVIP)に再定式化することを考える.

一般化変分不等式問題GVIP(F,S)とは,点-集合写像Fと空でない閉凸集合Sに対して,次のように定義 される問題である.

Find xS

such that ξF(x)

⟨ξ,yx⟩ ≥0,yS

(7)

GVIPについてもVIPと同様,点-集合写像が以下で定義される狭義単調性をもつとき,解は存在すれば一 意であることが知られている[8]

定義4.2.  点-集合写像A :nP(ℜn)と空でない凸集合S ⊆ ℜnが与えられているとする.このとき,任 意のx,yS(x̸=y)ξA(x), ηA(y)に対して,

xy, ξη⟩ ≥(>)0

が成り立つならば,点-集合写像 ASにおいて単調(狭義単調)であるという.

定理4.3. -集合写像F :ℜnP(ℜn)Sにおいて狭義単調であれば,GVIP(7)の解は,存在すれば一意 である.

ロバストNash均衡問題をGVIPに再定式化する.まず,凸関数に対して劣微分写像を定義する.

定義4.3. 凸関数 f :n→ ℜに対して,以下のように定義される集合∂f(x)⊆ ℜn f の点xにおける劣微 分という.

∂f(x)= {ξ ∈ ℜn| f(y)f(x)≥ ⟨ξ,yx(∀y∈ ℜn)}

劣微分写像とは,任意の点x∈ ℜnに関数 f の劣微分∂f(x)を対応させる点-集合写像である.

(10)

-集合写像F :ℜmP(ℜm)と集合S を次のように定義すると,ロバストNash均衡問題はGVIP(7) 等価になる.

F(x):=(

if˜i(xi,xi))

i=1,...,N (8)

S :=S1× · · · ×SN

ここで,if˜i は,プレイヤーiの戦略xi のみを変数と見たときの関数 f˜i の劣微分xi f˜iを意味している.

仮定1が成り立つとき,定理3.1よりロバストNash均衡解が存在するので,それと等価なGVIP(7)にも 解が存在する.したがって,定理4.3より,(8)で定義される点-集合写像F が狭義単調であれば,ロバスト Nash均衡解は一意に存在することがわかる.

次に,Fが狭義単調となるための条件を与える.仮定1に加えて,次の仮定を満たす場合を考える.

仮定2.

(a) 集合Ui は唯一の要素からなる.

(b) コンパクト集合Yi ⊆ ℜmi が存在して,Xi(xi)=xi+Yi と書ける.

(c) 任意に xi を固定した関数 fiui(xi,·) : ℜmi → ℜはアフィンである.すなわち,ある関数gi :ℜmi → ℜ, hi : ℜmi → ℜmi が存在して,fiui(xi,yi) := gi(xi)+hi(xi)Tyi と書ける.さらに,任意の y−iYi に対して,θi(xi):=h(xi)Ty−i で定義される関数θiSi 上で凸である.

仮定2(a)より,本節では,関数 fiui (i =1, . . . ,N)を単に fi と書くことにする.また,仮定2(b)(c)より,

f˜i(xi,xi)= max

ˆ

x−iX−i(x−i) fi(xi,xˆi)

= max

δx−iY−i

fi(xi,xi+δxi)

= fi(xi,xi)+ max

δx−i∈Yi

hi(xi)Tδxi (9)

と書くことができる.

補題4.1. 仮定2が成り立っているとする.このとき,F が狭義単調であれば,(8)で定義される点-集合写像 Fも狭義単調である.

証明. ψi(xi):=maxδxiYi hi(xi)Tδxi とおく.このとき,(9)より,f˜ixi についての劣微分は以下で表 される.

if˜i(xi,xi)= ∇ifi(xi,xi)+∂ψi(xi)

また,F(x)は以下で表される.

F(x)=F(x)+∂ψ1(x1)× · · · ×∂ψN(xN)

関数ψiは,仮定2(c)より凸であるから,その劣微分写像∂ψi Si 上で単調である[9,定理2.68].すなわち,

任意のxi,yiSiξ˜i∂ψi(xi),η˜i∂ψi(yi)に対して,

xiyi˜i− ˜ηi⟩ ≥0

(11)

が成り立つ.よって,任意のx,ySξF(x), ηF(y)に対して,

xy, ξη⟩ = ⟨xy,F(x)F(y)⟩ +

N i=1

xiyi˜i − ˜ηi>0

が成り立つ.したがって,Fは狭義単調である.

以上の補題より,ロバストNash均衡解の一意性に関する次の定理を得る.

定理4.4. 仮定1および仮定2が成り立つとする.このとき,(6)で定義されるF が狭義単調であれば,ロバ ストNash均衡解は一意に存在する.

証明. 仮定1と定理3.1より,ロバストNash均衡解は存在する.さらに,補題4.3,補題4.1により,ロバス Nash均衡解は一意である.

5

ロバスト

Nash

均衡問題の二次錐相補性問題への定式化

本節では,各プレイヤーが混合戦略をとり,各々のコスト関数が自分の戦略に関する凸2次関数で表される ゲームを考える.特に,コスト関数のパラメータや相手の戦略の評価値に対する不確実性集合がユークリッド ノルムやフロベニウスノルムを用いて表せるようなある種のゲームに対して,ロバストNash均衡問題が二次 錐相補性問題(SOCCP)として定式化できることを示し,その解の存在性や一意性を議論する.

一般に,SOCCPとは次の条件を満たすベクトル(ξ, η, ζ)∈ ℜl× ℜl× ℜνを求める問題である.

KξηK, G(ξ, η, ζ)=0 (10)

ただし,G :l× ℜl× ℜν → ℜl× ℜν は与えられた関数であり,ξηは,ξTη=0を意味する.また,Kは,

Klj = {1, ζ2)∈ ℜ×ℜlj1| ∥ζ2∥ ≤ζ1}で定義されるlj 次元の二次錐Klj を用いてK=Kl1×Kl2×· · ·×Klm で定義される閉凸錐である.SOCCPに対しては,平滑化法や再定式化法などのアルゴリズムが提案されてい [10].本報告書では,特に次の二次錐相補性条件を満たすベクトルζ を求める問題を考える.

K+q+rK, =d (11) ここで,ζ ∈ ℜl は変数で,M,N ∈ ℜl×(l+τ), q,r ∈ ℜl,C ∈ ℜτ×(l+τ),d ∈ ℜτ は定数である.新しい変数 ξ, η∈ ℜlを用いて,次のように関数G :3l → ℜ2lを定義すれば,SOCCP(11)SOCCP(10)と等価で ある.

G(ξ, η, ζ):=

ξq ηr

d

本節では,各プレイヤーi ∈ {1, . . . ,N}のコスト関数 fi が行列Ai ∈ ℜmi×mi,Bi j ∈ ℜmi×mj,および,ベク トルci ∈ ℜmi を用いて,

fi(xi,xi)= 1

2(xi)TAixi+(xi)T

 ∑N

j=1,j̸=i

Bi jxj+ci

 (12)

= 1

2(xi)TAixi+(xi)T(Bixi +ci)

(12)

と表される場合を考える.ここで,Bi ∈ ℜmi×m−i Bi =[

Bi 1 · · · Bi(i1) Bi(i+1) · · · Bi N]

を表す.以下では,行列Ai は半正定値であるとし,戦略は混合戦略,すなわち戦略集合Si Si = {xi |xi ≥0, eTm

ixi =1} (13)

と表される場合を考える.ただし,emi =(1,1, . . . ,1)T ∈ ℜmi である.このとき,Si は空でないコンパク ト凸集合であることに注意する.また,2節で用いたコスト関数のパラメータui vec(Ai),vec(Bi j),j =

1, . . . ,N,j ̸= i およびci を並べたベクトルと見なすことができる.ここで vec(·)m 個の列ベクトル

p1c, . . . ,pmc からなる行列P ∈ ℜn×m からnm-次元のベクトル((pc1)T, . . . , (pmc)T)T を生成するオペレーター である.

5.1

相手の戦略の評価に不確実性がある場合

この節では,各プレイヤーがコスト関数の値を計算するときに,その関数に含まれるパラメータは正確に推 定できるが,N −1人の相手プレイヤーの戦略の評価値が不確実性を含む場合を考える.そこで,すべての i ∈ {1, . . . ,N}に対して,次の仮定をおく.

仮定3.

(a) Xi(xi)= {xi +δxi | ∥δxj∥ ≤ρi j, emT

jδxj =0(j ̸=i)}

(b) Ui = {ui}

仮定3(a) において,条件emT

jδxj = 0 は,eTm

j(xj +δxj) = 1かつ emT

jxj = 1による.また,ρi j(i,j = 1,2, . . . ,N,j ̸=i)は与えられた非負の実数である.

この仮定の下で,次の定理が成り立つ.

定理5.1. 各プレイヤーのコスト関数と戦略集合がそれぞれ(12)(13)で与えられ,仮定3が成り立つとす る.このとき,ロバストNash均衡解が少なくとも一つ存在する.

証明. コスト関数が(12)で与えられているので,仮定1(a)は成り立つ.また,仮定3が成り立つとき,仮定

1(b)(c)が成り立つことは明らかである.さらに仮定1(d)は,AiOおよび混合戦略であることから成り立

つ.よって,仮定1をすべて満たすので,定理3.1よりロバストNash均衡解が存在する.

さらに,解の一意性に関して,次の定理が成り立つ.

定理5.2. 各プレイヤーのコスト関数と戦略集合がそれぞれ(12)(13)で与えられ,仮定3が成り立つとす る.そのとき,





A1 B12 · · · B1N B21 A2 ...

... ... ...

BN 1 · · · AN





≻O (14)

が成り立つならばロバストNash均衡解は一意である.

表 2 コスト関数のみに不確実性がある場合 プレイヤー 1 プレイヤー 2 プレイヤー 3 f ˜ i (˜ x i , x˜ − i ) − 1 . 3713 − 0
表 4 異なる k に対するロバスト Nash 均衡解 k ロバスト Nash 均衡解 (˜ x 1 , x˜ 2 , x˜ 3 ) 0.1 解 1: ((0.708, 0.020, 0.272), (1.000, 0.000, 0.000), (0.234, 0.499, 0.267))解 2: ((0.667, 0.294, 0.039), (0.608, 0.200, 0.193), (0.210, 0.457, 0.333)) 解 3: ((0.490, 0.510, 0.000), (0.000,

参照

関連したドキュメント

名の下に、アプリオリとアポステリオリの対を分析性と綜合性の対に解消しようとする論理実証主義の  

・総務部は、漏洩した個人情報の本人、取引先 などへの通知、スポーツ庁、警察、 IPA などへの届 出、ホームページ、

 複雑性・多様性を有する健康問題の解決を図り、保健師の使命を全うするに は、地域の人々や関係者・関係機関との

2.シニア層に対する活躍支援 (3) 目標と課題認識 ○ 戦力として期待する一方で、さまざまな課題も・・・

一五七サイバー犯罪に対する捜査手法について(三・完)(鈴木) 成立したFISA(外国諜報監視法)は外国諜報情報の監視等を規律する。See

平均的な消費者像の概念について、 欧州裁判所 ( EuGH ) は、 「平均的に情報を得た、 注意力と理解力を有する平均的な消費者 ( durchschnittlich informierter,

「系統情報の公開」に関する留意事項

対策等の実施に際し、物資供給事業者等の協力を得ること を必要とする事態に備え、