繰り返し多目的ゲームのフォーク定理について (非線形解析学と凸解析学の研究)

全文

(1)191 191. ‫܁‬Γฦ͠ଟ໨తήʔϜͷϑΥʔΫఆཧʹ͍ͭͯ 繰り返し多目的ゲームのフォーク定理について ౡࠜେֶେֶӃɹ૯߹ཧ޻ֶ‫ڀݚ‬Պɹ݉‫ݪ‬ɹᚸ (Makoto Kanehara) 島根大学大学院総合理工学研究科兼原眞(Makoto Kanehara). Interdisciplinary Graduate School of Science and Engineering, Shimane University ౡࠜେֶɹ૯߹ཧ޻ֶ෦ɹࠇ‫ؠ‬େ࢙ (Daishi Kuroiwa) 島根大学総合理工学部黒岩大史(Daishi Kuroiwa) Interdisciplinary Faculty of Science and Engineering, Shimane University 概要 ֓ཁ. नਓͷδϨϯϚ͸ɼ࠷΋༗໊ͳઓུ‫ܗ‬ήʔϜͷҰͭͰ͋Δɽ ͜ͷήʔϜͰ͸ϓϨΠϠʔ͕ 囚人のジレンマは,最も有名な戦略形ゲームの一つである.このゲームではプレイヤーが ‫͢ྗڠʹ͍ޓ‬Δઓུ͸φογϡ‫ʹ఺ߧۉ‬͸ͳΒͳ͍͕ɼແ‫܁ݶ‬Γฦ͠ήʔϜͰ͸ɼϓϨΠϠʔ 互いに協力する戦略はナッシュ均衡点にはならないが,無限繰り返しゲームでは,プレイヤーが互いに協力する戦略がナッシュ均衡点となる.これはフォーク定理によって保証されてい ͕‫͢ྗڠʹ͍ޓ‬Δઓུ͕φογϡ‫ͳͱ఺ߧۉ‬Δɽ͜Ε͸ϑΥʔΫఆཧʹΑͬͯอূ͞Ε͍ͯ る.利得関数がベクトル値関数によって与えられるゲームは多目的ゲームと呼ばれている Δɽ རಘؔ਺͕ϕΫτϧ஋ؔ਺ʹΑͬͯ༩͑ΒΕΔήʔϜ͸ଟ໨తήʔϜͱ‫ݺ‬͹Ε͍ͯΔ. [2] [3] [4] ຊ࿦จͰ͸ɼ‫܁‬Γ [2].ɽ ଟ໨తήʔϜʹ͓͚Δφογϡฏߧ͸ɼ 多目的ゲームにおけるナッシュ平衡は,[3] [4] ౳Ͱ‫͞ڀݚ‬Ε͍ͯΔɽ 等で研究されている.本論文では,繰り ฦ͠ଟ໨తήʔϜʹ͓͚ΔΠσΞϧφογϡ‫ͱ఺ߧۉ‬ऑύϨʔτφογϡ‫఺ߧۉ‬Λ‫؍‬ଌ͠ɼ‫܁‬ 返し多目的ゲームにおけるイデアルナッシュ均衡点と弱パレートナッシュ均衡点を観測し,繰り返し多目的ゲームのフォーク定理を与える. Γฦ͠ଟ໨తήʔϜͷϑΥʔΫఆཧΛ༩͑Δɽ. 1 ແ‫܁ݶ‬Γฦ͠ήʔϜͱϑΥʔΫఆཧ 無限繰り返しゲームとフォーク定理定義 1.1 Ll ఆٛ N ͷઓུू߹ɼ ɹN = {1, 2, · ·, ·n\} , n} ΛϓϨΠϠʔͷू߹ɼ ۭͰͳ͍ू߹ A ∈N A_{i}i ΛϓϨΠϠʔ N=\{1,2, をプレイヤーの集合,空でない集合をプレイヤー ii\in の戦略集合, ff_{i}i ::. N ͷརಘؔ਺ͱ͢Δɽ͜ͷͱ͖ をプレイヤー ii\in の利得関数とする.このとき G R ΛϓϨΠϠʔ ∈N = \{A_{i}\}_{i\in (N, {Ai }i∈N , {fi }i∈NN})) A A_{1}\cross\cdots\cross A_{n}arrow \mathbb{R} 1 ×· · ·×A n → G=(N, N}, \{f_{i}\}_{i\in. を戦略形 nn ਓήʔϜͱ͍͏ 人ゲームという.. Λઓུ‫ܗ‬ 定義 1.2 L2 ఆٛ. ɹG = \{A_{i}\}_{i\in (N, {Ai }i∈N , {fi }i∈NN})) Λઓུ‫ܗ‬ を戦略形 nn ਓήʔϜͱ͢ΔɽϓϨΠϠʔͷઓུͷ૊ 人ゲームとする.プレイヤーの戦略の組 G=(N, N}, \{f_{i}\}_{i\in ∗ A1 × · · · × aa^{*}=(a_{1}^{*}, = (a∗1 \ldots, , . . .a_{n}^{*})\in , a∗n ) ∈A_{1}\cross がナッシュ均衡点とは, \crossAA_{n} n ͕φογϡ‫ͱ఺ߧۉ‬͸ɼ ∀. ∀. ∗. ∗. ∗. ) ≦f_{i} (a_{i}^{* fi (ai ,}, a i ∈ N,N^{\forall}a_{i}}\in ai ∈ AA_{i}, a−i})\leqq i , ff_{i}(a_{i}, i (ai ,a_{-i}^{* \forall_{i\in a_{-i}^{* −i })). を満たすときをいう. Λຬͨ͢ͱ͖Λ͍͏ɽ. ྫ 1.1 ((囚人のジレンマ) नਓͷδϨϯϚ) 例1.1 Aͱ B ͕ୁั͞ΕɼͦΕͧΕͷनਓ͸ผʑʹ౤ࠈ͞ΕͯऔΓௐ΂Λ ɹ൜ࡑ૊৫ͷ 2 ਓͷϝϯόʔ A 犯罪組織の2人のメンバーと B が逮捕され,それぞれの囚人は別々に投獄されて取り調べを A ͱ B ͕‫ʹ͍ޓ‬૬खΛཪ੾Γࣗന 受けていて互いにコミュニケーションを取ることが出来ない.. A と B が互いに相手を裏切り自白 ड͚͍ͯͯ‫ʹ͍ޓ‬ίϛϡχέʔγϣϯΛऔΔ͜ͱ͕ग़དྷͳ͍. A ͕ࣗനΛͯ͠ B ͕໧ൿΛ͢Ε͹ A ͸േͤΒΕ ͢Δͱɼೋਓͱ΋ 9 ೥ͷ௄໾‫ܐ‬Λड͚Δɽ΋͠ A すると,二人とも9年の懲役刑を受ける.もしが自白をして B が黙秘をすれば A は罰せられ B ͸ ͣɼ 10 ೥ͷ௄໾‫ܐ‬Λड͚Δʢ‫ٯ‬΋·ͨಉ༷ʣ ɽ‫ͯ͠ྗڠʹ͍ޓ‬໧ൿΛ͢Ε͹ɼೋਓͱ΋ 1 ೥ ず, B は10年の懲役刑を受ける (逆もまた同様).互いに協力して黙秘をすれば,二人とも1年. の懲役刑を受ける.この状況を表にすると以下のようになる. ͷ௄໾‫ܐ‬Λड͚Δ . ͜ͷঢ়‫گ‬Λදʹ͢ΔͱҎԼͷΑ͏ʹͳΔɽ. 1.

(2) 192. この時,(裏切り,裏切り)がナッシュ均衡点となる. 定義 L3. G=(N, \{A_{i}\}_{i\in N}, \{f_{i}\}_{i\in N}) を戦略形. プレイヤー. i. n. 人ゲームとし,. \delta\in(0,1) を割引因子とする.. の戦略集合を畠 =\{s_{i}=\{s_{i}^{t}\}|s_{i}^{1}\in A_{i}, s_{i}^{t} : A^{t-1}arrow A_{i} (t\geqq 2)\} (ただし,. A^{t-1}=A\cross\cdots\cross A ( A の t-1 回の直積)) とおき,プレイヤー. i. の利得関数 F_{i} : S_{1}\cross\cdots\cross S_{n}arrow \mathbb{R}. を. F_{i}(s)= \sum_{t=1}^{\infty}\delta^{t-1}f_{i}(\alpha^{t}(s) とする.ただし,. \alpha^{t}(s)=\{\begin{ar ay}{l } (8_{1}, \ldots, s_{n})\in A (t=1) (s_{1}^{t}(\alpha^{1}(s), \ldots, \alpha^{t-1}(s) , \ldots, s_{n}^{t}(\alpha^{1} (\mathcal{S}), \ldots, \alpha^{t-1}(s) (t\geq 2) , \end{ar ay}. とする.. このとき, G^{\infty}(\delta)=(N, \{S_{i}\}_{i\in N}, \{F_{i}\}_{i\in N}) を戦略形. n. 人ゲーム G の割引因子 \delta を持つ無限繰. り返しゲームという.. この定義における A^{t-1} は. t-1. 回目までの履歴と呼ばれる. G^{\infty}(\delta) も戦略形. 釈出来るので,プレイヤーの戦略の組 s^{*}=(s_{1}^{*}, \ldots, s_{n}^{*})\in S_{1}\cross. n. 人ゲームと解. xS_{n} がナッシュ均衡点であ. るとは,. \forall_{i}\in N^{\forall}s_{i}\in S_{i}, F_{i}(s_{i}, s_{-i}^{*})\leqq F_{i} (s_{i}^{*}, s_{-i}^{*}). .. を満たすときをいう.. 例 L2 (囚人のジレンマの無限繰り返しゲーム) 繰り返しゲーム G^{\infty} における代表的な戦略として次の四つの戦略を考える.. . AII‐C : 過去のプレイによらず,常に協力 (cooperate) をとる. AII‐D : 過去のプレイによらず,常に裏切り (denounce) をとる. \bullet. \bullet. .. Trigger: 最初は協力をとる.しかし相手が裏切れば,それ以後裏切りをとり続ける. TFT (tit. for tat) : 最初は協力をとる.以後,相手の前回の行動と同じものをとり続ける.. 四つの戦略によるプレイヤーの利得は以下のようになる. ただし全ての利得は (1-\delta) 倍している..

(3) 193 A\B. All-C. All-D. Trigger. TFT. All-C. (−1, −1). (−10, 0). (−1, −1). (−1, −1). All-D. (0, −10). (−9, −9). (−9δ, −10 + δ). (−9δ, −10 + δ). Trigger. (−1, −1). (−10 + δ, −9δ). (−1, −1). (−1, −1). TFT. (−1, −1). (−10 + δ, −9δ). (−1, −1). (−1, −1). 1. ͷͱ͖ɼ (Trigger, Trigger) のとき,(Trigger, Trigger) ͕φογϡ‫ͳͱ఺ߧۉ‬ΓಘΔɽैͬͯɼ‫ྗڠʹ͍ޓ‬Λ がナッシュ均衡点となり得る.従って,互いに協力を \ d e l t a \ g e q \ f r a c { 91}{9} 選ぶ戦略がナッシュ均衡点になり得る. બͿઓུ͕φογϡ‫ͳʹ఺ߧۉ‬ΓಘΔɽ. ɹදΑΓ 表より δ ≥. 次のフォーク定理によりジレンマの解消が保障されている. ࣍ͷϑΥʔΫఆཧʹΑΓδϨϯϚͷղফ͕อো͞Ε͍ͯΔɽ. 1.1 ((フォーク定理) ϑΥʔΫఆཧ) ఆཧ 定理1.1 ∞ G ͷׂҾҼࢠ を戦略形ゲーム G の割引因子 δ\delta Λ࣋ͭແ‫܁ݶ‬Γฦ͠ήʔϜ を持つ無限繰り返しゲーム ɹG (δ) = (N,\{S_{i}\}_{i\in {Si }i∈N {Fi }i∈NN})) Λઓུ‫ܗ‬ήʔϜ G^{\infty}(\delta)=(N, N},,\{F_{i}\}_{i\in. とする.. δ\delta ͱ と aa=(a_{1}, が ∀i ͱ͢Δ = (a\ldots, , an ) A_{1}\cross ∈ A1 × · · · × NN,, \crossAA_{n} \forall∈i\in 1 , . . .a_{n})\in n ͕. • inf sup fi (bi , b−i ) < fi (a) \bullet. \inf_{b-\dot{i} \sup_{b_{\dot{i} }f_{i}(b_{i}, b_{-i})<f_{i}(a). b−i bi. • \bullet. supbi fi (bi , a−i ) − fi (a) ≦δ supbi fi (bi , a−i ) − inf b−i supbi fi (bi , b−i ). \frac{\sup b_{i}f_{i}(b_{i},a_{-i})-f_{i}(a)}{\sup_{b_{:} f_{i}(b_{i},a_{-\dot {i} )-\inf_{b-\dot{i} \sup_{b_{\dot{i} f_{i}(b_{\dot{i} ,b_{-i}) \leq \delta. ∞ ∗ を満たすならば G のナッシュ均衡点 ss^{*}=(s_{1}^{*}, Λຬͨ͢ͳΒ͹ (δ) = (N, {Si }i∈N {Fi }i∈NN})) ͷφογϡ‫఺ߧۉ‬ = (s∗1\ldots, , . . .s_{n}^{*})\in , s∗n ) ∈S_{1}\cross S1 × G^{\infty}(\delta)=(N, \{S_{i}\}_{i\in N}, ,\{F_{i}\}_{i\in t ∗ (s ) = (a1 , .\ldots, . . , a_{n}) an ) ͕੒Γཱͭ ··· × が存在して, ∀\fortal _{t}∈ が成り立つ.. \crossSS_{n} \in \matN, hbb{N}, α\alpha^{t}(s^{*})=(a_{1}, n ͕ଘࡏͯ͠ɼ. 2 ແ‫܁ݶ‬Γฦ͠ଟ໨తήʔϜͱͦͷϑΥʔΫఆཧ 無限繰り返し多目的ゲームとそのフオーク定理 ͜͜Ͱ͸ɼ [5] Ͱࣔͨ͠ແ‫܁ݶ‬Γฦ͠ଟ໨తήʔϜͷϑΥʔΫఆཧΛ঺հ͠ɼͦͷԠ༻ྫΛड़΂ ここでは,[5] で示した無限繰り返し多目的ゲームのフォーク定理を紹介し,その応用例を述べ Δɽ·ͣɼ໨తΛෳ਺ʹͨ͠ଟ໨తήʔϜʹ͍ͭͯ঺հ͠ɽແ‫܁ݶ‬Γฦ͠ଟ໨తήʔϜͷఆࣜԽ る.まず,目的を複数にした多目的ゲームについて紹介し.無限繰り返し多目的ゲームの定式化 Λ͠ɼଟ໨తήʔϜͱಉ༷ͷղΛఆٛ͢Δɽ をし,多目的ゲームと同様の解を定義する. ɹଟ໨తήʔϜΛߟ͑ΔϞνϕʔγϣϯͱͯ͠͸ɼզʑ͸ྫ͑͹ങ͍෺Λ͢Δ࣌ʹ͸Ձ֨ɼ඼࣭ 多目的ゲームを考えるモチベーションとしては,我々は例えば買い物をする時には価格,品質等の複数の目的重要視する.多目的ゲームを考える動機は実際の問題で最適化を行う場合目的が ౳ͷෳ਺ͷ໨తॏཁࢹ͢Δɽଟ໨తήʔϜΛߟ͑Δಈ‫ػ‬͸࣮ࡍͷ໰୊Ͱ࠷దԽΛߦ͏৔߹໨త͕ 複数個あるためである. ෳ਺‫͋ݸ‬ΔͨΊͰ͋Δɽɹ 定義2.1 2.1 ఆٛ N ͷઓུू߹ɼ ɹ NN=\{1,2, = {1, 2, · ·, ·n\} , n} ΛϓϨΠϠʔͷू߹ɼۭͰͳ͍ू߹ ∈N をプレイヤーの集合,空でない集合 A をプレイヤー ii\in の戦略集合, A_{i}i ΛϓϨΠϠʔ m N ͷརಘؔ਺ͱ͢ m ∈N をプレイヤー ii ͷ໨తͷ‫਺ݸ‬ɼ の目的の個数, ff_{i}i : A をプレイヤー ii\in の利得関数とす m_{i}i ΛϓϨΠϠʔ A_{1}\cross 1 ×···× \crossA A_{nn}arrow→ \mathbb{R R}_{ii}^{m} ΛϓϨΠϠʔ. る.このとき G を nn ਓଟ໨తήʔϜͱ͍͏ 人多目的ゲームという.. ɹ Δɽ͜ͷͱ͖ = \{A_{i}\}_{i\in (N, {Ai }i∈N , {fi }i∈NN})) Λ G=(N, N}, \{f_{i}\}_{i\in. イデアルナッシュ均衡点と弱パレート均衡点を定義するために次の関係を定義する. ΠσΞϧφογϡ‫ͱ఺ߧۉ‬ऑύϨʔτ‫఺ߧۉ‬Λఆٛ͢ΔͨΊʹ࣍ͷؔ܎Λఆٛ͢Δɽ. 3.

(4) 194. y=(\begin{ary}l _{1} y_{2} \vdots y_{m} \end{ary}), z=(\begin{ary}l z_{1} z_{2} z_{m} \end{ary}). \in \mathbb{R}^{m} とする.このとき. y\leq \mathbb{R}_{+}^{m}z\Leftrightar ow^{def}y_{i}\leq z_{i},. \forall_{i=1,2}. y<\mathbb{R}_{+}^{m}z\Leftrightar ow^{def}y_{i}<z_{i},. \forall_{i}=1,2. , .. . . ,. m. , .. . .. m. ,. 定義2.2. G=(N, \{A_{i}\}_{i\in N}, \{f翫 \in N) を m_{1}. ,..,,. m_{n}. n. 人多目的ゲームとし,それぞれのプレイヤーの目的の個数を. とする.プレイヤーの戦略の組 a^{*}\in\Pi_{i=1}^{n}A_{i} がイデアルナッシュ均衡点であるとは,. \forall i\in N, \forall a_{i}\in A_{i}, f_{i} (a_{i}, a_{-i}^{*})\leq_{R_{+}} f_{i}(a_{i}^{*}, a_{-i}^{*}) を満たすときである.. 定義2.3. G=(N, \{A_{i}\}_{i\in N}, \{f_{i}\}_{i\in N}) をを. m_{1}. ,. ,. m_{n}. n. 人多目的ゲームとし,それぞれのプレイヤーの目的の個数. とする.プレイヤーの戦略の組 a^{*}\in\Pi_{i=1}^{n}A_{i} が弱パレートナッシュ均衡点である. とは,. \forall i\in N, \forall a_{i}\in A_{i}, f_{i}(a_{i}^{*}, a_{-i}^{*})t_{R_{+} ^{m_{i}}}f_{i} (ai, a_{-i}^{*}) を満たすときである.. 定義2.4. G=(N, \{A_{i}\}_{i\in N}, \{f_{i}\}_{i\in N}) を m_{1} ,. ...,. m_{n},. n. 人多目的ゲームとし,それぞれのプレイヤーの目的の個数を. \delta\in(0,1) を割引因子とする.プレイヤー. i. の戦略集合を. S_{i}=\{s_{i}=\{s_{\dot{i}}^{t}\}|s_{i}^{1}\in A_{i}, s_{i}^{t} :A^{t-1}arrow A_{i}(t\geqq 2)\} (ただし, 回の直積)) とおき,プレイヤー. i. の利得関数 F_{i} : S_{1}\cross. A^{t-1}=A\cross. xA(A の. t-1. \cross S_{n}arrow \mathbb{R}^{m_{i}} を. F_{i}(s)= \sum_{t={\imath} ^{\infty}\delta^{t-1}f_{i}(\alpha^{t}(s) とする.ただし,. \alpha^{t}(8)=\{\begin{ar ay}{l } (\mathcal{S}_{1}, \ldots, s.)\in A (t=1) (s_{1}^{t}(\alpha^{1}(s), \ldots, \alpha^{t-1}(s) , \ldots, s_{n}^{t}(\alpha^{1} (s), \ldots, \alpha^{t-1}(s) (t\geq 2) , \end{ar ay}. とする.. このとき, G^{\infty}(\delta)=(N, \{S_{i}\}_{i\in N}, \{F_{i}\}_{i\in N}) を. n. 人多目的ゲーム. G. の割引因子. \delta. を持つ無限繰. り返し多目的ゲームという. 定義2.5. G^{\infty}(\delta)=(N, \{S_{l}\prime\}_{i\in N}, \{F_{i}\}_{i\in N}) を. n. 人無限繰り返し多目的ゲームとし,それぞれのプレイ.

(5) 195 ∗ Ϡʔͷ໨తͷ‫਺ݸ‬Λ = (s∗1\ldots, , . .s_{n}^{*})\in . , s∗n ) S_{1}\cross\cdots\cross ∈ S1 ×· · ·×S m_{1} m_{n} ヤーの目的の個数を m とする.プレイヤーの戦略の組 ss^{*}=(s_{1}^{*}, 1, . . . , m n ͱ͢ΔɽϓϨΠϠʔͷઓུͷ૊ S_{n}n. ͕ΠσΞϧφογϡ‫͋Ͱ఺ߧۉ‬Δͱ͸ɼ がイデアルナッシュ均衡点であるとは, ∀. ∀. ∗. ∗. ∗. ≤R Fi (si , s−i ) \foiral∈_{i}\iN, n N^{\forasl }si_{i}\∈in S_{Si}, iF_{,i}F(s_{ii},(s s_{-i}i^{*,})\sleq_{−i\mat)hbb { R}_{+}^{m_{i} }F_{i}(s_{i}^{*}, s_{-i}^{*}) mi +. を満たすときである. Λຬͨ͢ͱ͖Ͱ͋Δɽ 定義2.6 ఆٛ 2.6 ∞ ɹG (δ) = (N,\{S_{i}\}_{i\in {Si }i∈N {Fi }i∈NN})) Λ を nn ਓແ‫܁ݶ‬Γฦ͠ଟ໨తήʔϜͱ͠ɼͦΕͧΕͷϓϨΠ 人無限繰り返し多目的ゲームとし,それぞれのプレイ G^{\infty}(\delta)=(N, N}, ,\{F_{i}\}_{i\in ∗ ヤーの目的の個数を m とする.プレイヤーの戦略の組 aa^{*}\in が弱パレー Ϡʔͷ໨తͷ‫਺ݸ‬Λ ∈A_{1}\cross A1 × · · · × m_{n} \crossAA_{n} m_{1}, 1, . . . , m n ͱ͢ΔɽϓϨΠϠʔͷઓུͷ૊ n ͕ऑύϨʔ. τφογϡ‫͋Ͱ఺ߧۉ‬Δͱ͸ɼ トナッシュ均衡点であるとは, ∀. ∀. ∗. ∗. ∗. \foiral∈l_{i}\iN, n N^{\foralal}ia_{i∈}\in A_{Ai},iF_{, iF}(a_{ii(a }^{*}, a_{i ,-i}^a{*})−i. 4_{)\mat<hbb{RR}_{+}^{mF_{i}i}(a F_{i}(ia_{,i}a, a_{−i-i}^{*)}) mi +. を満たすときである. Λຬͨ͢ͱ͖Ͱ͋Δɽ. 多目的ゲームのフォーク定理として次の2つの定理を紹介する. ଟ໨తήʔϜͷϑΥʔΫఆཧͱͯ࣍͠ͷ̎ͭͷఆཧΛ঺հ͢Δɽ. ఆཧ 2.1 ([5]) 定理2.1 ([5]) ∞ ɹG (δ) = (N,\{S_{i}\}_{i\in {Si }i∈N {Fi }i∈NN})) ΛͦΕͧΕͷϓϨΠϠʔͷ໨తͷ‫͕਺ݸ‬ m_{1} m_{n} をそれぞれのプレイヤーの目的の個数が m である 1, . . . , m n Ͱ͋Δ G^{\infty}(\delta)=(N, N},,\{F_{i}\}_{i\in. 人多目的ゲーム G の割引因子 δ\delta\in(0,1) を持つ無限繰り返し多目的 nn ਓଟ໨తήʔϜ = \{A_{i}\}_{i\in (N, {Ai }i∈N , {fi }i∈NN})) ͷׂҾҼࢠ ∈ (0, 1) Λ࣋ͭແ‫܁ݶ‬Γฦ͠ଟ໨త G=(N, N}, \{f_{i}\}_{i\in Nͱ ήʔϜͱ͠ɼ = (a A1 × · · · × A ∈N ∈ {1, . .m_{i}\} . , mi } a_{n} \in A_{1}\cross\cdots\cross A_{n} 1 , .. .. .. ,, a n )) ∈ n ͱ͢Δɽ͜ͷͱ͖೚ҙͷ ゲームとし, aa= (al, とする.このとき任意の ii\in と jj\in\{1,. に対して ʹରͯ͠. • inf sup fij (bi , b−i ) < fij (a) \bullet. \inf_{b-\dot{i} \sup_{b_{\dot{i} }f_{ij}(b_{i}, b_{-i})<f_{ij}(a). b−i bi. • \bullet. supbi fij (bi , a−i ) − fij (a) ≦δ supbi fij (bi , a−i ) − inf b−i supbi fij (bi , b−i ). \frac{\supb_{l}f_{i_{\dot{j} (b_{i},a_{-\dot{i} )-f_{ij}(a)}{\sup_{b_{:} f_{ij}(b_{i},a_{-i})-\dot{ \imath} nf_{b-\dot{i} \sup_{b_{\dot{i} f_{ij}(b_{i}, b_{-i}) \leq \delta. ∞ ∗ Λຬͨ͢ͳΒ͹ɼ (δ) = (N,\{S_{i}\}_{i\in {Si }i∈N {Fi }i∈NN})) ͷΠσΞϧφογϡ‫఺ߧۉ‬ ∈ SS ͕ଘࡏ͠ を満たすならば, G のイデアルナッシュ均衡点 ss^{*}\in が存在し G^{\infty}(\delta)=(N, N},,\{F_{i}\}_{i\in t ∗ \mathbb{N} ͯɼ೚ҙͷ N ʹରͯ͠ (s ) = (a1 , . . . , aa nのが成り立つ. ) ͕੒Γཱͭ. て,任意の tt\in∈ に対して α\alpha^{t}(s^{*})=(a_{1}, \ldots,. ఆཧ 2.2 ([5]) 定理2.2 ([5]) ∞ をそれぞれのプレイヤーの目的の個数が m である ɹG (δ) = (N,\{S_{i}\}_{i\in {Si }i∈N {Fi }i∈NN})) ΛͦΕͧΕͷϓϨΠϠʔͷ໨తͷ‫͕਺ݸ‬ m_{n} m_{1}, 1, . . . , m n Ͱ͋Δ G^{\infty}(\delta)=(N, N},,\{F_{i}\}_{i\in. 人多目的ゲーム G の割引因子 δ\delta\in(0,1) を持つ無限繰り返し多目的 nn ਓଟ໨తήʔϜ = \{A_{i}\}_{i\in (N, {Ai }i∈N , {fi }i∈NN})) ͷׂҾҼࢠ ∈ (0, 1) Λ࣋ͭແ‫܁ݶ‬Γฦ͠ଟ໨త G=(N, N}, \{f_{i}\}_{i\in Nͱ , an ) A_{1}\cross ∈ A1 × · · · × ήʔϜͱ͠ɼͱ = (a\ldots, ∈N ∈ {1, . .m_{i}\} . , mi } ͕ଘࡏ ゲームとし,と aa=(a_{1}, とする.ある ii\in と jj\in\{1, が存在 \crossAA_{n} 1 , . . .a_{n})\in n ͱ͢Δɽ͋Δ. ͯ͠ɼ して,. • inf sup fij (bi , b−i ) < fij (a) \bullet. \inf_{b_{-\dot{i} }\sup_{b_{\dot{i} }f_{ij}(b_{i}, b_{-i})<f_{ij}(a). b−i bi. • \bullet. supbi fij (bi , a−i ) − fij (a) ≦δ supbi fij (bi , a−i ) − inf b−i supbi fij (bi , b−i ). \frac{\sup b_{i}f_{ij}(b_{i},a_{-i})-f_{ij}(a)}{\sup_{b_{:} f_{ij}(b_{i},a_{- i})-\inf_{b-i}\sup_{b_{\dot{i} f_{ij}(b_{i},b_{-i}) \leq \delta. ∞ ∗ を満たすならば G の弱パレートナッシュ均衡点 ss^{*}\in が存在し Λຬͨ͢ͳΒ͹ (δ) = (N,\{S_{i}\}_{i\in {Si }i∈N {Fi }i∈NN})) ͷऑύϨʔτφογϡ‫఺ߧۉ‬ ∈ SS ͕ଘࡏ͠ G^{\infty}(\delta)=(N, N},,\{F_{i}\}_{i\in t ∗ (s ) = (a1 , .\ldots, . . , a_{n}) an ) ͕੒Γཱͭ ͯɼ て, ∀\fortal _{t}∈ が成り立つ.. \in \matN, hbb{N}, α\alpha^{t}(s^{*})=(a_{1},. 5.

(6) 196. 例2.1 A 国と B 国は敵対していて,両国は戦争の可能性のある状況にある. \bullet. A 国と B 国が互いに武力行使をしないと国の平和と財政は初期状態から変化しない.. \bullet. A 国と B 国が互いに武力行使をすると,国の平和と財政は両方とも初期状態から減少する.. \bullet. 片方の国が武力行使をして,もう一方の国が武力行使をしないと,武力行使をした側の国の平和と財政が増加し,武力行使をしなかった側の国の平和と財政が減少する.. このゲームでは利得を ( 国財の財政和 ) としている. \mp\ovalbox{\t smal REJ CT}\prime. 国の平和の指標は. 0. から9とし ( 0 が一番低く,9が一番高い), 財政の単位は100万ドルとす. る.このゲームでは,武力行使をしないことが協力を意味していて,武力行使をすることが裏切りを意味している.. (武力行使をしない,武力行使をしない) は(武力行使をする,武力行使をする) よりも利得が高いので,定理3.1より,無限繰り返し多目的ゲームでは,. \delta\geq\frac{3}{4} の時 (武力行使をしない,武力行. 使をしない) がイデアルナッシュ均衡点になり,定理3.2より \delta\geq. 6. 五. では,(武力行使をしない,. 武力行使をしない) が弱パレート均衡点となる.. 参考文献 [1] John Forbes Nash, Non‐cooperative games. Annals of Mathematics 54:195‐286 (1951) [2] David Harold Blackwell, An analog of the minimax theorem for vector payoffs. Pacific Journal of Mathematics 6:1‐8 (1956) [3] Peter Borm, Freek van Megen, Stef Tijs, A perfectness concept for multicriteria games. Math. Methods Oper. Res. 49, 401‐412 (1999) [4] Mark Voorneveld, Sofia Grahn, Martin Durwenberg, Ideal equilibria in noncooperative multicriteria games. Math. Metthods. Oper. Res. 52, 65‐77 (2000). [5] Makoto Kanehara, Daishi Kuroiwa, Folk theorems for repeated multi‐objective games, preprint.. [6] 岡田章,ゲーム理論新版,有斐閣 (2011).

(7)