• 検索結果がありません。

多人数による最適停止問題

N/A
N/A
Protected

Academic year: 2021

シェア "多人数による最適停止問題"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

l 特集

スト y ビング・ルール 1

多人数による最適停止問題

蔵野正美・安田正実・中神潤ー

1

.

はじめに われわれは多次元確率過程の最適停止問題を考 察し,単調論理ルールのもとでの均衡停止戦略を 求める.たとえば,ある一家が千葉へ転勤にな り,貸家の物件をつぎつぎと探している場合を考 えてみよう.住居に対する希望は家族の各人それ ぞれ異なり,家の立地条件や環境から各自の価 値,利得が対応する.家族の意見をうまくとりま とめ,なるべく皆が満足できるようにしたい.借 りるかどうかを決定するルールとして,多数決, 妻の独裁,子供たちだけの意見などが考えられる. これらのルールではどのような決定をしたらよい だろうか. いま ρ 次元確率変数 Xn=

(Xl n

, ''',

X Pn

)1',

n 主主 l (T は転置を表わす)が p 人の集団(各人をプレイ ヤーとよぶ)によってつぎつぎに観測され,集団 全体の決定のみがこの観測過程を停止できるとす る.もし n 期で停止すると,プレイヤ - i

(i

=I

,

…, ρ) は yin三X九-ncí の利得を受けとる.ただ し c=(c

l,

"',

Cp) は l 期間当りの観測費用である. プレイヤーたちは停止時の利得 Yn=(yl町 YPn )T の期待値を最大にしたいと思っている.各 期でプレイヤーから表示される 2 穫の意見 観 測過程を停止または縦統一ーを集約するには,集 団の店:志決定のルールが必要である.まず始め に, ρ 人中過半数が停止の意見のとき,観測過程 を停止できる単純多数決が考えられる.また集団 の決定におよぽす影響がプレイヤーの間で強弱の ある不平等なルールや,とくに完全に決定を支配 する独裁者がいる場合もある.さらに現在の社会 で行なわれている代議員制や間接民主主義のよう に,集団(社会の構成メンバー)の意志決定が階 層的な場合なども考えられる. 本稿では,集団の意志決定ルールとして論理関 数にもとづき,多人数停止問題を非協力ゲームの 均衡点の概念を導入して解析する.さらに,種々 の決定ノレールがどのような性質をもっているか, 数値例によって考察してみよう.

2

.

問題の定式化と結果 ゾレイヤが X,, =(X1町・ , XPn )T の実現値 を観測して , n 期で過程を停止するという意見を

a'n=

1,継続するとし、う意見を σ九 =Q で表わす. この系列ポ =(σ九 , ai2 , • 一)をプレイヤの個人 停止戦略とよび,この集まり,行列 σ=(σ\

a

¥

…,

aP )T を停止戦略という.集団の意志決定ルー ルを表わすために論理関数を使う. {Q

,

1

}

_1: の p 変数論理関数 f: {Q

,

I}P• {Q

,

1} が単調とは,す べての i でが豆がならば f(x I, … , xP) 豆 f( が, "', yP) が成り立っときをいう.論理関数 f が単調 で , f(l , ・", 1) ニ 1 であるとき,単調論理ルール とよぶ. これはつぎのような意志決定ノレールを含 む. (1) 多数決のルール p 人中 r 人以卜ー (1;;;;1' 三五 p) が停止の意見のと

(2)

き,観測過程を停止できるルールを f

[p

,

r

J

で表わす.すなわち, 第 2 肘 (1, :E xi 註 r のとき f[ ρ ,

rJ(x

l,

,

x P)=l

lo

, :E x'<r のとき (ここでZ はふつうの和)とくに , r が p の過 半数ならば,単純多数決であり r=p なら ば,全員一致のルールである.

(

2

)

不平等なルール

(

2

.

1

)

(1) のルールの条件を非負定数 wl, … , wP で重みづけしたもの (1

:

E

WiXi ミ r のとき

f(x

l,

…,

xP)=j

(0

:

E

wixi<r のとき はプレイヤー聞が強弱のある不平等なルールを表 わせる.

(

2

.

2

)

(2. 1)を拡張するには,論理和+,論理 積・による単調論理関数 f を考えればよい.単調 であることは否定を含まないから,直感的な停止 戦略一一一あるレベル以との実現値が観測された ら停止ーーに結ひ寺つく.注意として , f= が・(・・・) の形ならば,プレイヤー i が停止の意見をもたな い限り観測過程は停止しない.つまり拒否権をも っている.また f= がならば,プレイヤー i が独 裁者で他のプレイヤーは集団の決定に何らの影響 をもたないアウトサイダーである.

(

3

)

階層的なルール 2 つの単調論理関数の合成もまたそうである. これは階層的構造を表わすと考えられる.たとえ ば図 l を見よ. 多数決ルールのみを考えるとき,つぎの記号を 用いる . q 人ずつの小集団が p 個集まって ρq 人 の集団を構成している場合で, 第 1 )曹の決定を f[q, sJ 第 2 層の決定を f[p , r] としたとき (1 豆 5 2玉 q, 1 壬 r 豆ρ) ,全体の意志決定を f[p,

r

]

[q,

s

]

と表わす. つぎに停止戦略 σ=(σ … , aP )T と単調論理ルー ル f に対して,集団の停止時刻々川三 t( σ) を, t( σ) 三 min{n 註 1 ;f( σ17h ・ σ九 )=1} で定義する.はじめて f(σ弘… , aPπ )=1 を満たし

3

2

6

1...2" ,3 r r.r 集団の意志決定 4 ",,5 " ,6 X~ x" .r x x'

1

=1,・ 1,t 1,.13十 1, .13 1,ニ X1+X2x3 12 ニ x' ・ (x5x6) 13=X' ・ x' 図 1 8 人の集団における個人意見の集約の例 たとき,観測過程を停止し,各プレイヤー t は yit<σ〉の利得を受けとる. 集団の合理的な停止戦略を求めるために非協力 ゲームにおける均衡点[7]の概念を導入しよう. 戦略 *σ=(*σ ・ 1*σP )T が均衡停止戦略であると は各プレイヤー i の任意の個人戦略 d に対して,

*a

(

i

)

=

(*σ … , (]i, "', *σp)T とすると,

E

[Y't内.)] ~

E

[Yit<*.山)] が成り立っときをいう.これはプレイヤのみ が*ゲと異なる個人戦略 aiをとっても,自分の期 待利得を増加できないことを意味している. 簡単のために , X1, X2, …は独立で , Xnの各成 分X1n, ・・・ , XPn も独立と仮定して均衡停止戦略を 求める.ただし,独立の仮定は本質的ではない. 有限期間問題の結果 (N 期間で必ず停止). ベグトル列 Vn=

(V

1

n

, … , VPn)Tをつぎの再帰式;

i

U414 同]-ci vil=Vin-Ci+ ん {i}

E

(XiN_n-Vin)+

一 αn{ i)

E

(XiN π ーがη)一 (n 孟 1) ただし ßn{i} 三 P(J(*σlN_n, …, 1 ,… *σPN-n) =1)αn{i} 三 P(J(*σlN_n, …, 0,… *σPN-n)

= 1)

, *aiN_n 三 I{ XiN_π ミ:;vin} (N)n 孟1), *σ'N 三 l (ここで( )

+,

(

)は,正,負の部分 , 1 は indi­ cator とする)で定義する. 定理 上で定めた *σ=(*σ1, --YσP )T, *σi== (*ポ1,… , *aら)が均衡戦略で,

E

[Yt待。)]=VN・ また各プレイヤー i の停止の意見は自分の利得

Xi

n, V九にしか依存しない. 無限期間問題の結果 .

v=(v\

… , vP )T につい ての方程式 i=l , ・ .., p で

{

i

)

E

(Xi ーが)+ー α {i}

E

(Xiーが)ー=ci

ただし ß1iJ, αli) は前と同様に*ゲ =I{ Xi 二三が} オベレーションズ・リサーチ

(3)

としたもので,げを除く v\ … , vP の関数. {X,/Jは iid で , Xi と同一分布に従うとす る. 定理 上の方程式が解~をもつならば, 各 n で*σ弘 =I{X九三三 *vi} なる *σ が均衡戦略 であり , E[Yt件。 )J= 句が成り立つ. とーんな単調論理ルールであっても , c=o な らば,利得句は, り .lil

EXi;:玉 *visup{a;

P(X

i

>a)=I}

であり, plil=αlil/ß1ilとおけば o 三五 plil 三五 l で, 0 に近いと*げは大きくに近いと γ= 5 (1.000) V. 0.8ι 1 l.7 y 二 3(0.6503) r=! (0.5087) n 102 10' *げは小さい. p1il=0 は拒否権をもっプレ 図 2 ノレーノレ f[5 , rJ に対する期待利得 h と( )はその極限値 イヤーで Xi のとり得る最大の値 sup

{a;

P

力的色彩をおびてくるからであろう.

(X'>a)

=

1}を期待利得にもつ.それに対して, 本稿では,確率ベクトルの成分が独立な場合で plil=1 はアウトサイダーで, 平均 EX' しかも つことができない. 3. 例 ここで、は数値例で、各種のルールの特徴を調べて みる.とくに断らない限り,確率変数 Xln, ・ ", XPn は独立で同ーの区間 (0, 1) 上の一様分布に従うと する

3

.

1

多数決ルールと全員一致のルール まず多数決ルール f[p , rJ を考える.図 2 は,

p=5

,

c=O の場合の期待利得を計算したもので ある.図のように,停止に必要 日

な人数,多数決水準 r が少ないけ .8

(r=1 や 2) と,各個人の利得は 小さい.このことは少人数で停 υ.6 止が可能とし、ぅ“強制停止"の 力が働き,彼らは小さい利得で

もあきらめざるを得ない . r が

4 大で、あれば (r=4 や 5) ,この力 は弱まり利得は大きくなる. と 0.21 くに観測期間 n が長くなるにつ れて,順次 r=3 , 4 , 5 と利得は 大きくなる.このことは非協力 ゲームでありながら,段々と協 あったが,つぎにプレイヤー聞に相関のあるとき を調べてみよう.図 3 は (Xlη, X九)が 2 次元正規

分布 N([g ], [~ f]) に従う場合である 明ら

かに , r=2 のほうが r=1 より大きな利得をもっ と予想される.また r=1 のとき,負の相関が高 い場合 (p=-O. 7) をみると 2 人のプレイヤー の利害が対立していて,小さい値でもがまんして 早く停止する“強制停止"の力がここでも働いて いる. 無限期間問題の場合, 土記の c=O では全員一 致のルールが一番良い.では異なる C=:C1=C2 u n 1 l.8 U.ö ト 1l2 , 2] のとき U.,j O.~ い.~ Lー」十一-L-L-L.4け(1 九 !O . ! 3 4 !O 得 矛・ 待 期 る す ιJJ 4メ 寸 114 f η4 「 L

f

# c と の 、、、 .EE ,, z' 寸 1111J o r ' 1 1Aρa ril-pl 」 「11111 」 ハ U ハ U 「 lil--L J''SEe-目、、、 N ・ 0 図

(4)

値に対しては,どの多数決水準が利得 を最大にするだろうか.図 4 を見ると, c が O に近ければ , r=p の全員一致が 最適多数決を与えていて,観測費用 c 0.8 が高くなるにつれてこの水準は低くな っていく.

3

.

2

不平等なルール ここでは p=3 のとき,独裁者 , t巨 否権を含めた不平等ルール(表 1 )を考 ぇ,その状態を図 5 と図 6 に示す.プ 0.2 レイヤー l は fα, /b, fc, f,,, の各ノレー ルで拒否権をもつが,対応する叫の 極限値 l への近づき方は独裁者 fα が 顕著で,全員一致の場合が遅くなって いる.

3

.

3

階層的なルール 複雑な構造をもっているので, くわしい解 析はできないが,数値例から大体つぎのよう な傾向をもっている. l 段階決定のルール f[p, rJ=f[p, rJ

[1

,

1J=f

[1

,

1

J

[p

, rJ のいくつかのほうが 2 段 階決定より有利(図7). 要するに, 直接な もののほうが,自分の意見を反映できて期待 利得が大きくなる.

4

.

あとがき 1 次元の停止問題は歴史も古く多くの研究 じ 1.0 戸川 υ = * T / J ' ぷ U ( (0.0'3,0.8) /~r キ =4 (0.00973,0.6) r* =

3

-

-

-

-

1

ここで h, (v)=C とは 与水準 r に対しての期待1111 u と観測費用 c の関係式. h 事(v ) '"max h, ( v ) 1:三 r~三 5 ; (0.10973,0.4) 戸ニ 2 ベ 。 0.1 0.2 r*

= 一寸

図 14 無限期間問題における最適多数決水準同 v~ 0.8 0.7 、〕

ハ U 停止 j レル I

J

a

Jb ん Jd

J

, プレイヤ 1 I 円す の期待平 IJl{fv~

I

1 共子二 の極限 1[/( ム n 3 5 10 10' 図 5 不平等ルールにおけるプレイヤーの期待利得世1n 表 1 ρ=3 のとき,不平等ルールの例

j

ん|八[ん

j~

lσ1σσ1σ2σσ1 ん1σ

ん2σ8

プレイヤー 1 が(プレイヤー 1 , i プレイヤー 1 ,プレイヤー 1 が(プレイヤー l は

ただ l 人拒否権 2 が拒否権をも

2 , 3 が拒否権|拒否権をもっ強いが,プレイ!

をもっ独裁者っ プレイヤー|をもっ.全員一|プレイヤー 2 ,ャー 2 , 3 は互|

質 11 プレイヤー 2 ,

3

~土アウト叶ィ(致のノレーノレ

3 は l と協力し|いに協力して停

3 はアウトサイ!ダー て停止で、きる i Jj: できる. ダー 停止ルール fα

f

6 1 生

3

2

8

(5)

があるが,多次元問題は始まったばか

りである[1OJ は決定Jレールが全員一

()Jz

,

d 致の場合に均衡停止戦略を求めた.

[

4

J ,臼 J ,

[6

J は 2 節で述べた結果 を導いている.よく知られている秘書 0.7 選択の問題を多次元の変形としてグル ープ面接の例を述べているが,ここで は割愛した.われわれのモデルは個人 の意見を同時に発表し集約するが,

[IIJ

,

[3 J はあらかじめ定められた先 手後手の手順に従う場合を動的計画法 で解析した.結果としては手順に無関 係であり 2 節と閉じ再帰式を導いて IS > )

停止ルール

1!.ん L ん

J, :1, , /吉ー l プレイヤ -2 , 31 ♂ fτ 1 1 -'--";;----'2-/1 の期待利111 v;, ト 11 1 , ,(5-1 v; の極限値 ;が|一一 1 -''';---' 2-/1 l I 2 2 -」→ n 10' ~り 10' 図 S 不平等ルールにおけるプレイヤー 2 , 3 の期待利得 V2n, v8n いる.また [3 J の Winning class は手順を 除くと,単調論理ルールと同じであることを 注意しておく.連続時聞の場合,これと類似 の議論もできるが,それはシステム全体が同 時には停止していない [9J とは異なるモデル になる. 最後に,集団の意志決定ルールの公理的研 究[7],

[2

J からの検討も必要で、あろうし,利 得の分配をしないことが本稿の前提であった が,ルールとともに停止時の分配方法を考え た協力ゲーム的接近は今後の課題としたい. 参宏文献

[ 1

J

Chow

,

Y. S.

,

Robbins

,

H. and Siegmund

,

D. : Great Expectations. Houghton Mifflin

Co.

,

Boston

,

1971.

[ 2

J

Fishburn

,

P. S. : The Theory of Represenュ

tative Majority Decision. Econometrica

,

34 ( 1971), 273-284.

[ 3

J

Kadane

,

J

.

B. : Reversibility ofa 恥1ultila­

teral Sequential Game: Proof of a Conjecture of Sakaguch

i

.

J. Op. Res. Soc. Japan

,

21

(1978)

,

509-516.

[4J 蔵野正美,安田正実,中神潤ー:多次元確率変数

の stopping problem について. OR 学会アブス トラクト (1977年).

[5

J

Kurano

,

M.

,

Yasuda

,

M. and Nakagami

,

J

.

:

Multivariate Stopping Problem with a Majority Rule(preprint)

,

1978. [6J 安田正実,中神潤ー,蔵野正美:Multivariate l .'n 0.7 l 段階決定 / /

/"

J[12, rJσ辻限〆/ドム悶ツ/ J[12,

8J

f[12 , 9)一一 0.6 J [ 3 ' 2 J / ---//. ...-五段階決定 J[3 , ァJ[い]の上限 Lームー-ーー」 3 5 10 102 レP ..n 図 7 段階決定と 2 段階決定の比較

Stopping Problem with a Monotone Logical

Rule. 京都大学数理解析研究所講究録 (1979).

[7

J

Murakami

,

Y. : Formal Structure of Majoュ

rity Decision

,

Econometrica

, 34(1966)

,

709-718.

[8

J

Nash

,

J

.

:

Non-cooperative Game

,

Ann. of

Math.

,

54(1951)

,

286-295.

[ 9

J

Presman

,

E. L. and Sonin

,

1. M. : Equiliュ

brium Points in a Game related to the Best Choice Problem

,

J.Prob.Appli., 20(1975)

,

770-781.

[IOJ Sakaguchi

,

M. : Optimal Stopping in Samュ pling from a Bivariate Distribution

,

J.Op. Res. Soc. Japan

,

18(1973)

,

186-200.

[11

J

Sakaguchi

,

M.: A Bilateral Sequential

Game for Sums of Bivariate Random Variaュ

bles

,

J.Oρ. Res. Soc. Japan

,

21(1978)

,

486-508.

(くらの・まさみ, やすだ・まさみ, なかがみ・じゅ

参照

関連したドキュメント

つの表が報告されているが︑その表題を示すと次のとおりである︒ 森秀雄 ︵北海道大学 ・当時︶によって発表されている ︒そこでは ︑五

(注)本報告書に掲載している数値は端数を四捨五入しているため、表中の数値の合計が表に示されている合計

巣造りから雛が生まれるころの大事な時 期は、深い雪に被われて人が入っていけ

※定期検査 開始のた めのプラ ント停止 操作にお ける原子 炉スクラ ム(自動 停止)事 象の隠ぺ い . 福 島 第

※定期検査 開始のた めのプラ ント停止 操作にお ける原子 炉スクラ ム(自動 停止)事 象の隠ぺ い . 福 島 第

いてもらう権利﹂に関するものである︒また︑多数意見は本件の争点を歪曲した︒というのは︑第一に︑多数意見は

 今日のセミナーは、人生の最終ステージまで芸術の力 でイキイキと生き抜くことができる社会をどのようにつ

(注)本報告書に掲載している数値は端数を四捨五入しているため、表中の数値の合計が表に示されている合計