• 検索結果がありません。

逐次選択過程におけるオファーの最適観測期間

N/A
N/A
Protected

Academic year: 2021

シェア "逐次選択過程におけるオファーの最適観測期間"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

1997年度日本オペレーションズ・リサーチ学会 秋季研究発表会 1−B−11

逐次選択過程におけるオファーの最適観測期間

02601880 法政大学 *松山宏之 MATSUYAMAHiroyuki

O1900070 法政大学 若山邦紘 WAKAYAMAKunihiro

1 はじめに

世の中には、行動の中で情報を得ながら決定を下

していかなければならない問題が多くある。しかも

その場合、決定はその場で下さなければならず、いっ たん過ぎてしまったことをさかのぼってむし返すこ とはできないことが多い。ここで、それを受け入れ ることによって自分が得られる効用をオファーと呼 ぶことにする。目的は決められた時刻までにできる だけ大きな価値のオファーを受け入れるようにする ことである。このような問題を数学的に定式化した ものが、逐次決定問題と呼ばれるものである。

この間題の中で、「いつ観測をやめて決断を下す

か」が焦点となっている問題は最適停止問題と呼ば

れ、今までにさまざまな停止規則が発表されてきた。

その規則のほとんどが、オファーの価値が従う分布 形とその分布のパラメータが既知であることを仮定 している。しかし実際には分布形は経験的に分かっ ていても、パラメータまでは事前に分からないこと が多い。そこで我々はこういったケースについて考

え、このような場合にも停止規則が適用できるよう

にしていくことを考えた。 次の式で表されこの基準をはじめてこえたオファー

を受けとるようにする。

q=maX且(諾汁1,β(JⅣ−i−1))

この基準を作る際分布のパラメータが既知である ことが必要で、あらかじめこれが分かっていれば、期 間の全体でオファーの選択を行なうことができる。 [三三≡] 帽鯛−−「′⊥「 ーーーー・・巨垂] 図1既知の時選択

2.2 分布のパラメータが未知の時

選択の基準を作るためには分布のパラメータが必

要なので、これを期間内で推定し、それを用いて選

択の基準を作ることを考えた。従って、計画期間全体

をパラメータを推定するためにオファーを流す部分 (推定期間)と、推定したパラメータを従来までの停

止規則に適用させる部分(選択期間)とに分けた。

2 停止規則

2.1 分布のパラメータが既知の時

これまでに発表されている停止規則として、次期 以降に最適な選択をしていったとした場合の受けと れるオファーの価値の期待値を判定基準とするもの が代表的である。i期におけるオファーを諾いi+1期 からN期まで最適な選択をしていったとした場合の 期待値をβ(ん−i)とすると、j期における基準qは 図2未知の時選択 推定したパラメータを停止規則に適用させるとき、 推定値は実際の分布のパラメータとの間に誤差を生 じている。この誤差は小さい方が望ましいため、パラ ●法政大学大学院工学研究科システム工学卓二改修士過程 −48− © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

(2)

メータ推定のための観測期間を長くする必要がある。 しかし、これをあまり長くして.しまうとオファーを 受け入れる期間が短くなってしまい、大きな価値の オファーを受け入れにくくなる。従って、パラメー タ推定のための観測期間をどのぐらいにすればよい かが問題となる。 以下では、受けとることができるオファーの価値 の期待値を最大にする観測期間を、最適な観測期間 として求めていくことにする。 環再(軍)血 J蒜‘好(£)ゐ 1−ダ(¢ci) (壷=J+1,‥・,〃−1) 〃 (豆=Ⅳ) これより、 訂j= ここで、 n・t与〃(角) 〈 勺≧訂ブ+1 り≦り+1

3 受け取れるオファーの期待値

まず、以下で使用する記号について定義しておく。 勺=観測期間の長さをjとしたときの 受け取れるオファーの期待値 Ⅳ:計画期間の長さ J:観測期間の長さ 〃:オファーの価値の平均 毎‥観測期間の長さをノとしたときのオファーの 価値の観測値の平均 となるような、jが最適な観測期間である。した がって、りを逐次計算することにより最適な観測期 間を求めることができる。 例として、オファーの価値の分布形が指数分布で、 平均が50のときの最適な観測期間を図3に示す。 J‥オファーの価値の分散 ∂:オファーの価値の観測値の分散 g:オファーの価値の確率変数 ダ(£)‥オファーの価値の確率分布関数 J(諾):オファーの価値の確率密度関数

ci:盲期における停止基準

℃:ゴ期に選択される確率 Ⅵ:盲期に選択した場合のオファーの期待値 ここで、 IO 神 − ■○ !b め n p D l巾 ■l血■l明 図3最適な観測期間 この他の結果については、発表時に示す。 参考文献 【1]竹内啓,ストッビング・ルール,オペレーショ ンズ・リサーチ,Vol・24,No.6,1979 【2]田口玄−,確率・統計,1981 [3】松山宏之,若山邦紘,逐次選択過程におけるオ ファーの最適観測期間,1996年度日本オペレー ションズ・リサーチ学会秋期研究発表会アブス トラクト集,1996

角叫1J(諾)ゐ+ 訂J(£)ぬ (盲=ノ+1 ∼〃) 〃 (ゴ=Ⅳ−1) −∞ (盲=Ⅳ) Ci= 1−ダ(角ci)

(嵐軸))

(盲=J+1) ・(1−ダ(角ci)) ℃= (盲=ノ+2,‥・,Ⅳ−1) Ⅲダ(恥)(盲=〃) 鳥=1 −49 − © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

参照

関連したドキュメント

⼝部における線量率の実測値は11 mSv/h程度であることから、25 mSv/h 程度まで上昇する可能性

12‑2  ‑209  (香法 ' 9

山元 孝広(2012):福島-栃木地域における過去約30万年間のテフラの再記載と定量化 山元 孝広 (2013):栃木-茨城地域における過去約30

山元 孝広(2012):福島-栃木地域における過去約30万年間のテフラの再記載と定量化 山元 孝広 (2013):栃木-茨城地域における過去約30

VVVVVVVVVVVVVVVVVVVVVVVV 5月15日~5月17日の3日間、館山市におい

10 分値の最高値の範囲は、100~119nGy/h、対照期間(事故前)の同一四半期における 1 時間