• 検索結果がありません。

動的計画の図解

N/A
N/A
Protected

Academic year: 2021

シェア "動的計画の図解"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

1111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII

I

I

!

IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII1111111111111111

動的計画の図解

岩本誠一九州大学

1111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111

1

.

積分と最適化

連続関数 f:

[a

,

bJ → Rl に 1 つの実数値を対応させ る最も有名なものは,積分値を対応させる写像 L (f)=

J

:

f(x)dx

であろう(図 1

)

写像 L は線形

L( αf+ßg) =αL (fJ+ ßL(g)

(

1

)

かつ単調 f~玉 g =辛L (f) 亘 L(g)

(

2

)

である.他方,最大値(最小値)を対応させる写像

M

(

f

)

=Max f(x)

(m

(

f

)

=min f(x))

( 図 1 )は, α 孟 Z~五 a<玉 x ;;i; b 非線形であるが単調である. 積分作用素は微分作用素とともに解析学の重要な作用 素であり,数学史上でも中心的な存在であったといえる だろう.他方,最大化,最小化の両作用素は動的計画 (DP) の基本作用素であり,最適化理論は最適化作用素の解明 に他ならない.数理計画法を中心とする最適化理論は比 較的新しい数学といえよう. 本稿では積分,最適化の両作用素の相異点と類似性に 触れると同時に , DP における最大化作用素の性質を具 体的な図によって解明しよう.

2

.

マクシマヴクス定理

定理 Dを 2 直線 x=a , x=b(a く b) と,連続的線 百=伊 (x) , y= φ (x) (伊 (x) 孟 φ (x)) で固まれた有界関領 域とする.このとき,関数 f:D→Rl が連続ならば, 百

z

y= ψ (x) 。

z

1987 年 6 月号 。

y

。 曲線

y=f(x)

図 1 Z

jtMd均=j:(j;;::fM

Max f(x

,

y

)

=Max Max f(x

,

y

)

同 yhD

α孟S孟b ~(X)話官話帳(x)

(

4

)

(3) の左辺は D 上で、 f(x, y) を 2 変数同時に積分する 2.積分である.右辺はまず区間 [\O (x)

,

s

l

>

(

x

)

]上を g で 積分して,次に [a , bJ上で z による積分をくりかえす累 次積分である. (4) の左辺は 2 変数同時最大化であり,右 辺はまず官による,そして次に z による 2 段階最大化で ある(図 2 ).どちらも,左辺の 2 変数同時作用を右辺の 2 段階作用に置き換えてよいことを保証している.事実 右辺の計算が左辺より容易であり,実際的である. 定理 2

(i)

g

,

ß: [a

,

bJ

Rl

,

h:

D→Rl が連続で

f(x

,

y) =g(x) +ß(x)h(x

,

y)

ならば,

H[g(x) 吋 (x)h(川)

Jdxdy

D

=S:[g(xJ+仲)j::::hM)dg]dz

(

i

i

)

g: [a

,

bJxRl

Rl

,

h:

D→Rl は連続で,各 z ε [a , bJ に対して g (x; ・ ) :Rl→Rl が非減少であって,

f(x

,

y) =g(x;h(x

,

y)

(

6

)

ならば,

Max g(x;h(x

,

y))= Max g(x;Max h(x

,

y)).

(x , 官l<D α 孟.r孟 b 戸.r)孟官三三世(r)

(

7

)

(6) の関数 f(x , 宮)は g(x;h) と h=h(x, y) との合成で あり(可分性),

g

は h について非減少である(単調性). 特に f(x, y) として

3

9

9

(2)

2.6

2

.

4

∞ 2.2

~2. 。

山1. 8

1

.6

1

.

4

'6'

図 3

f(x

,

y;O)

=

(t-x)e

.r+ (1 -y)e.r+首

f(x

,

y;h)

=g(x;g(y;h))

(

8

)

も考えられる.この f(x , y;h) に対しては,可分性はむ

しろ再帰性と呼んだほうがよかろう.

(6) ,

(8) を非減少

性をもっ再帰型関数ともいう. (7) を Maximax 定理

([4J) と呼ぶ.この変形としては次がある:

Max

g(x;h(y))=Max

g(x;Max

h(y))

,

(X ,y)tÐ

a~五 x;::玉~(.r l 話官孟 φ( .r)

Max [g(x)+ß(x)h(x

,

Y)J=Max

[g(x)+゚(x)

(x,y)tÐ

a~ J::豆 b

xMax

h(x, y)J ,

(ただし , ß(x) ミ 0)

少(.r l 豆町 Z五 ψ( .r l

Max g(x;h(x

,

y))=Max g(x;Max h(x

,

y)).

α 孟 z 話 a~x 壬 C<三 U 壬 d C 孟 Y'玉 d 上式は Max をすべて min にしても成り立つ.また, D は有界閉集合としていたが,一般の集合に対しても一 方の最大値が存在すれば,他方も存在して両者は等しく なる ([4 ,

5

J

)

.

例 1 f(x , y;k)=(t-x)ex+ (1 -y+k)ex叩:

R2

Rl

,

たRl( 図 3 )は g

(

z

;

k

)

= (t-z+k) e

z ( 図 4 )を再帰的に 合成して f(x,

y;k) =g(x;g

(y;k)) となる.この最大値 I土, Max よ (l-x) 〆 +(t-y+k)ex叩] (x

,

yhR

=

Max

[t-x)ex+e.r (Ma手 (1 -y+k)eY)J

x.R晶 y.R'

より , (x*, y*)=(ek, k) のとき ,

e

e

k

(図 3)

.

例 2

f(x

,

y;k)

=

I

x

-

l

y

-

k

l

-

2

k

l

+

2

I

y

-

k

J

+4k

4

0

0

(

t

0

6

)

g(z;k)

=

(l-z+k)e'

z

図 4 (図 5 )の最小値は ,

g(z;k)=lz-kJ+2k

(図 6 )の再帰 的合成だから ,

(x,Y) =

(2k, k) のとき ,

4

k

.

3

,

ミニマ‘y クス定理

非減少性をもっ再帰型関数 f(x , 百 )=g(x;h(智))に対 しては,凹性や凸性を仮定することなく, ミユマックス 定理が成り立つ. 定理 3

(

[

3

J

)

g:XXRl

R"

g

(x; ・):非減少 ,

h:

Y.•

Rl とする.

min

g(x;h)

(hfRl)

,

Max

h(y) が存在す

XlX yfY

るならば,

min Max

g(x;h(y))

, Max min

g(x;h(百))

XfX y

t

Y

1I

f

Y

X

I!

X

が存在して,両者は等しい:

min Max

g(x;h(y))=Max ming(x;h(y)).

XfX

YI!

Y

1.lE

Y XfX

k(h) =ming(x;h) ==g(x(h)

;h)

,

Max

h(y) =h(y*)

XEX lI

f

Y

とすれば , (x(h(y*)) , y*) が鞍点で,共通なミニマック

オベレーションズ・リサーチ

(3)

o

d

a

~

5 f(x

,

y;O) 口 !x-\y\ ザト 21yl

g(~;計二=l~-kl 十 2k

日目....z

f(ぉ;h) 戸山!J;-

/11-•

?.h

"--み x 図書

器量 1 f(ぷ,1/ ;0)=-\ぷ山 \11\ 十 2

¥

y

l

t

r

o

1事87 年 6 13 号

(

1

0

7

)

4

0

1

© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

(4)

ωO. H M < ト斗 ハリ 図 9 f( .x, y;O)=(I- .x )ex+(百一 l)ex叩

'

.

?

'$7' ス値は g(h(y*)) になる.

例として , f( .x, y)= .x2_y2 は g( .x ;k)

=.x

2+h

,

h(y)

=ーがの再帰的合成であるが,このミニマックス化は有

名である.ここでは

f(x

,

y

;

k

)

=g(x;h(y;k))

,

g(x; ・) :非減少

で,

Max

g(x;h)

,

min

h(y;k) が存在する例とし

ー∞く Z く∞ー∞ <11 く ω て次を考えよう. 例 3 f(x , y;k)= 一 l .x -Iy-kl ー 2kl

+

2

I

y

-

k

l

+4k

(図 7) は g(x;h)

=-Ix-hl

+2h( 図 8) ,

h(y;k)=lyュ

kl+2k

( 図 6 参照)の再帰的合成だから,鞍点 (x* , ý) =

(2

k

,

k)

,

ミニマッグス値 4k. 例 4

f(x

,

y;k) =

(

!

-

.

x)

e

x

+

(y-l+k)ex叩(図 9 )は

g(x;h)

= (

!

-x+h)e

x ( 図 4 参照). h(別是)=(y ー l+k)

e

l

l

( 図 10) の再帰的合成.鞍点 (xへの =(-e-k, -k). 型

3

z

c=l

図 11

4

0

2

(

1

08)

h(y;k)=(y-l+k)e

Y 図 10

ニマックス値 e-e-

k

4. 逆と反転 和が一定以下で積を最大にする問題群

(

P

)

Max

xy

s.t. .x+百孟 c( 註 0) , x 注 O, y 孟 O は最大点関数 (x本 (c) ,

y

*

(

c

)

)

=

(c/2, c/2) と最大値関数

u

(

c

)

=

(

c

/

2

)

Iをもっ(図 11). 他方,積が一定以上で和を 最小にする問題群

(

1

)

min

x+

l

I

s

.

t

.

xll 孟 c( 注 0) , x 孟 O, y~O は最小点関数 (.f (c) ,

y(c)=(

';c

,

.;c) と最小値関数

V

(

c

)

=2';cをもっ(図 12). (P) を主問題, (I)を逆問題 と呼ぶ.両問題聞には逆関係

u-

1

(

c

)

=v(c)

,

.

f

(

c

)

=x本 (u-1

(c))

,

y

(

c

)

=y*(u-

1

(

c

)

)

すなわち

v-

1

=U

J X事=.f0 V-l

,

y*=y

0 V・1 オベレーションズ・リサーチ © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

(5)

が成り立つ.逆関係は, (P) の目的

関数 f( :I: )=x+y , 制約関数 g( :I:)

=

xy の z が :1:= (x, y) のみならず ,:1: が :1:=

(Xh X2, …,

XN)

,

(Xh X2

, …),

X

(

t

)

0 孟 t 孟 T ,

x

(

t

)

0

~五 t< ∞で も ,

f

,

g がもっと一般の式でも成 立し,それぞれ DP の再帰式で解く ことができる(逆定理 [2, 6J). 任意の微分可能な凸関数 f:Rl→ Rl に対して

f(x;h) =f(x)

+

(h-x)

f

'

(

x

)

=F(x) +f'(x)h

(F(x) =f(x) -xf'(x))

を f(x) の h における線形(または 1 次)近似という(図 13). x を動かすと, f(h)=Ma芋 f(x;h) 't:<R ・ になり , x*(h)=h のときに最大値に到達する(図 13). さらに,

f

'

(

x

)

>

0 ならば , f(叫 h) は h の狭義増加だか ら, Maximax 定理より,

f(f(

h

)

)

=MaxJF(xtl +f'(Xl)F(X2)

Zl'Z'2fR" U 。

+f'(Xl)f'(X2)hJ

で ,

x

l

*

(

h

)

=f(h)

,

X2ペ h)=h のとき最大になる(例 l は f(x)=e:r: に他ならな L 、).しかも,このとき ,

f(x;h)

の h に関する逆関数が

f-1(z;h)=z-fj主!-+~

f'(x)' f

'

(

x

)

=F-dx) + 竺

f

'

(

x

)

U

k

x

,-

.((生L+~

1

l

'

(X

,)

I

i

(X

,)

¥

z-f(zh)k

一一一一十一一-2 1'(ゐ)

,

l

'

(

X

2

)

図 14 百

凸f

ーム

3

寸戸

ニE 一一....・・ 2〆E 。

z

h

図 12 図 13

(

F

-

l

(

X

)

=X-f,.恒2,)

f'(x)

として定義される . f-dx;k) を f(x;h) の反転関数

reverse

function とし、う.このとき,

f

-

l

(

k

)

=mi~

f

(x;k)

:r:.R‘ で , X(k)=f-1(k) で最小になる(図 14) .これは Newton 法の考え方を最小化作用素で・表わしたことになる.また Maximax 定理より,

f-l

(f-

l

(

k

)

)

=min

,

f-dxl;f-l(X2;k))

.l'bX2fR・

, xl(k)

=f-1

(f-1(

k))

,

x

2

(

k

)

=f-l(k) が最小点になる. 以上,最適性の原理によって動的計画法を直感的に解 説する ([IJ) のが常道だが.本稿では敢えて Maximax定 理によった.この定理によれば N( ミ 3) 変数同時最適化 も N段最適化によって計算され,逆理論・反転理論が展 開される(白J). 最後に,図3, 5, 7, 9を描いていただいた 九大経済学部時永祥三助教授に感謝する. 参考文献 I

[

I

J

Bellman

, R.,“

Dynamic Programming

,"

P

r

i

n

ceton Univ. Press

,

NJ.

,

1

9

5

7

.

<

2J Iwamoto

,

S.

, “

Inverse theorems i

n

dynamic

programming 1

,

II

,

m

,"

J

.

Math. Anal. Appl.

58(1977)

,

1

1

3

-

1

3

4

;

2

4

9

-

2

7

9

;

4

3

9

;

4

4

8

.

[3J 岩本誠一,

IMinimax theorem without convexュ

concav ty

J ,日本オベレーションズ・リサーチ学会ア

ブストラクト集, 1983年春季.

[

4

J

Iwamoto

,

S.

, “

Sequentìal m

inimaximization

under dynamic programming structure

,"

J

.

Math. Anal. Appl. 1

0

8

(1

985

),

2

6

7

-

2

8

2

.

[日]岩本誠一, I 動的計画論J.九大出版,

1

9

8

7

.

[6J 近藤次郎, I最適化技法J ,コロナ社,

1

9

8

4

.

図 3 f(x , y;O)  =  (t‑x)e .r+  (1 -y)e.r+首

参照

関連したドキュメント

 毒性の強いC1. tetaniは生物状試験でグルコース 分解陰性となるのがつねであるが,一面グルコース分

非自明な和として分解できない結び目を 素な結び目 と いう... 定理 (

しかし , 特性関数 を使った証明には複素解析や Fourier 解析の知識が多少必要となってくるため , ここではより初等的な道 具のみで証明を実行できる Stein の方法

「欲求とはけっしてある特定のモノへの欲求で はなくて、差異への欲求(社会的な意味への 欲望)であることを認めるなら、完全な満足な どというものは存在しない

[r]

としても極少数である︒そしてこのような区分は困難で相対的かつ不明確な区分となりがちである︒したがってその

このような環境要素は一っの土地の構成要素になるが︑同時に他の上地をも流動し︑又は他の上地にあるそれらと

※ CMB 解析や PMF 解析で分類されなかった濃度はその他とした。 CMB