アルゴリズム入門（8）

(1)

宮崎修一

京都大学学術情報メディアセンター

アルゴリズム入門（ 8 ）

（近似アルゴリズム）

(2)

近似アルゴリズムとは？

効率よく解ける問題（多項式時間アルゴリズムが存在する問題）

ソーティング、最短経路問題、最小全域木問題、

…

効率よく解けそうにない問題（

NP

困難問題）

最小頂点被覆問題、

MAX SAT

、

MAX CUT

、

…

本質的に問題が難しいのだが、何とか対応したい

→

幾つかのアプローチ

（平均時間計算量、指数時間アルゴリズム、

確率アルゴリズム、近似アルゴリズム）

(3)

指数時間アルゴリズム

・最適解（正しい解）を得たい。

・指数時間かかることは仕方ない。

・しかし、指数時間の中でも、できるだけ高速であって欲しい。

（例）

3SAT

（

3CNF

式の充足可能性問題）

Tamaki,04]

[Iwama, )

3227 .

1 ( 3238 .

1 [Rolf,03]

3280 .

1 ] Schuler,03 [Baumer,

3290 .

1 al.,02]

et r [Hofmeiste 3302

. 1

,99]

[Schoening 334

. 1

al.,98]

et [Paturi 362

. 1

er,79]

Speckenmey [Monien,

618 . 1

n

n n

n n n n n n

・・・

(4)

近似アルゴリズム

・指数時間かかるのは困る。多項式時間で解が欲しい。

・代わりに、解の質をあきらめる（最適解でなくてよい）。

・でも、できるだけ良い解が欲しい。

近似アルゴリズムの良さ例えば最小化問題

「アルゴリズムＡの近似度が

r

である

（Ａは

r-

近似アルゴリズムである）」

どんな入力に対しても、アルゴリズムＡの出す解のコストは最適解のコストの

ｒ

倍以内である。

⇔

(5)

最小頂点被覆問題

7個の頂点４個の頂点枝：道路

頂点：交差点

交差点にガードマンを配置して、全ての道を警備したい。

できるだけ少ないガードマンで済ませるには、どこに配置したら良いか？

ちなみに、

3

個では無理。

問題：なぜ？

問題：最適は？

(6)

頂点被覆問題に対する近似度２のアルゴリズム

log log N

問題：どうしてこれは近似度

2

？

(7)

近似アルゴリズムに対するアプローチ上限の研究

・問題に対する、

c-

近似アルゴリズムを開発する。

・

c

の値を小さくしていく方向。

下限の研究

・（Ｐ

≠

ＮＰの仮定の下で）、問題が

c-

近似アルゴリズムを持たないことを示す。

・

c

の値を大きくしていく方向。

例：

MAX 3SAT

・上限：

8/7-

近似アルゴリズムは存在する

・下限：Ｐ

≠

ＮＰならば、

(8/7-ε)-

近似アルゴリズムは存在しない

（

ε

：任意の正定数）

[Hastad 1997]

ちなみに、最小頂点被覆問題は、

1

(8)

MAX CUT

入力：グラフ

G

出力：

G

の頂点集合の

2

分割

間にある枝数が出来るだけ多くなるように

例

4

本

5

本

(9)

MAX CUT

に対する局所探索法

近傍：＝

1

頂点だけを反対側のグループへ移す

(10)

アルゴリズムが終了した時の性質

どの頂点も、

(11)

ＡＢ

両端がＡ内にある枝数：

E

_{全ての枝数：}

E

(12)

ＡＢ

v

とするとへの枝数

、への枝数

から

頂点 v A e

_A^v

B e

_B^v

v B v

A

e

e A

v  ならば 

(13)

ＡＢ

v

とするとへの枝数

、への枝数

から

頂点 v A e

_A^v

B e

_B^v

v B v

A

e

e A

v  ならば 

(14)

ＡＢ

v

. 2

_A_,_A _A_,_B

v B v

A

E E

e e

v A



 を足し合わせるとについて、

の全ての頂点

v B v

A

v B v

A

e e

B v

e e

A v









ならば

(15)

ＡＢ

v

. 2

_B_,_B _A_,_B

v A v

B

E E

e e

v B



 を足し合わせるとについて、

の全ての頂点

v B v

A

v B v

A

e e

B v

e e

A v









ならば

(16)

. 2

2 E

_A_,_A

 E

_A_,_B

と E

_B_,_B

 E

_A_,_B

より、 E

_A_,_A

+ E

_B_,_B

 E

_A_,_B

. 2 .

,

, ,

,

E E E

E E

E

B A

B A B

A B

B A

A





−

 +

+

=

一方、最適解つまり、

なので、

よって、このアルゴリズムは

2-

近似アルゴリズム。

(17)

MAX CUT

に対する貪欲アルゴリズム

ＡＢ

Step 1:

頂点を適当に選びＡ、Ｂどちらかに適当に入れる

(18)

MAX CUT

ＡＢ

Step 1:

頂点を適当に選びＡ、Ｂどちらかに適当に入れる

(19)

MAX CUT

ＡＢ

Step 2

以降

:

頂点を適当に選び、

これまで既に入っている頂点とのカットがより

大きくなる方に入れる。

(20)

MAX CUT

ＡＢ

Step 2

以降

:

(21)

MAX CUT

ＡＢ

Step 2

以降

:

(22)

MAX CUT

ＡＢ

Step 2

以降

:

(23)

MAX CUT

ＡＢ

Step 2

以降

:

(24)

MAX CUT

ＡＢ

Step 2

以降

:

(25)

MAX CUT

ＡＢ

Step 2

以降

:

(26)

近似度の解析

ＡＢ

(27)

近似度の解析

ＡＢ

左へ入れた場合

利得

(28)

近似度の解析

ＡＢ

(29)

近似度の解析

ＡＢ

右へ入れた場合

利得

(30)

近似度の解析

ＡＢ

アルゴリズムは、この

2

つのうち、

大きい方（小さくない方）の利得を得るように動く。

（このうち、半分は得る。）

(31)

近似度の解析

ＡＢ

この部分を、全部の頂点について足し合わせたら、ちょうど全ての枝

アルゴリズムは、全枝の半分はカットする。

MAX CUT

の現在最良の近似度は

1.138…

(32)

巡回セールスマン問題

京都駅から出発して、観光して、京都駅に戻って来たい。

同じところは

2

度通らない。できるだけ短い経路で回る。

(33)

応用：

コンビニの配送計画

自動販売機のジュース補給配送計画

集積回路

(VLSI)

の配線ロボットのアームの動き最適化

TSPLIB

様々なベンチマーク集合に対する、解法競争が行われている

http://comopt.ifi.uni-heidelberg.de/software/TSPLIB95/

(34)

TSPLIB

のベンチマークの

1

つ日本の

9847

都市

(35)

その最適解

(36)

アメリカ

13509

都市

(37)

(38)

きっちり定式化すると

入力：完全グラフ

G=(V, E)

、各枝

𝑒 ∈ 𝐸

に対して、長さ

𝑐(𝑒)

。

（頂点は観光スポットに対応。枝の長さは移動距離に対応）

出力：

G

の各頂点を

1

度ずつ通る閉路。

ただし、使われた枝の長さの合計が最小となるもの。

（同じ頂点を

2

度通ってはいけないことに注意）

(39)

単純なアルゴリズム：

頂点数を

n

とする。

それぞれの回り方（

n!

通りの順列）に対して、総距離を計算し、

最も短い経路を出力する。

↓

確かに最適解が得られるが、

n!

時間かかる。

(n!

＞

2

）

実際、ＮＰ困難であることが証明されている。

↓

・枝の重みが三角不等式を満たす場合の

2-

1.5-

・ユークリッド平面の場合（例えば先程の京都市の例）は、

n

(40)

2

－近似アルゴリズム

ステップ

1

：最小全域木を求める。（そのコストをＴとする。）

（巡回セールスマンの最適解のコストを

OPT

とすると、

T

＜

OPT

。）

問題：なぜ？

(41)

2

ステップ

2

：最小全域木沿いにツアーを組む。

（同じ枝を

2

度なぞる。）

このツアーの長さを

P

とすると、

P

＝

2T

。

(42)

2

ステップ

3

：同じところを

2

度通らないように飛ばす。

このツアーの長さを

L

とすると、

L ≦ P

。（三角不等式より）

(43)

2

ステップ

4

：得られたツアーを出力する。

近似度の解析

L ≦ P=2T

＜

2OPT

(44)

1.5

－近似アルゴリズムステップ

1

までは一緒。

T

＜

OPT

(45)

1.5

ステップ

2

：奇数次数の頂点を選ぶ。（偶数個ある。）

問題：なぜ？

(46)

1.5

ステップ

3

：緑の頂点間の最小重みマッチングを求める。

（枝の長さの総和が最小のもの）

元あった枝と合わせて、

全ての頂点の次数が偶数。

(47)

1.5

ステップ

4

：オイラー回路を求める。

青のツアー長＝

T

＋

(48)

1.5

ステップ

5

：先程のオイラー回路で、

2

度目の頂点を飛ばす。

得られた緑のツアーを出力する。

緑のツアー長青のツアー長

≦

青のツアー長＝

T

＋

(49)

奇数次数（緑）の頂点だけのツアーで最短のものを考えよう。

水色のツアー長≦

OPT

（例えば、

OPT

のツアーで、

赤色頂点を飛ばせば良い）

(50)

そのツアー上の、

1

つとびの枝集合、

2

組。

の全長＋の全長

＝のツアー長

(51)

の全長との全長のうち短い方をとする。

の全長

≦ 1/2

の全長そのツアー上の、

1

2

組。

(52)

の全長

≦

の全長

≦ 1/2

の全長

≦ 1/2 OPT

の枝集合はマッチング

の枝集合は最小マッチング

そのツアー上の、

1

2

組。

示したかったこと

1.5 − 10

⁻³⁶（

2021

年）

(53)

では、

「○○よりも良い近似度の多項式時間近似アルゴリズムは存在しない」

というのは、どういう風に示すのか？

判定問題の時と同様に、「リダクション（還元）」を使う。

前の例は、判定問題（

Yes/No

を答える）から判定問題へのリダクションだった。

近似アルゴリズムの限界

(54)

グラフのハミルトン閉路

各頂点を、ちょうど

1

度ずつ通る閉路

1 2 6

7

9 3 8

4

5

10

11

13

14

12

(55)

ハミルトン閉路問題（判定問題）から巡回セールスマン問題

（最適化問題）へリダクションをする。

ハミルトン閉路問題の入力グラフ

G

巡回セールスマン問題の入力グラフ

H

の作り方

H

の頂点集合は

G

と同じ

H

は完全グラフ

G

で枝のある所

→ H

では枝の重み（長さ）

1

(56)

例

G H

(57)

G

が

YES

の例題（

G

にハミルトン閉路がある）

→ H

は重み

1

の枝だけを使って一周することができる。

→

総距離

n

で一周できる。

→

最適の

1.8

倍悪い解でも

1.8n

以下で収まる。

G

が

NO

の例題（

G

にハミルトン閉路がない）

→ H

を一周するどんな経路も、重み

n+1

の枝を使う。

→

総距離は少なくとも

(n-1)+(n+1)=2n

。

→

最適解は

2n

以上。

(58)

ハミルトン閉路問題巡回セールスマン問題

入力

G

入力

H

A

の答

巡回セールスマン問題に

1.8-

A

が存在したとする。

A

を使って

G

を解くことを考える。

A YES

≦ 1.8n

最適値は

n

NO

最適値は≧

2n

≧ A

の答を見れば

G

が

YES

か

NO

か分かる

→

ハミルトン閉路問題が解けてしまう

→P=NP

(59)

最適値は

n

最適値は≧

2n

この

n

と

2n

のギャップが、近似度の下限を与えた。

YES NO

ポイントは

この

2

つが重ならないこと。

≦ 1.8n

≧ 2n

YES NO

A

の答

A

の答

→ →

1.8n 2n

n

(60)

問題：最初の方で巡回セールスマン問題に対する

1.5-

近似アルゴリズムを見たが、

1.8-

近似アルゴリズムが存在しないことが示せてしまった。

P=NP

を示せたのではないのか？

アルゴリズム入門（8）

宮崎修一

京都大学 学術情報メディアセンター