PDFファイル 2D3 「創発計算と人工生命」

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

動的環境

適応向

蟻

ー最適化手法

相対評価実装

Implementation of relative evaluation to the ant colony optimization method toward adaptation to dynamic environments

直人

*1

_高橋

_二

*2

Naoto Noguchi Tatsuji Takahashi

*1

_{東京電機大学大学院}

*2

_{東京電機大学}

Graduate School of Tokyo Denki University Tokyo Denki University

For combinatorial optimization like Traveling salesman problem (TSP), many efficient methods have been invented. However, in a real environment, the map can change through time. A supply route for chain stores calculated as optimal can be made useless if a path is blocked up. Traffic situation that determines the weight (efficiency or distance) of paths constantly varies. We propose an algorithm which is a variant of the ant colony optimization (ACO). It implements relative evaluation of the value of paths which is known to be effective in decision-making under uncertainty.

1. はじめに

蟻ー最適化 (Ant Colony Optimization:以 ACO)

[M.Dorigo 96] いう蟻給餌行動基作最適化手法

あ . 手法組合わ最適化問題, 特巡回ー

ン問題(Traveling Salesman Problem: TSP) [山本 97] い

非常優秀成績示知い [原 12]. 組合わ

最適化問題条件制約さい , 序や割当

う条件満解組合わ問題あ . 問題

多岐わ分研究さい , 問題規模大

解組合わ数膨大組合的爆発

(combinatorial explosion) 発生 . 計算増大

や , 現実的時間最適解求困 .

ACO ューテ手法用い , 最適解

求諦代わ , 現実的時間最適解比較

的近い準最適解求 .

組合わ最適化問題例 TSP やップッ問題

あ [ 川 12]. 問題環境変化い

定常環境問題あ . 他方，現実世界，最適化

計算時間無視いば，最適化途中環境動

的変化問題扱う必要性出 . ACO 探索

的行う , 焼法や遺伝的 [久保 09]

, 他ューテ手法比非定常問題対

有効あ . 手法 , あ程度探索進解収束

起 , 解再探索行わ . 解収束

起環境変化起最適解得時間

う.

本研究動的意思決定課題い有用あさ

相対評価法 ACO 付加 ,既存手法い困

動的環境変化巡回ーン問題い有効

手法提案

2. 巡回セーラスボン問題

巡回ーン問題(TSP) 代表的組合最適化問

題一あ . TSP 始 n 個都市合V =

, , ⋯ , n , 都市i 都市j 間 C 与え .

任意都市巡回始 , 全都市訪問後最初都

市戻 . 巡回路総最短い経路求 . ,

TSP C = C 対称TSP , C ≠ C 非対称

TSP あ , 本論文対称TSP い考え . TSP 最

適解求う , 都市数小さい場合容求

. , 都市数大組合的爆発

起経路数飛躍的増大 , 現実的時間

解う. う性質 TSP NP

Non-deterministic Polynomial 完全問題分類さ , 都市数n 関

, 多式時間解法存在いさい . 実際

的計算時間 , 較的良い精度準最適解与えう手

法必要 , 多手法提案さ .

3. Ant Colony Optimization

ACO ,蟻巣餌場経路形成給餌行動

基作最適化手法総称あ . 手法 , ン

ューテッ情報基確率的解生成 , 生成

解ン更新いう繰返行う.

組合わ最適化問題探索空間ン限定

効率探索行う出来 . 基本原理具体

化 Ant System (以 :AS) あ .

3.1 Ant System

AS ACO ューテ基最初実装さ

手法あ , TSP 解法 Dorigo 提案さ手

法あ .AS 用いTSP 解 , 蟻見立 m個ー

ン各都市ン配置 . 各ーン単純

ー都市間設置さン都市間

距逆数比例確率都市推移 , 巡回路形成

.

, あーン , k 都市i 都市j 推移

確率次う定義さ .

= {

(� ) (� )

∑_∈� (� ) (� ) ∈ �

ℎ �

k ーン番 = , , ⋯ , m 示 , N

ーン k 未訪問合示 .� 都市i,j間置

いン . � 問題領域固有情報あ , TSP

一般都市i.j間距 d 逆数用い . 式(1) ,

ン問題領域固有値比例選択確率得 .

, α β 非負実数 , ン段階的

形成さ大域的情報 , 問題領域固有値

連絡先：

氏：直人, E-mail：[email protected]

(2)

- 2 -

局所的情報程度視示ーあ

.

, m 個ーン式(1) 用い巡回路生成

動作 1 , t 目任意 2 都市i,j

間設置さいン

τ

次う定義

さ .

� + = � ∙ � + ∆�

∆� = ∑ = ∆�

∆� = { � , ∈ �

ℎ �

ρ ン蒸発率表ーあ , <

ρ < 間設定さ . 蒸発効 , 通い経路

ン薄い , 過去行動情報新い行動情報

適応的変化さ解収束行う出来 . ∆� , t

目 m個ーン経路i,j 設置ン

総示 . ∆� ーン k 都市i,j間設置

ン示 , Q ーン 1 設置

ン定示ー , �ｋーン k 生成

巡回路経路長あ , � ーン k 通経路

合あ . 即経路設置さン経路長

逆数決定さ , 経路長短い経路大い

ン置 , 逆経路長長い経路少い

ン置 .

AS 基本動作ン初期化行い, 式(1)

用いm個ーン確率的巡回路生成 . 後

式(2), 式(3), 式(4) 用いン更新 , 終了条件満

繰返 .

3.2 Max-Min Ant System

Max-Min Ant System(以：MMAS) AS 改良手法

あ .AS 間経路ン中解収束

起 , 経路抜出困う.

MMAS , 各経路置ン限値限値

区間_� _�,� ] 限定 .さン更新

各最成績良いーン経路用い .

限値限値限定 , 解収束起僅

確率全経路選択出来解多様性

保出来 . さ優秀ーン経路使う

, 優経路素早解収束行う出来 .

MMAS � _� , � 以式定い .

� � = ₋ ×_� − −

� =� �( − √ )

( ⁄ − ) √

C − o− _t _目 _{最短巡回路長}

あ , n 都市数, _� ン標準化際限値

関ーあ .

4. 相対評価

既存手法経路評価方法, 即ン更新

ーン通経路設置い絶対評価あ .

あ経路評価 , あい昇場合, 周

辺経路対価値伝搬さ , 再評価機会与え

必要考え . う , あ評価対象評価他

評価対象影響与え評価方法相対評価呼ば , 動的

意思決定課題い有用あ示さい

[Tversky 74]. 相対評価 ACO 付加 , 解収束

探索安定起際 , 環境変化周辺経路

伝播素早環境変化対応出来

考え .

5. 提案手法

MMAS ン更新式(2), 式(3), 式(4) う都市i,j

あ既存ン_� 揮発数_ρ 減衰さ ,

新ーン設置ン_∆� 加算手法

あ . 手法 , 環境変化直接影響受

辺 , ーン通辺 . 環境変

化ばや対応出来い考え . 本研究

, ーン通経路選択評価対象 , 通

経路他評価対象 , 選択評価対象評価 ,

他評価対象影響さ相対評価的ン更新

手法Ant System with Relative Evaluation 以 :AS-RE 提案

. AS-RE t 目最成績良いーン通

辺i,k ーン通いい辺 i,j

ン更新式以式(7), 式(8) 分 .

� + = � + ��

� + = �� + ��

�� = �� +

� − − −�

= � − � +

� − − (9)

�� t t 目ン変化 , 既存手法

∆� 相当 . 微少数μ 辺i,k 評価隣接辺i,j

与え影響調節行い . 提案手法ーン

通経路式(7) う辺設置さいン

変化加算 . ーン通経路式

(8) う , 辺設置さン蒸発数ρ

減少さ辺i,k間変化僅加算さ .

変化 _{�� t} 他経路拡散さ等い. あ

程度探索進解収束起 , 経路一定

式(9) ⁄C − o− 一定値 , ρ − τ t 値

減少い変化 _{�� t} 0 近 , � t 一定値

収束 . MMAS � _� 一定確率全

経路選択さ . 経路 i,j � 確率選ば ,

τ 含新経路総小さ場合, 変化

�� t 増大 . 式(8) 他経路ン

増え , あ程度収束後解再探索出

来 .

さ , 解収束変化 �� t 0 近い , 環

境変化起通い経路経路長大

場合, 変化 �� t 負値辺i,k ン減

少さ . 他経路対負変化伝播さ微少

(3)

- 3 -

相対的他経路評価再探索出来

い考え .

6. シポュリーション

本論文動的環境再現 , 図1 う 2

心状数都市均等並都市配置 TSP

. 都市配置側都市郡都市, 外側都市郡

外都市呼ぶ. 問題都市外都市半比

最適解図1 う C型, O型う変化 . 外

都市半固定都市半変化さ , C

型 O型最適解入替わ境界線半 R .

都市 R 側配置最適解 C型 , R

外側配置最適解 O型 .

型最短経路_{C , C} 式(10), 式(11) 得 .

� = { + − + − }

� = + + −

外都市半 , 都市半 , n

都市外都市配置さい都市数表い .

本実験最初都市 R 側配置 .

R 都市差 r . 状態探索行いC型

最適解求 . 最適解求後解収束行う

100 探索 . 後, 都市 R r

外側再配置環境変化起 . 状態探索再

開 O型最適解得数評価 1試

行ューョン行 . 本実験 , 都市再配

置行わ 5000 超え場合, 探索局所解

陥最適解発見探索終了 .

ューョン用い MMAS AS-RE ー ,

ン _{= .} , 可視化 = . , ーン 1

落ン総 _{Q =} _. , ン蒸

発数_{ρ = . , τ} 影響度_{μ = . × �} _⁄ _� _�_× .

図1：2 都市配置最適解局所解

6.1 結果

r 初期値 0.1 ューョン行い, 100試行 , r

0.001刻減少さ , r = . 施行結図2 示

. 縦軸再配置最適解得数, 横軸

境界線半 R 都市半差r 示い . 図2

r = . 環境変化大い MMAS AS-RE

1 最適解求出来い .

r 小さ環境変化小さ問題

MMAS AS-RE 最適解見数

増えいわ . AS-RE MMAS 常少

い数最適解発見確 .

既存手法非定常環境適応図い

考え .

図2：動的環境実験結

7. 結論

本研究 , 動的環境適応相対評価 ACO

付加既存手法性能向図 . 結 ,

本実験使用動的環境い性能向見

出来 . , 既存手法ン更新絶対評価

決定さい , 提案手法ーン通

経路変化通いい経路影響さ , 相対評価

考え . 相対評価解収束起い

解再探索出来既存手法良い結

得考え . 今後課題 , 他動的環境

提案手法有効性他ューテ相対評価有

用性検証い.

参考文献

[M.Dorigo 96] M. Dorigo, V. Maniezzo, A. Coloni (1996): The Ant System:Optimization by a Colony of Cooperating Agents, IEEE Trans. SMC-Part B, Vol. 26, No. 1, pp. 29-41. [山本 97] 山本芳嗣, 久保幹 (1997): 巡回ーン問題

招 , 朝倉書店.

[原 12] 原元 , 梶大輔, 堀匡 (2012): ACO 分割統

治型TSP近似解法, 知能情報日本知能情報学

会 Vol. 24, No. 6, pp. 1101-1105.

[ 川 12] 川正志, 川敬, 渡辺美知子, 木正博, 山本人,

鈴木育男: ューテュンューテ

ン , 社,2012

[久保 09] 久保幹 , J. P. ペソ (2009): ューテ

数理, 共立出版.

[ 川 12] 川正志, 川敬, 渡辺美知子, 木正博, 山本

人, 鈴木育男 (2012): ューテュン

ューテン , 社.

PDFファイル 2D3 「創発計算と人工生命」

動的環境

適応 向

蟻

ー最適化手法

相対評価 実装

直人

高橋

二

東京電機大学大学院

東京電機大学

1.

はじめに

2.

巡回セーラスボン問題

3. Ant Colony Optimization

τ

4.

相対評価

5.

提案手法

6.

シポュリーション

7.

結論

適応向

相対評価実装

_高橋

_二

_{東京電機大学大学院}

_{東京電機大学}