• 検索結果がありません。

PDFファイル 2D3 「創発計算と人工生命」

N/A
N/A
Protected

Academic year: 2018

シェア "PDFファイル 2D3 「創発計算と人工生命」"

Copied!
3
0
0

読み込み中.... (全文を見る)

全文

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

動的環境

適応 向

ー最適化手法

相対評価 実装

Implementation of relative evaluation to the ant colony optimization method toward adaptation to dynamic environments

直人

*1

高橋

*2

Naoto Noguchi Tatsuji Takahashi

*1

東京電機大学大学院

*2

東京電機大学

Graduate School of Tokyo Denki University Tokyo Denki University

For combinatorial optimization like Traveling salesman problem (TSP), many efficient methods have been invented. However, in a real environment, the map can change through time. A supply route for chain stores calculated as optimal can be made useless if a path is blocked up. Traffic situation that determines the weight (efficiency or distance) of paths constantly varies. We propose an algorithm which is a variant of the ant colony optimization (ACO). It implements relative evaluation of the value of paths which is known to be effective in decision-making under uncertainty.

1.

はじめに

蟻 ー 最 適 化 (Ant Colony Optimization:以 ACO)

[M.Dorigo 96] いう蟻 給餌行動 基 作 最適化手法

あ . 手法 組 合わ 最適化問題, 特 巡回 ー

ン問題(Traveling Salesman Problem: TSP) [山本 97] い

非常 優秀 成績 示 知 い [原 12]. 組 合わ

最適化問題 条件 制約さ い , 序や割当

う 条件 満 解 組 合わ 問題 あ . 問題

多岐 わ 分 研究さ い , 問題 規模 大

解 組 合 わ 数 膨 大 組 合 的 爆 発

(combinatorial explosion) 発生 . 計算 増大

や , 現実的 時間 最適解求 困 .

ACO ュー テ 手法 用い , 最適解

求 諦 代わ , 現実的 時間 最適解 比較

的近い準最適解 求 .

組 合わ 最適化問題 例 TSP や ップ ッ 問題

あ [ 川 12]. 問題 環境 変化 い

定常環境 問題 あ . 他方,現実世界 ,最適化

計算時間 無視 い ば,最適化 途中 環境 動

的 変化 問題 扱う必要性 出 . ACO 探索

的 行う , 焼 法や遺伝的 [久保 09]

, 他 ュー テ 手法 比 非定常問題 対

有効 あ . 手法 , あ 程度探索 進 解 収束

起 , 解 再探索 行わ . 解 収束

起 環境 変化 起 最適解 得 時間

う.

本研究 動的 意思決定課題 い 有用 あ さ

相対評価法 ACO 付加 ,既存手法 い 困

動的 環境 変化 巡回 ー ン問題 い 有効

手法 提案

2.

巡回セーラスボン問題

巡回 ー ン問題(TSP) 代表的 組合 最適化問

題 一 あ . TSP 始 n 個 都 市 合V =

, , ⋯ , n , 都市i 都市j 間 C 与え .

任意 都市 巡回 始 , 全都市 訪問 後 最初 都

市 戻 . 巡回路 総 最 短い経路 求 . ,

TSP C = C 対称TSP , C ≠ C 非対称

TSP あ , 本論文 対称TSP い 考え . TSP 最

適解 求 う , 都市数 小さい場合 容 求

. , 都市数 大 組合 的爆発

起 経路数 飛躍的 増大 , 現実的 時間

解 う. う 性質 TSP NP

Non-deterministic Polynomial 完全問題 分類さ , 都市数n 関

, 多 式時間 解法 存在 い さ い . 実際

的 計算時間 , 較的良い精度 準最適解 与え う 手

法 必要 , 多 手法 提案さ .

3. Ant Colony Optimization

ACO ,蟻 巣 餌場 経路 形成 給餌行動

基 作 最適化手法 総称 あ . 手法 , ン

ュー テ ッ 情報 基 確率的 解 生成 , 生成

解 ン 更新 いう 繰 返 行う.

組 合わ 最適化問題 探索空間 ン 限定

効率 探索 行う 出来 . 基本原理 具体

化 Ant System (以 :AS) あ .

3.1 Ant System

AS ACO ュー テ 基 最初 実装さ

手法 あ , TSP 解法 Dorigo 提案さ 手

法 あ .AS 用いTSP 解 , 蟻 見立 m個 ー

ン 各都市 ン 配置 . 各 ー ン 単純

ー 都市間 設置さ ン 都市間

距 逆数 比例 確率 都市 推移 , 巡回路 形成

.

, あ ー ン , k 都市i 都市j 推移

確率 次 う 定義さ .

= {

(� ) (� )

∈� (� ) (� ) ∈ �

ℎ �

k ー ン 番 = , , ⋯ , m 示 , N

ー ン k 未訪問 合 示 .� 都市i,j間 置

い ン . � 問題領域固有 情報 あ , TSP

一般 都市i.j間 距 d 逆数 用い . 式(1) ,

ン 問題領域固有 値 比例 選択確率 得 .

, α β 非負 実数 , ン 段階的

形成さ 大域的 情報 , 問題領域固有 値

連絡先:

氏 : 直人, E-mail:[email protected]

(2)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 2 -

局所的 情報 程度 視 示 ー あ

.

, m 個 ー ン 式(1) 用い巡回路 生成

動作 1 , t 目 任意 2 都市i,j

間 設置さ い ン

τ

次 う 定義

さ .

� + = � ∙ � + ∆�

∆� = ∑ = ∆�

∆� = { � , ∈ �

ℎ �

ρ ン 蒸発率 表 ー あ , <

ρ < 間 設定さ . 蒸発効 , 通 い経路

ン 薄 い , 過去 行動 情報 新 い行動 情報

適応的 変化さ 解 収束 行う 出来 . ∆� , t

目 m個 ー ン 経路i,j 設置 ン

総 示 . ∆� ー ン k 都市i,j間 設置

ン 示 , Q ー ン 1 設置

ン 定 示 ー , �k ー ン k 生成

巡回路 経路長 あ , � ー ン k 通 経路

合 あ . 即 経路 設置さ ン 経路長

逆数 決定さ , 経路長 短い経路 大 い

ン 置 , 逆 経路長 長い経路 少 い

ン 置 .

AS 基本動作 ン 初期化 行い, 式(1)

用いm個 ー ン 確率的 巡回路 生成 . 後

式(2), 式(3), 式(4) 用い ン 更新 , 終了条件 満

繰 返 .

3.2 Max-Min Ant System

Max-Min Ant System(以 :MMAS) AS 改良 手法

あ .AS 間 経路 ン 中 解 収束

起 , 経路 抜 出 困 う.

MMAS , 各経路 置 ン 限値 限値

区間 ,� ] 限定 .さ ン 更新

各 最 成績 良い ー ン 経路 用い .

限値 限値 限定 , 解 収束 起 僅

確率 全 経路選択 出来 解 多様性

保 出来 . さ 優秀 ー ン 経路 使う

, 優 経 路 素 早 解 収 束 行 う 出 来 .

MMAS � , � 以 式 定 い .

� � = × − −

� =� �( − √ )

( ⁄ − ) √

C − o− t 最短 巡回路長

あ , n 都市数, ン 標準化 際 限値

関 ー あ .

4.

相対評価

既存手法 経路 評価方法, 即 ン 更新

ー ン 通 経路 設置 い絶対評価 あ .

あ 経路 評価 , あ い 昇 場合, 周

辺 経路 対 価値 伝搬さ , 再評価 機会 与え

必要 考え . う , あ 評価対象 評価 他

評価対象 影響 与え 評価方法 相対評価 呼ば , 動的

意思決定課題 い 有用 あ 示さ い

[Tversky 74]. 相対評価 ACO 付加 , 解 収束

探索 安定 起 際 , 環境 変化 周辺 経路

伝播 素早 環境 変化 対応 出来

考え .

5.

提案手法

MMAS ン更新 式(2), 式(3), 式(4) う 都市i,j

あ 既存 ン 揮発 数ρ 減衰さ ,

新 ー ン 設置 ン∆� 加算 手法

あ . 手法 , 環境 変化 直接影響 受

辺 , ー ン 通 辺 . 環境 変

化 ばや 対応 出来 い 考え . 本研究

, ー ン 通 経路 選択 評価対象 , 通

経路 他 評価対象 , 選択 評価対象 評価 ,

他 評価対象 影響さ 相対評価的 ン 更新

手法Ant System with Relative Evaluation 以 :AS-RE 提案

. AS-RE t 目 最 成績 良い ー ン 通

辺i,k ー ン 通 い い辺 i,j

ン更新式 以 式(7), 式(8) 分 .

� + = � + ��

� + = �� + ���

�� = �� +

� − − −�

= � − � +

� − − (9)

�� t t 目 ン 変化 , 既存手法

∆� 相当 . 微少 数μ 辺i,k 評価 隣接 辺i,j

与え 影響 調節 行 い . 提案手法 ー ン

通 経路 式(7) う 辺 設置さ い ン

変化 加算 . ー ン 通 経路 式

(8) う , 辺 設置さ ン 蒸発 数ρ

減少さ 辺i,k間 変化 僅 加算さ .

変化 �� t 他 経路 拡散さ 等 い. あ

程度探索 進 解 収束 起 , 経路 一定

式(9) ⁄C − o− 一定 値 , ρ − τ t 値

減少 い 変化 �� t 0 近 , � t 一定 値

収束 . MMAS � 一定 確率 全

経路 選択さ . 経路 i,j � 確率 選ば ,

τ 含 新 経路 総 小さ 場合, 変化

�� t 増大 . 式(8) 他 経路 ン

増え , あ 程度収束 後 解 再探索 出

来 .

さ , 解 収束 変化 �� t 0 近 い , 環

境 変化 起 通 い 経路 経路長 大

場合, 変化 �� t 負 値 辺i,k ン 減

少さ . 他 経路 対 負 変化 伝播さ 微少

(3)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 3 -

相対的 他 経路 評価 再探索 出来

い 考え .

6.

シポュリーション

本論文 動的 環境 再現 , 図1 う 2

心 状 数 都市 均等 並 都市配置 TSP

. 都市配置 側 都市郡 都市, 外側 都市郡

外 都市 呼ぶ. 問題 都市 外 都市 半 比

最適解 図1 う C型, O型 う 変化 . 外

都市 半 固定 都市 半 変化さ , C

型 O型 最適解 入 替わ 境界線 半 R .

都市 R 側 配置 最適解 C型 , R

外側 配置 最適解 O型 .

型 最短経路C , C 式(10), 式(11) 得 .

� = { + − + − }

� = + + −

外 都市 半 , 都市 半 , n

都市 外 都市 配置さ い 都市数 表 い .

本実験 最初 都市 R 側 配置 .

R 都市 差 r . 状態 探索 行いC型

最適解 求 . 最適解 求 後解 収束 行う

100 探索 . 後, 都市 R r

外側 再配置 環境 変化 起 . 状態 探索 再

開 O型 最適解 得 数 評価 1試

行 ュ ー ョン 行 . 本実験 , 都市 再配

置 行わ 5000 超え 場合, 探索 局所解

陥 最適解 発見 探索 終了 .

ュ ー ョン 用い MMAS AS-RE ー ,

= . , 可視化 = . , ー ン 1

落 ン 総 Q = . , ン 蒸

発 数ρ = . , τ 影響度μ = . × � × .

図1:2 都市配置 最適解 局所解

6.1 結果

r 初期値 0.1 ュ ー ョン 行い, 100試行 , r

0.001刻 減少さ , r = . 施行 結 図2 示

. 縦軸 再配置 最適解 得 数, 横軸

境界線半 R 都市 半 差r 示 い . 図2

r = . 環境 変化 大 い MMAS AS-RE

1 最適解 求 出来 い .

r 小さ 環境 変化 小さ 問題

MMAS AS-RE 最適解 見 数

増え い わ . AS-RE MMAS 常 少

い 数 最適解 発見 確 .

既存手法 非定常環境 適応 図 い

考え .

図2:動的環境 実験結

7.

結論

本研究 , 動的環境 適応 相対評価 ACO

付加 既存手法 性能 向 図 . 結 ,

本実験 使用 動的環境 い 性能 向 見

出来 . , 既存手法 ン 更新 絶対評価

決定さ い , 提案手法 ー ン 通

経路 変化 通 い い経路 影響さ , 相対評価

考え . 相対評価 解 収束 起 い

解 再探索 出来 既存手法 良い結

得 考え . 今後 課題 , 他 動的環境

提案手法有効性 他 ュー テ 相対評価 有

用性 検証 い.

参考文献

[M.Dorigo 96] M. Dorigo, V. Maniezzo, A. Coloni (1996): The Ant System:Optimization by a Colony of Cooperating Agents, IEEE Trans. SMC-Part B, Vol. 26, No. 1, pp. 29-41. [山本 97] 山本芳嗣, 久保幹 (1997): 巡回 ー ン問題

招 , 朝倉書店.

[原 12] 原元 , 梶 大輔, 堀 匡 (2012): ACO 分割統

治型TSP近似解法, 知能 情報 日本知能情報 学

会 Vol. 24, No. 6, pp. 1101-1105.

[ 川 12] 川正志, 川 敬, 渡辺美知子, 木 正博, 山本 人,

鈴木育男: ュー テ ュ ン ューテ

ン , 社,2012

[久保 09] 久保幹 , J. P. ペ ソ (2009): ュー テ

数理, 共立出版.

[ 川 12] 川正志, 川 敬, 渡辺美知子, 木 正博, 山本

人, 鈴木育男 (2012): ュー テ ュ ン

ューテ ン , 社.

参照

関連したドキュメント

I Samuel Fiorini, Serge Massar, Sebastian Pokutta, Hans Raj Tiwary, Ronald de Wolf: Exponential Lower Bounds for Polytopes in Combinatorial Optimization. Gerards: Compact systems for

In this paper we develop a general decomposition theory (Section 5) for submonoids and subgroups of rings under ◦, in terms of semidirect, reverse semidirect and general

Altering one knot value, curve points move on well-defined paths, the limit of which can be computed if the knot value tends to infinity.. Symmetric alteration of two knot values

Theorem 4.8 shows that the addition of the nonlocal term to local diffusion pro- duces similar early pattern results when compared to the pure local case considered in [33].. Lemma

This paper develops a recursion formula for the conditional moments of the area under the absolute value of Brownian bridge given the local time at 0.. The method of power series

Since we are interested in bounds that incorporate only the phase individual properties and their volume fractions, there are mainly four different approaches: the variational method

The variational constant formula plays an important role in the study of the stability, existence of bounded solutions and the asymptotic behavior of non linear ordinary

7.1. Deconvolution in sequence spaces. Subsequently, we present some numerical results on the reconstruction of a function from convolution data. The example is taken from [38],