ITS ITS における における
知的ネットワークシステムの構築 知的ネットワークシステムの構築 - - 知的信号機システムの提案 知的信号機システムの提案 - -
中島 中島 史裕( 史裕( 同志社大院) 同志社大院)
廣安 廣安 知之( 知之( 同志社大工) 同志社大工)
三木 三木 光範( 光範( 同志社大工) 同志社大工)
○ ○
研究背景 研究背景
自律分散型のネット 自律分散型のネット
ワークシステム ワークシステム
インターネットの普及に伴うシステムのネットワーク化.
インターネットの普及に伴うシステムのネットワーク化.
具体的なネットワークシステムの構成方法の検討.
具体的なネットワークシステムの構成方法の検討.
ITSに適用し,その有効性を検証. ITS に適用し,その有効性を検証.
知的ネットワークシステム 知的ネットワークシステム
EX.
知的照明システム
研究背景 研究背景
人・道路・車のネットワーク化による各種の問題解決 人・道路・車のネットワーク化による各種の問題解決
ITS ITS ( ( 高度道路交通システム) 高度道路交通システム)
交差点における交通管理の役割を果たす 交差点における交通管理の役割を果たす
信号機が重要 信号機が重要
渋滞問題 渋滞問題 発生箇所のほとんどが 発生箇所のほとんどが 交差点 交差点 や合流部 や合流部
知的信号機システム
知的信号機システム
知的信号機システム 知的信号機システム
ネットワーク型知的信号機システム ネットワーク型知的信号機システム 独立型知的信号機システム
独立型知的信号機システム 自律分散システム
自律分散システム 信号機システム 信号機システム
知的ネットワーク 知的ネットワーク
システム システム 信号機システム 信号機システム
信号機システムにおける自律分散シ 信号機システムにおける自律分散シ ステムの有効性の検証,および強化 ステムの有効性の検証,および強化 学習の学習方法の検討.
学習の学習方法の検討.
知的ネットワークシステムの有効性の検証.
知的ネットワークシステムの有効性の検証.
知的信号機システム 知的信号機システム
目的 目的 交通渋滞を減少させる. 交通渋滞を減少させる.
交通量を取得.
交通量を取得.
強化学習により
強化学習により 自律的に判断基準を生成し 自律的に判断基準を生成し , , 最適な動作を決定.
最適な動作を決定.
・信号機のサイクル を調節.
・信号機のサイクル を調節.
・信号機の青,赤の切り替え.
・信号機の青,赤の切り替え.
Sense Sense Judge Judge
Act Act
Sense
Judge
Act
強化学習 強化学習
Q-Learning Q-Learning
「状態 「状態 s s
tt」 」 と「行 動 と「行 動 a a
tt」 」 の組に対する評価( の組に対する評価( Q Q 値)を見積もる. 値)を見積もる.
+ +
−
← (1 ) ( , ) ( + , )
) ,
(
s a s a r max s
t 1a
ta t
t t
t
t Q Q
Q α α γ
異なる「状態」と「行動」を設定したシステム 異なる「状態」と「行動」を設定したシステム
を提案し,その有効性を検証.
を提案し,その有効性を検証.
Q Q 値を与 える「状態」と「行動」の設定が重要 値を与 える「状態」と「行動」の設定が重要
α:学習率(
0<α≦
1),γ:割引率(
0≦γ≦
1)
「 状態」 と「 行動」 の設定
「 状態」 と「 行動」 の設定
状態 状態
行動 行動
状 態 状 態 1:交差点単位の累積交通量 1 :交差点単位の累積交通量 状 態 状 態 2:交差点の渋滞パターン 2 :交差点の渋滞パターン
行 動 行 動 1:サ イクル 値 の 増 減 1 :サ イクル 値 の 増 減
行 動 行 動 2:信号機の状態(青 ・赤)の 決 定 2 :信号機の状態(青 ・赤)の 決 定
状態 状態 1 1 ( ( 交差点単位の累積交通量) 交差点単位の累積交通量)
Sense
X1
X4 X3
X2
X1=0
〜
9Time
Sense Sense Q-Learning
Q-Learning SenseSense
Sense Sense Sense Sense Sense Sense Sense Sense Sense Sense Q-Learning
Q-Learning
Sense Sense Sense Sense Q-Learning
Q-Learning
累積 累積
累積 累積
X1〜X1
〜
X4の合計X4の合計
状態 状態 2 2 ( ( 交差点の渋滞パターン) 交差点の渋滞パターン)
0
・・・
・・・
LV.1LV.1
渋滞 渋滞
LV.2LV.2渋滞 渋滞
LV.1 LV.1 渋 滞 渋 滞
各交差点の渋滞状況を 各交差点の渋滞状況を
パ ターン化(全
パ ターン化(全 51 51 状態) 状態)
LV.2 LV.2 渋 滞 渋 滞
交差点から車 が
交差点から車 が
3〜3〜
5台5台 連 続 している場合
連 続 している場合
交差点から車 が
交差点から車 が
6台 以 上6台 以 上 連 続 している場合
連 続 している場合
1 2 3
4 5 16
17 18 50
行動 行動
行 動 行 動 1(サ イクル値の増減) 1 (サ イクル値の増減)
行 動 行 動 2(信号機の状態の決定) 2 (信号機の状態の決定)
横方向の 横方向の 青信号 青信号 ( ( 赤信号 赤信号 ) ) の 時 間 の 時 間 を短縮 を 短縮 ( ( 延長 延長 ) ) する. する .
Act(1) Act(1)
横方向の 横方向の 青信号 青信号 ( ( 赤信号 赤信号 )の 時 間 )の 時 間 を を 延長 延長 ( ( 短縮 短縮 )する. )する.
Act(2) Act(2)
横方向の信号機を
横方向の信号機を 赤 赤 (縦 方 向 を (縦 方 向 を 青 青 )にする. )にする.
Act(1) Act(1) Act(2)
Act(2) 横方向の信号機を 横方向の信号機を 青 青 (縦 方 向 を (縦 方 向 を 赤 赤 )にする. )にする.
独立型知的信号機システム 独立型知的信号機システム
知的信号機システム 知的信号機システム 1 1
交差点単位の累積交通量 交差点単位の累積交通量
サ イクル 値 の 増 減 サ イクル 値 の 増 減
交差点の渋滞パターン 交差点の渋滞パターン
信号機の状態(青 ・赤)の 決 定 信号機の状態(青 ・赤)の 決 定
知的信号機システム 知的信号機システム 2 2
サ イクル 値 の 増 減 サ イクル 値 の 増 減
知的信号機システム 知的信号機システム 3 3
交差点の渋滞パターン 交差点の渋滞パターン 状 態 状 態
行 動 行 動
状 態 状 態 行 動 行 動
状 態 状 態 行 動 行 動
「状態」設 定
「状態」設 定 の検証 の検証
「行動」設 定
「行動」設 定
の検証 の検証
Q-Learning
Q-Learning におけるパラメータ設定 におけるパラメータ設定
学 習 率
学 習 率 α: α:
0.070.07割 引 率
割 引 率 γ: γ:
0.90.9行動選択方法:
行動選択方法:
BoltzmannBoltzmann選 択 選 択
QQ値 の 初 期 値 : 値 の 初 期 値 :
0.1 0.1温度定数 温度定数
T: T:
0.2 0.2∑
∈=
actions k
T Q
T Q
t
t
e
s e
a
s aa s p
t t t t
) , ( ) , (
)
| (
知的信号機システム 知的信号機システム 1 1
各交差点の交通量を取得.
各交差点の交通量を取得.
各 交 差 点 の
各 交 差 点 の 累 積 交 通 量 累 積 交 通 量 を を 計算し,これ を状 態 とする.
計算し,これ を状 態 とする.
Q値 を更新する. Q 値 を更新する.
決められた行動選択方法に 決められた行動選択方法に より行動を決 定 し,実行する.
より行動を決 定 し,実行する.
報酬を受け取る.
報酬を受け取る. 前の状態(累積交通量)
と比べて, 交 通 量 が 減 少 していた場合に報酬
1を与える.
Act(1)
Act(1):
: 横 方 向 の 青 信 号
(赤信号)の 時 間 を 短 縮
( 延 長 ) .
Act(2)Act(2):
: 横 方 向 の 青 信 号
(赤信号)の 時 間 を 延 長
( 短 縮 ) .
知的信号機システム 知的信号機システム 2 2
各交差点の交通量を取得.
各交差点の交通量を取得.
各 交 差 点 の
各 交 差 点 の 渋滞パターン 渋滞パターン を計 算 し,状態とする.
を計 算 し,状態とする.
Q値 を更新する. Q 値 を更新する.
決められた行動選択方法に 決められた行動選択方法に より行動を決 定 し,実行する.
より行動を決 定 し,実行する.
報酬を受け取る.
報酬を受け取る. ・ 渋滞なし の場合に報酬
10.
・
LV.2渋 滞 →
LV.1渋 滞 の場 合に報酬
1.
Act(1)
Act(1):
: 横 方 向 の 青 信 号
(赤信号)の 時 間 を 短 縮
( 延 長 ) .
Act(2)Act(2):
: 横 方 向 の 青 信 号
(赤信号)の 時 間 を 延 長
( 短 縮 ) .
知的信号機システム 知的信号機システム 3 3
各交差点の交通量を取得.
各交差点の交通量を取得.
各 交 差 点 の
各 交 差 点 の 渋滞パターン 渋滞パターン を計 算 し,状態とする.
を計 算 し,状態とする.
Q値 を更新する. Q 値 を更新する.
決められた行動選択方法に 決められた行動選択方法に より行動を決 定 し,実行する.
より行動を決 定 し,実行する.
報酬を受け取る.
報酬を受け取る. ・ 渋滞なし の場合に報酬
2.
・
LV.2渋 滞 →
LV.1渋 滞 の場 合に報酬
1.
Act(1)
Act(1):
: 横 方 向 の 信 号 機 を赤 にする.
Act(2)
Act(2):
: 横 方 向 の 信 号 機
を青 にする.
シミュレーションの環境 シミュレーションの環境
道 路 :
道 路 :
4×4×
4の格子状4の格子状
(16(16交 差 点 交 差 点
))車 発 生 確 率 : 一定
車 発 生 確 率 : 一定
スプリット:
スプリット:
1:1(青:赤)1:1(青:赤)
基本サイクル:
基本サイクル:
80(steps)80(steps)車 の 動 作 車 の 動 作
・発 生 時 の 進 行 方 向 を目的方向とし,基本的に直進.
・発 生 時 の 進 行 方 向 を目的方向とし,基本的に直進.
・交 差 点 先 が 渋 滞 している場合は左折後,右折して回避.
・交 差 点 先 が 渋 滞 している場合は左折後,右折して回避.
車 発 生 比 率 : 上から
車 発 生 比 率 : 上から
3本目が3本目が
2,他2,他
1.1. 動作方法: セルラーオートマトン
動作方法: セルラーオートマトン
信号機故障時のシミュレーション 信号機故障時のシミュレーション
信号機が故障した時に発生する渋滞への対応を 信号機が故障した時に発生する渋滞への対応を
シミュレーションで検 証 . シミュレーションで検 証 .
5000(
5000(steps) steps) に信号機が に信号機が 故障(全て赤信号).
故障(全て赤信号).
周囲の交通状況に影響
周囲の交通状況に影響
「 状態」 に関する比較
「 状態」 に関する比較
100 120 140 160 180 200 220 240 260
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Steps
Total Traffic Volume
Conventional Traffic Light Systems Intelligent Traffic Light System 1 Intelligent Traffic Light System 2
「 状態」 に関する考察
「 状態」 に関する考察
交差点単位の累積交通量 交差点単位の累積交通量
(知的信号機システム
(知的信号機システム 1 1 ) )
交差点の渋滞パターン 交差点の渋滞パターン
(知的信号機システム
(知的信号機システム 2 2 ) )
同じ状 態
状態 (
9) 状態 (
9)
9台
9台
Q
値の差が開かない.
異なる状態
状態 ( 17 ) 状態 ( 18 )
9台
9台
Q
値 の 差 が 開 く.
縦・横の交通流が明示的な「状態」の設定が必要.
縦・横の交通流が明示的な「状態」の設定が必要.
「交差点の渋滞パターン」が有効.
「交差点の渋滞パターン」が有効.
「 行動」 に関する比較
「 行動」 に関する比較
100 120 140 160 180 200 220 240 260
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Steps
Total Traffic Volume
Conventional Traffic Light Systems Intelligent Traffic Light System 2 Intelligent Traffic Light System 3
「 「 行動」 行動」 に関する考察 に関する考察
サ イクル 値 の 増 減 サ イクル 値 の 増 減
(知的信号機システム
(知的信号機システム 2 2 ) )
信号機の状態の決定 信号機の状態の決定
(知的信号機システム
(知的信号機システム 3 3 ) )
信号機の時間を変化させ る. 信号機の状態を変化させ る.
直接的に「状態」を変化させる「行動」の設定が必要.
直接的に「状態」を変化させる「行動」の設定が必要.
「信号機の状態の決定」が 有 効 .
「信号機の状態の決定」が 有 効 .
Act(2)
Act(2) Act(2)Act(2)
良い「行 動 」をとっても「状態」
に反映されない場合がある.
良い「行 動 」が 「状 態 」 に必ず反映される.
状態 ( 0 )
状態 (
1) 状態 (
1) 状態 ( 1 )
交通流を限定したシミュレーション 交通流を限定したシミュレーション
交通流を上 か ら
交通流を上 か ら 3本目の左方向のみにすることで, 3 本目の左方向のみにすることで,
学習効果が明確になる.
学習効果が明確になる.
途中から信号機を故障させる 途中から信号機を故障させる
ことで,車の流れが変わる.
ことで,車の流れが変わる.
交通流に沿って青信号が続く 交通流に沿って青信号が続く
ような「行 動 」を選択するよう
ような「行 動 」を選択するよう
になる. になる.
独立型知的信号機システムにおける考察 独立型知的信号機システムにおける考察
知的信号機システム 知的信号機システム 3 3 強化学習により,信号機システムにおける
強化学習により,信号機システムにおける 自律分散システムの有効性が検証できた.
自律分散システムの有効性が検証できた.
状 態 状 態
行 動 行 動
信号機の状態の決定 信号機の状態の決定
交差点の渋滞パターン 交差点の渋滞パターン
知的信号機システム
知的信号機システム 3 3 のアルゴリズムを のアルゴリズムを
用いた知的ネットワークシステムの適用
用いた知的ネットワークシステムの適用
ネットワーク型知的信号機システム ネットワーク型知的信号機システム
知的信号機システム
知的信号機システム 3(a) 3( a)
知的信号機システム
知的信号機システム 3(b) 3( b)
ネットワーク化による有効性の検証.
ネットワーク化による有効性の検証.
4近傍の交差点の交通量情報を参照. 4 近傍の交差点の交通量情報を参照.
周辺を含めた広域の交通量の減少を目的とする.
周辺を含めた広域の交通量の減少を目的とする.
目的交差点の交通量情報を参照.
目的交差点の交通量情報を参照.
一つの交差点の交通量の減少を目的とする.
一つの交差点の交通量の減少を目的とする.
知的ネットワークシステム
知的ネットワークシステム 信号機システム 信号機システム
知的信号機システム
知的信号機システム 3( 3( a) a)
各交差点の交通量を取得.
各交差点の交通量を取得.
各 交 差 点 の
各 交 差 点 の 渋滞パターン 渋滞パターン を計 算 し,状態とする.
を計 算 し,状態とする.
Q値 を更新する. Q 値 を更新する.
決められた行動選択方法に 決められた行動選択方法に より行動を決 定 し,実行する.
より行動を決 定 し,実行する.
報酬を受け取る.
報酬を受け取る.
Act(1)
Act(1):
: 横 方 向 の 信 号 機 を赤 にする.
Act(2)
Act(2):
: 横 方 向 の 信 号 機 を青 にする.
・前状態に比べて, 各 交 差
点とその
4近傍の交通量の
和が
15台以上減少 した場合
に報酬
2.
知的信号機システム
知的信号機システム 3( 3( b) b)
・目的交差点の状態が 渋滞なし の場合に報酬
2.
・目的交差点の状態が
LV.2渋滞
→
LV.1渋滞 の場合に報酬
1.
各交差点の交通量を取得.
各交差点の交通量を取得.
各 交 差 点 の
各 交 差 点 の 渋滞パターン 渋滞パターン を計 算 し,状態とする.
を計 算 し,状態とする.
Q値 を更新する. Q 値 を更新する.
決められた行動選択方法に 決められた行動選択方法に より行動を決 定 し,実行する.
より行動を決 定 し,実行する.
報酬を受け取る.
報酬を受け取る.
Act(1)
Act(1):
: 横 方 向 の 信 号 機 を赤 にする.
Act(2)
Act(2):
: 横 方 向 の 信 号 機
を青 にする.
広域の交通量を参照した結果 広域の交通量を参照した結果
80 90 100 110 120 130 140
0 1000 2000 3000 4000 5000
Steps
Total Traffic Volume
Intelligent Traffic Light System 3 Intelligent Traffic Light System 3(a)
知的信号機システム
知的信号機システム 3( 3( a) a) におけ におけ るシミュレーション結果の考察 るシミュレーション結果の考察
ネットワークを介 して,他の信号機の
ネットワークを介 して,他の信号機の Sense部 を利 用 . Sense 部 を利 用 . 4 4 近傍の信号機の 近傍の信号機の Sense Sense 部が 部が
取得した交通量情報を参 照 .
取得した交通量情報を参 照 .
広域の交通量の減少が目的
広域の交通量の減少が目的
目的交差点の交通量を参照した結果 目的交差点の交通量を参照した結果
0 5 10 15 20 25 30
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Steps
Local Traffic Volume
Intelligent Traffic Light System 3 Intelligent Traffic Light System 3(b)
知的信号機システム
知的信号機システム 3( 3( b) b) におけ におけ るシミュレーション結果の考察 るシミュレーション結果の考察
目 的 交 差 点 目 的 交 差 点
他の交差点信号機の Act 部 を利用.
他 の 交 差 点 他 の 交 差 点
目的交差点信号機の Sense 部 を利用.
ネットワークを介 して,他 の ネットワークを介 して,他 の
信 号 機 の
信 号 機 の Sense Sense 部 や 部 や Act部 Act 部 を利 用 .
を利 用 .
結論 結論 1 1
・ ・ 自律分散システムの信号機システムへの適用. 自律分散システムの信号機システムへの適用.
・ ・ 知的人工物の 知的人工物の Judge部における Judge 部における Q-Learningの適用. Q-Learning の適用.
シミュレーション結果から,従来型の信号機システム シミュレーション結果から,従来型の信号機システム
に比べ,良い性能を示 した.
に比べ,良い性能を示 した.
信号機システムにおいて,自律分散システム 信号機システムにおいて,自律分散システム
および知的ネットワークシステムは有効である.
および知的ネットワークシステムは有効である.
・ ・ 知的ネットワークシステムの信号機システムへの適用. 知的ネットワークシステムの信号機システムへの適用.
結論 結論 2 2
・直接的に状態を変化させ るような「行動」の 設 定 .
・直接的に状態を変化させ るような「行動」の 設 定 .
・縦 と横の交通流を明示的にする「状 態 」の 設 定 .
・縦 と横の交通流を明示的にする「状 態 」の 設 定 .
・信号機故障の場合,他の信号機により機能低下
・信号機故障の場合,他の信号機により機能低下 を補 うことが可能.
を補 うことが可能.
・ ・ Q Q 値 を与える「状態」および「行動」の設定が重要. 値 を与える「状態」および「行動」の設定が重要.
・ネットワーク化により,他 の 信 号 機 の
・ネットワーク化により,他 の 信 号 機 の Sense部 Sense 部
および および Act部の有効利用が可能. Act 部の有効利用が可能.
今後の課題 今後の課題
・ ・ Q Q 値における動的変化の検討. 値における動的変化の検討.
・ ・ 知的信号機システムに与える目的の設定方法. 知的信号機システムに与える目的の設定方法.
・ ・ 強化学習における他手法との比較. 強化学習における他手法との比較.
- - 突発的な環境変化に対する柔 軟 性 の 欠 如 の 可 能 性 . 突発的な環境変化に対する柔 軟 性 の 欠 如 の 可 能 性 .
- - 一定時間毎に初期状態に近づける 一定時間毎に初期状態に近づける Q Q 値 の 動 的 変 化 . 値 の 動 的 変 化 .
補足: 信号機のサイクル 補足: 信号機のサイクル
赤
青
time
Cycle time
補足: 補足: Q Q 値の更新状況( 値の更新状況( 知的信号機システム 知的信号機システム 3 3 ) )
*******Step1000
の
Q値
*******信号機
3q0(0) 1.36644771261504 q0(1) 2.034504053187063 q1(0) 0.11687912507441091 q1(1) 0.48950989456202426 q2(0) 0.15465956227040462 q2(1) 1.1276795869646143 q3(0) 0.6289013133037114 q3(1) 0.10674727318193139 q4(0) 1.4330664071220742 q4(1) 0.12793975804885488 q5(0) 0.15802097596076287 q5(1) 0.6511083772538838 q6(0) 0.30101107434937613 q6(1) 0.0993
・ ・
・ ・
*******Step10000
の
Q値
*******信号機
3q0(0) 1.5380964883540666 q0(1) 10.767915416687488 q1(0) 0.11687912507441091 q1(1) 0.48950989456202426 q2(0) 0.15465956227040462 q2(1) 7.300104284382606 q3(0) 9.720320868541936 q3(1) 0.10674727318193139 q4(0) 10.072004246927069 q4(1) 0.12793975804885488 q5(0) 0.15802097596076287 q5(1) 0.6511083772538838 q6(0) 9.080670332151792 q6(1) 0.0993
・ ・
・ ・
0 1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20 20
20 21 21 21 22 23 24 25 26 27
30 29
28
33 32
31 36 36 36 36
36
34 35
39 39
39 39 39
38
37 41 41
41 41 41 42
40
44
44 44 44 44 45
43
48 47
46
46 48
46
46 47 47 48
46
補足: 知的人工物 補足: 知的人工物
知的人工物をネットワークにつなぎ,
知的人工物をネットワークにつなぎ,
システム化させたもの . システム化させたもの .
知的人工物 知的人工物
Sense
Judge
Act