令和元年度 修士論文
都市間高速道路サグ部の交通 状態遷移に着目した事故・渋滞 発生確率予測モデル
首都大学東京大学院 都市環境科学研究科
都市基盤環境学域 社会基盤分野
交通研究室
18851523 舟橋 尚平
指導教官 小根山 裕之 教授
1
目次
はじめに ... 3
本研究の概要 ... 3
本研究の流れ ... 7
第1章 研究背景及び目的 ... 9
第2章 分析対象とデータ ... 13
分析対象区間 ... 13
分析対象期間と分析対象時間 ... 14
第1項 分析対象期間 ... 14
第2項 データの利用時間帯 ... 14
利用データの詳細 ... 15
第1項 5分間車両感知器 ... 15
第2項 事故調書 ... 15
第3項 天候データ ... 15
渋滞と事故の定義 ... 16
第1項 渋滞 ... 16
第2項 事故 ... 16
第3章 ベイジアンネットワーク推計モデルの構築 ... 18
ベイジアンネットワークについて ... 18
分析手法 ... 19
第1項 手法概要 ... 19
第2項 変数の離散化 ... 21
分析結果とその考察 ... 25
第1項 モデル構造の概要... 25
第2項 感度分析結果 ... 26
第3項 的中率を用いた精度検証 ... 28
第4項 日別推定結果に基づく精度検証 ... 30
2
第5項 より詳細な感度分析 ... 31
第6項 まとめ ... 40
第4章 ディープラーニングを活用したモデルの構築 ... 42
構築するディープラーニングモデルについて ... 42
第1項 ディープラーニングとは... 42
第2項 LSTM(Long Short-Term Memory) 層とは ... 43
第3項 入出力データとモデル構造 ... 44
分析結果 ... 47
第1項 損失値と正解率 ... 47
第2項 再現率 ... 49
第3項 時系列予測 ... 57
第5章 まとめ ... 76
まとめ ... 76
参考文献 ... 78
謝辞 ... 79
付属資料 ... 81
3 はじめに
本章では,本稿の要旨と流れに関して記載する.
本研究の概要
1.背景と目的
都市間高速道路単路部での上り坂やトンネル部などのボトルネックにおいて渋滞が発生すること は,これまでの研究により明らかとなっている.渋滞は経済的な損失が大きく,わが国の大動脈で ある東名高速道路上り線横浜町田IC~海老名JCTにおいては151[万人・時間/年]もの渋滞損 失時間が発生している.現在,主要な都市間高速道路において,全渋滞長のうちの約25%が事 故を原因として生じていることからも,事故を原因とした渋滞への対策が急がれる.交通事故を発 生させないためには,現在及び過去の交通状況に基づいて事故・渋滞の起こりやすさを推定し,
出来る限り事故の発生しないような交通制御を実施していくことが求められる.特に近年では走光 型視線誘導システムやVariable Speed Limit(VSL),ランプメータリングなど様々な交通制御手 法が検討され,それらが事故・渋滞の発生を抑制する効果を有することが明らかとなっており,それ ら施策をより効果的に活用することへの寄与も期待できる.また既往研究により,「事故に至る渋滞 発生」や「渋滞の原因となる事故発生」につながる交通状況を事前に検知できる可能性を有するこ とが明らかとなった.
そこで本研究では,実際の交通安全施策の効果的な活用を見据え,都市間高速道路における 様々な要因,条件下での事故・渋滞発生確率を予測するモデルの構築を目的とし,その精度を検 証する.
4 2.対象とデータ
本研究の対象は,東名高速道路上り線における大和トンネル(TN)以西15kmの区間である.こ の区間は主要渋滞個所である大和TNをはじめとする慢性的な単路部ボトルネックが存在し,特 に週末を中心に事故および事故が多く発生している.期間は2015年1月から2017年12月ま での土休日であり,事故の発生がより多いとされる日の出から日没後1時間までを分析対象時間 とした.利用データは5分間車両感知器による速度等のデータと,事故有無を把握するための事 故調書,気象庁のアメダスデータである.なお,本研究では渋滞発生の定義を時速60km以下が 10分以上継続した場合とし,大和TNから厚木ICまでの区間内1箇所でもその条件を満たす 場合を渋滞発生とする.一方事故発生の定義も同様に,大和TNから厚木ICまでの区間内1箇 所でも事故発生がみられた場合を事故発生とした.発生時間についてはその時間が含まれる感知 器基準の5分間を発生時間とした.
5 3.ベイジアンネットワーク推計モデルの構築 3-1.手法
はじめに,ベイジアンネットワークを用いた推計モデルを構築した.ベイジアンネットワークが出力 する条件付き確率は,蓄積されたデータの学習により推定される.本研究では,非渋滞時のある時 刻Tとその5,10分前の時刻における車両感知器データから得られる交通データを,kmeans++
法により離散化を行った.これらを説明変数として与え,時刻Tからt(t=10,15,20,25,30)分以内 において区間内に生じる交通状態遷移を推計する.ここで交通状態遷移とは,t分以内渋滞発生 (その後60分以内に事故発生有),t分以内渋滞発生(その後60分以内に事故発生無),t分以 内事故発生の3状態への遷移に,非渋滞が継続する場合を加えた4つの交通状態を指し,これ を目的変数として与える.
3-2.分析結果
分析の結果,全ての時間tにおいて区間内の上流側と下流側の速度,交通量による影響を受 けていることが明らかとなった.これは事故・渋滞の発生を説明する要因として妥当であると考えら れる.ここで10分以内の交通状態遷移に関して感度分析を行い,事故や渋滞の発生確率が高ま る条件を確認した.その結果を図1,2に示す.リフト値は無条件確率に対して何倍事故が起きや すくなったかを示す.これより,上流側と下流側の速度差が大きい場合に事故の発生が起きやすく なることを確認できた.特に,交通量の大小との組み合わせで発生する事故のタイミングが変化す る可能性が示唆された.一方,上流側と下流側の速度差が小さい場合には,事故発生の無い渋 滞が発生しやすくなることが確認できた.これにより,事故と渋滞の異なる要因を表現可能な実用 的なモデルを構築できた.
6 4.ディープラーニングを活用したモデルの構築 4-1.手法
時々刻々と変化する様々な交通条件における適用性を高めるため,ディープラーニングによる判 別分析を行った.事故・渋滞の発生は時系列なものであり,そのようなデータの扱いに強みを持つ LSTMを用いることで予測への適用可能性を検討することとした.入力データにはベイジアンネッ トワークでの分析時と同じ変数を使用し,出力として5分後の事故・渋滞の発生を予測する.隠れ 層にはrelu関数,出力層にはsoftmax関数を用いた.そしてこの入力データから10の学習モ デルを形成し,予測された発生確率の平均値を分析した.
4-2.分析結果
その結果,時間経過とともに事故と渋滞の発生確率が同様に上昇し,途中から事故発生確率の 伸びが相対的に大きくなり,結果的に事故が発生する事例を確認できた.これにより,ディープラ ーニングにおいても事故と渋滞の異なる要因を表現可能なモデルを構築できた.
5.まとめ
本研究では,前者では具体的な要因,後者では時間的な流れに強みを持つ実用的なモデルを 構築できた.以上の結果を踏まえ,最後に本研究で提案した2種のモデルを活用し,交通事故発 生確率を低減させる交通運用の考え方について考察を行った.
7 本研究の流れ
本研究の流れを以下に示す.
第1章 研究背景及び目的 第2章 分析対象
第3章 ベイジアンネットワーク推計モデルの構築 第4章 ディープラーニングを活用したモデルの構築 第5章 まとめ
8
第1章 研究背景及び目的
9
第1章 研究背景及び目的
都市間高速道路単路部での上り坂やトンネル部などのボトルネックにおいて渋滞が発生すること は,これまでの研究により明らかとなっている.渋滞は経済的な損失が大きく(表1-1),わが国の大 動脈である東名高速道路上り線横浜町田IC~海老名JCTにおいては151[万人・時間/年]もの 渋滞損失時間が発生している1).現在,主要な都市間高速道路において,全渋滞長のうちの約
25%が事故を原因として生じている2)ことからも(図1-1,-2),事故を原因とした渋滞への対策が急
がれる.交通事故を発生させないためには,現在及び過去の交通状況に基づいて事故・渋滞の 起こりやすさを推定し,出来る限り事故の発生しないような交通制御を実施していくことが求められ る.特に近年では,日本で導入が進められている走光型視線誘導システム(図1-3),欧米を中心と した海外で導入されているVariable Speed Limit(=VSL)(図1-4)やランプメータリング(図1-5)な ど様々な交通制御手法が検討され,それらが事故・渋滞の発生を抑制する効果を有することが明 らかとなっており,それら施策をより効果的に活用することへの寄与も期待できる.また著者らの既 往研究3)により,「事故に至る渋滞発生」や「渋滞の原因となる事故発生」につながる交通状況を事 前に検知できる可能性を有することが明らかとなった.
そこで本研究では,実際の交通安全施策の効果的な活用を見据え,都市間高速道路における 様々な要因,条件下での事故・渋滞発生確率を予測するモデルの構築を目的とし,その精度を検 証する.
筆者ら既往研究では,ベイジアンネットワークモデルを用いたモデルの構築を行ったが,1年間 のデータ数に基づきモデル化を行ったため,事故発生時のデータが十分に確保できなかった.加 えて,説明変数をHIGHとLOWの2段階に離散化したため,大まかな傾向は捉えたものの,交 通状態の変化に応じたきめ細やかな交通制御に適用するには向かないモデルであった.今回は より精緻化されたモデル構造を目指し,3年間のデータを用いたモデル構築により,事故・渋滞の 発生しやすい交通状況の組み合わせを把握する.
10
表1-1 事故・渋滞の経済損失
渋滞 事故 経済損失貨幣価値換算値 約12兆円 約4兆円
(参考)国土交通省2017年度版「首都圏白書」
(参考)内閣府「交通事故による経済的損失に関する調査研究」報告書概要
図 1-1 全国の高速道路における事故件数推移
(参考)内閣府「平成30年度交通安全白書」
図 1-2 東名高速道路における渋滞量要因グラフ
(参考)NEXCO中日本データ集2014
交通集中 55%
工事 13%
事故 26%
その他 6%
交通集中 工事 事故 その他
11
図 1-3 走光型視線誘導システム
図 1-4 Variable Speed Limit(VSL)
図 1-5 ランプメータリング
12
第2章 分析対象
13
第2章 分析対象とデータ
本章では,本研究で用いる分析対象とそのデータの処理について示す.
分析対象区間
分析対象区間は,東名高速道路上り線における大和トンネル(以下TN)からその上流側15km の区間とした(図2-1).この区間は主要渋滞個所である大和TNをはじめとする慢性的な単路部ボト ルネックが存在し,特に週末を中心に渋滞および事故が多く発生している.
図 2-1 東名高速道路路線概要
東名高速
東名川崎IC
秦野中井IC
横浜町田IC
厚木IC
大和トンネル
海老名JCT 約15km
14 分析対象期間と分析対象時間 第1項 分析対象期間
2015年1月1日から2018年10月31日の休日のデータを用いる.そのうち2015年1月1 日から2017年12月31日までの3年分を学習データ,2018年1月1日から10月31日まで の10ヵ月分を検証データとして利用する.休日の定義は,毎週の土日に国民の休日,年末年始,
ゴールデンウィーク(GW),お盆の期間を加えたものとする.
第2項 データの利用時間帯
特に事故の発生が多い時間に絞るため,分析に用いるデータの時間帯を限定する.萩田ら4)に よる,「日没前後に交通事故率が高くなり,特に日没直後に最も高くなる」との知見を参考に,日の 出から日没から1時間後までの時間を分析対象とした.図2-2は萩田らから引用したものであり,
太陽の天頂角が東西方向に90°の時間に赤線をつけている.日の出から日没後の薄暮の時間に 事故が起こりやすくなっていることがわかる.
図 2-2 太陽の天頂角と事故率の関係
15 利用データの詳細
第1項 5分間車両感知器
5分間車両感知器データは高速道路上での車両感知器により収集されるデータであり,車線,
KPごとに5分あたりの全車台数,大型車台数,平均速度,Occupancyが記録されている.地点別 の交通量として,大型車台数に乗用車換算係数(=pce)1.8を掛けて求めた乗用車換算台数 (=pcu)を使用する.また分析対象区間に対して,図2-3に示す地点の車両感知器を基準として使 用する.
図 2-3 分析対象区間内の対象車両感知器
第2項 事故調書
実際に発生した事故について,個人の特性(性別や年齢)から事故発生当時の事故の原因や状 況,天候,路面,状態などが記録されている.
第3項 天候データ
気象庁のアメダスデータを使用する.観測地点は海老名とし,風速や降雨,気温等を利用する.
16 渋滞と事故の定義
第1項 渋滞
渋滞発生を時速60km以下が10分以上継続した場合とした.大和TNから厚木ICまでの区 間内において1箇所でもその条件を満たした場合を渋滞とする.またその条件を満たす時間に加 え,区間全域で速度回復してから30分経過するまで本研究での分析には用いないものとする.
第2項 事故
大和TNから厚木ICまでの区間内において1箇所でも事故の発生がみられた場合を区間内 における事故発生とした.特に本研究では,追突事故が本線で発生した場合のみを対象とした.
発生時間については,その時間が含まれる車両感知器基準の5分間を発生時間とする.なお,事 故発生以後日付が変わるまでのデータに関しては本研究での分析には用いないものとする.
図 2-4 使用データの判別に関して 渋滞発生 事故発生
速度がいずれかの区間で60km/h 以下を10分間継続し始める時刻
調書記載の発生時刻 日の出or 渋滞解消 から抽出 時
間 経 過
17
第3章
ベイジアンネットワーク推計モデルの構築
18
第3章 ベイジアンネットワーク推計モデルの構築
本章では,ベイジアンネットワークにより構築した推計モデルについてその過程と結果をまとめて いく.
ベイジアンネットワークについて
ベイジアンネットワークとは,原因と結果の関係を複数組み合わせ,それらが互いに影響を与え 発生する現象を,有向のリンクとノードを用いたネットワーク図と条件付き確率により可視化したもの である.すなわち,ある原因から発生する結果を,ネットワーク図と条件付き確率を用いて推測する 手法であると言える.特に,経験則をモデルに組み込むことができ,可視化されたモデル構造を人 間が明確に読み取れることができることから,効果を発揮する有用な条件の組み合わせを発見す ることに優れる.一方で,事前に変数を離散化する必要があり,その仕方が結果に大きく影響して しまう点に留意が必要である.本研究では後述のkmeans++法により離散化を行った.
19 分析手法
第1項 手法概要
ベイジアンネットワークモデルが出力する条件付き確率は,蓄積されたデータの学習に
より推定される.本研究では,非渋滞時のある時刻Tとその5,10分前の時刻における,大和
TN上流15kmの区間の車両感知器で得られる交通データに気象庁のアメダスデータから抽
出した天候データを加えたものを説明変数として与える(表3-1).そして時刻Tから t(t=10,15,20,25,30)分以内に大和TNから厚木ICの区間において生じる交通状態遷移 を推測する(図3-1).ここで交通状態遷移とは,t分以内渋滞発生(その後60分以内に事故 発生有),t分以内渋滞発生(その後60分以内に事故発生無),t分以内事故発生の3状態 への非渋滞流からの遷移に,非渋滞が継続する場合を加えた4つの交通状態を指す(表 3-2).
表 3-1 今回使用した変数
データ項目 元データ 特徴 総変数(x種類)
速度
車両感知器データ
地点毎&断面 6
実交通量 地点毎&車線毎 18
車線利用率 地点毎&車線毎 18
大型車混入率 地点毎&車線毎 18
10分間降水量
気象庁
アメダスデータ 各1値
1
最大瞬間風速 1
平均風速 1
最大風速 1
気温 1
日出方位 1
日入方位 1
20
図 3-1 原因結果別での使用車両感知器
表 3-2 モデル概略 時間経過 交通状態(t|t=10,15,20,25,30)
T - 10分 非渋滞
原因
(交通データ&天候)
T - 5分 非渋滞
当該時刻T 非渋滞
T + t分以内
1 非渋滞継続
結果 (交通状態遷移)
2 渋滞発生(後60分以内事故発生有)
3 渋滞発生(後60分以内事故発生無)
4 事故発生
大 和 トン ネル
車両感知器設置KP(東京ICからの距離)
至東京 この区間の交通データを使用(原因)
この区間の交通状態遷移を予測(結果)
21 第2項 変数の離散化
交通データ等をElbow法とSilhouette法を用いクラスタ数(K)を決定し,kmeans++法からそ れぞれの変数の離散化を行った.
Elbow法は,クラスタ数を横軸にとり,縦軸にそのクラスタ数ごとのクラスタ内誤差平方和(SSE)
の値をプロットした図を用い,クラスタ内誤差平方和が肘のように曲がる点を最適なクラスタ数(K)と みなす方法である.これにより,適切なクラスタ数(K)のあたりをつけることができる.図3-2は
24.97KP地点における速度に関してのグラフを示す.この例ではクラスタ数を2から4の範囲で
あたりをつけることとした.
Silhouette法は,クラスタ内がどの程度密にグルーピングされているかの目安となる図を可視化
することで,適切なクラスタ数を判断する方法である.図3-3,-4,-5,-6は,Elbow法と同様に
24.97KP地点における速度に関してのグラフ例であり,縦軸がクラスタ数,横軸がシルエット係数
である.シルエット係数の値は1に近いほどそのクラスタが他のクラスタから離れていることを示す.
また,クラスタごとの厚みはクラスタのサイズ(=所属するサンプル数)を表す.今回はElbow法の結 果を参考に,クラスタ数2-5までを比較した.シルエット係数には大きな差が見られなかったため,
実際にクラスタの中身を確認し,最終的にクラスタ数を3とした.他の変数についても同様の操作 を行い,それぞれの変数のクラスタ数を決定した.この結果を表3-3にまとめる.
以上の結果に基づき,kmeans++法による離散化を行った.これは,kmeans法においてラン ダムに設定していたクラスタ中心の初期値が近すぎないようにする手法である.
図 3-2 Elbow法のグラフ例(24.97KP地点断面速度)
22
図 3-3 シルエット法(クラスタ数=2/24.97KP地点断面速度)
図 3-4 シルエット法(クラスタ数=3/24.97KP地点断面速度)
23
図 3-5 シルエット法(クラスタ数=4/24.97KP地点断面速度)
図 3-6 シルエット法(クラスタ数=5/24.97KP地点断面速度)
24
表 3-3 使用する変数とそのクラスタ数
クラスタ数 変数名
2 10分間降水量
3 断面速度
4 平均風速,最大風速,瞬間最大風速
5 実交通量,車線利用率,車線間速度差,気温,日出日入方位
6 大型車混入率
離散化結果は付属資料を参考にされたい.
25 分析結果とその考察
第1項 モデル構造の概要
分析結果であるネットワークの親子関係(親1→子限定)を表3-4に示す.
表 3-4 親子関係結果
時間 子 親a(地点) 親b(地点) 親c(車線/地点)
t=10
交通状態遷移 (t=10,15,20,25,30)
速度 (24.97kp)
速度 (28.75kp)
実交通量
(第1走行車線/28.75kp)
t=15 5分前実交通量
(追越車線/35.74kp) t=20
実交通量 (追越車線/35.74kp) t=25
t=30
表3-4をみると,大和TNの直近である24.97kp地点の速度とその約4km上流側にあたる 28.75kp地点の速度が全てのt(t=10,15,20,25,30)において影響があることが確認された.実交 通量も全ての時間において影響がみられたが,時間が大きくなるにつれ上流の側のものが影響し ているような移動をしていることが確認できた.
その中でも最も下流側の実交通量が影響を与えているとされたt=10の場合に関して感度分析 を行い,考察を進めることとした.
26 第2項 感度分析結果
要因の組み合わせによる感度分析を行い,リフト値を求める.リフト値は無条件確率に対する条 件付き確率の比のことを指し,要因の条件がそろった際に何倍事象が起こりやすくなるかを示す値 である.表3-4の親子関係から求めた結果を図3-7,-8,-9に示す.
図3-7は下流側(24.97kp)速度と上流側(28.75kp)速度どちらも低い状況である.この場合,特 に交通量が多い際の渋滞発生が多い結果となった.これは大和TN上流側の速度が全体的に低 下し,緩やかに発生した渋滞であると考えられる.
図3-8は下流側(24.97kp)速度が高く,上流側(28.75kp)速度が低い状況である.この場合,特 に交通量の少ない場合に事故が起こりやすい傾向が読み取れる.これは相対的に流れている第1 走行車線へ車線変更を図る際,加速中の後方車に気付かず事故に至る,または事故に至らない 場合にも急激な速度低下による渋滞を引き起こす場合が考えられる.
図3-9は下流側(24.97kp)速度が低く,上流側(28.75kp)速度が高い状況である.この場合,実 交通量が大きい場合に事故が起こりやすい結果となった.これは急激な速度低下にブレーキが間 に合わず事故に至る,またはその後事故に至りやすい性質をもった渋滞が起こりやすいということ が考えられる.
以上から,2地点の速度差によって事故に起こりやすいか渋滞に至りやすいかの性質に差があ る可能性が示唆される結果となった.これは既往研究3)の「事故と渋滞で異なる傾向がある」と示し たものをより強固にする結果である.
図 3-7 リフト値比較図(速度(24.97kp)=LOW, 速度(28.75kp)=LOW) 0
10 20 30 40 50 60 70 80
L ML M MH H L ML M MH H L ML M MH H
リフト値
実交通量(第1走行車線/28.75kp) 10分以内渋滞発生
(その後事故発生有)
10分以内渋滞発生 10分以内事故発生
(その後事故発生無)
27
図 3-8 リフト値比較図(速度(24.97kp)=HIGH, 速度(28.75kp)=LOW)
図 3-9 リフト値比較図(速度(24.97kp)=LOW, 速度(28.75kp)=HIGH) 0
10 20 30 40 50 60 70 80
L ML M MH H L ML M MH H L ML M MH H
リフト値
実交通量(第1走行車線/28.75kp)
0 10 20 30 40 50 60 70 80
L ML M MH H L ML M MH H L ML M MH H
リフト値
実交通量(第1走行車線/28.75kp) 10分以内渋滞発生
(その後事故発生有)
10分以内渋滞発生
(その後事故発生無)
10分以内事故発生
10分以内渋滞発生
(その後事故発生有)
10分以内渋滞発生
(その後事故発生無)
10分以内事故発生
28 第3項 的中率を用いた精度検証
これまでの分析結果に基づき,2018年1月1日~10月31日までの10か月分のデータを用 い精度検証を行った.精度の指標として今回は的中率を用いる.的中率とは,ある確率以上で渋 滞または事故が発生すると判断した際の発生有無別に的中する確率を示す.
結果の前に,図の見方を簡単に説明する.例えば,事故発生確率が20%のときを想定する.閾
値1%として判定をする場合,事故と判定されたもののうち85%が的中し,事故ではないと判定さ
れたもののうち75%が的中する.このとき,20%は閾値1%よりも大きいため,事故を85%で判定 するものを採用し,「事故」と判定されることとなる.
その結果を次ページに示す.図3-10は渋滞発生の的中率を示す.閾値を3%とすると非渋 滞・渋滞のどちらも80%的中していることが確認できた.図3-11は事故発生の的中率を示す.閾
値を1%とすると事故無を75%,事故を85%的中していることが確認できた.
29
図 3-10 渋滞発生判定的中率
図 3-11 事故発生判定的中率 0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 0.1 0.2 0.3 0.4 0.5
的中率
渋滞発生判定閾値
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 0.01 0.02 0.03 0.04 0.05
的中率
事故発生判定域値
非渋滞 渋滞
事故無 事故
30 第4項 日別推定結果に基づく精度検証
実際にモデルの要因・条件が効いているかを確認するために,日別の推定を行った.2018年 のデータについて,10分以内の交通状態遷移において影響が大きいとされた3変数を使用す る.その3変数の条件から事故・渋滞発生確率を与え,その確率の推移を検証する.その結果を 以下に示す.図3-12は,渋滞後に事故が発生するケースであり,渋滞は13:45分頃区間内に発 生し,その5分後の13:50頃に事故が発生している.図3-13は事故が発生するケースであり,
14:35頃に発生したものである.これを見ると,実際に事故が発生する直前に向けて事故発生確
率,渋滞発生確率ともに上昇していることがわかる.事故の発生およそ30分前から確率の上昇は 見られており,その時間から施策を実行することにより最悪の事故発生を未然に防ぐことができる 可能性が考えられる結果となった.
図 3-12 日別推定結果図(渋滞発生後事故発生)
図 3-13 日別推定結果図(事故発生)
0 0.01 0.02 0.03 0.04 0.05
0 0.1 0.2 0.3 0.4 0.5
10:40:00 11:10:00 11:40:00 12:10:00 12:40:00 13:10:00 13:40:00
事故発生確率
渋滞発生確率
時間
0 0.01 0.02 0.03 0.04 0.05
0 0.1 0.2 0.3 0.4 0.5
11:30:00 12:00:00 12:30:00 13:00:00 13:30:00 14:00:00 14:30:00
事故発生確率
渋滞発生確率
時間 渋滞発生(事故発生有) [第2縦軸]
渋滞発生(事故発生無) [第1縦軸]
事故発生 [第2縦軸]
渋滞発生(事故発生有) [第2縦軸]
渋滞発生(事故発生無) [第1縦軸]
事故発生 [第2縦軸]
31 第5項 より詳細な感度分析
影響を与えている要因をより詳細にみるため,親1と子のみの関係の範囲にとどまっていた感度 分析を,親2までを含めた範囲に拡大した.その親子関係のネットワークを表3-5に示す.表に示 す通り,親3に対する親は現れなかった.速度と実交通量のみが影響を与えていたため,色分け して表現した.この結果をみると,親1,2,3で同一の要因が影響を与えている部分の存在を確認 することができる.この性質を考慮した感度分析を行った.
表 3-5 親子関係ネットワーク図
32
親2と親1の関係に着目し,感度分析を実施した.はじめに,親1の決定に影響を与えている 3種類の親2のうち2種類を選択し親1の感度を調べることとした.以下の表はこの親2の選択 状態を示す.黄色に塗られた変数が使用した変数である.また,図3-14以降の図はこの結果を示 し,上位10件について載せている.この結果の共通点として,親1と時間のみが異なる親2,す なわち感度分析結果2と感度分析結果6において,確率値の値が小さくなる結果となった.1地 点の速度のみを反映した結果であるため,様々な要因を混ぜることが単一の要因での分析に比べ 相対的に有効になることが考えられる.
表 3-6 感度分析での使用変数1
1 2 3 4 5 6 7 8 9 BF5速度_TC0
BF5速度_TC2 BF10速度_TC0 BF5速度_TC2 BF10速度_TC2 BF5実交通量_TC4 BF5実交通量_TC2 BF5実交通量_TC4 BF10実交通量_TC2 実交通量_TC2
目的変数となる親1 親2 感度分析No
速度_TC0
速度_TC2
33
図 3-14 感度分析結果1 (24.97KP地点速度:LOW)
図 3-15 感度分析結果2 (24.97KP地点速度:LOW)
図 3-16 感度分析結果3 (24.97KP地点速度:LOW)
34
図 3-17 感度分析結果4 (28.75KP地点速度:LOW)
図 3-18 感度分析結果5 (28.75KP地点速度:LOW)
図 3-19 感度分析結果6 (28.75KP地点速度:LOW)
35
図 3-20 感度分析結果7 (28.75KP地点第1走行車線実交通量:HIGH)
図 3-21感度分析結果8 (28.75KP地点第1走行車線実交通量:HIGH)
図 3-22感度分析結果9 (28.75KP地点第1走行車線実交通量:HIGH)
36
次に,親1と親2のみの関係にとどまらず,子を含め感度分析をすることとした.親1を2つ選 択し,残りの親1と親2を3つ選択した計5変数で実行した.表3-7にその様子を示す.緑に塗 った子が目的変数,黄色に塗った親1,2に示す変数を説明変数としている.例えば1の場合,
親1から「速度_TC2」「実交通量_TC2」を説明変数として使用し,選択しなかった親1の親2の 3種類の変数を使用する.これにより,親1の時点で選択しなかった変数の影響をより詳細にみる ことができる.変数の組み合わせが多いため,上位1000組を抜粋し,以下の図にはその中でもさ らに上位の20組を示す.
感度分析結果1(図3-23 ~ 図3-25)をみると,親2に大きな差がみられない結果となった.5分 前から0分前にかけて速度が急激に上昇している場合に事故につながる可能性が考えられた.
感度分析結果2(図3-26 ~ 図3-28)をみると,親1は同じ組み合わせが上位を独占している結 果となった.親2をみると事故が発生するものとそうでないもので大きな差があり,特に事故の発生 がある場合に速度が大きな状態が目立っていることから,5,10分前に安定して流れていた交通流 がいきなり0分前に大和トンネル付近で速度低下することで事故に至るケースが考えられる.
感度分析結果3(図3-29 ~ 図3-31)をみると,親1に事故がある場合とない場合でその速度の 組み合わせに大きな差がみられる.親2には大きな違いがあるように見えなかった.この結果を踏 まえると,実交通量が大きいと,事故も渋滞も発生しやすいということが言える.一方で,2地点の 速度差が大きい場合,交通量が小さい場合にも事故が発生しやすい傾向にあることも確認でき た.
以上より,感度分析2,すなわち親1内の「速度_TC2」が事故の発生の有無に対する影響が大 きいことが確認できた.これにより,この変数をさらに詳細に分析することや親2と子の間における 感度分析を進めることで,事故と渋滞の発生をより的確に予測する要因を見つけることができる可 能性が考えられる.
表 3-7 感度分析での使用変数2
37
図 3-23 感度分析結果1 (渋滞発生後事故発生有)
図 3-24 感度分析結果1 (渋滞発生後事故発生無)
図 3-25感度分析結果1 (事故発生)
38
図 3-26 感度分析結果2 (渋滞発生後事故発生有)
図 3-27感度分析結果2 (渋滞発生後事故発生無)
図 3-28 感度分析結果2 (事故発生)
39
図 3-29感度分析結果3 (渋滞発生後事故発生有)
図 3-30感度分析結果3 (渋滞発生後事故発生無)
図 3-31感度分析結果3 (事故発生有)
40 第6項 まとめ
本章では,事故と渋滞の発生しやすい要因の組み合わせに強みをもつベイジアンネットワーク 推計モデルの構築をすることができた.特に,2地点間の速度差が大きい際に事故発生,または 事故発生まで至らずとも危険な事故の起きやすい渋滞の発生がより起こりやすいことが考えられ た.上流側の速度小さくが下流側の速度が大きい場合,実交通量が小さい場合に事故が起きや すいことが確認できた.これにより,空いている車線へ車線変更をする際の後方不注視により事故 に至る可能性が挙げられた(図3-32).上流側の速度大きくが下流側の速度が小さい場合,実交 通量が大きい場合に事故が起こりやすいことが確認できた.これは急激な速度低下にブレーキが 間に合わず事故に至る可能性が挙げられた(図3-33).また,その他感度分析により,より的確に事 故や渋滞の発生を予測するモデルを構築できる可能性が挙げられた.
一方で,ベイジアンネットワークモデルは予測精度が高くなく,離散化の基準次第で結果が大き く変わる可能性がある.そこでベイジアンネットワークの結果を踏まえ,ディープラーニングによる事 故・渋滞発生判別分析を検討することとした.
図 3-32 事故発生原因可能性1
図 3-33 事故発生原因可能性2
41
第 4 章
ディープラーニングを活用した
モデルの構築
42
第4章 ディープラーニングを活用したモデルの構築
本研究では,時々刻々と変化する交通条件におけるモデルの適用性を高めるため,ディープラ ーニングによるモデル構築を行った.
構築するディープラーニングモデルについて 第1項 ディープラーニングとは
ディープラーニングとは,機械学習手法の一つであり,主にニューラルネットワーク(以下NN)を 基盤とした変数選択が自動化されたモデリング手法である.モデルの予測精度が高く,主に画像 認識や言語予測などの分野で成功を収めている.その一方でモデルの構造がブラックボックスなも のとなっており,とにかく精度の高さを要求するような識別問題に適性がある.ところが通常のNN は時系列データの解析に不適当なモデルとされ,今回対象としている事故や渋滞の発生といった 時系列な性質を持つデータの扱いには向かない.そこで時間を遡ることができ時系列を考慮可能 なリカレントニューラルネットワーク(以下,RNN)を使用する.ただし,RNNには長期依存を学習 できない問題がある.そこで本研究では,長期的な時系列データを扱うため,リカレントニューラル ネットワークの拡張モデルであるLSTM(Long Short-Term Memory)層を使用し,LSTM層の 予測への適用可能性を検討することとした.
43
第2項 LSTM(Long Short-Term Memory) 層とは
第1項においても触れたように,一般的なRNNの課題として,長期依存を学習できない点が 挙げられる.これは「勾配消失問題」と呼ばれ,誤差逆伝搬時に,誤差を入力に近い階層まで伝搬 させることが困難なことにより,系列データが長くなるにつれ「勾配消失問題」が生じる.このため10 時刻程度のデータを超えると限界を迎えることが多い.
そこで内部状態を記憶するメモリセルと3つ(忘却/入力/出力)のゲートを構成することで勾配消 失問題を解決し,短期と長期の記憶を両立した内部情報の保持方法を実現したものがLSTMで ある.詳細を以下の図に示す.本研究においては,LSTMの構造はメインではなく,今後のペー ジにおいて扱う際には「LSTM BLOCK」として表現する.
図 4-1 リカレントニューラルネットワークとLSTMの違い
図 4-2 LSTMの詳細
(参考:「山下隆義著,イラストで学ぶディープラーニング改訂第2版」より引用)
44 第3項 入出力データとモデル構造
モデルの概要を図4-3に示す.入力データには,ベイジアンネットワークで使用した変数と同じ ものを使用する.詳細は表3-1を参照されたい.また,出力として5分後の事故・渋滞の発生を予 測する.出力はベイジアンネットワークと異なり,「非渋滞継続」「渋滞発生」「事故発生」の3種類 のものを設定した.これはベイジアンネットワーク同様4種類の出力を与える前段階として,最低限 の適用可能性をみるためにこのような設定とした.
入力と出力については,様々な角度からディープラーニングに対してアプローチを行った.結果 的にこのモデルに落ち着くまでの入出力の検討過程については付属資料を参照されたい.
図 4-3 モデルの概要
45
学習データの抽出方法を示す.学習データには事故発生データ,渋滞発生データ,無事故・非 渋滞データを用意した.事故発生データと渋滞発生データは,事故・渋滞の発生する直前の時間 から約2時間分のデータを抽出する.その後,事故発生データと渋滞発生データと被りがないよう 事故・渋滞の発生しない2時間分のデータを抽出する.なお,無事故・非渋滞データが学習デー タの約半数になるよう事故発生データ件数と渋滞発生データ件数を基に設定した.抽出の際,学 習データのうち無事故・非渋滞データはランダムに選択する.このランダムな抽出を10データ分 行う.このデータを合わせたものを学習データとする.その概要を図4-4に示す.図4-4を見ると わかる通り,事故発生件数は通常時や渋滞発生件数と比較して少ないため,モデルに反映されに くいことが考えられた.そこで10の異なる入力データから異なる学習データを形成し,予測された 発生確率の平均値を分析した.
図 4-4 学習データ概要
… … …
…
46
モデルの構造は,LSTM層1層を隠れ層としたものを構築した.入力層と隠れ層の間の活性化 関数にはReLU関数を用い,隠れ層から出力層の間の活性化関数にはsoftmax関数を使用し た.ReLU関数は,0以下の入力を0に置き換え,0より大きな入力はそのまま出力する関数であ
る(図4-5).入力層隠れ層間の活性化関数には,その他にTanhやSigmoidが存在するが,今
回は不適当な値を十分に排除するためにReLU関数を使用する.softmax関数は分類問題等 で頻繁に使われる関数であり,正解ラベルの推論を確率で割り振ることができる.本研究において も,「非渋滞継続」「渋滞発生」「事故発生」の3種類の交通状況への遷移への分類問題を考える ため,softmax関数を使用した(図4-6).
図 4-5 ReLU関数
図 4-6 softmax関数の例
47 分析結果
第1項 損失値と正解率
はじめに,損失値と正解率を指標として分析した.損失値は,予測と実際の値のズレの大きさを 表すものであり,モデルの予測精度を評価する.一方で正解率は,全ての事象の中で結果があっ ていたものを指す.今回の分析においては,664あるデータのうち,200を訓練データ,464を検 証データとし,エポック数(計算の繰り返し回数)を100回とした.その結果の一例を以下の図4-7,
図4-8に示す.
図4-7は損失値を示す.この結果を見ると,検証データの損失値がエポック数を増やすごとに 悪化している.すなわち過学習している結果となった.構築するモデルには,この損失値が最小に なる,すなわち最良になるものを採用する.本研究では学習データをランダムに抽出しているた め,その抽出したデータにこの結果が依存していることが考えられた.しかし,抽出データのちがい による影響は大きく見られない結果となっていた.一方で中間層を増やすことでの結果の変化は,
抽出データのランダム性と比較して大きい結果となっていた.これは付属資料を参照されたい.
図4-8は正解率を示す.この結果をみると,訓練データではほぼ100%まで精度があがることが わかる.一方で検証データの結果は横ばいになっており,7割~8割前後の正解率にとどまる結 果となっていた.
48 図 4-7 損失値
図 4-8 正解率
49 第2項 再現率
損失値と正解率のみでの検証は不十分であると考えた.これは例えば,全データのうち90%を 正解しているとされた場合に,全データ中7%に満たない事故発生を全く事故発生として正解でき ていない場合においてもこの数字を叩き出すことが可能なためである.そこで再現率を指標として 用いる.再現率には,「実際にXのデータでXと判別される割合」「実際にXではないデータでX 以外に判別される割合」の2種類が存在する.その結果の一例を以下の図4-9に示す.図4-9に 示す再現率の数値は,前者を左,後者を右で示している.これをみると,実際に事故のデータで事 故発生と判別される割合が33%と高い数値を持つことがわかる.その他の数値も7割を超してお り,良好な結果であると考えられた.しかしながら,事故発生を事故発生と判定する再現率の値に はばらつきが大きく,ほとんど的中していない結果を持つケースも多々見られた.
図 4-9 再現率の結果
50
続けて,より高い再現率を目指し,入力する変数選択を変更した.これは,67種類の変数が多 すぎる関係で,モデルに影響の大きな変数が出ていないのではないかとの仮説の元進めたもので ある.変数を減らす際,ベイジアンネットワークの結果を参考に変数を絞ることとした.選択された入 力変数の個数と内訳を以下の表に示す.個数とその内訳を選択した理由を示していく.はじめに,
ベイジアンネットワークの結果を参考に,ベイジアンネットワーク上における親1の変数3種類のみ で表現する方法を考えた.また,親2,3を含めて考えた際,TC4地点の追越車線の実交通量が影 響を与えている結果を得ることができた.これより,個数3,4の場合を設定した.一方で,ベイジアン ネットワークの結果とは独立してどの要素が表現しやすいのかを,モデルを組む上で知っておく必 要があると考え,それぞれの速度であれば速度のみ,といった形で要因別の分析も行うこととした.
これにより,個数6,7,18a,b,cを与える.また,要因だけでなく車線別の影響も考えたほうがモデル を組む上で参考になるのではないかと考え,車線毎に分けたものを用意した.ところが,本研究に おいて「速度」は断面速度を指すため,速度を組み込むことができなかった.そこで,ベイジアンネ ットワークの結果において影響のあった「速度_TC0」と「速度_TC2」を加えることとした.これが
20a,b,cである.これまでと同様67個の変数を含めたものを用意し,それぞれの入力変数の組み
合わせにおける再現率を比較する.
表 4-1 入力変数の個数と内訳