交通研究室

(1)

令和元年度修士論文

都市間高速道路サグ部の交通状態遷移に着目した事故・渋滞発生確率予測モデル

首都大学東京大学院都市環境科学研究科

都市基盤環境学域社会基盤分野

交通研究室

18851523 舟橋尚平

指導教官小根山裕之教授

(2)

1

はじめに ... 3

本研究の概要 ... 3

本研究の流れ ... 7

第１章研究背景及び目的 ... 9

第２章分析対象とデータ ... 13

分析対象区間 ... 13

分析対象期間と分析対象時間 ... 14

第１項分析対象期間 ... 14

第２項データの利用時間帯 ... 14

利用データの詳細 ... 15

第１項 5分間車両感知器 ... 15

第２項事故調書 ... 15

第３項天候データ ... 15

渋滞と事故の定義 ... 16

第１項渋滞 ... 16

第２項事故 ... 16

第３章ベイジアンネットワーク推計モデルの構築 ... 18

ベイジアンネットワークについて ... 18

分析手法 ... 19

第１項手法概要 ... 19

第２項変数の離散化 ... 21

分析結果とその考察 ... 25

第１項モデル構造の概要... 25

第２項感度分析結果 ... 26

第３項的中率を用いた精度検証 ... 28

第４項日別推定結果に基づく精度検証 ... 30

(3)

2

第５項より詳細な感度分析 ... 31

第６項まとめ ... 40

第４章ディープラーニングを活用したモデルの構築 ... 42

構築するディープラーニングモデルについて ... 42

第１項ディープラーニングとは... 42

第２項 LSTM(Long Short-Term Memory) 層とは ... 43

第３項入出力データとモデル構造 ... 44

分析結果 ... 47

第１項損失値と正解率 ... 47

第２項再現率 ... 49

第３項時系列予測 ... 57

第５章まとめ ... 76

まとめ ... 76

参考文献 ... 78

謝辞 ... 79

付属資料 ... 81

(4)

3 はじめに

本章では，本稿の要旨と流れに関して記載する．

本研究の概要

１．背景と目的

都市間高速道路単路部での上り坂やトンネル部などのボトルネックにおいて渋滞が発生することは，これまでの研究により明らかとなっている．渋滞は経済的な損失が大きく，わが国の大動脈である東名高速道路上り線横浜町田IC～海老名JCTにおいては151[万人・時間/年]もの渋滞損失時間が発生している．現在，主要な都市間高速道路において，全渋滞長のうちの約25%が事故を原因として生じていることからも，事故を原因とした渋滞への対策が急がれる．交通事故を発生させないためには，現在及び過去の交通状況に基づいて事故・渋滞の起こりやすさを推定し，

出来る限り事故の発生しないような交通制御を実施していくことが求められる．特に近年では走光型視線誘導システムやVariable Speed Limit(VSL)，ランプメータリングなど様々な交通制御手法が検討され，それらが事故・渋滞の発生を抑制する効果を有することが明らかとなっており，それら施策をより効果的に活用することへの寄与も期待できる．また既往研究により，「事故に至る渋滞発生」や「渋滞の原因となる事故発生」につながる交通状況を事前に検知できる可能性を有することが明らかとなった．

そこで本研究では，実際の交通安全施策の効果的な活用を見据え，都市間高速道路における様々な要因，条件下での事故・渋滞発生確率を予測するモデルの構築を目的とし，その精度を検証する．

(5)

4 ２．対象とデータ

本研究の対象は，東名高速道路上り線における大和トンネル(TN)以西15kmの区間である．この区間は主要渋滞個所である大和TNをはじめとする慢性的な単路部ボトルネックが存在し，特に週末を中心に事故および事故が多く発生している．期間は2015年1月から2017年12月までの土休日であり，事故の発生がより多いとされる日の出から日没後1時間までを分析対象時間とした．利用データは5分間車両感知器による速度等のデータと，事故有無を把握するための事故調書，気象庁のアメダスデータである．なお，本研究では渋滞発生の定義を時速60km以下が 10分以上継続した場合とし，大和TNから厚木ICまでの区間内1箇所でもその条件を満たす場合を渋滞発生とする．一方事故発生の定義も同様に，大和TNから厚木ICまでの区間内1箇所でも事故発生がみられた場合を事故発生とした．発生時間についてはその時間が含まれる感知器基準の5分間を発生時間とした．

(6)

5 ３．ベイジアンネットワーク推計モデルの構築３－１．手法

はじめに，ベイジアンネットワークを用いた推計モデルを構築した．ベイジアンネットワークが出力する条件付き確率は，蓄積されたデータの学習により推定される．本研究では，非渋滞時のある時刻Tとその5,10分前の時刻における車両感知器データから得られる交通データを，kmeans++

法により離散化を行った．これらを説明変数として与え，時刻Tからt(t=10,15,20,25,30)分以内において区間内に生じる交通状態遷移を推計する．ここで交通状態遷移とは，t分以内渋滞発生 (その後60分以内に事故発生有)，t分以内渋滞発生(その後60分以内に事故発生無)，t分以内事故発生の3状態への遷移に，非渋滞が継続する場合を加えた4つの交通状態を指し，これを目的変数として与える．

３－２．分析結果

分析の結果，全ての時間tにおいて区間内の上流側と下流側の速度，交通量による影響を受けていることが明らかとなった．これは事故・渋滞の発生を説明する要因として妥当であると考えられる．ここで10分以内の交通状態遷移に関して感度分析を行い，事故や渋滞の発生確率が高まる条件を確認した．その結果を図1,2に示す．リフト値は無条件確率に対して何倍事故が起きやすくなったかを示す．これより，上流側と下流側の速度差が大きい場合に事故の発生が起きやすくなることを確認できた．特に，交通量の大小との組み合わせで発生する事故のタイミングが変化する可能性が示唆された．一方，上流側と下流側の速度差が小さい場合には，事故発生の無い渋滞が発生しやすくなることが確認できた．これにより，事故と渋滞の異なる要因を表現可能な実用的なモデルを構築できた．

(7)

6 ４．ディープラーニングを活用したモデルの構築４－１．手法

時々刻々と変化する様々な交通条件における適用性を高めるため，ディープラーニングによる判別分析を行った．事故・渋滞の発生は時系列なものであり，そのようなデータの扱いに強みを持つ LSTMを用いることで予測への適用可能性を検討することとした．入力データにはベイジアンネットワークでの分析時と同じ変数を使用し，出力として5分後の事故・渋滞の発生を予測する．隠れ層にはrelu関数，出力層にはsoftmax関数を用いた．そしてこの入力データから10の学習モデルを形成し，予測された発生確率の平均値を分析した．

４－２．分析結果

その結果，時間経過とともに事故と渋滞の発生確率が同様に上昇し，途中から事故発生確率の伸びが相対的に大きくなり，結果的に事故が発生する事例を確認できた．これにより，ディープラーニングにおいても事故と渋滞の異なる要因を表現可能なモデルを構築できた．

５．まとめ

本研究では，前者では具体的な要因，後者では時間的な流れに強みを持つ実用的なモデルを構築できた．以上の結果を踏まえ，最後に本研究で提案した2種のモデルを活用し，交通事故発生確率を低減させる交通運用の考え方について考察を行った．

(8)

7 本研究の流れ

本研究の流れを以下に示す．

第１章研究背景及び目的第２章分析対象

第３章ベイジアンネットワーク推計モデルの構築第４章ディープラーニングを活用したモデルの構築第５章まとめ

(9)

8

第１章研究背景及び目的

(10)

9

第１章研究背景及び目的

都市間高速道路単路部での上り坂やトンネル部などのボトルネックにおいて渋滞が発生することは，これまでの研究により明らかとなっている．渋滞は経済的な損失が大きく(表1-1)，わが国の大動脈である東名高速道路上り線横浜町田IC～海老名JCTにおいては151[万人・時間/年]もの渋滞損失時間が発生している¹⁾．現在，主要な都市間高速道路において，全渋滞長のうちの約

25%が事故を原因として生じている²⁾ことからも(図1-1,-2)，事故を原因とした渋滞への対策が急

がれる．交通事故を発生させないためには，現在及び過去の交通状況に基づいて事故・渋滞の起こりやすさを推定し，出来る限り事故の発生しないような交通制御を実施していくことが求められる．特に近年では，日本で導入が進められている走光型視線誘導システム(図1-3)，欧米を中心とした海外で導入されているVariable Speed Limit(=VSL)(図1-4)やランプメータリング(図1-5)など様々な交通制御手法が検討され，それらが事故・渋滞の発生を抑制する効果を有することが明らかとなっており，それら施策をより効果的に活用することへの寄与も期待できる．また著者らの既往研究³⁾により，「事故に至る渋滞発生」や「渋滞の原因となる事故発生」につながる交通状況を事前に検知できる可能性を有することが明らかとなった．

そこで本研究では，実際の交通安全施策の効果的な活用を見据え，都市間高速道路における様々な要因，条件下での事故・渋滞発生確率を予測するモデルの構築を目的とし，その精度を検証する．

筆者ら既往研究では，ベイジアンネットワークモデルを用いたモデルの構築を行ったが，1年間のデータ数に基づきモデル化を行ったため，事故発生時のデータが十分に確保できなかった．加えて，説明変数をHIGHとLOWの2段階に離散化したため，大まかな傾向は捉えたものの，交通状態の変化に応じたきめ細やかな交通制御に適用するには向かないモデルであった．今回はより精緻化されたモデル構造を目指し，3年間のデータを用いたモデル構築により，事故・渋滞の発生しやすい交通状況の組み合わせを把握する．

(11)

10

表1-1 事故・渋滞の経済損失

渋滞事故経済損失貨幣価値換算値約12兆円約4兆円

(参考)国土交通省2017年度版「首都圏白書」

(参考)内閣府「交通事故による経済的損失に関する調査研究」報告書概要

図１-1 全国の高速道路における事故件数推移

(参考)内閣府「平成30年度交通安全白書」

図１-2 東名高速道路における渋滞量要因グラフ

(参考)NEXCO中日本データ集2014

交通集中 55%

工事 13%

事故 26%

その他 6%

交通集中工事事故その他

(12)

11

図１-3 走光型視線誘導システム

図１-4 Variable Speed Limit(VSL)

図１-5 ランプメータリング

(13)

12

第２章分析対象

(14)

13

第２章分析対象とデータ

本章では，本研究で用いる分析対象とそのデータの処理について示す．

分析対象区間

分析対象区間は，東名高速道路上り線における大和トンネル(以下TN)からその上流側15km の区間とした(図2-1)．この区間は主要渋滞個所である大和TNをはじめとする慢性的な単路部ボトルネックが存在し，特に週末を中心に渋滞および事故が多く発生している．

図２-1 東名高速道路路線概要

東名高速

東名川崎IC

秦野中井IC

横浜町田IC

厚木IC

大和トンネル

海老名JCT 約15km

(15)

14 分析対象期間と分析対象時間第１項分析対象期間

2015年1月1日から2018年10月31日の休日のデータを用いる．そのうち2015年1月1 日から2017年12月31日までの3年分を学習データ，2018年1月1日から10月31日までの10ヵ月分を検証データとして利用する．休日の定義は，毎週の土日に国民の休日，年末年始，

ゴールデンウィーク(GW)，お盆の期間を加えたものとする．

第２項データの利用時間帯

特に事故の発生が多い時間に絞るため，分析に用いるデータの時間帯を限定する．萩田ら⁴⁾による，「日没前後に交通事故率が高くなり，特に日没直後に最も高くなる」との知見を参考に，日の出から日没から1時間後までの時間を分析対象とした．図2-2は萩田らから引用したものであり，

太陽の天頂角が東西方向に90°の時間に赤線をつけている．日の出から日没後の薄暮の時間に事故が起こりやすくなっていることがわかる．

図２-2 太陽の天頂角と事故率の関係

(16)

15 利用データの詳細

第１項 5分間車両感知器

5分間車両感知器データは高速道路上での車両感知器により収集されるデータであり，車線，

KPごとに5分あたりの全車台数，大型車台数，平均速度，Occupancyが記録されている．地点別の交通量として，大型車台数に乗用車換算係数(=pce)1.8を掛けて求めた乗用車換算台数 (=pcu)を使用する．また分析対象区間に対して，図2-3に示す地点の車両感知器を基準として使用する．

図２-3 分析対象区間内の対象車両感知器

第２項事故調書

実際に発生した事故について，個人の特性(性別や年齢)から事故発生当時の事故の原因や状況，天候，路面，状態などが記録されている．

第３項天候データ

気象庁のアメダスデータを使用する．観測地点は海老名とし，風速や降雨，気温等を利用する．

(17)

16 渋滞と事故の定義

第１項渋滞

渋滞発生を時速60km以下が10分以上継続した場合とした．大和TNから厚木ICまでの区間内において1箇所でもその条件を満たした場合を渋滞とする．またその条件を満たす時間に加え，区間全域で速度回復してから30分経過するまで本研究での分析には用いないものとする．

第２項事故

大和TNから厚木ICまでの区間内において1箇所でも事故の発生がみられた場合を区間内における事故発生とした．特に本研究では，追突事故が本線で発生した場合のみを対象とした．

発生時間については，その時間が含まれる車両感知器基準の5分間を発生時間とする．なお，事故発生以後日付が変わるまでのデータに関しては本研究での分析には用いないものとする．

図２-4 使用データの判別に関して渋滞発生事故発生

速度がいずれかの区間で60km/h 以下を10分間継続し始める時刻

調書記載の発生時刻日の出or 渋滞解消から抽出時

間経過

(18)

17

第３章

ベイジアンネットワーク推計モデルの構築

(19)

18

第３章ベイジアンネットワーク推計モデルの構築

本章では，ベイジアンネットワークにより構築した推計モデルについてその過程と結果をまとめていく．

ベイジアンネットワークについて

ベイジアンネットワークとは，原因と結果の関係を複数組み合わせ，それらが互いに影響を与え発生する現象を，有向のリンクとノードを用いたネットワーク図と条件付き確率により可視化したものである．すなわち，ある原因から発生する結果を，ネットワーク図と条件付き確率を用いて推測する手法であると言える．特に，経験則をモデルに組み込むことができ，可視化されたモデル構造を人間が明確に読み取れることができることから，効果を発揮する有用な条件の組み合わせを発見することに優れる．一方で，事前に変数を離散化する必要があり，その仕方が結果に大きく影響してしまう点に留意が必要である．本研究では後述のkmeans++法により離散化を行った．

(20)

19 分析手法

第１項手法概要

ベイジアンネットワークモデルが出力する条件付き確率は，蓄積されたデータの学習に

より推定される．本研究では，非渋滞時のある時刻Tとその5,10分前の時刻における，大和

TN上流15kmの区間の車両感知器で得られる交通データに気象庁のアメダスデータから抽

出した天候データを加えたものを説明変数として与える(表3-1)．そして時刻Tから t(t=10,15,20,25,30)分以内に大和TNから厚木ICの区間において生じる交通状態遷移を推測する(図3-1)．ここで交通状態遷移とは，t分以内渋滞発生(その後60分以内に事故発生有)，t分以内渋滞発生(その後60分以内に事故発生無)，t分以内事故発生の3状態への非渋滞流からの遷移に，非渋滞が継続する場合を加えた4つの交通状態を指す(表 3-2)．

表３-1 今回使用した変数

データ項目元データ特徴総変数(x種類)

速度

車両感知器データ

地点毎&断面 6

実交通量地点毎&車線毎 18

車線利用率地点毎&車線毎 18

大型車混入率地点毎&車線毎 18

10分間降水量

気象庁

アメダスデータ各1値

1

最大瞬間風速 1

平均風速 1

最大風速 1

気温 1

日出方位 1

日入方位 1

(21)

20

図３-1 原因結果別での使用車両感知器

表３-2 モデル概略時間経過交通状態(t|t=10,15,20,25,30)

T - 10分非渋滞

原因

(交通データ&天候)

T - 5分非渋滞

当該時刻T 非渋滞

T + t分以内

1 非渋滞継続

結果 (交通状態遷移)

2 渋滞発生(後60分以内事故発生有)

3 渋滞発生(後60分以内事故発生無)

4 事故発生

大和トンネル

車両感知器設置KP(東京ICからの距離)

至東京この区間の交通データを使用(原因)

この区間の交通状態遷移を予測(結果)

(22)

21 第２項変数の離散化

交通データ等をElbow法とSilhouette法を用いクラスタ数(K)を決定し，kmeans++法からそれぞれの変数の離散化を行った．

Elbow法は，クラスタ数を横軸にとり，縦軸にそのクラスタ数ごとのクラスタ内誤差平方和(SSE)

の値をプロットした図を用い，クラスタ内誤差平方和が肘のように曲がる点を最適なクラスタ数(K)とみなす方法である．これにより，適切なクラスタ数(K)のあたりをつけることができる．図3-2は

24.97KP地点における速度に関してのグラフを示す．この例ではクラスタ数を2から4の範囲で

あたりをつけることとした．

Silhouette法は，クラスタ内がどの程度密にグルーピングされているかの目安となる図を可視化

することで，適切なクラスタ数を判断する方法である．図3-3,-4,-5,-6は，Elbow法と同様に

24.97KP地点における速度に関してのグラフ例であり，縦軸がクラスタ数，横軸がシルエット係数

である．シルエット係数の値は1に近いほどそのクラスタが他のクラスタから離れていることを示す．

また，クラスタごとの厚みはクラスタのサイズ(=所属するサンプル数)を表す．今回はElbow法の結果を参考に，クラスタ数2-5までを比較した．シルエット係数には大きな差が見られなかったため，

実際にクラスタの中身を確認し，最終的にクラスタ数を3とした．他の変数についても同様の操作を行い，それぞれの変数のクラスタ数を決定した．この結果を表3-3にまとめる．

以上の結果に基づき，kmeans++法による離散化を行った．これは，kmeans法においてランダムに設定していたクラスタ中心の初期値が近すぎないようにする手法である．

図３-2 Elbow法のグラフ例(24.97KP地点断面速度)

(23)

22

図３-3 シルエット法(クラスタ数=2/24.97KP地点断面速度)

(24)

23

(25)

24

表３-3 使用する変数とそのクラスタ数

クラスタ数変数名

2 10分間降水量

3 断面速度

4 平均風速，最大風速，瞬間最大風速

5 実交通量，車線利用率，車線間速度差，気温，日出日入方位

6 大型車混入率

離散化結果は付属資料を参考にされたい．

(26)

25 分析結果とその考察

第１項モデル構造の概要

分析結果であるネットワークの親子関係(親1→子限定)を表3-4に示す．

表３-4 親子関係結果

時間子親a(地点) 親b(地点) 親c(車線/地点)

t=10

交通状態遷移 (t=10,15,20,25,30)

速度 (24.97kp)

速度 (28.75kp)

実交通量

(第1走行車線/28.75kp)

t=15 5分前実交通量

(追越車線/35.74kp) t=20

実交通量 (追越車線/35.74kp) t=25

t=30

表3-4をみると，大和TNの直近である24.97kp地点の速度とその約4km上流側にあたる 28.75kp地点の速度が全てのt(t=10,15,20,25,30)において影響があることが確認された．実交通量も全ての時間において影響がみられたが，時間が大きくなるにつれ上流の側のものが影響しているような移動をしていることが確認できた．

その中でも最も下流側の実交通量が影響を与えているとされたt=10の場合に関して感度分析を行い，考察を進めることとした．

(27)

26 第２項感度分析結果

要因の組み合わせによる感度分析を行い，リフト値を求める．リフト値は無条件確率に対する条件付き確率の比のことを指し，要因の条件がそろった際に何倍事象が起こりやすくなるかを示す値である．表3-4の親子関係から求めた結果を図3-7,-8,-9に示す．

図3-7は下流側(24.97kp)速度と上流側(28.75kp)速度どちらも低い状況である．この場合，特に交通量が多い際の渋滞発生が多い結果となった．これは大和TN上流側の速度が全体的に低下し，緩やかに発生した渋滞であると考えられる．

図3-8は下流側(24.97kp)速度が高く，上流側(28.75kp)速度が低い状況である．この場合，特に交通量の少ない場合に事故が起こりやすい傾向が読み取れる．これは相対的に流れている第1 走行車線へ車線変更を図る際，加速中の後方車に気付かず事故に至る，または事故に至らない場合にも急激な速度低下による渋滞を引き起こす場合が考えられる．

図3-9は下流側(24.97kp)速度が低く，上流側(28.75kp)速度が高い状況である．この場合，実交通量が大きい場合に事故が起こりやすい結果となった．これは急激な速度低下にブレーキが間に合わず事故に至る，またはその後事故に至りやすい性質をもった渋滞が起こりやすいということが考えられる．

以上から，2地点の速度差によって事故に起こりやすいか渋滞に至りやすいかの性質に差がある可能性が示唆される結果となった．これは既往研究³⁾の「事故と渋滞で異なる傾向がある」と示したものをより強固にする結果である．

図３-7 リフト値比較図(速度(24.97kp)=LOW, 速度(28.75kp)=LOW) 0

10 20 30 40 50 60 70 80

L ML M MH H L ML M MH H L ML M MH H

リフト値

実交通量(第1走行車線/28.75kp) 10分以内渋滞発生

（その後事故発生有）

10分以内渋滞発生 10分以内事故発生

（その後事故発生無）

(28)

27

図３-8 リフト値比較図(速度(24.97kp)=HIGH, 速度(28.75kp)=LOW)

図３-9 リフト値比較図(速度(24.97kp)=LOW, 速度(28.75kp)=HIGH) 0

10 20 30 40 50 60 70 80

リフト値

実交通量(第1走行車線/28.75kp)

0 10 20 30 40 50 60 70 80

リフト値

実交通量(第1走行車線/28.75kp) 10分以内渋滞発生

10分以内渋滞発生

10分以内事故発生

(29)

28 第３項的中率を用いた精度検証

これまでの分析結果に基づき，2018年1月1日～10月31日までの10か月分のデータを用い精度検証を行った．精度の指標として今回は的中率を用いる．的中率とは，ある確率以上で渋滞または事故が発生すると判断した際の発生有無別に的中する確率を示す．

結果の前に，図の見方を簡単に説明する．例えば，事故発生確率が20％のときを想定する．閾

値1％として判定をする場合，事故と判定されたもののうち85％が的中し，事故ではないと判定さ

れたもののうち75％が的中する．このとき，20％は閾値1％よりも大きいため，事故を85％で判定するものを採用し，「事故」と判定されることとなる．

その結果を次ページに示す．図3-10は渋滞発生の的中率を示す．閾値を3％とすると非渋滞・渋滞のどちらも80％的中していることが確認できた．図3-11は事故発生の的中率を示す．閾

値を1％とすると事故無を75％，事故を85％的中していることが確認できた．

(30)

29

図３-10 渋滞発生判定的中率

図３-11 事故発生判定的中率 0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

0 0.1 0.2 0.3 0.4 0.5

的中率

渋滞発生判定閾値

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

0 0.01 0.02 0.03 0.04 0.05

的中率

事故発生判定域値

非渋滞渋滞

事故無事故

(31)

30 第４項日別推定結果に基づく精度検証

実際にモデルの要因・条件が効いているかを確認するために，日別の推定を行った．2018年のデータについて，10分以内の交通状態遷移において影響が大きいとされた3変数を使用する．その3変数の条件から事故・渋滞発生確率を与え，その確率の推移を検証する．その結果を以下に示す．図3-12は，渋滞後に事故が発生するケースであり，渋滞は13：45分頃区間内に発生し，その5分後の13：50頃に事故が発生している．図3-13は事故が発生するケースであり，

14：35頃に発生したものである．これを見ると，実際に事故が発生する直前に向けて事故発生確

率，渋滞発生確率ともに上昇していることがわかる．事故の発生およそ30分前から確率の上昇は見られており，その時間から施策を実行することにより最悪の事故発生を未然に防ぐことができる可能性が考えられる結果となった．

図３-12 日別推定結果図(渋滞発生後事故発生)

図３-13 日別推定結果図(事故発生)

0 0.01 0.02 0.03 0.04 0.05

0 0.1 0.2 0.3 0.4 0.5

10:40:00 11:10:00 11:40:00 12:10:00 12:40:00 13:10:00 13:40:00

事故発生確率

渋滞発生確率

時間

0 0.01 0.02 0.03 0.04 0.05

0 0.1 0.2 0.3 0.4 0.5

11:30:00 12:00:00 12:30:00 13:00:00 13:30:00 14:00:00 14:30:00

事故発生確率

渋滞発生確率

時間渋滞発生(事故発生有) [第2縦軸]

渋滞発生(事故発生無) [第1縦軸]

事故発生 [第2縦軸]

渋滞発生(事故発生有) [第2縦軸]

渋滞発生(事故発生無) [第1縦軸]

事故発生 [第2縦軸]

(32)

31 第５項より詳細な感度分析

影響を与えている要因をより詳細にみるため，親1と子のみの関係の範囲にとどまっていた感度分析を，親2までを含めた範囲に拡大した．その親子関係のネットワークを表3-5に示す．表に示す通り，親3に対する親は現れなかった．速度と実交通量のみが影響を与えていたため，色分けして表現した．この結果をみると，親1,2,3で同一の要因が影響を与えている部分の存在を確認することができる．この性質を考慮した感度分析を行った．

表３-5 親子関係ネットワーク図

(33)

32

親2と親1の関係に着目し，感度分析を実施した．はじめに，親1の決定に影響を与えている 3種類の親2のうち2種類を選択し親1の感度を調べることとした．以下の表はこの親2の選択状態を示す．黄色に塗られた変数が使用した変数である．また，図3-14以降の図はこの結果を示し，上位10件について載せている．この結果の共通点として，親1と時間のみが異なる親2，すなわち感度分析結果2と感度分析結果6において，確率値の値が小さくなる結果となった．1地点の速度のみを反映した結果であるため，様々な要因を混ぜることが単一の要因での分析に比べ相対的に有効になることが考えられる．

表３-6 感度分析での使用変数1

1 2 3 4 5 6 7 8 9 BF5速度_TC0

BF5速度_TC2 BF10速度_TC0 BF5速度_TC2 BF10速度_TC2 BF5実交通量_TC4 BF5実交通量_TC2 BF5実交通量_TC4 BF10実交通量_TC2 実交通量_TC2

目的変数となる親1 親2 感度分析No

速度_TC0

速度_TC2

(34)

33

図３-14 感度分析結果1 (24.97KP地点速度：LOW)

(35)

34

(36)

35

図３-20 感度分析結果7 (28.75KP地点第1走行車線実交通量：HIGH)

図３-21感度分析結果8 (28.75KP地点第1走行車線実交通量：HIGH)

図３-22感度分析結果9 (28.75KP地点第1走行車線実交通量：HIGH)

(37)

36

次に，親1と親2のみの関係にとどまらず，子を含め感度分析をすることとした．親1を2つ選択し，残りの親1と親2を3つ選択した計5変数で実行した．表3-7にその様子を示す．緑に塗った子が目的変数，黄色に塗った親1，2に示す変数を説明変数としている．例えば1の場合，

親1から「速度_TC2」「実交通量_TC2」を説明変数として使用し，選択しなかった親1の親2の 3種類の変数を使用する．これにより，親1の時点で選択しなかった変数の影響をより詳細にみることができる．変数の組み合わせが多いため，上位1000組を抜粋し，以下の図にはその中でもさらに上位の20組を示す．

感度分析結果1(図3-23 ~ 図3-25)をみると，親2に大きな差がみられない結果となった．5分前から0分前にかけて速度が急激に上昇している場合に事故につながる可能性が考えられた．

感度分析結果2(図3-26 ~ 図3-28)をみると，親1は同じ組み合わせが上位を独占している結果となった．親2をみると事故が発生するものとそうでないもので大きな差があり，特に事故の発生がある場合に速度が大きな状態が目立っていることから，5,10分前に安定して流れていた交通流がいきなり0分前に大和トンネル付近で速度低下することで事故に至るケースが考えられる．

感度分析結果3(図3-29 ~ 図3-31)をみると，親1に事故がある場合とない場合でその速度の組み合わせに大きな差がみられる．親2には大きな違いがあるように見えなかった．この結果を踏まえると，実交通量が大きいと，事故も渋滞も発生しやすいということが言える．一方で，2地点の速度差が大きい場合，交通量が小さい場合にも事故が発生しやすい傾向にあることも確認できた．

以上より，感度分析2，すなわち親1内の「速度_TC2」が事故の発生の有無に対する影響が大きいことが確認できた．これにより，この変数をさらに詳細に分析することや親2と子の間における感度分析を進めることで，事故と渋滞の発生をより的確に予測する要因を見つけることができる可能性が考えられる．

表３-7 感度分析での使用変数2

(38)

37

図３-23 感度分析結果1 (渋滞発生後事故発生有)

図３-24 感度分析結果1 (渋滞発生後事故発生無)

図３-25感度分析結果1 (事故発生)

(39)

38

図３-26 感度分析結果2 (渋滞発生後事故発生有)

図３-27感度分析結果2 (渋滞発生後事故発生無)

図３-28 感度分析結果2 (事故発生)

(40)

39

図３-29感度分析結果3 (渋滞発生後事故発生有)

図３-30感度分析結果3 (渋滞発生後事故発生無)

図３-31感度分析結果3 (事故発生有)

(41)

40 第６項まとめ

本章では，事故と渋滞の発生しやすい要因の組み合わせに強みをもつベイジアンネットワーク推計モデルの構築をすることができた．特に，2地点間の速度差が大きい際に事故発生，または事故発生まで至らずとも危険な事故の起きやすい渋滞の発生がより起こりやすいことが考えられた．上流側の速度小さくが下流側の速度が大きい場合，実交通量が小さい場合に事故が起きやすいことが確認できた．これにより，空いている車線へ車線変更をする際の後方不注視により事故に至る可能性が挙げられた(図3-32)．上流側の速度大きくが下流側の速度が小さい場合，実交通量が大きい場合に事故が起こりやすいことが確認できた．これは急激な速度低下にブレーキが間に合わず事故に至る可能性が挙げられた(図3-33)．また，その他感度分析により，より的確に事故や渋滞の発生を予測するモデルを構築できる可能性が挙げられた．

一方で，ベイジアンネットワークモデルは予測精度が高くなく，離散化の基準次第で結果が大きく変わる可能性がある．そこでベイジアンネットワークの結果を踏まえ，ディープラーニングによる事故・渋滞発生判別分析を検討することとした．

図３-32 事故発生原因可能性1

図３-33 事故発生原因可能性2

(42)

41

第 4 章

ディープラーニングを活用した

モデルの構築

(43)

42

第４章ディープラーニングを活用したモデルの構築

本研究では，時々刻々と変化する交通条件におけるモデルの適用性を高めるため，ディープラーニングによるモデル構築を行った．

構築するディープラーニングモデルについて第１項ディープラーニングとは

ディープラーニングとは，機械学習手法の一つであり，主にニューラルネットワーク(以下NN)を基盤とした変数選択が自動化されたモデリング手法である．モデルの予測精度が高く，主に画像認識や言語予測などの分野で成功を収めている．その一方でモデルの構造がブラックボックスなものとなっており，とにかく精度の高さを要求するような識別問題に適性がある．ところが通常のNN は時系列データの解析に不適当なモデルとされ，今回対象としている事故や渋滞の発生といった時系列な性質を持つデータの扱いには向かない．そこで時間を遡ることができ時系列を考慮可能なリカレントニューラルネットワーク(以下，RNN)を使用する．ただし，RNNには長期依存を学習できない問題がある．そこで本研究では，長期的な時系列データを扱うため，リカレントニューラルネットワークの拡張モデルであるLSTM(Long Short-Term Memory)層を使用し，LSTM層の予測への適用可能性を検討することとした．

(44)

43

第２項 LSTM(Long Short-Term Memory) 層とは

第1項においても触れたように，一般的なRNNの課題として，長期依存を学習できない点が挙げられる．これは「勾配消失問題」と呼ばれ，誤差逆伝搬時に，誤差を入力に近い階層まで伝搬させることが困難なことにより，系列データが長くなるにつれ「勾配消失問題」が生じる．このため10 時刻程度のデータを超えると限界を迎えることが多い．

そこで内部状態を記憶するメモリセルと3つ(忘却/入力/出力)のゲートを構成することで勾配消失問題を解決し，短期と長期の記憶を両立した内部情報の保持方法を実現したものがLSTMである．詳細を以下の図に示す．本研究においては，LSTMの構造はメインではなく，今後のページにおいて扱う際には「LSTM BLOCK」として表現する．

図４-1 リカレントニューラルネットワークとLSTMの違い

図４-2 LSTMの詳細

(参考：「山下隆義著，イラストで学ぶディープラーニング改訂第2版」より引用)

(45)

44 第３項入出力データとモデル構造

モデルの概要を図4-3に示す．入力データには，ベイジアンネットワークで使用した変数と同じものを使用する．詳細は表3-1を参照されたい．また，出力として5分後の事故・渋滞の発生を予測する．出力はベイジアンネットワークと異なり，「非渋滞継続」「渋滞発生」「事故発生」の3種類のものを設定した．これはベイジアンネットワーク同様4種類の出力を与える前段階として，最低限の適用可能性をみるためにこのような設定とした．

入力と出力については，様々な角度からディープラーニングに対してアプローチを行った．結果的にこのモデルに落ち着くまでの入出力の検討過程については付属資料を参照されたい．

図４-3 モデルの概要

(46)

45

学習データの抽出方法を示す．学習データには事故発生データ，渋滞発生データ，無事故・非渋滞データを用意した．事故発生データと渋滞発生データは，事故・渋滞の発生する直前の時間から約2時間分のデータを抽出する．その後，事故発生データと渋滞発生データと被りがないよう事故・渋滞の発生しない2時間分のデータを抽出する．なお，無事故・非渋滞データが学習データの約半数になるよう事故発生データ件数と渋滞発生データ件数を基に設定した．抽出の際，学習データのうち無事故・非渋滞データはランダムに選択する．このランダムな抽出を10データ分行う．このデータを合わせたものを学習データとする．その概要を図4-4に示す．図4-4を見るとわかる通り，事故発生件数は通常時や渋滞発生件数と比較して少ないため，モデルに反映されにくいことが考えられた．そこで10の異なる入力データから異なる学習データを形成し，予測された発生確率の平均値を分析した．

図４-4 学習データ概要

… … …

…

(47)

46

モデルの構造は，LSTM層1層を隠れ層としたものを構築した．入力層と隠れ層の間の活性化関数にはReLU関数を用い，隠れ層から出力層の間の活性化関数にはsoftmax関数を使用した．ReLU関数は，0以下の入力を0に置き換え，0より大きな入力はそのまま出力する関数であ

る(図4-5)．入力層隠れ層間の活性化関数には，その他にTanhやSigmoidが存在するが，今

回は不適当な値を十分に排除するためにReLU関数を使用する．softmax関数は分類問題等で頻繁に使われる関数であり，正解ラベルの推論を確率で割り振ることができる．本研究においても，「非渋滞継続」「渋滞発生」「事故発生」の3種類の交通状況への遷移への分類問題を考えるため，softmax関数を使用した(図4-6)．

図４-5 ReLU関数

図４-6 softmax関数の例

(48)

47 分析結果

第１項損失値と正解率

はじめに，損失値と正解率を指標として分析した．損失値は，予測と実際の値のズレの大きさを表すものであり，モデルの予測精度を評価する．一方で正解率は，全ての事象の中で結果があっていたものを指す．今回の分析においては，664あるデータのうち，200を訓練データ，464を検証データとし，エポック数(計算の繰り返し回数)を100回とした．その結果の一例を以下の図4-7，

図4-8に示す．

図4-7は損失値を示す．この結果を見ると，検証データの損失値がエポック数を増やすごとに悪化している．すなわち過学習している結果となった．構築するモデルには，この損失値が最小になる，すなわち最良になるものを採用する．本研究では学習データをランダムに抽出しているため，その抽出したデータにこの結果が依存していることが考えられた．しかし，抽出データのちがいによる影響は大きく見られない結果となっていた．一方で中間層を増やすことでの結果の変化は，

抽出データのランダム性と比較して大きい結果となっていた．これは付属資料を参照されたい．

図4-8は正解率を示す．この結果をみると，訓練データではほぼ100%まで精度があがることがわかる．一方で検証データの結果は横ばいになっており，7割～8割前後の正解率にとどまる結果となっていた．

(49)

48 図４-7 損失値

図４-8 正解率

(50)

49 第２項再現率

損失値と正解率のみでの検証は不十分であると考えた．これは例えば，全データのうち90％を正解しているとされた場合に，全データ中７%に満たない事故発生を全く事故発生として正解できていない場合においてもこの数字を叩き出すことが可能なためである．そこで再現率を指標として用いる．再現率には，「実際にXのデータでXと判別される割合」「実際にXではないデータでX 以外に判別される割合」の２種類が存在する．その結果の一例を以下の図4-9に示す．図4-9に示す再現率の数値は，前者を左，後者を右で示している．これをみると，実際に事故のデータで事故発生と判別される割合が33％と高い数値を持つことがわかる．その他の数値も７割を超しており，良好な結果であると考えられた．しかしながら，事故発生を事故発生と判定する再現率の値にはばらつきが大きく，ほとんど的中していない結果を持つケースも多々見られた．

図４-9 再現率の結果

(51)

50

続けて，より高い再現率を目指し，入力する変数選択を変更した．これは，６７種類の変数が多すぎる関係で，モデルに影響の大きな変数が出ていないのではないかとの仮説の元進めたものである．変数を減らす際，ベイジアンネットワークの結果を参考に変数を絞ることとした．選択された入力変数の個数と内訳を以下の表に示す．個数とその内訳を選択した理由を示していく．はじめに，

ベイジアンネットワークの結果を参考に，ベイジアンネットワーク上における親１の変数３種類のみで表現する方法を考えた．また，親２,３を含めて考えた際，TC4地点の追越車線の実交通量が影響を与えている結果を得ることができた．これより，個数3,４の場合を設定した．一方で，ベイジアンネットワークの結果とは独立してどの要素が表現しやすいのかを，モデルを組む上で知っておく必要があると考え，それぞれの速度であれば速度のみ，といった形で要因別の分析も行うこととした．

これにより，個数6,７,18a,b,cを与える．また，要因だけでなく車線別の影響も考えたほうがモデルを組む上で参考になるのではないかと考え，車線毎に分けたものを用意した．ところが，本研究において「速度」は断面速度を指すため，速度を組み込むことができなかった．そこで，ベイジアンネットワークの結果において影響のあった「速度_TC0」と「速度_TC2」を加えることとした．これが

20a,ｂ,cである．これまでと同様６７個の変数を含めたものを用意し，それぞれの入力変数の組み

合わせにおける再現率を比較する．

表４-1 入力変数の個数と内訳