令和二年度 修士論文
気象レーダを用いた
落雷の短時間予測
指導教員 本島 邦行 教授
群馬大学大学院理工学府 理工学専攻
電子情報・数理教育プログラム
修士 2 年 学籍番号 T191D068
成田 貴一
1
目次
1. 序論 ...3 2. 解析データ ...5 2.1 データの種類 ...5 2.2 解析範囲および解析期間 ...6 2.3 解析データの選抜 ...8 3. 移動量の導出 ...9 3,1 5 分間の移動量の導出 ...9 3.2 異常な移動量の特定 ... 10 4. 移動予測 ... 11 4.1 f 分前の XRAIN データの導出 ... 11 4.2 f 分後の移動予測 ... 12 5. 落雷予測モデルの作成 ... 13 5.1 ロジスティック回帰分析 ... 13 5.1.1 説明変数候補 ... 13 5.1.2 説明変数の選択方法 ... 14 5.1.3 解析結果 ... 15 5.2 深層学習 ... 17 5.2.1 全結合型ニューラルネットワークの構造 ... 17 5.2.2 全結合型ニューラルネットワークの学習に用いる指標... 18 5.2.3 全結合型ニューラルネットワークの学習方法 ... 19 5.2.4 観測値の存在しない高度における XRAIN データ ... 20 5.2.3 学習結果 ... 21 6. 評価方法 ... 25 6.1 真陽性率 ... 25 6.2 適合率... 26 6.3 F 値 ... 26 6.4 落雷予測格子数 ... 27 6.5 AUC ... 272 7. 落雷予測結果 ... 29 7.1 落雷予測の手順 ... 29 7.2 落雷予測対象 ... 29 7.3 5 分後に発生する落雷の予測結果 ... 30 7.4 10 分後に発生する落雷の予測結果 ... 32 7.5 15 分後に発生する落雷の予測結果 ... 34 7.6 予測を行う格子の限定 ... 36 7.6.1 5 分後に発生する落雷の予測結果 ... 36 7.6.2 10 分後に発生する落雷の予測結果 ... 37 7.6.3 15 分後に発生する落雷の予測結果 ... 38 8. 結論 ... 40 9. 今後の課題 ... 41 謝辞 ... 42 参考文献 ... 43 研究業績 ... 44
3
1. 序論
警察白書によると落雷による年間死数は年々減少しており,2000-2009 における平均死 傷者数は 3 人と非常に少なくなっている。これは落雷に関する正しい知識が普及したため だと考えるが,それでも死傷者数は 0 となってはいない。また,落雷による被害は人へ対す るものに限らない。落雷の影響は電気機器の類にも及び,サーバ等への被害は無視できない。 しかし,これらの被害は,事前に落雷の発生を予知できていれば,外出を見送る,サーバの 電源を切る等の対策をとることで,回避できる。 気象庁では,雷ナウキャスト[1]という,雷の激しさや雷の可能性を予測するシステムが運 用されている。これは,気象レーダによって観測されるエコー強度の解析等を行うことで, 雷雲の特徴を捉え,落雷危険域の検出をしている。このように,従来の落雷予測では,気象 レーダによって観測されるエコー強度を用いることで,雷雲の解析は行われてきた。しかし, 国土交通省が運用する XRAIN(eXtended RAdar Information Network)[2]に用いられるよう なマルチパラメータレーダは,垂直偏波と水平偏波を同時に送受信することが可能であり, エコー強度の他に偏波情報を得ることが出来る。この偏波情報は,降水粒子の形状を反映し, 空間に存在する粒子の種類の推測に有用な情報である。落雷は雲中に存在する霰が原因と なって発生するため,雲中に霰が存在するかの推測に有用な偏波情報は,落雷予測を行う上 で,重要な情報であると考えた。そこで,新たな雲の情報として,偏波情報を落雷予測に用 いることで,エコー強度のみを用いた場合より高い落雷予測精度をもつ落雷予測アルゴリ ズムの作成を試みる。 よって本稿では,エコー強度と偏波情報を用いた落雷予測モデルとエコー強度のみを用 いた落雷予測モデルを作成し,予測精度の比較を行う。これにより,偏波情報を用いること で落雷予測精度は向上するのかを確認する。 落雷予測方法の概要を図 1.1 に示す。作成する落雷予測モデルは,入力された XARIN デ ータについて,”落雷が発生する f 分前の XRAIN データ”と”落雷が発生しない場合の f 分前 の XRAIN データ”に分類する分類モデルである。落雷予測モデルの分類結果に対して,雲 が f 分後にどこへ移動するかを予測することで,f 分後の落雷位置を予測する。 図 1.1 f 分後の落雷位置を予測する落雷予測アルゴリズムの概要4 予測対象とするのは,XRAIN データの観測タイムスタンプから,5,10,15 分後に発生する 落雷であり,それぞれの場合で異なる落雷予測モデルを作成し,評価する。 落雷予測モデルの作成は,ロジスティック回帰分析を用いた場合と人工知能による深層 学習を用いた場合でそれぞれ行う。これにより,ロジスティック回帰分析を用いて作成され た落雷予測モデルと人工知能による深層学習を用いて作成された落雷予測モデルの比較を 行い,各モデルの特徴を確認する。 このような比較を行う理由として,次のような理由が挙がる。 ロジスティック回帰分析により落雷予測モデルを作成する場合,事前に,解析に用いる XRAIN データ(10km 高度のエコー強度等)を決定しなくてはならない。そのため,落雷予 測モデルの製作者は把握していないが,落雷予測では重要な XRAIN データが存在した場合, それを解析対象とすることができない。 そこで,深層学習を用いることにより,全高度の XRAIN データを解析対象とした落雷予 測モデルの作成を行う。 これにより,全高度の XRAIN データを解析対象とした落雷予測モデルは,特定の XRAIN データを解析対象とした落雷予測モデルより予測精度が良くなるかを確認する。
5
2. 解析データ
本稿で扱う XRAIN データは,荒牧の教育学部の岩崎教授より提供していただいたもので ある。 本章では,落雷予測モデルの作成に使用する XRAIN データの種類や解析範囲,解析期間 を示す。2.1 データの種類
XRAIN によって得られるデータの種類を,表 2.1 にまとめた。 表 2.1 XRAIN によって得られるデータの種類 データの種類 データは何を反映しているか エコー強度 (REF) 降雨強度 偏波間位相差変化率 (KDP) 降水粒子の形状 レーダ反射因子差 (ZDR) 降水粒子の形状 降水粒子の種類 (HCX) 空間に存在する主な降水粒子の種類 XRAIN は,マルチパラメータレーダという垂直偏波と水平偏波からなるレーダを用いて 観測を行っている。これにより,図 2.1 に示すように,各偏波の反射波を比較することで降 水粒子の縦横比を推測することが出来る。また,マルチパラメータレーダによって観測され たデータや気温により,空間に存在する主な降水粒子の種類が推測される。 KDP,ZDR,HCX は従来の落雷予測に用いられたことのない値であり,REF を含めた 4 種のデータを用いて,落雷予測モデルの作成を行う。 図 2.1 マルチパラメータレーダによって得られる偏波情報の導出方法6 また,落雷位置および時刻の解析には,気象庁雷監視システム(LIDEN)[3]で得られた測定 データを用いる。LIDEN は,落雷が発生する時に生じる電磁波を観測することで,落雷地 点の推測を行っている。本稿では,LIDEN の位置推定精度を考慮し,落雷位置の±1 格子 の範囲を落雷地点とする。
2.2 解析範囲および解析期間
関東域には 7 基の XRAIN レーダが存在し(図 2.4 黒丸),それぞれが半径 60km の範囲 を,250m の空間分解能で,多仰角 PPI による 3 次元観測を 5 分間隔で行っている。その 3 次元データを水平方向に 500m,鉛直方向に 250m の分解能で内挿し,解析に用いる。鉛直 方向の観測範囲は,0km~15.75km である。以上より,格子間隔は 500m であり,各格子で f 分後に落雷が発生するかを予測する。 解析期間は,2017 年 7~8 月,2018 年 7~8 月である。落雷予測モデルの作成には,2017 年 7~8 月の XRAIN データを用いる。 XRAIN はレーダの仰角を変化させることで様々な高度の観測を行っている(図 2.2)。こ の仰角は 10 通り存在し,その最大仰角は 20°である。よって,レーダサイトの直上のよう な,最大仰角より大きな仰角でなければ観測できない範囲は,レーダによる観測が不可能な 領域である。 この観測が不可能な範囲は高度によって異なるが,式(2.1)を用いることで,高度 h 以上 を観測できない範囲(レーダサイトを中心として半径 r の範囲)が算出できる。 よって,適当な高度 h を設定することで,高度 h 以上を観測できない範囲を算出し,解 析対象外とする。r =
ℎ
tan 20°
(2.1.)
:レーダの観測範囲 図 2.2 レーダによる観測方法7 図 2.4 各格子で高度 10kn 以下を定量的に観測するレーダサイト数 雷雲の解析を行うにあたり,雲頂は雲がどのくらい成長しているかを表すため,重要な値 である。しかし,雲頂における REF は非常に小さく,レーダサイトから離れている場合, 感知できないことがある。そのため,場所や雲頂の高度によっては,REF から正確な雲頂 を求めることはできない。 よって,REF が 20dBZ に最も近くなる高度(以下,20dBZ 高度)を観測の難しい雲頂の 代わりとして解析に使用し,20dBZ 高度を観測できないような範囲は解析対象外とする。 20dBZ 高度を用いるのは,20dBZ という大きさの REF であれば,レーダサイトからの距 離によって感知できないことは少ないためである。 XRAIN レーダが半径 60km 以内に 3 基以上存在する範囲で,REF が 20dBZ 以上となる 高度が存在する格子を対象に,20dBZ 高度の分布を調べた。結果を図 2.3 に示す。 図 2.3 より,20dBZ 高度はほぼ 10km 以下である。よって,高度 10km までの観測が可能 であれば,20dBZ 高度はほとんどの場合で測定できる。よって式(2.1)より,レーダサイト から 27.5km 以上 60km 未満の範囲は,20dBZ 高度を定量的に観測可能である。 複数のレーダにより観測が行われる範囲では,鉛直方向の精度が高くなる。よって本稿で は,3 基以上のレーダにより高度 10km 以下の定量的な観測が行われる範囲(図 2.4 橙, 赤 の範囲)を解析対象とする。 図 2.3 20dBZ 高度の分布(縦軸はデータ総数で割った値) 黒点:レーダサイト位置
8
2.3 解析データの選抜
発雷条件の研究によると,-10℃高度における REF(以下,ref_m10)が 20dBZ に達しな い,あるいは-10℃高度が 2km より低いと発雷は起こりにくいことが分かっている[4](-10℃ 高度とは,気温が-10℃に最も近い値となる高度を表す)。本研究では夏期の雷雲を対象とす るため,後者の事例は存在しない。そのため,ref_m10 が 20dBZ 未満となる格子の XRAIN データを除外することで,発雷の可能性がある格子の XRAIN データのみを解析対象とする。9
3. 移動量の導出
XRAIN データの観測タイムスタンプから f 分後に発生する落雷を予測する場合,図 1.1 で示したように,以下のような手順で予測を行う。 ① ある格子(以下,格子 A)の XRAIN データを落雷予測モデルに入力し, 格子 A に存在する雲が落雷を発生させ f 分前のものであるか判定する ② 格子 A に存在する雲が f 分後に移動する場所(以下,格子 B)を予測し, ①で得た結果と合わせて,格子 B で f 分後に落雷が発生するか予測する そのため,落雷予測モデルを作成するには,”落雷が発生する f 分前の XRAIN データ”と” 落雷が発生しない場合の f 分前の XRAIN データ”が必要となる。これらのデータを解析す ることで,入力された XRAIN データが,”落雷を発生させる f 分前の XRAIN データ”であ るか分類する落雷予測モデルを作成する。 3 章では,ある格子に存在するレーダエコーが f 分前に存在した格子を求めるため,レー ダエコーの移動量の導出方法について記述する。3,1 5 分間の移動量の導出
2 章で示したように,XRAIN は 5 分間隔で観測を行っている。よって,ある時刻の XRAIN データと,その 5 分前の XRAIN データを比較することで,5 分間の雲の移動量を求める。 移動量の導出は,高度 10km 以下を定量的に観測できる範囲で行う。これを,15km 四方 の区画に,7.5km 間隔で区切り,それぞれで移動量を導出する。 移動量の導出方法の概要を,図 3.1 に示す。図 3.1 のように区切った各区画で,ある時刻 とその 5 分前のレーダエコー分布(以下,RE 分布)を作成し,それぞれの重心位置を求め る。その後,5 分間の重心位置の移動量を算出し,これをその区画に存在する雲全体の移動 量とした。ただし,RE 分布の重みとして,各格子における 20dBZ 高度を用いている。 図 3.1 5 分間の移動量の導出方法概要10
3.2 異常な移動量の特定
各区画で 5 分間の移動量を導出した場合,次に異常な移動量の特定を行う。 本稿では,RE 分布の重心位置を用いて移動量の導出を行っている。そのため,区画に大 きな RE 分布が出入りすると,導出した移動量が RE 分布の移動方向と異なる場合がある。 そこで,以下のような条件を設け,これに当てはまるものは異常な移動量として扱う。 1. 同区画で,5 分前から現在までにおける移動量ベクトルと,10 分前から 5 分前までに おける移動量ベクトルを比較し,成す角が 90°以上である場合,その区画における 5 分前から現在までの移動量ベクトルは異常と判定 2. 隣接する区画の移動量ベクトルと比較し,1 で異常と判定された区画を除いた過半数 において,移動量ベクトルの成す角が 90 °以上となる場合,異常な移動量ベクトル と判定 ただし,移動量ベクトルが 1km 未満と極端に小さい場合,上記の基準を満たしていると しても異常な移動量としては扱わない。これは,雲がほぼ停滞しているような状況では,RE 分布の移動方向が定まりづらく,上記のような条件を満たしたとしても正常な場合がある ためである。 異常な移動量と判定された区画は,隣接する区画を対象として,異常ではない移動量の平 均を求める。その後,算出した平均移動量を,その区画における RE 分布の移動量とする。11
4. 移動予測
前章では,5 分間の雲の移動量について記述した。本章では,移動量を用いることで,あ る格子に存在したレーダエコーが f 分前にはどの格子に存在したか,あるいは f 分後にはど の格子に存在するか,予測する方法について記述する。4.1 f 分前の XRAIN データの導出
ある格子(以下,格子 a)に存在するレーダエコーが,5 分前に存在した格子(以下,格 子 b)の求め方について,図 4.1 に示す。 3 章で述べたように,15km 四方の区画ごとに導出した移動量は,区画内の全てのレーダ エコーに適応すると考える。そのため,図 4.1 のように,区画内の格子 a に対して移動量を 用いることで,格子 b を予測する。 これを繰り返すように,10 分前から 5 分前までの移動量を求め,格子 b に存在するレー ダエコーがさらに 5 分前に存在した格子を予測することで,格子 a に存在するレーダエコ ーが 10 分前に存在した格子を予測できる。 このようにして,ある格子に存在するレーダエコーが 5,10,15 分前に存在していた格子を 予測する。 ただし,複数の移動量が適応される範囲(移動量を求める区画が複数重なっている範囲) の格子に対して移動予測を行う場合は,適応される全移動量の平均を用いる。 図 4.1 あるレーダエコーが 5 分前に存在した格子の予測方法12 ”落雷が発生する f 分前の XRAIN データ”と,”落雷が発生しない場合の f 分前の XRAIN データ”は,以上の移動予測を用いて求める。 それぞれ,以下のように定めた。(ただし,ある格子を格子 A,格子 A のレーダエコーの f 分前の位置を格子 B,XRAIN データの観測タイムスタンプを時刻 T とする。) ・”落雷が発生する f 分前の XRAIN データ” 時刻 T から 5 分の間に格子 A の±1 格子の範囲で落雷が発生した場合, 格子 B で時刻(T―f 分)に観測された XRAIN データ ・”落雷が発生しない場合の f 分前の XRAIN データ” 時刻 T から 5 分の間に格子 A の±1 格子の範囲で落雷が発生しない場合, 格子 B で時刻(T―f 分)に観測された XRAIN データ
4.2 f 分後の移動予測
ある格子(以下,格子 a)に存在するレーダエコーが,5 分後に存在する格子(以下,格 子 b)の予測方法を図 4.2 に示す。 レーダエコーは,5 分前とまったく同様に移動すると仮定する。これにより,区画内の格 子 a に対して 5 分間の移動量を用いることで,格子 b を予測する。 同様にして,格子 a に存在するレーダエコーが 10 分後に存在する格子(以下,格子 c) を予測する場合,5 分前からの移動を 10 分間続けると仮定することで,格子 c を予測する。 このようにして,ある格子に存在するレーダエコーが 5,10,15 分後に存在する格子を予測 する。以上の移動予測を用いて,落雷予測モデルの判定結果に対して移動予測を行うことで, f 分後の落雷地点の予測を行う。 ただし,複数の移動量が適応される範囲(3 章で移動量を求めた区画が複数重なっている 範囲)の格子に対して移動予測を行う場合は,適応される全移動量の平均を用いる。 図 4.2 あるレーダエコーが 5 分後, 10 分後に存在する格子の予測方 法13
5. 落雷予測モデルの作成
本章では,入力された格子データを”落雷を発生が発生する f 分前の XRAIN データ”と”落 雷が発生しない場合の f 分前の XRAIN データ”に分類する落雷予測モデルの作成方法につ いて記述する。ただし,1 章で示したように,本稿ではロジスティック回帰分析と深層学習 を用いた場合で異なる落雷予測モデルを作成する。そのため,ロジスティック回帰分析と深 層学習について,それぞれ記述する。5.1 ロジスティック回帰分析
ロジスティック回帰分析とは,複数の変数(説明変数)が被説明変数に与える影響につい て解析を行う,多変量解析の手法の一つである。この手法の特徴として,被説明変数が 2 値 の質的データとなることが挙がる。ここでいう 2 値の質的データとは,”男”と”女”のように, 分類によって測定できるものであり,本稿では”落雷が発生する f 分前の XRAIN データ”と” 落雷が発生しない場合の f 分前の XRAIN データ”となる。 ロジスティック回帰分析は,被説明変数 y に対して説明変数 x が与える影響を式(4.1)の ような関係式で表す。y =
1
1 + 𝑒
−(𝑎1𝑥1+𝑎2𝑥2+⋯+𝑎𝑛𝑥𝑛+𝑏)(4.1)
回帰分析により導出される説明変数と被説明変数の関係式を回帰式と呼ぶ。 a を偏回帰係数,b を定数項と呼び,複数のデータセットを用いることで,a や b の最適 値を導出する。求めた a,b を用いることで,ある格子の XRAIN データを入力した時,その 格子データが,”落雷が発生する f 分前の XRAIN データ”である確率を予測できるようにな る。5.1.1 説明変数候補
ロジスティック回帰分析を行う場合,被説明変数に影響を与えると考えられる説明変数 候補を設定する必要がある。その後,一定の基準に従い,説明変数候補の中から回帰式に用 いる説明変数が決定する。 本稿で回帰式の作成に用いる説明変数候補を表 5.1 に示す。 表 5.1 より,説明変数候補には様々な高度の XRAIN データを挙げた。これは,いずれの 高度の XRAIN データが落雷予測において重要か判明していないため,様々な高度の XRAIN データが解析対象となるよう,このような説明変数候補を作成した。14 表 5.1 説明変数候補一覧 名称 意味 名称 意味 ref_2km 2km 高度の REF zdr_2km 2km 高度の ZDR ref_5km 5km 高度の REF zdr_5km 5km 高度の ZDR ref_10km 10km 高度の REF zdr_10km 10km 高度の ZDR ref_m5 -5℃高度の REF zdr_m5 -5℃高度の ZDR ref_m10 -10℃高度の REF zdr_m10 -10℃高度の ZDR ref_m20 -20℃高度の REF zdr_m20 -20℃高度の ZDR kdp_2km 2km 高度の KDP high_20dBZ 20dBZ 高度 kdp_5km 5km 高度の KDP qty_G 霰が主な粒子となる空間数 kdp_10km 10km 高度の KDP WG 湿った霰が主となる空間が いずれかの高度に存在するか kdp_m5 -5℃高度の KDP DG 乾いた霰が主となる空間が いずれかの高度に存在するか kdp_m10 -10℃高度の KDP qtyG_m10 ±10 格子の-10℃高度で, 霰が主となる格子数 kdp_m20 -20℃高度の KDP qtyREF_m10 ±10 格子の-10℃高度で, REF が 20dBZ 以上の格子数 ※ WG, DG は質的変数であり,存在する場合は 1, 存在しない場合は 0 の値をとる ※ -〇℃高度とは,気温が-〇℃に最も近い値となる高度を表している 表 5.1 より,説明変数候補として,-10℃高度のような気温による高度における XRAIN デ ータを挙げた。これは,2 章で記述したように,ref_m10 が 20dBZ に達しなければ発雷は 起こりにくいという発雷条件から,落雷の発生には気温に依った高度におけるデータが重 要であると考えたためである。 qtyG_m10,qtyREF_m10 は雨雲の面積を表す説明変数である。これらの値を求めるため の範囲は,対象となる格子の±10 格子をとしたが,これは XRAIN の測定データから雨雲 の動きを観察したところ,落雷を発生させる雨雲の大きさが十数 km 四方であることが多か ったためである。
5.1.2 説明変数の選択方法
表 5.1 に示した説明変数候補から回帰式に用いる説明変数を選択する方法として,変数増 減法を用いた。これにより,AIC(Akaike's Information Criterion)が最小となる説明変数の組 み合わせを選択した。15 る場合,先に回帰式へ取り込まれなかった説明変数候補はその後回帰式に用いないように した。
5.1.3 解析結果
表 5.1 に示した説明変数候補を用いてロジスティック回帰分析を行う。回帰分析には, Python 言語のライブラリである statsmodels を使用した。 解析条件を以下にまとめる。 ただし,回帰分析に使用する格子データについて,表 5.2 に示した解析期間,解析範囲, 解析対象に該当する格子データを集めた場合,”落雷が発生する f 分前の XRAIN データ”の 数は”落雷が発生しない場合の f 分前の XRAIN データ”の数のおよそ 50 分の 1 である。そ のため,このデータ比のままロジスティック回帰分析を行ったとしても,”落雷が発生する f 分前の XRAIN データ”がノイズとして扱われる。 そこで,”落雷が発生しない場合の f 分前の XRAIN データ”からランダムに格子データを 取り除き,各格子データの数が同数となるようにした。このように数を調整した格子データ を用いて,ロジスティック回帰分析を行う。 また,本稿の目的は,エコー強度と偏波情報を用いた落雷予測モデルとエコー強度のみを 用いた落雷予測モデルの比較である。よって,説明変数候補を表 5.1 の全てとした場合と, 表 5.1 中の REF を用いたものに限定した場合で,それぞれ回帰分析を行う。 回帰分析により得られた回帰式は,以下のように呼称する。 ・Re_all_f min 表 5.1 の全ての説明変数候補から,AIC を基準とした変数増減法により作成した 回帰式(Regression equation)。f 分後の落雷予測に使用する。 表 5.2 解析条件 解析方法 ロジスティック回帰分析 データ単位 500m 格子 解析期間 2017 年 7 月~2017 年 8 月 解析範囲 (2 章参照) 解析対象 ref_m10 が 20dBZ 以上となる格子データ 被説明変数 落雷を発生させる f 分前の XRAIN データであるか 説明変数候補 (表 5.1 参照) 説明変数の選択方法 AIC が最小となるよう,変数増減法により選択16 ・Re_ref_f min 表 5.1 中の REF を用いた説明変数候補から,AIC を基準とした変数増減法により 作成した回帰式。f 分後の落雷予測に使用する。 f=5,10,15 の場合でそれぞれ,”落雷が発生する f 分前の XRAIN データ”と”落雷が発生し ない場合の f 分前の XRAIN データ”を用いてロジスティック回帰分析を行った。 導出された回帰式の詳細を表 5.3, 5.4, 5.5 に示す。 表 5.3 f=5 とした時の解析結果 回帰式 説明変数 x 偏回帰係数 a 説明変数 x 偏回帰係数 a Re_all_5min ref_2km -0.005774 zdr_10km -0.1259 ref_5km -0.01273 zdr_m20 0.1640 ref_10km 0.05847 high_20dBZ 0.006773 ref_m10 0.02915 qty_hcx 0.01754 kdp_m5 0.1220 qtyG_m10 0.001621 kdp_m10 0.1256 qtyREF_m10 0.007139 zdr_2km 0.2494 定数項 b -4.782 Re_ref_5min ref_2km 0.03576 ref_m20 0.01876 ref_5km -0.008465 high_20dBZ 0.006064 ref_10km 0.08662 qtyREF_m10 0.005320 ref_m10 0.08194 定数項 b -8.203 表 5.4 f=10 とした時の解析結果 回帰式 説明変数 x 偏回帰係数 a 説明変数 x 偏回帰係数 a Re_all_10min ref_2km -0.02568 zdr_2km 0.4046 ref_5km -0.01475 zdr_5km 0.1292 ref_10km 0.06341 zdr_m10 -0.1039 ref_m10 0.02591 DG 0.3502 kdp_5km 0.06224 high_20dBZ 0.004193 kdp_10km -0.2383 qtyG_m10 0.008513 kdp_m5 0.2116 定数項 b -3.752 Re_ref_10min ref_2km 0.02421 high_20dBZ 0.006064 ref_10km 0.1006 ref_m10 0.08786 定数項 b -7.353
17 ロジスティック回帰分析により,入力された格子データが”落雷が発生する f 分前の XRAIN データ”であるかを予測する落雷予測モデルが導出された。
5.2 深層学習
5.1 節では,ロジスティック回帰分析を用いることで落雷予測モデルの作成を行った。 しかし,回帰分析により落雷予測モデルの作成を行う場合,あらかじめ説明変数候補を挙 げ,その中から説明変数の決定を行う必要があり,説明変数候補として挙げられないような XRAIN データは,解析に用いることができない。表 5.1 では説明変数候補として,2,5,10km 高度や-5,-10,-20℃高度における XRAIN データを挙げたが,これ以外の高度における XRAIN データが落雷予測で最も重要である可能性がある。 本節では,全高度の XRAIN データを用いて深層学習を行い,入力された格子データが落 雷の発生する f 分前のものか分類する落雷予測モデルを作成する。5.2.1 全結合型ニューラルネットワークの構造
本稿では,様々な種類の深層学習手法の中で最も基本的な,全結合型ニューラルネットワ ーク(以下,全結合型 NN)を用いて落雷予測モデルの作成を行う。 全結合型 NN の一例として,3 層の全結合型 NN の概要を図 5.1 に示す。ただし,入力は 3 変数で,2 値の分類を行う NN とした。 表 5.5 f=15 とした時の解析結果 回帰式 説明変数 x 偏回帰係数 a 説明変数 x 偏回帰係数 a Re_all_15min ref_2km -0.03645 zdr_2km 0.5166 ref_5km -0.03482 zdr_5km 0.1753 ref_10km 0.05688 zdr_10km 0.1363 ref_m10 0.01235 zdr_m10 -0.1196 kdp_5km 0.1542 DG 0.9410 kdp_10km -0.2241 qtyG_m10 0.008177 kdp_m5 0.1919 kdp_m20 -0.09169 定数項 b -2.553 Re_ref_15min ref_2km 0.02216 ref_m10 0.05430 ref_5km -0.02384 high_20dBZ -0.004480 ref_10km 0.1003 qtyREF_m10 0.003835 ref_m5 0.04020 定数項 b -6.27618 全結合型 NN は,変数を入力する『入力層』,計算結果である『出力層』(分類問題では 各カテゴリである確率),入力層と出力層の間にある『中間層』より成り立つ。この中間層 は,図 5.1 では 1 層であるが,10 層や 20 層のように多層とすることができる。 この中間層数や,各層におけるノード数(図 5.1 赤円)は自身で設定する値である。これ らを多くするとより柔軟な NN となるが,計算量も多くなるため,完成までにかかる時間 は長くなる。よって,それぞれについて適切な値を探す必要がある。 また,各ノードでは活性化関数 a(u)が使用されているが,これは 1 つ前の層の出力を線 形変換した値 u について,非線形変換を行うことを目的としている。これにより,NN は全 体として非線形性を持つことが可能となる。そのため,入力と出力が非線形な関係となって いる観測データについても,的確な NN の構築を行える。本稿では,活性化関数 a(u)とし て正規化線形関数を用いる。
5.2.2 全結合型ニューラルネットワークの学習に用いる指標
全結合型 NN について,ノード数や中間層数は自身で決める値であるが,計算に用いら れる重み W は学習によって定まる値である。 始めに,重み W はランダムな初期値が設定される。その後,学習が上手くいく(分類問 題の場合,分類の精度が向上する)と小さくなる関数である損失関数を指標とし,損失関数 の値が小さくなるように重み W を更新していく。これにより,初めは適当な値であった重 み W が,最適な重み W へ変化していく。 本稿では,損失関数として交差エントロピーという関数を用いる。これは,主に分類問題 の深層学習で用いられる関数であり,式(5.1)のように表される。L = − log 𝑦
式(5.1)
y : 正解のカテゴリに分類される確率 a(u) = {0 (𝑢 < 0) 𝑢 (𝑢 ≥ 0) ノードにおける計算の一例 図 5.1. 分類問題における 3 層の全結合型 NN の例19 例として,全結合型 NN を用いてある格子データの分類を行った時,”落雷が発生する 5 分前の XRAIN データ”である確率が 70%,”落雷が発生しない場合の 5 分前の XRAIN デー タ”である確率が 30%であった場合を考える。 判定対象とした格子データが,”落雷が発生する 5 分前の XRAIN データ”であった場合, 損失関数 L によって導出される値は式(5.2)のようになる。あるいは,判定対象とした格子 データが,”落雷が発生しない場合の 5 分前の XRAIN データ”であった場合,損失関数 L に よって導出される値は式(5.3)のようになる。 L = − log 0.7 = 0.155 式(5.2) L = − log 0.3 = 0.523 式(5.3) 損失関数 L は,分類精度のよい分類モデルであれば,小さな値を取ることが確認できた。 本稿でも,この損失関数を指標として深層学習を進める。
5.2.3 全結合型ニューラルネットワークの学習方法
様々な全結合型 NN の学習方法の中で,本稿ではミニバッチ学習を用いる。 ミニバッチ学習とは,重み W の更新に用いるデータセットの選択方法である。具体的な 更新手順は以下の通りである。 【ミニバッチ学習の手順】 1. 訓練データ(データ数:N)から𝑁𝑏個のデータをランダムに取り出す 2. 𝑁𝑏個のデータを全結合型 NN に入力し,損失関数の平均値を算出する 3. 手順 2 で求めた損失関数の平均値が小さくなるように重み W を更新する 4. 手順 1~3 を,全ての訓練データを使い切るまで繰り返す (一度使用したデータは 再度使用しない) 5. 手順 1~4 を,任意の回数繰り返す 図 5.2. ミニバッチ学習による更新手順20 図 5.2 より,ミニバッチ学習は訓練データ(全結合型 NN の作成に使用するデータ)を複 数に分割し,それぞれで更新を行う学習方法である。 1 度の更新に用いられるデータ数𝑁𝑏をバッチサイズと呼び,手順5で訓練データを使い 切った回数をエポックという。例として,N=1000, 𝑁𝑏=100 の場合を考える。この時,1 エ ポックの間に 10 回の更新が行われることになる。 エポック数やバッチサイズは,中間層数やノード数と同様に,自身で決定する値である。 これらの値は,容易に変更可能であり,適切な値をとることで効率よく安定した深層学習を 行うことができる。以上のような,深層学習時に設定するパラメータのことを,以降「深層 学習パラメータ」と呼称する。
5.2.4 観測値の存在しない高度における XRAIN データ
XRAIN データは各格子において,高度 0~15.75km まで,250m の分解能で観測値が存在 している。しかし,雲が存在しない等の理由で観測値の存在しない高度がある。 本稿で行う深層学習では,特定の高度に注目せず,各格子の XRAIN データをそのまま用 いて全結合型 NN の作成を行う。しかしその場合,観測値が存在しない高度について,何か しらの値を挿入しなくてはならない。 本稿では,観測値の存在しない高度の XRAIN データについて,REF は 0,KDP と ZDR は-9.999,HCX は 0 を挿入する(図 5.3 参照)。 これらの値は,通常の観測値と比較して非常に外れた値となっている。このような処理を した XRAIN データを用いて学習を行えば,常に観測値の無いような高度の XRAIN データ は学習により影響がなくなると考えた。 図 5.3. 観測値の無い高度に挿入する値21
5.2.3 学習結果
ある格子データについて,”落雷を発生が発生する f 分前の XRAIN データ”と”落雷が発生 しない場合の f 分前の XRAIN データ”に分類する全結合型 NN の作成を行う。 解析条件を表 5.6 にまとめる。 深層学習には,表 5.4 に示した解析期間,解析範囲,解析対象に該当する格子データを用 いる。ただし,”落雷が発生する f 分前の XRAIN データ”と”落雷が発生しない場合の f 分前 の XRAIN データ”の数が同数となるように,”落雷が発生しない場合の f 分前の XRAIN デ ータ”からランダムに格子データを取り除いた。 数を調整した格子データの 70%を訓練データとし,深層学習に用いる。残りの 30%は, テストデータとする。1 エポックごとに,学習中の全結合型 NN を用いて訓練データとテス トデータの判定を行い,判定結果から損失関数の平均値を算出する。これにより,学習過程 における損失関数の遷移を確認する(図 5.4 参照)。 表 5.4 解析条件 解析方法 深層学習(全結合型 NN) データ単位 500m 格子 解析期間 2017 年 7 月~2017 年 8 月 解析範囲 (2 章参照) 解析対象 ref_m10 が 20dBZ 以上となる格子データ 入力 ある格子の 1km~15.75km 高度における XRAIN データ 出力 落雷を発生させる f 分前の XRAIN データであるか 図 5.4. 訓練データとテストデータ22 また本稿では,入力を REF のみとする全結合型 NN と REF, KDP, ZDR, HCX を入力と する全結合型 NN をそれぞれ作成する。 深層学習により得られた全結合型 NN は,以下のように呼称する。 ・NN_all_f min 1km~15.75km 高度における REF, KDP, ZDR, HCX を入力とする。 f 分後の落雷予測に用いる。 ・NN_ref_f min 1km~15.75km 高度における REF を入力とする。f 分後の落雷予測に用いる。 f=5,10,15 の場合でそれぞれ,”落雷が発生する f 分前の XRAIN データ”と”落雷が発生し ない場合の f 分前の XRAIN データ”を用いて深層学習を行った。全結合型 NN の学習過程 における損失関数の遷移を,図 5.5, 5.6, 5.7 に示す。また,全結合型 NN 作成時に設定した 深層学習パラメータを表 5.5, 5.6, 5.7 に示した。 本稿では,いずれの全結合型 NN においても中間層数は 6 層としている。これは,一般 的に中間層数が 3 層以上であると深層学習として扱われるため,中間層数を 3 層以上の適 当な層数である 6 層とした。 表 5.5 NN_all_5min と NN_ref_5min の深層学習パラメータ NN_all_5min NN_ref_5min 中間層数 6 6 各中間層のノード数 480 120 エポック数 300 600 ミニバッチサイズ 1024 1024 図 5.5. NN_all_5min と NN_ref_5min の学習過程における損失関数の遷移
23 表 5.6 NN_all_10min と NN_ref_10min の深層学習パラメータ NN_all_5min NN_ref_5min 中間層数 6 6 各中間層のノード数 480 120 エポック数 300 600 ミニバッチサイズ 1024 1024 図 5.6. NN_all_10min と NN_ref_10min の学習過程における損失関数の遷移 表 5.7 NN_all_10min と NN_ref_10min の深層学習パラメータ NN_all_5min NN_ref_5min 中間層数 6 6 各中間層のノード数 480 120 エポック数 400 400 ミニバッチサイズ 1024 1024 図 5.7. NN_all_15min と NN_ref_15min の学習過程における損失関数の遷移
24 図 5.5 より,NN_all_5min と NN_ref_5min の学習は,エポック数が進むごとに損失関数 が順調に低下していることから,正常に行われている。NN_all_10min と NN_ref_10min に ついても,図 5.6 よりエポック数が進むごとに損失関数が順調に低下しているため,学習は 正常に行われている。 NN_all_15min および NN_ref_15min については,他の全結合型 NN と比較して損失関数 の減少に大きな乱れが発生している。しかし,これらの全結合型 NN についても,損失関数 は減少の傾向にある。そのため,NN_all_15min と NN_ref_15min も他の全結合型 NN と同 様に,学習は正常になされている。
25
6. 評価方法
本章では,5 章で作成した落雷予測モデルを用いた落雷予測について,その予測精度を評 価するための指標について記述する。評価に用いるのは,“真陽性率”, “適合率”, “F 値”, “落 雷予測格子数”, “AUC(Area Under the Curve)”である。
これらの指標を説明するにあたり,落雷予測結果と実際に発生した落雷の一例をモデル 図として図 6.1 に示す。
6.1 真陽性率
真陽性率とは,「落雷の発生した格子数に対して,その落雷を予測できていた割合」であ り,式(6.1)で表される。真陽性率 =
落雷の発生を予測できた格子数
落雷の発生した格子数
式(6.1)
図 6.1 のような場合,落雷の発生した格子は 4 つであり,そのうちの 1 つは落雷が発生す ると予測できている。よって,真陽性率は 1 4= 0.25 となる。 真陽性率が高いとは,発生する落雷を見逃すことなく予測できていることを意味する。そ のため,落雷の発生を予期できなかったということを避けたい場合は,真陽性率の高い落雷 予測モデルを用いる。 図 6.1. 落雷予測結果と実際に発生した落雷の一例(モデル図)26
6.2 適合率
適合率とは,「落雷が発生すると予測した格子に対して,実際に落雷が発生した割合」で あり,式(6.2)で表される。適合率 =
落雷が発生するという予測が的中した格子数
落雷が発生すると予測した格子数
式(6.2)
図 6.1 のような場合,落雷が発生すると予測した格子は 5 つであり,そのうちの 1 つでは 実際に落雷が発生している。よって,適合率は 15= 0.2 となる。 適合率が高いとは,”落雷が発生する”という予測が信用できることを意味する。6.3 F 値
F 値とは,「真陽性率と適合率の調和平均」であり,式(6.3)で表される。F 値 =
2 ∙ 真陽性率 ∙ 適合率
真陽性率 + 適合率
式(6.3)
真陽性率と適合率の調和平均である F 値は,真陽性率と適合率を総合的にみて評価する 値である。このような値を評価に用いるのは,次のような理由のためである。 まず例として,必ず”落雷が発生する”と予測する落雷予測モデルを考える。この場合,ど のような格子も”落雷が発生する”と予測されるため,真陽性率は 1 となる。真陽性率のみに 注目するのであれば,この落雷予測モデルは非常に優れていることになる。しかし,必ず” 落雷が発生する”と予測する以上,その適合率は低い値となり,予測の信頼性は低くなる。 次に,”落雷が発生する”と予測した場合は必ず的中するが,ほとんどの落雷は見逃す落雷 予測モデルを考える。この場合,適合率は高いが,ほとんどの落雷を予測できないため,落 雷予測は成り立っていない。 以上のように真陽性率や適合率の一方が高くとも,もう一方が著しく低い場合,落雷予測 としては成り立たない。そのため,真陽性率と適合率を総合して評価する F 値が必要とな る。27
6.4 落雷予測格子数
落雷予測格子数とは,ある落雷予測モデルを用いて,落雷の有無を予測した格子数である。 回帰式を用いて落雷予測を行う場合,説明変数の値が存在しない格子データは,”落雷の 発生する f 分前の XRAIN データ”であるか,予測を行うことができない。しかし,全結合型 NN を用いて落雷予測を行う場合,いずれかの高度の XRAIN データが存在しない格子デー タについても,予測を行うことができる。 このように,使用する落雷予測モデルによって,落雷の有無を予測した格子数は異なる。 そのため,いくつの格子を予測することができたかを評価対象の一つとする。6.5 AUC
AUC とは,落雷予測モデルの判別能の高さを表す値であり,以下のように求められる。 落雷予測モデルが算出する値は,入力された格子データが”落雷の発生する f 分前の XRAIN データ”である確率である。この値が,閾値 th(通常は th=0.5)以上であれば”落雷 の発生する f 分前の XRAIN データ”であると判断する。 そのため,閾値 th が変化すれば,真陽性率等もまた変化する。真陽性率を縦軸に,偽陽 性率を横軸に取った時,閾値 th の変化により描かれる曲線を ROC 曲線と呼び,ROC 曲線 下の面積を AUC と呼ぶ(図 6.2 参照)。 ただし,偽陽性率とは「落雷が発生しない格子に対して,誤って落雷が発生すると予測し た割合」であり,式(6.4)で示される。偽陽性率 =
誤って落雷が発生すると予測した格子数
落雷が発生しない格子数
式(6.4)
図 6.1 のような場合,落雷が発生しない格子は 5 つであり,そのうちの 4 つでは落雷が発 生すると誤って予測している。よって,偽陽性率は 45= 0.8 となる。 図 6.2. ROC 曲線と AUC28
AUC とは,落雷予測モデルによる算出値が,”落雷が発生する f 分前の XRAIN データ”を 判定した時は高い値となり,”落雷が発生しない場合の f 分前の XRAIN データ”を判定した 時は低い値となると,1 に近づく値である。そのため,AUC の値を見ることで,落雷予測 モデルの判別能を評価することが可能となる。
29
7. 落雷予測結果
本章では,5 章に記述した落雷予測モデルを用いて f 分後の落雷予測を行い,真陽性率な どの予測結果を求める。7.1 落雷予測の手順
本節では,落雷予測の手順について記述する。以下に,落雷予測の流れを示した。 1. ある時刻 T の XRAIN データと落雷予測モデルを用いて, 各格子の格子データが落雷を発生させる f 分前のものであるか判定する 2. 各格子に存在するエコー強度は,f 分後にはどの格子に移動しているか予測する 3. 手順 1 の判定結果と手順 2 の移動予測結果を用いて, f 分後に落雷が発生する格子と落雷が発生しない格子を予測する 手順 3 で求めた予測結果と,実際に f 分後に発生した落雷を比較することで,落雷予測結 果を算出する。ただし,手順 3 で落雷の有無を予測した格子(図 7.1 赤や緑で塗られてい る範囲)のみを用いて,予測結果を算出する。落雷の有無を予測していない範囲で発生した 落雷については解析対象外とし,真陽性率等の算出には使用しない。7.2 落雷予測対象
落雷予測を行う期間,範囲,条件を以下に示す。 図 7.1. 落雷予測の手順 表 7.1 落雷予測対象 解析期間 2018 年 7 月~2018 年 8 月 解析範囲 (2 章参照) 解析条件 ref_m10 が 20dBZ 以上となる格子データ30
7.3 5 分後に発生する落雷の予測結果
本節では,5 分後に発生する落雷の予測を行う。
Re_ref_5min, Re_all_5min, NN_ref_5min, NN_all_5min を用いて,5 分後の落雷予測を行 った場合における真陽性率等を求めた。予測期間および範囲は表 7.1 の通りである。 予測結果を表 7.2 に示した。
また,Re_ref_5min, Re_all_5min, NN_ref_5min, NN_all_5min を用いて,5 分後の落雷地 点を予測した場合の一例を図 7.2 に示す。ただし,表 7.1 に示した解析範囲のみを予測対象 として図にすると,範囲が狭く各落雷予測モデルを使用した時の差異が分かりづらい。よっ て,関東圏全域を予測した場合の結果を図として示す。 表 7.2 より,落雷予測モデルとして回帰式を用いた場合と全結合型 NN を用いた場合の いずれにおいても,偏波情報を使用した方が真陽性率,適合率,F 値,AUC は良い結果と なっている。しかし,その差は僅かなものであり,偏波情報を用いたからといって予測精度 が劇的に向上するといったことは確認できない。 また,落雷予測モデルとして全結合型 NN を用いると,落雷予測格子数が回帰式を用い た場合の 1.5 倍以上となる。このことから,全結合型 NN を用いた落雷予測は,回帰式を用 いた場合と比較して,汎用性が高いことが分かる。 表 7.2 5 分後に発生する落雷の予測結果
落雷予測モデル Re_ref_5min Re_all_5min NN_ref_5min NN_all_5min
真陽性率 0.764 0.794 0.777 0.781
適合率 0.220 0.225 0.160 0.167
F 値 0.342 0.351 0.265 0.276
落雷予測格子数 547838 526736 894089 894089
31 図 7.2 より,落雷予測モデルとして回帰式を用いた場合と全結合型 NN を用いた場合の いずれにおいても,偏波情報の有無で予測結果に大きな差はないことが確認できる。 また,全結合型 NN を用いた場合,”落雷が発生する”と予測した面積は,回帰式を用いた 時より大きくなっている。このことから,落雷予測モデルとして全結合型 NN を用いると, 回帰式を用いた場合より,”落雷が発生する”と予測しやすいことが分かる。 図 7.2. 2018/8/6 18:55 に発生する落雷の位置を予測した結果 1 2018/8/6 18:50 の Xrain データを用いて 5 分後の落雷位置を予測
32
7.4 10 分後に発生する落雷の予測結果
本節では,10 分後に発生する落雷の予測を行う。
Re_ref_10min, Re_all_10min, NN_ref_10min, NN_all_10min を用いて,10 分後の落雷予 測を行った場合における真陽性率等を求めた。予測期間および範囲は表 7.1 の通りである。 予測結果を表 7.3 に示した。
また,Re_ref_10min, Re_all_10min, NN_ref_10min, NN_all_10min を用いて,10 分後の 落雷地点を予測した場合の一例を図 7.3 に示す。ただし,図 7.2 と同様,関東圏全域を予測 した場合の結果を図として示す。 表 7.3 より,落雷予測モデルとして回帰式を用いる場合は,偏波情報を使用した方が真陽 性率,適合率,F 値,AUC は良い結果となっている。しかしその差は,表 7.2 と同様に僅 かである。 落雷予測モデルとして全結合型 NN を用いた場合は,真陽性率と AUC については偏波情 報を用いた方が良いが,適合率と F 値は REF のみを用いた場合の方が良い結果となってい る。いずれも差は僅かであるが,これは表 7.2 とは異なる結果であり,偏波情報を用いれば 必ず精度が向上するわけではない。 落雷予測格子数は,表 7.2 と同様に,落雷予測モデルとして全結合型 NN を用いた場合は 回帰式を用いた場合の 1.5 倍以上となる。よって,全結合型 NN を用いた方が,汎用性は高 い。 表 7.3 10 分後に発生する落雷の予測結果
落雷予測モデル Re_ref_10min Re_all_10min NN_ref_10min NN_all_10min
真陽性率 0.747 0.794 0.805 0.839
適合率 0.190 0.193 0.117 0.109
F 値 0.303 0.310 0.205 0.193
落雷予測格子数 517273 461418 819861 819861
33 図 7.3 より,図 7.2 と同様に,いずれの落雷予測モデルを用いた場合も偏波情報の有無に より予測結果は大きく変わらない。 また,全結合型 NN を用いると,”落雷が発生する”と予測した面積は回帰式を用いたもの より大きくなっている。図 7.2 と比較しても,図 7.3 の方が”落雷が発生する”と予測した面 積は大きい。このことから,より未来の落雷を予測しようとすると,”落雷が発生する”と予 測しやすいことが確認できた。 2018/8/6 18:45 の Xrain データを用いて 10 分後の落雷位置を予測 図 7.3. 2018/8/6 18:55 に発生する落雷の位置を予測した結果 2
34
7.5 15 分後に発生する落雷の予測結果
本節では,15 分後に発生する落雷の予測を行う。
Re_ref_15min, Re_all_15min, NN_ref_15min, NN_all_15min を用いて,15 分後の落雷予 測を行った場合における真陽性率等を求めた。予測期間および範囲は表 7.1 の通りである。 予測結果を表 7.4 に示した。
また,Re_ref_15min, Re_all_15min, NN_ref_15min, NN_all_15min を用いて,15 分後の 落雷地点を予測した場合の一例を図 7.4 に示す。ただし,図 7.2, 7.3 と同様,関東圏全域を 予測した場合の結果を図として示す。 表 7.4 より,落雷予測モデルとして回帰式を用いた場合,真陽性率,適合率,F 値,AUC のいずれについても,偏波情報を使用した方が良い結果となっている。 しかし,落雷予測モデルとして全結合型 NN を用いた場合,表 7.3 と同様に,真陽性率と AUC は偏波情報を用いた方が良い結果であるが,適合率と F 値については偏波情報を用い ない方が良い結果となっている。 落雷予測格子数は,表 7.2, 7.3 と同様,全結合型 NN を用いた方が回帰式を用いた場合よ り多く,汎用性は高いことが確認できる。 また,表 7.2,7.3, 7.4 を見ると,未来の落雷を予測しようとするほど F 値が低下しており, 表 7.4 では回帰式を用いた場合においても F 値は 0.3 を下回っている。これは,未来を予測 しようとすると雲の移動予測が難しくなることが原因として挙がる。そのため,現在使用し ている雲の移動予測方法では,20 分以上後に発生する落雷の予測は非常に困難である。 表 7.4 15 分後に発生する落雷の予測結果
落雷予測モデル Re_ref_15min Re_all_15min NN_ref_15min NN_all_15min
真陽性率 0.722 0.781 0.677 0.755
適合率 0.157 0.159 0.117 0.109
F 値 0.258 0.265 0.200 0.191
落雷予測格子数 476103 424815 757883 757883
35 図 7.4 より,いずれの落雷予測モデルを使用しても,偏波情報の有無によって予測結果に 大きな差はみられない。 また,図 7.2, 7.3 と同様に,全結合型 NN を用いた予測結果は,回帰式を用いた予測結果 と比較して,”落雷が発生する”と予測した面積が大きいことが確認できる。 図 7.2, 7.3, 7.4 より,落雷予測モデルとして全結合型 NN を用いると,落雷の有無を予測 できる面積は大きくなるが,全体的に”落雷が発生する”と予測しやすい。このことから,汎 用性を求めるのであれば,落雷予測モデルには全結合型 NN を用いた方が良いが,適合率 の高い落雷予測を求める場合は,落雷予測モデルには回帰式を用いた方が良い 2018/8/6 18:40 の Xrain データを用いて 15 分後の落雷位置を予測 図 7.4. 2018/8/6 18:55 に発生する落雷の位置を予測した結果3
36
7.6 予測を行う格子の限定
落雷予測モデルとして全結合型 NN を用いる場合,落雷予測格子数は回帰式を用いた場 合より 1.5 倍以上多くなる。これは全結合型 NN を用いた落雷予測の汎用性を示している が,これにより回帰式を用いた場合の予測結果との比較が難しくなる。 本節では,落雷予測モデルとして回帰式を用いた場合に予測できる格子のみを対象とし て,全結合型 NN を用いて予測を行う。これにより,落雷予測格子数を同数とし,全結合型 NN を用いた落雷予測結果と回帰式を用いた落雷予測結果の比較を行う。7.6.1 5 分後に発生する落雷の予測結果
本節では,5 分後に発生する落雷の予測を行う。Re_ref_5min によって予測可能な格子のみを対象として,NN_ref_5min と NN_all_5min を用いて 5 分後の落雷予測を行った場合における予測結果を表 7.5 に示す。 ま た , Re_all_5min に よ っ て予 測 可 能な格 子 の み を 対 象と し て ,NN_ref_5min と NN_all_5min を用いて 5 分後の落雷予測を行った場合における予測結果を表 7.6 に示す。 ただし,いずれの場合も予測期間および範囲は表 7.1 の通りである。 表 7.5, 7.6 より,落雷予測モデルとして全結合型 NN を用いると,回帰式を用いた場合よ り,真陽性率は高く,適合率は低くなる。結果として F 値は,回帰式を用いた場合の方が高 くなるが,AUC についてはいずれの落雷予測モデルを用いた場合も同程度であるため,各 落雷予測モデルの判別能に大きな差はない。 表 7.5 5 分後に発生する落雷の予測結果 2 予測対象とする格子 Re_ref_5min によって予測可能な格子
落雷予測モデル Re_ref_5min NN_ref_5min NN_all_5min
真陽性率 0.764 0.829 0.833
適合率 0.220 0.169 0.176
F 値 0.342 0.281 0.291
37
表 7.7 10 分後に発生する落雷の予測結果 2
予測対象とする格子 Re_ref_10min によって予測可能な格子
落雷予測モデル Re_ref_10min NN_ref_10min NN_all_10min
真陽性率 0.747 0.883 0.903 適合率 0.190 0.122 0.114 F 値 0.303 0.214 0.203 AUC 0.846 0.826 0.823
7.6.2 10 分後に発生する落雷の予測結果
本節では,10 分後に発生する落雷の予測を行う。 Re_ref_10min に よ っ て 予 測 可 能 な 格 子 の み を 対 象 と し て , NN_ref_10min と NN_all_10min を用いて 10 分後の落雷予測を行った場合における予測結果を表 7.7 に示す。 また,Re_all_10min によって予測可能な格子のみを対象として ,NN_ref_10min と NN_all_10min を用いて 10 分後の落雷予測を行った場合における予測結果を表 7.8 に示す。 ただし,いずれの場合も予測期間および範囲は表 7.1 の通りである。 表 7.6 5 分後に発生する落雷の予測結果 3 予測対象とする格子 Re_all_5min によって予測可能な格子落雷予測モデル Re_all_5min NN_ref_5min NN_all_5min
真陽性率 0.794 0.836 0.841
適合率 0.225 0.170 0.177
F 値 0.351 0.283 0.292
38 表 7.7,7.8 より,全結合型 NN を用いた落雷予測は真陽性率が高く,適合率が低いことが 確認できる。これは,回帰式を用いた場合より,”落雷が発生する”という予測をしやすいこ とを示しており,結果として F 値は,回帰式を用いた場合を下回っている。 AUC は,回帰式を用いた場合の方が全結合型 NN を用いた場合より大きいが,その差は 僅かである。よって,各落雷予測モデルの判別能に大きな差はない。
7.6.3 15 分後に発生する落雷の予測結果
本節では,15 分後に発生する落雷の予測を行う。 Re_ref_15min に よ っ て 予 測 可 能 な 格 子 の み を 対 象 と し て , NN_ref_15min と NN_all_15min を用いて 15 分後の落雷予測を行った場合における予測結果を表 7.9 に示す。 ま た , Re_all_15min によ っ て予 測可 能な 格 子の み を対 象 とし て , NN_ref_15min と NN_all_15min を用いて 15 分後の落雷予測を行った場合における予測結果を表 7.10 に示 す。 表 7.9, 7.10 より,全結合型 NN を用いた落雷予測は真陽性率が高く,適合率が低い傾向 にある。これは,前節,前々節と同様の結果である。このことから,このような傾向は全結 合型 NN を落雷予測に用いた場合に共通することだと分かる。 表 7.8 10 分後に発生する落雷の予測結果 3 予測対象とする格子 Re_all_10min によって予測可能な格子落雷予測モデル Re_all_10min NN_ref_10min NN_all_10min
真陽性率 0.794 0.899 0.921
適合率 0.193 0.124 0.115
F 値 0.310 0.218 0.205
39
表 7.9 15 分後に発生する落雷の予測結果 2
予測対象とする格子 Re_ref_15min によって予測可能な格子
落雷予測モデル Re_ref_15min NN_ref_15min NN_all_15min
真陽性率 0.722 0.759 0.845 適合率 0.157 0.120 0.112 F 値 0.258 0.207 0.197 AUC 0.817 0.792 0.794 表 7.10 15 分後に発生する落雷の予測結果 3 予測対象とする格子 Re_all_15min によって予測可能な格子
落雷予測モデル Re_all_15min NN_ref_15min NN_all_15min
真陽性率 0.781 0.785 0.875
適合率 0.159 0.123 0.113
F 値 0.265 0.212 0.200
40
8. 結論
本稿では,従来の落雷予測では使用されていなかった,偏波情報を用いた落雷予測モデル の作成を行った。これにより,偏波情報を用いていない落雷予測モデルと予測精度の比較を 行い,偏波情報が落雷予測において重要な値であるかを確認した。 結果として,偏波情報を用いた落雷予測モデルは,用いなかったものと比べて,予測精度 が良いことが分かった。しかし,その差は僅かであり,偏波情報を用いなくとも落雷予測は 可能である。 偏波情報は,マルチパラメータレーダのような特殊な気象レーダでなくては得られない 情報である。よって,落雷予測において偏波情報はあまり有用ではないと考える。 また,落雷予測モデルの作成は,ロジスティック回帰分析と深層学習を用いた場合でそれ ぞれ行った。深層学習を用いた理由は,特定の XRAIN データに注目することなく,全ての XRAIN データを用いて解析を行うためである。 結果として,深層学習により作成した落雷予測モデルは,真陽性率は高いが適合率や AUC といった値がロジスティック回帰分析により作成した落雷予測モデルより低いことが確認 できた。このことから,深層学習を用いることで自身では気が付いていないが落雷予測にお いて重要な XRAIN データを解析対象とする,という試みは上手くいかなかった。 しかし,深層学習により作成した落雷予測モデルは,多くの格子を予測対象とすることが できた。よって,深層学習を用いることで,汎用性の高い落雷予測モデルを作成できたと考 える。41
9. 今後の課題
今後の課題として,移動量導出方法の改良が挙がる。移動量の導出を行う範囲や異常な移 動量の判別条件などは,検証を行って決定したものではない。そのため,最適な値や条件で はない。よって,移動予測精度が上がる条件を模索する必要がある。また,XRAIN の観測 間隔である 5 分の間に,新たに発生した雲をどのように扱うか,考える必要がある。 また,本稿では気象レーダによる観測値のみを用いて落雷予測モデルの作成を行ってい る。そこで今後の課題として,気象レーダによる観測値以外の情報を用いることが挙がる。 例えば,過去 5 分間で発生した落雷の情報や,雲間放電の有無など,LIDEN による情報を 用いることで,予測精度が向上すると考えている。42
謝辞
本論文を作成するにあたり,ご指導を頂きました本島邦行教授ならびに岩崎博之教授,研 究室の方々に心より感謝いたします。また,修士学位論文の主査を務めて頂いた山越芳樹教 授及び副査を務めていただいた三輪空司准教授に厚く御礼申し上げます。 さらに,本研究で用いた LIDEN データは防災科学技術研究所の清水慎吾博士から提供さ れました。XRAIN データは国土交通省より提供され,文部科学省の委託事業により開発・ 運用されているデータ統合解析システム(DIAS)の下で,収集・提供されたものです。また, XRAIN データの解析には,名古屋大学宇宙地球環境研究所提供の解析ソフトを利用させて 頂きました。関係各位に心より感謝いたします。43
参考文献
[1] 国土交通省 気象庁:「雷ナウキャスト」, https://www.jma.go.jp/jma/kishou/know/toppuu/thunder2-1.html [2] 国立研究開発法人防災科学技術研究所 水・土砂防災研究部門: 「X バンドマルチパラメータレーダ(MP レーダ)」, http://mp-radar.bosai.go.jp/index.html [3] 国土交通省 気象庁:「雷監視システム」, https://www.jma.go.jp/jma/kishou/know/toppuu/thunder1-2.html [4] 道本光一郎・柴村孝嗣:「冬季雷の気象学的特徴 と雷予知技術」, 電学論 B ,Vol.116,No.4,pp.431-437(1996)44
研究業績
本研究において筆者が作成した学会用発表原稿を末尾に記載する。学会発表
(1) 成田貴一, 本島邦行, 岩崎博之, “落雷検出におけるマルチパラメータレーダの有用性”, 第 10 回電気学会栃木・群馬支所合同研究発表会,ETG-20-56. ETT-20-56, 群馬県 群馬工業高等専門学校 2020/3/4, 2020/3/5 (2) 成田貴一, 本島邦行, 岩崎博之, “気象レーダを用いた落雷の短時間予測”, 第 11 回電気学会栃木・群馬支所合同研究発表会, 2021/3/1, 20203/2 (予定)落雷検出におけるマルチパラメータレーダの有用性
非会員
成田 貴一
*a)非会員
岩崎 博之
正 員本島 邦行
Usefulness of multi-parameter radar in lightning strike detection
Kiichi Narita*a), Non-member, Hiroyuki Iwasaki, Non-member, Kuniyuki Motojima, Member,
キーワード:X バンド MP レーダ, ロジスティック回帰分析
Keywords:X-band MP radar, Logistic regression analysis
1. まえがき 警察白書によると落雷による年間死数は年々減少してお り,2000-2009 における平均死傷者数は 3 人と非常に少なく なっている。これは落雷に関する危険と正しい知識が普及 したためだと考えるが,落雷による被害は人へ対するもの に限らない。落雷の影響は電気機器の類にも及び,サーバ等 への被害は無視できない。しかし雷雲の検出および落雷が 発生する危険性を予測できれば,落雷が発生する直前にサ ーバの電源を切る等の対策を行うことができる。そのため 本稿では,国土交通省が運用する XRAIN(eXtended RAdar Information Network)(1)より得られた降水強度や偏波情報を 用いた落雷予測を目指し,その第 1 段階として,観測された XRAIN データから落雷を伴う雷雲の検出アルゴリズムを作 製する。 XRAIN データからは,降水強度に対応するレーダ反射強 度(REF),降水粒子の形状の影響を反映する偏波間位相差変 化率(KDP)やレーダ反射因子差(ZDR)が得られる。そして, それらの情報から,降水粒子の種類(TPP)を推定している(2)。 REF を用いて雨雲が落雷を発生させるか予測する研究(3) はすでに行われているため,本稿の研究では REF のみから 雷雲の判定をする場合と REF の他に KDP,ZDR,TPP を雷 雲の判定に用いた場合の差を確認する。今回は KDP 等のデ ータが雷雲の検出に有用であるか確認することが目的であ る. 2. 使用データ 本研究では KDP,ZDR,TPP が雷雲の判定に有用かを判 定するために,次に示す XRAIN の測定データを用いる。ま た,落雷位置および時刻の解析には,気象庁雷監視システム (LIDEN)(4)で得られた測定データを用いる。 〈2・1〉 解析範囲と解析期間 関東域には 7 基の XRAIN レーダが存在し,それぞれが半径 60km の範囲を, 250m の空間分解能で,多仰角 PPI による 3 次元観測を 5 分 間隔で行っている(Fig. 1)。その 3 次元データを水平方向に 500m,鉛直方向に 250m の分解能で内挿し,解析に用いてい る。複数のレーダによる観測範囲が重複する範囲では,鉛直 方向の精度が高くなるため,本研究では 3 基のレーダによ る観測範囲が重複する領域を解析範囲とした。 解析期間は,2017 年 7~8 月である。 〈2・2〉 データの選抜 発雷条件の研究によると,- 10℃高度における REF(ref_m10)が 20dBZ に達しない,ある いは-10℃高度が 2km より低いと発雷は起こりにくいこと が分かっている(5)。本研究では夏期の雷雲を対象とするた め,後者の事例は存在しない。そのため,ref_m10 が 20dBZ 未満となる領域の降水データを除外することで,発雷の可 能性がある領域のみを解析対象とできる。
a) Correspondence to: [email protected]
* 群馬大学大学院理工学府
〒376-8515 群馬県桐生市天神町 1-5-1 Graduate School of Engineering, Gunma Universicy. 1-5-1, Tenjincho, Kiryu-shi, Gunma, Japan, 376-8515