• 検索結果がありません。

自己組織化マップを用いた鳥取県米子市の大気汚染物質濃度の特徴抽出と予測

N/A
N/A
Protected

Academic year: 2021

シェア "自己組織化マップを用いた鳥取県米子市の大気汚染物質濃度の特徴抽出と予測"

Copied!
10
0
0

読み込み中.... (全文を見る)

全文

(1)

[Original article]

(2020 年 月 日 Accepted)

自己

己組

組織

織化

化マ

マッ

ップ

プを

を用

用い

いた

た鳥

鳥取

取県

県米

米子

子市

市の

の大

大気

気汚

汚染

染物

物質

質濃

濃度

の特

特徴

徴抽

抽出

出と

と予

予測

宅野

将司

11

,権

権田

英功

22

,宮

宮田

仁志

2 1)米子工業高等専門学校・生産システム工学専攻 2)米子工業高等専門学校・電気情報工学科 要 要約約::大気汚染物質の発生機構は大陸からの越境汚染や都市・生活型の大気汚染,さらには気象データ にも依存する極めて複雑なものであるため,大気汚染物質の予測手法は現在も確立されていない.ま た,現在は数値モデルを用いたシミュレーションによる予測・解析が一般的だが高度な機器や専門知識 を要し,広域的な予測にとどまっているため,地方自治体による注意喚起には適していない.そこで本 論文では多次元データの解析手法の一つである自己組織化マップを用いた専門的な知識を必要とせず, 低コストで簡易的な時系列予測を検証した.実際に鳥取県米子市の大気汚染物質濃度と気象データを用 い自己組織化マップを作成し,大気汚染物質濃度の傾向の分析及び実用的な時系列濃度予測をすること で,より地域に密着した大気汚染物質濃度の予測を行った.また,鳥取県米子市以外のデータも加えて 予測を行い実測値と予測値を比較して評価を行った.その結果,データ数が最も少ない鳥取県米子市の みの場合の予測が最も予測精度が高くなり,鳥取県米子市周辺の地形と追加したデータ地点との距離に 原因があると考えた. キ キーーワワーードド::自己組織化マップ(SOM),大気汚染物質,時系列濃度予測,予測精度評価

Feature extraction and prediction using Self-Organizing Maps of Air pollutant

concentration in Yonago City, Tottori Prefecture

Masashi TAKUNO

1

, Eikou GONDA

2

, Hitoshi MIYATA

2

1)Department of Production System Engineering major, National Institute of Technology, Yonago College

2) Department of Electrical and Computer Engineering,National Institute of Technology, Yonago College

Abstract:The mechanism of the generation of air pollutants such as fine particulate matter is extremely complicated

because it depends on transboundary pollution from the continent, urban and living air pollution, and even mete-orological data. The prediction method has not been established yet. At present, prediction and analysis using sim-ulations with numerical models are common, but require advanced equipment and expertise, and are limited to wide-area predictions. Therefore, they are not suitable for alerting local governments. Therefore, establishment of a simple statistical prediction method is required. In this paper, we verified a low-cost and simple time series pre-diction without requiring technical knowledge using a self-organizing maps, which is one of the analysis methods of multidimensional data. By actually preparing a self-organizing maps using air pollutant concentration and me-teorological data in Yonago City, Tottori Prefecture, and analyzing the tendency of air pollutant concentration and predicting the practical time series concentration, the air pollutant concentration close to the region was predicted. And, the prediction was also carried out by adding the data except for Yonago City, Tottori Prefecture, and the evaluation became individual by comparing the measured value with the prediction value. As the result, the predic-tion accuracy in the case of only Yonago City in Tottori Prefecture with the smallest data number was the highest. As a conclusion, it was considered that there was a cause in the distance between landform around Yonago City in Tottori Prefecture and the point of the added data.

Keywords: Self-organizing maps (SOM), air pollutants, time series concentration prediction, prediction accuracy

evaluation

――――――――――――――――――――――――――――――――――――――――――――――――――

Eikou GONDA

Hikona 4448, Yonago, Tottori 683-8502, Japan

Phone: +81-859-24-5117, Email: [email protected]

(2)

1. は

はじ

じめ

めに

近年の日本において大気汚染は環境問題の一大テ ーマであり,大気汚染物質である微小粒子状物質 (PM2.5)や光化学オキシダントによる呼吸器官等への 健康被害も報告されていることから,私たちの生活に おいて大気汚染物質濃度情報の開示,また大気汚染物 質濃度予測の必要性が高まっている.これらの大気汚 染物質は日本の大都市圏を中心とした都市・生活型の 大気汚染のほかに,めざましい経済発展を遂げている アジア諸国からの越境汚染があり大気汚染物質の発 生機構を極めて複雑にしている. 現状の数値モデルを用いた予測手法は,膨大な調 査・高度な科学知識を要する.具体的には,経済産業 省が開発した低煙源向上拡散モデル(Ministry of Econ-omy,Tradeand Industry-Lowrise Industrial Source dispersion Model:METI-LIS モデル)の場合,煙突や排気口といっ た点煙源からの排出をモデル化するために,定常一様 状態を仮定したガウス型プルーム式を基本としてお り,その中で浮力等による上昇のない煙源や建物によ るダウンウォッシュ・煙源高さ補正のモデルなど幾つ もの過程・計算が必要とされる[1].この他に国立環境 研究所が提供するVENUS(Visual atmospheric Environ-ment Utility System)の場合,気象計算と大気汚染計算の 2 つのサブシステムで構成されている.気象計算シス テムは,気象庁の数値予報データを基に,翌日までの 風,気温,気圧,水蒸気量等を計算する.続いてそれ らの気象データを基に,大気汚染計算システムで光化 学オキシダント,硫酸塩エアロゾル,微小粒子状物質 の濃度を計算する.その際,大気汚染発生量データを 用い,反応・輸送・拡散・地表面等への沈着などの効 果を含めて計算する[2].また,日本気象協会(tenki.jp)の システムでは,一般環境大気測定局と自動車排出ガス 測定局の2 種類の測定値を用いている[3].しかし現時 点のPM2.5 分布予測情報は,東アジアスケールで定性 的に予測する精度はあるが,都市スケールの精度や時 系列予測等の定量的な精度に関しては不十分である. そこで,高度な知識を必要とせず,地方自治体等でも 新たな資金投入なしに適用できる手法として自己組 織化マップを用いた予測を検証した. 自己組織化マップの特徴はn 次元のベクトル集団を 学習することにより,2 次元マップにそれらのベクト ル関係を写像することができることである.似ている ベクトルは2 次元マップ上の近い位置に配置され,似 ていないベクトルは遠い位置に配置される[4]. 現状として,鳥取県では,その日1日の活動に備え, PM2.5 の予測濃度に応じて情報を提供し,注意・警戒 情報の発令を行っている.午前の早い段階で,環境基 準超過(35μg/m3)等が予測される場合は,その旨を情 報提供している.午後からの活動に備えた注意喚起は, 発令の基準となる濃度が高い(70,80μg/m3)ことから ほとんど発令することがなく,大半は午前の情報提供 となっている.PM2.5 は目視では確認することが不可 能であり,時系列予測による細かな情報提供を行うこ とにより,住民への意識啓発や,PM2.5 濃度や各個人 に応じた対策(マスク着用や,不要不急な外出を控え ることによる吸引防止等)が自発的にとられることが 望まれる. 自己組織化マップは汎用性に優れ,予測の他に認識, 分類など様々な分野への応用が可能である.その機能 を応用し,午前12 時間の実測値データを用いて,午後 の毎時の大気汚染物質濃度を予測した.さらに米子市 の大気汚染物質濃度のSOM から視覚的に傾向の分析 を行った.大気汚染物質濃度の予測と同様に専門知識 を必要とせずにビッグデータの分析を行うことがで き,大気汚染メカニズム解析の補助的な働きが期待で きる. また,今回使用した鳥取県米子市の大気汚染データ は鳥取県衛生環境研究所から提供頂き,気象データは 気象庁から引用した.

2. 自

自己

己組

組織

織化

化マ

マッ

ップ

プに

につ

つい

いて

自己組織化マップ(Self-Organizing-Maps,SOM)は,コ ンピュータの情報処理方法の1 つ”ニューラルネット ワークの一種である.Kohonen は,生物の神経細胞, 主として脳の情報処理の仕方を次の式(1)のように表 現した. 𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡 + 1) = 𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡) + 𝒉𝒉𝒉𝒉𝑐𝑐𝑐𝑐𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡)[𝒙𝒙𝒙𝒙 − 𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡)] (1) いま神経細胞(以下ユニットと呼ぶ)i が時刻t で処 理している情報処理能力を𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡)とするとき,外部か ら入力信号𝒙𝒙𝒙𝒙が入る.すると細胞は,この入力信号を学 習して次の時刻には入力信号により近い情報処理能 力𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡 + 1)を持つようになる.このとき𝒙𝒙𝒙𝒙がn 次元の 入力ベクトルであれば,参照ベクトル(過去実測値デ ータベース)とも呼ばれるユニット𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡)は同じ n 次 元の要素を持つ.なお,𝒉𝒉𝒉𝒉𝑐𝑐𝑐𝑐𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡)は学習率係数を含めた 近傍関数であり,t=0,1,2, …は離散時間座標である. 図1 に自己組織化マップの構造を示す.その構造は 入力層と出力(競合)層の2 層構造となっている.第 1 層はn 次元の入力層𝒙𝒙𝒙𝒙であり,第2 層は出力を視覚的 に把握するため,普通2 次元に配列されている.第 2 層の競合層のベクトルは参照ベクトル𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡)で表され, 入力層の次元に合わせてn 個の要素を持っている.出 力層の2 次元マップに入力層のn 次元ベクトルを学習 させると類似性の高いユニットが集まり,クラスタリ ングされる.これにより,出力層の参照ベクトルは多 次元入力データのベクトルを保持し2 次元として表示 される. 学習は次のように行われる.まず入力信号が提示さ れると,式(2)を満たす参照ベクトル𝒎𝒎𝒎𝒎𝑐𝑐𝑐𝑐(𝑡𝑡𝑡𝑡)を持つ勝者 ユニットが選ばれる.学習に用いる測度は通常,ユー クリッド距離が使用される.つまり,入力値との差が 最小のものが出力として決定される. |𝒙𝒙𝒙𝒙 𝒙 𝒎𝒎𝒎𝒎𝑐𝑐𝑐𝑐(𝑡𝑡𝑡𝑡)| = min|𝒙𝒙𝒙𝒙 𝒙 𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(t)| (2) 自己組織化マップ(SOM)は多次元のデータを 2次元平面に写像することで,データの構造や傾 向,分類,意味づけといったものが見る者に分か りやすくなる[5]. そして,勝者の周囲に近傍領域が定義される.その 形は六角形が一般的である.この近傍内の全てのユニ ットは式(1)にしたがって入力ベクトルを学習し,入力 ベクトルの方向へさらに近づく学習を繰り返し行う. つまり,学習の回数が多ければ多いほどユニット関係 が綿密になる. 以前までは2 次元マップ上に写像する平面 SOM を 用いていたが,各ノードの位置関係が分かりにくいこ とや解析機能が導入されたことから新たに開発され た球面SOM を用いて検証を行った. SOM の基本的な考え方としてノードの配置は基本 的自由であり,平面や長方形にとらわれるものではな い.そこで,3 次元立体のSOM として球面SOM が開 発された.これより,球面SOM の利点として従来の 平面SOM よりノード間の関係が得やすいことが挙げ られる[6][7]. また,類似した研究に機械学習(SVR)を用いた気象 予測がある.この研究は日本国内の局所的な地点の気 温・降水量等の時系列予測を行っており,かなりの高 精度で予測が行えている[8].SOM との相違点はマッ ピングが出来ない点である.SOM は予測が行え,かつ マッピングすることにより,データの関係性を視覚的 に把握することができる.これにより,SOM へ学習さ せたデータがどのように予測に作用しているのかが 明確になる.一方,他の機械学習ではこのようなこと が不可能である.これがSOM の特長だと言える. 図1 SOM の概念図

3. 球

球面

SOM に

によ

よる

る予

予測

測精

精度

度の

の検

検証

3.1 SOM を用いた予測手順 本予測手法は,過去の大気汚染物質の観測データを 基に,SOM を用いて各大気汚染物質の濃度を予測する ものである.鳥取県米子市の2014 年度~2016 年度の 大気汚染物質及び気象データの観測データを用いて SOM を作成する.図2 のように,このSOM と予測日 午前1 時~12 時の実測値を用いて午後 1 時~12 時の 濃度予測を行う.SOM に学習させるデータは 1 時間 ごと(1 時~24 時)に観測されており,環境基準が設け てある.環境基準とは人の健康の保護及び生活環境の 保全のうえで維持されることが望ましい基準である. それをもとに鳥取県が注意・警戒情報の発令を行って いる. 図2 は予測手法の概要図である.

(3)

1. は

はじ

じめ

めに

近年の日本において大気汚染は環境問題の一大テ ーマであり,大気汚染物質である微小粒子状物質 (PM2.5)や光化学オキシダントによる呼吸器官等への 健康被害も報告されていることから,私たちの生活に おいて大気汚染物質濃度情報の開示,また大気汚染物 質濃度予測の必要性が高まっている.これらの大気汚 染物質は日本の大都市圏を中心とした都市・生活型の 大気汚染のほかに,めざましい経済発展を遂げている アジア諸国からの越境汚染があり大気汚染物質の発 生機構を極めて複雑にしている. 現状の数値モデルを用いた予測手法は,膨大な調 査・高度な科学知識を要する.具体的には,経済産業 省が開発した低煙源向上拡散モデル(Ministry of Econ-omy,Tradeand Industry-Lowrise Industrial Source dispersion Model:METI-LIS モデル)の場合,煙突や排気口といっ た点煙源からの排出をモデル化するために,定常一様 状態を仮定したガウス型プルーム式を基本としてお り,その中で浮力等による上昇のない煙源や建物によ るダウンウォッシュ・煙源高さ補正のモデルなど幾つ もの過程・計算が必要とされる[1].この他に国立環境 研究所が提供するVENUS(Visual atmospheric Environ-ment Utility System)の場合,気象計算と大気汚染計算の 2 つのサブシステムで構成されている.気象計算シス テムは,気象庁の数値予報データを基に,翌日までの 風,気温,気圧,水蒸気量等を計算する.続いてそれ らの気象データを基に,大気汚染計算システムで光化 学オキシダント,硫酸塩エアロゾル,微小粒子状物質 の濃度を計算する.その際,大気汚染発生量データを 用い,反応・輸送・拡散・地表面等への沈着などの効 果を含めて計算する[2].また,日本気象協会(tenki.jp)の システムでは,一般環境大気測定局と自動車排出ガス 測定局の2 種類の測定値を用いている[3].しかし現時 点のPM2.5 分布予測情報は,東アジアスケールで定性 的に予測する精度はあるが,都市スケールの精度や時 系列予測等の定量的な精度に関しては不十分である. そこで,高度な知識を必要とせず,地方自治体等でも 新たな資金投入なしに適用できる手法として自己組 織化マップを用いた予測を検証した. 自己組織化マップの特徴はn 次元のベクトル集団を 学習することにより,2 次元マップにそれらのベクト ル関係を写像することができることである.似ている ベクトルは2 次元マップ上の近い位置に配置され,似 ていないベクトルは遠い位置に配置される[4]. 現状として,鳥取県では,その日1日の活動に備え, PM2.5 の予測濃度に応じて情報を提供し,注意・警戒 情報の発令を行っている.午前の早い段階で,環境基 準超過(35μg/m3)等が予測される場合は,その旨を情 報提供している.午後からの活動に備えた注意喚起は, 発令の基準となる濃度が高い(70,80μg/m3)ことから ほとんど発令することがなく,大半は午前の情報提供 となっている.PM2.5 は目視では確認することが不可 能であり,時系列予測による細かな情報提供を行うこ とにより,住民への意識啓発や,PM2.5 濃度や各個人 に応じた対策(マスク着用や,不要不急な外出を控え ることによる吸引防止等)が自発的にとられることが 望まれる. 自己組織化マップは汎用性に優れ,予測の他に認識, 分類など様々な分野への応用が可能である.その機能 を応用し,午前12 時間の実測値データを用いて,午後 の毎時の大気汚染物質濃度を予測した.さらに米子市 の大気汚染物質濃度のSOM から視覚的に傾向の分析 を行った.大気汚染物質濃度の予測と同様に専門知識 を必要とせずにビッグデータの分析を行うことがで き,大気汚染メカニズム解析の補助的な働きが期待で きる. また,今回使用した鳥取県米子市の大気汚染データ は鳥取県衛生環境研究所から提供頂き,気象データは 気象庁から引用した.

2. 自

自己

己組

組織

織化

化マ

マッ

ップ

プに

につ

つい

いて

自己組織化マップ(Self-Organizing-Maps,SOM)は,コ ンピュータの情報処理方法の1 つ”ニューラルネット ワークの一種である.Kohonen は,生物の神経細胞, 主として脳の情報処理の仕方を次の式(1)のように表 現した. 𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡 + 1) = 𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡) + 𝒉𝒉𝒉𝒉𝑐𝑐𝑐𝑐𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡)[𝒙𝒙𝒙𝒙 − 𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡)] (1) いま神経細胞(以下ユニットと呼ぶ)i が時刻t で処 理している情報処理能力を𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡)とするとき,外部か ら入力信号𝒙𝒙𝒙𝒙が入る.すると細胞は,この入力信号を学 習して次の時刻には入力信号により近い情報処理能 力𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡 + 1)を持つようになる.このとき𝒙𝒙𝒙𝒙がn 次元の 入力ベクトルであれば,参照ベクトル(過去実測値デ ータベース)とも呼ばれるユニット𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡)は同じ n 次 元の要素を持つ.なお,𝒉𝒉𝒉𝒉𝑐𝑐𝑐𝑐𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡)は学習率係数を含めた 近傍関数であり,t=0,1,2, …は離散時間座標である. 図1 に自己組織化マップの構造を示す.その構造は 入力層と出力(競合)層の2 層構造となっている.第 1 層はn 次元の入力層𝒙𝒙𝒙𝒙であり,第2 層は出力を視覚的 に把握するため,普通2 次元に配列されている.第 2 層の競合層のベクトルは参照ベクトル𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(𝑡𝑡𝑡𝑡)で表され, 入力層の次元に合わせてn 個の要素を持っている.出 力層の2 次元マップに入力層のn 次元ベクトルを学習 させると類似性の高いユニットが集まり,クラスタリ ングされる.これにより,出力層の参照ベクトルは多 次元入力データのベクトルを保持し2 次元として表示 される. 学習は次のように行われる.まず入力信号が提示さ れると,式(2)を満たす参照ベクトル𝒎𝒎𝒎𝒎𝑐𝑐𝑐𝑐(𝑡𝑡𝑡𝑡)を持つ勝者 ユニットが選ばれる.学習に用いる測度は通常,ユー クリッド距離が使用される.つまり,入力値との差が 最小のものが出力として決定される. |𝒙𝒙𝒙𝒙 𝒙 𝒎𝒎𝒎𝒎𝑐𝑐𝑐𝑐(𝑡𝑡𝑡𝑡)| = min|𝒙𝒙𝒙𝒙 𝒙 𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖(t)| (2) 自己組織化マップ(SOM)は多次元のデータを 2次元平面に写像することで,データの構造や傾 向,分類,意味づけといったものが見る者に分か りやすくなる[5]. そして,勝者の周囲に近傍領域が定義される.その 形は六角形が一般的である.この近傍内の全てのユニ ットは式(1)にしたがって入力ベクトルを学習し,入力 ベクトルの方向へさらに近づく学習を繰り返し行う. つまり,学習の回数が多ければ多いほどユニット関係 が綿密になる. 以前までは2 次元マップ上に写像する平面 SOM を 用いていたが,各ノードの位置関係が分かりにくいこ とや解析機能が導入されたことから新たに開発され た球面SOM を用いて検証を行った. SOM の基本的な考え方としてノードの配置は基本 的自由であり,平面や長方形にとらわれるものではな い.そこで,3 次元立体のSOM として球面SOM が開 発された.これより,球面SOM の利点として従来の 平面SOM よりノード間の関係が得やすいことが挙げ られる[6][7]. また,類似した研究に機械学習(SVR)を用いた気象 予測がある.この研究は日本国内の局所的な地点の気 温・降水量等の時系列予測を行っており,かなりの高 精度で予測が行えている[8].SOM との相違点はマッ ピングが出来ない点である.SOM は予測が行え,かつ マッピングすることにより,データの関係性を視覚的 に把握することができる.これにより,SOM へ学習さ せたデータがどのように予測に作用しているのかが 明確になる.一方,他の機械学習ではこのようなこと が不可能である.これがSOM の特長だと言える. 図1 SOM の概念図

3. 球

球面

SOM に

によ

よる

る予

予測

測精

精度

度の

の検

検証

3.1 SOM を用いた予測手順 本予測手法は,過去の大気汚染物質の観測データを 基に,SOM を用いて各大気汚染物質の濃度を予測する ものである.鳥取県米子市の2014 年度~2016 年度の 大気汚染物質及び気象データの観測データを用いて SOM を作成する.図2 のように,このSOM と予測日 午前1 時~12 時の実測値を用いて午後 1 時~12 時の 濃度予測を行う.SOM に学習させるデータは 1 時間 ごと(1 時~24 時)に観測されており,環境基準が設け てある.環境基準とは人の健康の保護及び生活環境の 保全のうえで維持されることが望ましい基準である. それをもとに鳥取県が注意・警戒情報の発令を行って いる. 図2 は予測手法の概要図である.

(4)

図2 自己組織化マップによる予測手法 ここで自己組織化マップは数値の大きな要素に依 存してしまう性質がある.そのため,SOM を作成する 際 に 用 い る 実 測 値 デ ー タ 𝒆𝒆𝒆𝒆𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗= (𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,1, 𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,2⋯ , 𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,24) の全てを対象に正規化 𝑒𝑒𝑒𝑒𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑑𝑑𝑑𝑑𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛を行い0~+1の範囲に収める.添え字“day” は日付,“j”は時刻とする.2 年間を通して日付毎の 関連性を高めることを目的に,次元(項目・物質)毎 で2 年間全てのデータに対し,最大値と最小値を決定 し,式(3)に基づいて正規化を行った[9][10].以降,正 規化したものを実測値データ𝒆𝒆𝒆𝒆𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗として扱う. 𝑒𝑒𝑒𝑒𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑑𝑑𝑑𝑑𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗=𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗− 𝑒𝑒𝑒𝑒𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛 𝑛𝑛𝑛𝑛𝑑𝑑𝑑𝑑𝑚𝑚𝑚𝑚− 𝑒𝑒𝑒𝑒𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛 (3) 予測手法は図3 のように行う.ある日の予測に使用す る実測値データ𝒆𝒆𝒆𝒆𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗𝑗1,⋯,12SOM の各ユニットベ クトル𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗𝑗1,⋯,24 = (𝑚𝑚𝑚𝑚𝑖𝑖𝑖𝑖,1, 𝑚𝑚𝑚𝑚𝑖𝑖𝑖𝑖,2, 𝑚𝑚𝑚𝑚𝑖𝑖𝑖𝑖,3, … , 𝑚𝑚𝑚𝑚𝑖𝑖𝑖𝑖,24) の午 前1時~12時の各項目𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗𝑗1,⋯,12のユークリッド距離 𝑑𝑑𝑑𝑑(𝑖𝑖𝑖𝑖)を算出する.添え字“i”はユニットベクトルナン バーとする.距離の最小値を𝑑𝑑𝑑𝑑𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛とし,該当ユニット ベクトルをベストマッチングユニット(BMU) ,その午 後1 時~12 時𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗𝑗13,⋯,24を予測値とする. また,予測に使用する実測値データはSOM に入力 するデータから取り出す.これはSOM の入力データ に予測に使用する実測値データを含めてしまうと, SOM の各ユニットベクトルに反映されてしまい,予測 値と実測値が完全に一致してしまうためである. 図3 予測プログラムのフローチャート 3.2 SOM を用いた予測と考察 項目は二酸化硫黄濃度(ppb),二酸化窒素濃度(ppb), オキシダント濃度(ppb),浮遊粒子状物質濃度(µg/m3), 微小粒子状物質(PM2.5)濃度(µg/m3)の大気汚染物質 5 種と風向(16 方向),風速(0.1m/s),気温(℃),気圧(hPa), 湿度(%),降水量(mm) ,日照時間の気象データ7 種を 加えた.検証は大気汚染物質5 種と風向(16 方向)と風 速(0.1m/s)の合計 7 個の項目と全ての大気汚染物質と 気象データを含めた合計12 種の場合で行った.予測 に使用する実測値データは2016 年度のデータ中から 50 日間を無作為に選んだものを使用した.予測する項 目はオキシダント濃度(ppb),浮遊粒子状物質濃度 (µg/m3),微小粒子状物質(PM2.5)濃度(µg/m3)とし,その 実測値と予測値の近似度を相関係数とχ 二乗検定の 2 つの指標から見出し,SOM に学習させるデータ量によ る予測精度の検証を行った. 相関係数は予測値と実測値のグラフの変化の近似 度を示す指標であり,-1~+1 で表され-1 に近いほど変 化が逆(負の相関),+1に近いほど変化が同じ(正の相関) となり,0 に近いほど相関がなくなる.しかし,予測 値と実測値に差がある場合でも変化が近似している と相関係数が+1 に近づく.この問題点を解決するため にχ 二乗検定を導入した.χ 二乗検定は毎時(午後 1 時 ~12 時)の予測値と実測値の差を総合的に示す指標で ある. 𝒆𝒆𝒆𝒆𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 ,𝑗𝑗𝑗𝑗𝑗1,⋯ ,12と𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗𝑗1,⋯ ,12を用意 𝑑𝑑𝑑𝑑 𝑖𝑖𝑖𝑖 = � (𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 ,𝑗𝑗𝑗𝑗− 𝑚𝑚𝑚𝑚𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗)2 12 𝑗𝑗𝑗𝑗 𝑗1 𝑑𝑑𝑑𝑑 𝑖𝑖𝑖𝑖 < 𝑑𝑑𝑑𝑑𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛 𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗→MU 𝑑𝑑𝑑𝑑 𝑖𝑖𝑖𝑖 → 𝑑𝑑𝑑𝑑𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛 𝑖𝑖𝑖𝑖 = 𝑖𝑖𝑖𝑖 + 1 MU→BMU BMUの𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗𝑗13 ,⋯,24を 午後の予測値とする 実測値𝒆𝒆𝒆𝒆𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗𝑗13,14,…,24,予測値𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗𝑗13,…,24とすると 検定統計量𝜒𝜒𝜒𝜒2は式(4)となる. 𝜒𝜒𝜒𝜒2= �(𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗− 𝑚𝑚𝑚𝑚𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗)2 𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗 24 𝑗𝑗𝑗𝑗𝑗13 (4) これより, 検定統計量𝜒𝜒𝜒𝜒2が小さいほど予測精度が 高くなる.これらの2 つの指標から予測精度を検証し た.今回は予測日50 日間の平均値で評価した. 図4 SOM の学習データ量の増加前後の 相関係数 図5 SOM の学習データ量の増加前後の

検定統計量

4・5 より,オキシダントは両方の値ともほとんど 変化がない. 一方,浮遊粒子状物質は相関係数がかな り悪化している.微小粒子状物質は浮遊粒子状物質と 対照的に相関係数が良化している.検定統計量は2 つ ともほとんど変わっていない. これらの結果からSOM の学習データ増加による予 測精度は全体的には改善されたとは言えない. SOM の性質上, SOM の学習データ量によって関係 性の強弱が決定されるので,データが多いほど分類が 綿密にでき,予測精度も上がるはずだが,今回の検証 ではデータを増やしたのにも関わらず予測の精度が 上がったとは考えられない項目があった. 原因として,SOM に学習させるデータの欠落があっ たため,正確な分類が出来なかったと考えられる.入 力データは各物質の量が1 時間ごとに配列されたもの が使われるが,観測所の機器が故障やメンテナンス等 を行う際の値は“x ”となっており,値自体は存在し ない.しかし,SOM は存在しない値“x ”を“0”と して扱い学習を行うので不完全なSOM が出来たてし まったと考えられる.今回,使用したデータには存在 しないデータ“x ”が学習データ305280 個中2790 個 (0.91%)混入していたので,この様な結果になったと考 えられる. 今後,予測精度の改善を図るにあたって,先決すべ き課題は存在しないデータ“x”の削除である.これに より,正確な分類が可能となり,予測精度が改善され ると考えられる.また,相関係数とχ 二乗検定を活用 することで予測精度の変動の原因を究明できると考 える.

4. SOM の

の学

学習

習デ

デー

ータ

タの

の欠

欠落

落デ

デー

ータ

タの

削除

除に

によ

よる

る予

予測

測精

精度

度の

の改

改善

図4・5 の結果より,SOM に学習させるデータに欠 落があり,それによって予測精度が下がっていると考 え,欠落データを全て削除し,予測を行った.学習デ ータは米子保健所の2014 年4 月1 日~2017 年3 月31 日の二酸化硫黄,二酸化窒素,オキシダント,浮遊粒 子状物質,微小粒子状物質,風向,風速,気温,気圧, 湿度,降水量,日照時間で行った.

(5)

図2 自己組織化マップによる予測手法 ここで自己組織化マップは数値の大きな要素に依 存してしまう性質がある.そのため,SOM を作成する 際 に 用 い る 実 測 値 デ ー タ 𝒆𝒆𝒆𝒆𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗 = (𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,1, 𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,2⋯ , 𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,24) の全てを対象に正規化 𝑒𝑒𝑒𝑒𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑑𝑑𝑑𝑑𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛を行い0~+1の範囲に収める.添え字“day” は日付,“j”は時刻とする.2 年間を通して日付毎の 関連性を高めることを目的に,次元(項目・物質)毎 で2 年間全てのデータに対し,最大値と最小値を決定 し,式(3)に基づいて正規化を行った[9][10].以降,正 規化したものを実測値データ𝒆𝒆𝒆𝒆𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗として扱う. 𝑒𝑒𝑒𝑒𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑑𝑑𝑑𝑑𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗=𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗− 𝑒𝑒𝑒𝑒𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛 𝑛𝑛𝑛𝑛𝑑𝑑𝑑𝑑𝑚𝑚𝑚𝑚− 𝑒𝑒𝑒𝑒𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛 (3) 予測手法は図3 のように行う.ある日の予測に使用す る実測値データ𝒆𝒆𝒆𝒆𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗𝑗1,⋯,12SOM の各ユニットベ クトル𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗𝑗1,⋯,24= (𝑚𝑚𝑚𝑚𝑖𝑖𝑖𝑖,1, 𝑚𝑚𝑚𝑚𝑖𝑖𝑖𝑖,2, 𝑚𝑚𝑚𝑚𝑖𝑖𝑖𝑖,3, … , 𝑚𝑚𝑚𝑚𝑖𝑖𝑖𝑖,24) の午 前1時~12時の各項目𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗𝑗1,⋯,12のユークリッド距離 𝑑𝑑𝑑𝑑(𝑖𝑖𝑖𝑖)を算出する.添え字“i”はユニットベクトルナン バーとする.距離の最小値を𝑑𝑑𝑑𝑑𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛とし,該当ユニット ベクトルをベストマッチングユニット(BMU) ,その午 後1 時~12 時𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗𝑗13,⋯,24を予測値とする. また,予測に使用する実測値データはSOM に入力 するデータから取り出す.これはSOM の入力データ に予測に使用する実測値データを含めてしまうと, SOM の各ユニットベクトルに反映されてしまい,予測 値と実測値が完全に一致してしまうためである. 図3 予測プログラムのフローチャート 3.2 SOM を用いた予測と考察 項目は二酸化硫黄濃度(ppb),二酸化窒素濃度(ppb), オキシダント濃度(ppb),浮遊粒子状物質濃度(µg/m3), 微小粒子状物質(PM2.5)濃度(µg/m3)の大気汚染物質 5 種と風向(16 方向),風速(0.1m/s),気温(℃),気圧(hPa), 湿度(%),降水量(mm) ,日照時間の気象データ7 種を 加えた.検証は大気汚染物質5 種と風向(16 方向)と風 速(0.1m/s)の合計 7 個の項目と全ての大気汚染物質と 気象データを含めた合計12 種の場合で行った.予測 に使用する実測値データは2016 年度のデータ中から 50 日間を無作為に選んだものを使用した.予測する項 目はオキシダント濃度(ppb),浮遊粒子状物質濃度 (µg/m3),微小粒子状物質(PM2.5)濃度(µg/m3)とし,その 実測値と予測値の近似度を相関係数とχ 二乗検定の 2 つの指標から見出し,SOM に学習させるデータ量によ る予測精度の検証を行った. 相関係数は予測値と実測値のグラフの変化の近似 度を示す指標であり,-1~+1 で表され-1 に近いほど変 化が逆(負の相関),+1に近いほど変化が同じ(正の相関) となり,0 に近いほど相関がなくなる.しかし,予測 値と実測値に差がある場合でも変化が近似している と相関係数が+1 に近づく.この問題点を解決するため にχ 二乗検定を導入した.χ 二乗検定は毎時(午後 1 時 ~12 時)の予測値と実測値の差を総合的に示す指標で ある. 𝒆𝒆𝒆𝒆𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 ,𝑗𝑗𝑗𝑗𝑗1,⋯ ,12と𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗𝑗1,⋯ ,12を用意 𝑑𝑑𝑑𝑑 𝑖𝑖𝑖𝑖 = � (𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 ,𝑗𝑗𝑗𝑗− 𝑚𝑚𝑚𝑚𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗)2 12 𝑗𝑗𝑗𝑗 𝑗1 𝑑𝑑𝑑𝑑 𝑖𝑖𝑖𝑖 < 𝑑𝑑𝑑𝑑𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛 𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗→MU 𝑑𝑑𝑑𝑑 𝑖𝑖𝑖𝑖 → 𝑑𝑑𝑑𝑑𝑛𝑛𝑛𝑛𝑖𝑖𝑖𝑖𝑛𝑛𝑛𝑛 𝑖𝑖𝑖𝑖 = 𝑖𝑖𝑖𝑖 + 1 MU→BMU BMUの𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗𝑗13 ,⋯,24を 午後の予測値とする 実測値𝒆𝒆𝒆𝒆𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗𝑗13,14,…,24,予測値𝒎𝒎𝒎𝒎𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗𝑗13,…,24とすると 検定統計量𝜒𝜒𝜒𝜒2は式(4)となる. 𝜒𝜒𝜒𝜒2= � (𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗− 𝑚𝑚𝑚𝑚𝑖𝑖𝑖𝑖,𝑗𝑗𝑗𝑗)2 𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑,𝑗𝑗𝑗𝑗 24 𝑗𝑗𝑗𝑗𝑗13 (4) これより, 検定統計量𝜒𝜒𝜒𝜒2が小さいほど予測精度が 高くなる.これらの2 つの指標から予測精度を検証し た.今回は予測日50 日間の平均値で評価した. 図4 SOM の学習データ量の増加前後の 相関係数 図5 SOM の学習データ量の増加前後の

検定統計量

4・5 より,オキシダントは両方の値ともほとんど 変化がない. 一方,浮遊粒子状物質は相関係数がかな り悪化している.微小粒子状物質は浮遊粒子状物質と 対照的に相関係数が良化している.検定統計量は2 つ ともほとんど変わっていない. これらの結果からSOM の学習データ増加による予 測精度は全体的には改善されたとは言えない. SOM の性質上, SOM の学習データ量によって関係 性の強弱が決定されるので,データが多いほど分類が 綿密にでき,予測精度も上がるはずだが,今回の検証 ではデータを増やしたのにも関わらず予測の精度が 上がったとは考えられない項目があった. 原因として,SOM に学習させるデータの欠落があっ たため,正確な分類が出来なかったと考えられる.入 力データは各物質の量が1 時間ごとに配列されたもの が使われるが,観測所の機器が故障やメンテナンス等 を行う際の値は“x ”となっており,値自体は存在し ない.しかし,SOM は存在しない値“x ”を“0”と して扱い学習を行うので不完全なSOM が出来たてし まったと考えられる.今回,使用したデータには存在 しないデータ“x ”が学習データ305280 個中2790 個 (0.91%)混入していたので,この様な結果になったと考 えられる. 今後,予測精度の改善を図るにあたって,先決すべ き課題は存在しないデータ“x”の削除である.これに より,正確な分類が可能となり,予測精度が改善され ると考えられる.また,相関係数とχ 二乗検定を活用 することで予測精度の変動の原因を究明できると考 える.

4. SOM の

の学

学習

習デ

デー

ータ

タの

の欠

欠落

落デ

デー

ータ

タの

削除

除に

によ

よる

る予

予測

測精

精度

度の

の改

改善

図4・5 の結果より,SOM に学習させるデータに欠 落があり,それによって予測精度が下がっていると考 え,欠落データを全て削除し,予測を行った.学習デ ータは米子保健所の2014 年4 月1 日~2017 年3 月31 日の二酸化硫黄,二酸化窒素,オキシダント,浮遊粒 子状物質,微小粒子状物質,風向,風速,気温,気圧, 湿度,降水量,日照時間で行った.

(6)

図6 SOM の欠落データの削除前後の 相関係数 図7 SOM の欠落データの削除前後の 検定統計量 図6・7 より,オキシダントと浮遊粒子状物質に関し ては変化が小さく欠落データの削除による影響が小 さいと考えられるが,微小粒子状物質はかなり改善さ れていることが分かる.微小粒子状物質は大気汚染物 質の中でも最も重要な物質なので欠落データを削除 する手法を正規の手法とした.

5. 国

国内

内外

外デ

デー

ータ

タの

の追

追加

加に

によ

よる

る予

予測

測精

精度

度の

検証

証と

とデ

デー

ータ

タの

の相

相関

関性

性の

の変

変化

5.1 国内外データの追加による予測精度の検証 日本における大気汚染の主要因は中国大陸からの 越境汚染である.中国主要都市で発生した大気汚染物 質が偏西風に乗り,日本海を渡り日本に飛散する.こ れより,日本国内のデータのみで予測を行うより偏西 風の通り道である島根県松江市や中国,韓国のデータ を追加することで米子市に飛散する以前の大気汚染 物質の状況がSOM に反映され,予測精度が高まると 考え検証を行った. また,松江市は大気汚染物質データがなく気象デー タのみで中国や韓国は微小粒子状物質データのみ得 られた.検証は米子市のデータをベースに各々のデー タ加えた全てのパターンを検証した. 今回使用した北京とソウルの微小粒子状物質デー タと松江市の気象データは気象庁から引用した. 図8 データ追加地点ごとの相関係数 図9 データ追加地点ごとの

検定統計量

8・9 より,米子市のみが一番予測精度が良く,デ ータを加えるほど予測精度が悪くなった.原因として はデータの追加地点の距離が米子市と遠すぎたこと, 米子市周辺の地形が複雑なことが挙げられる. 次に各データ追加地点の予測をグラフでみる.図10 より,今回は2016 年 12 月 25 日の米子市の微小粒子 状物質である.実測値とその他のグラフを比べると, 緩やかな変化には追従しているが,急な変化には追従 できていないことが分かる.他の日付も同様な傾向が みられた. 図10 各データ追加地点の2016 年12 月25 日の微 小粒子状物質の予測 5.2 国内外データの追加によるデータの相関性の変 化 国内外データの追加による予測精度の変化は相関 係数と検定統計量で検証することができた.次にSOM の特徴的な機能であるマッピングを用いて国内外デ ータの追加によって,データの相関性がどのように変 化するかをみていく.今回は2017 年3 月9 日, 2017 年2 月17 日, 2017 年2 月6 日,2016 年4 月18 日の 4つの日付の位置関係を図11の米子市のみのデータを 用いて作成したSOM における位置を基準にして考察 する. また,各SOM は微小粒子状物質の濃度を示してお り,色が赤に近いほど微小粒子状物質の濃度が高く, 青に近いほど低い. (a)米子市 (b)米子市-松江市 (c)米子市-ソウル-北京

(7)

図6 SOM の欠落データの削除前後の 相関係数 図7 SOM の欠落データの削除前後の 検定統計量 図6・7 より,オキシダントと浮遊粒子状物質に関し ては変化が小さく欠落データの削除による影響が小 さいと考えられるが,微小粒子状物質はかなり改善さ れていることが分かる.微小粒子状物質は大気汚染物 質の中でも最も重要な物質なので欠落データを削除 する手法を正規の手法とした.

5. 国

国内

内外

外デ

デー

ータ

タの

の追

追加

加に

によ

よる

る予

予測

測精

精度

度の

検証

証と

とデ

デー

ータ

タの

の相

相関

関性

性の

の変

変化

5.1 国内外データの追加による予測精度の検証 日本における大気汚染の主要因は中国大陸からの 越境汚染である.中国主要都市で発生した大気汚染物 質が偏西風に乗り,日本海を渡り日本に飛散する.こ れより,日本国内のデータのみで予測を行うより偏西 風の通り道である島根県松江市や中国,韓国のデータ を追加することで米子市に飛散する以前の大気汚染 物質の状況がSOM に反映され,予測精度が高まると 考え検証を行った. また,松江市は大気汚染物質データがなく気象デー タのみで中国や韓国は微小粒子状物質データのみ得 られた.検証は米子市のデータをベースに各々のデー タ加えた全てのパターンを検証した. 今回使用した北京とソウルの微小粒子状物質デー タと松江市の気象データは気象庁から引用した. 図8 データ追加地点ごとの相関係数 図9 データ追加地点ごとの

検定統計量

8・9 より,米子市のみが一番予測精度が良く,デ ータを加えるほど予測精度が悪くなった.原因として はデータの追加地点の距離が米子市と遠すぎたこと, 米子市周辺の地形が複雑なことが挙げられる. 次に各データ追加地点の予測をグラフでみる.図10 より,今回は2016 年 12 月 25 日の米子市の微小粒子 状物質である.実測値とその他のグラフを比べると, 緩やかな変化には追従しているが,急な変化には追従 できていないことが分かる.他の日付も同様な傾向が みられた. 図10 各データ追加地点の2016 年12 月25 日の微 小粒子状物質の予測 5.2 国内外データの追加によるデータの相関性の変 化 国内外データの追加による予測精度の変化は相関 係数と検定統計量で検証することができた.次にSOM の特徴的な機能であるマッピングを用いて国内外デ ータの追加によって,データの相関性がどのように変 化するかをみていく.今回は2017 年3 月9 日, 2017 年2 月17 日, 2017 年2 月6 日,2016 年4 月18 日の 4つの日付の位置関係を図11の米子市のみのデータを 用いて作成したSOM における位置を基準にして考察 する. また,各SOM は微小粒子状物質の濃度を示してお り,色が赤に近いほど微小粒子状物質の濃度が高く, 青に近いほど低い. (a)米子市 (b)米子市-松江市 (c)米子市-ソウル-北京

(8)

(d)米子市-松江市-ソウル-北京 図11 2014~2016 年度のデータを 用いて作成したSOM 図11(a)~(b)より,米子市に松江市の気象データの追 加により,2017 年 2 月 17 日とその他の日付との相関 性が低くなっていることが分かる.ソウルと北京の大 気汚染データの追加においても同様である.松江市・ ソウル・北京のデータ追加では4 つの日付が米子市の みと似たような位置になっていることが分かる.また, 米子市のみと他を比較すると微小粒子状物質の濃度 の高い日付と低い日付の密集度に差がある.米子市の みは一か所に集まっているのに対して,他は分散して いる.これより,国内外データの追加が米子市のみで は存在しなかった相関が生じたということである.ま た,米子市のみが最も予測精度が高いことから,微小 粒子状物質の濃度の高い日付の分散が予測精度の悪 化と関連している可能性があると考えられる.

6. 実

実用

用的

的な

な時

時間

間帯

帯の

の予

予測

これまでの予測は1 時~12 時からのデータから 13 時~24 時を予測したが,これでは人間の活動時間をカ バーできていないので,人間の活動時間をカバーでき る実用的な予測手法を検証した. 1 つ目は午後 7 時~午前 6 時のデータから午前 7 時 ~午後6 時を予測する手法で予測する時間の範囲はこ れまでと同じだが,予測する時間帯をずらし,活動時 間をカバーできるようにした.2 つ目は予測範囲を広 げ前日24 時間のデータから当日24 時間を予測するよ うにした. 図12 各予測時間の相関係数 図13 各予測時間の検定統計量 図12・13 より,少しの差ではあるが午前7 時~午後 6 時の予測が相関係数と検定統計量,共に最も実測値 に近い値になった.1 日分の予測に関しては他の予測 手法より精度が劣っていることが分かる.特に微小粒 子状物質の予測精度が悪化している.これより,午後 7 時~午前 6 時のデータから午前 7 時~午後 6 時を予 測する手法が現状で最も実用的だということが分か った.

7. ま

まと

とめ

本研究は,地域に密着した大気汚染情報開示を目指 し,鳥取県内の2014 年 4 月 1 日~2017 年3 月 31 日(1 時~24 時)の 3 年間の観測データから自己組織 化マップを作成した.作成した自己組織化マップを用 いて, 午前 1 時~12 時の実測データから午後 1 時 ~12 時の大気汚染物質濃度の予測を行い,相関係数 とχ 二乗検定によって予測精度の検証を行った. 次に欠落データを削除することでデータを減らし 予測を行った.また国内外のデータをSOM の学習デ ータに追加して予測を行った.結果はデータを増やす ほど予測精度が低下した.さらに追加したデータによ ってSOM にどのような影響がでたかを視覚的に考察 した.その結果,同じ特徴を持つノードの拡散が予測 精度の低下と関係している可能性があると考えた. 最後に午後1 時 ~12 時の実測データから午後1 時 ~12 時の値を予測する手法をより実用な手法に変え るために時間帯を変え午後7 時~午前6 時のデータか ら午前7 時~午後6 時を予測する手法や1 日分のデー タから1 日分の値を予測し検証した.結果は午後7 時 ~午前6 時のデータから午前7 時~午後6 時を予測す る手法が最も予測精度が高かった. 結果,微小粒子状物質に関しては実測値とかなり近 似した予測ができた.一方,浮遊粒子状物質は大気汚 染物質3 つの中で最も予測の精度が低かった.オキシ ダントは微小粒子状物質には及ばなかったものの高 い精度で予測ができた. 現在の大気汚染物質濃度の予測における課題点と して, 予測地点外のデータを追加して予測した場合, 予測精度の向上が見込めないことである.これはデー タの追加地点と予測地点の距離が遠いことと予測地 点の地形が複雑なことが要因であると考えられる.よ って,予測地点と近い地点のデータを追加して予測す る必要がある.また,グラフにおいて予測値が実測値 の急な変化に追従できていないことも課題である.加 えて,実用に供する予測精度の判断基準もあげられる. 他の機械学習を用いた予測手法と比較し優位性を相 対的に判断すること,予測値と自治体が出す注意喚起 情報の判断となる閾値との間の定量的な差異(予測値 と注意喚起情報との正答率など)の評価を行っていく ことが重要であると考えている. 今後,より予測地点と近傍な地点のデータを追加し, さらに19 時~6 時のデータから 7 時~18 時を予測す る手法を用いることやSOM の学習のパラメーターで ある学習係数,学習回数等を変更することで実用的で 精度が高い大気汚染物質濃度の時系列予測が期待で きる.

参考

考文

文献

[1] 経済産業省:「有害大気汚染物質に係る発生源周辺に おける環境影響予測手法マニュアル」,pp.31-39,2012 [2] 菅田誠治,大原利眞,黒川純一,早崎将光:「大気汚 染予測システム(VENUS)の構築と検証」,大気環境学会 誌,Vol.46(1),pp.49-59,2011 [3] 日 本 気 象 協 会 「 PM2.5 分 布 予 測 」 : http://www.tenki.jp/particulate_matter/,2017 [4] 徳高平蔵,大北正昭,大藪又茂ら:「医療・医学・薬 学における SOM の応用」,海文堂出版 pp.102-110,2015 [5] 大北正昭,徳高平蔵,藤村喜久郎,権田英功ら:「自 己組織化マップとそのツール」,シュプリンガー・ジャパ ン pp.2-10,2008 [6] 徳高平蔵,大北正昭,藤村喜久郎:球面SOM を用い たクラスター分析,バイオメディカル・ファジィ・システ ム学会誌,8 巻,1 号,pp.30,2006

[7] H.Ritter:Self-Organizing Maps on non-euclidean Spaces,in Kohonen Maps,pp.95-110,1999

[8] 吉兼隆生:機械学習による局所気象予測手法の開発, https://www.jstage.jst.go.jp/article/pjsai/JSAI2019/0 /JsaI2019_ 4Rin133/_pdf/-char_ja,2019 [9] 宅野将司,権田英功,宮田仁志:自己組織化マップを 用いた鳥取県内の大気汚染物質の予測と気象データによ る解析,ファジィシステムシンポジウム講演論文集, pp.626-627,2018 [10]宅野将司,権田英功,宮田仁志,佐々木惣一郎:自己 組織化マップを用いた鳥取県内の大気汚染物質の時系列 予測,大気環境学会年会,pp.142,2019

(9)

(d)米子市-松江市-ソウル-北京 図11 2014~2016 年度のデータを 用いて作成したSOM 図11(a)~(b)より,米子市に松江市の気象データの追 加により,2017 年 2 月 17 日とその他の日付との相関 性が低くなっていることが分かる.ソウルと北京の大 気汚染データの追加においても同様である.松江市・ ソウル・北京のデータ追加では4 つの日付が米子市の みと似たような位置になっていることが分かる.また, 米子市のみと他を比較すると微小粒子状物質の濃度 の高い日付と低い日付の密集度に差がある.米子市の みは一か所に集まっているのに対して,他は分散して いる.これより,国内外データの追加が米子市のみで は存在しなかった相関が生じたということである.ま た,米子市のみが最も予測精度が高いことから,微小 粒子状物質の濃度の高い日付の分散が予測精度の悪 化と関連している可能性があると考えられる.

6. 実

実用

用的

的な

な時

時間

間帯

帯の

の予

予測

これまでの予測は1 時~12 時からのデータから 13 時~24 時を予測したが,これでは人間の活動時間をカ バーできていないので,人間の活動時間をカバーでき る実用的な予測手法を検証した. 1 つ目は午後 7 時~午前 6 時のデータから午前 7 時 ~午後6 時を予測する手法で予測する時間の範囲はこ れまでと同じだが,予測する時間帯をずらし,活動時 間をカバーできるようにした.2 つ目は予測範囲を広 げ前日24 時間のデータから当日24 時間を予測するよ うにした. 図12 各予測時間の相関係数 図13 各予測時間の検定統計量 図12・13 より,少しの差ではあるが午前7 時~午後 6 時の予測が相関係数と検定統計量,共に最も実測値 に近い値になった.1 日分の予測に関しては他の予測 手法より精度が劣っていることが分かる.特に微小粒 子状物質の予測精度が悪化している.これより,午後 7 時~午前 6 時のデータから午前 7 時~午後 6 時を予 測する手法が現状で最も実用的だということが分か った.

7. ま

まと

とめ

本研究は,地域に密着した大気汚染情報開示を目指 し,鳥取県内の2014 年 4 月 1 日~2017 年3 月 31 日(1 時~24 時)の 3 年間の観測データから自己組織 化マップを作成した.作成した自己組織化マップを用 いて, 午前 1 時~12 時の実測データから午後 1 時 ~12 時の大気汚染物質濃度の予測を行い,相関係数 とχ 二乗検定によって予測精度の検証を行った. 次に欠落データを削除することでデータを減らし 予測を行った.また国内外のデータをSOM の学習デ ータに追加して予測を行った.結果はデータを増やす ほど予測精度が低下した.さらに追加したデータによ ってSOM にどのような影響がでたかを視覚的に考察 した.その結果,同じ特徴を持つノードの拡散が予測 精度の低下と関係している可能性があると考えた. 最後に午後1 時 ~12 時の実測データから午後1 時 ~12 時の値を予測する手法をより実用な手法に変え るために時間帯を変え午後7 時~午前6 時のデータか ら午前7 時~午後6 時を予測する手法や1 日分のデー タから1 日分の値を予測し検証した.結果は午後7 時 ~午前6 時のデータから午前7 時~午後6 時を予測す る手法が最も予測精度が高かった. 結果,微小粒子状物質に関しては実測値とかなり近 似した予測ができた.一方,浮遊粒子状物質は大気汚 染物質3 つの中で最も予測の精度が低かった.オキシ ダントは微小粒子状物質には及ばなかったものの高 い精度で予測ができた. 現在の大気汚染物質濃度の予測における課題点と して, 予測地点外のデータを追加して予測した場合, 予測精度の向上が見込めないことである.これはデー タの追加地点と予測地点の距離が遠いことと予測地 点の地形が複雑なことが要因であると考えられる.よ って,予測地点と近い地点のデータを追加して予測す る必要がある.また,グラフにおいて予測値が実測値 の急な変化に追従できていないことも課題である.加 えて,実用に供する予測精度の判断基準もあげられる. 他の機械学習を用いた予測手法と比較し優位性を相 対的に判断すること,予測値と自治体が出す注意喚起 情報の判断となる閾値との間の定量的な差異(予測値 と注意喚起情報との正答率など)の評価を行っていく ことが重要であると考えている. 今後,より予測地点と近傍な地点のデータを追加し, さらに19 時~6 時のデータから 7 時~18 時を予測す る手法を用いることやSOM の学習のパラメーターで ある学習係数,学習回数等を変更することで実用的で 精度が高い大気汚染物質濃度の時系列予測が期待で きる.

参考

考文

文献

[1] 経済産業省:「有害大気汚染物質に係る発生源周辺に おける環境影響予測手法マニュアル」,pp.31-39,2012 [2] 菅田誠治,大原利眞,黒川純一,早崎将光:「大気汚 染予測システム(VENUS)の構築と検証」,大気環境学会 誌,Vol.46(1),pp.49-59,2011 [3] 日 本 気 象 協 会 「 PM2.5 分 布 予 測 」 : http://www.tenki.jp/particulate_matter/,2017 [4] 徳高平蔵,大北正昭,大藪又茂ら:「医療・医学・薬 学における SOM の応用」,海文堂出版 pp.102-110,2015 [5] 大北正昭,徳高平蔵,藤村喜久郎,権田英功ら:「自 己組織化マップとそのツール」,シュプリンガー・ジャパ ン pp.2-10,2008 [6] 徳高平蔵,大北正昭,藤村喜久郎:球面SOM を用い たクラスター分析,バイオメディカル・ファジィ・システ ム学会誌,8 巻,1 号,pp.30,2006

[7] H.Ritter:Self-Organizing Maps on non-euclidean Spaces,in Kohonen Maps,pp.95-110,1999

[8] 吉兼隆生:機械学習による局所気象予測手法の開発, https://www.jstage.jst.go.jp/article/pjsai/JSAI2019/0 /JsaI2019_ 4Rin133/_pdf/-char_ja,2019 [9] 宅野将司,権田英功,宮田仁志:自己組織化マップを 用いた鳥取県内の大気汚染物質の予測と気象データによ る解析,ファジィシステムシンポジウム講演論文集, pp.626-627,2018 [10]宅野将司,権田英功,宮田仁志,佐々木惣一郎:自己 組織化マップを用いた鳥取県内の大気汚染物質の時系列 予測,大気環境学会年会,pp.142,2019

(10)

宅 宅野野 将将司司((たたくくのの ままささしし)) 2020 年 3 月米子工業高等専門学校専 攻科生産システム工学専攻修了. 権 権田田 英英功功((ごごんんだだ ええいいここうう)) 1996 年 3 月東北大学大学院工学研究 科電子工学専攻博士前期課程修了.同 年4月米子工業高等専門学校電気工学 科助手となり,2006 年 3 月鳥取大学 大学院工学研究科博士後期課程情報 生産工学専攻修了,2016 年 4 月同工 業高等専門学校電気情報工学科教授, 現在に至る. 博士(工学).主としてファジィ・ニュ ーラルネットワークに関する研究に 従事.電子情報通信学会会員. 宮 宮田田 仁仁志志((みみややたた ひひととしし)) 1992 年 3 月鳥取大学大学院工学研究 科電気工学専攻修士課程修了,同年4 月米子工業高等専門学校電気工学科 助手となり,2011 年教授,現在に至る. 博士(工学).自律移動ロボットの研究 に従事.日本ロボット学会,電気学会, IEEE 各会員.

図 2    自己組織化マップによる予測手法 ここで自己組織化マップは数値の大きな要素に依 存してしまう性質がある.そのため, SOM を作成する 際 に 用 い る 実 測 値 デ ー タ
図 2    自己組織化マップによる予測手法 ここで自己組織化マップは数値の大きな要素に依 存してしまう性質がある.そのため, SOM を作成する 際 に 用 い る 実 測 値 デ ー タ
図 6   SOM の欠落データの削除前後の 相関係数 図 7   SOM の欠落データの削除前後の 検定統計量 図 6 ・ 7 より,オキシダントと浮遊粒子状物質に関し ては変化が小さく欠落データの削除による影響が小 さいと考えられるが,微小粒子状物質はかなり改善さ れていることが分かる.微小粒子状物質は大気汚染物 質の中でも最も重要な物質なので欠落データを削除 する手法を正規の手法とした. 5
図 6   SOM の欠落データの削除前後の 相関係数 図 7   SOM の欠落データの削除前後の 検定統計量 図 6 ・ 7 より,オキシダントと浮遊粒子状物質に関し ては変化が小さく欠落データの削除による影響が小 さいと考えられるが,微小粒子状物質はかなり改善さ れていることが分かる.微小粒子状物質は大気汚染物 質の中でも最も重要な物質なので欠落データを削除 する手法を正規の手法とした. 5

参照

関連したドキュメント

3.5 今回工認モデルの妥当性検証 今回工認モデルの妥当性検証として,過去の地震観測記録でベンチマーキングした別の

システムの許容範囲を超えた気海象 許容範囲内外の判定システム システムの不具合による自動運航の継続不可 システムの予備の搭載 船陸間通信の信頼性低下

界のキャップ&トレード制度の最新動 向や国際炭素市場の今後の展望につい て、加盟メンバーや国内外の専門家と 議論しました。また、2011

汚染水の構外への漏えいおよび漏えいの可能性が ある場合・湯気によるモニタリングポストへの影

電子式の検知機を用い て、配管等から漏れるフ ロンを検知する方法。検 知機の精度によるが、他

指標 関連ページ / コメント 4.13 組織の(企業団体などの)団体および/または国内外の提言機関における会員資格 P11

都市 の 構築 多様性 の 保全︶ 一 層 の 改善 資源循環型 ︵緑施策 ・ 生物 区 市 町 村 ・ 都 民 ・ 大気環境 ・水環境 の 3 R に よ る 自然環境保全 国内外 の 都市 と の 交流︑. N P

予測の対象時点は、陸上競技(マラソン)の競技期間中とした。陸上競技(マラソン)の競 技予定は、 「9.2.1 大気等 (2) 予測 2)