Kochi University of Technology Academic Resource Repository
Title
環境分野への深層学習応用研究の立ち上げについて
Author(s)
中根, 英昭, 若槻, 祐貴
Citation
高知工科大学紀要, 15(1): 111-120
Date of issue
2018-07-31
URL
http://hdl.handle.net/10173/1949
Rights
Text version
publisher
Kochi, JAPAN
環境分野への深層学習応用研究の立ち上げについて
中根 英昭
1∗若槻 祐貴
2 (受領日:2018年5月7日) 1高知工科大学環境理工学群
〒 782–8502 高知県香美市土佐山田町宮ノ口 185
2高知工科大学大学院工学研究科環境数理コース
〒 782–8502 高知県香美市土佐山田町宮ノ口 185
∗E-mail: [email protected]
要約:高知工科大学環境理工学群環境解析研究室(中根研究室)では、2016 年度後半に深層学習の ための計算機環境を整備し、2017 年度当初から、具体的な環境分野のテーマへの応用に取り組み、 2017 年度中に所期の成果を上げることができた。深層学習による回帰および分類(判別)のための 推定モデル作成の対象は以下の通りである。回帰の対象は、早明浦ダムへの流入量、安田川の水位、 鏡川の水位、高知の全天日射量である。分類(判別)の対象は、高知における降雨現象の有無、3 種 のユリ科の花の種類、森林の樹種である。対象は多岐にわたるが、多層パーセプトロン(MLP)と 畳み込みニューラルネットワーク(CNN)の 2 種類の深層学習の手法によって推定モデルの作成を 行うことができた。回帰においては、増水期から渇水期に至る全期間の水位やダムへの流入量を、 外挿も含めて良好にモデル化できることを示した。ドローン空撮した森林写真から切り出した画像 を用いた森林樹種分類に際しては、転移学習によって人間と同等あるいはそれ以上の識別が可能で あることを示すことができた。1. はじめに
深層学習(ディープラーニング)は、近年の人工 知能の急速な発展にとって鍵となる技術である1)。 パーソナルコンピュータ(PC)の高速化、並列計算 を行うことが可能な GPU(Graphics Processing Unit) の低価格化、深層学習のためのソフトウェアライブ ラリー(フレームワーク)がオープンソースとして 公開されていることから、極端な言い方をすれば、 「だれでも深層学習を活用できる」環境が出現して いる。 高知工科大学環境理工学群中根研究室では、2016 年度から深層学習に用いるハードウェア・ソフト ウェアシステムの構築を行い、2017 年度から具体 的なデータを解析するプログラムの作成を開始し た。2017 年度末には、深層学習のいくつかの手法 を環境分野のテーマに応用した結果が得られ、有 効な研究手段であると考えるに至ったため、2016∼ 2017 年度にかけて実施したシステムの立ち上げの 経緯と研究例について報告する。2. 大阪大学基礎工学部における先行研究
環境理工学群では、学群コロキウム「理工学の フロンティア」2)を 1 年に 10∼20 回開催しており、 2016 年 4 月 19 日に大阪大学基礎工学部三宅淳教授 (2017 年度より大阪大学国際医工情報センター特任 教授)による「ディープラーニングが解く世界」と 題する講演が行われた。講演では、 (a) バイオ応用として、DNA レベルの進化、タンパ ク質の突然変異や細胞の分化誘導、細胞内の 遺伝子や化学反応の連鎖(例えばガン化メカニ ズム) (b) 知能と運動の研究として、ロボットと人間の認 識共有、テロリストの検知・人間の行動解析 などについての三宅研究室において実施されて いる研究3, 4)、の紹介と共に、将来の研究の方向性 や可能性について述べられた。講演後の研究打合わせでは、気象現象推定モデルの開発についての共同 研究の可能性について検討した。三宅研究室では、 当時 2 名の卒業研究生がこのテーマに取り組んでお り、その成果の一部が、後に日本気象学会 2016 年 秋季大会で発表された5)。 2017 年 3 月に三宅教授が大阪大学基礎工学部を 退職される際に、深層学習による気象現象の推定に に関する卒業研究の情報、使用したデータ等を共有 して共同研究を行うことになった。
3. 環 境 理 工 学 群 中 根 研 究 室 に お け る 開 発
(2016 年度後半∼2017 年度前半)
3.1 深層学習に必要な計算機環境の整備 三宅教授の研究室では、GPU を備えた PC、OS と して Linux、深層学習のフレームワークとしては独 自に開発した「Σ」、プログラミングは C++を用い ていた。筆者らを含む中根研究室のメンバーには ハードルが高く、そのまま模倣して使わせて頂くこ とは困難と考えた。ただ、GPU の使用は不可欠と考 えた。また、フレームワークとして、Caffe、Chainer、 Tensorflow、H2O などがある中で、「どれも試してみ るのが良い」というアドバイスや、「Tensorflow が 良い」等のアドバイスを、様々な方から頂いていた ことから、とりあえず Tensorflow による環境構築を 目指した。2016 年 10 月には、中根研究室修士課程 1 年生の小島慶之君が、名古屋大学太陽地球環境研 究所の長濱智生准教授のご協力の下、GPU を装着 しない Linux-PC に Tensorflow をインストールして 計算させることに成功した。2016 年 11 月中頃には Windows/Linux の両方の OS が搭載された PC に GPU (GeForce GTX1070)を搭載した。しかし、GPU 版の Tensorflow のインストールは困難であった。 2016 年 11 月 29 日に Google から Windows 用の Ten-sorflow が公開された。また、11 月 30 日には、オー ム社より「実装ディープラーニング」6)が出版され た。この本の中の GPU を使うための環境設定に関 する詳細な記述は、Linux への実装ではあるが、大 いに役立った。さらに、Keras というインターフェー スからバックエンドの Tensorflow や Theano を動作さ せると機械学習のプログラミングが容易になると の記述もあり、参考になった。また、インターネッ トのエンジニア同士の情報交換サイト「Qiita」にも 「Tensorflow が正式に Windows サポートして GPU が 使えたので試してみた」という記事が 2016 年 12 月
中頃にアップロードされた7) ため、Window-PC に
Tensorflow のインストールを試みたところ、特段の 困難もなくインストールすることができた。数字の
表 1. 深層学習に用いた計算機環境例
CPU Core i7-7700
GPU GeForce GTX1070 or GTX1080Ti OS Windows 10 フレームワーク Keras/ TensorFlow プログラミング言語 Python 3.6 (Anaconda 4.4.0) 0∼9 を判別する手書き文字認識「MNIST」のサン プルプログラムを実行したところ、CPU のみで実 行した場合に約 1 時間かかっていたプログラムが、 GPU を用いた場合には約 1 分で完了することを確 認できた。このとき、「深層学習の大衆化」の時代 が到来したことを感じた。 中根研究室では環境データの解析に R 言語を用 いていたことから、機械学習のコミュニティで良く 使用されている Python には不慣れであった。それ に加えて Tensorflow の文法の学習をするのは大き な負担であったことから、Tensorflow のためのイン ターフェースである Keras8) を用い、Python によっ て深層学習用のプログラムを作成することにした。 Keras にとって Tensorflow はバックエンドとして用 いることのできる機械学習ライブラリの一つであ り、他に、Theano、CNTK をバックエンドとして用 いることができる8)。実際のプログラミングの際 には Tensorflow を意識することは現時点ではない。 Python については、ライブラリ間のバージョン管理 の容易な Anaconda によってインストールすること にした。プログラム作成には、Anaconda のライブ ラリに含まれている Spyder を用いた。R 言語によ るプログラム開発環境として用いていた Rstudio と 類似した環境であるためである。表 1 に利用して いる計算機環境をまとめた。以前から環境データ 解析用に用いていた Windows PC に GPU が搭載さ れたグラフィックボードを追加した場合には、追加 的な費用は数万円(GTX1070 の場合)、10 数万円 (GTX1080Ti の場合)である。
我々の 研 究 室 で は Keras / Tensorflow を Windows 上で実行しているが、Keras の中心的開発者である Francois Chollet は自著 “Deep Learning with Python” の “Software/ hardware requirement”9) において “You’ll
need access to a UNIX machine; it’s possible to use Windows too, but I don’t recommend it” とはっきりと 述べていることに留意する必要がある。実際、アッ プデートの際のバージョンの不整合に対するサポー
図 1. 使用した CNN の構造。畳み込みのストラ イド幅は 1、パディング有り。 トにおいて Linux が優先されていると感じることが ある。 3.2 Keras/ Tensorflow による大阪大学の研究例の再 現・改良 深層学習のプログラム開発環境がほぼ整った 2017 年 3 月に、中根研究室の 3 年生 5 名全員に、「卒業 研究のテーマは深層学習の環境分野への応用であ ること」を確認した。修士課程 1 年生の 1 名と併せ て 6 名の研究テーマのために、短期間で成功例を示 す必要があった。本報告の著者の一人である若槻が 大学院に進学予定である他は、就職活動が始まって いたことから、先ず、中根と若槻の二人で大阪大学 の研究例の再現に取り組んだ。再現する研究例を、 大阪大学基礎工学部三宅研究室岩井尚晴氏の卒業 論文10)のテーマ(「大阪における降雨現象の有無」) に絞った。深層学習の代表的な機械学習モデルであ る畳み込みニューラルネットワーク(CNN)を用い、 ひまわり 7 号の赤外雲画像を入力データとして、ア メダス大阪観測所における降雨現象の有無を推定 するモデルの作成である。入力用の雲画像と教師 データは提供して頂いたものを用いたが、プログ ラムは Keras/ Tensorflow を用いて独自に作成した。 大阪の降雨の再現については、畳み込み層を 2 層 から 3 層に増やす、全結合層を 2 層から 1 層に減ら す、ノード数を減らす、最適化方法を工夫する等、 岩井氏が作成したモデルから修正したものを用い て、より高い正解率(約 80 %;8 %向上)が得られ た。2017 年 7 月の初旬のことである。そこで次に、 高知における降雨現象の有無に関する研究への適 用に取り組んだ。 3.3 ディープラーニングによる高知市の降水現象の 有無の判別 高知市の降水現象の有無の推定モデルの作成に 図 2. 学習に使用した雲画像の例 表 2. 高知の降水現象推定のための学習条件 学習回数 30 回 入力画像サイズ 17,433×200×200×3 バッチサイズ 64 最適化方法 Adam 各層の活性化関数 ReLU 関数 出力層の活性化関数 softmax 関数 ついては、データの自動ダウンロード、画像の切り 出し、RGB 画像からグレースケール画像への変換、 複数グレースケール画像による多チャンネル画像の 作成、Keras による降雨推定モデルの作成、学習済 みモデルによる降雨推定の全ての Python プログラ ムを自作した。プログラム作成は主に若槻が担当し た。図 1 に用いた CNN の構成を示す。 使用したひまわり 7 号赤外画像と、200×200 画素 を切り出してグレースケールに変換した画像の例 を図 2 に示す。学習に用いた入力画像11)は 2013 年 及び 2014 年における西日本エリアの赤外衛星写真 を中四国地方の範囲で 200×200 ピクセルのサイズ に切り出し、グレースケールに変換したもの(図 2 右上段の画像)を 17,435 枚用意した。 そして、1 時間異なる時刻の画像を 3 枚組み合わ せた 3 チャンネル RGB 画像(図 2 右下段の画像; 200×200×3)を作成し、17,433 個の入力データとし た。なお、図 2 の 3 ch 画像は他の 2 画像と異なる時 刻のものである。 17,433 個の入力データおよび教師データ(アメダ スデータに基づく、降雨現象有り、降雨現象無しの データ)を 80 %の訓練データと 20 %のモデル検証 用のテストデータにランダムに分割し、表 2 の設 計の CNN を用いて推定モデルを作成した。その結 果、図 3 に示すように、正解率が 87 %以上に達し た。以上の成果は、高知工科大学永国寺キャンパス で開催された日本環境共生学会 20 回記念(2017 年 度)学術大会(9 月 22∼24 日)の発表論文集12) に
図 3. 学習による降水現象有無の正解率の変化 掲載されている。 3.4 多層パーセプトロンによる早明浦ダム流入量の 推定 ひまわり 7 号雲画像データについては、降水現象 の有無だけではなく、降水量の推定も試みた。降雨 現象の有無の推定では満足できなかったからであ る。一つの手法として、降水量をいくつかのレベル に分けて、CNN による画像分類の手法をそのまま 用いる試みを行ったが、観測結果との相関が良くな かった。ひまわり 7 号赤外画像の輝度と降雨量との 定量的関係が良くないことが理由と考えている。 試行錯誤の中で、降雨現象に関連した定量的な 予測を機械学習・深層学習によって行うことのでき るテーマに取り組みたいと考えるようになった。ま た、降雨に関する大量のデータと環境問題にとって 重要な物理量との間の推定モデルを作成したいと も考えた。データ探索の結果、早明浦ダムの上流流 域圏平均雨量、ダムへの流入量、放流量、貯水量等 の 1 時間値が、国土交通省の水文水質データベース として公開されていること13)が確認できた。早明 浦ダムは「四国のいのち」と呼ばれている重要なダ ムであるため、意義があると判断して研究に着手 した。 問題は、Keras によって「分類」ではなく「回帰」 をどのように実装するかであるが、その情報は容 易には見つからなかった。ほとんどの教科書やホー ムページで扱っている手法は分類であった。そのな かで、2017 年 4 月に出版された “Deep Learning with Keras” に “regression network” の項目があり、様々な 大気汚染物質濃度を入力データしてベンゼン濃度 を推定する回帰の例が掲載されていた14)。余りにも 単純な例であったが、次の重要な情報が得られた。 Keras では、分類においては通常、各カテゴリーに 図 4. 学習に用いた多層パーセプトロンの構造 対応する確率を計算するために次の行、 model.add(Activation("softmax")) が必要であるが、回帰の場合にはこの行が必要な いこと 、誤 差は “categorical crossentropy” ではなく “mean squared error” によって評価すれば良いことで ある。この情報を基に、ダム上流流域圏平均降水量 の 1 時間値の時系列データ(96 時間あるいは 120 時 間)114,550 個を入力データとして、ダムへの流入 量を教師データ(推定すべきデータ;出力データ) として選択してプログラムを作成した。学習には多 層パーセプトロン(MLP)を用いた。画像の特徴抽 出が必要な場合に用いられる CNN と異なり、比較 的単純なニューラルネットワークによって良好な学 習結果が得られると考えられるからである。用いた MLP の構造を図 4 に示す。 2017 年 9 月上旬には、120 時間の上流流域圏降雨 量の時系列のみを入力データとして、ダム流入量の 良好な推定モデルが得られた。短期間の降雨による ダム流入量の増加は、主に数時間から数日間の降 雨によって起こると考えられるため、120 時間の上 流流域圏平均降水量を入力データとして選んだこ とが功を奏したと考えられる。その後、96 時間の 時系列データで十分であることを確認した。なお、 ダムへの流入量は放流の影響を受けること、放流量 はダムの貯水量を勘案して決められると考えられ るため、入力データとしてダム放流量、ダム貯水量 を追加することによって、推定値と実測値の一致の 度合いが改善された。この 3 入力を用いて学習した 場合の、モデル推定流量と観測流量の散布図を図 5 に示す。流入量の大きさにかかわらず、データが原 点を通る傾きが 1 の直線の周りに分布している。ち なみに、入力が上流流域圏平均降雨量のみの場合の 平均二乗誤差平方根(RMSE)は 23.947 m3/s、ダム
図 5. 上流流域圏平均降水量、ダム貯水量、ダム 放流量を入力データとした場合のダム流 入量散布図 貯水量を入力に加えると 19.559 m3/s であった15)。
4. 様々なテーマへの展開(2017 年度後半)
4.1 深層学習による安田川水位推定モデル 若 槻 を 中 心 に 作 成 さ れ た 多 層 パ ー セ プ ト ロ ン (MLP)お よ び 畳 み 込 み ニュー ラ ル ネット ワ ー ク (CNN)のプログラムは、入力データと教師データ を作成していた各研究テーマの分担者によって応用 された。計算機環境構築にかかわってきた修士 2 年 生の小島慶之君はダムのない中小河川である高知 県安田川の水位の推定に対して MLP を応用した。 気象庁が降雨レーダーのデータ等に基づいて作成 した 1 km メッシュの「解析雨量」16)(気象業務支援 センターより購入)から切り出した安田川流域圏 を囲む領域の雨量の平均値を入力とし、高知県に 提供して頂いた東島観測所の水位を教師データと して、MLP による学習を行い、水位推定モデルを 作成した。解析雨量の切り出しについては、環境理 工学群柴田研究室の中前久美氏に協力して頂いた。 以下は、小島慶之君の修士論文17) の一部を基にし てまとめたものである。 2006 年から 2017 年 9 月までの 1 時間ごとの解析 雨量流域圏平均値(92,821 データ)の過去 96 時間 時系列データを入力データとし、80 %を訓練デー タ、20 %をテストデータとして学習し、水位推定モ デルを作成した。テストデータに対するモデル推定 値と観測水位の散布図を図 6 に示す。水位の高い領 域では推定水位と観測水位の一致は良いが、水位の 低い領域ではデータが大きくばらついている。 水位の低い場合、すなわち流域圏に数日間降雨の ない場合の水位の推定を改善するために、1 か月平 均流域圏雨量を 1 年分(12 データ)の時系列として 図 6. 安田川流域圏平均雨量 96 時間時系列デー タを入力データに用いた場合の東島観測 水位の散布図 図 7. 安田川流域圏平均雨量 96 時間時系列に加 え、1 か月平均雨量の 1 年の時系列を入力 データに含めた場合の東島観測水位の散 布図 入力データに追加して学習を行い、モデルの検証を 行った。図 6 と同様の散布図を図 7 に示す。低水位 領域の推定値と観測値の一致が劇的に改善し、負の 水位の領域も含めて、データが原点を通る傾きが 1 の直線の周囲にコンパクトに分布している。 図 6 と図 7 の比較の意味するところは、流域圏に 数日間雨がない場合の水位は、過去数か月の間に 降った雨による地下水等による湧水によって保たれ ているということである。すなわち、ダムのない 安田川について「緑のダム」の効果を、深層学習に よって示すことができたと考えている。感度解析を 行った結果、3∼6 か月前の期間の降雨の寄与が大き いことを確認することができた。図 8. 鏡川の概要と宗安寺観測所に関連する情報 4.2 豪雨時の鏡川宗安寺観測所の水位の推定 ダムの流入量の推定のために若槻が作成したプロ グラムを、ダムのない安田川の水位推定と「緑のダ ム」の効果の解析の研究に応用しつつ、並行してダ ムのある支流とダムのない支流からの河川水が流 入する鏡川宗安寺観測所の水位推定を行った。2017 年度の 4 年生の林良真君が卒業研究18)として担当 した。以下は、林良真君の卒業論文の一部に基づい て執筆した。 鏡川は、源流域から河口までが高知市域に入る、 延長 31 km、流域面積 170 平方キロメートルの二級 河川であり、水位周知河川(流域面積が小さく洪水 予報を行う時間的余裕がない河川)に指定されてい る。また、台風 12 号および台風 11 号の影響を受け た 2014 年 8 月豪雨の際には、宗安寺観測所におい ても記録的水位が記録された。そして、高知市全域 に避難勧告が出された。このような特徴を持ち、高 知市民にとって重要な河川において、4 m 以上の水 位の記録がない 2009 年 1 月 1 日∼2014 年 7 月 31 日 の降雨量、ダム諸量、宗安寺観測所水位データに基 づく学習によって作成した水位推定モデルが、2014 年 8 月 1 日∼8 月 10 日の水位をどの程度正確に推定 できるかについて検討した。 図 8 は、高知県のホームページに基づき作成した 鏡川と宗安寺観測所に関連する情報をまとめたも のである。この図に示されるように、宗安寺観測所 の水位は、鏡ダムを経由して鏡川に流れるダム集水 範囲に位置する黄色エリアと、鏡ダムを経由せずに 鏡川に流れる緑色エリアの降雨量と、鏡ダムの影 響を受ける。この研究では、各入力データの寄与の 解析より、一種の外挿可能性の検討に重点を置いて いるため、宗安寺観測所水位に関連する、欠測の少 ない河川情報および全てのダム諸量を入力データ 図 9. モデル作成期間および水位推定期間の宗 安寺観測所の水位。下段の図は、上段右端 8 月 1 日∼10 日の期間を拡大したもの。 として用いた。具体的には、平石降雨量(73 時間の 時系列)、柿の又降雨量(73 時間の時系列)、宗安 寺降雨量、鏡ダム流入量・鏡ダム全放流量・鏡ダム 貯水量、柿の又月平均降雨量(1∼9 カ月の時系列) を入力データとし、宗安寺観測所水位を教師データ とした。学習による推定モデル作成には、2009 年 1 月 1 日∼2014 年 7 月 31 日の期間を用い、2014 年 8 月 1 日∼8 月 10 日の入力データを用いてこの期間 の宗安寺観測所の水位を推定した。図 9 に宗安寺観 測所の観測水位とモデル推定水位の時系列を示す。 図 9 上段に示すように、水位推定モデル作成に用 いた期間の最大水位は 4 m 以下であるにもかかわら ず、8 月 3 日の約 5 m の宗安寺観測所の水位を良好 に推定している。また、台風 12 号と台風 11 号が続 けて接近して発生した、豪雨による水位の時系列の 全体像も良く再現している。通常、帰納的手法によ る外挿は困難とされているが、想定の範囲内であれ ば、入力データを注意深く扱うことによって外挿も 可能であることを示すことができたと言える。 1 級河川について、洪水時に着目し、深層学習を
図 10. 樹種判別に用いたドローン空撮画像。左 上のオレンジ色の正方形は、樹種判別に 用いた 100 × 100 ピクセルの個別の画像。 含む機械学習によって高い精度の予測が可能である ことを示した例が報告されている19)。この研究で は、洪水時のみの数時間の雨量の時系列データを 入力データとして用いている。それに対して、本報 告で紹介している早明浦ダム流入量、安田川水位、 鏡川水位を対象として実施している、低水位期間の 降水量のデータも含めた全期間の大量の入力デー タを用いた研究は、深層学習の特長を活かし、洪水 期間も渇水期も含めた河川の水文過程全体を切れ 目なくモデル化する試みとして独自性の高い研究 であると考えている。現在は中小河川を対象にして いるために、入力データが得られない将来の予報 について言及していないが、大河川の場合には河 川データのみによって予報が可能であると考えてい る。また、解析雨量の予報値を用いるならば、中小 河川についても数時間の予報が可能であることを 示唆する結果が得られていると考えている。 4.3 ドローンによる空撮画像と転移学習による森林 の樹種判別 高知の降水量の有無の判別に用いた畳み込みニ ューラルネットワーク(CNN)のプログラム、“Deep Learning with Python”9)等の書籍、ホームページから
の情報等を参考にしつつ、2017 年度 4 年生の明田啓 暉君は 3 種類のユリ科植物、「ヤマユリ」、「オニユ リ」、「ウバユリ」の花の分類を行うプログラムを作 成した20)。この研究の中では、1000 個のカテゴリー に分類するための画像データベース “ImageNet” で 学習した重みを使うことのできる Xception モデル20) を用いた転移学習(fine-tuning)を用いて、100 %の 正解率を得た21)。このプログラムを用いて、2017 年 度 4 年生の増本雄大君はドローン空撮画像の判別を 図 11. 各カテゴリーの典型的な画像(上段)と 不正解画像例(下段)。( )内は学習済 みモデルの判断。 行い約 90 %の正解率を得た22)。さらに、明田君と 2018 年度 4 年生の山本啓君がプログラムの見直しを 行い、2018 年 4 月現在、98 %以上の正解率を得るこ とができている。以下に、3 名の中根研究室学生の 成果の一部を紹介する。なお、Fine-tuning、Xception によるプログラミングは、“Keras Documentation”8) を参考にして行った。 空撮画像は、高知工科大学地域連携機構の村井亮 介研究員がドローンに装着したカメラで撮影した ものを、高知工科大学システム工学群の高木方隆教 授を通して提供して頂いた。今回使用した森林画像 は、高知県香美市土佐山田町の佐岡地区の森林の 一部を撮影した動画の 1 枚を静止画として取り出 したものである。使用した画像を図 10 に示す。横 6000 ピクセル、縦 4000 ピクセルの画像である。こ の画像から 100×100 ピクセル(2.4 m×2.4 m)の画像 を 2400 枚切り出し、「竹」、「ヒノキ」、「広葉樹」、 「竹—ヒノキ混合」、「竹—広葉樹混合」、「ヒノキ— 広葉樹混合」、「影」の 7 カテゴリーに分類した。そ れぞれの画像を 90 度、180 度、270 度回転させた画 像を加えて 9600 画像にした後、80 %の訓練画像と
20 %のテストデータにランダムに分割し、400 回の 学習をほぼ 1 日かけて行った。テストデータの正解 率は 98.75 %であった。 作成した学習済みモデルを用いて、テストデータ の中の回転する前のオリジナル画像に対する樹種 判別を行ったところ、正解は 475 画像中 469 画像で、 正解率は 98.74 %であった。回転したテスト画像に 対する正解率とほぼ等しい。典型的な正解画像と不 正解画像例を図 11 に示す。ヒノキの不正解画像の ように、深層学習によって作成された学習済みモデ ルの判断の方が人間の判断に勝ると考えられる例 もある。 98.7 %を超える正解率は極めて高いが、1 枚のド ローン空撮画像に含まれるテストデータによる検 証の結果であり、作成された学習済みモデルを他の 空撮画像について樹種推定を行った場合には正解 率が低下する可能性がある。「広葉樹」の具体的 な中身が場所によって異なるからである。2 種類の 樹種の「混合」というカテゴリーがあることも問題 である。さらに、真に適切な教師データ(樹種判別) ができているか、については専門家の判断に頼る 必要があるが、専門家の負担を小さくするために、 オートエンコーダーの利用等についても検討する 必要があると考えている。 4.4 畳み込みニューラルネットワークによる回帰 これまでの例から、畳み込みニューラルネットワー ク(CNN)は分類、多層パーセプトロン(MLP)は 回帰と分担が決まっているような印象を持つ向きが あるかも知れない。しかし、CNN も MLP も分類、 回帰のどちらにも使用できる。 中根研究室においても、2017 年 4 年生の松浦栄 理さんが、ひまわり 7 号の可視雲画像から全天日射 量の推定モデルを作成し、雲量の多い場合を除いて 良好な再現が可能であることを確認した23)。市街地 と雲の輝度が同じように高いことが雲量の多い場 合の誤差もたらしていると考えられる。ひまわり 8 号のいくつかのチャンネルを組み合わせた画像を使 用する等により、改良が可能であると考えている。
5. おわりに
世の中は解決したい課題で溢れているが、解決す るための技術は多くの専門分野に細分化され、精 緻さを競っている。本質を把握すれば、なるべく汎 用性の高い技術によって課題の解決に近づけない か、と常々考えてきた。その時、深層学習(ディー プラーニング)に出会った。大きな可能性を感じた。 2016 年は、それ程のコストをかけることなく深層 学習のための計算機環境を整備することが可能に なった時期であったことは幸いであった。 私達はたまたま Keras/ Tensorflow のフレームワー クを用いて深層学習用のプログラムを作成したが、 Chainer やその他のフレームワークでも同様の成果 が得られたかもしれない。これらの多様なオープン ソースを開発して下さった技術者たちに、心から感 謝したい。この報告書においてなるべく具体的で詳 細な記述を心がけたのは、少しでもお返したい、こ れから深層学習に取り組む方々のお役に立ちたいと 考えたからである。このオープンソースの生態系が 「共有地の悲劇」の対象になるのではなく、多様性 を持った持続可能な生態系であり続けることを願っ ている。また、この生態系が、人間社会にとって、 持続可能性を支える重要な構成部分であることを 願っている。 この研究に貢献した教員、研究者、学生は余りに も多い。本報告はプロジェクト立ち上げに関する報 告であるため、立ち上げそのものに関わった中根と 若槻が代表して報告させて頂いた。関係者のご理解 を賜れば幸いである。謝辞
深層学習に取り組むきっかけを作ってくださった 大阪大学三宅淳教授と三宅研究室の皆様に深く感 謝します。「このような問題に、このように取り組 めば、このような結果が得られる」という具体例や データを示して頂いたお陰で、プロジェクトを軌道 に乗せることが可能になりました。 実際にデータを吟味し、プログラムを改良して 様々なテーマに取り組んで下さった、中根研究室大 学院生、学生の皆さん、小島慶之君、明田啓暉君、 林良真君、増本雄大君、松浦栄理さんによって、こ の研究分野の多様な可能性を示すことがでました。 ありがとうございます。 河川に関してご教示頂いた高知工科大学経済・マ ネジメント学群那須清吾教授、吉村耕平助教、デー タサイエンス、気象、シミュレーションに関してディ スカッションして下さった、高知工科大学環境理工 学群、古沢浩教授、柴田清孝教授、全卓樹教授、中 前久美氏に感謝いたします。ドローン空撮画像と画 像に関する情報を提供して下さった、システム工学 群高木方隆教授、赤塚慎准教授、地域連携機構村井 亮介研究員に感謝いたします。また、河川データを 提供して下さった高知県土木部河川課のご協力が あって、初めてこの研究が可能になりました。お礼を申しあげます。 気象データ、河川データに関わる観測、整備等に 携わる方々なしにはこのような研究はあり得ません でした。深く感謝する次第です。 本研究を行う場を与えて下さった高知工科大学に はお礼の申しようもありません。なお、本研究の一 部は、「SI-CAT 気候変動適応技術社会実装プログラ ム」の一環として実施されております。
文献
1) 情報処理推進機構, “第 1 章 技術動向”, AI 白書 2017, pp. 15–166, 2017. 2) 高知工科大学環境理工学群ホームページ, “理工 学のフロンティア”, URL= http://www.scsci. kochi-tech.ac.jp/frontier.html3) J. Miyake, Y. Kaneshita, S. Asatani, S. Tagawa, Shimoda, H. Niioka and T. Hirano, “Graphical classification of DNA sequences of HLA alleles by Deep learning”, Human Cell, published online, URL= https://link.springer.com/article/ 10.1007/s13577-017-0194-6, 2018.
4) H. Niioka, S. Asatani, A. Yoshimura, H. Ohi-gashi, S. Tagawa, and J. Miyake, “Classifica-tion of C2C12 cells at differentiation by convolu-tional neural network of deep learning using phase contrast images”, Human Cell, published online, URL= https://link.springer.com/article/ 10.1007%2Fs13577-017-0191-9, 2017. 5) 岩井尚晴, 浅谷学嗣, 田川聖一, 新岡宏彦, 三宅淳, “ニューラルネットワークを用いた日平均気温の 予測”, 気象学会 2016 秋季大会予稿集, 2016. 6) 藤田一弥, 高原 歩, “実装 ディープラーニング”, オーム社, 2016.
7) Qiita, “TensorFlow が 正 式 に Windows サ ポ ー ト して GPU が使えたので試してみた”,
URL = https://qiita.com/tilfin/items/ 24e9491eb8a4ce42eea6, 2016.
8) Keras Documentation ホームページ, URL= https://keras.io/ja/.
9) F. Chollet, “Software/hardware requirement”, Deep Learning with Python, Manning, 2018.
10) 岩井尚晴, “気象に対する Deep Learning の応用 —100∼1000 km 圏の解析—”, 大阪大学基礎工学 部システム科生物工学コース三宅研究室平成 28 年度卒業論文, 2017. 11) 日本気象協会ホームページ, “過去天気”, URL = http://www.tenki.jp/past/2013/01/ ?selected_type=satellite. 12) 若槻祐貴, 小島慶之, 中根英昭, 岩井尚晴, 田川聖 一, 新岡宏彦, 三宅淳, “ディープラーニングの環 境分野への応用—降水現象を例として—”, 日本 環境共生学会第 20 回記念(2017 年度)学術大 会論文集, pp. 1–6, 2017. 13) 国土交通省, “国土交通省水門水質データベース, 任意期間ダム諸量検索−”, URL = http://www1.river.go.jp/cgi-bin/ SrchDamData.exe?ID=1368080700010.
14) A. Gulli and S. Pal, “regression network”, Deep Learning with Keras, pp. 223–228, Packt, 2017. 15) 若槻祐貴, “ディープラーニングによる高知市の 降水現象の有無の判別と早明浦ダムの流入量推 定”, 高知工科大学環境理工学群平成 29 年度卒 業論文, 2018. 16) 気象庁ホームページ, URL = http://www.jma.go.jp/jma/kishou/ know/kurashi/kaiseki.html. 17) 小島慶之, “ディープラーニングを用いた安田川 の水位推定モデル”, 高知工科大学大学院工学研 究科基盤工学専攻物質生命システム工学コース 平成 29 年度修士論文, 2018. 18) 林良真, “深層学習による高知市鏡ダム下流宗安 寺観測所の水位推定モデル”, 高知工科大学環境 理工学群平成 29 年度卒業論文, 2018. 19) 一言正之, 櫻庭雅明, 清雄一, “深層学習を用いた 河川水位予測手法の開発”, 土木学会論文集 B1 (水工学), Vol. 72, No. 4, pp. I 187–I 192, 2016. 20) F. Chollet, “Xception: Deep Learning with
Depth-wise Separable Convolutions”, URL = https:// arxiv.org/abs/1610.02357v3, 2017. 21) 明田啓暉, “深層学習/転移学習を用いた 3 種のユ リ科の花の判別”, 高知工科大学環境理工学群平 成 29 年度卒業論文, 2018. 22) 増本雄大, “転移学習を用いたドローン空撮画像 による樹種判別”, 高知工科大学環境理工学群平 成 29 年度卒業論文, 2018. 23) 松浦栄理, “深層学習(CNN)による高知の全天 日射量推定モデル”, 高知工科大学環境理工学群 平成 29 年度卒業論文, 2018.
Startup of Deep Learning Application to
Environmental Research
Hideaki Nakane
1∗Yuki Wakatsuki
2(Received: May 7th, 2018)
1
School of Environmental Science and Engineering, Kochi University of Technology
185 Miyanokuchi, Tosayamada, Kami City, Kochi 782–8502, JAPAN
2
Graduate School of Engineering, Kochi University of Technology
185 Miyanokuchi, Tosayamada, Kami City, Kochi 782–8502, JAPAN
∗
E-mail: [email protected]
Abstract:We implemented a computing environment for deep learning, a form of artificial intelligence technology, at the Nakane Laboratory in the second half of FY 2016. In FY 2017, deep learning technologies were successfully applied to various environmental research themes. We developed regression and classification models for the following targets. For regression, we used the amount of inflow into the Sameura Dam, the water level of the Yasuda River, the water level of the Kagami River, and the total amount of solar insolation in Kochi. The targets of classification were the presence/ absence of precipitation in Kochi, three species of flowers/ lilies, and forest tree species. Although our objective is diverse, we could create estimation models using two kinds of deep learning methods; multilayer perceptron (MLP) and convolutional neural network (CNN). In regression cases, it was shown that the water levels and the inflow amounts to the dam during entire periods from flooding to droughts can be well predicted using the MLP models. The CNN models with transfer study demonstrated performance equivalent to or better than humans for classification of tree species.