産業衛生学雑誌 J-STAGE 早期公開 (2018 年 8 月 28 日 ) 1 産業保健における Deep Learning の活用 : 物流企業の職場巡視画像を用いたパイ 2 ロット研究 3 4 ランニングタイトル : 産業保健における Deep Learning の活用 5 6 内田満夫 1

(1)

1 産業保健における Deep Learning の活用：物流企業の職場巡視画像を用いたパイ 1 ロット研究 2 3 ランニングタイトル：産業保健における Deep Learning の活用 4 5 内田満夫 1），野下浩司 2），筒井保博 3)，小山洋 1） 6 7 1）群馬大学大学院医学系研究科公衆衛生学分野 8 2）九州大学理学研究院生物化学部門数理生物学研究室 9 3）日立金属株式会社九州工場健康管理室 10 11 代表者：内田満夫 12 〒371-8511 群馬県前橋市昭和町３－３９－２２ 13 Tel：027-233-8014 Fax：027-233-8016 14 E-mail： [email protected] 15 16 原稿の種類：短報 17 18

(2)

2 表：0 19 図：2 20 21 投稿フィールド：物理的要因/人間工学 22 23 利益相反 24 内田満夫は本研究でデータを収集したトラスコ中山株式会社と嘱託産業医契約 25 を結んでいる。 26 27

(3)

3

Application of a deep learning for occupational health and safety recognition: a pilot 28

study in a logistics industry 29

30

Running title: A deep learning for occupational health 31

32

Mitsuo Uchida 1), Koji Noshita 2), Yasuhiro Tsutsui 3), Hiroshi Koyama 1) 33

34

1) Department of Public Health, Graduate School of Medicine, Gunma University 35

2) Mathematical Biology Laboratory, Department of Biology, Kyushu University 36

3) Health Service Section, Kyushu Industry, Hitachi Metals, LTD. 37

38

Correspondence: Mitsuo Uchida 39

3-39-22, Showamachi, Maebashi City, Gunma Prefecture, 371-8511 Japan 40 Tel: 027-233-8014, Fax: 027-233-8016 41 Email: [email protected] 42 43 Keywords 44

Deep Learning, Artificial Intelligence, Occupational Health, Python, TensorFlow 45

(4)

4 目的 46 近年わが国では，少子高齢化による労働者人口の減少，転職の活性化や派遣 47 業の拡大により労働形態の多様化を認める1)_{。さらに高年齢者の雇用対策}2)_，働 48 き方改革3)_{など，時代に応じた新しい働き方を認め，より柔軟な安全衛生活動が} 49 求められている。しかし以前より，わが国の労働災害の減少率が鈍化傾向にあ 50 ること，熟練社員の退職によりノウハウが継承されず安全管理を担う人材不足 51 が危惧されていること，産業の高度化などに伴い多様化するリスクに十分対応 52 できないこと等の課題が存在し，事業場における新しい安全衛生管理が必要と 53 されてきた4)_{。さらには，平成 29 年の労働災害発生状況の総数を見ると，前年} 54 と比較して死亡件数は 5.4％，休業 4 日以上の死傷災害は 2.2％増加しており5)_， 55 今後も継続的な労働災害の予防の取り組みが必要とされている6)_。 56 これらと並行して，コンピュータ技術の発達とともに，2010 年ころより第 3 57

次人工知能（Artificial Intelligence: AI）ブームが沸き起こり，インターネットの 58

検索エンジンやスマートフォンの音声応答など，私たちの生活の身近なところ 59

に浸透し始めている7)_{。特に，AI の主要構成要素である「Deep learning (深層学}

60 習)」は，人の脳の神経細胞を模倣したニューラルネットワーク構造をより深い 61 階層によって表現した技術であり8)_{，ヒトの視覚や聴覚を補う技術として広く活} 62 用されている。画像解析を得意とする深層学習は，医師の視覚を必要とする技 63

(5)

5 術と親和性が高く，医学研究では画像解析診断学領域で使用され始めた9-11)_。臨 64 床医学現場でもその有用性が認められ，わが国の重点課題として推進される傾 65 向にある 12)_{。これらと同様に，産業保健分野でも熟練者の視覚による評価や判} 66 定が重要な役割を果たしている。したがって産業保健分野にも人工知能の活用 67 が期待されるが13)_{，しかしながら，2018 年 6 月時点で，同分野における深層学} 68 習の議論や研究は国内外ともに乏しい。 69 以上より，労災の予防が喫緊の課題である現在，わが国の安全衛生活動の推 70 進のために，新たな手法である深層学習の可能性を知ることが必要である。わ 71 が国の産業保健現場で深層学習の報告が乏しいのは，有用性について認識しな 72 がらも，深層学習を用いて具体的にどのような研究ができるのか不明瞭であっ 73 たためと推察される。本報告は，職場巡視で得た画像を用いて，産業保健分野 74 における深層学習の可能性を探ることを目的とした。 75 76 対象と方法 77 画像データの収集 78 2018 年 3 月と 4 月に，群馬県の物流企業 1 社において職場巡視をおこなった。 79 今回は作業通路の床面を対象に，4S（整理，整頓，清掃，清潔）の状況の良否 80 を判定した。深層学習では，多量のデータを機械学習させ，専門家の達観によ 81

(6)

6 る分類を画像認識技術で模倣することが可能となっている。このたび研究者は， 82 職場巡視の際に床面の画像を撮影しながら，作業通路に物が置かれていないか， 83 通路を移動するキャリアやパレットが整頓されているか，また不要なゴミなど 84 がないか評価し，問題なければ良好，それ以外は要改善，と 2 種類の判定をお 85 こなった。撮影条件をそろえるため，全ての画像を研究者一人が同じデジタル 86 カメラを使用し，対象の撮影距離は 5m におさめ，また午後に撮影という条件で 87 60 枚の画像を収集した。 88 89 深層学習の方法 90 職場巡視で得られた物流業の床面の画像 60 枚を，研究者の判定に基づき良好 91 群 27 枚と要改善群 33 枚に 2 分し，画像データと判定区分を紐づけする教師あ 92

り学習を実施した（図 1）。学習におけるコンピュータスペックは CPU が Core i7， 93

メモリが 8GB，使用言語は Python3.6 (ver. 5.1.0) 8)_{を用いた。深層学習ライブラリ}

94

は，世界的に普及しているオープンソースの TensorFlow と TensorBoard （Google, 95

CA, USA）を用いた 14)。画像を学習するネットワークは，畳み込みニューラル 96

ネットワーク(Convolutional Neural Network: CNN)を用いた8, 15)_{。この CNN は，}

97

画像に特徴的な輪郭やパターンを探しながら単純化していく手法であり，画像 98

認識のアプリケーションにおいて最も使用されているモデルである16)_{。CNN の}

(7)

7 プログラムは，その目的に応じて条件を探索しながら研究者が学習ネットワー 100 クを構築するため，標準的なパラメータの数値は確立されていない。このたび 101 の研究では，各種パラメータは TensorFlow のデフォルト設定をベースにし，公 102 開されているチュートリアル 15)_{に沿って修正し，また適宜アレンジしながら決} 103 定した。その結果画像は 224×224 ピクセル，フィルターは 5×5 ピクセルとした。 104 CNN の中間層は 4 層，活性化関数は中間層が Relu 関数，出力層は Softmax 関数 105 を使用した。学習バッチ数は 64，エポック数は 30，最適化は確率的勾配降下法， 106

損失関数は Cross entropy error 法で評価した。 107 深層学習では大量のデータが必要なため，手持ちのデータが少ない場合は画 108 像処理して増幅させることが一般的である。このたび撮影した画像は明度，彩 109 度，コントラスト，画像角度の 5 度と 10 度の回転，左右反転により処理をおこ 110 ない，オリジナルの画像 60 枚から処理後の画像 4810 枚に増加させた。全ての 111 画像のうち，ランダムに 20％をテストデータとして予め抽出し，残りを訓練デ 112 ータとして学習ネットワークを構築した。その後，構築したネットワークに， 113 改めてテストデータを読み込み良好/要改善を判定させ，研究者が先にラベルし 114 た正解結果との一致割合を評価した（学習精度 100％とは，研究者が判定したテ 115 ストデータの良好/要改善ラベルを，学習ネットワークが全て的中させることを 116 意味する）。 117

(8)

8 118 研究倫理 119 本研究は，人を対象とした個人情報が発生する研究ではなく，職場施設の床 120 面を評価する研究のため，倫理審査は不要と判断した。 121 122 結果 123 今回の研究では，研究者による床面の安全衛生の判定と，構築した学習ネッ 124 トワークによる判定の一致割合を 10 回にわたって評価した。その結果，最低で 125 60％，最高で 95％を示した。最も精度の高い学習ネットワークを構築したとき 126 の学習プロセスを図 2 に示す。本研究で使用したコンピュータでは，学習ネッ 127 トワークを構築するのに，１回あたり約 8 時間を要した。 128 129 考察と結論 130 本パイロット研究は，安定的な労働力を確保することが難しい現代のわが国 131 において，持続的な安全衛生活動を推進するため，AI 技術を安全衛生活動の補 132 助的ツールにすることを視野に入れて開始した。本研究では，まず職場巡視で 133 撮影した画像という身近なデータを用いて，研究者による安全衛生の判定と， 134 深層学習で構築した学習ネットワークによる判定の一致割合を検討した。その 135

(9)

9 結果，職場巡視において AI のサポートの有用性を示唆する結果が得られた。 136 本研究で使用した CNN は，画像を単純化すると同時に特徴のある輪郭等を探 137 し出す手法である。今回は 4S をテーマとして研究者が良否を分類したが，深層 138 学習はそこから物品の配置や整列状態の違いを，また不要物の存在や著しい汚 139 れの有無などを画像の特徴量として認識している。したがって，私たち産業保 140 健従事者が職場巡視を実践する際に良否を判断する材料は画像で視覚化できる 141 部分があり，専門家の技術に深層学習を適用することが可能であると推測され 142 る。ただし，床面の 4S 以外のデータは本研究で評価されていないため，引き続 143 き CNN の適用範囲について検討することが必要である。 144 今回の研究では，深層学習による学習精度はネットワークを構築するたびに 145 異なり，最低 60％から最高 95％と幅を認めた。本研究では職場巡視画像を用い 146 るという新たな試みであるため，学習精度が十分であると判断できる閾値は存 147 在しないが，その値は 100％に近いほどよいネットワークであるといえる。しか 148 し，良否の判定という 2 値のアウトカムであることを考慮すると，ランダムに 149 回答（50％）するよりは一貫して高かった，という結果に留まる。学習精度に 150 幅を認めたのは，元の画像枚数が少ないこと，またパラメータ設定に改善の余 151 地があることが推察される。したがって現段階では，本パイロット研究は現場 152 での実用に直結するものではない。今後は画像データのバリエーションを増や 153

(10)

10 して高い学習精度を示すモデルを構築し，さらに頑健性と汎化性を高めていく 154 ことが求められる。 155 わが国で AI 研究を推進するためには，この研究テーマに興味を持つ研究者が 156 議論を活性化させ，基礎的な研究を積み重ねることが必要である。しかし現在 157 のところ産業保健分野における深層学習に関する研究は不足している。したが 158 って，まず本パイロット研究を短報で報告することとした。ここでは，産業保 159 健分野において AI の研究報告が少ない理由を考察せねばならない。筆者らの考 160 えでは以下の 3 点が推察された。 161 ①一般的な仮説検定に基づく因果関係の推定と異なる研究手法であること：開 162 発系の研究は，そのツールの信頼性や妥当性の評価が求められるため，因果推 163 定の研究とは手法が異なる。AI 研究は目的によりアウトカムの表現方法は多様 164 であるが，本研究では深層学習によりヒトの判定を模倣することが目的である 165 ため，判定を的中させる割合という単一の指標で結果を示した。現在のところ， 166 この割合を「学習精度」として表現することで，学習ネットワークの信頼性を 167 示すことができる 15)_{。今後はこの精度を向上させることが，産業保健における} 168 深層学習研究の目標の一つとなるだろう。 169 ②深層学習の方法が煩雑で理解しにくいというテクニカルな問題が存在するこ 170 と：深層学習にはコンピュータが必須であり，条件を設定するためには少々の 171

(11)

11 プログラミングスキルが要求される。今回使用した Python3 は初学者向きの言語 172 としてその地位を確立しており，多くの研究者が比較的取り掛かりやすいと考 173 えられる。 174 ③AI に対する過度の期待と誤認があること：AI における深層学習の技術は，そ 175 の仕組みを見てみると，観察データと推定関数の誤差が最も少なくなるところ 176 を探す方法，と理解することができる。メディアでは，人にとって代わる夢の 177 技術であるかのような表現を散見するが，今のところは決してそのような技術 178 でない。我々研究者が AI を正しく認識することで，適切に利用することが可能 179 となる。 180 本研究は，これらの 3 点をクリアしたことに意義があると考えられる。今後 181 多くの研究が行われ，基礎的研究データが蓄積されると，次は実用化の検討と 182 ルールの整備が必要となるだろう。本学会において，遠からず産業保健と AI に 183 関する活発な議論が始まり，必然的にルールの整備も始まると予想される。ま 184 た産業保健で AI を活用するとしても，安全衛生という性格上「運用上の責任は 185 人に帰属する」ことを留意しなければならない。 186 本研究の限界は，まず教師あり学習につながる研究者の判定が定量評価に基 187 づいていないことである。臨床医学研究では，特定の評価尺度に基づく得点の 188 カットオフポイントから ROC カーブを描き，人と AI の判定精度を比較してい 189

(12)

12 る9, 11)_{。産業保健において，職場画像の定量化は，チェックシートや点数票を用} 190 いることで克服できる可能性もあるが，場面の異なる画像 1 枚ずつに画一的な 191 評価をすることは困難な場合もある。今回は研究者の経験に基づき，良否とい 192 う 2 値で判断することとした。次に，画像を処理して枚数を増加させたため， 193 学習ネットワークがデータセットに依存する“過学習”の問題がある。これは， 194 今回の結果が変動することからも，その影響が疑われる。引き続きデータを収 195 集して多様な場面を学習させることで制御することが可能となる。これらを解 196 決するため，今後の研究のテーマとして設定することが必要である。 197 以上より，産業保健分野において深層学習の技術を活用することは可能であ 198 ると考えられる。今後 AI は，高年齢労働者の増加や働き方の多様化する労働現 199 場において，安全衛生の取り組みを補完する技術として応用できる可能性が高 200 い。今後は技術開発だけでなくルールも整備することで，将来的に AI は安全衛 201 生活動のよきサポーターとなることが期待される。 202 203 本研究の一部は，第 91 回日本産業衛生学会（熊本，2018）で発表した。 204 205 引用 206 1) 厚生労働省: 平成 26 年就業形態の多様化に関する総合実態調査の概況. 207

(13)

13

[Online]. 2014 [cited 2018 May 24]; Available from: 208

http://www.mhlw.go.jp/toukei/itiran/roudou/koyou/keitai/14/dl/gaikyo.pdf 209

2) 厚生労働省: 高年齢者雇用対策. [Online]. 2018 [cited 2018 May 24]; Available 210 from: 211 http://www.mhlw.go.jp/stf/seisakunitsuite/bunya/koyou_roudou/koyou/koureisha/index. 212 html 213

3) 厚生労働省: 「働き方改革」の実現に向けて. [Online]. 2018 [cited 2018 May 24]; 214

Available from: http://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000148322.html 215

4) 厚生労働省: 労働安全衛生マネジメントシステムとは. [Online]. 2012 [cited 216

2018 May 24]; Available from: 217

http://www.mhlw.go.jp/bunya/roudoukijun/anzeneisei14/dl/msh24jirei1_100.pdf 218

5) 厚生労働省: 平成 29 年の労働災害発生状況を公表. [Online]. 2018 [cited 2018 219

May 24]; Available from: https://www.mhlw.go.jp/stf/houdou/0000209118.html 220

6) 厚生労働省: 第 13 次労働災害防止計画について. [Online]. 2018 [cited 2018 221

May 24]; Available from: 222

http://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000197308.html 223

7) 株式会社野村総合研究所: ICT の進化が雇用と働き方に及ぼす影響に関する 224

調査研究報告書 . [Online]. 2016 [cited 2018 May 24]; Available from: 225

(14)

14

http://www.soumu.go.jp/johotsusintokei/linkdata/h28_03_houkoku.pdf 226

8) 斎藤康毅. ゼロから作る Deep Learning. 東京: オライリー・ジャパン, 2016 227

9) Gulshan V, Peng L, Coram M, et al. Development and Validation of a Deep Learning 228

Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs. JAMA 229

2016;316: 2402-2410. 230

10) Enlitic: Enlitic uses deep learning to make doctors faster and more accurate. 231

[Online]. 2018 [cited 2018 May 24]; Available from: https://www.enlitic.com 232

11) Haenssle H, Fink C, Schneiderbauer R, et al. Man against machine: diagnostic 233

performance of a deep learning convolutional neural network for dermoscopic 234

melanoma recognition in comparison to 58 dermatologists. Ann Oncol 2018;(Advanced 235

publication) 236

12) 厚生労働省: データヘルス改革 ICT・AI 等を活用した健康・医療・介護の 237

パラダイムシフトの実現. [Online]. 2017 [cited 2018 May 24]; Available from: 238 http://www.mhlw.go.jp/file/05-Shingikai-12401000-Hokenkyoku-Soumuka/000016514 239 0.pdf 240 13) 征矢敦至. AI やロボットが産業医の仕事を奪う？. 産業医学ジャーナル 241 2018;41: 80-82. 242

14) Google: An open source machine learning framework for everyone. [Online]. [cited 243

(15)

15

2018 May 24]; Available from: https://www.tensorflow.org/ 244

15) TensorFlow: Tutorials. [Online]. 2018 [cited 2018 May 24]; Available from: 245

https://www.tensorflow.org/tutorials/ 246

16) Francois C. Python と Keras によるディープラーニング. 東京: マイナビ出版, 247

2018: 123. 248

249

(16)

16 図 1 教師あり学習のイメージ 251 研究者が職場巡視で得た画像を「良好」と「要改善」に 2 分して，それぞれ 252 の画像と判定結果を紐づけした。そのデータセットから画像の特徴をコンピュ 253 ータが学習して，学習ネットワークを構築した。 254 255 図 2 学習精度の向上を表示 256 TensorBoard 14)_{を利用すると，学習プロセスを視覚的に表現することが可能で} 257 ある。今回の研究では，最高で 95％の一致割合を示した。X 軸はトレーニング 258 ステップ（画像を数値データに変換して推定した良否の判定結果と，実際の判 259 定結果の誤差を少なくするために繰り返される計算の回数），Y 軸は学習精度（判 260 定の一致割合）を表している。 261 262

(17)

職場巡視の画像データ

(18)