2. 新聞報道を対象としたテキストマイニングによる災害時情報ニーズの把握
2.4. 地方紙と全国紙を対象としたライフライン関連記事の基礎的な分析
2.4.1. 記事群全体を対象とした頻出語の集計
分析対象期間全体(全フェーズと表記)を対象として形態素解析を行い,2紙の頻出語を集計した.
そのうち上位60位までの結果を図 2.4に示す.
地方紙ではライフラインに関する用語として水(23位,66回)と断水(42位,49回)のほかに,
図示は省略するが上位150位以内までにガス(121位,26回),停電(121位,26回)が入っている.
一方,全国紙では,ライフラインに関する用語は上位150位まで対象を拡張しても水(70位,168回)
が現れるのみである.
(a) 地方紙,1~30位 (b) 地方紙,31~60位
(c) 全国紙,1~30位 (d) 全国紙,31~60位
(活用を持つ語は,すべて基本形として抽出・集計11)) 図 2.4 2紙の4月15~30日における上位60位までの頻出語
210 163 156 135 132 130 130 124 118 93 92 88 84 82 81 80 80 79 79 78 72 70 66 66 66 66 65 63 61 60
0 50 100 150 200 250 熊本市
熊本地震 地震県 避難所 熊本 再開 被害 県内 復旧 益城町 午前 話す 避難 震度 南阿蘇村 発生 一部続く 午後 支援 被災者 確認 受け 水 被災 人 市 施設 家屋
60 59 57 54 53 53 52 51 51 50 50 49 49 47 47 45 45 44 44 44 43 43 43 43 42 42 41 41 41 41
0 50 100 150 200 250 出る
余震 多い現在 作業 捜索 影響 倒壊 避難者 女性 必要 ほか 断水 中央区 病院 営業 状態 九州情報 状況 阿蘇 供給 自宅 地域 センター 同市 以上 現場 受ける 続ける
1377 1078 684 608 579 518 510 482 478 459 419 406 351 343 342 334 317 307 306 304 290 286 284 284 284 273 272 268 267 261
0 500 1000 1500 2000 地震
熊本県 支援 県 熊本地震 被害 避難所 人 熊本市 熊本 被災地 話す 益城町説明 被災者 活動 午前 写真 起きる 派遣 必要 震度 午後 続く 避難 発生 被災物資 前 受け
258 254 251 242 238 231 231 230 227 226 224 220 220 213 212 209 208 203 202 197 195 194 192 189 188 187 187 184 184 184
0 500 1000 1500 2000 職員
出る 災害 発表 県内 復旧 余震 思う 九州 揺れ 東日本大震災 確認 予定対応 受ける 再開 状況 義援金 募金 送る 情報 本震 自宅 以上 影響 倒壊 工場入る 多い 内
31
2.4.2. ライフラインに関する頻出語の時系列推移
前項で集計した2紙の上位150位までの頻出語のうちライフラインに関連する語(停電・断水・ガ ス)の順位について各フェーズと全フェーズの結果を図 2.5に示す.
地方紙の各フェーズに着目すると,停電はフェーズ 2 でピークを迎え,その後はランク外となっ た.断水もフェーズ 2でピークを迎え,フェーズ4でランク外となった.ガスはフェーズ 1で出現 後,フェーズ2ではランク外となり,フェーズ3で再度出現後,フェーズ5でピークを迎えた.この ように,関心が停電,断水,ガスと移行したことがわかる.一方,全国紙では停電がフェーズ1のみ ランク内となったほかは,すべてランク外である.全フェーズを対象にした場合は,ライフライン関 連の語は地方紙でのみ出現している.
(a) 地方紙 (b) 全国紙
(4月15~30日,上位150語)
図 2.5 2016年熊本地震と供給系ライフライン(停電・断水・都市ガス停止)に関する頻出語の順位 の推移
2.4.3. 自己組織化マップによる記事群の概要の把握
記事群の概要を把握するため,自己組織化マップ14)を作成した.自己組織化マップとは,教師なし ニューラルネットワークアルゴリズムの一種で,高次元データを 2 次元平面上へ非線形写像するデ ータ解析方法である.KH Coder11)では,文書の頻出語を用いて出現パターンが似通った言葉ほど近く に布置される言葉のマップを指す.
2 紙の頻出語を用いて自己組織化マップを作成した(図 2.6).さらに自己組織化マップの解釈補注
[2]を容易にするため,ノードのクラスター化にはSOM-Ward法を用いた.SOM-Ward法とは,クラス ターに「飛び地」が生じないようにWard法を修正した手法である11).地方紙においては,各クラス ターに含まれる語群から「ライフライン」「都市ガス」「高速道路」「鉄道運休」などの主題が読みと れる.一方で,全国紙においてライフラインに関する主題は,地方紙と比べて少ない.これは熊本地 震の発生そのものや活断層,避難の他に被災地支援,政府対応に関連すると思われる主題を表す頻出 語が多く現れているためである.
52
16
3 1 1 1
2 29
20
121 71
16 18
42
104 100
124 78
90 121 0
25 50 75 100 125 150
1 2 3 4 5 6 7
出現順位
フェーズ
熊本地震 停電 断水 ガス
全 フェーズ 1
4/15 4/16~184/19~21 4/22~24 4/25~27 4/28~30
115
7 6 5 3 3
5
115 0 25 50 75 100 125 150
1 2 3 4 5 6 7
出現順位
フェーズ
熊本地震 停電 断水 ガス
全 フェーズ 1
4/15 4/16~18 4/19~21 4/22~24 4/25~27 4/28~30
32 (a) 地方紙
(b) 全国紙
図 2.6 頻出語を用いた自己組織化マップ
(四角枠は読み取れた主題を図中に記載.赤四角枠は,ライフラインに関連する主題)
33