Twitter 上の新型コロナウイルス関連語句の分析
―2度目の緊急事態宣言前後の動向に焦点をあてて―
峰 滝 和 典
要旨 本稿では2度目の緊急事態宣言発令前後の Twitter 上での反応を時系列でみることで,
この時期人々がより新型コロナウイルス感染の影響に関心を持っていたことがわかった。医 療リソースや病状,死に関する語句の割合が2020年12月に入って急増している。ネガティブ 感情とポジティブ感情の割合差が感染者数の先行指標となることがわかった。
Abstract This research analyzed tweets on Twitter about the period of the second Declaration of the State of Emergency choronologically, and found that people con- cerned the infection of COVID19 more than ever. The ratio of words related to medical resources, symptoms, and death has surged since December in 2020. It was concluded that the difference between negative and positive emotion could be consid- ered as the leading indicator which predicted the increase of infection.
キーワード 新型コロナウイルス,Twitter,形態素分析 原稿受理日 2021年1月31日
1.は じ め に
2021年1月7日に2度目の緊急事態宣言が1都3県に対して発令された。1
月13日に7 つの府県を加え対象は11都府県に拡大した。本稿の一つの目的は,この2度目の緊急事態 宣言発令前後の Twitter 上での反応を時系列でみることである。昨年11月後半以降,PCR 検査陽性者数,新型コロナウイルスによる死亡者数累計ともに増加が加速し,12月後半,
さらに増加幅が拡大した(図1,図2)。
インターネット上に大量の情報が氾濫し実社会に影響を与える現象をインフォデミック と呼ばれている。新型コロナウイルスに関する情報はソーシャルメディア上でも大量に流 れている。ソーシャル・メディア が新型コロナウイルスのパンデミックに影響している
(Ahmad A. R. et al.(2020))。
鳥海・他(2020)は2020年1月17日から4月30日の期間中,40,720,545ツイートと105,317,606 リツイートの計146,038,151件のデ-タを対象に分析している。ツイートユーザーの偏りを 検出し,新型コロナウイルスのツイートがいつ頃から一般的な人々によって投稿されたの かを考慮した上でリツイートと URL を含むツイートを除いたものを対象として,感情の
Su Yue et al.(2020)は,中国武漢とイタリア・ロンバルディにおける新型コロナウイルスに よるロックダウンの影響について,Weibo と Twitter を用いて分析している。
図1 PCR 検査陽性者数(単日) 人
(出所)厚生労働省
時間変化を分析している。
Lwin M. O. et al.(2020)は新型コロナウイルスのパンデミック中の Twitter 上の人々 の感情について恐怖,怒り,悲しみと喜びの4つの世界中のトレンドを検証している。
Alaa Abd-Alrazaq et al.(2020)は Twitter 上の新型コロナウイルスに関する投稿を,
新型コロナウイルスの発生地,感染源,人々と国への影響,そして抑制方法の4つに分類 している。
四方田(2020)は2020年1月15日から2020年3月17日の期間のツイートを対象としてい る。ツイート投稿内容から,「新型コロナウイルスの感染拡大は,人々のウイルス感染の 不安に加え,生活の変化や制限,報道内容や社会情勢の不安定さによる不安や疲労感,ス トレスを生じさせていた実態が示唆された」と述べられている。
峰滝(2020)は,第1回緊急事態宣言解除後のツイートを分析している。抽出語の分析,
共起ネットワーク,階層的クラスター分析を行った結果,Twitter のツイート上,緊急事 態宣言解除後,経済活動の再開に対する期待を感じる反面,新たな感染者の出現に関する 関心の高まりが観測できたという。Minetaki(2020)は2020年5月21日から2020年8月15 日のツイートを対象として,ポジティブ感情が2020年6月以降減少し,2020年7月以降,
死,重症といった語句が急増していることを分析している。峰滝(2020),Minetaki(2020)
はともに,第1回緊急事態宣言解除によってツイート上の人々の関心が経済活動より,む しろ新型コロナウイルス感染に関する懸念に向けられていることを分析している。本稿は,
峰滝(2020), Minetaki(2020)の続編に位置づけられている。
図2 新型コロナウイルスによる死亡者数累計 人
(出所)厚生労働省
2.デ ー タ 分 析
今回用いる Twitter のツイートデータ は峰滝(2020),Minetaki(2020)と同様2020 年5月21日に大阪府・京都府・兵庫県の緊急事態宣言解除決定の日から開始し,2021年1 月31日までのデ-タである。
Twitter のツイートデータにはリツイートのデータも含まれるが,同じ文章の繰り返し をサンプルに入れることを避けるために,リツイートは除いた。1
カ月を3つの期間に分 け合計5,279,612ツイートを対象とした。取得したツイートについて,MeCab を Python から使用して形態素分析を行った。形態素分析の結果を16カテゴリー(表1)に分類した 結果が表2である。 表4は100ツイートあたりの語数に変換した値である。全ツイートを 取得していないので,ツイート数で除することで期間毎の比較を試みた。
表4によると,13.ポジティブ感情が2020年6月第2期にピークとなり,2020年8月第 2期まで下落トレンドとなり,その後,2020年11月にやや高い値となっている。2020年11 月は,政府の“Go To トラベル”,“Go To イート”政策が人々の外出を促した効果が出 ていることが伺える。それに対して1.ウイルス・感染・変異と3.医療施設・スタッフ はそれぞれ2020年12月第2期,12月第1期に急上昇している。5.症状・病状は,2020年 11月3期に急上昇している。人々の活動が活発になり,新型コロナウイルスの感染が広ま
り,医療施設の負担が大きくなったことを示唆している。
カテゴリー1(ウイルス,感染,変異)の100ツイートあたりの頻出度をグラフ化した ものが図3である。7
月第2期から12月第1期まで安定して推移していたが,12月第2期 以降上昇傾向がみられる。
カテゴリー2の感染収束とカテゴリー14の所得, 雇用, 経営, 経済の100ツイートあた りの頻出度は,5
月第3期がピークとなっている。第一回緊急事態宣言解除の直後にツ イート上の人々の関心がいったん経済要因に向けられたものと考えられる。
カテゴリー3(医療施設・スタッフ),カテゴリー5(症状・病状),カテゴリー7(死)
の100ツイートあたりの頻出度を表したものが図4である。とりわけカテゴリー7(死)
が11月第3期以降強い上昇傾向がみられる。カテゴリー3(医療施設・スタッフ)は12月
Chen Emily et al.(2020)は,複数言語で1億2,300万ツイートの新型コロナウイルス・デー タセットを構築している。
表3に各期のツイート数とその合計を掲載している。
16. オリンピック15. 旅行, 会食
14. 所得,雇用, 経営,経済
13. ポジティブ 感情
12. 命,健康11. その他マイナ ス感情とそれ をひき起こす 言葉
10. ストレス, 疲労,鬱, 不安
9. 恐怖, 怒り, 抗議
8. デマ, 誹謗中傷, 偏見,差別, 監視
7. 死6. 予防,検査, 対策
5. 症状, 病状
4. ワクチン,薬, 副作用
3. 医療施設, スタッフ
2. 感染収束1. ウイルス, 感染,変異 五輪 オリンピック旅行 観光 会食
給付 給料 ボーナス 収入 アルバイト 採用 解雇 失業 景気 経営 株 株価 株式 減収 資金繰り 潰れる 倒産 金融 金利 決算 減税 破産 破綻 廃業 補償 経済 ビジネス
ありがたい 幸い 幸せ 感謝 感動 敬意 共感 連携 励ます 喜ぶ 嬉しい 楽しい 楽しみ 楽しむ 楽しめる
命 生きる 生き抜く 健康
嫌い 最悪 絶望 テロ テロリスト 戦争 戦
疲れ 疲れる 疲弊 しんどい ストレス ダメージ 諦める 苦しい 苦しむ 辛い 悩む つらい 不安 不満 うつ 鬱 心配 迷惑
恐れ 恐れる 恐ろしい 恐怖 こわい 怖い 怖がる 危ない 危険 怒り 怒る デモ 非難 暴動
デマ 陰謀 隠蔽 ゲイツ 誹謗 中傷 煽る 偏見 差別 監視
死 死亡 死去 死ぬ 亡くなる 急死 訃報 死者 死因 葬儀 葬 自殺 悲報
予防 隔離 検疫 検温 検査 換気 手洗 手洗い 消毒 通気 マスク シールド 体温計 時短 特措法
ぜんそく 咳 喘息 肺炎 血栓 倦怠 後遺症 梗塞 合併症 嗅覚 嘔吐 発熱 熱 味覚 炎症 重症 疾病 症状 症例 急変
ワクチン ファイザー 塩野義製薬 副作用 アナフィラキシー アレルギー ステロイド 医薬品 特効薬
院内 病院 総合医療センター ICU 救急 病床 病棟 入院 医師 医者 専門医 看護
収まる 収束 終息 弱毒 陰性
武漢 コウモリ 病原 毒素 遺伝子 突然変異 異変 新種 変異 感染 飛まつ 飛沫 濃厚接触 うつす うつる クラスター パンデミック 蔓延 陽性
表1 新型コロナに関する用語分類
表2 各カテゴリーごとの新型コロナ関連語句数の推移
8.
デマ,
誹謗中傷,
偏見,差別,
監視 7.
死 6.
予防,検査,
対策 5.
症状,病状 4.
ワクチン,
薬,副作用 3.
医療施設,
スタッフ 2.
感染収束 1.
ウイルス,
感染,変異 期
月 年
7,874 34,790
57,151 17,099
9,032 21,692
12,504 168,934
3 5 2020
2,886 9,747
22,315 5,723
2,276 6,892
10,781 37,319
1 6 2020
3,518 18,839
38,195 10,598
5,038 10,602
13,494 64,263
2 6 2020
3,243 14,374
29,581 9,795
4,893 9,611
10,452 62,988
3 6 2020
2,477 11,761
29,777 13,459
3,921 12,111
9,707 99,298
1 7 2020
2,390 14,704
26,352 20,318
4,927 10,624
6,237 113,442
2 7 2020
2,476 15,078
36,890 19,860
6,924 13,894
8,455 157,256
3 7 2020
4,334 16,439
38,298 20,522
9,022 15,461
7,892 144,269
1 8 2020
3,162 17,710
28,304 19,844
8,302 12,016
5,191 127,360
2 8 2020
4,853 16,303
34,046 20,403
10,005 13,221
6,530 127,955
3 8 2020
3,246 13,872
28,523 12,269
9,789 9,245
4,700 91,433
1 9 2020
1,805 9,504
19,714 9,279
5,078 7,140
2,749 73,069
2 9 2020
1,156 10,718
16,792 7,188
3,539 4,871
2,578 64,112
3 9 2020
1,249 11,005
19,661 10,245
4,260 7,131
2,830 72,231
1 10 2020
1,319 9,307
19,422 7,522
4,958 5,286
2,725 73,205
2 10 2020
1,632 9,923
19,777 9,029
4,843 5,336
2,382 72,603
3 10 2020
1,220 8,950
18,514 10,034
11,172 5,406
2,885 78,016
1 11 2020
1,545 11,959
24,216 11,535
10,430 10,140
3,112 107,187
2 11 2020
1,845 14,004
21,783 14,873
7,878 12,159
2,801 89,246
3 11 2020
1,192 15,664
17,623 13,126
10,707 19,265
2,463 75,790
1 12 2020
3,054 32,056
39,054 26,941
28,064 27,379
5,223 206,265
2 12 2020
4,991 44,865
50,959 33,782
22,749 39,875
9,149 306,202
3 12 2020
3,436 42,511
47,522 38,397
23,898 33,637
10,114 279,720
1 1 2021
4,724 46,338
52,764 37,511
28,497 49,544
7,959 262,477
2 1 2021
4,465 52,742
47,643 33,227
60,190 40,789
7,003 233,699
3 1 2021
16.
オリンピック 15.
旅行,会食 14.
所得,雇用,
経営,経済 13.
ポジティブ 感情 12.
命,健康 11.
その他マイナ ス感情とそれ をひき起こす 言葉 10.
ストレス,
疲労,鬱,
不安 9.
恐怖,怒り,
抗議 期 月 年
2,587 4,967
43,601 10,605
6,415 5,851
9,096 10,580
3 5 2020
1,208 3,397
21,476 13,245
4,051 2,385
12,268 11,399
1 6 2020
3,528 5,890
37,185 22,258
7,212 4,230
21,318 18,390
2 6 2020
2,239 5,430
31,509 18,715
6,026 3,701
17,437 15,868
3 6 2020
2,223 5,009
26,639 13,549
6,125 3,103
17,378 15,905
1 7 2020
1,370 8,766
20,042 5,640
3,521 3,342
8,502 10,233
2 7 2020
2,608 8,404
18,961 5,415
3,951 3,106
8,901 9,678
3 7 2020
1,159 5,546
16,139 7,475
4,813 3,394
7,780 9,765
1 8 2020
810 3,297
14,047 3,598
3,318 2,872
4,219 6,903
2 8 2020
1,315 4,509
15,926 8,471
4,846 2,634
6,406 6,360
3 8 2020
3,877 2,424
15,374 6,380
4,039 2,639
4,917 4,452
1 9 2020
509 2,875
9,141 3,194
1,914 1,240
2,491 2,689
2 9 2020
1,147 2,710
9,420 3,459
1,995 1,150
2,388 2,557
3 9 2020
496 2,285
9,450 3,720
2,040 1,491
2,546 2,907
1 10 2020
645 2,441
10,716 4,047
2,157 1,691
3,198 2,439
2 10 2020
992 3,292
12,676 3,632
1,872 1,493
2,592 2,808
3 10 2020
762 2,897
10,820 5,606
2,531 1,553
4,284 3,147
1 11 2020
1,494 5,266
13,916 3,815
2,716 1,494
3,569 4,194
2 11 2020
1,007 4,450
12,425 6,006
3,034 1,359
4,360 3,266
3 11 2020
1,214 3,396
10,082 4,310
2,675 1,316
3,812 2,675
1 12 2020
1,284 10,168
13,927 3,214
3,845 2,203
4,573 7,438
2 12 2020
3,604 6,919
19,671 7,052
6,306 2,713
7,583 9,885
3 12 2020
5,895 10,073
23,839 4,104
6,769 3,397
5,810 9,376
1 1 2021
4,893 7,618
24,305 3,990
6,723 3,899
5,486 12,614
2 1 2021
6,528 6,333
23,368 4,507
5,719 3,008
7,499 8,371
3 1 2021
表3 各期のツイート数の推移
各期総ツイート数 期
月 年
243,315 3
5 2020
218,342 1
6 2020
331,883 2
6 2020
312,999 3
6 2020
293,461 1
7 2020
197,901 2
7 2020
232,585 3
7 2020
241,189 1
8 2020
175,216 2
8 2020
213,966 3
8 2020
174,218 1
9 2020
111,286 2
9 2020
100,186 3
9 2020
114,627 1
10 2020
113,204 2
10 2020
115,597 3
10 2020
132,912 1
11 2020
144,755 2
11 2020
146,818 3
11 2020
125,916 1
12 2020
249,182 2
12 2020
334,913 3
12 2020
331,184 1
1 2021
329,919 2
1 2021
294,038 3
1 2021
5,279,612 総 計