マルチエージェ ン ト 感染シミ ュ レ ーショ ン における 人口分布偏在
影響の反映
How to Reflect Effects of Ununiform Distribution in Multiagent
Pandemic Simulation
野田五十樹
1∗鷹見竣希
2,1大西正輝
1,2 1産業技術総合研究所 人工知能研究セン タ ー
1AIRC, AIST
2筑波大学
2University of Tsukuba
Abstract: 人口分布の偏り に よ り 生じ る 感染過程への影響を 統計的に 同定し 、 そ れを マ ルチエー ジェ ン ト 感染シミ ュ レ ーショ ン に反映する 方法を 提案する 。 COVID-19 のよ う な 感染過程が見え に く い感染症に対し ては、 人の移動モデルを 用いた感染拡大シミ ュ レ ーショ ン が対策立案の重要なツ ー ルと なる 。 こ れら のシミ ュ レ ーショ ン では人の分布や移動について ある 程度の一様性の過程がある 。 一方、 実際の人の空間的分布にはかなら ず偏り があり 、 携帯端末によ る データ でのその偏り を 確認で き る 。 こ の偏り は人口密度の偏り と し て、 感染拡大に大き な影響を 与える 。 本稿では、 こ の影響につ いて 統計的に分析し 、 シミ ュ レ ーショ ン にそれを 反映さ せる 方法を 提案し 、 さ ら にシミ ュ レ ーショ ン 実験でその効果を 検証する 。1
はじ めに
COVID-19のよ う な感染症のシミ ュ レ ーショ ン を す る 上では、 人々 の空間的な 分布と 移動を ど のよ う にモ デル化する かが重要と なる 。 COVID-19 では接触及び 飛沫によ る 感染が主体と さ れて いる 。 よ っ て 、 その感 染拡大シミ ュ レ ーショ ン を 行う ためには、 人同士がど れく ら い頻繁に近接距離に近づき 、 その近接状態を ど れく ら い維持する か、 を モデル化し なければなら ない。 2019年から 感染が始ま っ たと さ れる COVID-19 は、 現在、 世界中で猛威を ふる っ て おり 、 それへの対処の 手段の 1 つと し て 、 各種の感染シミ ュ レ ーショ ン が試 みら れて いる [2, 1, 3]。 中でも 、 人の移動と 組合せた 感染シミ ュ レ ーショ ン は、 経済活動シミ ュ レ ーショ ン と の連携の可能性も ある こ と から 、 様々 な 形で取り 組 ま れている [5, 4]。 一方で、 人の空間的移動を 陽に扱う マ ルチエージェ ン ト 感染シミ ュ レ ーショ ン の場合、 妥 当でかつ扱いやすい人の移動モデルを 用意する 必要が ある 。 人々 の移動を 反映し た現実に則し た感染シミ ュ レ ー ショ ンを 構築する ためには、 実際の人の移動を 表すデー タ と 、 そのデータ に基づく 移動モデルを 用意する 必要 ∗連絡先: 産業技術総合研究所 人工知能研究セン タ ー 〒 305-8560 茨城県つく ば市梅園1 − 1 − 1 E-mail: [email protected] がある 。 携帯端末の位置情報の記録は人の移動データ の有力候補である 。 特に本稿では、 携帯電話の ID 付き で時刻と 位置データ が記録さ れた、 移動軌跡データ を 取り 上げる 。 こ の移動軌跡データ を そ のま ま エージェ ン ト の移動と し て 扱いシミ ュ レ ーショ ン を 行う こ と も 考えら れる が、 実際には 2 つの問題点がある 。 1 つ目の 問題点は、 こ のよ う な データ は、 全人口ある いは全携 帯端末を カ バーし て いる わけ ではな く 、 ある 一定の割 合の人口を カ バーし て いる サン プリ ン グデータ と な っ て いる こ と である 。 つま り 、 何ら かの形で移動データ を 増幅し な け れば、 全人口分のエージェ ン ト の移動軌 跡が得ら れな い。 も う 1 つの問題点は、 既存のデータ だけ では未来の移動を 作り 出すこ と にな ら ず、 新し い 施策によ る 人の行動の変化を 反映さ せる こ と が出来な い。 未来の移動を シミ ュ レ ーショ ン する ためには、 何 ら かの方法で移動のモデルが必要と な る 。 シミ ュ レ ーショ ン で扱いやすい移動モデルと し ては、 ラ ン ダム ウ ォ ーク な ど 確率的な 移動モデルがある 。 特 にラ ン ダム ウ ォ ーク では、 移動のスピ ード や広がり を 制御し やすく 、 ま た、 実データ によ る 設定パラ メ ータ の同化や上位の移動モデルと の組み合わせも 容易であ る ので、 シミ ュレ ーショ ンに組み込みやすい。 一方、 ラ ン ダム ウ ォ ーク は、 エージェ ン ト の分布がほぼ一様に な る 点が問題と な る 。 現実の人の移動では、 人の位置 分布にはかな り 偏り がある が、 ラ ン ダム ウ ォ ーク ではその分布の偏り を データ に従う 形で反映する こ と が容 易でな いと いう 問題がある 。 本稿では、 移動モデルを シミ ュ レ ーショ ン で扱いや すいラ ン ダム ウ ォ ーク と し た上で、 実データ から わか る 人の位置の偏り が感染に与え る 影響を 反映する 方法 を 構築し て いく 。 以下、 2 節で実データ に よ る 人の位 置データ の偏り を 確認し た後、 3 節において 位置の非 一様性のヒ スト グラ ム によ る 扱い方を 導入し 、 感染現 象に於け る 非一様な 分布と 一様な 分布の関係から 補正 方法を 導出する 。 4 節では、 ど の補正方法の効果を 双 子実験によ り 検証し 、 5 節において 、 提案手法を ま と める 。
2
実データ における 人の分布の偏り
人が位置する 場所の分布は一様ではない。 こ れは都市 部な ど 人口が密集する 地域の一区画において も 同様で ある 。 実際、 以下の二区画 (各々 、 緯度経度で 0.001 度、 すな わち 南北約 111m、 東西約 91m) に ついて 、 Blog-Watcherの移動軌跡データ で記録さ れた位置データ の 一部を プロ ッ ト する と 、 図 1 およ び図 2 のよ う に な る1。 • 北緯 35.681 度∼35.682 度、 東経 139.766 度∼139.767 度 (東京駅の中) の矩形領域。 カウ ント 総数 209,087 点。 • 北緯 35.687 度∼35.688 度、 東経 139.764 度∼139.765 度 (大手町付近) の矩形領域。 カウ ント 総数 200,370 点。 図では、 経度・ 緯度各々 0.00001 度刻みの小グリ ッ ド (南北 1.11m, 東西 0.91m) に分け、 各小グリ ッ ド ごと の 位置データ 数を カ ウ ン ト し 、 そのカ ウ ン ト を 色の濃度 で表し て いる 。 こ れら を 見る と わかる よ う に、 位置データ の分布は 一様分布と はいえず、 かなり 偏り がある こ と がわかる 。 ま た、 図 1 と 図 2 を 見比べる と 、 偏り 方にも 違いがあ る こ と がわかる 。 分布の偏り を よ り 定量的に見る ため、 各小グリ ッ ド の人口のヒ スト グラ ム を 求めて みる 。 図 3 およ び図 4 は各々 、 図 1 およ び図 2 に 対応する ヒ ス ト グラ ム で 1 こ れら の地点は、 以下の手順で選んでいる 。 1. 日本全国を 1.0 度毎の矩形にわけ、 ラ ン ダムにサン プリ ン グ し た位置データ を 矩形毎にカ ウ ン ト する 。 2. 最大のカウ ン ト 数の矩形を 一辺につき 1/10 の矩形に分割し 、 再度サン プリ ン グし た位置データ でカ ウ ン ト する 。 3. 上記の操作を 、 一辺 0.001 度にな る ま で繰り 返す。 4. 一辺 0.001 度の矩形について 、 カウ ン ト 数第 1 位、 2 位のも のを 選択。 日本全国を 一辺 0.001 度の矩形に分け た時の最大カ ウ ン ト 数の矩形 でな いこ と に注意。 0 20 40 60 80 0 20 40 60 80 Latitude Longitude 1 10 100 1000 図 1: 緯度経度が (35.681,139.766)-(35.682,139.767) の 矩形領域 (東京駅の中) 0 20 40 60 80 0 20 40 60 80 Latitude Longitude 1 10 100 1000 図 2: 緯度経度が (35.687,139.764)-(35.688,139.765) の 矩形領域 (大手町付近) ある 。 も し 、 位置データ の分布が空間に対し 一様分布 な ら 、 グリ ッ ド 毎の人口の分布である こ のヒ スト グラ ムは二項分布と なる 。 各々 の矩形では約 20 万点ずつプ ロ ッ ト し て おり 、 その矩形を 1 万の小グリ ッ ド に分割 し ている ので、 一様分布の場合は、 最頻値 20 の二項分 布になる はずである 。 し かし 図 3 、 図 4 に示さ れる 実 際のヒ スト グラ ム はそれと は異な る 。 こ れら はど ち ら かと いう と 、 幾何分布な ど ロ ン グテールを 持つ分布で ある と いえ る 。3
非一様分布の影響と そ の解消法
3.1
非一様性 vs 一様性
こ こ では、 非一様分布が感染シミ ュ レ ーショ ン に及 ぼす影響について 解析を 試みる 。 空間的な配置や移動を 伴う マルチエージェント シミ ュ レ ーショ ン (MAS) では、 一般に、 一様分布や等方的な ラ ン ダムウ ォーク などの一様性を 仮定する こ と が多い。 こ のよ う な 一様性は、 シミ ュ レ ーショ ン に於いて も ミ ク ロ レ ベルのモデルを 作り やすい利点を 持つ上、 統計 的性質が解析し やすい利点を 持つ。 空間的相互作用を 扱う MAS では各エージェ ン ト の位置を 具体化する 必 要がある 場面が多い。 その位置について 一様分布を 仮 定すれば各エージェ ン ト の位置は容易に決定する こ と ができ 、 ま た、 ラ ン ダム ウ ォ ーク を 用いれば空間の連1 10 100 1000 10000 0 50 100 150 200 ../Result/countOccupiedGrid/japan.L4.nth0_0.000010_summary/gridCount.ext.o139.76600,35.68100.s000.00100,00.00100.u000.00001,00.00001..X02279.plotHist 図 3: 緯度経度が (35.681,139.766)-(35.682,139.767) の 矩形領域でのヒ スト グラ ム 1 10 100 1000 10000 0 100 200 300 400 500 ../Result/countOccupiedGrid/japan.L4.nth1_0.000010_summary/gridCount.ext.o139.76400,35.68700.s000.00100,00.00100.u000.00001,00.00001..X02218.plotHist 図 4: 緯度経度が (35.687,139.764)-(35.688,139.765) の 矩形領域でのヒ スト グラ ム 続性を 反映し て 位置を 変え て いく エージェ ン ト を 簡潔 に実現でき る 。 ま た統計的にも 、 一様性に基づく 対称 性によ り 、 その統計値と 空間的な 位置関係に依存する 相互作用の関係を 解析的に論じ やすく 、 実際のデータ と のすり 合わせや比較が容易である 。 一方、 実際の現象では、 こ のよ う な 一様性が安易に は仮定でき ない。 2 節で示し たよ う に、 実世界における 人の空間的分布は一様ではな い。 こ のよ う な 一様でな い分布を 示す場合、 感染病の拡大のよ う に近接遭遇の 確率が影響する 現象を 扱う 場合、 一様分布でのシミ ュ レ ーショ ン では現実から 大き く 外れて し ま う 可能性が ある 。 し かし 、 与え ら れた非一様な 分布を 再現する 確 率分布や移動モデルを 構成する のは容易ではな い。 特 に、 MAS で必要と なる 位置の具体化を 行う ためのモデ ルの構成方法は自明ではな い。
3.2
小グリ ッ ド の人口ヒ スト グラ ム
非一様性を 特徴づけ る 指標と し て 、 小グリ ッ ド の人 口ヒ スト グラ ムに 注目する 。 図 3 や図 4 で示さ れた よ う な ヒ スト グラ ム は、 エージェ ン ト の位置分布の偏 り ・ 非一様性を 特徴づける も のと みなすこ と ができ る 。 2 節で議論し たよ う に、 一様分布であればこ のヒ スト グラ ム は人口密度に相当する 値を 最頻値と する 二項分 布と な る が、 偏り があればその分布から 外れて いく こ と にな る 。 そ こ で、 ま ず、 感染拡大シミ ュ レ ーショ ン への適用 を 前提と し て、 小グリ ッ ド のサイ ズを 感染距離2 が決め る 間接範囲の面積と 仮定する 。 そし て 、 含ま れる 人口 2ある 感染者が近接する 未感染者に感染を ひろ げる 確率のある 、 そ の近接範囲を 定める 距離を 、「 感染距離」 と 呼ぶこ と にする 。 が k である 小グリ ッ ド の数の関数 c(k) を 小グリ ッ ド の人口ヒ スト グラ ムと する 。 N およ び C を (検討対象 の範囲の) 総人口およ び小グリ ッ ド の総数と する と 、 定 義によ り 以下の式が成り 立つ。 C = X k≥0 c(k) N = X k≥0 kc(k) こ こ で、 ある 小グリ ッ ド が人口 k を 持つ確率 γ(k) を 考え る と 、 以下にな る 。 γ(k) = c(k) C こ れから 、 ある 小グリ ッ ド の人口の期待値 µk及びその 分散 σ2 kを 求める と 、 以下で表さ れる 。 µk = X k≥0 kγ(k) = N C σ2 k = X k≥0 (k − µk)2γ(k) = X k≥0 k2 γ(k) − N C 2 (1)3.3
小グリ ッ ド での感染者と 未感染者の遭遇
こ こ で、 ある 感染エージェ ン ト が人口 k の小グリ ッ ド のいずれかに位置する 確率 p(k) を 考える と 、 以下の よ う に表さ れる 。 p(k) = kc(k) N = C Nkγ(k) こ の小グリ ッ ド の中の、 その感染エージェ ン ト 以外の エージェ ン ト 数は k′= k − 1である 。 よ っ て 、 ある 感 染エージェ ン ト と 小グリ ッ ド 内に同居する 人口の平均 値 µk′は次のよ う に計算でき る 。 µk′ = X k≥1 k′p(k) = σ 2 k µk + µk− 1 (2) µk′ は、 ある 単位時間サイ ク ル内で、 ある 感染エージェ ン ト が感染距離内で近接する エージェ ン ト 数の期待値 を 表し て いる と みな せる 。 こ こ で、 エージェ ン ト 位置の分布が完全な 一様分布 である と する と 、 σ2 k は 0 と な る 。 すな わち 、 µk′(uniform) = µk− 1 = N C − 1 (3) と なる 。 一方、 σ2 k が正の値の時、 µk′ はそれに応じ て 増加し ていく 。 こ れは、 小グリ ッ ド の人口ヒ スト グラ ム が一様分布から 外れて いき 、 大き な分散 σ2 kを も つと 、(2)式に従っ て感染エージェン ト に近接する エージェン ト 数の期待値が増え て いく こ と にな る 。 4.1節で述べる よ う に、 感染シミ ュ レ ーショ ン では、 ある 感染者から 新規に感染者する エージェ ン ト 数の期 待値 ∆I は、 その感染者への近接者数の期待値 µk′と 感染確率 β (後述) の積で表さ れる 。 ∆I = βµk′ こ こ で、 全体の人口密度 N/C は同じ だが、 小グリ ッ ド 人口の分散 σ2 k が異なる 2 つのケース a, b を 考える 。 各々 のケースの分散値を σ2 ka、 σ 2 kbと する と 、 それぞ れのケ ースでの一人の感染者から の新規感染者数の平 均 ∆Ia、 ∆Ib は以下にな る 。 ∆Ia = β σ2 ka µk + µk− 1 (4) ∆Ib = β σ2 kb µk + µk− 1 (5) こ の時、 (4) 式 の β の代わり に 、 以下の補正さ れた
感染確率 βb/aを 用いれば ∆Ia= ∆Ib と する こ と がで
き る 。 βb/a = σ2 kb µk + µk− 1 σ2 ka µk + µk− 1 · β = fb/a· β (6) こ れは、 こ の補正さ れた感染確率でケ ース a のシミ ュ レ ーショ ンを 行う こ と ができ れば、 その感染拡大過程は ケース b を 模倣する こ と ができ る こ と を 意味し ている 。 こ の方法を 、 人口ヒ スト グラムよ る 感染確率補正法 (ad-justment of infection ratio by grid histgram, AIRGH
法) と 呼び、 fb/aを 補正係数と 呼ぶこ と にする 。 例え ば、 完全に一様にエージェ ン ト が分布する 設定 (σ2 k = 0)のシミ ュ レ ーショ ン で非一様の設定の感染を 模倣する 場合には、 以下の補正係数を 用いれば良い。 f = σ2 k µk+ µk− 1 µk− 1 (7)
4
実験
4.1
シミ ュ レ ーショ ン モデル
分析のベースと する 感染シミ ュ レ ーショ ン について 説明する 。 本稿で用いる シミ ュ レ ーショ ン は、 拡張 SIR 遷移モ デルに人の移動モデルを 組み合わせた、 MAS である 。 個々 のエージェ ン ト は人ひと り に対応する 。 拡張 SIR 遷移モデルと は、 感染拡大のモデルである SIR モデル 図 5: 拡張 SIR 遷移モデル 図 6: 簡易感染シミ ュ レ ーショ ン の様子 の状態遷移を ベースに、 感染状態を 、 不活性状態 (他者 に感染を 広げない状態) と 活性状態 (感染を 広げら れる 状態) に分け、 不活性から 活性への遷移は確率的ではな く 時間経過に従っ て 生じ る も のと する 。 すな わち 、 各 エージェ ン ト の感染に関する 状態遷移は以下のよ う に 生じ る 。 • 未感染状態: ま だ一度も 感染し て いない状態。 こ の状態で、 活性化し た感染状態のエージェン ト と 一定距離 (感染距離) に近づく と 、 1 サイ ク ルで一 定確率 β で感染状態 (不活性) に遷移する 。 • 感染状態 (不活性): ウ イ ルスに感染し て いる が、 ま だ他者に感染を 拡げる 能力のない状態。 こ の状 態のま ま 一定時間サイ ク ル (活性化遅延時間) 経 過する と 、 活性化する 。 ま た、 1 サイ ク ルで一定 確率 γ で治癒状態に遷移する 。 • 感染状態 (活性化): ウ イ ルスに感染し 、 他者に感 染を 拡げる 能力のある 状態。 ま た、 1 サイ ク ルで 一定確率 γ で治癒状態に遷移する 。 • 治癒状態: 治癒し た状態。 免疫があり 、 2 度めの 感染は生じ な いも のと する 。 図 5 は、 上記の感染状態遷移を 表し たも のである 。 な お、 以下の実験では特に断ら ない限り 、 感染距離 = 0.3、0 50 100 150 200 250 300 350 400 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 # of cases time 1.Result/expA/trailed/runSession.a.trailed....stat.log (infected) 図 7: 簡易感染シミ ュ レ ーショ ン によ る 感染者数の推移 の例 感染確率 β = 0.15、 治癒確率 γ = 0.001、 活性化遅延 時間 = 100 サイ ク ル と し て いる 。 移動モデルはラ ンダムウ ォーク と する 。 すなわち エー ジェ ン ト は、 各サイ ク ルに於いて ラ ン ダム に 1 ステッ プを 決め、 移動する 。 1 ステッ プは、 実験では、 一定の 標準偏差 v を 持つの対称な 2 次元正規分布に従っ て 決 めら れる 。 (特に 断ら な い限り v = 0.2 と し て おく 。 ) エージェ ン ト が動き ま わる 空間は 100 × 100 の大き さ の正方形であり 、 各辺はト ーラ ス上に接続し 、 端がな い空間と する 。 エージェン ト の総数は 1000 体と し 、 初 期配置は空間全体に渡り 一様ラ ン ダム で選ばれる と す る 。 ま た、 初期の感染者数は全体の 1%である 10 体と する 。 ただし 、 4.3 節で導入する 非一様分布を 安定さ せ る ため、 初期配置から 3000 ステッ プ分移動シミ ュ レ ー ショ ン を 行っ た後、 感染シミ ュ レ ーショ ン を 開始し て いる 。 上記の設定で MAS を 行っ ている 様子を 図 6 に示す。 こ の図では、 ある 時点におけ る エージェ ン ト の空間的 位置を 点で示し ており 、 点の色は、 緑色は未感染状態、 オレ ン ジが不活性の感染状態、 赤が活性の感染状態、 紺色が治癒状態を 示し て いる 。 ま た、 図 7 は、 シミ ュ レ ーショ ン で得ら れた感染拡大について 、 各々 の時点 における 患者数の変化を 、 32 試行分別々 にプロ ッ ト し たも のである 。 全体傾向と し ては 4000∼5000 サイ ク ル で 100 ± 50 く ら いでピーク を 迎える 変化と なっ ている が、 確率過程である ため、 試行毎にかな り ばら つき の ある 推移と な っ て いる 。
4.2
感染拡大過程の特性値
感染拡大過程の比較を 容易にする ため、 感染拡大過 程の形状を 特徴づける 特性値を 定義する 。 図 7 に示し たよ う に、 感染拡大過程は試行ごと のばら つき が多く 、 ま た、 1 試行でも ゆら ぎが大き い。 そこ で、 ある 感染過 程を う ま く 模倣でき て いる かを 評価する ために、 感染 拡大過程の形状を な んら かの抽象化を 行い、 そこ から 少数の数値 (特性値) でその形状を 代表さ せる こ と を 考 え て いく 。 ま ず、 過程の形状の抽象化と し て、 なめら かな連続関 数によ る 近似を 行っ て みる 。 感染状態を 表現する いく つかの数値の内、 累計感染者数、 累計治癒者数、 およ び その差 (=現感染者数) の時間的推移を 示すと 、 図 8 の 折れ線 (橙色 (data infected)、 黄色 (data recovered)、 青色 (data current) の各線) のよ う になる 。 こ のう ち 累 計患者数・ 治癒者数の変化を 見る と 、 各々 、 ほぼ 0 か ら 始ま り 、 ある 時点で増加が始ま り 、 そ の増加が徐々 に加速し つつ、 ある 時点から 増加が鈍化し 、 最終的に は増加が止ま り 飽和する 、 いわゆる シグモイ ド 型の変 化を 示し て いる 。 そこ でこ の 2 つの累計数の変化を シ グモイ ド 関数で近似し て みる 。 実際には、 以下の手順で累計数の変化の近似を 行い、 最終的に現感染者数の変化を 表す式を 求める 。 1. 以下のよ う な 3 つのパラ メ ータ (A、 θ、 T ) を 持 つシグモイ ド 関数を 考え る 。 f (t; A, θ, T ) = A 1 + e−x−θT . 2. 注目し ている 累計感染者数の変化に対し て、 各時 点における その数値と シグモイ ド 関数の値の自乗 誤差を 計算し 、 その総和を 最小化する パラ メ ータ の組 hAI, θI, TIiを 求める 。3 3. 同様に、 累計治癒者数の変化に対し て、 誤差を 最 小化する パラ メ ータ の組 hAR, θR, TRiを 求める 。 4. 現感染者数の変化の近似式を 以下で定義する 。 g(t) = f (t; AI, θI, TI) − f (t; AR, θR, TR)図 8 の紫 (infected)・ 緑 (recovered)・ 水色 (current) の曲
線は、 上記の手順で求めた f(t; AI, θI, TI)、 f(t; AR, θR, TR)、 g(t)のプロ ッ ト と な っ て いる 。 さ ら に、 こ れら の近似関数を 使っ て 、 以下の 3 つの 特性値を 求め、 感染拡大過程の形状を 代表さ せる 。 • 感染のピ ーク の高さ : ˆA = maxtg(t) • 感染のピ ーク の時期: ˆθ = arg maxtg(t) • 感染拡大の波の幅4 : ˆT = 2(TI+ TR) + (θR− θI) 3 最適値は山登り 法で求めて いる 。 4波の幅 ˆ T の定義の根拠は次のと おり であ る 。 シグモイ ド 関数 f (t; A, θ, T )の最大傾斜は A/4T である 。 も し こ の最大傾斜で f(.) の最小値から 最大値に 変化する と すれば、 ∆t = 4T の時間がかか る 。 波の左右の斜面を 形成する のはこ の半分と みな し て 、 その幅は 2(TI+ TR)。 ま た、 2 つのシグモイ ド 関数の最大傾斜の位置の差は θR− θIで、 こ れは頂上部分の平ら な 部分に対応する 。 こ れら を 合 わせて ˆT を 定義し て いる 。
0 200 400 600 800 1000 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 # of agents cycle ,Log/expA0/runSession.a.2020-1009-022230.stat.apxSigmoid :infected :recovered :current :data_infected :data_recovered :data_current 図 8: 累積感染者数、 累積治癒者数、 現感染者数の変化 と シグモイ ド 関数によ る 近似 0 100 200 300 400 500 0 2000 4000 6000 8000 10000
Maximum # of Current Infected
Cycle at Maximum 1.Result/expA/trailed/runSession.a.trailed...stat.apxSigmoid.summary.feature 6000 8000 10000 12000 14000 Wave Length 図 9: 図 7 の各感染過程に対する 特性値の分布 こ れら 3 つの特性値は、 実際の感染症対策に於いて、 以 下のよ う な 意味を 持つ。 • 感染のピ ーク の高さ ˆAは、 感染対策の医療資源 の必要量を 示す指標と な る 。 • ピーク の時期 ˆθおよ び波の幅 ˆT は、 行動規制な ど社会的制約を 導入する 時期や期間を 決める 指標 と な り 得る 。 こ のよ う な特性値の組を 、 図 7 に示し た各結果に対 し て 求める と 、 図 9 のよ う にな る 。 こ のグラ フ で、 X 軸およ び Y 軸は各々 ピ ーク の時期 ˆθおよ び高さ ˆAを 表し 、 点の色は波の幅 ˆT を 示し ている 。 こ れを 見る と 、 こ れら の感染が、 4000∼6000 サイ ク ルで 80∼200 の高 さ のピーク を 迎え、 かつ、 感染の波が 10000∼15000 ぐ ら いかかる こ と が読み取れる 。 以下の実験の評価では、 こ の特性値を 使っ て 感染拡 大の過程の類似性を 議論し て いく 。
4.3
局所的加速ラ ンダムウォ ーク によ る 非一
様分布
AIRGH法の効果検証のため、 ま ずは非一様分布を 生 み出す手法と し て 局所的に不均一に加速さ せたラ ン ダ ムウ ォ ーク (locally accelerated random walk、 LARW) を 導入する 。 4.4 節で示す検証では、 双子実験を 用いて AIRGHによ る 補正が有効かを 示す。 そのためには、 双 子の片割れと な る 、 非一様にエージェ ン ト が分布する よ う に動き ま わる 移動モデルが必要と なる 。 LARW で は以下のよ う な 方法でその非一様分布を 生み出す。 ま ず空間を 適当な小領域に分割し 、 各小領域 i に異な る 加速係数 aiを 割り 当て る 。 ある サイ ク ルにその小領 域に存在する エージェン ト は、 その次の移動において、 通常のラ ン ダム ウ ォ ーク の規則に 従っ て 決めたス テッ プ幅に加速係数を 乗じ て 実際のステッ プと する 。 こ う する と 、 大き な 加速係数を 持つ領域ではエージェ ン ト の移動スピ ード が加速し 、 その分、 その領域の外に出 て し ま う 確率が増え る 。 逆に 加速係数が小さ いと ゆっ く り 移動する ため、 長く その領域にと ど ま る 。 結果と し て 、 エージェ ン ト の分布にばら つき が出て 非一様分 布が形成さ れる 。 実際に LARW を 用いてエージェン ト 群を 動かし 、 小 グリ ッ ド 毎の人口のヒ ス ト グラ ム を 取る と 図 10 のよ う になる 。 こ のヒ スト グラ ムは図 3 や図 4 で示し たヒ ス ト グラ ム の特徴を 再現し て いる と 言え る 。 た だし 、 こ の結果およ び次節での実験では、 加速係数を 割り 当 てる 小領域は感染域に匹敵する 小グリ ッ ド と 同じ と し 、 加速係数は [0, r] の一様乱数で決めた係数 αi に対し 、 ai = eαi を 各小グリ ッ ド の加速係数と し て いる 。 こ の rを 非一様度 (ununiform factor) と 名付け る 。 いく つかの非一様度 r を 用いて LARW を 行わせて 、 小グリ ッ ド 人口の度数分布から (1) 式の σ2 k およ び補 正係数 f、 そ し て 加速後のラ ン ダム ウ ォ ーク のス テッ プの標準偏差 v を 求める と 、 表 1 のよ う になる 。 こ こ で、 ステッ プの標準偏差 v を 求めて いる のは、 LARW ではラ ン ダム ウ ォ ーク を 加速する ため、 それを 通常の 正規分布によ る ラ ン ダム ウ ォ ーク と 同等に扱う ために は、 加速さ れたステッ プを 含めて 正規分布の標準偏差 を 求める 必要がある ためである 。 こ の表に示さ れた結 果の内、 r = 0.00 が、 通常の加速し ないラ ンダムウ ォー ク に対応する 。 r を 大き く する に従い小グリ ッ ド の人口 の分散 σ2 kが大き く なり 、 それに伴い、 補正係数 f も 大 き く な っ て いく こ と がわかる 。 ま た、 ステッ プの標準 偏差 v も 同様に大き く な っ て いる こ と がわかる 。4.4
AIRGH
の効果の検証
前節で導入し た LARW のデータ を 用いて、 双子実験 によ り AIRGH 法の効果の検証を 行う 。0.1 1 10 100 1000 0 5 10 15 20 25 30 35 # of Grids Grid Population Grid Populatio Histgram Summary (/expE/eZ030/runSession.eZ030.2020-1001-175236.gridPopHist.json) 図 10: LARW を 用いた場合のエージェン ト の分布のヒ スト グラ ム 表 1: 各非一様度に対し て得ら れた分散・ 補正係数・ ス テッ プの標準偏差 r σ2 k f v 0.00 2.38 1.000 0.201 0.05 2.86 1.078 0.253 0.10 3.67 1.210 0.291 0.20 7.71 1.869 0.443 0.30 13.79 2.852 0.623 実験は以下のよ う に行う 。 ま ず、 r を ある 値に定めて LARWによ り エージェ ン ト を 動かし ながら 感染シミ ュ レ ーショ ン を 行い、 その感染拡大過程の特性値を 求め る 。 こ れが双子の片割れと なる 。 それに対し て、 ステッ プを 決める 正規分布の標準偏差に表 1 で求めた v の値 を 用いて 通常のラ ン ダム ウ ォ ーク でエージェ ン ト を 動 かし 、 さ ら に、 AIRGH によ る 補正係数 f と (6) 式によ り 感染係数 β を 補正し て感染シミ ュ レ ーショ ン を 行い、 特性値を 求める 。 こ れが双子のも う 一方と な る 。 感染 過程の確率的な ゆら ぎを 捉え る ため、 各々 の片割れを 32回ずつ行い、 特性値の組の集合と し て各結果を 扱う 。 こ の実験を r = 0.00, 0.05, 0.10, 0.20, 0.30 で行っ て みた結果を 図 11 に示す。 こ の中で、 (a.1) ∼ (a.5) が LARWを 用いて 得ら れた特性値であり 、 (b.1) ∼ (b.5) が AIRGH によ り 補正を 加え たラ ン ダム ウ ォ ーク で得 ら れた特性値である 。 こ の結果を 見る と 、 ま ず LARW では、 非一様度 r が 0.00 では特性値がグラ フ の中央下 部に 分布し て いる のに 対し 、 r が大き く な る に 従っ て 左上の方に 分布が移動し て いく こ と がわかる 。 ま た 、 色合いも 、 r = 0.00 では黄色から 赤に分布し て いたの に対し 、 大き な r にな る に従っ て 緑から 青に変化し て いっ ている 。 次に、 AIRGH 法の結果を 見る と 、 左側の LARWと ほぼ同じ あたり に特性値が分布し 、 r が大き く なる に従い LARW の場合と 同じ よ う に変化し ていっ て いる こ と がわかる 。 こ れは、 AIRGH 法に よ る 補正 が正し く 作用し 、 非一様分布する エージェ ン ト 間で起 こ っ て いる 感染現象を 、 一様分布にな っ て し ま う 通常 のラ ン ダム ウ ォ ーク で正確に模倣でき て いる こ と を 示 し て いる 。
5
最後に
本稿では、 人の移動の実データ を 用いて 感染拡大シ ミ ュ レ ーショ ン を 行う こ と を 目的と し て 、 人口分布の 偏り によ り 生じ る 感染過程への影響を 統計的に解析し 、 異な る 人口分布の間での感染現象の補正方法 AIRGH 法を 提案し た。 こ の方法では、 人口分布のヒ スト グラ ム から 計算でき る 補正係数で感染確率を 修正する こ と で、 非一様分布での感染拡大過程を 一様分布な ど で正 確に再現でき る よ う にする 。 こ れによ り 、 制御や分析 が容易な ラ ン ダム ウ ォ ーク な ど 一様性のある 行動モデ ルに よ り 実データ を 反映し た感染拡大シミ ュ レ ーショ ン を 構成でき る よ う にな る 。 提案手法は、 人工的に非一様分布を 作り 出す LARW によ り 生成し たデータ を 用いて 検証さ れ、 感染拡大過 程の特性値が正確に再現さ れる こ と が確認でき た。 本手法の利点は、 小グリ ッ ド 単位の人口の平均値と 分散値、 およ びラ ン ダム ウ ォ ーク と し て のステッ プの 標準偏差を 求める こ と ができ れば、 シン プルな ラ ン ダ ム ウ ォ ーク を 移動モデルと する MAS に よ り 感染拡大 過程が正確に模倣でき る よ う にな る こ と である 。 こ れ ら の平均・ 分散・ 標準偏差の値は携帯端末の軌跡デー タ な ど から 容易に 計算でき る ため、 AIRGH に よ り 簡 便な シミ ュ レ ーショ ン で評価でき る よ う にな る 。 将来の課題と し ては、 LARW 以外の行動モデルでも 同様の効果が得ら れる かを 検証する と 共に、 こ の方法 を 活用し て実データ を 分析し ていく こ と があげら れる 。 謝辞 本研究の一部は JSPS 科研費 18H03301 の助成 を 受け たも のである 。 ま た、 人の位置データ に関する 分析では、 ブロ グウ ォッ チャ ー社の位置情報データ を 用 いて いる 。参考文献
[1] Erik Cuevas. An agent-based model to evaluate the covid-19 transmission risks in facilities. Comput. Biol. Med., 121:103827, 2020. Published online 2020 May 20.
[2] Rebecca J. Rockett et. al. Revealing covid-19 trans-mission in australia by sars-cov-2 genome sequencing and agent-based modeling. Nature Medicine, pages (on–line), July 2020. Letter published: 09 July 2020.
[3] Navid Mahdizadeh Gharakhanlou and Navid
Hooshangi. Spatio-temporal simulation of the
novel coronavirus (covid-19) outbreak using the agent-based modeling approach (case study: Urmia,
iran). Inform Med. Unlocked, 20:100403, 2020.
0 100 200 300 400 500 600 700 0 2000 4000 6000 8000 10000
Maximum # of Current Infected
Cycle at Maximum ./,Log/expG/gA000/runSession_00.gA000...stat.apxSigmoid.summary.feature 4000 6000 8000 10000 12000 14000 Wave Length 0 100 200 300 400 500 600 700 0 2000 4000 6000 8000 10000
Maximum # of Current Infected
Cycle at Maximum ./,Log/expG/gB000/runSession_00.gB000...stat.apxSigmoid.summary.feature 4000 6000 8000 10000 12000 14000 Wave Length
(a.1) ununiform factor = 0.00 (b.1) uniform with f = 1.000, v = 0.200
0 100 200 300 400 500 600 700 0 2000 4000 6000 8000 10000
Maximum # of Current Infected
Cycle at Maximum ./,Log/expG/gA005/runSession_00.gA005...stat.apxSigmoid.summary.feature 4000 6000 8000 10000 12000 14000 Wave Length 0 100 200 300 400 500 600 700 0 2000 4000 6000 8000 10000
Maximum # of Current Infected
Cycle at Maximum ./,Log/expG/gB005/runSession_00.gB005...stat.apxSigmoid.summary.feature 4000 6000 8000 10000 12000 14000 Wave Length
(a.2) ununiform factor = 0.05 (b.2) uniform with f = 1.078, v = 0.253
0 100 200 300 400 500 600 700 0 2000 4000 6000 8000 10000
Maximum # of Current Infected
Cycle at Maximum ./,Log/expG/gA010/runSession_00.gA010...stat.apxSigmoid.summary.feature 4000 6000 8000 10000 12000 14000 Wave Length 0 100 200 300 400 500 600 700 0 2000 4000 6000 8000 10000
Maximum # of Current Infected
Cycle at Maximum ./,Log/expG/gB010/runSession_00.gB010...stat.apxSigmoid.summary.feature 4000 6000 8000 10000 12000 14000 Wave Length
(a.3) ununiform factor = 0.10 (b.3) uniform with f = 1.210, v = 0.291
0 100 200 300 400 500 600 700 0 2000 4000 6000 8000 10000
Maximum # of Current Infected
Cycle at Maximum ./,Log/expG/gA020/runSession_00.gA020...stat.apxSigmoid.summary.feature 4000 6000 8000 10000 12000 14000 Wave Length 0 100 200 300 400 500 600 700 0 2000 4000 6000 8000 10000
Maximum # of Current Infected
Cycle at Maximum ./,Log/expG/gB020/runSession_00.gB020...stat.apxSigmoid.summary.feature 4000 6000 8000 10000 12000 14000 Wave Length
(a.4) ununiform factor = 0.20 (b.4) uniform with f = 1.869, v = 0.443
0 100 200 300 400 500 600 700 0 2000 4000 6000 8000 10000
Maximum # of Current Infected
Cycle at Maximum ./,Log/expG/gA030/runSession_00.gA030...stat.apxSigmoid.summary.feature 4000 6000 8000 10000 12000 14000 Wave Length 0 100 200 300 400 500 600 700 0 2000 4000 6000 8000 10000
Maximum # of Current Infected
Cycle at Maximum ./,Log/expG/gB030/runSession_00.gB030...stat.apxSigmoid.summary.feature 4000 6000 8000 10000 12000 14000 Wave Length
(a.5) ununiform factor = 0.30 (b.5) uniform with f = 2.852, v = 0.623
[4] 野田 五十樹. サン プリ ン グさ れた移動軌跡データ と 感染 シミ ュレ ーショ ン.研究報告2020-ICS-200(1) pp.1-6,情 報処理学会 知能システム( ICS) , 9月2020.
[5] 野田五十樹. 人の移動と コ ロ ナウ ィ ルス感染症covid-19