計算社会科学に関する文献紹介
6
0
0
全文
(2) 鳥海/認知科学 (2021) 28(2) 308–313 生み出した.絵文字はその利用範囲の広さと利用者. 309. の絵文字が利用の 90% を占めている.. の多さから,これまで小規模な調査に頼っていたい. 絵文字の中でもっとも使われたものは,泣きなが. くつかの研究課題を,大規模な行動データから解く. ら喜ぶ様子を表した “face with tears of joy” と呼ば. ことができる可能性がある.例えば,国ごとのユー. れるもので,絵文字利用の 15.4% を占めていた.. ザの感情表現の違いをそれぞれの国の文化から説明 可能になることが期待される. 一方で,このような状況にもかかわらず,絵文字 を利用した体系的な比較分析研究はまだあまり行わ. 1.4.2 国による絵文字利用の違い 絵文字の利用はべき分布であることを考慮して, 国ごとの利用頻度の高い絵文字を分析した.. れていない.そこで,我々は Google Play 上の “kika. 元論文 Table 1 に絵文字の利用率が高い 10 か国. emoji keyboard” に入力された一ヶ月分のメッセー. について使用頻度の高い絵文字が示されている.フ. ジのログを収集し,分析した.. ランスでは 19.8% のメッセージに絵文字が含まれて. 本論文では,地域横断的絵文字データセットの実 証分析を行い,以下の問いに答えた.. おり,これは有意に他の国よりも高いことが分かっ た.また,利用される絵文字も他の 9 か国と比較. • ユーザの絵文字の嗜好性は国によって異なるか. して大きく異なる.例えば,最も利用される絵文字. • 特定の文脈で使う絵文字や一緒に使う絵文字に. が他の国では「顔」に関係する絵文字であるのに対. 違いはあるか. • それらの違いは文化によって説明可能か. して,フランスでは「ハート」が最もよく使われて いる.. その結果,絵文字の利用は国によって異なり,その 違いは文化的背景の違いと高い相関があることを示. 1.4.3 アノテーションによるクラスタリング. した.本研究は,人とコンピュータの相互作用を明. Unicode Consortium は各絵文字に 1283 種類のア. らかにし,絵文字利用の大規模データセットの利用. ノテーションタグを付与している.アノテーション. と,絵文字利用のユーザ体験を向上させるインター. タグが付与された絵文字の出現数を人気スコアと. フェースの改善方法を明らかにするものである.. し,人気スコアが 200 万以上のアノテーションタグ を抽出し,及び,絵文字の出現頻度が 200 万以上の. 1.3 データ収集. 国を抽出した.これによって,最終的に 141 のタグ. 1.3.1 Kika emoji keyboard. と 38 の国が得られた.. 本論文で用いたデータセットは,kika emoji key-. これらの国について,人気スコアを使用頻度で正. board によって収集された.入力された絵文字のほ. 規化したうえで,特定のタグが他の国と比較して Z. か,承認があったユーザの使用言語,匿名化された. 検定の結果,有意水準 0.05 で有意に多く(また少. メッセージ内容,国の情報などのメタデータを収集. なく)出現した場合に +1(または −1)とした 141. している.. 次元のベクトルを計算した.このベクトルの内積か ら類似度スコアを計算し,階層的クラスタリングを. 1.3.2 データセット詳細. 行った.. データセットには,212 の国と地域の 388 万人の. その結果 38 か国が 27 か国からなる第 1 グループ. アクティブユーザーが含まれている.また,2015 年. と 11 か国からなる第 2 グループとに大きく分類さ. 9 月 1 日から 9 月 30 日に送信された,少なくとも. れた.第 1 グループ 27 か国のうち 11 か国(米国,. 1 つ以上の絵文字が含まれているメッセージを 4 億. カナダ,ドイツ,イタリア,フランス,ベルギー,ポ. 2700 万件収集した.. ルトガル,英国,オランダ,チェコ,オーストラリ ア)が先進国であった.一方,第 2 グループに含. 1.4 分 析. まれる先進国はスペインのみであった.この結果か. 1.4.1 絵文字の利用. ら,先進国かどうかと絵文字の利用には潜在的な関. 60 億のメッセージの 7.1% に少なくとも 1 つの. 係性があることが示された.. 絵文字が含まれていた.絵文字の利用頻度の分布は. また,クラスタリングの結果は地理的な近さや言. べき分布となっており,1281 個の絵文字のうち 119. 語,歴史などからも説明可能である.例えば,ヨー.
(3) 310. 鳥海/認知科学 (2021) 28(2) 308–313. ロッパの 10 か国(ドイツ,オーストリア,イタリ. 性が高いことも示されている.その一方で,類似性. ア,フランス,ベルギー,ギリシャ,ポルトガル,. が言語や地理的条件から予想されるもの以上になっ. イギリス,ルーマニア,オランダ)は第 1 グループ. ている国もある.. で密にクラスタリングされている.一方,第 2 グ. ユーザの絵文字利用の嗜好は文化的背景に深く根. ループの国はほとんどが南米の国々(エクアドル,. 差している可能性がある.例えば,東洋文化のユー. コロンビア,ペルー,チリ,メキシコ,コスタリカ,. ザは^_^やT_T といった目の形を重視した縦形の顔. ブラジル,アルゼンチン,ベネズエラ,ドミニカ共. 文字を好むのに対して,欧米文化のユーザは:-) や. 和国)であり,ブラジルを除くすべての国がかつて. :D のような口の形を重視した横向きの顔文字を好. スペインの植民地であった.スペイン語圏であるこ. む.この顔文字のスタイルの違いは,欧米人と東洋. れらの国がラテンアメリカの文化に基づくクラスタ. 人の表情信号の解読方法の違いと一致しているこ. を作っているといえる.さらに,そこにポルトガル. とが知られている (Jack, 2009).そこで,文化の違. 語圏であるブラジルが含まれていることから,言語. いがどのように絵文字の仕様の違いに影響を与え. 的要因よりも地域的要因がより影響を与えていると. るのかを明らかにする.絵文字は感情を表現するた. 考えられる.. めのものであることから,絵文字の感情と Hofstede. Culture Index (Hofstede et al., 2010) との関連を分析 1.4.4 共起関係に基づくクラスタリング. する.. 二つの絵文字の共起関係を point-wise mutual in-. formation (PMI; Church, 2008) によって算出し,同 時に出現することの多い絵文字のネットワークを生 成する.ノードは絵文字を表し,PMI の大きいほう. 1.5.1 ホフステッド指数(Hofstede Culture Index) ホフステッド指数では,国の文化の違いを power. から 5 つの絵文字にリンクを張ることによってネッ. distance(PDI:上下関係の強さ),collectivism versus. トワークを構築した.その結果は元論文 Figure 6 に. individualism(IDV:個人主義傾向の強さ),mas-. ある.本図より,旗や顔,動物などのクラスタが見. culinity versus femininity(MAS:男らしさを求める. て取れる.. 強さ),uncertainty avoidance(UAI:不確実性の回避. ここで,fast unfolding algorithm (Blondel et al.,. 傾向の強さ),long-term versus short-term orientation. 2008) を用いて 69 個のクラスタを抽出した.さら. (LTD:長期的主義傾向の強さ),indulgence versus. に,これらのクラスタの利用頻度を調べたところ,. restraint(IVR:快楽的か禁欲的か)の 6 次元モデ. 国によって使用頻度が異なることが明らかとなった.. ルによって表現する.. 例えば,アルゼンチンでは顔に関連した絵文字が重 要なクラスタとなるが,メキシコではオフィスやエ. 本研究では,ホフステッド指数とデータセットの 双方がカバーする 102 の国と地域を対象とする.. ンタテインメントといった絵文字がよく使われる. そこで,今度はこれらのクラスタの利用度の相関. 1.5.2 絵文字感情の抽出. を用いて国のクラスタリングを行った.その結果得. 文化指標と絵文字の利用状況の相関を調べること. られた第 1 グループには南米,ドイツ系ヨーロッ. は可能だが,どのような絵文字が代表性があるとし. パ,サウジアラビアが含まれ,第 2 グループは,主. て比較をすればよいかはわからない.そこで,利用. に南アジア,アングロ文化圏,東欧,アラブ文化圏. 頻度の高い絵文字は特定の感情を表したものである. の国々が含まれた.これらのクラスタによって得ら. ことに注目し,感情を表す絵文字と文化指標との比. れたグループは,アノテーションによるクラスタリ. 較を行うこととした.. ングとはまた異なるものであった.. LIWC(linguistic inquiry and word count)1) を利 用して絵文字に感情スコアを付与した.その結果. 1.5 絵文字の利用と文化指標. 199 の感情スコアを持つ絵文字を獲得した.絵文. 異なる国のユーザーは絵文字を使うパターンが異. 字はポジティブスコアがネガティブスコアよりも高. なるが,類似した絵文字の使用パターンを持ってい. い,同じ,低い絵文字が,それぞれ Positive(POS),. る国同士は共通の言語や地域性を共有している可能 1) http://liwc.wpengine.com/.
(4) 鳥海/認知科学 (2021) 28(2) 308–313. 311. Mixed(MIX),Negative(NEG)に分類される.さ. ラットフォームによって絵文字は異なる表現をされ. らに,Negative な絵文字についてはさらに,Anxi-. るため,その影響がある可能性がある.. ety(ANX:不安),Anger(ANG:怒り),Sadness. もう一つの限界は,データセットが一か月分であ. (SAD:悲しみ)のうち最大のスコアを持つ感情に. るという点である.自然災害のような大きなイベン. 分類する.. トが特定の国であった場合,その影響を受ける可能 性がある.. 1.5.3 ホフステッド指数と絵文字感情の相関 各カテゴリについて,そのカテゴリに該当する 各国の絵文字の割合を計算し,その国のホフステッ. 最後に,本研究では文化指標と絵文字の関係が示 されたが,ユーザの年齢や性別などの因子が考慮さ れていない.今後より厳密な分析が必要となる.. ド指数とのピアソン相関 ρ を算出した.すべての. 一方で,本研究では文化指標とのみ比較している. Culture Index とすべての感情カテゴリのピアソン相. が,年齢や経済,性別など他の指標との比較に一般. 関をまとめたものが元論文 Table 3 に示されている.. 化することが可能かを検証することができると考え. 結果の一部を紹介すると,まず IDV(individual-. られる.他のアプリでの絵文字パターンの分析も今. ism)は最も多くの指標と関係がある.個人主義志 向な社会では,幸せを表現することが推奨され悲し みを表現することが抑制されており,個人主義と使 用される絵文字の間には有意な相関関係があった. 他の 3 つの指標(UAI,LTO,IVR)も,ポジティ. 後の課題であろう.. 2. 第 2 論文 Ohsawa, Y., & Tsubokura, M. (2020). Stay with your community: Bridges between clusters trigger. ブ側とネガティブ側の両方を説明する.不確実性回. expansion of COVID-19. PLOS ONE, 15 (12),. 避度の高い社会(UAI)では,ポジティブな感情の. e0242766.. 表現が少ない傾向にある.しかし,UAI と ANX(不. https://doi.org/10.1371/journal.pone.0242766. 安)絵文字の使用との間の相関は有意ではなく,不 確実性回避度の高い国の特徴と矛盾している.一方. 2.1 概 要. で,ANG(怒り)の感情を絵文字で表現する傾向が. 本研究は,新型コロナウィルスを想定し,スケー. ある.長期志向(LTO)の高い国では,長期的な計. ルフリーネットワークとしてモデル化した人工的に. 画や目標に焦点を当てているためか,ポジティブな. 作った社会ネットワーク上でウイルス感染の拡大を. 傾向がある.また,快楽傾向(IVR)が高い社会の. シミュレーションを行った.このとき,実空間の都. 人々はネガティブな表現を抑制する傾向が少ない.. 市生活を制約条件付きのネットワークモデルに拡張. 最後に,上下関係の強さ(PDI)が強い国では,ネ. するとともに,時空間的に制約された実社会行動を. ガティブな感情,特に SAD(悲しみ)を表現する 絵文字が頻出する傾向にあった.. 表現するようにモデルを修正した. その結果,シミュレーションから 4 つの知見と提. 以上のように,絵文字の利用はホフステッド指数. 言が得られた.第 1 に,人々の社会的接触への外部. に完全に対応しているわけではないが,一定の関係. からの干渉によらず「第 2 波」が訪れることが示さ. 性があることが示された.これによって,絵文字の. れた.ただし,これらはネットワークでつながって. 使い方が異なる文化的背景を持つユーザーを区別. いてもまだ感染していなかった人々によるもので,. するための有用なシグナルになり得ることを示して. クラスタ間のつながりが誘発するものである.第 2. いる.. に,ネットワーク構造が変化することで第 2 波は より大きくなる可能性があることが示された.第 3. 1.6 ディスカッション. に,感染者のピークの高さは,それぞれの人が接触. 本研究の限界は,対象となるユーザが kika key-. 可能な人数と感染拡大中に接触した人数の差に依存. board の利用者だけであるという点である.多くの. することが分かった.第 4 に,制約の解除がピーク. スマートフォンでは絵文字を入力する方法を提供し. に近すぎる場合,何もしなかった場合よりも第 2 波. ているため,あえて kika keyboard を利用するユー. のピークが大きくなる可能性が示唆された.. ザは若年層に偏っている可能性がある.また,プ.
(5) 312. 鳥海/認知科学 (2021) 28(2) 308–313. 2.2 イントロダクション. 導入するため,一つのノードの最大次数は W を上. パンデミック発生時の感染拡大は,公衆衛生上の. 限とする.さらに,スケールフリーモデルにあった. 大きな課題である.感染拡大を予測し適切な予防措. 「すでにネットワーク上に存在するノードにリンク. 置を確実にとることは,解決策を決定する上で重要. を張る」という条件も撤廃した.このように,ノー. である.2019 年 12 月に中国湖北省武漢市で初めて. ドの接触キャパシティW と,ノードの接触の選好. 報告された新型コロナウイルス(SARS-CoV-2)は,. 性 m0 を導入,制御することで人々が自分では意図. 世界中に急速に広がり COVID-19 のパンデミック. しない(W − m0 であるような)接続が感染症の拡. を引き起こした.感染予防の対策は様々な行われて. 大に与える影響を見る.. いるが,マスクや手洗いといった個人的な対策以外 に,ソーシャルディスタンスやロックダウンといっ. 2.3.2 感染拡大モデル. た政策が効果的であった.一方で「人と人との距離. 上記ネットワークにおける各ノードが感染を拡大. を置くことが感染予防に本当に効果的なのか」「誰. するためには三つのダイナミクスが存在する.. との接触を避けるべきか」といった疑問が存在する.. (1). 隣接ノードからウィルスを獲得する. そこで,効果的な予防策を明らかにするために,. (2). 感染する. (3). 他のノードへの感染者となる. 都市環境を考慮した社会ネットワークを用いたウィ ルス感染拡大のシミュレーションモデルを提案する. 人間社会を表すネットワークモデルとして,高次 数ノードと新規ノードが繋がりやすいスケールフ. 社会ネットワーク上のリンクは,2 つのノードが接 触する可能性を示している. 各ノードは,一定の確率で隣接ノードと接触し,. リーネットワーク(SFN: scale free network)があ. 接触したノードが感染していれば感染者の感染力の. るが,このモデルでは,1) 人が会える時間の制約,. 強さに応じてウィルスの影響を受ける.ただし,こ. 2) 空間の制約,3) 接触への関心といった制約につ. の時感染するとは限らない.ウィルスの影響を受け. いて考慮されていない.そこで,各人が実際に会え. た場合,一定確率で感染者となる.感染した場合は,. る人数を時間と空間によって制約があると仮定しそ. 感染力を持つようになり,一定間隔で減衰する感染. の上限 W を導入した.さらに,3 番目の条件を満. 力に応じて隣接ノードに感染を広める.ここで,リ. たすように,人々が出会うことを選択する人数を制. ンクの活性化率 pactive を定義し,1.0 であれば確実. 限する m0 を導入した.. に感染するような濃厚接触が必ず生じることを示. 本研究では,上記 2 種類の制約付き SFN を用い たシミュレーションを用いて適切な政策を議論する ためのエビデンスを得ることを目的とする.. し,政府の規制によって接触頻度が 80% 減少すれ ば, pactive = 0.2 となる. このモデルを用いて,感染のシミュレーションを 行う.. 2.3 手 法 2.3.1 ネットワーク生成. 2.4 結 果. 本論文では Albert-Balabasi モデルを拡張したス. ネットワーク内のノード数 N = 1000, 10000 とし. ケールフリーネットワークを生成する the SFN with. て,ランダムに 2 つのノードを感染ノードとして. spatiotemporal constraints(SFN-SC)を提案した.オ. 100 週間のシミュレーションを行った.シミュレー. リジナルのスケールフリーネットワークでは単一の. ションは 10 回行い,その平均によって議論を行う.. クリーク(部分完全グラフ)から優先的選択に従っ てノードを追加する.すなわち,新たに追加される ノード i がノード j に接続される確率が, deg(node j ) Pconnected ( j) = ∑nodeh ∈V deg(nodeh ). 2.4.1 第 2 波 初期クリーク数 k = 0.1N/W としてシミュレー. (1). である.これを,初期に複数(k > 1)のクリーク. ションを行った結果,全試行のうち 45.7% で第 2 波 が検出された.第 2 波が第 1 波よりも大きかった パターンは全体の 10% だった.また,第 3 波が第. が存在し,それに対して優先的選択が行われるも. 1 波よりも大きくなるケースは 3.7% 存在した.全. のとして生成する.各ノードは追加された際に m0. 体の 1.2% で第 1 波ののち,新規感染者がピークの. のノードに対してリンクを張り,時空間的な制限を.
(6) 鳥海/認知科学 (2021) 28(2) 308–313. 313. 5% 以下まで減少したのちに第 2 波が生じていた.. 第 2 の知見は,感染が広がっている期間または感. 次に 20 週目にネットワークの構造を単一クリー. 染が抑制された後にネットワーク構造が変化した場. クから作られたネットワークに変更し,その他のパ. 合,第 2 波のピークが第 1 波のピークよりも大き. ラメータは変更せずに継続するシミュレーションを. くなるということである.これは,感染者が非感染. 行った.その結果全試行のうち 35% で第 2 波が生. 者と直接接触するためである.. じた.そのすべてが第 1 波よりもピークが大きくな. 第 3 の知見として,実際に人々が接触する人数 W. り,全体の 22% では新規感染者がピークの 5% 以. に依存して感染者数が増加するということである.. 下まで減少したのちに第 2 波が生じていた.. 特に,W > 2m0 となると感染のピークが急激に増 加するため,W − m0 = 0 とすることで感染者数の. 2.4.2 W , m0 を変化させた場合の感染の傾向. 抑制が見込まれる.しかし,W − m0 = 0 とするこ. 次に,W , m0 と感染者数の変化を見る.元論文 Figure 7 に,W , n0 を変化させたときの感染者数の. とは,クラスタ外の人々との接触を禁止することを. 変化を示されている.ここから,感染者数は W が. に抑えることが最も現実的な政策であろう.. 増加すれば増加する正の関係にあることが分かる.. 意味するため現実的ではない.そのため,W < 2m0 以上を踏まえ,人々が自分の所属するコミュニティ. 複数クリークが存在する場合は,W > m0 ,W > 2m0 が閾値となって感染者数が顕著に増加する傾向. 内の人とのみ接触する(W < m0 )か,それが困難 な場合は自分が接触したい人よりも多い人数から意. がみられた.単一クリークの場合は W > 2m0 で有. 図しない接触をうけることを回避する(W < 2m0 ). 意に増加した.. ようにすることが感染症の抑制に効果的であると 考えられる.これはすなわち,我々は意図的に選. 2.4.3 制限解除の効果. んだコミュニティにとどまるべき(stay with your. 各ノードが隣接ノードとの接触を制限されるこ. community)であるということを意味する.. となく接触する場合,すなわち pactive を 1.0 まで. 第 4 の知見は,感染のピークが過ぎたからと言っ. 変化させていった場合の感染率の変化について確認. てすぐに制限を解除するとより大きなピークを引. した.その結果,ピークに近い時期で制限を解除し. き起こす可能性があるということである.したがっ. た場合,制限を加えずに pactive = 1.0 としていた場. て,ピークが過ぎた後も制限は段階を踏んで解除し. 合よりもピークの高い第 2 波が生じることが示さ. ていくべきである.. れた. ピークから解除までの近さと,元のピークに対す る制限解除後のピークの高さの間には相関がある ことが分かり,ピーク後の制限解除が早ければ早い ほど次の波のピークが大きくなることが明らかと なった.. 2.5 考 察 シミュレーションから得られた最初の知見は,ネッ トワークが不変であれば第 2 波は第 1 波よりも小 さいということである.構造が変わらない場合は, 第 2 波はネットワーク内の局所的なクラスタで生じ るため,大きくならない.. 文 献 Blondel, V. D., Guillaume, J. L., Lambiotte, R., & Lefebvre, E. (2008). Fast unfolding of communities in large networks. Journal of Statistical Mechanics: Theory and Experiment, 2008 (10), P10008. Church, K. W., & Hanks, P. (1990). Word association norms, mutual information, and lexicography. Computational Linguistics, 16 (1), 22–29. https://doi.org/10. 3115/981623.981633 Hofstede, G., Hofstede, G. J., & Minkov, M. (2010). Cultures and organizations: Software of the mind (3rd ed.). McGraw Hill. Jack, R.E., Blais, C., Scheepers, C., Schyns, P.G., & Caldara, R. (2009). Cultural confusions show that facial expressions are not universal. Current Biology, 19 (18), 1543– 1548. https://doi.org/10.1016/j.cub.2009.07.051.
(7)
関連したドキュメント
健学科の基礎を築いた。医療短大部の4年制 大学への昇格は文部省の方針により,医学部
また,文献 [7] ではGDPの70%を占めるサービス業に おけるIT化を重点的に支援することについて提言して
大きな要因として働いていることが見えてくるように思われるので 1はじめに 大江健三郎とテクノロジー
Q4-1 学生本人は児童養護施設で生活( 「社会的養護を必要とする者」に該当)してい ます。 「生計維持者」は誰ですか。. A4-1
「時価の算定に関する会計基準」(企業会計基準第30号
この資料には、当社または当社グループ(以下、TDKグループといいます。)に関する業績見通し、計
当図書室は、専門図書館として数学、応用数学、計算機科学、理論物理学の分野の文
関西学院大学社会学部は、1960 年にそれまでの文学部社会学科、社会事業学科が文学部 から独立して創設された。2009 年は創設 50