上のアイコン画像とユーザ行動の関係の調査と分析
冨永 登夢
1,a)土方 嘉徳
1,b) 概要:近年,TwitterやWeiboなどのマイクロブログサービスにおいて,ユーザの利用目的やリンク特性 などについて調べるユーザプロファイリングに関する研究が盛んである.これらの研究は,ユーザが持つ もともとの性質(デモグラフィック情報や性格,利用目的など)がマイクロブログサービス上でのユーザ行 動に影響を与えると考えている.このようなユーザの性質は,ユーザ行動だけでなく,上記サービス上で のユーザのアイコン画像の選択にも影響を与えると思われる.なぜなら,アイコン画像はTwitter上での ユーザの顔となるシンボル的存在であるため,ユーザの嗜好や目的の影響を受けると思われるからである. 我々は,アイコン画像とユーザ特徴,及びその他ユーザ行動に関する研究の手始めとして,まずはTwitter 上のアイコン画像を13種類のカテゴリに分類し,それぞれのカテゴリに属するユーザ行動とそのアイコン 画像の関係を調査した.また,いくつかのカテゴリ間で有意なユーザ行動の差が確認された. キーワード:アイコン画像,ユーザ行動,Twitter,ユーザプロファイルAn Investigation and Analysis on the Relationship between Profile
Images and User Behaviors on Twitter
Tominaga Tomu
1,a)Hijikata Yoshinori
1,b)Abstract: In recent years, many researches on user profiling based on users’ usage objectives or link
proper-ties have arisen on micro-blog services such as Twitter or Weibo. These studies assume that users’ behaviors (e.g. posting, sharing) are influenced by their characteristics such as their demographic information, person-ality, or usage objectives. We believe that these characteristics of users also have an impact on what kind of images they set as their profile images on micro-blog services. This is because profile images are regarded as visual symbols of the owners. In this study, we firstly categorize profile images on Twitter into 13 types, then investigate the relationship between the types of profile images and users’ behaviors of those who belong to the type. We find several statistically significant differences of users’ behaviors across types of profile images.
Keywords: Profile images, User behaviors, Twitter, User profiling
1.
はじめに
Twitter*1は,我々の日常生活に浸透したマイクロブログ サービスの一つである.Twitterはユーザ同士のコミュニ ケーションツールとしての側面と,情報発信獲得ツールと しての側面とを併せ持ち,これを用いるユーザの本質に迫 ることは学術的に興味深いことである.近年これらのユー 1 大阪大学大学院 基礎工学研究科1-3, Machikane-yama, Toyonaka, Osaka, Japan
a) [email protected] b) [email protected] *1 https://twitter.com ザを対象に,ユーザがもともと持つ特性や,Twitter上で の行動について把握するユーザプロファイリングに関する 研究が行われている[1], [2], [5]. これまでユーザプロファイリングの研究は,その本人の プロフィールや,投稿されたツイートのテキスト情報を使 うものが多かった[7], [9], [10], [11].我々はこれに対し, ユーザ特性は,上記のテキスト情報だけでなく,プロフィー ルに設定されたアイコン画像とも関係があると考えた.本 稿において,ユーザ特性とは,ユーザの性別や年齢などの デモグラフィック情報,内向性や外向性などの性格,そし
てソーシャルメディアを利用する目的や意図を指す.実際 に,オンライン上のユーザインタラクションシステムにお いて,ユーザのアバターの見た目が彼らの行動に影響を与 えることが示唆されており[15],この関係がTwitter上で も確認できる可能性があると期待される.アイコン画像と ユーザ行動の関係を分析する研究は本稿が最初である. 本研究では,Twitter上のアイコン画像を13種類に分類 し,各カテゴリに属するユーザ群のユーザ行動の特徴を比 較した.アイコン画像のカテゴリは,動物,たまご,自画 像,顔隠し,文字,ロゴ,オブジェ,オタク,本人一人, 本人複数,景色,他人,キャラクタの13種類である.各 カテゴリの詳細は次節以降で説明する.また,本稿におい て対象とするユーザ行動は,ツイート,リツイート(他の ユーザの投稿を引用し再投稿する行為),被リツイート(リ ツイートされる),リプライ(他の人のユーザに返信する 投稿)の4つとする.各ユーザ行動においてカテゴリ間の 違いを統計的検定で比較したところ,いくつかの有意差が 確認された.例えば,ロゴと文字のアイコン画像に属する ユーザは,ツイートする回数は少ないが,被リツイートさ れる割合が高い結果が得られた.具体的な分析手法や上記 以外の結果は,5章で説明する. 本稿の構成は以下のとおりである.まず本研究の位置づ けについて述べる.続いて,アイコン画像のカテゴリ分け について説明する.そして,ユーザ行動の取得について述 べた後,結果について報告する.最後に,本研究の課題と 結論を述べる.
2.
本研究の位置づけ
これまで,ソーシャルメディア*2上におけるプロフィー ル画像とユーザ特性の分析を行う研究[4], [6], [13], [14], [16] や,プロフィール情報,投稿情報からユーザ特性を推定を 試みる研究[1], [2], [3], [8], [10], [11], [12]は多くみられる が,ユーザ行動とプロフィール画像の関係を分析したもの は我々の知る限り存在しない.そのため,どのようなユー ザ特性に注目して分析すればよいか探すため,まずはアイ コン画像とユーザ行動の関係を網羅的に調査する必要があ る.上記の関係が明らかになれば,それらを引き起こした ユーザの内面的特徴についての推察ができるようになると 思われる.この推察とそこから引き出される仮説について は,将来の研究で検討する予定である.3.
アイコン画像の分類
我々は,アイコン画像に描かれている対象として13種 類のカテゴリを定義した.表1に定義されたカテゴリとそ の説明を示す. ここで定義された13種類のカテゴリに対し,10人の被 *2 本稿では簡易のため,SNSとマイクロブログサービスを合わせ てソーシャルメディアと呼ぶ 表1: アイコン画像のカテゴリとその説明 カテゴリ 定義 本人一人(On) ユーザ本人の顔写真 自画像(Sp) ユーザの顔がイラストで描かれたもの 顔隠し(Hf) 顔がはっきりと確認できない写真 本人複数(As) 友人や家族と一緒に写っているもの 他人(Dp) 芸能人やスポーツ選手などの有名人の写真 文字(Le) 文字のみで構成される画像 ロゴ(Lo) 会社や学校,その他組織のロゴ オタク(Ot) アニメ/漫画調で書かれた美少女キャラクタ キャラクタ(Ch) くまモンやふなっしー,ドラえもんなどの キャラクタの画像 動物(An) 犬や猫,鳥などの動物が写った写真や画像 オブジェ(Ob) 好きな車や趣味で使う道具などの物体 景色(Sc) 風景の写真や画像 たまご(Eg) ユーザがTwitterに新規登録した時にデフォ ルトで設定されている画像 表2: ユーザ行動に関する取得データ データ 説明 ツイート数 対象期間内における投稿したツイートの数 リツイート数 他ユーザのツイートを引用し再投稿した数 被リツイート数 自身の投稿をリツイートされたツイートの数 リプライ数 他ユーザに返信するツイートの数 験者によってそれぞれ300人のTwitterユーザのアイコン 画像を分類させたところ,Siegelの一致係数は0.70とな り,実質的に一致しているとみなされた.以降,定義され た13種類のカテゴリに属するユーザ行動の違いについて 分析を進める.4.
データ収集
我々はまず,定義された13種類のカテゴリに属するアイ コン画像を利用しているユーザを,Twitter上から人手に よってそれぞれ100ユーザ収集した.次に,収集した全てのユーザに対し,Twitter REST APIを利用してユーザ行
動に関するデータを取得した.Twitter上でユーザは様々 な行動を示すが,本稿では,Twitterにおいて基本的な操 作となる,投稿,引用(被引用),返信に関するデータを対 象とする.対象となるデータを表2に示す.取得データの 対象期間は2014年2月23日から3月25日である.以降 では,ツイート数をNtweet,リツイート数をNrt,被リツ イート数をNrted,そしてリプライ数をNreplyと書く.
5.
結果
5.1 投稿頻度 ユーザによってツイートを投稿する頻度は異なるため, ツイート数でカテゴリ間の違いを観察することは適切でな い.そこで我々は,ユーザの全ツイート数をTwitterに登 録し利用を始めた日数で正規化し,1日当たりの投稿数をOn Sp Hf As Dp Le Lo Ot Ch An Ob Sc Eg 01 02 03 04 05 06 07 0 Profile Image Rtw 図1: 1日当たりの投稿頻度(Rtw)
比較することにした.Twitter REST APIにより,ユーザ
のこれまで投稿してきたツイートの数(以降,NAllT weetと
表記)と利用日数(以降,Daysと表記)を取得した.ユー
ザの一日当たりの投稿頻度をRtwとすると,
Rtw= NAllT weets / Days (1) と表現できる. 図1に各カテゴリごとにユーザのRtwを箱ひげ図で表現 している.横軸はアイコン画像のカテゴリ(表1の略記に 対応),縦軸はRtwを意味する.例えば,この図からたま ごユーザ(Eg)は全体的に低い傾向にあり,オタクユーザ (Ot)は全体的に高い傾向にある,といったことが分かる. 続いて,カテゴリによってユーザのRtwの分布がどの 程度異なるかを多重比較により統計的に検証する.我々は Steel-Dwass法を用いてこの検証を行った.その結果を,表 3の最左列(Rtwの列)に示す.表内には,各カテゴリの Rtwの中央値と,多重比較によって得られた統計量が示さ れている.例えば,Rtwにおいて,本人一人(On)カテゴ リとオタク(Ot)カテゴリを検定した結果,統計量は6.55 となり,有意確率はp < 1.0· 10−7となる. オタクユーザ(Ot)は,1日当たりの投稿頻度が他カテゴ リよりも有意に高い傾向が確認された.自身の趣味や嗜好 を積極的に表現している可能性がある.ロゴユーザ(Lo) は,組織や団体のアカウントとして利用されることが多い が,Rtwは低い傾向にあり中央値は2番目に小さい.投稿 が多すぎると,フォロワーのタイムラインに出現する回数 が多くなり,フォロワーに倦厭されるかもしれない.彼ら は宣伝や広告を目的としていると推定されるため,この現 象を避けようとしている可能性がある. 5.2 引用頻度 Twitter上では,他のユーザのツイートを引用し,自分の ツイートとして再投稿できる.これはリツイートと呼ばれ On Sp Hf As Dp Le Lo Ot Ch An Ob Sc Eg 0.0 0.1 0.2 0.3 0.4 0.5 0.6 Profile Image Rrt 図2:投稿数に対するリツイートの割合(Rrt) る.ユーザによって投稿数が異なるため,単純にリツイー トの数を比較するのではなく,投稿数に対するリツイート の割合を比較する.投稿数に対するリツイートの割合を Rrtとすると, Rrt= Nrt / Ntweet (2) と表現できる.上記の計算式により,全てのユーザのRrt を算出した. 図2に,ユーザのRrtを各カテゴリごとに分布として箱 ひげ図で示す.図1と同様に横軸はアイコン画像のカテゴ リを示しており,縦軸はRrtとなっている. 1日当たりの投稿頻度(Rtw)と同様に,Rrtに対して各 カテゴリ間の多重比較を行った.その結果を表3の中左列 (Rrtの列)に示す. 引用行為は,カテゴリ間で大きな差がなく,中央値から 考察するとほとんどのカテゴリは10回∼20回に1回引用 を行う結果となった.しかし,たまご(Eg)ユーザは極端 にリツイートが少なく,どのカテゴリと比較しても有意に 引用頻度が低いことが分かった.たまごの画像は,Twitter を始めた時に標準設定されている画像であるため,初心 者が多い可能性がある.従って,彼らがフォローしている ユーザが少なく,引用する情報源がそもそも他のユーザよ り少ないことがこの結果につながったと思われる. 5.3 被引用頻度 前節で述べたように,Twitter上には引用する機能が存 在するため,自身の投稿が引用されることもある.フォロ ワーにとって興味深かったり,有益であると思われたツ イートが引用されやすいと考えられる. Rrtの分析と同様に,投稿数がユーザによって異なるた め,投稿数に対する被引用回数の割合で比較する.投稿数 に対する被引用回数の割合をRrtedとすると,
表3: カテゴリ間の多重比較の結果(統計量tに対するtn... n = 1の時p < 0.05,n≥ 2の時p < 1.0· 10−nの有意確率)
Rtw Rrt Rrted Rreply
M edian Ot Lo M edian Eg M edian Lo Eg M edian As Lo
本人一人(On) 3.69 6.557 1.23 0.079 7.5511 0.069 3.711 8.3912 0.365 4.423 6.417 自画像(Sp) 5.19 4.944 2.70 0.084 7.4411 0.030 4.653 6.829 0.270 5.645 5.295 顔隠し(Hf) 12.7 2.77 5.485 0.100 7.3210 0.031 5.655 7.1410 0.337 4.383 5.976 本人複数(As) 7.53 5.595 3.802 0.067 7.7512 0.046 5.976 7.8412 0.519 – 9.1112 他人(Dp) 7.35 4.483 3.551 0.058 7.1610 0.034 5.475 7.3510 0.351 3.651 6.097 文字(Le) 3.43 6.147 0.74 0.029 4.573 0.341 0.38 8.4812 0.025 9.2112 1.60 ロゴ(Lo) 2.80 6.588 – 0.040 5.916 0.311 – 8.7112 0.071 9.1112 – オタク(Ot) 25.4 – 6.588 0.076 7.3110 0.025 5.706 6.989 0.284 5.505 5.455 キャラクタ(Ch) 5.32 5.114 2.33 0.043 6.357 0.026 4.974 6.588 0.383 3.431 6.167 動物(An) 2.81 5.966 0.17 0.062 6.989 0.013 6.608 4.453 0.253 6.046 4.393 オブジェ(Ob) 6.54 4.222 2.74 0.045 6.327 0.019 6.738 5.485 0.331 4.633 5.184 景色(Sc) 3.27 6.187 0.22 0.044 5.315 0.021 5.655 5.625 0.141 6.929 1.98 たまご(Eg) 0.79 6.498 2.50 0.000 – 0.000 8.7112 – 0.002 8.1812 1.84 On Sp Hf As Dp Le Lo Ot Ch An Ob Sc Eg 0.0 0.2 0.4 0.6 0.8 1.0 Profile Image Rrt ed 図3:投稿数に対する被リツイートの割合(Rrted) と表現できる.上記の計算式により,全てのユーザのRrted を算出した. 図3に,ユーザのRrtedを各カテゴリごとに分布として 箱ひげ図で示す.図1と同様に横軸はアイコン画像のカテ ゴリを示しており,縦軸はRrtedとなっている.図3を見 ると,ロゴ(Lo)ユーザと文字(Le)ユーザのRrtedが目 立って高いことが分かる. 1日当たりの投稿頻度(Rtw)と同様に,Rrtedに対して 各カテゴリ間の多重比較を行った.その結果を表3の中右 列(Rrtedの列)に示す. ロゴ(Lo)ユーザは,文字(Le)ユーザ以外のすべてのカ テゴリと比較して有意に引用される頻度が高い.前述した ように,ロゴユーザは組織や団体のアカウントであること が多いと考えられるため,フォロワーにとって有益な情報 が発信されている可能性が高い.また,その情報を拡散さ せることを目的にフォローしているユーザも多いかもしれ ない.これらが,ロゴユーザのRrtedの高さに寄与してい ると考えられる.文字ユーザにも同様の傾向が見られる. たまご(Eg)ユーザは,引用する頻度も低かったが,引用 される頻度も全てのカテゴリと比較して有意に低い結果と なった.彼らはTwitterの初心者である可能性が高く,引 用されるためのフォロワーがそもそも少ないことがこの結 果の原因であると思われる. 5.4 返信頻度 Twitterでは,他のユーザの投稿に返信する形でツイー トすることができる.これはリプライと呼ばれる.特定の ユーザとインタラクションを取る行為であるため,親しい 友人や知人と連絡を取り合う目的で利用されやすい. Rrtの分析と同様に,投稿数がユーザによって異なるた め,投稿数に対するリプライ数の割合で比較する.投稿数 に対するリプライ数の割合をRreplyとすると,
Rreply= Nreply / Ntweet (4)
と表現できる.上記の計算式により,全てのユーザのRreply を算出した. 図4に,ユーザのRreplyを各カテゴリごとに分布として 箱ひげ図で示す.図1と同様に横軸はアイコン画像のカテ ゴリを示しており,縦軸はRreplyとなっている. 1日当たりの投稿頻度(Rtw)と同様に,Rreplyに対し て各カテゴリ間の多重比較を行った.その結果を表3の最 右列(Rreplyの列)に示す. 本人複数(As)ユーザは,他のどのカテゴリと比較して も有意にリプライの頻度が高い.中央値で評価すると,2回 の投稿に対して1回は返信を行っていると言える.彼らは 友人や知り合いと一緒に写った写真をアイコン画像に用い ており,人とのコミュニケーションへの関心の高さがユー ザ行動にも表れる結果となった.一方,ロゴ(Lo)ユーザ はほとんどのカテゴリと比べてリプライを積極的に行わな い傾向が見られた.組織や団体を代表するアカウントが多
On Sp Hf As Dp Le Lo Ot Ch An Ob Sc Eg 0.0 0.2 0.4 0.6 0.8 1.0 Profile Image Rre pl y 図4: 投稿数に対するリプライの割合(Rreply) いと思われるため,特定の個人とのコミュニケーションを 避けている可能性がある.
6.
本研究の課題
本研究は,アイコン画像のカテゴリ間でユーザ行動に違 いを明らかにすることを試みた最初に研究であるが,調査 と分析にあたっていくつか課題が残されている. まず,分析対象となるユーザが日本人に限定されている 点である.文化の違いは,自分が移る写真の提示やソー シャルメディア上のアイコン画像の選択に影響を与えると 報告されている[16], [17].より一般的な知見を得るために は,国籍や言語などの文化的背景の異なるユーザを対象に 調査を進める必要があると言える. また,今回の調査と分析において,ユーザから投稿され たツイートの内容は確認していない.投稿や引用,返信の 頻度だけでなく,その内容にもユーザ特性が反映され,カ テゴリごとに違いが確認される可能性は高い.本稿では網 羅的な調査を行うため簡易なデータを対象としたが,将来 的にはツイートの内容の違いも検証していく必要がある.7.
結論
本研究は,Twitter上のアイコン画像のカテゴリごとに ユーザ行動の違いを分析した最初の研究である.我々は, アイコン画像を,動物,たまご,自画像,顔隠し,文字, ロゴ,オブジェ,オタク,本人一人,本人複数,景色,他 人,キャラクタの13種類のカテゴリに分類し,各カテゴ リに対して100人のユーザを人手で集め,彼らの投稿,引 用(被引用),返信の頻度の違いを分析した. その結果,以下の結果が確認された.オタクユーザは投 稿頻度が高く,自身の趣味や興味の対象について頻繁に投 稿している可能性がある..また,たまごユーザは引用,被 引用ともに頻度が低く,彼らのフォローしているユーザや 彼らがフォローされているユーザの少なさによるものと 推察される.ロゴユーザは引用される頻度が非常に高く, フォロワーの関心をひくツイートを投稿していると考えら れる.本人複数ユーザは返信の頻度が高い結果となり,コ ミュニケーションへの積極性がユーザ行動とアイコン画 像に現れていると言える.対象ユーザが日本人に限定され ており,投稿されたツイートの内容を確認していないとい う課題が残されているが,我々は本研究がアイコン画像と ユーザ行動の関係を明らかにする最初に第一歩となると考 えている. 参考文献[1] Burger, J. D., Henderson, J., Kim, G. and Zarrella, G.: Discriminating Gender on Twitter, Proceedings of the
Conference on Empirical Methods in Natural Language Processing, pp. 1301–1309 (2011).
[2] Golbeck, J., Robles, C., Edmondson, M. and Turner, K.: Predicting Personality from Twitter, 2011 IEEE
Third International Conference on Privacy, Security, Risk and Trust (PASSAT) and 2011 IEEE Third Iner-national Conference on Social Computing (SocialCom),
IEEE, pp. 149–156 (2011).
[3] Golbeck, J., Robles, C. and Turner, K.: Predicting Per-sonality with Social Media, Proceedings of the 2011
An-nual Conference Extended Abstracts on Human Factors in Computing Systems - CHI EA ’11, New York, New
York, USA, ACM Press, pp. 253–262 (2011).
[4] Hum, N. J., Chamberlin, P. E., Hambright, B. L., Port-wood, A. C., Schat, A. C. and Bevan, J. L.: A picture is worth a thousand words: A content analysis of Face-book profile photographs, Computers in Human
Behav-ior, Vol. 27, No. 5, pp. 1828–1833 (2011).
[5] Ikeda, K., Hattori, G., Ono, C., Asoh, H. and Higashino, T.: Twitter user profiling based on text and community mining for market analysis, Knowledge-Based Systems, Vol. 51, pp. 35–47 (2013).
[6] Kapidzic, S.: Narcissism as a predictor of motivations behind Facebook profile picture selection.,
Cyberpsychol-ogy, Behavior and Social Networking, Vol. 16, No. 1, pp.
14–19 (2013).
[7] Kim, D., Jo, Y., Moon, I.-C. and Oh, A.: Analysis of Twitter Lists as a Potential Source for Discovering La-tent Characteristics of Users, ACM CHI Workshop on
Microblogging, p. 4 (2010).
[8] Pennacchiotti, M. and Gurumurthy, S.: Investigating Topic Models for Social Media User Recommendation,
Proceedings of the 20th International Conference Com-panion on World Wide Web, New York, New York,
USA, ACM Press, pp. 101–102 (2011).
[9] Pennacchiotti, M. and Popescu, A.-m.: A Machine Learning Approach to Twitter User Classification,
Pro-ceedings of the Fifth International AAAI Conference on Weblogs and Social Media, pp. 281–288 (2010).
[10] Qiu, L., Lin, H., Ramsay, J. and Yang, F.: You are what you tweet: Personality expression and perception on Twitter, Journal of Research in Personality, Vol. 46, No. 6, pp. 710–718 (2012).
[11] Quercia, D., Kosinski, M., Stillwell, D. and Crowcroft, J.: Our Twitter Profiles, Our Selves: Predicting Personality with Twitter, 2011 IEEE Third International
and 2011 IEEE Third Inernational Conference on So-cial Computing (SoSo-cialCom), IEEE, pp. 180–185 (2011).
[12] Ramage, D., Dumais, S. and Liebling, D.: Character-izing Microblogs with Topic Models, Proceedings of the
Fourth International AAAI Conference on Weblogs and Social Media, pp. 130–137 (2010).
[13] Siibak, A.: Constructing masculinity on a social net-working site, Young, Vol. 18, No. 4, pp. 403–425 (2010). [14] Siibak, A. and Hernwall, P.:‘Looking like my favourite Barbie’Online Gender Construc- tion of Tween Girls in Estonia and in Sweden,Studies of Transition States and Societies, Vol. 3, No. 2, pp. 57–68 (2011).
[15] Suler, J.: The Psychology of Avatars and Graphical Space in Multimedia Chat Communities or : How I Learned to Stop Worrying and Love My Palace Props,
Chat communication, pp. 305–344 (1999).
[16] Zhao, C. and Jiang, G.: Cultural differences on vi-sual self-presentation through social networking site pro-file images, Proceedings of the 2011 Annual Conference
on Human Factors in Computing Systems - CHI ’11,
New York, New York, USA, ACM Press, pp. 1129–1132 (2011).
[17] Ziller, R. C.: Photographing the self: Methods for
ob-serving personal orientations., Sage publications, Inc