[15] Twitter Twitter 2 [4], [6], [13], [14], [16] [1], [2], [3], [8], [10], [11], [12] 2 SNS 1: (On) (Sp) (Hf) (As) (Dp)

(1)

Twitter

上のアイコン画像とユーザ行動の関係の調査と分析

冨永登夢

1,a)

_{土方嘉徳}

1,b) 概要：近年，TwitterやWeiboなどのマイクロブログサービスにおいて，ユーザの利用目的やリンク特性などについて調べるユーザプロファイリングに関する研究が盛んである．これらの研究は，ユーザが持つもともとの性質（デモグラフィック情報や性格，利用目的など）がマイクロブログサービス上でのユーザ行動に影響を与えると考えている．このようなユーザの性質は，ユーザ行動だけでなく，上記サービス上でのユーザのアイコン画像の選択にも影響を与えると思われる．なぜなら，アイコン画像はTwitter上でのユーザの顔となるシンボル的存在であるため，ユーザの嗜好や目的の影響を受けると思われるからである．我々は，アイコン画像とユーザ特徴，及びその他ユーザ行動に関する研究の手始めとして，まずはTwitter 上のアイコン画像を13種類のカテゴリに分類し，それぞれのカテゴリに属するユーザ行動とそのアイコン画像の関係を調査した．また，いくつかのカテゴリ間で有意なユーザ行動の差が確認された．キーワード：アイコン画像，ユーザ行動，Twitter，ユーザプロファイル

An Investigation and Analysis on the Relationship between Profile

Images and User Behaviors on Twitter

Tominaga Tomu

1,a)

Hijikata Yoshinori

1,b)

Abstract: In recent years, many researches on user profiling based on users’ usage objectives or link

proper-ties have arisen on micro-blog services such as Twitter or Weibo. These studies assume that users’ behaviors (e.g. posting, sharing) are influenced by their characteristics such as their demographic information, person-ality, or usage objectives. We believe that these characteristics of users also have an impact on what kind of images they set as their profile images on micro-blog services. This is because profile images are regarded as visual symbols of the owners. In this study, we firstly categorize profile images on Twitter into 13 types, then investigate the relationship between the types of profile images and users’ behaviors of those who belong to the type. We find several statistically significant diﬀerences of users’ behaviors across types of profile images.

Keywords: Profile images, User behaviors, Twitter, User profiling

1. はじめに

Twitter*1_{は，我々の日常生活に浸透したマイクロブログ} サービスの一つである．Twitterはユーザ同士のコミュニケーションツールとしての側面と，情報発信獲得ツールとしての側面とを併せ持ち，これを用いるユーザの本質に迫ることは学術的に興味深いことである．近年これらのユー 1 _{大阪大学大学院基礎工学研究科}

1-3, Machikane-yama, Toyonaka, Osaka, Japan

a) _{[email protected]} b) _{[email protected]} *1 _{https://twitter.com} ザを対象に，ユーザがもともと持つ特性や，Twitter上での行動について把握するユーザプロファイリングに関する研究が行われている[1], [2], [5]．これまでユーザプロファイリングの研究は，その本人のプロフィールや，投稿されたツイートのテキスト情報を使うものが多かった[7], [9], [10], [11]．我々はこれに対し，ユーザ特性は，上記のテキスト情報だけでなく，プロフィールに設定されたアイコン画像とも関係があると考えた．本稿において，ユーザ特性とは，ユーザの性別や年齢などのデモグラフィック情報，内向性や外向性などの性格，そし

(2)

てソーシャルメディアを利用する目的や意図を指す．実際に，オンライン上のユーザインタラクションシステムにおいて，ユーザのアバターの見た目が彼らの行動に影響を与えることが示唆されており[15]，この関係がTwitter上でも確認できる可能性があると期待される．アイコン画像とユーザ行動の関係を分析する研究は本稿が最初である．本研究では，Twitter上のアイコン画像を13種類に分類し，各カテゴリに属するユーザ群のユーザ行動の特徴を比較した．アイコン画像のカテゴリは，動物，たまご，自画像，顔隠し，文字，ロゴ，オブジェ，オタク，本人一人，本人複数，景色，他人，キャラクタの13種類である．各カテゴリの詳細は次節以降で説明する．また，本稿において対象とするユーザ行動は，ツイート，リツイート（他のユーザの投稿を引用し再投稿する行為），被リツイート（リツイートされる），リプライ（他の人のユーザに返信する投稿）の4つとする．各ユーザ行動においてカテゴリ間の違いを統計的検定で比較したところ，いくつかの有意差が確認された．例えば，ロゴと文字のアイコン画像に属するユーザは，ツイートする回数は少ないが，被リツイートされる割合が高い結果が得られた．具体的な分析手法や上記以外の結果は，5章で説明する．本稿の構成は以下のとおりである．まず本研究の位置づけについて述べる．続いて，アイコン画像のカテゴリ分けについて説明する．そして，ユーザ行動の取得について述べた後，結果について報告する．最後に，本研究の課題と結論を述べる．

2. 本研究の位置づけ

これまで，ソーシャルメディア*2_{上におけるプロフィー} ル画像とユーザ特性の分析を行う研究[4], [6], [13], [14], [16] や，プロフィール情報，投稿情報からユーザ特性を推定を試みる研究[1], [2], [3], [8], [10], [11], [12]は多くみられるが，ユーザ行動とプロフィール画像の関係を分析したものは我々の知る限り存在しない．そのため，どのようなユーザ特性に注目して分析すればよいか探すため，まずはアイコン画像とユーザ行動の関係を網羅的に調査する必要がある．上記の関係が明らかになれば，それらを引き起こしたユーザの内面的特徴についての推察ができるようになると思われる．この推察とそこから引き出される仮説については，将来の研究で検討する予定である．

3. アイコン画像の分類

我々は，アイコン画像に描かれている対象として13種類のカテゴリを定義した．表1に定義されたカテゴリとその説明を示す．ここで定義された13種類のカテゴリに対し，10人の被 *2 本稿では簡易のため，SNSとマイクロブログサービスを合わせてソーシャルメディアと呼ぶ表1: アイコン画像のカテゴリとその説明カテゴリ定義本人一人(On) ユーザ本人の顔写真自画像(Sp) ユーザの顔がイラストで描かれたもの顔隠し(Hf) 顔がはっきりと確認できない写真本人複数(As) 友人や家族と一緒に写っているもの他人(Dp) 芸能人やスポーツ選手などの有名人の写真文字(Le) 文字のみで構成される画像ロゴ(Lo) 会社や学校，その他組織のロゴオタク(Ot) アニメ／漫画調で書かれた美少女キャラクタキャラクタ(Ch) くまモンやふなっしー，ドラえもんなどのキャラクタの画像動物(An) 犬や猫，鳥などの動物が写った写真や画像オブジェ(Ob) 好きな車や趣味で使う道具などの物体景色(Sc) 風景の写真や画像たまご(Eg) ユーザがTwitterに新規登録した時にデフォルトで設定されている画像表2: ユーザ行動に関する取得データデータ説明ツイート数対象期間内における投稿したツイートの数リツイート数他ユーザのツイートを引用し再投稿した数被リツイート数自身の投稿をリツイートされたツイートの数リプライ数他ユーザに返信するツイートの数験者によってそれぞれ300人のTwitterユーザのアイコン画像を分類させたところ，Siegelの一致係数は0.70となり，実質的に一致しているとみなされた．以降，定義された13種類のカテゴリに属するユーザ行動の違いについて分析を進める．

4. データ収集

我々はまず，定義された13種類のカテゴリに属するアイコン画像を利用しているユーザを，Twitter上から人手によってそれぞれ100ユーザ収集した．次に，収集した全て

のユーザに対し，Twitter REST APIを利用してユーザ行

動に関するデータを取得した．Twitter上でユーザは様々な行動を示すが，本稿では，Twitterにおいて基本的な操作となる，投稿，引用（被引用），返信に関するデータを対象とする．対象となるデータを表2に示す．取得データの対象期間は2014年2月23日から3月25日である．以降では，ツイート数をNtweet，リツイート数をNrt，被リツイート数をNrted，そしてリプライ数をNreplyと書く．

5. 結果

5.1 投稿頻度ユーザによってツイートを投稿する頻度は異なるため，ツイート数でカテゴリ間の違いを観察することは適切でない．そこで我々は，ユーザの全ツイート数をTwitterに登録し利用を始めた日数で正規化し，1日当たりの投稿数を

(3)

On Sp Hf As Dp Le Lo Ot Ch An Ob Sc Eg 01 02 03 04 05 06 07 0 Profile Image Rtw 図1: 1日当たりの投稿頻度（Rtw）

比較することにした．Twitter REST APIにより，ユーザ

のこれまで投稿してきたツイートの数（以降，NAllT weetと

表記）と利用日数（以降，Daysと表記）を取得した．ユー

ザの一日当たりの投稿頻度をRtwとすると，

Rtw= NAllT weets / Days (1) と表現できる．図1に各カテゴリごとにユーザのRtwを箱ひげ図で表現している．横軸はアイコン画像のカテゴリ（表1の略記に対応），縦軸はRtwを意味する．例えば，この図からたまごユーザ（Eg）は全体的に低い傾向にあり，オタクユーザ（Ot）は全体的に高い傾向にある，といったことが分かる．続いて，カテゴリによってユーザのRtwの分布がどの程度異なるかを多重比較により統計的に検証する．我々は Steel-Dwass法を用いてこの検証を行った．その結果を，表 3の最左列（Rtwの列）に示す．表内には，各カテゴリの Rtwの中央値と，多重比較によって得られた統計量が示されている．例えば，Rtwにおいて，本人一人（On）カテゴリとオタク（Ot）カテゴリを検定した結果，統計量は6.55 となり，有意確率はp < 1.0· 10−7となる．オタクユーザ（Ot）は，1日当たりの投稿頻度が他カテゴリよりも有意に高い傾向が確認された．自身の趣味や嗜好を積極的に表現している可能性がある．ロゴユーザ（Lo）は，組織や団体のアカウントとして利用されることが多いが，Rtwは低い傾向にあり中央値は2番目に小さい．投稿が多すぎると，フォロワーのタイムラインに出現する回数が多くなり，フォロワーに倦厭されるかもしれない．彼らは宣伝や広告を目的としていると推定されるため，この現象を避けようとしている可能性がある． 5.2 引用頻度 Twitter上では，他のユーザのツイートを引用し，自分のツイートとして再投稿できる．これはリツイートと呼ばれ On Sp Hf As Dp Le Lo Ot Ch An Ob Sc Eg 0.0 0.1 0.2 0.3 0.4 0.5 0.6 Profile Image Rrt 図2:投稿数に対するリツイートの割合（Rrt）る．ユーザによって投稿数が異なるため，単純にリツイートの数を比較するのではなく，投稿数に対するリツイートの割合を比較する．投稿数に対するリツイートの割合を Rrtとすると， Rrt= Nrt / Ntweet (2) と表現できる．上記の計算式により，全てのユーザのRrt を算出した．図2に，ユーザのRrtを各カテゴリごとに分布として箱ひげ図で示す．図1と同様に横軸はアイコン画像のカテゴリを示しており，縦軸はRrtとなっている． 1日当たりの投稿頻度（Rtw）と同様に，Rrtに対して各カテゴリ間の多重比較を行った．その結果を表3の中左列（Rrtの列）に示す．引用行為は，カテゴリ間で大きな差がなく，中央値から考察するとほとんどのカテゴリは10回∼20回に1回引用を行う結果となった．しかし，たまご（Eg）ユーザは極端にリツイートが少なく，どのカテゴリと比較しても有意に引用頻度が低いことが分かった．たまごの画像は，Twitter を始めた時に標準設定されている画像であるため，初心者が多い可能性がある．従って，彼らがフォローしているユーザが少なく，引用する情報源がそもそも他のユーザより少ないことがこの結果につながったと思われる． 5.3 被引用頻度前節で述べたように，Twitter上には引用する機能が存在するため，自身の投稿が引用されることもある．フォロワーにとって興味深かったり，有益であると思われたツイートが引用されやすいと考えられる． Rrtの分析と同様に，投稿数がユーザによって異なるため，投稿数に対する被引用回数の割合で比較する．投稿数に対する被引用回数の割合をRrtedとすると，

(4)

表3: カテゴリ間の多重比較の結果（統計量tに対するtn_{... n = 1}_の時_{p < 0.05}_，_n_{≥ 2}_の時_{p < 1.0}_{· 10}−n_{の有意確率）}

Rtw Rrt Rrted Rreply

M edian Ot Lo M edian Eg M edian Lo Eg M edian As Lo

本人一人(On) 3.69 6.557 _1.23 _0.079 _7.5511 _0.069 _3.711 _8.3912 _0.365 _4.423 _6.417 自画像(Sp) 5.19 4.944 _2.70 _0.084 _7.4411 _0.030 _4.653 _6.829 _0.270 _5.645 _5.295 顔隠し(Hf) 12.7 2.77 5.485 _0.100 _7.3210 _0.031 _5.655 _7.1410 _0.337 _4.383 _5.976 本人複数(As) 7.53 5.595 _3.802 _0.067 _7.7512 _0.046 _5.976 _7.8412 _0.519 _– _9.1112 他人(Dp) 7.35 4.483 _3.551 _0.058 _7.1610 _0.034 _5.475 _7.3510 _0.351 _3.651 _6.097 文字(Le) 3.43 6.147 _0.74 _0.029 _4.573 _0.341 _0.38 _8.4812 _0.025 _9.2112 _1.60 ロゴ(Lo) 2.80 6.588 _– _0.040 _5.916 _0.311 _– _8.7112 _0.071 _9.1112 _– オタク(Ot) 25.4 – 6.588 _0.076 _7.3110 _0.025 _5.706 _6.989 _0.284 _5.505 _5.455 キャラクタ(Ch) 5.32 5.114 _2.33 _0.043 _6.357 _0.026 _4.974 _6.588 _0.383 _3.431 _6.167 動物(An) 2.81 5.966 _0.17 _0.062 _6.989 _0.013 _6.608 _4.453 _0.253 _6.046 _4.393 オブジェ(Ob) 6.54 4.222 _2.74 _0.045 _6.327 _0.019 _6.738 _5.485 _0.331 _4.633 _5.184 景色(Sc) 3.27 6.187 _0.22 _0.044 _5.315 _0.021 _5.655 _5.625 _0.141 _6.929 _1.98 たまご(Eg) 0.79 6.498 _2.50 _0.000 _– _0.000 _8.7112 _– _0.002 _8.1812 _1.84 On Sp Hf As Dp Le Lo Ot Ch An Ob Sc Eg 0.0 0.2 0.4 0.6 0.8 1.0 Profile Image Rrt ed 図3:投稿数に対する被リツイートの割合（Rrted）と表現できる．上記の計算式により，全てのユーザのRrted を算出した．図3に，ユーザのRrtedを各カテゴリごとに分布として箱ひげ図で示す．図1と同様に横軸はアイコン画像のカテゴリを示しており，縦軸はRrtedとなっている．図3を見ると，ロゴ（Lo）ユーザと文字（Le）ユーザのRrtedが目立って高いことが分かる． 1日当たりの投稿頻度（Rtw）と同様に，Rrtedに対して各カテゴリ間の多重比較を行った．その結果を表3の中右列（Rrtedの列）に示す．ロゴ（Lo）ユーザは，文字（Le）ユーザ以外のすべてのカテゴリと比較して有意に引用される頻度が高い．前述したように，ロゴユーザは組織や団体のアカウントであることが多いと考えられるため，フォロワーにとって有益な情報が発信されている可能性が高い．また，その情報を拡散させることを目的にフォローしているユーザも多いかもしれない．これらが，ロゴユーザのRrtedの高さに寄与していると考えられる．文字ユーザにも同様の傾向が見られる．たまご（Eg）ユーザは，引用する頻度も低かったが，引用される頻度も全てのカテゴリと比較して有意に低い結果となった．彼らはTwitterの初心者である可能性が高く，引用されるためのフォロワーがそもそも少ないことがこの結果の原因であると思われる． 5.4 返信頻度 Twitterでは，他のユーザの投稿に返信する形でツイートすることができる．これはリプライと呼ばれる．特定のユーザとインタラクションを取る行為であるため，親しい友人や知人と連絡を取り合う目的で利用されやすい． Rrtの分析と同様に，投稿数がユーザによって異なるため，投稿数に対するリプライ数の割合で比較する．投稿数に対するリプライ数の割合をRreplyとすると，

Rreply= Nreply / Ntweet (4)

と表現できる．上記の計算式により，全てのユーザのRreply を算出した．図4に，ユーザのRreplyを各カテゴリごとに分布として箱ひげ図で示す．図1と同様に横軸はアイコン画像のカテゴリを示しており，縦軸はRreplyとなっている． 1日当たりの投稿頻度（Rtw）と同様に，Rreplyに対して各カテゴリ間の多重比較を行った．その結果を表3の最右列（Rreplyの列）に示す．本人複数（As）ユーザは，他のどのカテゴリと比較しても有意にリプライの頻度が高い．中央値で評価すると，2回の投稿に対して1回は返信を行っていると言える．彼らは友人や知り合いと一緒に写った写真をアイコン画像に用いており，人とのコミュニケーションへの関心の高さがユーザ行動にも表れる結果となった．一方，ロゴ（Lo）ユーザはほとんどのカテゴリと比べてリプライを積極的に行わない傾向が見られた．組織や団体を代表するアカウントが多

(5)

On Sp Hf As Dp Le Lo Ot Ch An Ob Sc Eg 0.0 0.2 0.4 0.6 0.8 1.0 Profile Image Rre pl y 図4: 投稿数に対するリプライの割合（Rreply）いと思われるため，特定の個人とのコミュニケーションを避けている可能性がある．

6. 本研究の課題

本研究は，アイコン画像のカテゴリ間でユーザ行動に違いを明らかにすることを試みた最初に研究であるが，調査と分析にあたっていくつか課題が残されている．まず，分析対象となるユーザが日本人に限定されている点である．文化の違いは，自分が移る写真の提示やソーシャルメディア上のアイコン画像の選択に影響を与えると報告されている[16], [17]．より一般的な知見を得るためには，国籍や言語などの文化的背景の異なるユーザを対象に調査を進める必要があると言える．また，今回の調査と分析において，ユーザから投稿されたツイートの内容は確認していない．投稿や引用，返信の頻度だけでなく，その内容にもユーザ特性が反映され，カテゴリごとに違いが確認される可能性は高い．本稿では網羅的な調査を行うため簡易なデータを対象としたが，将来的にはツイートの内容の違いも検証していく必要がある．

7. 結論

本研究は，Twitter上のアイコン画像のカテゴリごとにユーザ行動の違いを分析した最初の研究である．我々は，アイコン画像を，動物，たまご，自画像，顔隠し，文字，ロゴ，オブジェ，オタク，本人一人，本人複数，景色，他人，キャラクタの13種類のカテゴリに分類し，各カテゴリに対して100人のユーザを人手で集め，彼らの投稿，引用（被引用），返信の頻度の違いを分析した．その結果，以下の結果が確認された．オタクユーザは投稿頻度が高く，自身の趣味や興味の対象について頻繁に投稿している可能性がある．．また，たまごユーザは引用，被引用ともに頻度が低く，彼らのフォローしているユーザや彼らがフォローされているユーザの少なさによるものと推察される．ロゴユーザは引用される頻度が非常に高く，フォロワーの関心をひくツイートを投稿していると考えられる．本人複数ユーザは返信の頻度が高い結果となり，コミュニケーションへの積極性がユーザ行動とアイコン画像に現れていると言える．対象ユーザが日本人に限定されており，投稿されたツイートの内容を確認していないという課題が残されているが，我々は本研究がアイコン画像とユーザ行動の関係を明らかにする最初に第一歩となると考えている．参考文献

[1] Burger, J. D., Henderson, J., Kim, G. and Zarrella, G.: Discriminating Gender on Twitter, Proceedings of the

Conference on Empirical Methods in Natural Language Processing, pp. 1301–1309 (2011).

[2] Golbeck, J., Robles, C., Edmondson, M. and Turner, K.: Predicting Personality from Twitter, 2011 IEEE

Third International Conference on Privacy, Security, Risk and Trust (PASSAT) and 2011 IEEE Third Iner-national Conference on Social Computing (SocialCom),

IEEE, pp. 149–156 (2011).

[3] Golbeck, J., Robles, C. and Turner, K.: Predicting Per-sonality with Social Media, Proceedings of the 2011

An-nual Conference Extended Abstracts on Human Factors in Computing Systems - CHI EA ’11, New York, New

York, USA, ACM Press, pp. 253–262 (2011).

[4] Hum, N. J., Chamberlin, P. E., Hambright, B. L., Port-wood, A. C., Schat, A. C. and Bevan, J. L.: A picture is worth a thousand words: A content analysis of Face-book profile photographs, Computers in Human

Behav-ior, Vol. 27, No. 5, pp. 1828–1833 (2011).

[5] Ikeda, K., Hattori, G., Ono, C., Asoh, H. and Higashino, T.: Twitter user profiling based on text and community mining for market analysis, Knowledge-Based Systems, Vol. 51, pp. 35–47 (2013).

[6] Kapidzic, S.: Narcissism as a predictor of motivations behind Facebook profile picture selection.,

Cyberpsychol-ogy, Behavior and Social Networking, Vol. 16, No. 1, pp.

14–19 (2013).

[7] Kim, D., Jo, Y., Moon, I.-C. and Oh, A.: Analysis of Twitter Lists as a Potential Source for Discovering La-tent Characteristics of Users, ACM CHI Workshop on

Microblogging, p. 4 (2010).

[8] Pennacchiotti, M. and Gurumurthy, S.: Investigating Topic Models for Social Media User Recommendation,

Proceedings of the 20th International Conference Com-panion on World Wide Web, New York, New York,

USA, ACM Press, pp. 101–102 (2011).

[9] Pennacchiotti, M. and Popescu, A.-m.: A Machine Learning Approach to Twitter User Classification,

Pro-ceedings of the Fifth International AAAI Conference on Weblogs and Social Media, pp. 281–288 (2010).

[10] Qiu, L., Lin, H., Ramsay, J. and Yang, F.: You are what you tweet: Personality expression and perception on Twitter, Journal of Research in Personality, Vol. 46, No. 6, pp. 710–718 (2012).

[11] Quercia, D., Kosinski, M., Stillwell, D. and Crowcroft, J.: Our Twitter Profiles, Our Selves: Predicting Personality with Twitter, 2011 IEEE Third International

(6)

and 2011 IEEE Third Inernational Conference on So-cial Computing (SoSo-cialCom), IEEE, pp. 180–185 (2011).

[12] Ramage, D., Dumais, S. and Liebling, D.: Character-izing Microblogs with Topic Models, Proceedings of the

Fourth International AAAI Conference on Weblogs and Social Media, pp. 130–137 (2010).

[13] Siibak, A.: Constructing masculinity on a social net-working site, Young, Vol. 18, No. 4, pp. 403–425 (2010). [14] Siibak, A. and Hernwall, P.:‘Looking like my favourite Barbie’Online Gender Construc- tion of Tween Girls in Estonia and in Sweden，Studies of Transition States and Societies, Vol. 3, No. 2, pp. 57–68 (2011).

[15] Suler, J.: The Psychology of Avatars and Graphical Space in Multimedia Chat Communities or : How I Learned to Stop Worrying and Love My Palace Props,

Chat communication, pp. 305–344 (1999).

[16] Zhao, C. and Jiang, G.: Cultural diﬀerences on vi-sual self-presentation through social networking site pro-file images, Proceedings of the 2011 Annual Conference

on Human Factors in Computing Systems - CHI ’11,

New York, New York, USA, ACM Press, pp. 1129–1132 (2011).

[17] Ziller, R. C.: Photographing the self: Methods for

ob-serving personal orientations., Sage publications, Inc

[15] Twitter Twitter *2 [4], [6], [13], [14], [16] [1], [2], [3], [8], [10], [11], [12] *2 SNS 1: (On) (Sp) (Hf) (As) (Dp)

Twitter

上のアイコン画像とユーザ行動の関係の調査と分析

冨永 登夢

土方 嘉徳

An Investigation and Analysis on the Relationship between Profile

Images and User Behaviors on Twitter

Tominaga Tomu

Hijikata Yoshinori

1.

はじめに

2.

本研究の位置づけ

3.

アイコン画像の分類

4.

データ収集

5.

結果

6.

本研究の課題

7.

結論

[15] Twitter Twitter 2 [4], [6], [13], [14], [16] [1], [2], [3], [8], [10], [11], [12] 2 SNS 1: (On) (Sp) (Hf) (As) (Dp)

冨永登夢

_{土方嘉徳}