顔文字に着目した映画に対するtweetの感情抽出
甲南大学 知能情報学部 知能情報学科 灘本研究室 10971077 田中美羽
はじめに
・リアルタイムにツイートが表示される ・140字以内で自由に発信できる ・ハッシュタグでHOTワードが表示される近年、twitterなどのマイクロブログの普及に伴い、
テレビを見ながらツイートしている人が増えている
その番組に対して自分の感想などのコメントが多く見られる ツイートの中には視聴者の感情が多く含まれている【映画が盛り上がっている時のツイート例】
アリエッティかわいそう(´・ω・`) @Syo_K_pickles やだぁああっとっちゃいやぁっそのまま、そのままでいいの!!セ゛ェッハァ(°□°;)眼鏡 の翔ちゃん大好きなんだからねっ @kmzw1048 今日は、アリエッティがアリエッティ ( TДT)コ゛メンヨー アリエッティ声優さん使ってないのが凄く勿体無い(;つД`) アリエッティ「濡れすぎたんだ・・・・湿ってやがる・・・・(砂糖について」 なんだかんだでアリエッティ見ちゃってるぅ(^O^) アリエッティの男の子恐い( ・_・;) @ryo1206R @tsuru0501 なんだ~そっか!ってか、まいこ様が一番の関所やろたい!アロハ翔くん♪トー クショーで着てたりしないよね?( ̄^ ̄) アリエッティ録画忘れてた\(^o^)/ 翔ちん普通にいやらしいですしね(ぉ アリエッティまじかわいいな(*^ω^*) @2PMchansung_bot アリエッティしってる?(δvδ)感情表現として
「かわいそう」「恐い」などの
感情語
(´・ω・`), (^O^)などの
顔文字
が多く見られる
目的
テレビ放送されている映画に対するツイートから
感情を抽出する
【期待できること】
・テレビ番組の要約(ダイジェスト)
・ユーザーの見たい番組の推薦 の手助けにつながる!
テキストベースの感情語だけでなく、顔文字にも着目するテキスト+顔文字
感情値抽出
テキスト文のみ
感情値抽出までの流れ(顔文字ない場合)
~文の感情値抽出の流れ~
トトロ感動した。 最後の男の人かわいそうやな トトロ/感動/した。 最後の/男/の/人/かわいそうや/な 楽しい 悲しい 嬉しい 怒り のどか 緊迫 ツイート1 0 0.6 0 0.1 0 0.2 楽しい 悲しい 嬉しい 怒り のどか 緊迫 感動 0 0.2 0 0 0 0.1 かわいそう 0 0.4 0 0.1 0 0.1 映画に関するツイートの収集 感情辞書 1ツイート毎に形態素解析文の感情値
単語
感情軸について
嬉しい 怒り のどか 緊迫 楽しい 悲しい本研究では熊本ら(千葉工業大学)が構成した3軸を使う
感情語 しかし、熊本らの辞書は新聞記事用のものなので,映画のツイッター用に印象語の拡張す る必要がある.そこで・・・ 感情語を指し示す語 「楽しい」→「わくわくする」 「悲しい」→「泣く」 印象語 「楽しい」「悲しい」 「嬉しい」「怒り」 「のどか」「緊迫」 複数の印象語から構成される感情辞書
感情語 辞書 文 感情軸ごとの 印象語決定 =TFの上位 ユーザ実験 ジャンル:映画 300tweet 【目的】 共起をとるための印象語を習得する 被験者:5名 映画に関する300ツイート 「6個の感情語+その他」からどの印象を感じたか選んでもらう 【印象語の取得方法】 各感情語の中で形態素解析をかけ,出現頻度の高い単語を 印象語とする。 楽しい tf 悲しい tf 嬉しい tf 怒り tf のどか tf 緊迫 tf 可愛い 4 涙 3 可愛い 7 騒がしい 2 安心 2 ピンチ 3 やばい 4 酷い 2 最高 4 あざとい 1 やさしい 1 やばい 1 おもしろい 2 痛い 2 かっこいい 3 くそ 1 気持ちよい 1 おもろい 1 かっこいい 2 寂しい 1 良い 2 うるさい 1 なつかしい 1 高い 1 腹筋 2 切ない 1 良い 2 迷惑 1 素晴らしい 1 あぶない 1 感情語辞書拡張のために 結果として22個→109個に印象語を拡張した
テキスト+顔文字
感情値抽出
テキスト文のみ
\(^O^)/
無理だ\(^O^)/
きたああああ\(^O^)/
ふざけんなこら\(^O^)/
同じ顔文字の場合 同じ顔文字でも文によって使われ方が異なる顔文字に感情値を付与してそのまま使わず、
文と顔文字の関係
から感情値を決める
本研究のポイント 役割映画に関するツイートの収集
顔文字
感情辞書 顔文字 感情語辞書 1ツイート毎に形態素解析文の感情語
顔文字の感情語
文の感情値
単語
両者の関係に合った役割の 重みを文の感情値に付与 1ツイート全体の感情値感情値抽出までの流れ(顔文字がある場合)
楽しい 悲しい 嬉しい 怒り のどか 緊迫 ツイート1 0 0.6 0 0.1 0 0.2 悲しい 楽しい 悲しい 嬉しい 怒り のどか 緊迫 (ToT) 0 1 0 0 0 0 悲しい トトロ感動した。 最後の男の人かわいそうやな(ToT)映画に関するツイートの収集
顔文字
感情辞書 顔文字 感情語辞書 1ツイート毎に形態素解析文の感情語
顔文字の感情語
文の感情値
単語
両者の関係に合った役割の 重みを文の感情値に付与 1ツイート全体の感情値感情値抽出までの流れ(顔文字がある場合)
悲しい 悲しい トトロ感動した。 最後の男の人かわいそうやな(ToT)顔文字の感情語辞書の生成 ユーザー実験により顔文字だけをみてもらい、「楽しい」,「悲しい」,「嬉しい」, 「怒り」,「のどか」,「緊迫」の6個の感情語と「不明」の中から分類。 被験者5名のうち、2名以上が選んだものを、その顔文字の感情語とする。
結果:169個の顔文字から感情語を取得することが出来た。
目的 顔文字がどの感情語を持つか調べる 楽しい 悲しい 嬉しい 怒り のどか 緊迫 (*^^*) 1 1 1 0 1 0 (´・ω ・`) 1 1 0 0 0 1 (´;ω ;`) 0 1 1 1 0 1 ( ̄▽ ̄) 0 1 0 1 1 0 (((o(*゜▽゜*)o)) 1 0 1 0 0 0 (・∀・) 0 0 1 1 1 0 (´Д ` ) 0 1 0 1 0 0 (´・_・`) 0 1 0 0 0 0 ( ´ ▽ ` ) 1 1 1 0 1 0 。・゜・(ノД `)・゜・。 0 1 1 0 0 1 顔文字 感情語辞書映画に関するツイートの収集
顔文字
感情辞書 顔文字 感情語辞書 1ツイート毎に形態素解析文の感情語
顔文字の感情語
文の感情値
単語
マッチした役割の重み を文の感情値に付与 1ツイート全体の感情値感情値抽出までの流れ
(顔文字がある場合)
顔文字の役割について 役割とは 顔文字があることで文章の意味に何らかの影響を与えている ・強調・・・顔文字が文の意味(良い意味、悪い意味含めて)をより強めている ・自嘲・・・顔文字があることで、自分に呆れて笑うさま、さげすんであざ笑うこと・・・と いったニュアンスを感じさせる ・弛緩・・・ネガティブな文面に対して、顔文字が文の意味を少しでも弱めている、和ら げている 【予備実験】 目的 ・役割の特徴の発見 ・感情語との関係性を調べる (一つの顔文字に対しての役割を見たいので、今回は1ツイートの中に顔文字が複数ある ツイートは省いている) 被験者:5名 ツイート数:270ツイート ①顔文字を含んだツイート文を見てもらい、「6個の感情語+その他」からどの印象を感じた か選んでもらう ②また、上記の定義をした説明したうえで顔文字がどの役割を果たしているか選んでもらう.
特徴の例 例 同じ表現を繰り返すもの きたああああ\(^O^)/ 強調記号+顔文字 見る!!(*≧∀≦*) 文の意味=顔文字の意味 好きだな(*´∇`*) 嫌い(´・_・`) 文の意味 ↔ 顔文字の意味 かわいいわぁヽ(;▽;)ノ 否定系+(笑)、(^0^) できてない(笑) 見てない(*´▽`*) 文の意味 ↔ 顔文字の意味 何かムカつく( ^ω^) 機能 強調 自嘲 弛緩 文の感情語と顔文字の感情語が同じ ↓ 強調 文の感情語が 「楽しい」「嬉しい」→強調 文の感情語と顔文字の感情語が反対 ↓ 弛緩 文に否定系が含まれている + 顔文字の感情語が「楽しい」「嬉しい」「のどか」 ↓ 自嘲
顔文字の役割の重みについて ・文の感情語=「楽しい」「嬉しい」 ・文の感情語=顔文字の感情語
値
における文のみの感情
含めた感情値
における文と顔文字を
ある1ツイート
i
DIM
i
TIM
i
i i:
:
:
2
i iDIM
TIM
文の感情語⇔顔文字の感情語
0
.
3
i iDIM
TIM
文中に否定形 + 顔文字の感情語=「楽しい」「嬉しい」「のどか」TIM
i
DIM
i
0
.
2
強調 弛緩 自嘲 1ツイート全体の感情値=文の感情値×重み評価実験 【正解データ】 予備実験で得られた結果の上位3位を正解データとする 【比較対象】 顔文字を考慮しないで感情値を算出したシステム、 顔文字を考慮して感情値を算出したシステム が判定した結果の上位3位をセットデータとする 適合率 再現率 F値 顔文字考慮なし
29%
38%
33%
顔文字考慮あり33%
42%
37%
顔文字を考慮したほうが適合率・再現率・F値共に数値が上がった 楽しい 悲しい 嬉しい 怒り のどか 緊迫 顔文字考慮なし(F値) 39% 28% 42% 36% 18% 34% 顔文字考慮あり(F値) 48% 33% 50% 27% 21% 32% 「弛緩」の重み付けが文の感情値を大きく下げてしまったためシステムに 判定されず、正解データとマッチしなくなった →感情語によって重みの値を変える必要がある 目的:顔文字を考慮して算出した感情値がどの程度適合しているか しかし・・・映画「サマーウォーズ」
顔文字を含んだツイートから感情値をグラフ化
「あかんもう泣く(ノД`)」