• 検索結果がありません。

顔文字に着目した TwitterのP/N値に基づく映画の見どころ検索

N/A
N/A
Protected

Academic year: 2021

シェア "顔文字に着目した TwitterのP/N値に基づく映画の見どころ検索"

Copied!
20
0
0

読み込み中.... (全文を見る)

全文

(1)

顔文字に着目した映画に対するtweetの感情抽出

甲南大学 知能情報学部 知能情報学科 灘本研究室 10971077 田中美羽

(2)

はじめに

・リアルタイムにツイートが表示される ・140字以内で自由に発信できる ・ハッシュタグでHOTワードが表示される

近年、twitterなどのマイクロブログの普及に伴い、

テレビを見ながらツイートしている人が増えている

その番組に対して自分の感想などのコメントが多く見られる ツイートの中には視聴者の感情が多く含まれている

(3)

【映画が盛り上がっている時のツイート例】

アリエッティかわいそう(´・ω・`) @Syo_K_pickles やだぁああっとっちゃいやぁっそのまま、そのままでいいの!!セ゛ェッハァ(°□°;)眼鏡 の翔ちゃん大好きなんだからねっ @kmzw1048 今日は、アリエッティがアリエッティ ( TДT)コ゛メンヨー アリエッティ声優さん使ってないのが凄く勿体無い(;つД`) アリエッティ「濡れすぎたんだ・・・・湿ってやがる・・・・(砂糖について」 なんだかんだでアリエッティ見ちゃってるぅ(^O^) アリエッティの男の子恐い( ・_・;) @ryo1206R @tsuru0501 なんだ~そっか!ってか、まいこ様が一番の関所やろたい!アロハ翔くん♪トー クショーで着てたりしないよね?( ̄^ ̄) アリエッティ録画忘れてた\(^o^)/ 翔ちん普通にいやらしいですしね(ぉ アリエッティまじかわいいな(*^ω^*) @2PMchansung_bot アリエッティしってる?(δvδ)

感情表現として

「かわいそう」「恐い」などの

感情語

(´・ω・`), (^O^)などの

顔文字

が多く見られる

(4)

目的

テレビ放送されている映画に対するツイートから

感情を抽出する

【期待できること】

・テレビ番組の要約(ダイジェスト)

・ユーザーの見たい番組の推薦 の手助けにつながる!

テキストベースの感情語だけでなく、顔文字にも着目する

(5)

テキスト+顔文字

感情値抽出

テキスト文のみ

(6)

感情値抽出までの流れ(顔文字ない場合)

~文の感情値抽出の流れ~

トトロ感動した。 最後の男の人かわいそうやな トトロ/感動/した。 最後の/男/の/人/かわいそうや/な 楽しい 悲しい 嬉しい 怒り のどか 緊迫 ツイート1 0 0.6 0 0.1 0 0.2 楽しい 悲しい 嬉しい 怒り のどか 緊迫 感動 0 0.2 0 0 0 0.1 かわいそう 0 0.4 0 0.1 0 0.1 映画に関するツイートの収集 感情辞書 1ツイート毎に形態素解析

文の感情値

単語

(7)

感情軸について

嬉しい 怒り のどか 緊迫 楽しい 悲しい

本研究では熊本ら(千葉工業大学)が構成した3軸を使う

感情語 しかし、熊本らの辞書は新聞記事用のものなので,映画のツイッター用に印象語の拡張す る必要がある.そこで・・・ 感情語を指し示す語 「楽しい」→「わくわくする」 「悲しい」→「泣く」 印象語 「楽しい」「悲しい」 「嬉しい」「怒り」 「のどか」「緊迫」 複数の印象語から構成される

感情辞書

(8)

感情語 辞書 文 感情軸ごとの 印象語決定 =TFの上位 ユーザ実験 ジャンル:映画 300tweet 【目的】 共起をとるための印象語を習得する 被験者:5名 映画に関する300ツイート 「6個の感情語+その他」からどの印象を感じたか選んでもらう 【印象語の取得方法】 各感情語の中で形態素解析をかけ,出現頻度の高い単語を 印象語とする。 楽しい tf 悲しい tf 嬉しい tf 怒り tf のどか tf 緊迫 tf 可愛い 4 涙 3 可愛い 7 騒がしい 2 安心 2 ピンチ 3 やばい 4 酷い 2 最高 4 あざとい 1 やさしい 1 やばい 1 おもしろい 2 痛い 2 かっこいい 3 くそ 1 気持ちよい 1 おもろい 1 かっこいい 2 寂しい 1 良い 2 うるさい 1 なつかしい 1 高い 1 腹筋 2 切ない 1 良い 2 迷惑 1 素晴らしい 1 あぶない 1 感情語辞書拡張のために 結果として22個→109個に印象語を拡張した

(9)

テキスト+顔文字

感情値抽出

テキスト文のみ

(10)

\(^O^)/

無理だ\(^O^)/

きたああああ\(^O^)/

ふざけんなこら\(^O^)/

同じ顔文字の場合 同じ顔文字でも文によって使われ方が異なる

顔文字に感情値を付与してそのまま使わず、

文と顔文字の関係

から感情値を決める

本研究のポイント 役割

(11)

映画に関するツイートの収集

顔文字

感情辞書 顔文字 感情語辞書 1ツイート毎に形態素解析

文の感情語

顔文字の感情語

文の感情値

単語

両者の関係に合った役割の 重みを文の感情値に付与 1ツイート全体の感情値

感情値抽出までの流れ(顔文字がある場合)

楽しい 悲しい 嬉しい 怒り のどか 緊迫 ツイート1 0 0.6 0 0.1 0 0.2 悲しい 楽しい 悲しい 嬉しい 怒り のどか 緊迫 (ToT) 0 1 0 0 0 0 悲しい トトロ感動した。 最後の男の人かわいそうやな(ToT)

(12)

映画に関するツイートの収集

顔文字

感情辞書 顔文字 感情語辞書 1ツイート毎に形態素解析

文の感情語

顔文字の感情語

文の感情値

単語

両者の関係に合った役割の 重みを文の感情値に付与 1ツイート全体の感情値

感情値抽出までの流れ(顔文字がある場合)

悲しい 悲しい トトロ感動した。 最後の男の人かわいそうやな(ToT)

(13)

顔文字の感情語辞書の生成 ユーザー実験により顔文字だけをみてもらい、「楽しい」,「悲しい」,「嬉しい」, 「怒り」,「のどか」,「緊迫」の6個の感情語と「不明」の中から分類。 被験者5名のうち、2名以上が選んだものを、その顔文字の感情語とする。

結果:169個の顔文字から感情語を取得することが出来た。

目的 顔文字がどの感情語を持つか調べる 楽しい 悲しい 嬉しい 怒り のどか 緊迫 (*^^*) 1 1 1 0 1 0 (´・ω ・`) 1 1 0 0 0 1 (´;ω ;`) 0 1 1 1 0 1 ( ̄▽ ̄) 0 1 0 1 1 0 (((o(*゜▽゜*)o)) 1 0 1 0 0 0 (・∀・) 0 0 1 1 1 0 (´Д ` ) 0 1 0 1 0 0 (´・_・`) 0 1 0 0 0 0 ( ´ ▽ ` ) 1 1 1 0 1 0 。・゜・(ノД `)・゜・。 0 1 1 0 0 1 顔文字 感情語辞書

(14)

映画に関するツイートの収集

顔文字

感情辞書 顔文字 感情語辞書 1ツイート毎に形態素解析

文の感情語

顔文字の感情語

文の感情値

単語

マッチした役割の重み を文の感情値に付与 1ツイート全体の感情値

感情値抽出までの流れ

(顔文字がある場合)

(15)

顔文字の役割について 役割とは 顔文字があることで文章の意味に何らかの影響を与えている ・強調・・・顔文字が文の意味(良い意味、悪い意味含めて)をより強めている ・自嘲・・・顔文字があることで、自分に呆れて笑うさま、さげすんであざ笑うこと・・・と いったニュアンスを感じさせる ・弛緩・・・ネガティブな文面に対して、顔文字が文の意味を少しでも弱めている、和ら げている 【予備実験】 目的 ・役割の特徴の発見 ・感情語との関係性を調べる (一つの顔文字に対しての役割を見たいので、今回は1ツイートの中に顔文字が複数ある ツイートは省いている) 被験者:5名 ツイート数:270ツイート ①顔文字を含んだツイート文を見てもらい、「6個の感情語+その他」からどの印象を感じた か選んでもらう ②また、上記の定義をした説明したうえで顔文字がどの役割を果たしているか選んでもらう.

(16)

特徴の例 同じ表現を繰り返すもの きたああああ\(^O^)/ 強調記号+顔文字 見る!!(*≧∀≦*) 文の意味=顔文字の意味 好きだな(*´∇`*) 嫌い(´・_・`) 文の意味 ↔ 顔文字の意味 かわいいわぁヽ(;▽;)ノ 否定系+(笑)、(^0^) できてない(笑) 見てない(*´▽`*) 文の意味 ↔ 顔文字の意味 何かムカつく( ^ω^) 機能 強調 自嘲 弛緩 文の感情語と顔文字の感情語が同じ ↓ 強調 文の感情語が 「楽しい」「嬉しい」→強調 文の感情語と顔文字の感情語が反対 ↓ 弛緩 文に否定系が含まれている + 顔文字の感情語が「楽しい」「嬉しい」「のどか」 ↓ 自嘲

(17)

顔文字の役割の重みについて ・文の感情語=「楽しい」「嬉しい」 ・文の感情語=顔文字の感情語

における文のみの感情

含めた感情値

における文と顔文字を

ある1ツイート

i

DIM

i

TIM

i

i i

:

:

:

2

i i

DIM

TIM

文の感情語⇔顔文字の感情語

0

.

3

i i

DIM

TIM

文中に否定形 + 顔文字の感情語=「楽しい」「嬉しい」「のどか」

TIM

i

DIM

i

0

.

2

強調 弛緩 自嘲 1ツイート全体の感情値=文の感情値×重み

(18)

評価実験 【正解データ】 予備実験で得られた結果の上位3位を正解データとする 【比較対象】 顔文字を考慮しないで感情値を算出したシステム、 顔文字を考慮して感情値を算出したシステム が判定した結果の上位3位をセットデータとする 適合率 再現率 F値 顔文字考慮なし

29%

38%

33%

顔文字考慮あり

33%

42%

37%

顔文字を考慮したほうが適合率・再現率・F値共に数値が上がった 楽しい 悲しい 嬉しい 怒り のどか 緊迫 顔文字考慮なし(F値) 39% 28% 42% 36% 18% 34% 顔文字考慮あり(F値) 48% 33% 50% 27% 21% 32% 「弛緩」の重み付けが文の感情値を大きく下げてしまったためシステムに 判定されず、正解データとマッチしなくなった →感情語によって重みの値を変える必要がある 目的:顔文字を考慮して算出した感情値がどの程度適合しているか しかし・・・

(19)

映画「サマーウォーズ」

顔文字を含んだツイートから感情値をグラフ化

「あかんもう泣く(ノД`)」

(20)

まとめ

• 感情語辞書の拡張を行い,顔文字感情辞書の生成を行った

• 文章と顔文字との感情語の関係から映画に対するツイートの感情値を抽出

し,分析を行った

• 顔文字の役割をそれぞれ定義し,重み付けを行った

【今後の課題】

・顔文字の感情語辞書に登録している印象語と顔文字の数が

少ない為さらに増やす必要がある

・役割を定義し,それぞれの場合について重み付けを行ったが,

重み付けの値をより最適な値にする必要がある

参照

関連したドキュメント

「文字詞」の定義というわけにはゆかないとこ ろがあるわけである。いま,仮りに上記の如く

いかなる使用の文脈においても「知る」が同じ意味論的値を持つことを認め、(2)によって

「他の条文における骨折・脱臼の回復についてもこれに準ずる」とある

噸狂歌の本質に基く視点としては小それが短歌形式をとる韻文であることが第一であるP三十一文字(原則として音節と対応する)を基本としへ内部が五七・五七七という文字(音節)数を持つ定形詩である。そ

管理画面へのログイン ID について 管理画面のログイン ID について、 希望の ID がある場合は備考欄にご記載下さい。アルファベット小文字、 数字お よび記号 「_ (アンダーライン)

目標を、子どもと教師のオリエンテーションでいくつかの文節に分け」、学習課題としている。例

とされている︒ところで︑医師法二 0