• 検索結果がありません。

九州大学学術情報リポジトリ Kyushu University Institutional Repository 動画コンテンツの視聴者コメントに基づくランキングとその評価 村上, 直至九州大学情報基盤研究開発センター 九州大学大学院システム情報科学府 伊東, 栄典九州大学大学院システム情報科学府

N/A
N/A
Protected

Academic year: 2021

シェア "九州大学学術情報リポジトリ Kyushu University Institutional Repository 動画コンテンツの視聴者コメントに基づくランキングとその評価 村上, 直至九州大学情報基盤研究開発センター 九州大学大学院システム情報科学府 伊東, 栄典九州大学大学院システム情報科学府"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

九州大学学術情報リポジトリ

Kyushu University Institutional Repository

動画コンテンツの視聴者コメントに基づくランキン

グとその評価

村上, 直至

九州大学情報基盤研究開発センター | 九州大学大学院システム情報科学府

伊東, 栄典

九州大学大学院システム情報科学府 | 九州大学情報基盤研究開発センター

Murakami, Naomichi

Ito, Eisuke

http://hdl.handle.net/2324/24241

出版情報:第4回データ工学と情報マネジメントに関するフォーラム(DEIM2012), 2012-07-31. 日本

データベース学会

バージョン:

権利関係:

(2)

DEIM Forum 2012 F8-3

動画コンテンツの視聴者コメントに基づくランキングとその評価

村上 直至

伊東 栄典

†九州大学大学院システム情報科学研究院

〒812-8581 福岡市東区箱崎 6-10-1

‡九州大学情報基盤研究開発センター

〒812-8581 福岡市東区箱崎 6-10-1

E-mail: †mrkm978@gmail.com, ‡ito.eisuke.523@m.kyushu-u.ac.jp

あらまし 近年,ニコニコ動画や YouTube に代表される動画共有サービスが流行している.これらのサービスに は大量の動画が投稿されており,膨大な数の動画から利用者が求める動画を発見することは難しい.我々は国内で 人気の高いニコニコ動画を対象に,視聴者が動画に対して抱いた感情を数値化し,検索に役立てる研究を行なって いる.本論文では「笑い」の感情に注目して,動画ごとの「笑い」の度合を数値化する手法を提案し,アンケート に基づく評価実験を行った.数値化には動画のコメント情報を利用した.評価実験では,提案手法が動画の持つ「笑 い」に関する度合を抽出できたことを確認した. キーワード 動画共有サービス,folksonomy,ニコニコ動画

Video weighting method based on viewer’s comments and its evaluation

Naomichi MURAKAMI

Eisuke ITO

†Graduate School of Information Science and Electrical Engineering, Kyushu University, Fukuoka-shi, 812-8581 Japan

Research Institute for Information Technology, Kyushu University, Fukuoka-shi, 812-8581 Japan

E-mail: †mrkm978@gmail.com, ‡ito.eisuke.523@m.kyushu-u.ac.jp

Abstract Nowadays, a lot of people post various contents to the video sharing services. There are a large number of

videos, and it makes the video search harder. In this paper, we focused on Nico Nico Douga, and we propose a ranking method based on viewer’s comments, especially amount of "funny" feelings comments given by viewer. We also evaluate the questionnaire for our method. Our proposed method is assumed to be applicable to all types of content, if it given a lot of comments from people.

Keyword video hosting service,folksonomy,Nico Nico Douga

1. は じ め に

YouTube[1] や ニ コ ニ コ 動 画 [2] の よ う な 利 用 者 投 稿 型 の 動 画 共 有 サ ー ビ ス が 人 気 を 博 し て い る . こ れ ら の サ イ ト に は プ ロ ア マ 問 わ ず 制 作 さ れ た 多 種 多 様 な 動 画 が 大 量 に 投 稿 さ れ て お り , こ れ ら 動 画 の 中 か ら 利 用 者 が 面 白 い 動 画 を 見 つ け る た め に は 検 索 シ ス テ ム が 重 要 で あ る . 利 用 者 が 娯 楽 を 求 め て サ イ ト を 訪 れ る と き , 検 索 対 象 の 動 画 を う ま く 限 定 で き ず , そ の と き ど き の 気 分 に 合 う よ う な 動 画 を 探 し て い る 場 合 が あ る . 予 め 動 画 の 持 つ 感 情 的 な 要 素 を 数 値 化 で き れ ば , 利 用 者 が 自 分 の 気 分 に 合 う 動 画 を 発 見 す る の に 役 立 つ . 我 々 は ニ コ ニ コ 動 画 に 注 目 し て , 動 画 検 索 エ ン ジ ン の 研 究 を 行 っ て い る[3, 4, 5, 6].ニ コ ニ コ 動 画 で は 多 数 の 利 用 者 が 多 数 の 動 画 に コ メ ン ト を 与 え て い る . 過 去 に 動 画 を 視 聴 し た 人 の コ メ ン ト を 利 用 す れ ば , 動 画 ご と の 娯 楽 の 性 質 を 機 械 的 に 判 断 で き る 可 能 性 が あ る . 本 論 文 で は「 笑 い 」の 感 情 に 注 目 し て ,動 画 ご と の「 笑 い 」 の 度 合 を 数 値 化 す る 手 法 を 提 案 し , ア ン ケ ー ト に 基 づ く 評 価 実 験 を 行 っ た . 実 験 の 結 果 , 検 索 者 が 受 け 狙 い の 動 画 を 発 見 し た い 場 合 に 特 化 し た 検 索 エ ン ジ ン が 構 築 で き る こ と を 確 認 し た .

2. ニ コ ニ コ 動 画

ニ コ ニ コ 動 画 は 2006 年 12 月 12 日 に 運 営 を 開 始 し た ,視 聴 者 投 稿 型 の 動 画 配 信 サ ー ビ ス で あ る[7].サ イ ト 内 で 動 画 を 視 聴 す る に は 会 員 登 録 が 必 要 で ,2012 年 1 月 時 点 で の 一 般 会 員 登 録 者 数 は 約 2500 万 人 ,有 料 会

(3)

員 は 約150 万 人 , モ バ イ ル 会 員 は 600 万 人 を 超 え て い る . 類 似 す る サ ー ビ ス に YouTube, Myspace[8], deviantArt[9]な ど が あ る . 運 営 開 始 か ら 5 周 年 を 迎 え た 2011 年 12 月 時 点 で の 総 動 画 数 は , 700 万 件 を 超 え て い る . 類 似 サ ー ビ ス と 比 べ た 時 の ニ コ ニ コ 動 画 の 最 大 の 特 徴 は , 独 自 の コ メ ン ト シ ス テ ム で あ る . 動 画 の あ る 再 生 時 点 に 投 稿 さ れ た コ メ ン ト は , 投 稿 し た 動 画 再 生 時 間 情 報 と 共 に 保 存 さ れ , 他 の 全 て の 視 聴 者 の 動 画 再 生 画 面 上 に 表 示 さ れ る . 2.1. 動 画 に 付 与 さ れ る ア ノ テ ー シ ョ ン ニ コ ニ コ 動 画 に お け る ア ノ テ ー シ ョ ン に つ い て 述 べ る . ニ コ ニ コ 動 画 へ 投 稿 さ れ た 動 画 に は ア ノ テ ー シ ョ ン と し て 「 投 稿 者 ア カ ウ ン ト , 動 画 ID, タ イ ト ル , 説 明 文 , 投 稿 日 時 , タ グ , サ ム ネ イ ル 画 像 , 動 画 の 長 さ , コ メ ン ト 数 , 再 生 数 , マ イ リ ス ト 登 録 数 , 視 聴 者 コ メ ン ト 」 が 付 与 さ れ る . こ の う ち , タ イ ト ル , 説 明 文 , 投 稿 日 時 , タ グ の 一 部 , サ ム ネ イ ル 画 像 は 投 稿 者 が 指 定 す る . 動 画 長 は 投 稿 動 画 か ら 自 動 的 に 決 ま る . 図 1 に 動 画 ID「 sm9」に 付 与 さ れ た ア ノ テ ー シ ョ ン (視 聴 者 コ メ ン ト を 除 く)を 付 す . 図1 動 画 ID「 sm9」 に 付 与 さ れ た ア ノ テ ー シ ョ ン の 一 部 ま た , ニ コ ニ コ 動 画 へ 投 稿 さ れ た 視 聴 者 コ メ ン ト は , 次 の よ う な デ ー タ の 組 と し て 公 開 さ れ て い る . 「 コ メ ン ト 本 文 ,投 稿 し た 時 間 ,投 稿 し た 動 画 時 間 , 投 稿 者 ハ ッ シ ュ 値 ,コ マ ン ド ,投 稿 し た コ メ ン ト の ID」 投 稿 し た 時 間 と は , 視 聴 者 が コ メ ン ト の 投 稿 ボ タ ン を 押 し た と き の UNIX 時 間 で あ る . 一 方 で , 視 聴 者 が 動 画 の ど の タ イ ミ ン グ に 対 し て コ メ ン ト を 付 与 し た か と い う 情 報 も , 投 稿 し た 動 画 時 間 と し て 公 開 さ れ る . コ メ ン ト 情 報 を 動 画 の 推 薦 に 用 い る 際 , コ メ ン ト の 投 稿 者 情 報 は 非 常 に 重 要 で あ る . し か し , 公 開 さ れ て い る 情 報 は 利 用 者 の ア カ ウ ン ト と 動 画 ID と 日 付 情 報 を 用 い た ハ ッ シ ュ 値 に 限 定 さ れ て い る . そ の た め , 同 じ ユ ー ザ ー が 他 の 動 画 に 対 し て 行 っ た コ メ ン ト 投 稿 や , 別 な 日 に 同 じ 動 画 に 対 し て 行 っ た コ メ ン ト 投 稿 を 識 別 す る こ と は で き な い . ま た , 利 用 者 の ID が 見 え な い た め に , 利 用 者 ID と 紐 づ い て い る マ イ リ ス ト (お 気 に 入 り リ ス ト)や 視 聴 履 歴 な ど も 取 得 で き な い . 視 聴 者 コ メ ン ト に は , 本 文 と は 別 に コ メ ン ト の 表 示 方 法 を 指 定 す る コ マ ン ド 機 能 が あ る . こ れ に よ っ て , コ メ ン ト 文 を 映 画 の 字 幕 の よ う に 画 面 下 部 に 表 示 さ せ た り , 文 字 サ イ ズ を 大 き く さ せ た り と , 幅 広 い コ メ ン ト 表 現 を 可 能 に し て い る . コ マ ン ド と は こ の , コ メ ン ト 文 字 の 修 飾 に 用 い ら れ る 文 字 列 を 指 す . 投 稿 し た コ メ ン ト の ID と は , 動 画 ご と に 1 か ら 順 に 与 え ら れ る 整 数 値 で , コ メ ン ト 情 報 を 投 稿 が 行 わ れ た 時 系 列 順 に 見 る 場 合 に 有 用 で あ る . 図 2 に 動 画 ID 「sm9」 に 付 与 さ れ た 視 聴 者 コ メ ン ト デ ー タ を 付 す . 図2 動 画 ID「 sm9」 に 付 与 さ れ た 視 聴 者 コ メ ン ト 2.2. 動 画 検 索 動 画 検 索 に は 2 つ の 段 階 が あ る . 1 つ め は 動 画 に 対 す る 絞 り 込 み 操 作 の 段 階 で あ る . こ れ は 巨 大 な 動 画 空 間 か ら , 自 分 の 興 味 の あ る 分 野 の み を 抽 出 す る た め の 処 理 で あ り ,「 検 索 語 を 入 力 す る 」,「 タ グ を 入 力 す る 」 な ど の 操 作 が こ れ に 該 当 す る ( 図 3). 2 つ め は , 抽 出 で き た 動 画 に 対 す る 並 び 替 え 操 作 の 段 階 で あ る . ニ コ ニ コ 動 画 で は 絞 り 込 み 操 作 の 後 に ,「 コ メ ン ト が 新 し い 順 」「 再 生 数 が 多 い 順 」 な ど の 12 種 類 の 観 点 か ら , 抽 出 し た 動 画 を 並 び 替 え る こ と が で き る ( 図 4). 本 稿 で は 動 画 検 索 の2 段 階 目 で あ る 並 び 替 え 操 作 に つ い て 議 論 す る . 既 存 の シ ス テ ム は , コ メ ン ト 数 や 再 生 数 の 多 い 順 に 並 び 替 え る こ と で 人 気 の 動 画 を 素 早 く 発 見 で き る 反 面 , 動 画 が ど う い っ た 趣 向 ・ 性 質 を 持 っ て 人 気 と な っ て い る か に つ い て は , 検 索 結 果 に 反 映 さ れ る こ と が 無 か っ た .動 画 に 付 与 さ れ た コ メ ン ト か ら , 動 画 の 持 つ 娯 楽 の 性 質 を 判 別 出 来 れ ば , 利 用 者 の 気 分

(4)

に 合 わ せ た 動 画 検 索 を 提 供 で き る だ ろ う . 図3 絞 り 込 み 操 作 ( 検 索 語 の 入 力 ) 図4 並 び 替 え 操 作

3. 視 聴 者 コ メ ン ト に 基 づ く ラ ン キ ン グ

動 画 に 対 し て 視 聴 者 が 付 与 す る コ メ ン ト に は , し ば し ば 視 聴 者 が 動 画 に 向 け る 感 情 の 切 れ 端 が 含 ま れ る . 低 い 再 生 回 数 の 動 画 で あ っ て も , 視 聴 者 が 楽 し そ う に 動 画 を 閲 覧 し て い る 様 子 は コ メ ン ト か ら 伝 わ っ て く る . コ メ ン ト に 出 現 す る 単 語 に は , 動 画 に 特 定 の 単 語 が 頻 出 す る こ と も あ る し , 分 野 ( カ テ ゴ リ ) に 固 有 の 単 語 も あ る . ま た , ニ コ ニ コ 動 画 内 で 一 般 的 な 文 字 列 も あ る . た と え ば , 文 字 「w」 を 用 い た コ メ ン ト 高 い 頻 度 で 出 現 す る . こ の 文 字 「w」 は 「 warai」 の 略 で あ り , 多 く の 視 聴 者 が 文 字 「w」 を 含 む コ メ ン ト を 付 与 し た 動 画 は ,「 笑 い 」 の 特 徴 を 強 く 持 つ こ と が 予 想 で き る . 我 々 は , コ メ ン ト 文 に 現 れ る 文 字 「w」 の 数 に 応 じ て 重 み 付 け を 行 う 「W 値 」 を 次 の 式 で 定 義 し た . Wv= wi

n(C) +1 wi= log count "w", c

(

(

i

)

+1

)

動 画 v の W 値 を Wvと す る .v に 付 与 さ れ た コ メ ン ト C を ,コ メ ン ト の 付 与 者 別 に ま と め ,そ れ ぞ れ が 含 む 文 字「w」の 数 を 数 え る .文 字「 w」の 入 力 数 に は コ メ ン ト 付 与 者 ご と に ば ら つ き が 出 る こ と が 予 想 さ れ る た め , 対 数 を 取 っ て そ の 影 響 を 押 さ え る . 最 後 に コ メ ン ト 付 与 者 の 人 数 で 平 均 を と っ た 値 をWvと す る . 我 々 は ニ コ ニ コ 動 画 に お け る ア ノ テ ー シ ョ ン を 検 索 支 援 の た め の 資 源 と し て 活 用 す る た め ,2009 年 10 月 28 日 よ り 11 月 5 日 ま で の 間 ,「 音 楽 」タ グ が 付 与 さ れ た 全 て の 動 画373,265 件 に つ い て 視 聴 者 コ メ ン ト 以 外 の ア ノ テ ー シ ョ ン を 収 集 し た . 収 集 に は , 公 式 に 提 供 さ れ て い る API[10]を 利 用 し た . ま た , 2010 年 5 月 か 6 月 に か け て ,同 じ 373,265 件 の 動 画 に つ い て 視 聴 者 コ メ ン ト 情 報 の 収 集 を 行 っ た . 視 聴 者 コ メ ン ト は そ の 全 て を 収 集 せ ず , そ れ ぞ れ の 動 画 で 直 近 の 500 件 ず つ を 集 め ,W 値 を 算 出 し た .

4. 評 価

1.1. ア ン ケ ー ト 調 査 の 概 要 W 値 の 性 能 を 調 査 す る た め ,ア ン ケ ー ト 調 査 を 行 っ た . ア ン ケ ー ト 調 査 の 前 準 備 と し て , 再 生 数 の 多 か っ た 50 個 の 動 画 か ら な る「 高 再 生 数 の 動 画 グ ル ー プ 」と , 我 々 の 提 案 手 法 に よ る 得 点 の 高 か っ た 50 個 の 動 画 か ら な る「 高 W 値 の 動 画 グ ル ー プ 」の 二 種 類 の 動 画 グ ル ー プ を 用 意 し た . グ ル ー プ の 構 築 の た め , ニ コ ニ コ 大 百 科[11]に お い て「 VOCALOID プ ロ デ ュ ー サ ー の 一 覧 」 [12]を 調 べ た . ニ コ ニ コ 大 百 科 と は ニ コ ニ コ 動 画 版 の Wikipedia で ,日 々 新 し い 語 や 概 念 が 誕 生 し て い く イ ン タ ー ネ ッ ト の 流 行 に 対 応 し て い く た め に 重 要 な 役 割 を 持 つ .VOCALOID は 株 式 会 社 ヤ マ ハ の ボ ー カ ル シ ン セ サ イ ザ ー ソ フ ト で ,ニ コ ニ コ 動 画 で 大 変 な 人 気 を 持 つ . 記 事 「VOCALOID プ ロ デ ュ ー サ ー の 一 覧 」 に は 1,153 名 の プ ロ デ ュ ー サ ー の 名 前 が あ り , 彼 ら の 中 に は 実 際 に 音 楽 関 係 の 仕 事 を し て い る 者 も あ る .12,824 件 の 動 画 に 彼 ら の 名 前 が タ グ 付 け さ れ て お り ,そ の う ち2,247 件 の 動 画 で は 500 以 上 の コ メ ン ト が 寄 せ ら れ て い た . そ の 中 か ら 我 々 は 500 件 以 上 の コ メ ン ト を 付 与 さ れ た 動 画 数 が 最 も 多 い 10 人 の プ ロ デ ュ ー サ ー を 選 出 し た . 10 人 の プ ロ デ ュ ー サ ー か ら は 313 件 の 動 画 が 投 稿 さ れ て い た . そ れ ぞ れ の プ ロ デ ュ ー サ ー ご と に 再 生 数 の 多 い5 件 の 人 気 動 画 と W 値 の 高 い 5 件 の 笑 い 動 画 を 選 出 し た . 図 5 は そ の 全 て を 合 わ せ た 100 件 の 動 画 に つ い て ,再 生 数 と W 値 で プ ロ ッ ト し た も の で あ る .再 生 数 に つ い て は 対 数 軸 を と っ た . 図5 選 出 し た 動 画 の 再 生 数 と W 値 図 5 か ら は ,W 値 の 高 い 動 画 は 再 生 数 10,000 回 か ら 100,000 回 ほ ど の も の が 多 い こ と が 分 か る .6 つ の 動 画 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 1000 10000 100000 1000000 10000000 高再生数 高W値 重複

(5)

は 重 複 し て 2 グ ル ー プ に 現 れ , 2 つ の 動 画 は 削 除 さ れ て お り ,3 つ の 動 画 は ア ク セ ス が 困 難 な 状 況 に あ っ た た め 最 終 的 に89 の 動 画 の リ ス ト を 用 意 し た .こ の リ ス ト は , 動 画 検 索 の 第 1 段 階 に あ た る ,「 VOCALOID プ ロ デ ュ ー サ ー の 名 前 を 用 い た 絞 り 込 み 操 作 」 に よ っ て 作 ら れ る 動 画 集 合 を 擬 似 的 に 再 現 し た も の で あ る . こ う し て 用 意 し た 89 の 動 画 を ラ ン ダ ム に 並 べ て 8 人 の 被 験 者 に 見 せ ,以 下 に 挙 げ る 3 つ の 質 問 を 行 っ た . 全 て の 質 問 に は “ は い ” か “ い い え ” で 回 答 す る . (A) 受 け 狙 い の 動 画 で し た か ? (B) あ な た に と っ て , 笑 え る 動 画 で し た か ? (C) も う 一 度 見 た い と 思 い ま す か ? 質 問 1, 2 は 笑 い の 感 情 に 関 す る 質 問 で あ る . 視 聴 者 コ メ ン ト に よ る 重 み 付 け に よ り , 上 手 く 笑 い の 感 情 に 関 す る 動 画 を 抽 出 で き て い れ ば , こ れ ら の 項 目 に お い て 「 高 W 値 の 動 画 グ ル ー プ 」 は 「 高 再 生 数 の 動 画 グ ル ー プ 」 よ り 高 い ス コ ア を 出 す . ま た , 質 問3 は 再 生 関 数 に 関 す る 質 問 で あ る .「 高 再 生 数 の 動 画 グ ル ー プ 」 は ,こ の 項 目 に お い て 高 ス コ ア を 記 録 す る と 予 想 し た . 以 下 ,図 表 に 表 す 場 合 を 除 い て ,そ れ ぞ れ の 質 問 を(A), (B), (C)で 表 記 す る . 4.1. ア ン ケ ー ト 調 査 の 結 果 8 人 の ア ン ケ ー ト 協 力 者 に 89 の 動 画 を 見 て も ら い , そ の そ れ ぞ れ に つ い て 前 節 に 記 述 し た3 種 類 の 質 問 を し た . 質 問 に は 「 は い 」 か 「 い い え 」 で 回 答 し て も ら っ た . そ の た め 全 て の 動 画 に は , そ れ ぞ れ 3 つ の 質 問 に つ い て 0 か ら 8 ま で の 評 価 が つ く . 表 は ア ン ケ ー ト 調 査 の 結 果 で あ る . 両 グ ル ー プ に 共 通 し て ,(A) に つ い て は8 人 の 評 価 が 合 致 し や す く , 低 い 値 を つ け ら れ た 動 画 と 高 い 値 を つ け ら れ た 動 画 が 多 く 見 ら れ た . 一 方 で (B)と (C)に つ い て は 評 価 値 が 低 い 値 に 集 中 し た . 図6 高 再 生 数 の 動 画 グ ル ー プ の 結 果 図7 高 W 値 の 動 画 グ ル ー プ の 結 果 4.2. ス ピ ア マ ン の 順 位 相 関 係 数 3 つ の 質 問 に 対 す る 回 答 と 再 生 回 数 , W 値 の 間 の 相 関 関 係 を 調 べ る た め , ス ピ ア マ ン の 順 位 相 関 係 数[13] を 求 め た . 表 1 ス ピ ア マ ン の 順 位 相 関 係 数 (A)受 け 狙 い (B)笑 え た (C)も う 一 度 見 た い 再 生 数 W 値 (A) 受 け 狙 い 1.000 0.890 -0.207 -0.200 0.730 (B) 笑 え た 0.890 1.000 -0.240 -0.172 0.742 (C) も う 一 度 見 た い -0.207 -0.240 1.000 0.426 -0.254 再 生 数 -0.200 -0.172 0.426 1.000 -0.468 W 値 0.730 0.742 -0.254 -0.468 1.000 (A)は (B)と W 値 の 2 項 目 に 対 し て 正 の 相 関 を 見 せ た . 一 方 で 残 り の 2 項 目 ,(C)と 再 生 回 数 に 対 し て は 相 関 が 無 か っ た .こ の こ と か ら W 値 は ,動 画 の 持 つ 人 気 の 程 度 と 関 係 せ ず に , 笑 い に 関 す る 成 分 だ け を よ く 表 現 で き て い る と 読 み 取 れ る .(B)は (C)と 弱 い 負 の 相 関 を 持 っ た (t 検 定 , p = 0.01).動 画 を 見 た 上 で「 笑 え た 」と , あ る 一 定 の 価 値 は 認 め つ つ も , 特 に も う 一 度 見 た い と は 思 わ な い と い う 感 情 の 機 微 が 現 れ て お り , 娯 楽 と 消 費 の 関 係 を 伺 わ せ る . ま た ,(B)は (A)と 同 じ く , W 値 と 正 の 相 関 を 持 っ た .(B)と W 値 の 相 関 係 数 の ほ う が (A)と W 値 の そ れ よ り も わ ず か に 高 か っ た . (C)は 再 生 数 と 弱 い 正 の 相 関 を 持 っ た .動 画 の 再 生 数 を 増 や す 要 因 は , 特 定 の 人 間 に 繰 り 返 し 再 生 さ れ る こ と よ り も む し ろ , 多 く の 人 に 少 し ず つ 再 生 さ れ た こ と で あ る と 推 測 で き る . 一 定 以 上 の 品 質 を 持 つ 動 画 は , よ り 多 く の 人 に 存 在 を 知 っ て も ら う こ と で , よ り 再 生 さ れ る 可 能 性 が あ る . 0 2 4 6 8 10 12 14 16 18 20 22 24 0 1 2 3 4 5 6 7 8 動画の数 「はい」と答えた被験者の数 高再生数の動画グループ (A) 受け狙い (B) 笑える (C) もう一度見たい 0 2 4 6 8 10 12 14 16 0 1 2 3 4 5 6 7 8 動画の数 「はい」と答えた被験者の数 高W値の動画グループ (A) 受け狙い (B) 笑える (C) もう一度見たい

(6)

再 生 数 は W 値 と の 間 に 弱 い 負 の 相 関 を 持 っ た .し か し , W 値 の 高 い 動 画 は 「 笑 え た 」 こ と か ら , 一 概 に W 値 の 高 い 動 画 の 視 聴 価 値 を 否 定 す る こ と は で き な い . W 値 の 高 い 動 画 は 馬 鹿 馬 鹿 し い 笑 い を 提 供 し て く れ る も の を 多 数 含 ん で い た た め , こ の よ う な 結 果 に な っ た と 考 え ら れ る . 4.3. 受 信 者 操 作 特 性 ( ROC) W 値 の 笑 い の 動 画 に 関 す る 二 項 分 類 能 力 を よ り 詳 し く 分 析 す る た め , 我 々 は 受 信 者 操 作 特 性 曲 線(ROC 曲 線)[14]を 求 め た . W 値 の 閾 値 を 0.1 ず つ ず ら し て 描 い たROC 曲 線 が 図 8 で あ る .正 解 集 合 に は ア ン ケ ー ト 調 査 で の(A)を 用 い て い る .89 の 動 画 に 対 し 8 人 が「 受 け 狙 い 」 で あ る か 否 か を 評 価 し て い る の で , 標 本 数 は 712 あ る . AUC は 0. 82 で あ り , 単 純 に 選 ん だ 一 つ の 文 字 だ け で も , よ い 識 別 能 を 持 つ こ と が わ か る . 図 9 は 再 生 数 に よ り , も う 一 度 見 た い と 思 う 動 画 が 発 見 出 来 る か , 同 様 の 手 法 で 調 べ た も の で あ る . ス ピ ア マ ン の 順 位 相 関 係 数 を 求 め た 時 点 で は 正 の 相 関 が 見 え た 二 項 目 で あ っ た . し か し 実 際 の と こ ろ , 再 生 回 数 は , も う 一 度 み た い と 思 え る 動 画 を 発 見 す る に は あ ま り 良 く な い 指 標 と な っ て い る こ と が わ か る .AUC は 0.60 で あ っ た . ニ コ ニ コ 動 画 の よ う に 大 量 の コ ン テ ン ツ を 有 す る サ イ ト か ら の 検 索 で は , 再 生 数 な ど の 人 気 度 を 指 標 に 探 す 方 法 が よ く 行 わ れ る . し か し な が ら , 今 回 の 調 査 に よ れ ば , こ う い っ た 検 索 の 方 法 は あ ま り 良 い 方 法 と は 言 え な い . こ の 結 果 と 比 較 し て も , 我 々 の 提 案 し た 重 み 付 け は 有 用 で あ る と 言 え る . 図8 再 生 数 に よ る 「 も う 一 度 み た い 」 に 関 す る 分 類 の ROC 図9 W 値 に よ る 「 受 け 狙 い 」 に 関 す る 分 類 の ROC 4.4. F 値 W は 笑 い の 感 情 に 関 係 の あ る 動 画 に 対 し て 高 い 数 値 を と る 傾 向 を 見 せ た . し か し , 我 々 は 具 体 的 に ど の 値 以 上 の W 値 を 取 る 動 画 が , 笑 い に 関 す る も の で あ る か に つ い て , 定 義 し て い な い . 図 10 は W の 値 で 動 画 を 二 種 類 に 分 け た と き , W 値 の 推 移 に よ る 分 類 の 精 度 を 調 べ た も の で あ る .W 値 の 大 小 に よ っ て 動 画 を 受 け 狙 い の も の で あ る か ど う か 機 械 的 に 推 定 し た と き , 適 合 率 , 再 現 率 ,F 値 の 推 移 を , 分 類 の し き い 値 と な る W 値 を 0.1 き ざ み で 変 化 さ せ つ つ 観 察 し た . 89 の 動 画 に 対 し て 実 行 し た ア ン ケ ー ト 結 果 の う ち 「 受 け 狙 い 」 で あ る と さ れ た 動 画 を 適 合 文 書 と し て い る . 被 験 者 8 人 が 見 た 89 の 動 画 は ,共 通 の 集 合 で あ る が ,そ れ ぞ れ の 評 価 ご と に 別 々 の 適 合 文 書 と 見 た . つ ま り , 適 合 文 書 は 最 大 で 89×8 の 712 個 に な り 得 る . 評 価 の 分 か れ た 動 画 が ひ と つ 以 上 存 在 す る 場 合 , 適 合 率 は 0 や 1 に は な ら な い .X 軸 は W 値 で あ る . F 値 は W 値 が 2.0 の と き 最 大 値 0.76 を と り , お お よ そ 1.8 か ら 2.7 の 範 囲 で 75%付 近 の 値 を 保 持 し た . 多 く の 動 画 が 存 在 す る 中 か ら , い く つ か の 面 白 い 動 画 を 発 見 し た い と き , 検 索 者 に と っ て は 再 現 率 よ り 適 合 率 の 方 が 重 要 か も し れ な い .W 値 が 3.4 の と き 適 合 率 は 最 大 値 0.83 を と る .W 値 が 4 以 上 の と き ,我 々 の 期 待 に 反 し て 適 合 率 が 下 降 し た .W 値 が 極 端 に 高 い 動 画 は 母 数 が 少 な く(た っ た 3 個 の 動 画 の み が 値 4 以 上 に 該 当 し た), 実 験 時 の 誤 差 が 出 た も の で あ る と 思 わ れ る . 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 真陽率 偽陽率

再生数

(A) 受け狙い (B) 笑えた (C) もう一度見 たい 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 真陽率 偽陽率

W値

(A) 受け狙い (B) 笑えた (C) もう一度見 たい

(7)

図10 W 値 に よ る 「 受 け 狙 い 」 に 関 す る 分 類 の F 値

5. 実 装

視 聴 者 コ メ ン ト に よ る 重 み 付 け で 動 画 を 返 す SeeMore を 公 開 し て い る [15]. 試 作 シ ス テ ム で も , 先 に 述 べ た「 音 楽 」タ グ が つ い た 動 画 373,265 万 件 を 対 象 と し て い る . 利 用 画 面 を 図11 に 示 す . 図11 試 作 シ ス テ ム の 利 用 画 面

6. 関 連 研 究

ニ コ ニ コ 動 画 は , 常 に 新 し い サ ー ビ ス が 実 験 的 に 生 み 出 さ れ て は 運 用 が 始 ま る 変 化 の 激 し い 場 で あ る た め に , 自 発 的 に 研 究 ・ 解 析 を 行 っ て い た 利 用 者 も 多 い . ニ コ ニ コ 動 画 全 体 の 分 析 は myrmecoleon[16]が 詳 し い . 2009 年 1 月 に は ,自 発 的 な 研 究 を 行 っ て い た 研 究 者 が , ニ コ ニ コ 動 画 デ ー タ 分 析 研 究 発 表 会[17]を 開 催 し た . 末 永 匡 は 榊 剛 史 ら の 論 文[18]に 倣 い ,χ2値 を 用 い た 単 語 間 の 関 連 度 の 指 標 を 使 っ て , ニ コ ニ コ 動 画 の folksonomy な タ グ 同 士 の 関 連 度 を 求 め た [19] . ま た 2011 年 12 月 6 日 に は ニ コ ニ コ 研 究 会 [20]が ,自 主 的 に 研 究 を 行 っ て い た ニ コ ニ コ 動 画 の 研 究 者 30 名 を 集 め , 第 1 回 ニ コ ニ コ 学 会 β シ ン ポ ジ ウ ム [21]を 開 催 し た . 動 画 に 付 随 す る ア ノ テ ー シ ョ ン は , 動 画 の 内 容 検 索 に 重 要 な 意 味 を 持 つ .HaraldSack ら は MPEG-7 の ア ノ テ ー シ ョ ン 構 造 を 用 い た イ ン タ フ ェ ー ス の 例 を 示 し た [22].中 村 ら [23]は ニ コ ニ コ 動 画 に 着 目 し ,一 度 利 用 者 が 視 聴 し た 動 画 に つ い て コ メ ン ト の 集 中 す る 箇 所 を サ ム ネ イ ル 化 し て 保 存 , 再 度 そ の 動 画 を 閲 覧 す る 際 に 素 早 く 動 画 の 見 所 ま で 移 動 す る シ ス テ ム を 提 案 し て い る . 本 稿 で は 動 画 検 索 を 二 段 階 に 分 け て 考 察 し た 上 で , 絞 込 み 後 の 動 画 の 並 び 替 え 操 作 に 着 目 し て い る . 動 画 の 絞 り 込 み に 関 し て は , 投 稿 者 間 の つ な が り を 用 い る 方 法 や , 動 画 タ グ を 用 い る 方 法 が あ る . 濱 崎 ら は ニ コ ニ コ 動 画 に お け る 初 音 ミ ク 動 画 コ ミ ュ ニ テ ィ を 対 象 と し て 動 画 作 者 ネ ッ ト ワ ー ク を 分 析 し た[24]. 近 年 は パ ー ソ ナ ラ イ ズ ド 推 薦 に 関 す る 研 究 も 進 ん で い る .IdoGuy ら [25]や Huizhi Liang[26]ら は 利 用 者 と ア イ テ ム , タ グ の 3 点 間 の つ な が り が 推 薦 に 有 用 で あ る と 主 張 し て い る . 論 文[25]で は 利 用 者 に ア イ テ ム を 推 薦 す る に あ た り , 利 用 者 間 の 距 離 を 用 い た 推 薦 と タ グ 間 の 距 離 を 用 い る 推 薦 , 利 用 者 間 と タ グ 間 の 距 離 を 組 み 合 わ せ た 推 薦 の 3 種 を 比 較 実 験 し た . 論 文 [26]で は , 利 用 者 の 付 与 す る タ グ か ら ノ イ ズ を 取 り 除 く 手 法 を 提 案 し て い る .

7. お わ り に

本 稿 で は ニ コ ニ コ 動 画 を 対 象 に , 視 聴 者 か ら 付 与 さ れ た コ メ ン ト を 用 い た 動 画 の 重 み 付 け 手 法 を 提 案 し , ア ン ケ ー ト に 基 づ く 評 価 を 行 っ た . 今 後 の 課 題 は 3 つ あ る . 1 つ 目 は 今 回 実 装 し た 検 索 エ ン ジ ン の 性 能 向 上 で あ る . 現 在 の と こ ろ , 大 量 に 存 在 す る コ メ ン ト 資 源 の 内 , 文 字 「w」 に つ い て し か 解 析 を 行 な っ て い な い . 他 の 文 字 ・ 単 語 に つ い て , 出 現 頻 度 や 共 起 関 係 を 調 査 す る こ と で , 性 能 の 向 上 が 図 れ る と 思 わ れ る . 2 つ め は タ グ の 利 用 で あ る . 動 画 ご と に ば ら つ き の 見 ら れ る コ メ ン ト も , 笑 い と い う 共 通 の 要 素 を 前 提 し た 場 合 , 文 字 「 w 」 が 現 れ や す い と い う 傾 向 が 見 ら れ た . 同 様 に , 共 通 の タ グ を 持 つ 動 画 群 に お け る コ メ ン ト の 傾 向 を 探 る こ と で , そ の 分 野 に 適 し た 動 画 を 発 見 す る こ と が 可 能 か も し れ な い . 最 後 は 視 聴 者 の 信 頼 度 の 問 題 で あ る . 単 語 の 頻 度 解 析 だ け で は , コ メ ン ト を 投 稿 し た 視 聴 者 の 価 値 を 考 慮 し て い な い . 気 持 ち を う ま く 代 弁 す る 良 質 な 視 聴 者 の コ メ ン ト は , 他 の コ メ ン ト に 比 べ 重 要 視 さ れ る べ き で あ る .

参 考 文 献

[1] YouTube, http://www.youtube.com/ (accessed 2012.1.10). [2] ニ コ ニ コ 動 画 , http://nicovideo.jp/ (accessed 2012.1.10). [3] 村 上 直 至 , 伊 東 栄 典 , “ 視 聴 者 コ メ ン ト に 基 づ く 動 画 検 索 手 法 ”, 電 子 情 報 通 信 学 会 2010 年 総 合 大 会 講 演 論 文 集, D-4-2 (page D-24), 2010. 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0.1 0.3 0.5 0.7 0.9 1.1 1.3 1.5 1.7 1.9 2.1 2.3 2.5 2.7 2.9 3.1 3.3 3.5 3.7 3.9 4.1 適合率 再現率 F値

(8)

[4] 村 上 直 至 , 伊 東 栄 典 , “ 共 感 度 検 索 の た め の 動 画 ア ノ テ ー シ ョ ン 分 析 ”, FIT2010( 第 9 回 情 報 科 学 技 術 フ ォ ー ラ ム ), F-002, 第 2 分 冊 , pp.343-348, 2010. [5] 村 上 直 至 , 伊 東 栄 典 , “ 動 画 投 稿 サ イ ト で 付 与 さ れ た 動 画 タ グ の 階 層 化”, 情 処 研 報

Vol.2010-MPS-81 No.17 (Vol.2010-BIO-23 No.17), 2010.

[6] N. Murakami, E. Ito, “ Emotional video ranking based on user comments” , Proc. of iiWAS2011, pp.499-502, ACM, 2011.

[7] ニ コ ニ コ 動 画 :From Wikipedia, the free

encyclopedia., http://ja.wikipedia.org/wiki/ニ コ ニ コ 動 画, (accessed 2012.1.10).

[8] Myspace, http://www.myspace.com, (accessed 2012.1.10).

[9] deviantART, http://www.deviantart.com, (accessed 2012.1.10). [10] getthumbinfo, http://ext.nicovideo.jp/api/getthumbinfo/, (accessed 2012.1.10). [11] ニ コ ニ コ 大 百 科 , http://dic.nicovideo.jp/, (accessed 2012.1.10) [12] VOCALOID の プ ロ デ ュ ー サ ー の 一 覧 , http://dic.nicovideo.jp/a/vocaloid の プ ロ デ ュ ー サ ー の 一 覧, (accessed 2012.1.10)

[13] ス ピ ア マ ン の 順 位 相 関 係 数 :From Wikipedia, the free encyclopedia., http://ja.wikipedia.org/wiki/ス ピ ア マ ン の 順 位 相 関 係 数, (accessed 2012.1.10). [14] 受 信 者 操 作 特 性 : From Wikipedia, the free

encyclopedia., http://ja.wikipedia.org/wiki/受 信 者 操 作 特 性, (accessed 2012.1.10).

[15] SeeMore, http://joe.cc.kyushu-u.ac.jp/seemore/ . [16] myrmecoleon, Myrmecoleon in Paradoxical Library.

は て な 新 館, http://d.hatena.ne.jp/myrmecoleon/, (accessed 2012.1.10). [17] CodeZine, 「 膨 大 な デ ー タ を 分 析 し て 見 え て く る こ と 」 ニ コ ニ コ 動 画 デ ー タ 分 析 研 究 発 表 会, http://codezine.jp/article/detail/3516, (accessed 2012.1.10) . [18] 榊 剛 史 , 松 尾 豊 , 石 塚 満 , “ Web 上 の 情 報 を 用 い た 関 連 語 の シ ソ ー ラ ス 構 築 に つ い て ”, 自 然 言 語 処 理, Vol.14, No.2, pp.3-31, 2007. [19] 末 永 匡 , “ χ 2 乗 値 を 関 連 度 と し た ニ コ ニ コ 動 画 関 連 タ グ ネ ッ ト ワ ー ク の 解 析 ”, http://d.hatena.ne.jp/tasukuchan/20090126/nicovideo _tag_kai2_analysis, (accessed 2012.1.10). [20] ニ コ ニ コ 研 究 会 , http://niconicogakkai.jp/, (accessed 2012.1.10). [21] 第 1 回 ニ コ ニ コ 学 会 β シ ン ポ ジ ウ ム , http://niconicogakkai.jp/, (accessed 2012.1.10). [22] Harald Sack, Jorg Waitelonis, “ Integrating Social

Tagging and Document Annotation for

Content-Based in Multimedia Data” , SAAW2006 - 1st Semantic Authoring and Annotation

WorkshopAthens, GA, USA, 2006.

[23] 中 村 貴 洋 , 青 木 秀 憲 , 宮 下 芳 明 , “ マ ン ガ 的 手 法 を 用 い た ニ コ ニ コ 動 画 ナ ビ ゲ ー シ ョ ン ”, ヒ ュ ー マ ン イ ン タ ー フ ェ ー ス 学 会 研 究 報 告 集 Vol.10 No.4 pp103-110, 2008. [24] 濱 崎 雅 弘 , 武 田 英 明 , 西 村 拓 一 , “ 動 画 共 有 サ イ ト に お け る 大 規 模 な 協 調 的 創 造 活 動 の 創 発 の ネ ッ ト ワ ー ク 分 析 -ニ コ ニ コ 動 画 に お け る 初 音 ミ ク 動 画 コ ミ ュ ニ テ ィ を 対 象 と し て -” , 人 工 知 能 学 会 論 文 誌, Vol. 25, No. 1, pp.157-167, 2010.

[25] I. Guy, N. Zwerdling, I. Ronen, D. Carmel, E. Uziel, “Social media recommendation based on people and tags” , ACM SIGIR2010, pp.194-201, 2010.

[26] H. Loang, Yue Xu, Yuefeng Li, Richi Nayak, Xiaohui Tao, “ Connecting Users and Items with Weighted Tags for Personalized ItemRecommendations”, Proc. of HT '10, ACM, 2010.

図 10 W 値 に よ る 「 受 け 狙 い 」 に 関 す る 分 類 の F 値   5.  実 装   視 聴 者 コ メ ン ト に よ る 重 み 付 け で 動 画 を 返 す SeeMore を 公 開 し て い る [15]. 試 作 シ ス テ ム で も , 先 に 述 べ た「 音 楽 」タ グ が つ い た 動 画 373,265 万 件 を 対 象 と し て い る . 利 用 画 面 を 図 11 に 示 す .   図 11  試 作 シ ス テ ム の 利 用 画

参照

関連したドキュメント

全国の 研究者情報 各大学の.

金沢大学学際科学実験センター アイソトープ総合研究施設 千葉大学大学院医学研究院

東京大学 大学院情報理工学系研究科 数理情報学専攻. hirai@mist.i.u-tokyo.ac.jp

情報理工学研究科 情報・通信工学専攻. 2012/7/12

鈴木 則宏 慶應義塾大学医学部内科(神経) 教授 祖父江 元 名古屋大学大学院神経内科学 教授 高橋 良輔 京都大学大学院臨床神経学 教授 辻 省次 東京大学大学院神経内科学

東北大学大学院医学系研究科の運動学分野門間陽樹講師、早稲田大学の川上

関谷 直也 東京大学大学院情報学環総合防災情報研究センター准教授 小宮山 庄一 危機管理室⻑. 岩田 直子

話題提供者: 河﨑佳子 神戸大学大学院 人間発達環境学研究科 話題提供者: 酒井邦嘉# 東京大学大学院 総合文化研究科 話題提供者: 武居渡 金沢大学