早稲田大学大学院理工学研究科
博 士 論 文 概 要
論 文 題 目
Information Retrieval and Filtering based on User Preferences
ユーザ嗜好に基づく情報検索・フィルタリング技術に 関する研究
申 請 者
帆足 啓一郎
Keiichiro Hoashi 氏 名
専攻・研究指導 (課程内のみ)
2006 年 6 月
こ こ か ら 概 要 ( 3 6 文 字 × 3 7 行 )
イ ン タ ー ネ ッ ト の 急 速 な 拡 大 に よ り , ユ ー ザ が ア ク セ ス で き る 情 報 の 量 が 飛 躍 的 に 増 加 し て い る . あ ら ゆ る 情 報 へ の ア ク セ ス が 可 能 な 現 状 は , ユ ー ザ に と っ て の 利 便 性 は 非 常 に 高 い も の の , そ の 一 方 で ユ ー ザ が 必 要 と し て い る 情 報 を 効 率 的 に 検 索 す る こ と が 難 し く な っ て い る . ま た , こ こ 数 年 の ブ ロ ー ド バ ン ド 環 境 の 普 及 に よ り , 画 像 , 動 画 像 , 音 楽 な ど と い っ た マ ル チ メ デ ィ ア コ ン テ ン ツ も 急 速 に 増 え て い る . こ う し た マ ル チ メ デ ィ ア コ ン テ ン ツ に つ い て も , 従 来 の テ キ ス ト 情 報 同 様 , ユ ー ザ が 必 要 と し て い る 情 報 の 検 索 が 重 要 な 課 題 と な っ て い る .
本 論 文 で は , 上 記 の 問 題 を 鑑 み , ユ ー ザ の 嗜 好 や 要 求 に 適 合 し た 情 報 を , 高 精 度 か つ 効 率 的 に 検 索 す る 情 報 検 索 技 術 に 関 す る さ ま ざ ま な 手 法 を 提 案 し , 評 価 実 験 を 通 じ て そ の 有 効 性 を 確 認 す る . 具 体 的 に は , テ キ ス ト 情 報 な ら び に マ ル チ メ デ ィ ア 情 報 の そ れ ぞ れ に つ い て , ユ ー ザ が 必 要 と す る 情 報 を 効 率 的 に 検 索 ・ 提 示 す る た め の 技 術 の 提 案 と 評 価 を 行 う .
ま ず , テ キ ス ト 情 報 検 索 に つ い て は , 高 精 度 な テ キ ス ト 情 報 検 索 シ ス テ ム の 開 発 の た め に 必 要 不 可 欠 な 「 検 索 式 拡 張 」( q u e r y e x p a n s i o n )技 術 に つ い て , 2 つ の 方 式 を 提 案 し , そ の 有 効 性 を 実 証 す る . ま た , 文 書 の 流 れ の 中 か ら , ユ ー ザ の 要 求 に 適 合 し た 文 書 の み を 抽 出 し , ユ ー ザ に 提 示 す る 「 文 書 フ ィ ル タ リ ン グ 」 技 術 に つ い て , ユ ー ザ に と っ て 不 要 な 文 書 を 大 幅 に 減 少 さ せ る こ と が 可 能 な 方 式 を 提 案 し , そ の 有 効 性 を 実 証 す る .
次 に , 近 年 急 増 し て い る マ ル チ メ デ ィ ア コ ン テ ン ツ , 具 体 的 に は 「 音 楽 」 と 「 動 画 像 」 か ら , ユ ー ザ の 嗜 好 に 適 合 し た デ ー タ を 検 索 す る た め の 技 術 を 提 案 す る . ま ず , 音 楽 情 報 検 索 に つ い て は , ユ ー ザ の 音 楽 嗜 好 に 適 合 す る 楽 曲 を , そ の 音 響 的 特 徴 を 基 に 検 索 す る 技 術 を 提 案 す る . 本 論 文 で の 提 案 手 法 は , 従 来 の 音 楽 情 報 検 索 技 術 と 異 な り , ユ ー ザ に と っ て 未 知 の 楽 曲 の 発 見 を 促 進 す る こ と を 目 的 と し た 技 術 で あ り , 大 量 の 音 楽 デ ー タ の 中 か ら ユ ー ザ が 聴 き た い 楽 曲 の 効 率 的 な 検 索 を 可 能 に す る . さ ら に , 本 論 文 で は , 動 画 像 情 報 検 索 の た め に 必 要 な 要 素 技 術 で あ る 「 動 画 像 話 題 分 割 」 に つ い て , コ ン テ ン ツ の 種 別 ( ニ ュ ー ス , バ ラ エ テ ィ 番 組 な ど ) に 全 く 依 存 し な い , 新 た な 技 術 を 提 案 す る . 同 技 術 に よ り , 大 量 の 動 画 像 ア ー カ イ ブ の 中 か ら , ユ ー ザ が 必 要 と す る 動 画 像 の 効 率 的 な 検 索 や , 動 画 像 自 動 要 約 な ど の 高 度 な 動 画 像 解 析 技 術 の 実 用 化 が 可 能 に な る .
本 論 文 で 提 案 す る 上 記 の 各 技 術 に よ り , 大 量 の テ キ ス ト 情 報 な ら び に マ ル チ メ デ ィ ア 情 報 か ら , ユ ー ザ が 必 要 と す る 情 報 を 効 率 的 か つ 高 精 度 に 検 索 ・ 提 示 す る シ ス テ ム の 開 発 が 可 能 と な り , し い て は , イ ン タ ー ネ ッ ト の 利 便 性 の 大 幅 な 向 上 に
1
貢 献 す る シ ス テ ム の 開 発 に つ な が る と 期 待 さ れ る .
以 下 , 本 論 文 の 構 成 に つ い て 説 明 す る .
ま ず 第 1 章 で は ,「 単 語 寄 与 度 」と い う 概 念 を 利 用 し た 検 索 式 拡 張 手 法 に つ い て 述 べ る . テ キ ス ト 情 報 検 索 シ ス テ ム へ の 入 力 文 か ら 生 成 さ れ る 検 索 式 の 情 報 を 拡 張 す る こ と に よ っ て よ り 高 い 精 度 の 検 索 を 図 る 「 検 索 式 拡 張 」 の 有 効 性 は さ ま ざ ま な 研 究 事 例 に よ っ て 実 証 さ れ て い る が , 検 索 式 拡 張 に 使 用 さ れ る 単 語 の 選 択 時 に
は ,T F * I D F な ど , 適 合 文 書 集 合 に お け る 平 均 的 な 重 要 性 の み が 考 慮 さ れ る 場 合
が 多 く , そ の 単 語 が 入 力 文 と 個 々 の 適 合 文 書 の 間 の 類 似 度 に 与 え る 考 慮 さ れ て い な い . そ の た め , 検 索 式 拡 張 に お い て 有 効 な 単 語 が 選 択 さ れ て い な い 可 能 性 が あ る と 考 え ら れ る .本 研 究 で は 類 似 度 へ の 単 語 の 影 響 力 を 数 値 化 し た「 単 語 寄 与 度 」 と い う 概 念 を 定 義 し , 単 語 寄 与 度 に 基 づ い た 新 た な 検 索 式 拡 張 手 法 を 提 案 す る . ま た , 検 索 式 拡 張 の 代 表 的 な 手 法 で あ る R o c c h i o の ア ル ゴ リ ズ ム に 基 づ く 検 索 式 拡 張 と の 比 較 実 験 を 通 し , 提 案 手 法 の 有 効 性 を 示 す .
第 2 章 で は , 検 索 式 拡 張 で 利 用 さ れ る 適 合 文 書 と , 初 期 検 索 式 と の 類 似 度 を 考 慮 し た 新 た な 検 索 式 拡 張 手 法 を 提 案 す る . 従 来 の 検 索 式 拡 張 手 法 で は , 適 合 文 書 集 合 に 含 ま れ る 文 書 は , 初 期 検 索 式 と の 類 似 度 に 関 わ ら ず , 全 て 同 等 に 扱 わ れ る . こ の た め , 初 期 検 索 式 と の 類 似 度 が 高 い 文 書 か ら 抽 出 さ れ た 単 語 と 類 似 度 が 低 い 文 書 か ら 抽 出 さ れ た 単 語 が 同 等 に 扱 わ れ る こ と に な り , こ れ ら の 単 語 を 利 用 し て 拡 張 さ れ た 検 索 式 に 基 づ く 検 索 の 精 度 の 劣 化 の 原 因 と な っ て い る . 本 研 究 で は , 協 調 フ ィ ル タ リ ン グ で 使 用 さ れ る 評 価 値 予 測 ア ル ゴ リ ズ ム を 応 用 し , 初 期 検 索 式 に 出 現 し な い 単 語 の ス コ ア を 「 予 測 」 す る こ と に よ っ て 検 索 式 拡 張 を 行 う 手 法 を 提 案 す る . 協 調 フ ィ ル タ リ ン グ で は , 評 価 対 象 ユ ー ザ と の 相 関 が 強 い ユ ー ザ の 評 価 デ ー タ を 利 用 し , そ の ユ ー ザ の ア イ テ ム 評 価 値 を 予 測 す る . 本 手 法 を 検 索 式 拡 張 に 応 用 す る こ と に よ り , 拡 張 対 象 単 語 の ス コ ア 算 出 時 に 初 期 検 索 式 と の 類 似 度 が 考 慮 さ れ る た め , 拡 張 さ れ た 検 索 式 を 利 用 し た 検 索 精 度 向 上 が 期 待 さ れ る . こ の 提 案 手 法 の 有 効 性 を 実 証 す る た め ,T R E C デ ー タ を 利 用 し た 評 価 実 験 を 行 う .
第 3 章 で は , テ キ ス ト 文 書 の 流 れ の 中 か ら ユ ー ザ の 要 求 ( プ ロ フ ァ イ ル ) に 適 合 し た 文 書 を 選 択 す る 文 書 フ ィ ル タ リ ン グ 手 法 を 提 案 す る . 文 書 フ ィ ル タ リ ン グ の シ ス テ ム で は , 多 く の 場 合 , プ ロ フ ァ イ ル と 検 索 対 象 文 書 と の 類 似 度 を 計 算 し , そ の 類 似 度 が 閾 値 を 超 え た 文 書 を 選 択 す る 手 法 が と ら れ て い る . し か し , こ の よ う な 類 似 度 に 基 づ い た 手 法 で は , 閾 値 を 高 く 設 定 し た 場 合 多 く の 適 合 文 書 が 見 逃 さ れ て し ま い , ま た , 逆 に 閾 値 を 低 く 設 定 し た 場 合 は 多 く の 非 適 合 文 書 が 誤 っ て 選 択 さ れ て し ま う な ど , 十 分 な フ ィ ル タ リ ン グ 精 度 が 得 ら れ て い な い の が 現 状 で
3
あ る . そ こ で 本 論 文 で は 従 来 の プ ロ フ ァ イ ル に 加 え , 非 適 合 文 書 か ら 抽 出 さ れ た 情 報 に 基 づ い た 非 適 合 プ ロ フ ァ イ ル を 利 用 す る 新 た な フ ィ ル タ リ ン グ 手 法 を 提 案 す る .T R E C デ ー タ に 対 す る 評 価 実 験 を 行 な い , 提 案 手 法 の 適 用 に よ っ て 誤 っ て 文 書 フ ィ ル タ リ ン グ の 精 度 向 上 が 得 ら れ る こ と を 実 証 す る .
第 4 章 で は , ユ ー ザ か ら 提 供 さ れ る 少 量 の 学 習 情 報 に 基 づ き , ユ ー ザ の 音 楽 嗜 好 を 抽 出 し , 大 量 の 音 楽 デ ー タ の 中 か ら ユ ー ザ が 好 む と 推 測 さ れ る 楽 曲 を 検 索 す る 音 楽 情 報 検 索 手 法 を 提 案 す る . 提 案 手 法 は , 楽 曲 の 音 楽 的 特 徴 を 抽 出 す る ツ リ ー ベ ク ト ル 量 子 化 手 法 (Tr e e Q) に よ り 抽 出 さ れ た ユ ー ザ の 音 楽 的 嗜 好 を 表 す ユ ー ザ プ ロ フ ァ イ ル と 検 索 対 象 楽 曲 の ベ ク ト ル 間 の 類 似 度 を 基 に ユ ー ザ が 好 む 楽 曲 を 検 索 す る 音 楽 情 報 検 索 手 法 で あ る . ま た , ユ ー ザ か ら の 適 合 フ ィ ー ド バ ッ ク 情 報 を 利 用 し ,ユ ー ザ プ ロ フ ァ イ ル を 更 新 し ,検 索 精 度 の 向 上 を 図 る 手 法 も 提 案 す る . さ ら に , 提 案 手 法 に お け る 学 習 処 理 の 効 率 化 の た め に , ユ ー ザ の ジ ャ ン ル 嗜 好 を 表 す ジ ャ ン ル プ ロ フ ァ イ ル を 基 に 検 索 を 行 う 手 法 も 提 案 す る . 各 提 案 手 法 の 有 効 性 を 確 認 す る た め , ユ ー ザ の 主 観 評 価 が 付 与 さ れ た 実 験 用 音 楽 デ ー タ を 構 築 し , 同 実 験 デ ー タ に 基 づ く 評 価 実 験 を 行 う . 本 実 験 に お い て , 一 般 的 な 音 楽 特 徴 抽 出 手 法 と の 比 較 の 結 果 , 提 案 手 法 の 有 効 性 を 確 認 す る と と も に , ジ ャ ン ル プ ロ フ ァ イ ル 手 法 に つ い て も , 適 合 フ ィ ー ド バ ッ ク を 適 用 し た 結 果 , ユ ー ザ の 嗜 好 に 適 合 す る 楽 曲 を 高 精 度 で 検 索 す る こ と が で き る こ と を 実 証 す る .
第 5 章 で は , ユ ー ザ 嗜 好 に 適 合 し た 動 画 像 情 報 検 索 シ ス テ ム に 重 要 な 要 素 技 術 で あ る 「 動 画 像 話 題 分 割 」 に お い て , 分 析 対 象 動 画 像 コ ン テ ン ツ 種 別 に 依 存 し な い 汎 用 的 な 手 法 の 提 案 と 評 価 を 行 な う . 従 来 , 主 に ニ ュ ー ス 番 組 に 対 す る 動 画 像 話 題 分 割 手 法 が 提 案 さ れ て き た が , こ れ ら の 既 存 手 法 で は , ニ ュ ー ス に 特 化 し た ア ン カ ー シ ョ ッ ト 検 出 結 果 な ど の 特 徴 量 を 利 用 し て い る た め , ニ ュ ー ス 以 外 の 動 画 像 コ ン テ ン ツ へ の 適 用 は 困 難 で あ る . こ れ に 対 し , 本 研 究 で は , 各 シ ョ ッ ト の 色 配 置 情 報 , 動 き 情 報 , 音 情 報 な ど , コ ン テ ン ツ に 依 存 し な い 特 徴 を 個 々 の シ ョ ッ ト か ら 抽 出 し , 話 題 分 割 点 が 含 ま れ る シ ョ ッ ト を サ ポ ー ト ベ ク タ ー マ シ ン( S V M ) に よ っ て 識 別 す る こ と に よ り , 話 題 分 割 を 行 う 手 法 を 提 案 す る . 提 案 手 法 の 評 価 の た め ,T R E C V I D 2 0 0 4 デ ー タ ( ニ ュ ー ス 番 組 ) と ,N I I - V D B( 情 報 バ ラ エ テ ィ 番 組 ) の そ れ ぞ れ の 実 験 デ ー タ を 利 用 し た 評 価 実 験 を 行 い , い ず れ の 実 験 デ ー タ で も 高 精 度 で の 話 題 分 割 が 可 能 で あ る こ と を 実 証 す る .
最 後 に , 第 6 章 で は , 本 論 文 の 結 論 と し て , 本 研 究 で 提 案 し た 各 手 法 の 評 価 結 果 を 総 括 す る と と も に , テ キ ス ト 情 報 検 索 , な ら び に マ ル チ メ デ ィ ア 情 報 検 索 技 術 の 展 望 を 示 す .
研 究 業 績
種 類 別 題名、 発表・発行掲載誌名、 発表・発行年月、 連名者(申請者含む)
論文
総説
(論文誌)
帆足啓一郎,松本一則,井ノ上直己,橋本和夫:協調フィルタリングにおける評価地予 測アルゴリズムを応用した検索式拡張手法,情報処理学会論文誌,Vol. 43, No. 4, pp.
1100-1111, 2002.
帆足啓一郎,松本一則,井ノ上直己,橋本和夫:非適合プロファイルを利用した文書フ ィルタリング手法,情報処理学会論文誌,Vol.42, No.3, pp. 507-517, 2001.
帆足啓一郎,松本一則,井ノ上直己,橋本和夫:文書間の類似度における単語寄与度を 利用した文書フィルタリング手法,情報処理学会論文誌:データベース,Vol. 40, No. SIG 8 (TOD 4), pp. 63-73, 1999.
Keiichiro Hoashi, Kazunori Matsumoto, Naomi Inoue: “Personalization of user profiles for content-based music retrieval based on user preferences”, Proceedings of ACM Multimedia 2003, pp. 110-119, 2003.
帆足啓一郎,菅野勝,内藤正樹,松本一則,菅谷史昭:汎用的特徴量に基づく動画像話 題分割手法,電子情報通信学会論文誌 D, Vol. J89-D, No. 10, pp. 2305-2314, 2006.
(査読付き国際学会)
Keiichiro Hoashi, Masaru Sugano, Masaki Naito, Kazunori Matsumoto, Fumiaki Sugaya:
“Video story segmentation and its application to personal video recorders”, Proceedings of CIVR 2005, LNCS 3568, pp. 39-48, 2005. (Invited Talk)
Keiichiro Hoashi, Erik Zeitler, Naomi Inoue: “Implementation of relevance feedback for content-based music retrieval based on user preferences”, Proceedings of ACM-SIGIR 2002, pp. 385-386, 2002.
Keiichiro Hoashi, Kazunori Matsumoto, Naomi Inoue, Kazuo Hashimoto: “Query expansion based on predictive algorithms for collaborative filtering”, Proceedings of ACM-SIGIR 2001, pp. 414-415, 2001.
Keiichiro Hoashi, Kazunori Matsumoto, Naomi Inoue, Kazuo Hashimoto: “Document filtering method using non-relevant information profile”, Proceedings of ACM-SIGIR 2000, pp. 176-183, 2000.
Keiichiro Hoashi, Kazunori Matsumoto, Naomi Inoue, Kazuo Hashimoto: “Query expansion method based on word contribution”, Proceedings of ACM-SIGIR 1999, pp.
303-304, 1999.
帆足啓一郎,菅野勝,松本一則:映像情報検索技術とその評価の最前線,情報処理学会 誌,Vol. 46, No. 9, 2005.
帆足啓一郎,上月勝博,菅谷史昭:楽曲配信サービスを支える音楽情報検索技術,電子 情報通信学会誌,Vol. 88, No. 7, pp. 529-534, 2005.
6
研 究 業 績
種 類 別 題名、 発表・発行掲載誌名、 発表・発行年月、 連名者(申請者含む)
講演 (国際学会)
Keiichiro Hoashi, Masaru Sugano, Masaki Naito, Kazunori Matsumoto, Fumiaki Sugaya, Yasuyuki Nakajima: “Shot boundary determination based on MPEG compressed domain and story segmentation experiments for TRECVID 2004”, Proceedings of TRECVID 2004 Workshop, http://www-nlpir.nist.gov/projects/tvpubs/tvpapers04/kddi.pdf, 2004.
Masaru Sugano, Keiichiro Hoashi, Kazunori Matsumoto, Yasuyuki Nakajima: “Shot boundary determination based on MPEG compressed domain and story segmentation experiments for TRECVID 2003”, Proceedings of TRECVID 2003 Workshop, http://www-nlpir.nist.gov/projects/tvpubs/tvpapers03/kddi.final2.paper.pdf, 2003.
Keiichiro Hoashi, Kazunori Matsumoto, Naomi Inoue, Kazuo Hashimoto: “Experiments on the TREC-9 filtering track”, The 9th Text Retrieval Conference, NIST SP 500-249, pp. 295-301, 2001.
Keiichiro Hoashi, Kazunori Matsumoto, Naomi Inoue, Kazuo Hashimoto: “Experiments on the TREC-8 filtering track”, The 8th Text Retrieval Conference, NIST SP 500-246, pp. 457-463, 2001.
Keiichiro Hoashi, Kazunori Matsumoto, Naomi Inoue, Kazuo Hashimoto: “TREC-7 experiments: Query expansion based on word contribution”, The 7th Text Retrieval Conference, NIST SP 500-242, pp. 433-442, 1999.
(研究会・シンポジウム)
帆足啓一郎,菅野勝,内藤正樹,松本一則,菅谷史昭:コンテンツ非依存特徴量に基づ く動画像話題分割手法,電子情報通信学会研究会報告,DE2005-8, pp. 43-48, 2005.
帆足啓一郎,井ノ上直己:ユーザの音楽嗜好に基づく音楽情報検索手法,情報処理学会 研究会報告,2003-MUS-49, pp. 79-84, 2003.
帆足啓一郎,松本一則,井ノ上直己,橋本和夫:文書フィルタリングにおけるプロファ イル更新手法の検討,電子情報通信学会「知識発見のための自然言語処理」シンポジウ ム , http://www.pluto.ai.kyutech.ac.jp/plt/inui-lab/pub/NLP_Sympo99/hoashi/, 1999.
帆足啓一郎,松本一則,井ノ上直己,橋本和夫:文書間の類似度における単語寄与度に 基づく検索式拡張手法,情報処理学会研究会報告,99-DBS-118, pp. 17-24, 1999.
研 究 業 績
種 類 別 題名、 発表・発行掲載誌名、 発表・発行年月、 連名者(申請者含む)
講演
その他
(大会)
帆足啓一郎,菅野勝,内藤正樹,松本一則,菅谷史昭:コーナー別 SVM を利用した動画 像話題分割手法,2005 年電子情報通信学会総合大会講演論文集,D-12-20, p. 170, 2005.
帆足啓一郎,菅野勝,松本一則,菅谷史昭:コンテンツ非依存特徴量に基づく動画話題 分割手法,FIT2005 講演論文集,Vol. 2, pp. 9-10, 2004.
帆足啓一郎,松本一則,井ノ上直己:ジャンルプロファイルによる音楽情報検索手法の 検討,FIT2003 情報技術レターズ LD-001, pp. 66-67, 2003.
帆足啓一郎,井ノ上直己:SVM を利用した音楽情報検索手法の検討,第 65 回情報処理学 会全国大会論文集,Vol. 2, pp. 23-24, 2003.
帆足啓一郎,井ノ上直己:ユーザの嗜好を反映した音楽情報検索手法の検討,第 64 回情 報処理学会全国大会論文集,Vol. 2, pp. 11-12, 2002.
他,6件.
(論文)
井ノ上直己,帆足啓一郎,橋本和夫:文書自動分類手法を用いた有害情報フィルタリン グソフトの開発,電子情報通信学会論文誌 D-II, Vol. J84-D-II, No. 6, pp. 1158-1166, 2001.
(国際学会)
Keiichiro Hoashi, Naomi Inoue, Kazuo Hashimoto, Atsushi Ito, Takeo Tatsumi, Joji Maeno, Noriaki Kusumoto, Yasunari Harada: “Feasibility evaluation of a bibliographical information dissemination system”, Proceedings of ITHET 2002, 2002.
Keiichiro Hoashi, Kazuo Hashimoto, Atsushi Ito, Takeo Tatsumi, Noriaki Kusumoto, Yasunari Harada: “SDI application in educaton and research support: Restrictive information sharing of bibliographical resources”, Proceedings of ITHET 2001, 2001.
Keiichiro Hoashi, Takaya Tanaka, Shigeki Muramatsu, Naomi Inoue, Yayoi Matsuoka, Masanobu Manei: “Application of recommender systems to mobile phone services”, ACM-SIGIR Recommender System Workshop, 2001.
(特許)
特許 3595184「文書検索方法および文書検索装置」
特許 3220104「URL 階層構造を利用した情報自動フィルタリング方法および装置」
他、公開公報 24 件.
以上