DEIM Forum 2016 H3-2
行動タイプを利用した複数旅行ブログエントリ自動要約
飯沼
俊平 難波 英嗣 竹澤 寿幸
広島市立大学大学院 情報科学研究科 〒731-3194 広島県広島市安佐南区大塚東 3-4-1
E-mail: {iinuma,nanba,takezawa}@ls.info.hiroshima-cu.ac.jp
あらまし ブログなどのソーシャルメディアでは実際に観光地を訪れた旅行者の経験に関する情報を得ることが でき,それらは訪問場所や宿泊施設を選択する際に大いに役立つ情報である.本研究では,画像を含む複数旅行ブ ログエントリの要約を自動生成する手法を提案する.提案手法では,グラフベースの文の重要度計算手法である LexRank を拡張し,ブログエントリのタイプを考慮しながら文と同様の仕組みで画像の重要度を算出することで, 代表画像付きの要約を出力する.提案手法の有効性を検証するために評価実験を行った結果,ベースラインよりも 高い性能で要約を作成できることが確認できた.また,旅行ブログエントリ閲覧システムを構築し,ユーザが指定 した地理的範囲およびユーザの目的に合致するエントリの要約を動的に生成・提示する機能を実装した. キーワード 旅行ブログ,マルチメディア要約,観光情報処理1. は じ め に
旅 行 者 が 旅 先 の 観 光 情 報 を 収 集 す る た め に 利 用 す る 情 報 源 の 一 つ と し て , 旅 行 ガ イ ド ブ ッ ク が 挙 げ ら れ る .一 般 的 な 旅 行 ガ イ ド ブ ッ ク に は ,有 名 な 観 光 名 所 , 土 産 物 , 宿 泊 施 設 , 飲 食 店 な ど , 観 光 に 関 連 す る 基 本 的 な 情 報 が 掲 載 さ れ て い る . 一 方 , ブ ロ グ な ど の ソ ー シ ャ ル メ デ ィ ア で は , 実 際 に 観 光 地 を 訪 れ た 旅 行 者 の 経 験 に 関 す る 情 報 を 得 る こ と が で き , そ れ ら は 訪 問 場 所 や 宿 泊 施 設 を 選 択 す る 際 に , 大 い に 役 立 つ 情 報 で あ る . こ れ ま で に ,旅 行 者 が 旅 行 中 で の 経 験 を 記 し た“旅 行 ブ ロ グ エ ン ト リ”を 情 報 源 と し て 活 用 す る た め の 研 究 が 行 わ れ て き て い る . 石 野 ら は , 機 械 学 習 を 用 い て ブ ロ グ エ ン ト リ 集 合 か ら 旅 行 ブ ロ グ エ ン ト リ を 自 動 検 出 す る 手 法 を 提 案 し て い る[1].ま た ,旅 行 者 の 目 的 に 合 致 す る 情 報 へ の ア ク セ ス を 支 援 す る た め に , エ ン ト リ を 旅 行 者 の 行 動 タ イ プ ( 買 う , 食 べ る , 体 験 す る , 泊 ま る ,見 る )に 自 動 分 類 す る 手 法 が 提 案 さ れ て い る[2]. 上 述 の 旅 行 ブ ロ グ エ ン ト リ の 検 出 ・ 分 類 技 術 を 利 用 し て 収 集 さ れ た ブ ロ グ エ ン ト リ は , 実 際 に 広 島 P2 ウ ォ ー カ ー で 公 開 さ れ て い る “ ぶ ら り 広 島 電 停 散 歩 MAP” 1で 使 用 さ れ て い る .こ の シ ス テ ム は 地 図 上 に 旅 行 ブ ロ グ エ ン ト リ を マ ッ ピ ン グ す る こ と で , 目 的 の 場 所 に 関 す る 情 報 を 地 図 上 で 検 索 で き る よ う に し た シ ス テ ム で あ る ( 図 1). 本 研 究 で は , 上 述 の 既 存 シ ス テ ム の 利 便 性 を 向 上 さ せ る た め , ユ ー ザ が 指 定 し た 地 理 的 範 囲 お よ び 行 動 タ イ プ の 旅 行 ブ ロ グ エ ン ト リ を 要 約 し て 提 示 す る 機 能 を 実 装 す る . そ の た め に , テ キ ス ト だ け で な く 画 像 も 対 象 と し た 要 約 手 法 を 提 案 す る . 画 像 付 き の 要 約 を 提 示 す る こ と で , 旅 行 者 は 目 的 地 の 特 徴 を 容 易 に 把 握 す る 1 http://p2walker.jp/peace/ja/blog/ こ と が で き る . ま た , 行 動 タ イ プ を 利 用 す る こ と で 旅 行 者 の 目 的 に 合 っ た 情 報 を 提 示 す る こ と が で き る . 本 論 文 の 構 成 は 以 下 の 通 り で あ る .2 節 で は 実 装 し た シ ス テ ム の 概 要 お よ び 動 作 例 ,3 節 で は 関 連 研 究 ,4 節 で は 旅 行 ブ ロ グ エ ン ト リ の 自 動 要 約 手 法 ,5 節 で は 評 価 実 験 に つ い て 述 べ ,6 節 で 実 験 結 果 に つ い て 議 論 し ,7 節 で 本 稿 を ま と め る . 図 1 ぶ ら り 広 島 電 停 散 歩 MAP 表 1 旅 行 ブ ロ グ エ ン ト リ の タ イ プ [2] 観 光 タ イ プ 判 定 基 準 見 る 観 光 名 所 な ど の 見 て 楽 し め る 物 や イ ベ ン ト に つ い て の 情 報 が 記 載 さ れ て い る 食 べ る 飲 食 に 関 す る 情 報 が 記 載 さ れ て い る 買 う お 土 産 に 関 す る 情 報 が 記 載 さ れ て い る 体 験 す る ○ ○ 体 験 や ス キ ュ ー バ ダ イ ビ ン グ な ど ,自 分 の 体 を 使 っ て 楽 し め る 物 に つ い て の 情 報 が 記 載 さ れ て い る 泊 ま る 宿 泊 に 関 す る 情 報 が 記 載 さ れ て い る2. 旅 行 ブ ロ グ エ ン ト リ 閲 覧 シ ス テ ム
本 節 で は , 実 装 し た シ ス テ ム の 概 要 お よ び 動 作 例 に つ い て 説 明 す る . な お , シ ス テ ム で 用 い て い る 旅 行 ブ ロ グ エ ン ト リ は , 前 節 で 言 及 し た 藤 井 ら の 手 法 で 自 動 分 類 さ れ た も の で あ る . 図 2 に 本 研 究 で 開 発 し た 旅 行 ブ ロ グ エ ン ト リ 閲 覧 シ ス テ ム2を 示 す .地 図 上 に エ ン ト リ 集 合 を 表 示 し て お り , 画 面 下 の ボ タ ン で ,“ 見 る ”, “ 体 験 す る ”,“ 買 う ”,“ 食 べ る ”,“ 泊 ま る ” な ど の , 旅 行 者 の 目 的 に 沿 っ た エ ン ト リ タ イ プ ( 表 1) を 選 択 す る こ と が で き る . ま た , マ ー カ ー を ク リ ッ ク す る と ポ ッ プ ア ッ プ で エ ン ト リ へ の リ ン ク 付 き の タ イ ト ル を 表 示 す る . こ こ ま で の 機 能 は , 既 存 シ ス テ ム ( ぶ ら り 広 島 電 停 MAP) と ほ ぼ 同 等 で あ る . 次 に , 本 研 究 で 構 築 し た 自 動 要 約 シ ス テ ム を 中 心 に , 既 存 シ ス テ ム か ら の 拡 張 点 に つ い て 説 明 す る . 拡 張 点 は 以 下 の 通 り で あ る . • リ ス ト ビ ュ ー : 表 示 範 囲 の エ ン ト リ 一 覧 • サ マ リ ー ビ ュ ー:表 示 範 囲 の 指 定 し た タ イ プ の エ ン ト リ 集 合 の 要 約 2 http://www.ls.info.hiroshima-cu.ac.jp/blogMap/ 画 面 左 下 の 緑 の ボ タ ン を ク リ ッ ク す る と リ ス ト ビ ュ ー お よ び サ マ リ ー ビ ュ ー が 表 示 さ れ , 上 部 の タ ブ で ビ ュ ー を 切 り 替 え る こ と が で き る . リ ス ト ビ ュ ー に は 単 純 に 表 示 範 囲 の エ ン ト リ 一 覧 を 表 示 す る . 既 存 シ ス テ ム で は 地 図 上 の マ ー カ ー を ク リ ッ ク す る こ と で エ ン ト リ の タ イ ト ル を 表 示 す る こ と が で き た が , 上 述 の リ ス ト ビ ュ ー の よ う に , あ る 地 点 に 関 し て 書 か れ た エ ン ト リ の 一 覧 を 表 示 す る ビ ュ ー は 実 装 さ れ て い な か っ た . 図 2 旅 行 ブ ロ グ エ ン ト リ 閲 覧 シ ス テ ム 図4 広 島 県 宮 島 付 近 , タ イ プ “食 べ る ”の 要 約 例 図5 東 京 都 浅 草 周 辺 , タ イ プ “見 る ”の 要 約 例 (a) (b) 図 3 広 島 県 宮 島 付 近 , タ イ プ “見 る ”の 要 約 例サ マ リ ー ビ ュ ー で は , ユ ー ザ が 指 定 し た 地 理 範 囲 , タ イ プ の エ ン ト リ 集 合 を ト ピ ッ ク ご と に 自 動 要 約 し た 結 果 と , 関 連 す る エ ン ト リ へ の リ ン ク を 表 示 す る . 図 3, 4 は 広 島 県 の 宮 島 付 近 で タ イ プ “ 見 る ”,“ 食 べ る ” に 該 当 す る エ ン ト リ 集 合 を そ れ ぞ れ 自 動 要 約 し た 例 で あ る .同 じ 地 点 で も ,“ 見 る ”を 選 択 し た と き は「 厳 島 神 社 」や「 水 中 花 火 大 会 」,“ 食 べ る”を 選 択 し た と き は 「 牡 蠣 祭 り 」 の よ う に , 選 択 し た タ イ プ に 沿 っ た 要 約 を 自 動 生 成 す る こ と が で き る . 同 様 に ,図 5 は 東 京 の 浅 草 付 近 で タ イ プ“見 る ”を 選 択 し て 要 約 し た 結 果 で あ る . こ の よ う に , 任 意 の 場 所 に 関 し て も 要 約 を 自 動 生 成 す る こ と が で き る . 既 存 シ ス テ ム で は , 目 的 の 地 域 の 情 報 を 閲 覧 す る た め に ,1. 地 図 上 の マ ー カ ー を ク リ ッ ク , 2. ブ ロ グ リ ン ク を ク リ ッ ク , と い う 操 作 を 興 味 あ る エ ン ト リ の 数 だ け 行 う 必 要 が あ っ た . サ マ リ ー ビ ュ ー を 導 入 す る こ と で , ユ ー ザ は 画 面 遷 移 す る こ と な く エ ン ト リ 集 合 の 要 約 を 閲 覧 で き る の で , 指 定 し た 地 域 の 見 所 が 発 見 し や す く な り , さ ら に , 個 々 の エ ン ト リ へ の リ ン ク を 示 す こ と で ,よ り 詳 細 な 情 報 へ の ア ク セ ス が 容 易 に な る . ま た , エ ン ト リ の タ イ プ を 利 用 す る こ と で , よ り 旅 行 者 の 目 的 に 合 っ た 要 約 を 自 動 生 成 ・ 提 示 す る こ と が で き る .
3. 関 連 研 究
3.1. 旅 行 地 の推 薦 および観 光 情 報 の提 示 旅 行 地 の 推 薦 は , テ キ ス ト 情 報 に 加 え て 動 画 像 な ど も 扱 う マ ル チ メ デ ィ ア 分 野 で 盛 ん に 研 究 が 行 わ れ て い る .特 定 の 場 所 を 推 薦 す る 際 に ,「 目 的 の 場 所 を ど う 表 現 す る か 」( タ グ ,代 表 画 像 ,ス ニ ペ ッ ト な ど )は ,最 終 的 に 旅 行 者 が 旅 行 先 を 決 定 す る 際 に 重 要 な 手 が か り と な る . Wu ら は , 観 光 情 報 を 要 約 す る シ ス テ ム を 提 案 し て お り , ク エ リ の カ テ ゴ リ ご と に , テ キ ス ト や 画 像 , 動 画 な ど の 異 な る メ デ ィ ア を 情 報 源 と し て 選 択 す る 手 法 を 提 案 し て い る[3].Hao ら は ,旅 先 の 特 徴 を 表 す タ グ や ス ニ ペ ッ ト を 要 約 と し て 出 力 す る モ ジ ュ ー ル な ど , 地 域 特 有 の 情 報 を ブ ロ グ か ら 発 見 す る 手 法 を 提 案 し て い る[4].ま た ,ブ ロ グ を 情 報 源 に 用 い る 研 究 と し て 安 田 ら の 研 究 が あ げ ら れ る .安 田 ら は ,“ 歴 史 ”や“ 食 べ 物 ” と い っ た ト ピ ッ ク と 地 理 的 範 囲 を 入 力 と し て 受 け 取 り , 対 象 範 囲 の 情 報 を 簡 潔 に ま と め た 文 書 を 生 成 す る 要 約 手 法 を 提 案 し て お り , ブ ロ グ を 要 約 対 象 と し て 実 験 を 行 っ て い る[5].本 研 究 で は ,旅 行 地 の 情 報 源 と し て 旅 行 ブ ロ グ エ ン ト リ を 対 象 と し て い る が , そ れ ら に は , テ キ ス ト 情 報 だ け で な く 旅 行 者 が 撮 影 し た 写 真 が 数 多 く 含 ま れ て い る . 画 像 は ユ ー ザ に 視 覚 的 理 解 を 促 す 有 用 な 情 報 源 で あ る た め , 本 研 究 で は 代 表 画 像 付 き の 要 約 生 成 を 目 標 と す る . 3.2. テキスト要 約 テ キ ス ト 要 約 は テ キ ス ト 情 報 か ら 重 要 な 情 報 の み を 選 択 し , 要 点 の 迅 速 な 把 握 を 支 援 す る 技 術 で あ る . Web 上 に 膨 大 な テ キ ス ト 情 報 が 蓄 積 さ れ る よ う に な り , ユ ー ザ が 必 要 な 情 報 に 効 率 的 に ア ク セ ス す る の を 支 援 す る 技 術 が 求 め ら れ て い る 状 況 で 活 発 に 研 究 が な さ れ て き た . 現 在 で も 多 く の 研 究 で 用 い ら れ て い る 重 要 文 抽 出 手 法 は ,テ キ ス ト 中 か ら 重 要 な セ グ メ ン ト( 文 や 段 落 ) を 抜 き 出 し , 抜 き 出 し た セ グ メ ン ト を 適 切 に 並 べ て 出 力 す る こ と で 要 約 と す る 手 法 で あ る . 文 の 重 要 度 計 算 に は , 文 が 持 つ 特 徴 か ら 回 帰 モ デ ル で 重 要 度 を 計 算 す る 手 法 や グ ラ フ ベ ー ス の 手 法 な ど が 用 い ら れ て き た . こ こ で , グ ラ フ ベ ー ス の 重 要 度 計 算 手 法 で あ り , 本 研 究 で 提 案 す る 手 法 の ベ ー ス と な るLexRank を 以 下 に 紹 介 す る .LexRank は , テ キ ス ト 要 約 に 関 す る 評 価 ワ ー ク シ ョ ッ プ TAC3を は じ め と す る 多 く の テ キ ス ト 要 約 研 究 に お い て , そ の 有 効 性 が 確 認 さ れ て い る 代 表 的 な テ キ ス ト 要 約 手 法 の ひ と つ で あ る[6]. LexRank は 文 の グ ラ フ 表 現 に お け る 固 有 ベ ク ト ル 中 心 性 の 概 念 に 基 づ い て 文 の 重 要 度 を 計 算 す る . LexRank で は , ま ず 対 象 テ キ ス ト に 含 ま れ る 文 間 の 類 似 度 を 計 算 し ,類 似 度 グ ラ フ を 作 成 す る( 図 6).次 に , 類 似 度 が 閾 値 以 上 で あ れ ば 1, そ れ 以 外 は 0 を 要 素 と す る 隣 接 行 列 を 用 意 す る . 作 成 し た グ ラ フ か ら , ノ ー ド ( 文 )𝑢の 重 要 度 は 式 1 で 求 め ら れ る . こ れ は , PageRank と 同 様 ,隣 接 行 列 に 対 し て べ き 乗 法 を 用 い て 主 固 有 ベ ク ト ル を 計 算 す る こ と で 得 ら れ る . 3 http://www.nist.gov/tac/ 図 6 類 似 度 グ ラ フ の 例𝑝 𝑢 =1 − 𝑑 𝑁 + 𝑑 𝑝(𝑣) deg (𝑣) 0∈234[6] (1) こ こ で ,𝑁は ノ ー ド の 数 ( 文 の 数 ), 𝑑は ダ ン ピ ン グ フ ァ ク タ[7],adj[u]は ノ ー ド 𝑢に 隣 接 す る ノ ー ド 集 合 , deg(v)は ノ ー ド 𝑣の 次 数 を 表 す . 計 算 さ れ る 重 要 度 は , 他 の 多 く の 文 と 類 似 す る 文 ほ ど 高 く , さ ら に , 重 要 度 の 高 い 文 と 類 似 す る 文 の 重 要 度 も 高 く な る . ま た , Erkan ら は 隣 接 行 列 の 各 成 分 を 類 似 す る か 否 か の 離 散 値 で は な く , ノ ー ド 間 の 重 み ( 類 似 度 ) に 設 定 し た Continuous LexRank を 提 案 し て い る . (式 2) 𝑝 𝑢 =1 − 𝑑 𝑁 +𝑑 𝑤𝑒𝑖𝑔ℎ𝑡 𝑢, 𝑣 𝑤𝑒𝑖𝑔ℎ𝑡(𝑧, 𝑣) D∋234[0] 𝑝(𝑣) 0∈234[6] (2) テ キ ス ト と 画 像 を リ ン ク さ せ る こ と が で き れ ば , テ キ ス ト と 同 様 の 枠 組 み で 画 像 の 重 要 度 を 計 算 で き る と 考 え , 本 研 究 で は グ ラ フ ベ ー ス の 手 法 を 採 用 し た . 前 田 ら の 研 究[8]で は LexRank を 画 像 の 類 似 性 グ ラ フ に 適 用 し て い た が , 本 研 究 で は 画 像 と 文 を 一 つ の グ ラ フ で 扱 う 点 が 異 な る .ま た ,我 々 の 手 法 で は LexRank を 拡 張 し た biased LexRank [9]の ア プ ロ ー チ を 用 い る こ と で エ ン ト リ の タ イ プ に 焦 点 を 当 て た 要 約 を 実 現 す る . 近年では, テ キ ス ト 要 約 を 組 み 合 わ せ 最 適 化 問 題 と し て 定 式 化 す る こ と が 多 く な っ て い る[10].例えば, 指定した要約長を超えないように,重要度の和の最大化 して冗長性の最小化するなど,同 時 に 様 々 な 制 約 を 設 定 で き る と い う 特 徴 が あ る . 本 研 究 で は 画 像 も 要 約 の 対 象 と し て い る が , 画 像 か ら 得 ら れ る 特 徴 量 は テ キ ス ト か ら 得 ら れ る 特 徴 量 と 性 質 が 異 な る た め , こ れ ら の 手 法 を 画 像 に 適 用 す る こ と は 困 難 で あ る . こ の よ う な 理 由 か ら , 我 々 は グ ラ フ ベ ー ス の 手 法 を 採 用 し た .
4. 旅 行 ブ ロ グ エ ン ト リ の 自 動 要 約
本 研 究 で 扱 う 旅 行 ブ ロ グ エ ン ト リ は , 藤 井 ら の 手 法 に よ り 5 種 類 の タ イ プ に 分 類 さ れ て い る と 仮 定 す る . シ ス テ ム は , エ ン ト リ タ イ プ と 地 理 的 範 囲 を 入 力 と し て , 該 当 す る エ ン ト リ 集 合 の 要 約 を 出 力 す る . な お , 閲 覧 シ ス テ ム の 表 示 領 域 を 考 慮 し て ,1 ト ピ ッ ク に つ き 画 像 3 枚 , 3 文 か ら 5 文 程 度 の 短 い 要 約 を 目 標 と す る . 要 約 は 大 ま か に 次 の 手 順 で 作 成 す る . 1. エ ン ト リ 集 合 を ク ラ ス タ リ ン グ 2. ク ラ ス タ ご と に 文 と 画 像 の 重 要 度 を 計 算 3. 重 要 度 が 高 い 順 に 文 と 画 像 を 選 択 エ ン ト リ に は す で に “ 見 る ” や “ 食 べ る ” と い っ た タ イ プ が 付 与 さ れ て い る が , ユ ー ザ が 指 定 し た 範 囲 に は , さ ら に 複 数 の ト ピ ッ ク が 混 在 す る 可 能 性 が あ る た め ,こ れ ら を グ ル ー プ 化 す る 必 要 が あ る .本 研 究 で は , 最 遠 隣 法 を 用 い た 階 層 的 ク ラ ス タ リ ン グ を 行 い , ク ラ ス タ 間 の 距 離 が 閾 値 以 下 の 時 に ク ラ ス タ を 統 合 す る 方 法 を と る . な お , エ ン ト リ は tf*idf 値 を 要 素 と す る 文 書 ベ ク ト ル と し て 扱 い , 距 離 関 数 は𝑓 𝑐H, 𝑐4 = 1 − cos (𝑐H, 𝑐4)を 用 い る . こ こ で , cos (𝑐H, 𝑐4)は コ サ イ ン 類 似 度 を 表 す . 4.1. LexRank による文 と画 像 の重 要 度 計 算 3.2 節 で 説 明 し た よ う に LexRank ( Continuous LexRank) は 文 の 類 似 度 グ ラ フ を 用 意 し て , ノ ー ド の PageRank 値 を 計 算 す る こ と で 文 の 重 要 度 を 計 算 し て い る . 同 様 に , エ ン ト リ 集 合 に 含 ま れ る 画 像 間 の 類 似 度 を 計 算 し , 隣 接 行 列 を 用 意 す れ ば , 多 く の エ ン ト リ に 出 現 す る 物 体 が 写 っ た 代 表 画 像 を 得 る こ と が で き る と 考 え ら れ る . 本 研 究 で は , 文 お よ び 画 像 を ノ ー ド と し て グ ラ フ を 作 成 し , 文 と 画 像 の 重 要 度 を 同 時 に 計 算 す る . な お , 画 像 の 前 後 に 出 現 す る 文 は 被 写 体 の 説 明 を し て い る 可 能 性 が 高 い と 仮 定 し , 画 像 と そ の 前 後 に 出 現 し た 文 の 関 係 を 表 す 隣 接 行 列 の 成 分 は 1 に 設 定 す る . こ れ に よ り , 重 要 な 文 に 隣 接 す る 画 像 の 重 要 度 が 高 く な り , 文 , 画 像 と も に 重 要 か つ 関 連 性 の 高 い も の が 選 ば れ や す く な る と 考 え た . ま と め る と , 隣 接 行 列 の 各 成 分 は 次 の よ う に 決 定 す る . 𝑎H,4=sim(𝑠H,𝑠4) (type(𝑠H)= type(𝑠4))
1 (type(𝑠H)≠ type(𝑠4) and |𝑖 − 𝑗| = 1)
0 (otherwise) (3) こ こ で ,𝑠は エ ン ト リ を 構 成 す る 要 素( 文 ま た は 画 像 ) の シ ー ケ ン ス を 表 し ,𝑠Hは そ の𝑖番 目 の 要 素 を 示 す . type(𝑠H)は 要 素𝑠Hの 型( 文 ま た は 画 像 ),simは 類 似 度 関 数 を 表 し て い る . な お , 類 似 度 関 数 は 要 素 の 型 ご と に 用 意 す る . 要 素 間 の 類 似 度 計 算 に 関 し て は 次 節 で 説 明 す る . 図 6 は 実 際 に 存 在 す る エ ン ト リ を も と に 作 成 し た 類 似 度 グ ラ フ で あ る . 白 い ノ ー ド は 文 , 灰 色 の ノ ー ド は 画 像 を 表 し て い る . ま た , ノ ー ド の 大 き さ は 4.3 節 で 説 明 す る 式4 を 用 い て 計 算 し た 重 要 度 を 表 し て い る . 4.2. 文 間 および画 像 間 の類 似 度 文 は tf*idf 値 を 要 素 と す る ベ ク ト ル で 表 し , 類 似 性 尺 度 に は コ サ イ ン 類 似 度 を 用 い る . 画 像 は 2 種 類 の ベ ク ト ル で 表 現 し ,そ れ ぞ れ の コ サ イ ン 類 似 度 を 計 算 し , そ の 平 均 値 を 画 像 間 の 類 似 度 と す る . 利 用 す る ベ ク ト
ル 表 現 は , 色 ヒ ス ト グ ラ ム と Bag of Visual Words ベ ク ト ル で あ る .
色 ヒ ス ト グ ラ ム は ,HSV 色 空 間 を 用 い て H, S, V の 値 域 を そ れ ぞ れ 10,4,4 分 割 す る こ と で 160 色 に 減 色 さ せ ,ヒ ス ト グ ラ ム を 計 算 す る .Bag of Visual Words は 画 像 か ら 得 ら れ る 複 数 の 局 所 特 徴 を ベ ク ト ル 量 子 化 し て ヒ ス ト グ ラ ム を 化 し た も の で あ る[11]. 本 研 究 で は , ま ず , 画 像 集 合 か ら SIFT 特 徴 量 を , ス ケ ー ル を 固 定 し て 格 子 状 に 抽 出 し , 得 ら れ た 特 徴 量 を k-means 法 に よ り ク ラ ス タ リ ン グ す る . 次 に , 個 々 の 画 像 か ら 抽 出 し た SIFT 特 徴 量 を , ク ラ ス タ リ ン グ に よ り 得 た セ ン ト ロ イ ド を 用 い て ベ ク ト ル 量 子 化 ヒ ス ト グ ラ ム を 作 成 す る . 4.3. 行 動 タイプを利 用 した LexRank の拡 張 旅 行 ブ ロ グ エ ン ト リ に は“見 る ”や “食 べ る ”な ど の 旅 行 者 の 行 動 タ イ プ が 付 与 さ れ て い る が , な か に は 複 数 の 事 柄 に 関 し て 書 か れ た エ ン ト リ も 存 在 す る .例 え ば , 食 べ 物 に 関 す る 記 述 と , 桜 な ど の 見 て 楽 し む 物 に 関 す る 記 述 が 混 在 す る エ ン ト リ が 要 約 対 象 で あ る と す る . こ の 時 , ユ ー ザ が タ イ プ“食 べ る ”を 指 定 し た 場 合 は , 食 べ 物 に 関 し て 言 及 し て い る 文 の 重 要 度 を 高 く , タ イ プ “ 見 る ” を 指 定 し た 場 合 は 桜 に 関 す る 文 の 重 要 度 を 高 く 設 定 し た い . こ の よ う に , ユ ー ザ の 指 定 し た タ イ プ と 文 の 内 容 の 関 連 度 を 考 慮 す る た め に ,biased LexRank の ア プ ロ ー チ を 導 入 す る . こ こ で は ま ず , 文 の “ タ イ プ ら し さ”を 算 出 す る . そ し て , PageRank 値 を 計 算 す る 際 , 算 出 し た ス コ ア を 各 ノ ー ド ( 文 ) へ の ラ ン ダ ム ジ ャ ン プ 確 率 に 設 定 す る . す な わ ち , 式(2) を 次 の よ う に 修 正 す る . 𝑝 𝑢 = 1 − 𝑑 𝑡𝑦𝑝𝑒𝑆𝑐𝑜𝑟𝑒(𝑢) 𝑡𝑦𝑝𝑒𝑆𝑐𝑜𝑟𝑒(𝑣) 0 +𝑑 𝑤𝑒𝑖𝑔ℎ𝑡 𝑢, 𝑣 𝑤𝑒𝑖𝑔ℎ𝑡(𝑧, 𝑣) D∋234[0] 𝑝(𝑣) 0∈234[6] (4) 本 研 究 で は , 上 述 の“タ イ プ ら し さ ”(𝑡𝑦𝑝𝑒𝑆𝑐𝑜𝑟𝑒(𝑢)) を タ イ プ に 関 す る 単 語 の 情 報 利 得 と 頻 度 か ら 単 語 レ ベ ル で 算 出 し ,文 に 含 ま れ る 単 語 の“ タ イ プ ら し さ”の 最 大 値 を 文 全 体 の ス コ ア𝑡𝑦𝑝𝑒𝑆𝑐𝑜𝑟𝑒(𝑢)と す る .単 語 の タ イ プ ら し さ は 次 の よ う に 算 出 す る . 𝑡𝑦𝑝𝑒𝑆𝑐𝑜𝑟𝑒 𝑤 = 𝐼𝐺 𝑤, 𝑡 log 1 +𝑐𝑜𝑢𝑛𝑡 𝑤, 𝐷[ 𝑐𝑜𝑢𝑛𝑡 𝑤, 𝐷 (5) こ こ で ,𝐼𝐺 𝑤, 𝑡 は 単 語 𝑤が 含 ま れ て い る か 否 か で , エ ン ト リ を タ イ プ𝑡と そ れ 以 外 の タ イ プ に 分 類 し た 時 の エ ン ト ロ ピ ー の 減 少 量 を 表 し て い る .𝑐𝑜𝑢𝑛𝑡 𝑤, 𝐷 は エ ン ト リ 集 合𝐷( 要 約 対 象 の エ ン ト リ で は な く , コ ー パ ス に 含 ま れ る す べ て の エ ン ト リ 集 合 ) の う ち , 単 語 𝑤を 含 む エ ン ト リ 数 を 表 す . ま た , 𝐷[は タ イ プ𝑡に 該 当 す る エ ン ト リ 集 合 で あ る . 4.4. 冗 長 性 の削 減 LexRank で 計 算 し た ス コ ア の 高 い 順 に 文 を 抽 出 す る と , 冗 長 性 の あ る 要 約 が 作 成 さ れ る 可 能 性 が あ る . Radev ら は , 文 中 の 情 報 の 包 含 関 係 (CSIS) [12]に 基 づ き ,文 を リ ラ ン キ ン グ す る こ と で こ れ を 解 決 し て い る . 本 研 究 で は , 文 を 重 要 度 順 に 選 択 す る 際 , 要 素 間 の 類 似 度 に 閾 値 を 設 定 し て お き , 類 似 度 が 閾 値 以 上 の 要 素 が す で に 選 ば れ て い る と き は 対 象 要 素 を 要 約 に 追 加 し な い と い う 処 理 を 最 後 に 行 う .
5. 評 価 実 験
5.1. 実 験 設 定 石 野 ら の 手 法 で 収 集 し , 藤 井 ら の 分 類 手 法 で タ イ プ を 自 動 付 与 し た 旅 行 ブ ロ グ エ ン ト リ を 用 い る . な お , 旅 行 ブ ロ グ エ ン ト リ と し て 適 切 で あ る こ と , ま た , タ イ プ が 適 切 に 付 与 さ れ て い る こ と を 人 手 で 確 認 済 み の エ ン ト リ を 用 い る .日 本 全 国 20 地 点 に 関 し て 地 点 ご と に 平 均 10 件 の エ ン ト リ を 選 択 し ,タ イ プ ご と に 画 像 3 枚 ,5 文 程 度 の 正 解 要 約 を 合 計 47 件 人 手 で 作 成 し , ROUGE [13]に よ る 評 価 と 被 験 者 2 人 に よ る 主 観 評 価 を 行 い , 提 案 手 法 の 有 効 性 を 検 証 し た . 比 較 手 法 は 以 下 の 通 り で あ る . い ず れ の 手 法 で も , 抽 出 す る 文 字 数 と 画 像 の 数 は 正 解 と 同 じ に な る よ う に 調 整 し た . • Lead 法( baseline):エ ン ト リ の 先 行 か ら 文 と 画 像 を 抜 き 出 す 手 法 . • LR( baseline):文 と 画 像 ,そ れ ぞ れ の 類 似 度 グ ラ フ に 対 し て LexRank を 適 用 す る 手 法 .( 式 2) • LR+IMG: 隣 接 す る 文 と 画 像 を リ ン ク さ せ る こ と で , 文 と 画 像 の 類 似 度 グ ラ フ を 統 合 し た も の に LexRank を 適 用 す る 手 法 .( 式 2, 式 3) • LR+TYPE : タ イ プ 情 報 を 利 用 し た LexRank ( 式4) に よ り , 文 の 重 要 度 を 計 算 す る 手 法 .• LR+IMG+TYPE:上 述 の LR+IMG と LR+TYPE を 組 み 合 わ せ た 手 法 .
な お , 各 種 パ ラ メ ー タ は 次 の よ う に 設 定 し た . エ ン ト リ を 階 層 的 ク ラ ス タ リ ン グ す る 際 の ク ラ ス タ の 距 離 の 閾 値 を 0.9( 4 節 ),Bag of Visual Words ベ ク ト ル を 計 算 す る 際 は SIFT 特 徴 量 の ス ケ ー ル を 16 ピ ク セ ル に 固 定 し て 8 ピ ク セ ル ご と に サ ン プ リ ン グ 行 い , k-means 法 は ク ラ ス タ 数 を 1,000 に 設 定 し た( 4.2 節 ).LexRank
を 計 算 す る 際 の ダ ン ピ ン グ フ ァ ク タ は 0.85 に 設 定 し ( 式 2),冗 長 性 を 削 減 す る た め の コ サ イ ン 類 似 度 の 閾 値 は 文 の 場 合0.9,画 像 の 場 合 0.5 と 設 定 し た( 4.4 節 ). 4.3 節 で 説 明 し た 単 語 の タ イ プ ら し さ は , 日 本 全 国 の 要 約 対 象 外 の エ ン ト リ も 含 め た 1,836 件 の 旅 行 ブ ロ グ エ ン ト リ ( 買 う :147 件 ,見 る : 1,145 件 ,体 験 す る : 119 件 , 泊 ま る : 38 件 , 食 べ る : 693 件 ) を 用 い て 算 出 し た も の を 用 い た . 5.2. 評 価 指 標 シ ス テ ム の 出 力 し た 要 約 は , テ キ ス ト 部 分 は ROUGE に よ る 自 動 評 価 , 画 像 に 関 し て は 精 度 ・ 再 現 率 を 用 い て 評 価 す る .ROUGE-N は 正 解 要 約 と シ ス テ ム の 出 力 の 両 方 に 共 通 し て 含 ま れ る N-gram の 数 を , 正 解 要 約 中 の N-gram の 数 で 割 っ た 数 値 ( 再 現 率 ) で あ る . す な わ ち , 正 解 に 含 ま れ る 情 報 を ど れ だ け 網 羅 で き て い る か を 自 動 評 価 す る た め の 指 標 で あ る . ROUGE は , テ キ ス ト 要 約 に 関 す る 評 価 ワ ー ク シ ョ ッ プ TAC で も 採 用 さ れ て い る テ キ ス ト 要 約 分 野 の 代 表 的 な 自 動 評 価 指 標 の ひ と つ で あ る . ROUGE に 加 え て , 以 下 の 観 点 か ら 人 手 に よ る 主 観 評 価 も 行 っ た . 1. 要 約 元 の ブ ロ グ エ ン ト リ の 内 容 が 適 切 に ま と め ら れ て い る か ? 2. 要 約 に 含 ま れ て い る 画 像 と テ キ ス ト の 内 容 は 違 っ て い な い か ? 人 手 に よ る 評 価 で は , 原 文 を 読 ん だ 上 で 要 約 を 読 み , 評 価 す る よ う に 被 験 者 に 指 示 し た . 観 点 1 は , 人 手 に よ る 正 解 要 約 を 比 較 手 法 に 加 え た 6 種 類 の 要 約 を 読 み 比 べ ,順 位 を 付 け た .こ の 評 価 方 法 は NTCIR-3 の テ キ ス ト 要 約 タ ク ス で も 用 い ら れ て い る[14]. な お , 要 約 が ほ ぼ 同 じ 場 合 は 同 一 順 位 に す る こ と も 許 可 し て い る . 観 点2 に 関 し て は , 要 約 結 果 を 5 点 満 点 で 評 価 し た . 5.3. 実 験 結 果 表 2 に ROUGE に よ る 評 価 結 果 を 示 す .有 意 水 準 5% で t 検 定 を 行 っ た と こ ろ ,LR+TYPE と LR+IMG+TYPE は 2 つ の ベ ー ス ラ イ ン 手 法 の ど ち ら と も 有 意 に 差 が あ る こ と が 確 認 で き た . ま た , 表 3 に 画 像 の 選 択 精 度 ・ 再 現 率 ( 全 タ イ プ の 平 均 ) を 示 す . 顕 著 な 改 善 は み ら れ な い が ,LR+IMG+TYPE が 最 も 有 効 で あ る こ と が 確 認 で き た . 表 4, 5 に 人 手 に よ る 主 観 評 価 の 結 果 を 示 す . 表 4 は 複 数 の 手 法 で 生 成 し た 要 約 を 被 験 者 2 人 に 良 い 順 に 並 べ て も ら っ た 時 の 平 均 順 位 を 表 し て い る . 表 5 は テ キ ス ト と 画 像 の 内 容 が 合 っ て い る か を 5 点 満 点 で 評 価 し た 結 果 で あ る . ど ち ら の 観 点 で も , 文 と 画 像 を 一 つ の グ ラ フ で 扱 っ たLR+IMG が 最 も 良 い 評 価 値 を 得 て い る こ と が 分 か る .ま た ,有 意 水 準 5%で t 検 定 を 行 っ た と こ ろ ,Lead 法 と 提 案 手 法 ( LR+IMG , LR+TYPE , LR+IMG+TYPE) の 評 価 値 に 有 意 差 を 確 認 す る こ と が で き た . 次 に ,要 約 の タ イ プ 別 に LexRank( LR)と 提 案 手 法 を 比 較 す る . 表 6 は 人 手 に よ る 内 容 評 価 ( 順 位 付 け ) 結 果 を も と に ,LR と 提 案 手 法 の 優 劣 関 係 を タ イ プ 別 に カ ウ ン ト し た 結 果 で あ る . 同 様 に , 人 手 に よ る テ キ ス ト と 画 像 の 内 容 一 致 に 関 す る 評 価 結 果 を も と に , 手 法 の 優 劣 関 係 を 表 7 に ま と め た . な お , 表 の 中 で 背 景 が 灰 色 の 部 分 は 提 案 手 法 が 優 勢 の 箇 所 で あ る .表 6 か ら , 画 像 と 文 の 類 似 度 グ ラ フ を 結 合 し た 手 法 (LR+IMG) が ど の タ イ プ で もLR よ り も 優 勢 で あ る こ と が 分 か る . し か し ,LR+TYPE は ど の タ イ プ に 関 し て も LR と 比 べ 表2 ROUGE に よ る 評 価 結 果 ROUGE-1 ROUGE-2 L e a d 法 ( baseline) 0 . 3 1 8 0 . 2 2 2 L R (baseline) 0 . 3 1 6 0 . 2 0 7 L R + I M G 0 . 3 3 1 0 . 2 2 7 L R + T Y P E 0 . 3 4 5 0 . 2 4 0 L R + I M G + T Y P E 0 . 3 4 0 0 . 2 3 7 表 3 代 表 画 像 の 選 択 精 度 お よ び 再 現 率 精 度 再 現 率 L e a d 法 ( baseline) 0 . 3 5 1 0 . 3 5 9 L R (baseline) 0 . 3 4 1 0 . 3 4 1 L R + I M G 0 . 3 3 8 0 . 3 4 2 L R + T Y P E 0 . 3 5 1 0 . 3 5 9 L R + I M G + T Y P E 0 . 3 7 2 0 . 3 6 7 表 4 要 約 の 内 容 に 関 す る 主 観 評 価 順 位 の 平 均 値 正 解 要 約 1 . 2 8 L e a d 法 ( baseline) 4 . 0 1 L R (baseline) 3 . 0 9 L R + I M G 2 . 8 5 L R + T Y P E 3 . 2 2 L R + I M G + T Y P E 2 . 9 9 表 5 テ キ ス ト と 画 像 の 内 容 の 一 致 度 に 関 す る 主 観 評 価 評 価 値 の 平 均 値 正 解 要 約 4 . 3 3 L e a d 法 ( baseline) 2 . 8 0 L R (baseline) 3 . 0 9 L R + I M G 3 . 1 2 L R + T Y P E 2 . 9 6 L R + I M G + T Y P E 3 . 0 5
て 劣 勢 で あ る . テ キ ス ト と 画 像 の 内 容 一 致 に 関 す る 評 価( 表 7)で は ,タ イ プ“ 見 る ”に 関 し て は LR+TYPE を 含 め た す べ て の 提 案 手 法 が 優 勢 で あ る が ,“ 食 べ る ” に 関 し て は ど の 手 法 も LR と 同 等 ま た は 劣 っ て い る こ と が 分 か る . 同 様 に , 要 約 対 象 エ ン ト リ に 含 ま れ る テ キ ス ト の 量 と 画 像 の 量 の バ ラ ン ス と , 要 約 性 能 の 関 係 を 調 査 し た . 表 8 は , エ ン ト リ に 含 ま れ る “ 画 像 あ た り の 文 字 数 ” 別 に LR と 提 案 手 法 の 優 劣 関 係 を カ ウ ン ト し た も の で あ る . 表 8 よ り , 100 文 字 未 満 の 場 合 は LR+IMG の み が 優 勢 で あ る が , 文 字 数 が 100 文 字 以 上 の 場 合 で あ れ ばLR+IMG と LR+IMG+TYPE が 優 勢 で あ る こ と が 分 か る .
6. 考 察
実 験 の 結 果 ,対 象 と す る 要 約 タ イ プ や エ ン ト リ に 含 ま れ る 画 像 あ た り の 文 字 数 に よ っ て 最 適 な 手 法 が 異 な る こ と が 分 か っ た . 例 え ば , 文 と 画 像 の 類 似 度 グ ラ フ を 結 合 す る 手 法(LR+IMG)は ど の タ イ プ で も LR よ り 性 能 が 良 い た め , 最 適 な 手 法 で あ る と 言 え る . 文 字 数 別 に 比 較 す る と , 画 像 あ た り の 文 字 数 が 100 文 字 以 上 で あ れ ば ,LR+IMG よ り も LR+IMG+TYPE の 方 が 優 れ て い る 事 例 が 多 い た め , タ イ プ 情 報 を 用 い た 後 者 の 方 が 適 し て い る と 言 え る . 画 像 あ た り の テ キ ス ト 量 が 多 い 時 に LR+IMG+TYPE の 性 能 が 良 い の は ,提 案 手 法 で は テ キ ス ト の タ イ プ 情 報 を 利 用 し て い る た め で あ る と 考 え ら れ る . 次 に , 実 際 に 閲 覧 シ ス テ ム ( 図 2-5) を 使 用 し て 明 ら か に な っ た 提 案 手 法 の 問 題 点 に つ い て 述 べ る .ま ず , 本 研 究 で 用 い て い る 旅 行 ブ ロ グ エ ン ト リ に は 複 数 の タ イ プ が 付 与 さ れ た エ ン ト リ も 多 く 存 在 す る . 特 に , タ イ プ ご と の 情 報 量( 文 ,画 像 の 数 )の 偏 り が 大 き い と , タ イ プ に 沿 っ た 要 約 が う ま く で き な い 傾 向 に あ る . た と え ば , 宮 島 で は 牡 蠣 祭 り ( タ イ プ“食 べ る ”) が 毎 年 行 わ れ て い る が ,参 加 者 の 中 に は ,同 時 に 厳 島 神 社( タ イ プ“見 る ”) や , 宮 島 に 到 着 す る ま で に フ ェ リ ー に 乗 っ た こ と な ど も 記 述 す る 人 が 多 い . 本 研 究 で は , こ の 問 題 を 解 決 す る た め に LR+TYPE お よ び LR+IMG+TYPE 手 法 を 提 案 し た が ,LexRank の 特 性 上 , 多 く の エ ン ト リ で 言 及 さ れ る 事 柄 の 重 要 度 が 高 く な り や す い た め ,“食 べ る ”の 要 約 に , 船 や 風 景 画 像 が 混 入 す る こ と が あ る .実 験 で は ,PageRank 値 を 計 算 す る ダ ン ピ ン グ フ ァ ク タ は0.85 に 固 定 し た が ,こ れ を エ ン ト 表 6 LexRank と 提 案 手 法 の タ イ プ 別 の 比 較 ( 人 手 に よ る 内 容 評 価 ) 見 る 食 べ る 買 ,体 験 ,泊 全 タ イ プ L R < L R + I M G 1 2 1 2 4 2 8 L R > L R + I M G 7 6 3 1 6 L R = L R + I M G 2 3 1 2 1 5 5 0 L R < L R + T Y P E 7 9 2 1 8 L R > L R + T Y P E 1 4 9 6 2 9 L R = L R + T Y P R 2 1 1 2 1 4 4 7 L R < L R + I M G + T Y P E 1 3 1 5 7 3 5 L R > L R + I M G + T Y P E 1 3 1 1 6 3 0 L R = L R + I M G + T Y P E 1 6 4 9 2 9 表 7 LexRank と 提 案 手 法 の タ イ プ 別 の 比 較 ( 人 手 に よ る テ キ ス ト と 画 像 の 内 容 一 致 度 評 価 ) 見 る 食 べ る 買 ,体 験 ,泊 全 タ イ プ L R < L R + I M G 8 1 0 4 2 2 L R > L R + I M G 5 1 0 3 1 8 L R = L R + I M G 2 9 1 0 1 5 5 4 L R < L R + T Y P E 6 6 2 1 4 L R > L R + T Y P E 4 1 1 7 2 2 L R = L R + T Y P R 3 2 1 3 1 3 5 8 L R < L R + I M G + T Y P E 1 2 9 6 2 7 L R > L R + I M G + T Y P E 9 1 2 6 2 7 L R = L R + I M G + T Y P E 2 1 9 1 0 4 0 表 8 “画 像 あ た り の 文 字 数 ”別 LexRank と 提 案 手 法 の 比 較 ( 内 容 の 評 価 ) 1 0 0 文 字 未 満 1 0 0 文 字 以 上 L R < L R + I M G 1 8 1 0 L R > L R + I M G 1 0 6 L R = L R + I M G 3 0 2 0 L R < L R + T Y P E 1 1 7 L R > L R + T Y P E 2 0 9 L R = L R + T Y P R 2 7 2 0 L R < L R + I M G + T Y P E 2 1 1 4 L R > L R + I M G + T Y P E 2 2 8 L R = L R + I M G + T Y P E 1 5 1 4リ に 含 ま れ る タ イ プ 情 報 の ば ら つ き な ど に よ っ て 調 整 す る こ と で , こ の 問 題 は 解 決 で き る と 考 え て い る . 旅 行 ブ ロ グ エ ン ト リ に は 観 光 情 報 と し て 有 用 な 情 報 以 外 に も , 個 人 的 な 事 柄 に 関 す る 記 述 も 多 く 含 ま れ る た め , そ れ ら を 要 約 か ら 除 外 す る こ と も 重 要 な 課 題 で あ る . エ ン ト リ 数 が 多 い ク ラ ス タ に 関 し て は , 内 容 の 共 通 部 分 を 重 要 箇 所 と し て 検 出 で き る が , エ ン ト リ が 少 な い ク ラ ス タ に 関 し て は そ の 検 出 が 難 し く な る た め , 観 光 に は 関 係 の な い 情 報 が 要 約 に 含 ま れ る 可 能 性 も 高 く な る .LR+TYPE 手 法 で は ,タ イ プ に 関 す る 単 語 の 情 報 利 得 値 を 用 い て“タ イ プ ら し さ ”を 表 現 し た . 同 様 に , 旅 行 ブ ロ グ エ ン ト リ と 一 般 的 な ブ ロ グ エ ン ト リ か ら ,単 語 や 表 現 の“ 旅 行 ブ ロ グ ら し さ”を 算 出 し ,重 要 度 計 算 の 際 に 利 用 す れ ば , 上 述 の よ う な ノ イ ズ を 軽 減 で き る と 考 え ら れ る .
7. お わ り に
本 研 究 で は , 旅 行 ブ ロ グ エ ン ト リ 閲 覧 シ ス テ ム を 構 築 し , ユ ー ザ が 指 定 し た 地 理 的 範 囲 , タ イ プ の エ ン ト リ を 自 動 要 約 し て 提 示 す る 機 能 を 実 装 し た . グ ラ フ ベ ー ス の 文 の 重 要 度 計 算 手 法 で あ る LexRank を 拡 張 し , 文 と 画 像 に 適 用 す る こ と で 画 像 付 き の 要 約 を 作 成 す る 手 法 を 提 案 し た . ま た ,タ イ プ 情 報 を 利 用 す る こ と で 旅 行 者 の 目 的 に 合 っ た 要 約 手 法 を 提 案 し , そ の 有 効 性 を 実 験 に よ り 示 し た .謝 辞
本 研 究 の 一 部 は 総 務 省 に よ る 戦 略 的 情 報 通 信 研 究 開 発 推 進 制 度 (SCOPE) の 支 援 を 受 け て 行 わ れ た .参 考 文 献
[1] 石 野 亜 耶 , 難 波 英 嗣 , 竹 澤 寿 幸 ,“ 旅 行 ブ ロ グ エ ン ト リ か ら の 観 光 情 報 の 自 動 抽 出 ,”『 知 能 と 情 報 』,Vol.22, No.6, pp. 667-679, 2010. [2] 藤 井 一 輝 , 石 野 亜 耶 , 藤 原 泰 士 , 前 田 剛 , 難 波 英 嗣 , 竹 澤 寿 幸 ,“ 多 言 語 旅 行 ブ ロ グ エ ン ト リ を 用 い た 観 光 情 報 提 示 シ ス テ ム ,” 第 6 回 デ ー タ 工 学 と 情 報 マ ネ ジ メ ン ト に 関 す る フ ォ ー ラ ム ,2014. [3] X. Wu, J. Li, and S.-Y. Neo, “Personalized Multimedia Web Summarizer for Tourist,” Proc. of World Wide Web Conference, 2008.[4] Q. Hao, R. Cai, C. Wang, R. Xiao, J.-M. Yang, Y. Pang, and L. Zhang, "Equip Tourists with Knowledge Mined from Travelogues," Proc. of World Wide Web Conference, 2010.
[5] 安 田 宜 仁 , 西 野 正 彬 , 片 岡 良 治 ,“ 地 理 範 囲 と ト ピ ッ ク に 応 じ た 動 的 要 約 生 成 ,” 第 26 回 人 工 知 能 学 会 全 国 大 会 ,2012.
[6] G. Erkan and D. R. Radev, “LexRank: Graph-based Lexical Centrality as Salience in Text Summarization,” Journal of Artificial Intelligence Research, pp. 457-479, 2004.
[7] S. Brin and L. Page, “The Anatony of a Large-scale Hypertextual Web Search Engine,” Computer
Networks and ISDN Systems, pp. 107-117, 1998. [8] 前 田 剛 , 難 波 英 嗣 , 竹 澤 寿 幸 ,“ 場 所 に 焦 点 を 当
て た 複 数 旅 行 ブ ロ グ の 自 動 要 約 ,” 第 7 回 デ ー タ 工 学 と 情 報 マ ネ ジ メ ン ト に 関 す る フ ォ ー ラ ム , 2015.
[9] J. Otterbacher, G. Erkan, D. R. Radev, “Biased LexRank: Passage Retrieval Using Random Walks with Question-based Priors,” Information Processing & Management, Vol. 45, Issue 1, pp. 42-54, 2009. [10] H. Takamura and M. Okumura, “Text Summarization
Model Based on Maximum Coverage Problem and its Variant,” Proc. of the 12th Conference of the European Chapter of the Association for Computational Linguistics (EACL ‘09), pp. 781-789, 2009.
[11] G. Csurka, C. R. Dance, L. Fan, J. Willamowski, and C. Bray, “Visual Categorization with Bags of Keypoints,” Proc. of ECCV International Workshop on Statistical Learning in Computer Vision, pp. 1-22, 2004.
[12] D. R. Radev, H. Jing, and M. Budzikowska, “Centroid-based Summarization of Multiple Documents: Sentence Extraction, Utility-based Evaluation, and User Studies,” Proc. of the NAACL-ANLP Workshop on Automatic summarization, Vol. 4, pp. 21-30, 2000.
[13] C. Y. Lin, “ROUGE: a Package for Automatic Evaluation of Summaries,” Proc. of Workshop on Text Summarization Branches Out, pp. 74-81, 2004. [14] T. Fukushima, M. Okumura, and H. Nanba, “Text
Summarization Challenge 2 / Text Summarization Evaluation at NTCIR Workshop 3,” in Working Notes of the 3rd NTCIR Workshop Meeting, PART V, pp. 1-7, 2002.