DEIM Forum 2014 F8-2
同一料理に対する多様なレシピ集合からの
効率的な選別を目的とした可視化手法
村瀬 秀† 牛尼 剛聡‡ †九州大学芸術工学部 〒815-8540 福岡市南区塩原 4-9-1 ‡九州大学大学院芸術工学研究院 〒815-8540 福岡市南区塩原 4-9-1E-mail: †[email protected], ‡[email protected]
あらまし 近年,投稿型レシピサイトが一般的に利用されるようになった.投稿型レシピサイトでは,利用 者がレシピを投稿できるため,ひとつの料理に対して多数のレシピが存在する場合が多い.特定の料理を作ろ うとしてレシピサイトでレシピを見ている利用者は,同一の料理に対する様々なレシピから自分が作るレシピ を選別する必要がある.しかし,候補となる全てのレシピを閲覧することは現実的ではない.そこで,他のユ ーザが行った評価を利用してレシピを選別することが多い.しかしユーザの評価に基づいた選別では,新しい レシピは選別の候補にならない可能性が高く,その料理のバリエーション(料理の全体像)を把握して,自分 の嗜好や目的に合致したレシピを選別したいという要求に対応できない.この問題を解決するために,本論文 では,ユーザが指定した料理に対して,多数のレシピが存在する状況で,レシピの選別を支援する可視化手法 を提案する.本研究では,レシピの構成要素を分析することでレシピのバラエティーを発見し,ユーザが料理 の全体像が理解できるような可視化を行う. キ ーワード レシピ選別, 可視化手法, 階層的クラスタリング
1. まえがき
近年, 投 稿型レシピサイト には 大 量のレシピが 投稿さ れ, ユーザは 様々なレシピから自 分の 目 的にあ ったレシ ピを選 択でき るよ うにな った. レシ ピサイト の代 表 的な 利 用方法の 一つは , ユーザが調理したい料理 を指 定して, そのレシピを検索するとい うものである. しかし, 投稿型サ イト には 膨大な数のレシピが登録されているため, 料理を 指定した場 合には , 大量のレシピが検索 結 果として 返さ れることが多 い. 例え ば, 代表的な レシピサイト の一つで ある「 楽天レシピ」 [1 ]では,201 4 年 1 月の段階で「 オムラ イス」 のレシ ピとして 1 ,755 件が登録されており, 今後もさ らに増加していくと予想される. レシ ピサイト の検索 結果として返される大量のレシ ピを, ユーザがすべて 確認することは 現実的でない. そこで, 多 くのレシピサイト では , 人気 順で 検索 結 果 をランキ ングし て ユーザのレシピ選 別を支援している. しかし, ユーザは 必ずしも人気があるレシピを求めていない場合がある. 料 理名 をクエリとして返される結 果のレシピには, 利用する 食材や, 調理 手順に 様々なバ リエーシ ョンがあり, それら の特徴を把握してからレシピを選びたい場合 も多い. 上記の問 題 を解 決するために, 本研究では 検索 結果 として返されるレシピ集合に対して, その全体的な カテ ゴ リ構造 を可 視化する 手法 を提案する. 具 体的には , レシ ピに含まれる材料の出 現頻 度を調べ, 料理をいくつかの 部分 要素( 料 理パーツ) に分割する. 例え ば, オムライス は,「ライス 」,「 オムレツ」, 「ソース」 という料理パ ーツに分 解できる. 次に材料の出 現数から, 料理パ ーツの代表の 材料 を決め, 手順 内で代表の 材料と他の 材料の共 起数 を調べ, 共 起の多 い材 料 をパ ーツに分 類させる. 分類さ れた材料の共 起数から次の 代表とな る材 料を決め, これ を繰 り返す. 最 終的に 共起した 順に材 料 を図 示すること で材料のカテ ゴリ構 造の可視化 を行う.2. 関連研究
石橋 ら[2]は,食 材 の利 用頻 度 と典 型度 か ら,ユ ーザ の嗜 好に 合 った レシ ピ推 薦 を目 的と し ,食 材の 得 点を 以下 の式 か ら求 めて レシ ピ を推 薦す る 手法 を提 案 して いる. 食材 n の 得 点= 食材 n の 利 用 頻 度 × 食材 n の 典 型 度 ここ で, 食 材の 利用 頻度 は ,ユ ーザ の 調理 履歴 か ら食 材の 出現 頻 度を 求め ,調 理 した 日が 近 いほ ど重 み を低 くす るこ と で同 じ食 材ば か りが 出て こ ない 工夫 を して いる.望 月ら[3]は ,レシ ピサ イ トに おけ る ユー ザ個 人 の嗜 好に 合わ せ た偏 りの ない レ シピ 推薦 を 目的 とし , 調理 履歴 から 見 つけ 出し たユ ー ザの 嗜好 食 材を 用い た 推薦 , 冷蔵 庫の 余 剰食 材を 考慮 し た推 薦, 調 理履 歴の レ シピ の調 理法 を 考慮 した 推薦 の 3つ を提 案 して いる . ユー ザの 調理 履 歴か ら嗜 好食 材 を見 つけ 出 す方 法に つ いて は ,食 材 k の 典型 度を𝑝𝑘,利用 頻 度をu𝑘とし ,レ シピ𝑟𝑗𝑘 に含 まれ る 食材 を𝐼𝑗𝑘とする と き,レ シ ピの 得点𝑆 𝐼(𝑟𝑗𝑘)を 以下 の式 か ら求 めて レシ ピ の推 薦に 用 いる 手法 を 提案 している. 𝑆𝐼(𝑟𝑗𝑘) ∑ 𝑢𝑖∙ 𝑃𝑖 𝑖∈𝐼𝑗𝑘 ∑ 𝑃𝑖 𝑖∈𝐼𝑗𝑘 冷蔵 庫の 余 剰食 材を 用い た 推薦 する た めに ,ま ず ,ユ ーザ が冷 蔵 庫の 余っ てい る 食材 をデ ー タベ ース に 登録 する .そ し て登 録さ れて い る食 材を 多 く含 むレ シ ピの 得点 を大 き くす る. また , 余剰 食材 は 古い もの を 優先 的 に 使う こ と が 望 ま しい と し て , 登 録日 を𝑑と し ,登 録日によっ て ,以 下の 式で 食 材に 重み 付 けを 行う . 𝑤(𝑐)=(𝑑 − 1) 𝑑 調理 履歴 か ら求 めた 調理 法 の履 歴に よ る推 薦の た めに は,まず ,レシ ピを「 煮物 」「焼 物 」「 炒物 」「揚 物 」「蒸 物」「 和え 物 」「生 物 」「汁 物 」の 8つ の 調理 法に 分 類し た.そし て ,調 理法𝑐の レシ ピの 得点 を ,全 調理 履 歴中 の𝑐が出現 し た回 数に よっ て 求め てい る .そ して ,3つ の推 薦手 法 の推 薦度 を最 適 化す るこ と で最 終的 な レシ ピの推薦を 行 う. 福 本ら[4]は ,食 材の 重要 度 と食 品群 に 注目 し,レシ ピ間 の類 似 度を 算出 する 手 法を 提案 し た.例 え ば,「オ ムラ イス 」 とい う料 理に お いて 「鶏 肉 」を 材料 に 含む レシ ピと , それ ぞれ 「豚 肉 」と 「椎 茸 」を 含む 別 のレ シピ の類 似 度を 考え る際 ,従来 手法 では ,「豚 肉」と「椎 茸」 は「 鶏 肉」 と独 立し た 別の 食材 で ある ため , 類似 度は 高く な らな い. しか し ,こ の手 法 では 食品 群 を考 慮す るた め ,「 鶏肉 」と「豚 肉」が 同じ「肉 類」に 分類 され ,「椎 茸 」を 含む レ シピ に比 べ て類 似度 が 高く なる . また ,「 大 」「中 」「 小」の3 つ の食 品群 を 作り,食 品に それ ぞれ の 食品 群を 対応 付 け, 食材 の 重要 度は 料 理に おけ る出 現 度だ けで なく , その 食材 が 属し てい る 食品 群に つい て も出 現度 を算 出 し合 算し た .最 終的 な レシ ピ 間 の 類 似 度 は コ サ イ ン 類 似 度 と 食 品 群 の 重 み 付 け 𝑤𝑛を利用して 以 下の 式に よっ て 求め る. レシピ間類似度=𝑤1×食材単体のコサイン類似度 +𝑤2×食品群[小]のコサイン類似度 +𝑤3×食品群[中]のコサイン類似度 +𝑤4×食品群[大]のコサイン類似 度 (𝑤1+𝑤2+ 𝑤3+ 𝑤4= 1 0 ≤ 𝑤1, 𝑤2, 𝑤3, 𝑤4≤ 1) こ れら の 研究 では ,本 研 究で 対象 と する よう な ,同 一料 理の 複 数の レシ ピを 選 別の 支援 す るこ とは 考 慮さ れていない .
3. 提案手法
本章 では , 同一 料理 とし て 登録 され た 様々 なレ シピ のバ リエ ー ショ ンを 提示 す るた めに , レシ ピ集 号 の全 体像 抽出 し ,可 視化 す る手 法を 提 案す る .具 体的 に は, 提案手法は , 以下 のス テッ プ から 構成 さ れる . 1. レシピの代 表 的な 材料 の抽 出 2. 料理の構成 要 素( パー ツ) へ の分 割 3. 可視化図の 作 成 以 下に , それ ぞれ のス テ ップ につ い て詳 細に 説 明し てい く. な お, 対象 とす る 料理 のレ シ ピ集 合は 与 えら れて いる も のと する .レ シ ピは ,材 料 一覧 ,及 び 手順 から構成さ れ るも のと する .3.1 代表的な材料の抽 出
レ シ ピ集 合𝑅に お け る代 表 的 な 材 料を 抽 出 す る .そ の た め に レ シ ピ 集 合𝑅に お け る 材 料 𝑓の 出 現 頻 度 を 𝐹𝑟𝑒𝑞(𝑓, 𝑅)と表 記す る .レ シピ サ イト に含 ま れる 材料 の 集 合を𝐹と す ると き , 𝐹に 含ま れ る 全て の 要 素 𝑓 に対 し て𝐹𝑟𝑒𝑞(𝑓, 𝑅)を求め る .𝐹𝑟𝑒𝑞(𝑓, 𝑅)が大き い 食材 は,レ シ ピ集合𝑅にお け る代 表的 な材 料 であ ると 考 えら れる .3.2 料理の構成要素( パ ーツ )へ の 分割
料理 の全 体 像を ユー ザに 提 示す る際 , その 料理 のレ シピ 集合 に おけ る代 表的 な 材料 を提 示 する だけ で は, その 料理 の 手順 を知 らな い 利用 者に と って は, 全 体像 を構築する こ とが 困難 であ る . 一般 的に , 料理 は要 素か ら 構成 され る .例 えば ,オ ムラ イス に 対し ては ,「オ ム レツ 」,「ラ イス 」,「ソ ー ス」 とい う3 種 類の 要素 に分 割 でき る. こ のと き, 料 理の バリ エー シ ョン は, それ ぞ れの 構成 要 素の バリ エ ーシ ョン の組 み 合わ せで ある と 考え られ る .し たが っ て, レシ ピを 構 成要 素に 分割 し ,そ れぞ れ の構 成要 素 を作 成す る際 に 利用 する 材料 を 提示 する こ とに より , ユー ザは ,レ シ ピ集 合の バリ エ ーシ ョン の 全体 像を 効 率的 に把 握で き ると 考え られ る .オ ムラ イ スに おけ る 材料 の分割イメ ー ジを 図2 に示 す .図2: オムライスの材料 の分 割 次 に ,構 成要 素を 抽 出す る手 法 につ いて 述 べる .我々 は, 構成 要 素は ,代 表的 な 材料 とそ れ に付 随す る 材料 によ って 構 成さ れる と考 え た. レシ ピ は, 複数 の ステ ップ から 構 成さ れる が, 一 つの ステ ッ プに は, 一 つの 構成 要素 に 関す る調 理方 法 が記 述さ れ てい る場 合 が多 い. すな わ ち, 一つ のス テ ップ にお い て, 複数 の 構成 要素 に関 す る調 理を 行う こ とは 稀で あ ると 考え ら れる . 本手 法で は,上記 の考 え に基 づい て ,「 同じ ステ ッ プに 出現 する 材 料は 同じ 構成 要 素の ため に 使用 され る 材料 である可能 性 が高 い」 とい う 仮説 を立 て た. 上 記の 考 えに 基づ いて , 材料 を構 成 要素 に基 づ いて グル ープ 化 する ため に, 代 表的 な材 料 と他 の材 料 との 共起 回数 を 利用 する .材 料 の共 起例 を 図3 に示 す .図 3よ り同 じ 手順 にあ る「 玉 ねぎ 」「ハ ム 」「 コー ン 」は 共起 して い ると 判断 する . また ,ス テ ップ 2に お いて は,「ご 飯」,「塩 」,「 コ ショ ウ」 が 共起 して い る. レ シ ピ 集 合 に 含 ま れ る 全 て の 材 料 の 共 起 を 集 計 し, 最も 多 く共 起し てい る 代表 的な 材 料が 表す 構 成要 素に 対し て ,代 表的 な材 料 以外 の材 料 を分 類す る .例 とし て, オ ムラ イス のレ シ ピ集 合に お ける ,代 表 的な 食材 「ご 飯 」と の共 起回 数 の上 位を 図 4 に 示す . その 結果 ,玉 ね ぎ, ニン ジン , 鳥肉 の共 起 回数 が多 か った ため,こ れら は ,「 ご飯」の 構成 要素 に 所属 する 材 料で あるとする . 共 起 回 数 が 最 も 多 い 代 表 的 な 材 料 の パ ー ツ に す べ ての 材料 を 分割 した 後に , 分割 され た 材料 の中 で 共起 回数 の上 位 3件 を新 しい 代 表的 な食 材 とし て, そ れ以 外の 材料 を 分割 する .こ れ を繰 り返 す こと で関 係 が強 い材 料か ら 順に 木構 造を 作 るこ とが 可 能で ある . 図4 にパーツへ の 分割 工程 の例 を 示す . 図3: 材料の共起 図4: パーツへの分割の 繰り 返し ご飯 パー ツ に分 割さ れた 材 料の 内, 共 起数 の上 位 3件 の「 玉ね ぎ 」「 ニン ジ ン」「 鳥肉 」が そ れぞ れ代 表 の材 料と なり パ ーツ 化さ れる . 次に 玉ね ぎ パー ツに 注 目す ると ,同 様 にし て「 ウイ ン ナー 」「ピ ーマ ン 」「 ハ ム」 がパーツ化 さ れる .
3.3 可視化図の作成手 法
上記 の処 理 によ って 得ら れ た構 造に 基 づい て, 可視 化図 を作 成 する .図 5に 可 視化 図の 描 き方 を示 す .具 体的 には , まず 中央 に料 理 名, 次の 階 層に 代表 と なる 材料 を配 置 する .そ の後 共 起数 に基 づ いて それ ぞ れの 構成 要素 を 生成 され た順 に 配置 する . この 時, 階 層が 一つ 変わ る に従 って 材料 名 の文 字サ イ ズを 小さ く する . こう する こ とで ,そ の料 理 にと って 重 要な 材料 と ,階 層構 造が 認 識し やす くす る .ま た各 材 料は 単純 に 直線 で繋 ぐだ け にし ,無 駄な 情 報を 極力 入 れな い構 造 とす る.図5: 文字のサイズの変 更
4. 実験・評価
提 案 手 法 の 有 効 性 を 評 価 す る た め に 被 験 者 実 験 を 行った.4.1 対象とするデータ
実験 には , 楽天 レシ ピの レ シピ デー タ を用 いた .デ ータ は 2012 年 の 総レ シピ 数 442,504 件 まで のも の につ いて,以下 の 項目 をデ ータ ベ ース に格 納 した . ・レシピの ID ・レシピの 料 理名 ・レシピに 含 まれ る材 料名 ・レシピの 手 順 また ,レ シ ピの 手順 につ い ては 文章 を 形態 素解 析し , 食材 名の み を抽 出し た. な お, 材料 の 表記 揺れ の 問題 を解 決 す るた め ,5,513 件の 辞 書デ ー タ を用 意 し ,デ ータベース に 格納 した .4.2 提案図の作成
楽天 レシ ピ にお いて ,料 理 名に ‘オ ム ライ ス‘ を含 むレ シピ 数 862 件に 基づ い て, 提案 手 法に よっ て 作成 した 可視 化 図を 図6 に示 す .な お, 可 視化 図を 作 成す る際 ,代 表 的な 材料 の抽 出 と構 造の 取 得は プロ ト タイ プシ ステ ム を利 用し て行 い ,得 られ た 構造 から の 可視 化図の作成 は 手動 で行 った . 図6: オムライスの可視 化図4.3 評価実験の内容
可 視 化 図 を 見 る 場 合 と 見 な い 場 合 で レ シ ピ 検 索 に 差が 出る か を被 験者 実験 に より 調査 し た. 被験 者 は, 大学生5人 で ある . 被験 者に は ,制 限時 間 5 分 の間 に楽 天 レシ ピで オム ライ スの レ シピ をな るべ く 多く 見て , 見た 中で 一 番作 りた いと 思 った レシ ピを 一 つ選 択し て もら い, 次 の3 つの設問に 5 段階 評価 で回 答 して もら っ た. ①選んだレ シ ピに 対し ての 確 信度 ②よく使わ れ る材 料, あま り 使わ れな い 材料 の把 握 ③バリエー シ ョン の把 握4.4 実験結果及び考察
被験者の評 価 点を 平均 した 結 果を 図 7 に 示す . 図7: 実験結果 実験 結果 よ り, よく 使わ れ る材 料や あ まり 使わ れな い材 料の 把 握と 料理 のバ リ エー ショ ン を把 握す る こと に関して提 案 図が 特に 有効 で ある こと が 示さ れた . 確信 度に つ いて は, それ ほ ど差 がで な かっ たが ,こ れは ,制 限 時間 に設 定し た 5 分 だと , 人気 順を 閲 覧し ても 確信 を もて るレ シピ を 容易 に見 つ けら れる こ とが 原因 であ る と思 われ る. 材 料の 典型 度 に関 して は 典型 0 1 2 3 4 5 確信度 材料の典型度 バリエーション なにも見ない 提案図を見る度の 高い 食 材は 大部 分提 案 図に 記載 し てい るの で ,あ まり 使わ れ ない 材料 につ い ても 把握 で き, 見な い 場合 に比 べ大 き な差 が出 たと 考 えら れる . バリ エー シ ョン につ いて は 料理 名を 提案 図 に記 載さ れ てい る気 に なる 材料 によ っ て絞 り込 み検 索 を行 うこ と で, 新し い バリ エーション を 発見 でき たと 考 えら れる .