• 検索結果がありません。

2. 関連研究本節では, 本研究に関連する研究として, 英語版料理シソーラス, 料理レシピを対象にした言語処理研究, テキストデータベースからの用語の抽出について, それぞれ 2.1 節,2.2 節,2.3 節で述べる 英語版料理シソーラス本研究で構築する料理オントロジーと類似したものと

N/A
N/A
Protected

Academic year: 2021

シェア "2. 関連研究本節では, 本研究に関連する研究として, 英語版料理シソーラス, 料理レシピを対象にした言語処理研究, テキストデータベースからの用語の抽出について, それぞれ 2.1 節,2.2 節,2.3 節で述べる 英語版料理シソーラス本研究で構築する料理オントロジーと類似したものと"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

This article is a technical report without peer review, and its polished and/or extended version may be published elsewhere. Copyright ©2014 by IEICE

料理レシピと特許データベースからの料理オントロジーの構築

土居 洋子

辻田 美穂

難波 英嗣

竹澤 寿幸

角谷 和俊

†広島市立大学情報科学部 〒731-3194 広島市安佐南区大塚東 3-4-1

‡兵庫県立大学環境人間学部 〒670-0092 兵庫県姫路市新在家本町 1-1-12

E-mail: †{doi, tsujita, nanba, takezawa}@ls.info.hiroshima-cu.ac.jp, ‡sumiya@shse.u-hyogo.ac.jp

あらまし 料理オントロジーとは,料理レシピを言語処理するために必要な言語資源である.本研究では,統計 的言語処理技術を用いて,料理レシピと特許データベースから,用語の上位・下位関係,同義語,属性,部分・全 体関係を抽出し,人手で選定することで,料理オントロジーを構築した.

キーワード 料理オントロジー,料理レシピ,上位・下位関係,同義,属性,部分・全体関係

Construction of a Cooking Ontology from Cooking Recipes and Patents

Yoko DOI

Miho TSUJITA

Hidetsugu NANBA

Toshiyuki TAKEZAWA

and Kazutoshi SUMIYA

†Faculty of Information Sciences, Hiroshima City University

3-4-1 Ozukahigashi, Asaminamiku, Hiroshima 731-3194 Japan

‡School of Human Science and Environment, University of Hyogo

1-1-12 Shinzaike–honcho, Himeji, Hyogo 670-0092 Japan

E-mail: †{doi, tsujita, nanba, takezawa}@ls.info.hiroshima-cu.ac.jp, ‡sumiya@shse.u-hyogo.ac.jp

Abstract A cooking ontology is an inevitable language resource for language processing of cooking recipes. We

constructed the cooking ontology using statistical natural language processing techniques for identifying hyponymy, synonymy, attributes, and meronymy.

Keyword Cooking Ontology,Cooking Recipe,Hyponymy,Synonymy,Attribute,Meronymy

1. は じ め に

近 年 , 料 理 レ シ ピ を 対 象 に し た 様 々 な 言 語 処 理 研 究 が 増 加 し て い る . 料 理 レ シ ピ の 要 約 や 料 理 レ シ ピ を 対 象 に し た 情 報 抽 出 な ど が そ の 一 例 で あ る . し か し , 料 理 レ シ ピ で は 固 有 の 言 い 回 し や 表 現 の 省 略 が 多 く 存 在 す る こ と や , ユ ー ザ 投 稿 型 レ シ ピ サ イ ト で は 料 理 レ シ ピ 中 で 用 い る 料 理 用 語 の 表 記 が 投 稿 者 に よ っ て 異 な る こ と な ど が , 料 理 レ シ ピ を 十 分 な 精 度 で 解 析 で き な い 大 き な 要 因 と な っ て い た . そ こ で 本 研 究 で は こ れ ら の 問 題 を 改 善 す る た め に , 言 語 処 理 を 行 う 際 の 知 識 体 系 と し て 利 用 さ れ る 料 理 オ ン ト ロ ジ ー の 構 築 を 試 み る . こ れ ま で に , 自 然 言 語 処 理 分 野 で は , テ キ ス ト デ ー タ ベ ー ス か ら 同 義 語 , 関 連 語 , 用 語 の 上 位 ・ 下 位 関 係 な ど を 抽 出 す る 手 法 が 数 多 く 提 案 さ れ て い る . 本 研 究 で は , テ キ ス ト デ ー タ ベ ー ス に , 料 理 レ シ ピ と 特 許 を 用 い る . 近 年 , ユ ー ザ 投 稿 型 レ シ ピ サ イ ト な ど で 公 開 さ れ て い る 大 量 の 料 理 レ シ ピ デ ー タ の 一 部 は 研 究 目 的 で も 利 用 可 能 に な っ て い る た め , 料 理 オ ン ト ロ ジ ー の た め の 情 報 源 の ひ と つ と し て , 料 理 レ シ ピ デ ー タ を 用 い る . こ こ で , 上 述 の と お り , 料 理 レ シ ピ に は 表 現 の 省 略 が 多 く 存 在 す る た め , 料 理 レ シ ピ デ ー タ の み を 対 象 に オ ン ト ロ ジ ー を 構 築 す る と , オ ン ト ロ ジ ー と し て の 網 羅 性 に 欠 け る 可 能 性 が あ る . こ の 問 題 を 回 避 す る た め ,本 研 究 で は 特 許 に も 着 目 す る .特 許 明 細 書 に は , 権 利 の 範 囲 を よ り 明 確 に す る こ と で 特 許 権 侵 害 訴 訟 を 回 避 す る た め に , 自 明 な こ と で あ っ て も 明 示 的 に 記 述 す る こ と が 多 い . そ こ で , 特 許 デ ー タ ベ ー ス を , 料 理 オ ン ト ロ ジ ー を 構 築 す る た め の も う ひ と つ の 情 報 源 と し て 利 用 す る こ と で , 人 間 に と っ て は 自 明 な 知 識 も 抽 出 で き る 可 能 性 が あ る . 本 研 究 で は , 料 理 レ シ ピ と 特 許 を 情 報 源 と し , 同 義 語 抽 出 手 法 や 上 位 ・ 下 位 関 係 の 抽 出 手 法 な ど を こ れ ら の テ キ ス ト デ ー タ に 適 用 す る こ と で , 効 率 的 な 料 理 オ ン ト ロ ジ ー の 構 築 を 目 指 す . 本 論 文 の 構 成 は 以 下 の と お り で あ る . 2 節 で は 関 連 研 究 ,3 節 で は 料 理 オ ン ト ロ ジ ー の 構 築 手 法 ,4 節 で は 実 験 に つ い て 述 べ , 5 節 で 本 稿 を ま と め る .

(2)

2. 関 連 研 究

本 節 で は , 本 研 究 に 関 連 す る 研 究 と し て , 英 語 版 料 理 シ ソ ー ラ ス ,料 理 レ シ ピ を 対 象 に し た 言 語 処 理 研 究 , テ キ ス ト デ ー タ ベ ー ス か ら の 用 語 の 抽 出 に つ い て , そ れ ぞ れ 2.1 節 , 2.2 節 , 2.3 節 で 述 べ る .

2.1. 英 語 版 料 理 シ ソ ー ラ ス

本 研 究 で 構 築 す る 料 理 オ ン ト ロ ジ ー と 類 似 し た も の と し て ,英 語 版 料 理 シ ソ ー ラ ス「Cook’s Thesaurus1 が あ る .こ れ は ,17 種 類 の カ テ ゴ リ で 構 成 さ れ て お り , 各 エ ン ト リ に は , 食 材 の 画 像 , 同 義 語 , 発 音 , 説 明 , 代 替 材 料 , 保 存 方 法 な ど が 記 載 さ れ て い る . こ の 英 語 版 料 理 シ ソ ー ラ ス は , 世 界 中 の 食 材 を 網 羅 す る こ と を 目 的 と し て い る が , 本 研 究 で は , 言 語 処 理 精 度 改 善 の た め に , 日 本 語 の 料 理 レ シ ピ に 特 化 し て 料 理 オ ン ト ロ ジ ー を 構 築 す る 目 的 と し て い る 点 で 異 な る .

2.2. 料 理 レ シ ピ を 対 象 に し た 言 語 処 理 研 究

難 波 ら [1]は ,複 数 テ キ ス ト 要 約 の 技 術 を 用 い て ,特 定 の 料 理 に 関 す る 複 数 の 料 理 レ シ ピ か ら , そ の 料 理 で 用 い る 典 型 的 な 材 料 と 調 理 手 順 を 出 力 す る 手 法 を 提 案 し て い る . 難 波 ら は , 複 数 料 理 レ シ ピ 要 約 の 作 成 に お け る 考 慮 す べ き 点 と し て , 表 記 の 揺 れ と 表 現 の 省 略 を 挙 げ て い る . こ れ ら に つ い て , 本 研 究 で 構 築 す る 料 理 オ ン ト ロ ジ ー の 同 義 語 辞 書 , 属 性 辞 書 , 部 分 辞 書 を 用 い る こ と で ,言 語 処 理 精 度 を 改 善 で き る と 考 え ら れ る . 橘 ら [2]は ,レ シ ピ タ イ ト ル の 特 徴 を 表 す「 簡 単 」,「 子 供 が 喜 ぶ 」,「 ヘ ル シ ー 」 と い っ た 修 飾 表 現 に 着 目 し , そ れ ら の 修 飾 表 現 の 根 拠 を ネ ー ミ ン グ コ ン セ プ ト と 定 義 し て ,料 理 レ シ ピ か ら 抽 出 す る 手 法 を 提 案 し て い る . 橘 ら は , ネ ー ミ ン グ コ ン セ プ ト の 抽 出 に お い て 材 料 と 調 理 器 具 の 抽 出 を 行 っ て い る . こ の 抽 出 に お い て , 本 研 究 で 構 築 す る 料 理 オ ン ト ロ ジ ー の 同 義 語 辞 書 を 用 い る こ と で ,言 語 処 理 精 度 の 改 善 が で き る と 考 え ら れ る .

2.3. テ キ ス ト デ ー タ ベ ー ス か ら の 用 語 の 抽 出

テ キ ス ト デ ー タ ベ ー ス か ら , 上 位 ・ 下 位 関 係 を 抽 出 す る 代 表 的 な 手 法 と し て , Hearst[3] の も の が あ る . Hearst は ,「 A や B な ど の (等 の )C」 と い っ た 定 型 表 現 に 着 目 す る こ と で ,「 A と B の 上 位 関 係 は C で あ る 」 と い う 用 語 の 上 位 ・ 下 位 関 係 を 抽 出 す る 手 法 を 提 案 し て い る . 本 研 究 で は , Hearst の 手 法 を 用 い て , エ ン ト リ 辞 書 の 構 築 を 行 う . エ ン ト リ 辞 書 の 構 築 に つ い て は 3.1 節 で 述 べ る . テ キ ス ト デ ー タ ベ ー ス か ら , 関 連 語 を 収 集 す る 代 表 的 な 手 法 と し て , 分 布 類 似 度 [4][5][6]が あ る . 分 布 類 似 度 と は ,「 2 つ の 用 語 A と B が 意 味 的 に 類 似 し て い 1 http://www.foodsubs.com/ れ ば , A と B の 文 脈 に 出 現 す る 語 の 傾 向 が 似 て い る 」 と い う 仮 定 に 基 づ い た 関 連 語 収 集 手 法 で あ る . 文 脈 語 の 選 定 に は , 全 単 語 を 用 い る 手 法 , 内 容 語 の み を 用 い る 手 法 な ど が 考 え ら れ る . 本 研 究 で は , 相 澤 の 手 法 に 従 い , 対 象 と な る 語 と 係 り 受 け 関 係 に あ る 動 詞 を 文 脈 語 と し て 利 用 す る . こ の 手 法 は , あ る 動 詞 に 着 目 し , そ の 動 詞 と 係 り 受 け 関 係 に あ る 名 詞 を 文 脈 語 と 考 え れ ば , 動 詞 の 関 連 語 の 収 集 も 可 能 に な る . 一 方 , 料 理 レ シ ピ か ら 関 連 語 を 収 集 す る 手 法 と し て , Chung[7]の 手 法 が あ る .Chung は ,「 料 理 レ シ ピ で は ,あ る 料 理 で 使 用 す る 材 料 の う ち , 主 要 な も の か ら 順 に 材 料 リ ス ト に 記 載 す る 傾 向 が あ る 」 と い う 特 徴 を 利 用 す る 関 連 語 収 集 手 法 を 提 案 し て い る .例 え ば ,楽 天 レ シ ピ2の よ う に 各 料 理 レ シ ピ が 材 料 ご と に 階 層 的 に 分 類 さ れ て い る 場 合 に は ,「 エ ビ 」カ テ ゴ リ に 分 類 さ れ て い る 料 理 レ シ ピ の 材 料 リ ス ト の 先 頭 に 記 載 さ れ て い る 材 料 を 収 集 す る こ と で ,「 エ ビ 」の 関 連 語 が 効 率 的 に 収 集 で き る .本 研 究 で は ,分 布 類 似 度 と Chung の 手 法 を 用 い て ,同 義 語 辞 書 の 構 築 を 行 う . 同 義 語 辞 書 の 構 築 に つ い て は 3.2 節 で 述 べ る .

3. 料 理 オ ン ト ロ ジ ー の 構 築

本 節 で は , 料 理 オ ン ト ロ ジ ー の 構 築 手 法 に つ い て 述 べ る . 料 理 オ ン ト ロ ジ ー の 構 築 は , 以 下 の 5 つ の Step か ら 構 成 さ れ る .  Step 1 概 念 辞 書 の 構 築  Step 2 カ テ ゴ リ の 設 定  Step 3 エ ン ト リ 辞 書 の 構 築  Step 4 同 義 語 辞 書 の 構 築  Step 5 属 性 辞 書 , 部 分 辞 書 の 構 築 Step 1 と し て , 概 念 辞 書 の 構 築 を 行 う . 概 念 辞 書 と は , 料 理 オ ン ト ロ ジ ー の 概 念 階 層 の こ と を 指 す . 本 研 究 で 構 築 す る 概 念 辞 書 は ,「 カ テ ゴ リ−エ ン ト リ −同 義 語 」 の 3 階 層 と す る . Step 2 と し て ,カ テ ゴ リ の 設 定 を 行 う .カ テ ゴ リ は , 楽 天 レ シ ピ の カ テ ゴ リ を 参 考 に 一 部 拡 張 し て 「 材 料− 魚 介 」,「 材 料−肉 」,「 材 料−野 菜 」,「 材 料−そ の 他 」,「 調 味 料 」,「 調 理 器 具 」,「 動 作 」の 7 種 類 と す る .Step 3, Step 4, Step 5 に つ い て , そ れ ぞ れ 3.1 節 , 3.2 節 , 3.3 節 で 述 べ る . 2 http://recipe.rakuten.co.jp/

(3)

3.1. エ ン ト リ 辞 書 の 構 築

本 節 で は , エ ン ト リ 辞 書 の 構 築 に つ い て 述 べ る . エ ン ト リ 辞 書 の 構 築 は ,次 の 2 つ の Step か ら 構 成 さ れ る .

Step 3-1 上 位 ・ 下 位 関 係 の 抽 出

Step 3-2 エ ン ト リ の 選 定 Step 3-1 で は ,2.3 節 で 述 べ た Hearst の 手 法 を 用 い て , 特 許 か ら 上 位・下 位 関 係 の 抽 出 を 行 う .例 え ば ,「 材 料 −魚 介 」 カ テ ゴ リ の 下 位 関 係 を 抽 出 す る と き ,「 A や B 等 の 魚 類 」や「 C 等 の 魚 介 類 」と い う 表 現 か ら ,A,B, C と い っ た 用 語 を エ ン ト リ の 候 補 と し て 抽 出 す る .「 魚 類 」 や 「 魚 介 類 」 に 相 当 す る 用 語 は , カ テ ゴ リ ご と に 次 の 用 語 を 利 用 す る .  材 料−魚 介 : 魚 類 , 魚 介 類 , 海 産 物 , 水 産 物  材 料−肉 : 肉 類 , 食 肉 , 食 肉 類 , 原 料 肉  材 料−野 菜 : 野 菜 , 果 菜 類 , 野 菜 類 , 果 菜 物 , 農 産 物  調 味 料 : 調 味 料 , 香 辛 料 , 薬 味 , ス パ イ ス 類  調 理 器 具 : 調 理 器 具 , 調 理 容 器 , 調 理 器 , 調 理 具 , 調 理 道 具 Step 3-2 で は ,Step 3-1 で 抽 出 さ れ た 用 語 を 頻 度 順 に 並 べ , 頻 度 の 高 い 用 語 か ら 順 に エ ン ト リ を 選 定 す る . こ の 際 ,「 材 料−そ の 他 」 に つ い て は , Step 3-1 で 挙 げ た 用 語 を 使 っ て 収 集 し た 結 果 , い ず れ に も 当 て は ま ら な か っ た 用 語 を エ ン ト リ の 候 補 と し た .「 動 作 」に つ い て は , 料 理 レ シ ピ に 出 現 す る 動 詞 を 頻 度 順 に 並 べ , 頻 度 の 高 い 動 詞 か ら 順 に エ ン ト リ を 選 定 す る .

3.2. 同 義 語 辞 書 の 構 築

本 節 で は , 同 義 語 辞 書 の 構 築 に つ い て 述 べ る . 同 義 語 辞 書 の 構 築 は , 以 下 の 2 つ の Step か ら 構 成 さ れ る .  Step 4-1 関 連 語 の 収 集

Step 4-2 同 義 語 の 選 定 Step 4-1 で は ,2.3 節 で 述 べ た 分 布 類 似 度 を 用 い て 幅 広 く 関 連 語 を 収 集 す る 手 法 と 2.3 節 で 述 べ た Chung の 料 理 レ シ ピ の 記 載 傾 向 を 用 い て 効 率 的 に 収 集 す る 手 法 を 組 み 合 わ せ て 関 連 語 の 収 集 を 行 う . 分 布 類 似 度 に よ る 関 連 語 の 収 集 に つ い て 述 べ る . 係 り 受 け 解 析 器 CaboCha3を 用 い ,す べ て の 料 理 レ シ ピ を 構 文 解 析 す る . 得 ら れ た 解 析 木 か ら , 係 り 受 け 関 係 に あ る 名 詞 と 動 詞 の 対 を 抽 出 す る . 次 に , 名 詞 ご と に , 係 り 受 け 関 係 に あ る 動 詞 の 頻 度 を 数 え , 共 起 語 ベ ク ト ル を 作 成 す る . 与 え ら れ た 名 詞 に 対 し , 共 起 語 ベ ク ト ル 間 の 類 似 度 を 計 算 す る 尺 度 と し て , コ サ イ ン 距 離 を 利 用 す る . Step 4-2 で は ,Step 4-1 で 収 集 し た 関 連 語 を 人 手 で 選 3 http://code.google.com/p/cabocha/ 定 す る . 人 手 で の 同 義 語 の 選 定 は , 代 替 し た こ と が 料 理 レ シ ピ の 特 徴 と な り う る か を 基 準 と す る . 例 え ば , 「 ピ ー マ ン 」と「 パ プ リ カ 」に つ い て ,「 ピ ー マ ン の 肉 詰 め 」 を 作 る 際 ,「 ピ ー マ ン 」 の 代 わ り に 「 パ プ リ カ 」 を 使 用 し て も , 料 理 レ シ ピ の 特 徴 に な る と は 考 え に く い .よ っ て ,「 ピ ー マ ン 」と「 パ プ リ カ 」は 同 義 語 と す る . 一 方 ,「 豚 肉 」 と 「 鶏 肉 」 に つ い て ,「 酢 豚 」 を 作 る 際 ,「 豚 肉 」 の 代 わ り に 「 鶏 肉 」 を 使 用 す る こ と は , 料 理 レ シ ピ の 特 徴 に な り う る .よ っ て ,「 豚 肉 」と「 鶏 肉 」 は 同 義 語 と し な い . 以 上 の 基 準 に 基 づ い て 同 義 語 の 選 定 を 行 う .

3.3. 属 性 辞 書 , 部 分 辞 書 の 構 築

本 節 で は , 属 性 辞 書 と 部 分 辞 書 の 構 築 手 法 に つ い て 述 べ る .各 辞 書 の 構 築 は ,以 下 の 3 つ の Step か ら 構 成 さ れ る .  Step 5-1 定 型 表 現 「 A の B」 の 収 集  Step 5-2 属 性 , 部 分 に 関 す る 用 語 の 収 集

Step 5-3 属 性 , 部 分 の 選 定 Step 5-1 で は , 料 理 レ シ ピ か ら 定 型 表 現 「 A の B」 の 収 集 を 行 う .本 研 究 で は ,「 A の B」と い う 定 型 表 現 に 着 目 す る . 例 え ば ,「 サ バ の 色 」 と い う 表 現 で 「 色 」 は サ バ の 属 性 ,「 サ バ の 皮 」 は 部 分 ・ 全 体 関 係 で あ る . 本 研 究 で は , 定 型 表 現 「 A の B」 を 収 集 す れ ば , 効 率 的 に 属 性 , 部 分 ・ 全 体 関 係 を 収 集 で き る と 仮 定 し , 料 理 レ シ ピ か ら 定 型 表 現 「 A の B」 を 収 集 す る . Step 5-2 で は ,Step 5-1 で 収 集 し た 定 型 表 現「 A の B」 か ら 属 性 , 部 分 に 関 す る 用 語 の 収 集 を 行 う . 例 え ば , 「 サ バ 」の 属 性 ,部 分 に 関 す る 用 語 を 収 集 す る 際 ,「 サ バ の B」 と い う 表 現 か ら , B の 用 語 を 属 性 , 部 分 の 候 補 と し て 収 集 す る . Step 5-3 で は , Step 5-2 で 収 集 し た B の 用 語 を 人 手 で 選 定 す る . 人 手 で の 属 性 , 部 分 の 選 定 は 以 下 の 定 義 に 基 づ い て 行 う . ま ず , 属 性 の 定 義 に つ い て 述 べ る . 本 研 究 で は ,属 性 を「 色 が 変 わ っ た ら 鍋 か ら 取 り 出 す 」 の よ う に , 変 化 す る こ と で 次 の 手 順 に う つ る 基 準 と な る 用 語 ,も し く は ,「 形 を 崩 さ な い よ う に 煮 る 」の よ う に , 料 理 に お け る コ ツ や ポ イ ン ト を 示 す 用 語 と 定 義 す る . 次 に , 部 分 の 定 義 に つ い て 述 べ る . 本 研 究 で は , 部 分 を , 全 体 を 構 成 す る 要 素 , パ ー ツ と 定 義 す る . 例 え ば ,「 サ バ 」 を 全 体 と し た と き ,「 皮 」,「 骨 」,「 身 」 が 部 分 と な る . 提 案 手 法 属 性 , 部 分 の 選 定 を 効 率 的 に 行 う た め , Step 5-2 で 収 集 し た 用 語 を , テ キ ス ト デ ー タ に 出 現 す る 定 型 表 現 「 A の B」の 頻 度 順 に 並 べ て 選 定 す る 手 法 を 提 案 す る .

(4)

テ キ ス ト デ ー タ は , 特 許 と 料 理 レ シ ピ を 用 い る . 特 許 は 表 現 の 省 略 や 表 記 の 揺 れ が 少 な い こ と か ら , よ り 定 量 的 な 選 定 が 可 能 で あ る と 考 え ら れ る .属 性 選 定 手 法 , 部 分 選 定 手 法 に つ い て , そ れ ぞ れ 次 の 4 つ の 手 法 を 提 案 す る .  特 許 A: 特 許 に 出 現 す る 定 型 表 現 「 A の B」 の A に 該 当 す る 表 現 を 頻 度 順 に 並 べ て 選 定 す る 手 法  特 許 B: 特 許 に 出 現 す る 定 型 表 現 「 A の B」 の B に 該 当 す る 表 現 を 頻 度 順 に 並 べ て 選 定 す る 手 法  料 理 レ シ ピ A:料 理 レ シ ピ に 出 現 す る 定 型 表 現「 A の B」の A に 該 当 す る 表 現 を 頻 度 順 に 並 べ て 選 定 す る 手 法

料 理 レ シ ピ B:料 理 レ シ ピ に 出 現 す る 定 型 表 現「 A の B」の B に 該 当 す る 表 現 を 頻 度 順 に 並 べ て 選 定 す る 手 法

4. 実 験

本 節 で は ,本 研 究 で 行 っ た 実 験 に つ い て 述 べ る .4.1 節 で は , 3.2 節 で 述 べ た 同 義 語 辞 書 の 構 築 と そ の 結 果 に つ い て 述 べ る . 4.2 節 で は , 3.3 節 で 提 案 し た 属 性 , 部 分 の 選 定 手 法 の 有 効 性 を 調 べ る た め に 行 っ た 実 験 に つ い て 述 べ , 実 験 結 果 を 考 察 す る .

4.1. 同 義 語 辞 書

デ ー タ セ ッ ト ま ず , エ ン ト リ 辞 書 の 構 築 を 行 っ た . 3.1 節 で 述 べ た 手 法 を 用 い て , 3 節 で 設 定 し た カ テ ゴ リ 7 種 類 に つ い て , 特 許 公 開 公 報 (1993~ 2011)か ら 上 位 ・ 下 位 関 係 の 抽 出 を 行 っ た . 抽 出 し た 用 語 を 頻 度 順 に 並 べ , 頻 度 の 高 い 用 語 か ら 順 に エ ン ト リ を 選 定 し た . エ ン ト リ 辞 書 の 構 築 結 果 を 表 1 に 示 す . 表 1 エ ン ト リ 辞 書 の 構 築 結 果 カ テ ゴ リ エ ン ト リ 数 (語 ) 材 料−魚 介 61 材 料−肉 6 材 料−野 菜 122 材 料−そ の 他 55 調 味 料 51 調 理 器 具 48 動 作 131 合 計 474 次 に , 選 定 し た エ ン ト リ を ク エ リ と し て , 関 連 語 の 収 集 を 行 っ た .2.3 節 ,3.2 節 で 述 べ た Chung の 手 法 と 分 布 類 似 度 を 用 い て , 楽 天 レ シ ピ に 投 稿 さ れ た 料 理 レ シ ピ 約 44 万 件 か ら 関 連 語 を 収 集 し た .収 集 し た 関 連 語 数 を 表 2 に 示 す . 表 2 Chung の 手 法 と 分 布 類 似 度 で 収 集 し た 関 連 語 数 カ テ ゴ リ Chung の 手 法 (語 ) 分 布 類 似 度 (語 ) 材 料−魚 介 216 1,247,767 材 料−肉 265 208,390 材 料−野 菜 379 3,485,494 材 料−そ の 他 241 1,542,022 調 味 料 24 1,665,538 調 理 器 具 0 431,382 動 作 0 88,822 構 築 結 果 収 集 し た 関 連 語 の う ち ,類 似 度 の 高 い 関 連 語 を ,3.2 節 で 述 べ た 選 定 基 準 に 基 づ き , 人 手 で 選 定 し た . 同 義 語 辞 書 の 構 築 結 果 を 表 3 に 示 す . 表 3 同 義 語 辞 書 の 構 築 結 果 カ テ ゴ リ 同 義 語 数 (語 ) 材 料−魚 介 453 材 料−肉 383 材 料−野 菜 947 材 料−そ の 他 732 調 味 料 909 調 理 器 具 643 動 作 956 合 計 5,023

4.2. 属 性 , 部 分 の 選 定

デ ー タ セ ッ ト ま ず , 楽 天 レ シ ピ に 投 稿 さ れ た 料 理 レ シ ピ 約 44 万 件 か ら , 定 型 表 現 「 A の B」 の 収 集 を 行 っ た . 次 に , 収 集 し た 定 型 表 現 か ら , カ テ ゴ リ 「 材 料−魚 介 」 の 同 義 語 453 語 を ク エ リ と し て , 属 性 , 部 分 に 関 す る 用 語 を 717 語 収 集 し た .さ ら に ,収 集 し た 用 語 717 語 か ら , 料 理 名 を 除 外 し た 453 語 を 人 手 で 選 定 し た . 人 手 で の 選 定 結 果 を 表 4 に 示 す . 表 4 の 選 定 結 果 に 対 し , 属 性 選 定 手 法 ,部 分 選 定 手 法 に つ い て ,そ れ ぞ れ 表 5,表 6 の デ ー タ を 用 い た . 3.3 節 で 述 べ た 特 許 と 料 理 レ シ ピ に つ い て 述 べ る . 特 許 デ ー タ は , 国 際 特 許 分 類 (IPC) の サ ブ ク ラ ス レ ベ ル で A23L(食 品 、 食 料 品 )、 A47J(台 所 用 具 )、 H05B(電 気 加 熱 )が 筆 頭 IPC(ひ と つ の 特 許 明 細 書 に 付 与 さ れ る 複 数 の 分 類 コ ー ド の 中 で 一 番 重 要 な も の )と し て 付 与 さ れ た 料 理 分 野 の 特 許 明 細 書 (1993~ 2012 年 公 開 特 許 公 報 ) 91,736 件を 用 い た .料 理 レ シ ピ デ ー タ は ,楽 天 レ シ ピ に 投 稿 さ れ た 料 理 レ シ ピ 約 44 万 件 を 用 い た .特 許 , 料 理 レ シ ピ , そ れ ぞ れ に 出 現 す る 定 型 表 現 「 A の B」 と そ の 頻 度 を 用 い た .

(5)

評 価 ツ ー ル に は , 評 価 ワ ー ク シ ョ ッ プ TREC(Text REtrieval Conference)で 使 わ れ る trec_eval を 用 い た .こ の ツ ー ル を 用 い , 再 現 率 が 1 に な っ た と き の 精 度 の 値 を 評 価 値 と し て 算 出 し た . こ れ は , 用 語 を 漏 れ な く 収 集 し た と き (再 現 率 が 1)に ,ど の 程 度 収 集 し た 用 語 に 正 し い も の が 含 ま れ て い る の か を 評 価 す る た め で あ る . 表 4 人 手 で 属 性 か 部 分 か 該 当 な し か 選 定 し た 結 果 属 性 (語 ) 部 分 (語 ) 該 当 な し (語 ) 合 計 (語 ) 146 144 163 453 表 5 属 性 選 定 手 法 の 実 験 デ ー タ 正 解 (語 ) 不 正 解 (語 ) 合 計 (語 ) 146 307 453 表 6 部 分 選 定 手 法 の 実 験 デ ー タ 正 解 (語 ) 不 正 解 (語 ) 合 計 (語 ) 144 309 453 実 験 結 果 と 考 察 属 性 選 定 手 法 , 部 分 選 定 手 法 に つ い て , 実 験 結 果 を そ れ ぞ れ 表 7, 表 8 に 示 す . 表 7 の 実 験 結 果 よ り , 属 性 選 定 手 法 に つ い て , 属 性 , 部 分 に 関 す る 用 語 を , 特 許 に 出 現 す る 定 型 表 現 「 A の B」 の B に お け る 頻 度 順 に 並 べ て 選 定 す る 手 法 で 最 も 高 い 精 度 0.493 を 獲 得 し た .よ っ て ,属 性 選 定 手 法 に お い て ,特 許 B 手 法 が 最 も 有 効 で あ る こ と が わ か っ た . 表 8 の 実 験 結 果 よ り , 部 分 選 定 手 法 に つ い て , 属 性 , 部 分 に 関 す る 用 語 を , 料 理 レ シ ピ に 出 現 す る 定 型 表 現 「 A の B」の A に お け る 頻 度 順 に 並 べ て 選 定 す る 手 法 で 高 い 精 度 0.257 を 獲 得 し た . よ っ て , 部 分 選 定 手 法 に お い て , 料 理 レ シ ピ A 手 法 が 有 効 で あ る こ と が わ か っ た . 表 7 属 性 選 定 手 法 の 実 験 結 果 手 法 精 度 特 許 A 0.452 特 許 B 0.493 料 理 レ シ ピ A 0.411 料 理 レ シ ピ B 0.452 表 8 部 分 選 定 手 法 の 実 験 結 果 手 法 精 度 特 許 A 0.222 特 許 B 0.201 料 理 レ シ ピ A 0.257 料 理 レ シ ピ B 0.215 ま ず , 属 性 選 定 手 法 に お い て , 最 も 高 い 精 度 を 獲 得 し た 特 許 B 手 法 に つ い て 考 察 を 行 う .表 9 に 特 許 に 出 現 す る 定 型 表 現 「 A の B」 の B に お け る 頻 度 の 高 い 上 位 10 語 と 人 手 に よ る 属 性 ,部 分 選 定 結 果 を 示 す .表 9 よ り , 頻 度 の 高 い 上 位 10 語 の う ち , 3 語 は 属 性 , 4 語 は 部 分 で あ る こ と が わ か る . こ の こ と か ら , あ ら か じ め 部 分 の 用 語 を 除 外 す る こ と で , よ り 選 定 の 精 度 を 改 善 で き る と 考 え ら れ る . 一 方 , 特 許 に 出 現 す る 定 型 表 現 「 A の B」の A に お け る 頻 度 の 高 い 用 語 を 調 べ た と こ ろ , 6 位 が 「 状 態 」, 8 位 が 「 量 」 で あ る こ と が わ か っ た . こ の よ う に , 定 型 表 現 「 A の B」 の A, B ど ち ら に も 出 現 す る 理 由 と し て ,「 水 の 量 」,「 量 の 比 率 」と い っ た 階 層 的 な 表 現 が 成 り 立 つ た め と 考 え ら れ る . こ の 問 題 に つ い て , Hearst の 上 位 ・ 下 位 関 係 を 抽 出 す る 手 法 を 用 い る こ と で , 階 層 的 な 表 現 を 考 慮 で き る よ う に な る と 考 え ら れ る . 表 9 特 許 の B に お け る 頻 度 の 高 い 上 位 10 語 属 性 , 部 分 に 関 す る 用 語 属 性 選 定 結 果 部 分 選 定 結 果 場 合 不 正 解 不 正 解 表 面 不 正 解 正 解 間 不 正 解 不 正 解 量 正 解 不 正 解 状 態 正 解 不 正 解 水 不 正 解 不 正 解 上 面 不 正 解 正 解 種 類 正 解 不 正 解 部 分 不 正 解 正 解 面 不 正 解 正 解 次 に , 部 分 選 定 手 法 に お い て , 高 い 精 度 を 獲 得 し た 料 理 レ シ ピ A 手 法 に つ い て 考 察 を 行 う .部 分 の 用 語 に つ い て 調 べ た と こ ろ ,「 背 わ た 」,「 背 ワ タ 」,「 背 綿 」と い っ た 表 記 の 揺 れ が 多 い こ と が わ か っ た . こ れ ら の 用 語 の 料 理 レ シ ピ に 出 現 す る 定 型 表 現 「 A の B」の A に お け る 頻 度 は そ れ ぞ れ 1.060e-05, 0, 0 で あ っ た . こ の こ と か ら , あ ら か じ め 分 布 類 似 度 を 用 い て 用 語 の 表 記 の 揺 れ に 対 応 し た 上 で 頻 度 を 求 め る こ と で , よ り 選 定 の 精 度 を 改 善 で き る と 考 え ら れ る .

5. お わ り に

本 研 究 で は , 統 計 的 言 語 処 理 技 術 を 用 い る こ と に よ り ,効 率 的 な 料 理 オ ン ト ロ ジ ー4の 構 築 を 試 み た .分 布 類 似 度 と Chung の 手 法 を 組 み 合 わ せ る こ と に よ り 収 集 し た 関 連 語 を 人 手 で 選 定 す る こ と で , 同 義 語 辞 書 を 構 築 し た .こ の 結 果 ,同 義 語 5,023 語 を 獲 得 し た .属 性 , 部 分 の 選 定 で は , 定 型 表 現 「 A の B」 と そ の 頻 度 に 着 4 http://www.ls.info.hiroshima -cu.ac.jp/cooking/ontology. html

(6)

目 し た . 実 験 の 結 果 , 最 も 高 い 精 度 が 得 ら れ た , 特 許 に 出 現 す る 定 型 表 現 「 A の B」 の B に お け る 頻 度 順 に 属 性 を 選 定 す る 手 法 が 最 も 有 効 で あ る こ と が わ か っ た . 今 後 の 課 題 と し て , ま ず , 辞 書 構 築 に つ い て , 規 模 の 拡 大 が 挙 げ ら れ る . 一 方 , 人 手 で 用 語 を 選 定 す る コ ス ト の 削 減 が 挙 げ ら れ る .森 ら [8]は ,材 料 な ど の 固 有 表 現 認 識 に 機 械 学 習 を 用 い て い る .本 研 究 で も 同 様 に , 機 械 学 習 に よ る 用 語 の 選 定 を 検 討 す る 必 要 が あ る と 考 え ら れ る . 次 に , 属 性 , 部 分 の 選 定 に つ い て , 上 位 ・ 下 位 関 係 を 考 慮 す る 必 要 が あ る と 考 え ら れ る . 一 方 , 表 記 の 揺 れ を 考 慮 し た 上 で 頻 度 を 求 め る こ と で , よ り 選 定 の 精 度 を 改 善 で き る と 考 え ら れ る . さ ら に , 構 築 し た 料 理 オ ン ト ロ ジ ー を 用 い て , 料 理 レ シ ピ の 言 語 処 理 を 行 う こ と で , 精 度 が 改 善 さ れ る か 実 験 し , 本 研 究 で 構 築 し た 料 理 オ ン ト ロ ジ ー の 有 効 性 を 確 認 す る 必 要 が あ る .

謝 辞

本 研 究 を 遂 行 す る に あ た り , 解 析 対 象 と な る レ シ ピ デ ー タ を 楽 天 株 式 会 社 よ り ご 提 供 い た だ い た . こ こ に 記 し て 謹 ん で 感 謝 の 意 を 表 す る .

文 献

[1] 難 波 英 嗣 , 土 居 洋 子 , 辻 田 美 穂 , 竹 澤 寿 幸 , 角 谷 和 俊 ,“ 複 数 料 理 レ シ ピ の 自 動 要 約 ,”電 子 情 報 通 信 学 会 技 術 研 究 報 告 , Vol.113, No.338, NLC2013-41, pp.39-44, 2013. [2] 橘 明 穂 , 若 宮 翔 子 , 難 波 英 嗣 , 角 谷 和 俊 ,“ 料 理 名 の 修 飾 表 現 の 関 係 性 に 基 づ く レ シ ピ の ネ ー ミ ン グ コ ン セ プ ト 抽 出 ,” 電 子 情 報 通 信 学 会 技 術 研 究 報 告 , Vol.113, No.214, DE2013-36, pp.19-24, 2013.

[3] M. A. Hearst, “Automatic Acquisition of Hyponyms from Large Text Corpora,” Proc. 14th International Conference on Computational Linguistics, pp.539-545, 1992.

[4] D. Lin, “Automatic Retrieval and Clustering of Similar Words,” Proc. COLING/ACL1998, pp.768-774, 1998.

[5] L. Lee, “Measures of Distributional Similarity,” Proc. 37th Annual Meeting of the Association for Computational Linguistics on Computational Linguistics, pp.25-32, 1999.

[6] 相 澤 彰 子 ,“ 大 規 模 テ キ ス ト コ ー パ ス を 用 い た 語 の 類 似 度 計 算 に 関 す る 考 察 ,” 情 報 処 理 学 会 論 文 誌 , Vol.49, No.3, pp.1426–1436, 2008.

[7] Y. Chung, “Finding Food Entity Relationships Using User-generated Data in Recipe Service,” Proc . 21st ACM International Conference on Information and Knowledge Management (CIKM2012), pp.2611 -2614, 2012.

[8] 森 信 介 , 山 肩 洋 子 , 笹 田 鉄 郎 , 前 田 浩 邦 ,“ レ シ ピ テ キ ス ト の た め の フ ロ ー グ ラ フ の 定 義 ,” 情 報 処 理 学 会 研 究 報 告 ,Vol.2013-NL-214, No.13, pp.1-7, 2013.

参照

関連したドキュメント

1、研究の目的 本研究の目的は、開発教育の主体形成の理論的構造を明らかにし、今日の日本における

Birdwhistell)は、カメラフィル ムを使用した研究を行い、キネシクス(Kinesics 動作学)と非言語コミュニケーションにつ いて研究を行いました。 1952 年に「Introduction

そのため本研究では,数理的解析手法の一つである サポートベクタマシン 2) (Support Vector

機械物理研究室では,光などの自然現象を 活用した高速・知的情報処理の創成を目指 した研究に取り組んでいます。応用物理学 会の「光

「心理学基礎研究の地域貢献を考える」が開かれた。フォー

本稿では,まず第 2 節で,崔 (2019a) で設けられていた初中級レベルへの 制限を外し,延べ 154 個の述語を対象に「接辞

本節では本研究で実際にスレッドのトレースを行うた めに用いた Linux ftrace 及び ftrace を利用する Android Systrace について説明する.. 2.1

Research Institute for Mathematical Sciences, Kyoto University...