• 検索結果がありません。

レシピテキストの と 15 料理情報の知的処理 料理レシピテキストの処理と活用 Cooking Recipe Text Processing and its Applications 山肩洋子 Yoko Yamakata Graduate School of Informatics, Kyoto U

N/A
N/A
Protected

Academic year: 2021

シェア "レシピテキストの と 15 料理情報の知的処理 料理レシピテキストの処理と活用 Cooking Recipe Text Processing and its Applications 山肩洋子 Yoko Yamakata Graduate School of Informatics, Kyoto U"

Copied!
9
0
0

読み込み中.... (全文を見る)

全文

(1)

1.は

 じ め に

料理レシピは世界中で生成・利用されている人気のコ ンテンツである.Web サイト解析ツール SimilarWeb*1 のカテゴリー「Food and Drink > Cooking and Recipes」 におけるレシピサイトの世界ランキングを見てみよう (表 1).これによると,現在ランキング 1 位に位置する のは日本のクックパッドであり,上位 10 件には日本, アメリカ,ドイツ,中国,イタリア,フランス,ロシア, ブラジルと,実に 8 か国のサイトがランクインしている. それぞれの国が自国の食文化をもち,自国の言語で書か れたレシピを検索し,利用している様子がうかがえる. 現在,Web で検索可能なレシピの大半を占めるの は,一般ユーザが作成・投稿したユーザ投稿型レシピで ある.日本においてはクックパッド*2や楽天レシピ*3 が,米国においては Allrecipes*4や Genious kitchen*5 が該当するが,一方で,NHK「みんなのきょうの料理*6 や FoodNetwork*7,味の素「レシピ大百科*8」,Excite 「E・レシピ*9」のように,料理番組や食品企業を通じて 料理のプロが作成した Web レシピも順調にその数を伸 ばしている.一人称視点映像に似た料理動画を提供する 「クラシル*10」や「delish*11」のように,コンテンツリッ チなマルチメディアレシピも増えており,ユーザの多様 な要求を満たす高品質なレシピが Google などの検索エ ンジンを通じて見つけられるようになってきた.よって, これからユーザ投稿型レシピは,その数の多さと多様性 の高さを生かすべく,より詳細な条件による検索を可能

料理レシピテキストの処理と活用

Cooking Recipe Text Processing and its Applications

山肩 洋子

京都大学大学院情報学研究科

Yoko Yamakata Graduate School of Informatics, Kyoto University.

yamakata@i.kyoto-u.ac.jp, https://www.hal.t.u-tokyo.ac.jp/~yamakata/index_j.html

難波 英嗣

広島市立大学大学院情報科学研究科

Hidetsugu Nanba Graduate School of Information Sciences, Hiroshima City University.

nanba@hiroshima-cu.ac.jp, http://www.ls.info.hiroshima-cu.ac.jp/~nanba/

森  信介

京都大学学術情報メディアセンター

Shinsuke Mori Academic Center for Computing and Media Studies, Kyoto University.

forest@i.kyoto-u.ac.jp, http://www.ar.media.kyoto-u.ac.jp/mori/

Keywords:

cooking recipe, procedural text, natural language processing, text analysis, ontology, flowgraph. 「料理情報の知的処理」 *1 https://www.similarweb.com/ *2 1998 年開設,https://cookpad.com/ *3 2010 年開始,https://recipe.rakuten.co.jp/ *4 https://www.allrecipes.com/ *5 https://www.geniuskitchen.com/ *6 https://www.kyounoryouri.jp/ *7 https://www.foodnetwork.com/ *8 https://park.ajinomoto.co.jp/recipe/

*9 https://erecipe.woman.excite.co.jp/ *10 https://www.kurashiru.com/*11 https://www.delish.com/

表 1 SimilarWeb カテゴリー「Food and Drink > Cooking and Recipes」におけるレシピサイトの世界ランキング 順 位 Webサイトアドレス 時間〔分〕平均滞在 ページ/訪問者 国 1 cookpad.com 3:40 3.98 日 2 allrecipes.com 2:15 2.26 米 3 chefkoch.de 3:22 3.99 独 4 dianping.com 2:37 3.84 中 5 giallozafferano.it 3:34 2.81 伊 6 foodnetwork.com 1:48 2.18 米 7 marmiton.org 2:41 2.43 仏 8 geniuskitchen.com 2:17 2.79 米 9 russianfood.com 3:21 3.01 露 10 tudogostoso.com.br 2:02 2.23 伯 2018年 8 月 29 日現在

(2)

とすることや,レシピ全体としての集合知を取り出す仕 組みを構築することが重要になると考える.本稿では, そのための必須の技術であるレシピテキストの自然言語 処理技術について解説する. 2章では Web レシピをめぐる最近の動向とその活用法 について紹介する.また,Web レシピを活用するために 利用可能なツールとして,3 章では「料理オントロジー」 を,4 章では「レシピのフローグラフ化」をそれぞれ紹 介する.

2.

料理レシピの活用と課題

日本は Web レシピ資源が極めて豊富な国である. 2018年 9 月現在,クックパッドには約 300 万件,楽天 レシピには約 150 万件のレシピが掲載されており,この 2社だけですでに 450 万件に達する.一方で,検索可能 な英文レシピが最も多いといわれるレシピ推薦サービス Yummly*12の Web ページでは,レシピ数は 200 万件強 と記されている.Yummly は自社でレシピを提供するの ではなく,さまざまなサイトからレシピを収集し,それ を自社のフォーマットにそろえて整理したうえで,高度 な検索・推薦サービスを提供するサービスであり,よっ てこの 200 万件という数字は Yummly が収集可能であっ た英文 Web レシピの総数といえるだろう.著者が調べ た限りでは,表 1 にランクインしている米国のレシピサ イトのうち,自社で掲載しているレシピ数が最も多かっ たのは第 8 位の Genious Kitchen*13であり,このサイ トが food.com という名前であった 2017 年 4 月に調査し た際,検索可能なレシピ数は約 52 万件(うち 2 万件は 空白ページ)であった.以上のことから,和文のレシピ は他の言語に比べて極めて多いと推測される. 料理は材料や分量,手順やその記述方法などでいかよ うにも変化する極めて多様なコンテンツであるから,大 量のレシピはその多様性をカバーするために必要である といえる.一方で,ニーズの高いレシピはやはり一部に 限られており,プロが作成したレシピである程度事足り るようになった昨今では,ユーザ投稿型レシピをそのま まレシピとして使う動機は薄まりつつあると感じてい る.クックパッドや楽天レシピ,Geneous Kitchen など が提供するユーザ投稿型レシピは,その掲載にあたって ある程度の編集や著者への加筆・修正依頼などのフェー ズが用意されているものの,レシピを作成するのは多く の場合,家庭の主婦を中心とする一般の人々である.レ シピの提供に対しては無償あるいは少額のポイントによ る報酬が与えられるのみであり,常に料理や編集のプロ が作成したレシピと同等のクオリティを期待することは 難しいだろう.2017 年 4 月には,クックパッドに豚肉 の生食やはちみつ入りの離乳食など,健康被害が生じる 可能性のあるレシピが掲載されているとして大きな批判 を浴びた*14.では,ユーザ投稿型レシピはもう使われな いのかといえば,それはもちろん No である.レシピは 「ものづくり」の手順書であり,人間が素材を飲食可能 な物質へと変化させるための工夫を記した文書であり, 嗜好や健康など,人間のさまざまな生命活動に結び付い ている貴重な情報源である.今後はこの膨大な記録を, 一つ一つのコンテンツとしてだけではなく,総体として 活用することが重要であると考える. ここで著者が注目しているのがレシピ処理系 API で ある.レシピの材料リストを送るとその栄養データを返 したり,料理名を送るとレシピのリストを返すといった サービスを,一般ユーザに無料で提供する一方,より高 機能あるいは特別な追加サービスを有料で提供すること によって収益を上げるビジネスモデルだ.近年,スマー トフォンを使った食事管理アプリが次々とリリースされ ている.米国でも人気の高い MyFitnessPal*15のほか, 最近は AI 技術を導入してより野心的なサービスを提供 するアプリも多く,Noom*16ではダイエットのコーチ ングに AI を利用,あすけん*17や foodLog*18は深層学 習の技術を活用し,食事の写真を撮影するだけで,その 写真に写っている個々の料理を自動認識し食事記録をと ることが可能である.シリコンバレーのスタートアップ カンパニー Passio*19は材料を撮影するとそこからつく れるレシピを提案してくれる.乱れた食生活による生活 習慣病の増加とそれに伴う医療費の増大は多くの国で深 刻な社会問題となっていることから,このような食事管 理アプリのニーズはますます高まっていくと予想される が,これらのアプリには多くの場合,カロリー計算やレ シピ検索などの機能が組み込まれており,レシピ処理系 APIを活用すれば少ない手間で高度なサービスを実現で きる. 前出の Yummly*20や Edaman*21は,英文レシピを対 象に,料理名や材料リストから詳細な栄養価データを導 出したり,レシピを検索する API を提供しており,機 能制限したものを無償で,制限を解除したものを有償で 提供するビジネスモデルである.彼らが処理対象として いるレシピはさまざまなレシピ掲載サイトから収集した データであるため,データ構造がバラバラであり,食材 名や分量などの記載も多岐にわたることから,これらを *12 https://www.yummly.com/about *13 https://www.geniuskitchen.com/ *14 生田 綾:「クックパッド」に非難相次ぐ「豚肉の“生食”レ シピや蜂蜜入りの離乳食」を掲載,The Huffington Post, 2017 年 4 月 10 日,https://www.huffingtonpost.jp/2017/ 04/10/cookpad_n_15911012.html *15 https://www.myfitnesspal.com/ja *16 https://www.noom.com/jp/ *17 http://www.asken.jp/ *18 http://www.foodlog.jp/ *19 https://www.passiolife.com/

*20 Yummly Recipe API, https://developer.yummly.com/ *21 https://www.edamam.com/

(3)

自社の統一形式に変換したり,料理名を食材集合へ,ま た食材名を栄養データへとひも付けたりするために自然 言語処理技術が使われている.料理は同じ料理名でも材 料が違ったり味付けが違ったり,盛付けによっても見た 目が変わるなど,極めて多様なコンテンツである.ユー ザの自由な名付けによる料理名や,毎回の食事を撮影し た画像から,そのカロリーなどの栄養データを推定する ような機能を実現するためには,その多様性をカバーす るに足る大量のデータが必要であり,ユーザ投稿型レシ ピの利用が適している.さらに,その料理名や食材名を 認識・整理するためには,3 章で紹介する「料理オント ロジー」のような技術が不可欠であろう. また,食の世界における新たなイノベーションとして, 調理ロボットの登場があげられる.2018 年 5 月,MIT の卒業生 4 名とミシュラン二つ星シェフにより“Spyce” というロボティックレストランがボストンにオープンし た*22.提供しているのは炒め物の料理であり,客はタ ブレットによりメニューを選択し,さらに食材や味付け などをカスタマイズすることが可能である.材料は人間 が用意するが,あとはロボットが全自動で調理する.指 定されたレシピに従い材料が運ばれ,回転する鍋に投入 されながら加熱され,味付けされ,皿に盛られる.非常 にシンプルな構造であり,まさに実用的なロボティック キッチンの第一歩といえるだろう. 2015年にロンドンで設立された Moley Robotics*23 さらに野心的なロボティックキッチンを開発している. 詳細はぜひ同サイトの動画を見てほしい.2 本のロボッ トアームがあたかも人間の腕のように動いて,食材を切 り,炒め,調味料を加えて,盛り付け,最後には使用し た調理器具を食洗器へと投入する.同社は 2018 年にこ のロボットキッチンの発売を開始すると発表しており, 初めからこの動画にあるような完成度の高い製品とな るかは懐疑的だが,いずれにせよ何らかのロボティック キッチンが世に送り出されることになるだろう.このイ メージ動画では,人間の調理者が調理する様子を記録す ると,それを解析してロボットが再現するようなシーン も収められており,それはまさに我々食メディアの研究 者が目指している究極のプロダクトではないだろうか. 以上のようなロボティックキッチンの実現には,レシピ テキストを単なる単語列としてではなく,手順として深 く理解する技術が不可欠であり,4 章で紹介する「調理 手順の意味構造解析」がその一助となると考える. 本章では,Web レシピの活用方法として,食事管理ア プリのためのレシピ処理系 API とロボティックキッチ ンについて紹介した.それでは次章からは,具体的なレ シピの自然言語処理技術について紹介しよう.

3.

料理オントロジー

近年,料理レシピを対象にしたさまざまな言語処理研 究が増加している.料理レシピの要約 [重田 18],料理 レシピを対象にした情報抽出*24や情報検索 [Yasukawa 14]などがその一例である.しかし,料理レシピでは固 有の言い回しや表現の省略が多く存在することや,ユー ザ投稿型レシピサイトでは料理レシピ中で用いる料理用 語の表記が投稿者によって異なることなどが,料理レシ ピを十分な精度で解析できない大きな要因となってい た.これらの問題を改善するために,言語処理を行う際 の知識体系として利用される料理オントロジーが整備さ れるようになってきている.本章では,こうした料理オ ントロジーを紹介する. 現在,料理レシピを対象にした言語処理を目的とした 料理オントロジーがいくつか公開されている [清丸 18, Nanba 14].著者の一人難波ら [Nanba 14] が構築して いるオントロジーは 3・1 節で,清丸ら [清丸 18] のもの は 3・2 節で,このほかの言語処理を主な目的とはしてい ないが,一般的に利用可能な料理オントロジーは 3・3 節 で,それぞれ紹介する. 3・1 言語処理のための料理オントロジー (料理オントロジー構築プロジェクト) 難波ら [Nanba 14] は,材料,調理器具,調理動作の 上位・下位関係,同義語,属性,部分・全体関係を人手 で整備し,2014 年より一般公開している.さらに,同 義語に関したオントロジーを英訳し,この英訳データも 日本語版と合わせて公開している*25.難波らは,日本語 の料理レシピおよび特許データベースを情報源とし,表 層パターンおよび統計処理を用いて上位・下位関係,同 義語,属性,部分・全体関係の用語対の候補を自動収集 した後,それらをすべて人手で確認することで,料理オ ントロジーを構築している. 表 2 と図 1 を用いて,料理オントロジーの構造を説明 する.難波らのオントロジーは,表 2 に示す材料,調味料, 調理器具など 7 種類のカテゴリーから構成されている. 各カテゴリーには複数の代表語が登録されている.各代 表語は,それぞれ同義語,部分,属性関係にある用語リ ストから構成されている.図 1 において,「材料─魚介類」 カテゴリーに含まれる代表語「イカ」には,同義語とし て「イカ」や「いか」が,部分として「げそ」や「ゲソ」 が,属性として「色」や「旨味」が含まれていることを 意味する.また,表 3 は,日本語および英語オントロジー *22 メニューは Spyce のホームページ(https://www.spyce. com/)で,また調理の様子の動画は同サイトや YouTube で見 ることができる. *23 http://www.moley.com/ *24 本稿 4 章を参考にされたい. *25 http://www.ls.info.hiroshima-cu.ac.jp/cooking/ synonym_je.tsv

(4)

におけるカテゴリーごとの同義語の総数を示している. 3・2 言語処理のための料理オントロジー(料理基本 知識ベース) 清 丸 ら [清 丸 18] は,(1) 前 節 で 紹 介 し た 難 波 ら [Nanba 14]の料理オントロジーのうち,材料および調 理動作に関する代表語と同義語,(2)クックパッドに投 稿された料理レシピデータ,(3)クラウドソーシングで 収集した料理の印象データを情報源とし,料理基本知識 デースを構築し,公開している*26.表 4 に,料理基本 知識ベースで扱う関係を示す.また,料理基本知識ベー スの規模(語彙サイズなど)を表 5 に示す. 基本料理知識ベースと難波らの料理オントロジーとの 主な違いは,材料に加え,料理名や調理法(料理名と調 理動作と材料の関係)を含む点である.例えば,表 4 に おいて,「ぜんざい」の同義語として「善哉」が,また,「ぜ んざい」の材料として「 」が存在する,といったもの があげられる.属性については,難波らは材料の属性に 着目しているのに対し,料理基本知識ベースでは料理の 印象を属性と呼んでおり,例えば,「ぜんざい」に関し ては「ホッとする」が属性となっている.対象言語は難 波らが日本語と英語であるのに対し,料理基本知識ベー スでは日本語のみとなっている.表 6 に難波らの料理オ ントロジーと料理基本知識ベースとの関係をまとめる. 3・3 このほかの料理オントロジー 3・1 節および 3・2 節で紹介したもの以外にもさまざま な料理オントロジーが構築され,Web 上で公開されてい る.以下に,その一部を紹介する*27.なお,以下のオ ントロジーは,事前に各データの利用条件を調べて,必 要に応じて利用許諾を取る必要がある. 図 1 難波らの料理オントロジーの構造 表 3 難波らの料理オントロジーにおける同義語辞書 カテゴリ 同義語数(日) 同義語数(英) 材料─魚介 542 373 材料─肉 399 244 材料─野菜 1 047 400 材料─その他 1 121 864 調味料 1 139 401 調理器具 1 525 110 調理動作 1 059 288 合 計 6 832 2 680 表 4 基本料理知識が扱う関係([清丸 18] 表 2 より引用) 関 係 例 上位・下位 (ぜんざい,上位・下位,料理) 同義語 (ぜんざい,同義語,善哉) 料理─材料 (ぜんざい,材料, ) 料理─調理法 (ぜんざい,調理法,煮る) 料理─属性 (ぜんざい,属性,ホッとする) 料理─代表材料 (ぜんざい,代表材料,小豆) 料理─代表調理法 (ぜんざい,代表調理法,煮る) 料理─代表属性 (ぜんざい,代表属性,インスタント) 表 5 清丸らの料理知識([清丸 18] 表 3 より引用) 語彙・関係 知識の総数 料理クラスの語彙 材料クラスの語彙 調理法クラスの語彙 属性クラスの語彙 388 295 29 4 396 上位・下位 同義語 料理─材料 料理─調理法 料理─属性 料理─代表材料 料理─代表調理法 料理─代表属性 5 955 3 932 7 174 1 525 6 135 388 388 388 *26 http://nlp.ist.i.kyoto-u.ac.jp/ から「NLP リソー ス」→「基本料理知識ベース」 *27 2018 年 9 月 3 日にアクセスして確認. 表 2 難波らの料理オントロジーにおける カテゴリーと代表語 カテゴリ 代表語数 材料─魚介 61 材料─肉 6 材料─野菜 122 材料─その他 55 調味料 51 調理器具 48 調理動作 131 合 計 474

(5)

● 食品の効能効果辞典 http://www.kounoujiten.com/ 用語数:222 内容:栄養価,効能 ● e-ヘルシーレシピ e 食材辞典(第一三共株式会社) https://www.ehealthyrecipe.com/recipe-webapp/syokuzai/ 用語数:640 以上 内容:栄養素(効能なし) ● 果物ナビ,野菜ナビ https://www.yasainavi.com/ 用語数:100 以上 内容:特徴,栄養価,効能,歴史,旬,産地,食べ方 ● 野菜果物辞典(株式会社 ZUCCA,株式会社オモシロ) https://www.yasaiyasai.com/ 用語数:100 以上 内容:栄養価,効能,産地 ● 食品成分データベース(文部科学省) https://fooddb.mext.go.jp/ ● 日本食品標準成分表 2015 年版(七訂)(文部科学省) http://www.mext.go.jp/a_menu/ syokuhinseibun/1365297.htm

● Food Encyclopedia(Food Network)

https://www.foodnetwork.com/terms 内容:定義文,特徴,訳語 ● Weblio辞書 食品(ウェブリオ株式会社) https://www.weblio.jp/cat/food 内容:(食に関する物事ほぼ全般)定義文,同義語, つくり方 ● 日 本 の 食 べ 物 用 語 辞 典( 株 式 会 社 FROMTO JAPAN) https://japan-word.com/ 内容:定義文,由来,食べ方 ● 世 界 の 食 べ 物 用 語 辞 典( 株 式 会 社 FROMTO JAPAN) https://world-food.info/ 内容:定義文,由来,食べ方 ● 食べ物大辞典 http://tjiten.com/ 用語数:約 370 内容:(食材)栄養価,効能,産地,食べ方 ● 食品の安全性に関する用語集(pdf ファイル) http://www.fsc.go.jp/yougoshu/visual_ yougosyu_fsc_5_201307.pdf 内容:定義文,特徴 ● フランス料理情報サービス 用語集 http://www.french.ne.jp/modules/ xwords/ 用語数:503 内容:定義文 ● レタスクラブニュース 料理用語事典(株式会社 KADOKAWA) https://www.lettuceclub.net/recipe/ dictionary-cook/ 用語数:200 語以上 内容:調理器具または調理方法の定義文 ● タイトル:旬の食材百科 http://foodslink.jp/syokuzaihyakka/ index.htm 内容:(果物・野菜・キノコ・ハーブ・魚介)定義文, 栄養価,効能,旬,産地

French-English Food Dictionary

https://cnz.to/french-english-food-glossary/

内容:訳語

● Japanese Food Glossary(Japan Visitor)(Goods

From Japan KK)

https://www.japanvisitor.com/japanese-culture/food-glossary

内容:(日本食に関する用語)日→英訳語

● Italian A-Z Food Name Dictionary(Cellar Tours)

https://www.cellartours.com/blog/ italy/italian-a-z-fooddictionary 内容:訳語

● Japanese-English Glossary Categories(NHK

World Japan)(NHK) https://www3.nhk.or.jp/nhkworld/en/ food/glossary/ 内容:定義文 ● お菓子の辞典(日本チョコレート・ココア協会) http://www.asahi-net.or.jp/˜ju4j-ishr/ jitenhp.htm 表 6 料理オントロジー [Nanba 14] と基本料理知識 [清丸 18] と の比較 関 係 料理オントロジー [Nanba 14] ベース [清丸 18]基本料理知識 上位・下位(材料) ○ ○ 日本語同義語(材料) ○ ○ 英語同義語(材料) ○ × 材料(代表表記) ○ ○ 材料(属性) ○ × 材料(部分) ○ × 料理(材料) × ○ 料理(代表材料) × ○ 料理(調理法) × ○ 料理(代表調理法) × ○ 料理(属性) × ○ 料理(代表属性) × ○

(6)

内容:定義文 ● ぼうずコンニャクの市場魚貝類図鑑(ぼうずコン ニャク株式会社) https://www.zukan-bouz.com/ 用語数:2 500 以上 内容:詳細な分類,特徴,同義語,生息地,食べ方 ● きのこ図鑑 食用きのこ http://www.kinoco-zukan.net/edible_ mushroom.php 用語数:100 以上 内容:特徴,食べ方,生息地 ● 日本食肉消費総合センター用語集(公共財団法人日 本食肉消費総合センター) http://www.jmi.or.jp/info/glossary.html 内容:定義文

4.

調理手順の意味構造解析

通常,レシピは以下の三つの部分から構成される. (1)タイトル (2)食材リスト(材料名および分量) (3)調理手順(手順番号および手順説明文.図 2 参照) 調理手順は自然言語で書かれており,計算機による解 釈は容易ではない.この手順に対して何らかの意味表現 を定義し,手順文書から意味表現に変換する研究が多数 なされている.本章では,まず我々の意味表現(フロー グラフ)とその推定についての取組みを説明し,ほかの 研究者による同様の研究を紹介する. 4・1 レシピフローグラフ 先行研究として,フローチャートによる一般の手順文 書の表現 [Momouchi 80] や作業動詞とその対象と道具の 関係を表現する木構造 [苅米 12] がある.これらを参考 に一般の手順文書をフローグラフで表すことを提案し, レシピを対象にアノテーションを行った [Mori 14].図 2 の調理手順に対応するレシピフローグラフ(r-FG)を図 3に示す. フローグラフの頂点は,食材や動作を表す単語列とそ の種別である.このような単語列をレシピ固有表現と呼 ぶ*28.表 7 に,レシピ固有表現の種類(クラス)とそ の意味を掲げる.詳しい定義は [笹田 15] に述べられて いる. フローグラフの辺は有向であり,両端の頂点(食材や 動作)の関係を表す.典型的な例は,動作とその対象の 関係である.ほとんどのレシピは食材を加工し併合して いくので木で表現できるが,木で表現できないレシピも 存在する.典型的な例は,食材の分離である*29.したがっ てフローグラフは,無閉路有向グラフ(DAG:Directed Acyclic Graph)である.一般の DAG とは異なり,レシ ピフローグラフは根と呼ばれる特別の頂点がある.これ は,その手順を実行することで最終的に得られるもので, 料理の完成品である.図 3 の例では,「まぶ /Ac」(す) の頂点が根である. 文書中のレシピ固有表現に以下であげる 3 種類のうち のいずれかの関係が認められる場合,それらのレシピ用 語に対応する頂点の間に有向辺を張り,ラベルとしてそ の関係の種類を付与する. ● 述語項関係がある場合(ゼロ照応も含む) ● 同種の二つのレシピ固有表現の間に何らかの参照関 係がある場合 ● 二つの動作の間に何らかの関係がある場合 ラベルの一覧とその意味を表 8 に掲げる.フローグラ フの辺やラベルの詳しい定義は [森 13, Mori 14] に述べ られている. 4・2 レシピフローグラフコーパス 我々は,クックパッド株式会社のサイト*30から和文 レシピを選び,上述の基準に沿ってアノテーションを 人手で行い,コーパスを構築した.これらのランダム (1) 両手鍋で油を熱する.セロリと青ねぎとニンニクを 加え,1分ほど炒める. (2) ブイヨンと水とマカロニと胡椒を加えて,パスタが柔 らかくなるまで煮る. (3) 刻んだセージをまぶす. 図 2 調理手順の例 ૏ু࿭7दఅ)॑೸$Fघॊ؛  ७টজ)धஒबऍ)धॽথॽॡ)॑ਸइ$Fؚ  ীऺन'᫵ी$Fॊ؛  ঈॖচথ)ध਷)धঐढ़টॽ)धმᦪ)॑ਸइ$Fथؚ  ঃ५ॱ)ऋฑैऊ6Iऎऩ$IॊऽदႽ$Fॊ؛  മ$F॒ट७ش४)॑ऽव$Fघ؛ 7FRPS 'HVW 7DUJ 7DUJ 7DUJ

7DUJ 7DUJ 7DUJ 7DUJ 'HVW RWKHUPRG 7DUJ )HT RWKHUPRG $JHQW 9WP 7DUJ 7DUJ 7DUJ 'HVW ऒभইটشॢছইभஉ 図 3 図 2 のフローグラフ *28 数量表現や動作表現も含むため固有表現と呼ぶことは多少違 和感があるが,一般の固有表現でも時間や金額などの数量表現 を含むことや,固有表現認識と同じ手法で推定されることを踏 まえて固有表現と呼ぶことにした. *29 直感的には食材の分離がわかりやすいが,実際のレシピで頻 出する例は,図 3 におけるマカロニからパスタへの辺のような 共参照等による分岐である. *30 http://cookpad.com/,2015 年 11 月 25 日アクセス.

(7)

に選ばれたレシピにはお菓子や肉じゃがのつくり方な ど多様なレシピが含まれているため,レシピテキストの 記述の偏りは少ない.同様に,英文のレシピについても Allrecipes.co.ukのサイトから選び,アノテーションを 行った [Yamakata 17b, 山肩 17c].これらのコーパスの 統計情報を表 9 に示す. 4・3 フローグラフの推定 調理手順の意味構造の解析の取組みとして,レシピテ キストから何らかの意味表現を推定する研究が行われて いる [濱田 02, Kiddon 15, Maeta 15].文献 [Maeta 15] では,和文レシピを対象に以下の三つの処理で前述のフ ローグラフを推定している.なお,下記の手順(1)お よび(2)は,レシピ言語処理マニュアル*31で公開して いるツールおよびモデルを使えば実行できる. (1)単語分割:レシピテキストの単語分割には通常の 形態素解析器を用いることができる.実際には,分 野適応が容易な KyTea [Neubig 11] を用いた.配布 モデルでは約 95%の分割精度であったが,フロー グラフコーパスの学習部分(180 レシピ)を用いる ことで約 99%の分割精度となった.レシピテキス トにおける単語の認識の問題はほぼないといえる. (2)レシピ固有表現の認識:一般の機械学習に基づ く固有表現認識器をフローグラフコーパスの学習部 分(180 レシピ)を用いて構築することによりレシ ピ固有表現認識器が得られる.実際には,部分的ア ノテーションからの学習が可能な PWNER [Sasada 15]を用いた.正解の単語列に対する認識精度は F 値で約 0.90 であった.比較的高いが,向上の余地 があると考えられる. (3)フローグラフの推定:前段で得られたレシピ固 有表現が頂点集合であり,それらの間の有向辺とそ のラベルの推定がこの段階の課題である.これに は,すべての頂点の組とラベルの組合せに対して尤 度を推定し,それを指標とする最大全域木(MST: Maximum Spanning Tree)を推定して木を生成し, さらに有用な辺を追加するという方法を取ってい る.正解の頂点集合に対してラベル付き有向辺の推 定精度は F 値で約 0.72 であった. 以上のような手続きでフローグラフ化されたレシピ は,レシピ検索やレシピ要約・翻訳,手順の可視化や調 理映像との対応付けなどさまざまな場面での応用が期待 される.著者らは,調理映像において食材領域を調理の 開始から終了まで追跡し,かつそれらの領域に対し行わ れた調理行動を認識してグラフ化し,それとレシピのフ ローグラフとを対応付けることで,レシピから調理映像 に対しインデックスを張る手法 [山肩 07] や,「肉じゃ *31 http://www.ar.media.kyoto-u.ac.jp/how-to/ recipe-NLP/ 表 7 レシピ用語の種類 クラス 意 味 備 考 F 食 材 中間・最終生成物を含む T 道 具 調理道具や器など D 継続時間 概数表現を含む Q 分 量 概数表現を含む Ac 調理者の動作 語幹のみ Ac2 調理者の動作 連続しない動詞句の後ろの要素 Af 食材の動作 語幹のみ At 道具の動作 語幹のみ Sf 食材の状態 St 道具の状態 Ac2と At は英語のレシピのフローグラフにのみ出現する. 表 9 フローグラフコーパスの 1 レシピ当たりの諸元 出典 選択基準 文数 レシピ用語数(葉の数, 中間ノード数) 単語数 文字数 クックパッド社 無作為(200 レシピ) 肉じゃが(66 レシピ) 6.51 6.91 36.34(13.91, 48.05(22.12, 22.43) 25.92) 118.65 132.95 180.51 198.70 Allrecipes.co.uk 無作為(200 レシピ) カテゴリ代表(100 レシピ) 9.10 10.06 47.32(18.38, 55.18(21.25, 27.89) 32.75) 120.67 138.19 494.97 556.39 表 8 辺のラベルの種類 ラベル 意 味 Agent 主 語 Targ 対 象 Dest 方 向 T-comp 道具を用いて F-comp 食材を用いて F-eq 同一の食材 F-part-of 食材の一部 F-set 食材の集合 T-eq 同一の道具 T-part-of 道具の一部 A-eq 同一の動作 V-tm 動作を行う other-mod その他の修飾語句

(8)

が」などの特定の料理名で検索して得られた上位 10 件 のレシピから典型的な調理手順を導くため,先にレシピ をフローグラフ化した後,それらを統合して一つの手順 構造を導出する手法 [山肩 16a],「トマト,炒める」の ように特定の食材と加工の組合せを手順として含むレシ ピの検索 [Yamakata 17a],および辞書の自動生成 [山肩 16b]などに利用している.なお,上記手法のいくつかは 最短編集距離によるグラフ間マッピングのアルゴリズム を利用しているが,本フローグラフのような DAG に対 しては NP 困難となり効率の良いアルゴリズムが存在し ない.よって,事前に食材(F),道具(T)および調理 者の動作(Ac)のみからなるツリーに変換する処理を行っ ている.これは,上記手順における(3)において,F,T, Ac以外のレシピ固有表現を削除した後,MST を導出す ることにより実現している.詳しくは [Yamakata 16c] を参照されたい. 4・4 関 連 研 究 自然言語処理において統計や機械学習に基づく手法が 全盛になる以前から,レシピ手順書の理解の一例として 研究されている.[Momouchi 80] は,手順書の意味をフ ローチャートとして表現することを提案し,レシピテキ ストに対してそれを推定する手法について述べている. また,[苅米 12] は,当時の言語処理ツールを多段に適 用し意味表現を推定している. ほかには,作業知識を動作動詞,対象,前提条件や 終了条件などの組として表せるとし,パターンマッチ によってそれをレシピテキストから獲得する試みがあ る [Zhang 12].本章で紹介したレシピフローグラフは これらを参考に,意味表現を詳細に定義した結果であ る.同様の取組みとして,MILK(Minimal Instruction Language for the Kitchen)と呼ばれる意味表現を提案 している研究がある [Tasse 08].これは,レシピフロー グラフのようにすべての調理用語の関係を記述するには 至っていない. 近年では,機械学習に基づく意味表現の自動推定手法 も試みられている.[Jermsurawong 15] は,MILK を 木構造化した SIMMR という意味表現を推定している. [Kiddon 15]は,レシピフローグラフに近い意味表現を EMアルゴリズムに基づく教師なし学習によって推定す る方法を提案している. 意味表現とその推定に近い研究として,ロボットの 制御言語への変換を行い,実際にロボットによる調理を 行っている研究がある [Bollini 13].現状のロボットの 制御言語は,さまざまなレシピを被覆するようにはでき ていないようであるが,計算機による手順書理解の結果 として,その自動実施を評価するというのは非常に興味 深い.

5.お

 わ り に

本稿では,料理レシピテキストの現状と活用,および レシピテキストの自然言語処理技術として「料理オント ロジー」と「調理手順の意味構造解析」の二つを紹介した. 食と健康に対する世界的な意識の高まりを受けて,食を 対象とするビジネスが急速に発展している.日本はレシ ピをはじめとする豊かな食情報資源を活用することで, より健康的でおいしくむだの少ない食生活の実現を目指 して,世界の舞台でイニシアティブを握れるような研究 を行うことができるだろう.本稿がその一助となれば幸 いである.

◇ 参 考 文 献 ◇

[Bollini 13] Bollini, M., Tellex, S., Thompson, T., Roy, N. and Rus, D.: Interpreting and executing recipes with a cooking robot, Proc. 13th Int. Symp. on Experimental Robotics, pp. 481-495 (2013)

[濱田 02] 濱田玲子,井手一郎,坂井修一,田中英彦:料理テキス ト教材における調理手順の構造化,信学論,Vol. J85-D2, No. 1, pp. 79-89(2002)

[Jermsurawong 15] Jermsurawong, J. and Habash, N.: Predicting the structure of cooking recipes, Proc. 2015 EMNLP, pp. 781-786(2015)

[苅米 12] 苅米志帆乃,藤井 敦:料理レシピテキストの構造解析と その応用,言語処理学会第 18 回年次大会予稿集,pp. 839-842 (2012)

[Kiddon 15] Kiddon, C., Ponnuraj, G. T., Zettlemoyer, L. and Choi, Y.: Mise en place: Unsupervised interpretation of instructional recipes, Proc. 2015 EMNLP, pp. 982-992(2015)

[清丸 18] 清丸寛一,黒橋禎夫,遠藤 充,山上勝義:料理レシピと クラウドソーシングに基づく基本料理知識ベースの構築,言語 処理学会第 24 回年次大会論文集,pp. 662-665(2018) [Maeta 15] Maeta, H., Sasada, T. and Mori, S.: A framework for

procedural text understanding, Proc. IWPT15(2015) [Momouchi 80] Momouchi, Y.: Control structures for actions in

procedural texts and PT-Chart, Proc. COLING80, pp. 108-114 (1980)

[森 13] 森 信介,山肩洋子,笹田鉄郎,前田浩邦:レシピテキスト のためのフローグラフの定義,情処学研報,Vol. NL214(2013) [Mori 14] Mori, S., Maeta, H., Yamakata, Y. and Sasada, T.: Flow graph corpus from recipe texts, Proc. LREC14, pp. 2370-2377 (2014)

[Nanba 14] Nanba, H., Doi, Y., Takezawa, T., Sumiya, K. and Tsujita, M.: Construction of a cooking ontology from cooking recipes and patents, Proc. Workshop on Smart Technology for Cooking and Eating Activities: CEA2014, pp. 507-516(2014) [Neubig 11] Neubig, G., Nakata, Y. and Mori, S.: Pointwise

prediction for robust, adaptable Japanese morphological analysis, Proc. ACL11, pp. 529-533(2011)

[Sasada 15] Sasada, T., Mori, S., Kawahara, T. and Yamakata, Y.: Named entity recognizer trainable from partially annotated data, Proc. PACLING15(2015)

[笹田 15] 笹田鉄郎,森 信介,山肩洋子,前田浩邦,河原達也:レ シピ用語の定義とその自動認識のためのタグ付与コーパスの構 築,自然言語処理,Vol. 22, No. 2, pp. 107-131(2015) [重田 18] 重田識博,難波英嗣,竹澤寿幸:分散表現を用いた複数 料理レシピからの典型手順の抽出,第 10 回データ工学と情報マ ネジメントに関するフォーラム(DEIM Forum 2018)(2018) [Tasse 08] Tasse, D. and Smith, N. A.: SOUR CREAM: Toward

semantic processing of recipes, Technical Report, Carnegie Mellon University(2008)

(9)

[山肩 07] 山肩洋子,角所 考,美濃導彦:調理コンテンツの自動作 成のためのレシピテキストと調理観測映像の対応付け,信学論, Vol. J90-D, No. 10, pp. 2817-2829(2007) [山肩 16a] 山肩洋子,今堀慎治,森 信介,田中克己:ワークフロー 表現を用いたレシピの典型性評価と典型的なレシピの生成,信 学論,Vol. J99-D, No. 4, pp. 378-391(2016) [山肩 16b] 山肩洋子,難波英嗣,森 信介,大須賀智子,原島 純, 但馬康宏,大山敬三:料理レシピデータセットを用いた料理用 語辞書の自動構築 : フローグラフから得られる加工履歴に基づ く食材名の分布類似度計算に関する検討,信学技報,Vol. 116, No. 340, pp. 13-18(2016)

[Yamakata 16c] Yamakata, Y., Imahori, S., Maeta, H. and Mori, S.: A method for extracting major workflow composed of ingredients, tools, and actions from cooking procedural text, Proc. 8th Workshop on Multimediafor Cooking and Eating Activities(CEA2016), pp. 1-6(2016)

[Yamakata 17a] Yamakata, Y., Maeta, H., Kadowaki, T., Sasada, T., Imahori, S. and Mori, S.: Cooking recipe search by pairs of ingredient and action - Word sequence v.s. Flow-graph representation, Trans. of JSAI, Vol. 32, No. 1, pp. WII-F 1-9 (2017)

[Yamakata 17b] Yamakata, Y., Mori, S. and Carroll, J.: A Comparison of Cooking Recipe Named Entities between Japanese and English, Proc. CEA17(2017)

[山肩 17c] 山肩洋子,前田浩邦,森 信介,John, C.:英文レシピを 対象とした手順文書からの意味構造抽出,信学技報,Vol. 117, No. 374, pp. 41-46(2017)

[Yasukawa 14] Yasukawa, M., Diaz, F., Druck, G. and Tsukada, N.: Overview of the NTCIR-11 cooking recipe search task, Proc. 11th NTCIR Workshop Meeting(2014)

[Zhang 12] Zhang, Z., Webster, P., Uren, V. S., Varga, A. and Ciravegna, F.: Automatically extracting procedural knowledge from instructional texts using natural language processing, Proc. LREC12, pp. 520-527(2012) 2018年 10 月 22 日 受理

著 者 紹 介

山肩 洋子(正会員) 2005年京都大学大学院情報学研究科博士後期課程 研究指導認定退学.同年,京都大学情報学研究科研 究員.2006 年(独)情報通信研究機構専攻研究員. 2010年京都大学特定講師,准教授,特定准教授を経 て,2015 年より日本学術振興会特別研究員.2018 年より京都大学特定准教授.現在に至る.博士(情 報学).電子情報通信学会食メディア研究会副委員 長.レシピや調理行動に関するマルチメディア処理の研究に従事.電子 情報通信学会会員. 難波 英嗣(正会員) 2001年北陸先端科学技術大学院大学情報科学研究科 博士後期課程修了.同年,日本学術振興会特別研究 員,2002 年東京工業大学精密工学研究所助手,同年, 広島市立大学情報科学部講師.2010 年広島市立大学 大学院情報科学研究科准教授,現在に至る.博士(情 報科学).2011 年情報処理学会論文誌データベース 優秀論文賞.2017 年日本図書館情報学会論文賞.テ キストマイニング,情報検索,自動要約に関する研究に従事.言語処理 学会,情報処理学会,ACM 各会員. 森  信介 1998年京都大学大学院工学研究科電子通信工学専 攻博士後期課程修了.同年,日本アイ・ビー・エム 株式会社入社.2007 年より京都大学学術情報メディ アセンター准教授.2016 年より同教授.博士(工 学,京都大学).1997 年情報処理学会山下記念研究 賞受賞.2010 年,2013 年情報処理学会論文賞受賞. 2010年第 58 回電気科学技術奨励賞受賞.言語の理 解・生成および音声言語処理の研究に従事.言語処理学会,情報処理学会, 日本データベース学会,ACL 各会員.

表 1  SimilarWeb カテゴリー「Food and Drink > Cooking and  Recipes」におけるレシピサイトの世界ランキング 順 位 Web サイトアドレス 平均滞在 時間〔分〕 ページ/訪問者 国 1 cookpad.com 3:40 3.98 日 2 allrecipes.com 2:15 2.26 米 3 chefkoch.de 3:22 3.99 独 4 dianping.com 2:37 3.84 中 5 giallozafferano.it 3:34 2.81 伊

参照

関連したドキュメント

 

あれば、その逸脱に対しては N400 が惹起され、 ELAN や P600 は惹起しないと 考えられる。もし、シカの認可処理に統語的処理と意味的処理の両方が関わっ

燃料デブリを周到な準備と 技術によって速やかに 取り出し、安定保管する 燃料デブリを 安全に取り出す 冷却取り出しまでの間の

「海洋の管理」を主たる目的として、海洋に関する人間の活動を律する原則へ転換したと

光を完全に吸収する理論上の黒が 明度0,光を完全に反射する理論上の 白を 10

固体廃棄物の処理・処分方策とその安全性に関する技術的な見通し.. ©Nuclear Damage Compensation and Decommissioning Facilitation

※ 本欄を入力して報告すること により、 「項番 14 」のマスター B/L番号の積荷情報との関

廃棄物の再生利用の促進︑処理施設の整備等の総合的施策を推進することにより︑廃棄物としての要最終処分械の減少等を図るととも