農業
ICT
システムのデータ連携のための農作物語彙体系の構築
Designing of Crop Vocabulary for Data Interoperability of
Agriculture ICT Systems
朱 成敏
1 ∗武田 英明
1,2竹崎 あかね
3吉田 智一
3Sungmin JOO
1Hideaki TAKEDA
1,2Akane TAKEZAKI
3Tomokazu YOSHIDA
31
国立情報学研究所
1
National Institute of Informatics
2
総合研究大学院大学
2
SOKENDAI University(The Graduate University for Advanced Studies)
3
農業・食品産業技術総合研究機構
3
National Agriculture and Food Research Organization
Abstract: This paper proposes Crop Vocabulary(CVO) as a basis of core vocabulary of crop names that becomes the guidelines for data interoperability between agricultural ICT systems on the food chain. Since a single species is treated in different ways, there are many different types of crop names. So, we organize the crop name discriminated by properties such as scientific name, planting method, edible part and registered cultivar name. CVO is also linked to existing vocabularies issued by Japanese government agency and international organization. It is expected to use in the data format in the agricultural ICT system.
1
はじめに
近年,農業における ICT 基盤技術の普及は様々な分 野に大きな影響を与えることになった.センサーネット ワークを用いたモニタリングや自動かん水や施肥等を 用いた省力的な栽培管理とともに,システムに蓄積さ れたデータを利用した収穫量の予測や作業の最適化も 可能となった.また,流通・販売においても消費者が生 産,加工に対する情報を照会することができるトレー サビリティーシステムの導入が進んでいる.特に食品 安全に対する社会的要望が急速に高まっており,生産 現場から消費者に至るフードチェーンにおいて食品に 対する一貫性のあるデータ管理が求められている.そ のために最も要求されていることは生産,流通,販売 などフードチェーンの各段階を管理する ICT システム 間のデータの共有と連携,すなわちデータの相互運用 性である. しかし,フードチェーンにおける一貫性のあるデータ 管理を行うためには,対象となる農作物のデータにつ いて考慮しなければならない事項が2つある.まず,1 つ目として標準語彙の導入が挙げられる.異なる ICT システム間データを共有・連携するためには基準となる ∗連絡先:国立情報学研究所 〒 101-8430 東京都千代田区一ツ橋 2-1-2 E-mail: [email protected] 情報が必要であるが,その基準がないため各システム ベンダーは独自語彙の利用や利用者による入力に依存 しており,現状ではデータの共有や連携が困難である. 農作物の標準語彙を導入すれば,農作物に関するデー タを連携・統合することが可能となり,その管理が容 易となる.2つ目の事項はフードチェーンにおける語 彙の変化に対応できる柔軟性を持つことである.フー ドチェーンにおける農作物は段階によっては作物や食 品として管理され語彙が変化する.また,農薬基準や 栄養成分の管理など,管轄の公的機関によって提示さ れている語彙がそれぞれ異なることが多く,語彙の対 応関係を明確にしながら管理しなければならない.そ のためには各段階での一般名称と各管轄の公的機関の 語彙に対応ができ,その管理が可能な語彙体系が必要 となる. そこで, 本研究では農業 ICT システム間のデータ連 携とフードチェーンにおける一貫性のあるデータ管理 を目的とする農作物における標準語彙を提案する.そ して,既存の語彙体系との連携と利活用について考察 し,その可能性について議論する.表 1: 既存語彙におけるじゃがいも,オクラ,わさびの例. (a)農薬登録における適用作物名 大グループ名 中グループ名 作物名 作物名に含まれる別名, 地方名,品種名等の例 備考 いも類 - ばれいしょ じゃがいも 塊茎を収穫するもの 野菜類 - オクラ 果実を収穫するもの 野菜類 - 花オクラ 花を収穫するもの 野菜類 - わさび みずわさび 葉, 花茎, 根茎及び根を収穫する もの. 水系で栽培されるもの. 野菜類 - わさび (根茎) みずわさび 根茎を収穫するもの. 水系で栽 培されるもの. (b)農産物等の食品分類表 食品名 食品分類 じゃがいも ばれいしょ ばれいしょ ばれいしょ オクラ おくら オクラの花 その他の野菜 わさびの根茎 その他のあぶらな科野菜 わさびの葉 その他のハーブ わさびの葉柄 その他のハーブ わさびの花 その他のハーブ (c) 日本食品標準成分表,資料 2 食品の原料となる生物種の英名・学名 食品番号 食品名 生物種の英名 学名
02017∼021 じゃがいも Potato Solanum tuberosum 06032, 06033 オクラ Okra Abelmoschus esculentus
06322, 060323 わさび Wasabi Wasabia Japonica [Syn. Eutrema wasabi]
2
農作物における語彙体系の現状
現在,農業分野で主に用いられている日本国内の農 作物語彙は農林水産省による「農薬登録における適用 作物名」,厚生労働省による「農産物等の食品分類表」, 文部科学省による「日本食品標準成分表」の3つであ り,それぞれ異なる目的によって発行された語彙であ る.本研究ではこれらの3つの語彙を分析対象とする.2.1
既存の語彙
農林水産省が発行している「農薬登録における適用 作物名」は農薬の登録申請に適用対象となる作物名の 一覧である [1].農薬情報は作物の栽培において最も重 要な情報であるため,生産者の注意と参照が必要な語 彙である.記載項目としては作物の分類を意味する大 グループ名と中グループ名1,作物名,別名や地方名な どの同義語情報,詳細についての備考がある (表 1-(a)). オクラとわさびは収穫部位によってそれぞれ「オクラ」 と「花オクラ」,「わさび」と「わさび (根茎)」に分け られている. 厚生労働省が発行している「農産物等の食品分類表」 は食品中に残留する農薬に関する情報に用いられる農 作物の語彙である [2].食品安全を確保するために残留 農薬に対する基準は厳格であり,収穫から加工までの 管理に影響を与えている.記載項目としては食品名と 分類名が記載項目となっている2,農薬登録における適 用作物名と同様,食品とする農作物の部位によって分 けられて収録されている (表 1-(b)). 最後に文部科学省が発行している「日本食品標準成 分表」が挙げられる [3].日本食品標準成分表は国民の 1果樹類の場合は大作物群,中作物群,小作物群 2http://www.mhlw.go.jp/topics/bukyoku/iyaku/ syoku-anzen/zanryu2/dl/070516-1.pdf健康,栄養管理のために管理する食品の成分を明らか にするために作成されている.例えば,オクラは日本 食品標準成分表の野菜類の資料に果実を生とゆでた状 態で摂取した場合の成分が書かれている.食品名称に 関する情報は「資料 2 食品の原料となる生物種の英名・ 学名3」にあり,参照するための食品番号と食品名,生 物種の英名と学名が記載されている. これらの語彙はそれぞれの管轄機関が独自の基準と 目的によって作成したため名称や対象となる部位など の詳細が異なる.特に「農薬登録における適用作物名」 は作物名として定義しているが,「農産物等の食品分類 表」と「日本食品標準成分表」は食品名として定義をし ているため,同じものを示す場合も異なる名称になっ ている場合が多くみられる.表 1 のじゃがいも (ばれい しょ) の表記の場合,「農薬登録における適用 作物名」 では「ばれいしょ」,「日本食品標準成分表」では「じゃ がいも」,「農産物等の食品分類表」では「じゃがいも」 と「ばれいしょ」が用いられている.オクラとわさびの 場合は農薬登録における適用作物名と食品分類表では 収穫部位によって名称が区分されているが,日本食品 標準成分表では食品名の代表表記として「オクラ」と 「わさび」のみ記載されている. 「農薬登録における適用作物名」にはもう一つの特 徴があり,栽培方法に関する情報が記載されている.わ さびの場合,別名に「みずわさび」,備考欄に「水系で 栽培されるもの.」と書かれており,畑で栽培するわさ びである「畑わさび」は対象ではないことを意味する. 「農産物等の食品分類表」と「日本食品標準成分表」は 栽培による区分がない.
2.2
考察
前節に述べたように農業分野で用いられている代表 的な農作物語彙は発行機関の目的によって名称と情報 がそれぞれ異なる.そのため,現状では対象となる農 作物の生産過程や管轄機関によって異なる名称を利用 しなければならない.例えば,栽培農家では農薬使用 のために「農薬登録における適用作物名」から該当農 薬情報を参照し,収穫を商品として出荷する段階では 「農産物等の食品分類表」,「日本食品標準成分表」を参 照する.また,地域や自治体の場合もそれぞれの語彙 に合わせて指導する必要がある. このように農作物の標準語彙となる公的機関による 語彙が複数存在する現状は農業 ICT システムにおいて も様々な問題点を与えている.システムベンダーが基 準となるデータを定義する際に,独自の基準または利 用者である農家に一任する場合が多い.また,農家は 3 http://www.mext.go.jp/component/a_menu/ science/detail/_icsFiles/afieldfile/2017/06/22/ 1365334-1-0321r2.xlsx 慣習的な名称や一般的に通用されている名称でデータ を作成することが多い.こういった現状では異なるシ ステムで作成されたデータ間の連携や統合が困難とな り,政策の策定や予測,管理などデータの利活用に妨 げとなる.食品安全を確保するためのトレーサビリティ システムの運用においても一貫性のある管理が困難で ある. 「日本食品標準成分表」はエクセル形式,「農薬登録 における適用作物名」と「農産物等の食品分類表」は PDF形式で利用者が発行機関のサイトからダウン ロー ドする形で配布されている.PDF 形式である「農薬登 録における適用作物名」と「農産物等の食品分類表」の 場合,IT システムで利用するためには読み込みが可能 な形式に変換する必要がある.また,一部の表記には 独立の濁点,半濁点があり,システムに用いるために は事前処理が必要な場合もある. 現状に対する以上の考察から農業 ICT システム間の データ相互運用性を考慮した農作物名称の標準語彙と して要求される事項は以下の点が挙げられる. • 名称の一貫性 • 栽培方法と対象部位の定義 • データの機械可読性 そこで,本研究では以上の3点を目的とする農作物 の標準語彙を構築し,農作物名称の標準語彙としての 可能性と有用性を考察する.3
農作物における標準語彙の設計
本章では前章で述べた農作物における標準語彙の条 件を考慮した設計について述べる.3.1
農作物名称の標準化
農作物の名称を収集するために公的機関が発行した 既存の語彙体系を参考にした.今回,参考にした既存 の語彙は農薬登録における適用作物名,農産物等の食 品分類表,日本食品標準成分表の3つである.その詳 細を表 2 に示す.フードチェーンの始点である農家が農 作物の生産のために最も注目している語彙は「農薬登 録における適用作物名」である.農作物の生産におい て農薬使用に対する注意は農作物の生産に重要であり, 収穫物の品質にも大きな影響を与える.そこで,本研 究では「農薬登録における適用作物名」を中心に「農産 物等の食品分類表」と「日本食品標準成分表の食品名」 との対応関係を把握しながら作物名の整理を行った. また,「農薬登録における適用作物名」を中心に「農 産物等の食品分類表」には品種名が含まれていたため表 2: 公的機関による重要語彙. 語彙名 発行機関 改訂版数 語彙数 農薬登録における適用作物名 農林水産省 2017年 3 月 31 日改正 893語 農産物等の食品分類表 厚生労働省 2013年 7 月版 1,179語 日本食品標準成分表 文部科学省 2015年版 (七訂) 625語 独自で品種名の整理を行った.30,302 語の品種情報を 収集し,選別を行った. 3.1.1 農作物の基本情報 農作物の名称を整理するためにまず注目した情報は 生物学的分類に基づく情報である.特に学名に注目し, 農作物を定義する基準とした.そして,品種名の場合 を除き,代表名称はカタカナで表記することにした [5]. 農作物の情報としては同義語となる農作物の別名以外 にも科名,英名,学名を調査し,収録した. 3.1.2 収穫部位による定義 農作物の名称の場合,一般的には作物または植物と して呼ばれることが多いが,管理する管轄機関によっ ては一部の部位を示す場合もある.例えば,表 1 のオ クラの場合,「農薬登録における適用作物名」では「果 実を収穫するもの」と明記されており,農薬使用にお いてオクラとは果実部位を意味する.また,花オクラ は花を収穫するものを示しており,オクラとは別の項 目になっており.「農産物等の食品分類表」のオクラも 果実と花が分けられており,「オクラ」はオクラの果実 を,「オクラの花」は「その他の野菜」として分類され ている.一方,「日本食品標準成分表」では食品として の「オクラ」のみ収録しているが資料の中で果実に限 定している.そこで,本研究では農作物の代表表記に 作物の部位を記述することを提案する.オクラの果実 として明記されたものと食品としてのオクラを「オク ラ (果実)」,オクラの花は「オクラ (花)」とし,農作 物名称の代表表記とする (表 3). 3.1.3 栽培方法による定義 作物によっては栽培方法によって異なる農作物にな る場合もある.一般的にわさびは水系で栽培すること が多いが,畑で栽培する場合もあり,この場合を「畑 ワサビ」と呼ぶ.しかし,表 1 のように「農薬登録に おける適用作物名」には「畑ワサビ」が収録されてお らず,「わさび」は水系で栽培されたもののみに定義し ている.一方,「農産物等の食品分類表」と「日本食品 標準成分表」では収穫部位を詳細にしているが,栽培 方法については明記していない.本研究では栽培方法 を考慮し,名称を区分することにする.表 4 はワサビ の例である. 3.1.4 品種の区分 農作物名称の中では品種名も多数存在しており,登 録年度や登録情報の管理上,詳細な定義が困難な作物 もある.例えば,農薬登録における適用作物名では「か ぶ」の別名として定義された「赤菜」と「赤かぶ」は 地方品種名である.本研究ではこういった品種に関す る情報を作物を定義する属性として用いる.その詳細 は表 5 に示す. 3.1.5 農作物の階層 本研究では農作物の名称を定義するために収穫部位 と栽培方法を用いた.農作物の収穫後の加工や食品と しての管理のためにこれらの情報を収録する必要があ るが,農作物の管理上農作物の全体を表す手段を考慮 しなければならない.例えば,表 3 の「オクラ (果実)」 と「オクラ (花)」をまとめる上位概念として「オクラ」 を導入すれば,オクラの全体,または果実と花以外の 部位についても適用する作物の名称となる.本研究で はこれを総称と呼び,表 6 のように表す.
3.2
相互運用性のための連携
今回,農作物名称の標準語彙を構築するために公的 機関による3つ語彙と独自で整理した品種のリストを 用いた.農作物や食品に関する語彙は他にも存在してお り,日本国内国外の管理機関によって発行された様々な 語彙がある.これらの語彙の作物名,または食品名と連 携することによってシステム間はもちろん国際的な相 互運用性を高めることも可能となる.まず,国内の語彙 体系として内閣官房による「農業 IT システムで用いる 農作物の名称に関する個別ガイドライン」の作物名と, そしてデータの連携としては Wikipedia 日本語版4の 項目と対応関係を調査し,農作物のデータとして収録 した.国外の語彙としてはアメリカの FAO(Food and 4https://ja.wikipedia.org表 3: 収穫部位による農作物名称の定義. 農薬登録における適用作物名 農産物等の食品分類表 日本食品標準成分表 本研究 (提案) 作物名 備考 食品名 食品分類 食品名 農作物名 オクラ 果実を収穫するもの オクラ おくら オクラ オクラ (果実) 花オクラ 花を収穫するもの オクラの花 その他の野菜 - オクラ (花) 表 4: 栽培方法による農作物名称の定義. 農薬登録における適用作物名 農産物等の食品分類表 日本食品標準成分表 本研究 (提案) 作物名 備考 食品名 食品分類 食品名 農作物名 わさび (根茎) 根 茎 を 収 穫 す る も の。水系で栽 培され るもの。 わさびの根茎 その他のあぶら な科野菜 水ワサビ (根茎) わさびの葉 その他のハーブ 水ワサビ (葉) わさび 葉, 花茎, 根茎及び根 を収穫するもの。 わさびの葉柄 その他のハーブ 水ワサビ (葉柄) 水系で栽培されるも の。 - - わさび 水ワサビ (花茎) わさびの花 その他のハーブ 水ワサビ (花) - - わさびの根茎 その他のあぶら な科野菜 畑ワサビ (根茎) - - わさびの葉 その他のハーブ 畑ワサビ (葉) - - わさびの葉柄 その他のハーブ 畑ワサビ (葉柄) - - - - 畑ワサビ (花茎) - - わさびの花 その他のハーブ 畑ワサビ (花) 表 5: 品種の区分. 区分基準 品種登録があるもの 品種 (一般名称) 品種 (地方品種) 品種 (育成団体名あるいは国名) 栽培植物の小分類 統計項目名 特性調査基準 グループ
Agriculture Organization)による AGROVOC5の項目
名,アメリカの NCBI(National Center for Biotechnol-ogy Information)6の taxonomy ID を収録した.これ
らの語彙やデータと連携することによって語彙体系の 相互運用性の向上が期待される. 5 http://aims.fao.org/vest-registry/vocabularies/agrovoc-multilingual-agricultural-thesaurus 6https://www.ncbi.nlm.nih.gov/
3.3
農作物語彙体系
以上の設計方針に基づいて本研究では農作物名称の標 準語彙となる農作物語彙体系 (CVO, Crop Vocabulary) の構築を行った [6].農作物語彙体系は現在,共通農業 語彙 (CAVOC)7にて公開されている.2018 年 1 月 10 日 に公開された最新版である ver1.12 は 1,191 語の農作物 の情報が収録されている.表 7 はこれまでの更新履歴 を表す.今回,整理した農作物の情報と公的機関によ る語彙のデータも提供しており,誰もが自由に使うこ とができる8.また, これらのデータを ICT システム で円滑に利用するために関連 API とアプリケーション を開発し,公開している.その詳細については次章で 詳しく述べる.4
農作物語彙体系の応用
本章では本研究で構築した農作物語彙体系の応用に ついて述べる. 7http://www.cavoc.org 8http://www.cavoc.org/cvo.php表 6: 農作物名称の階層構造. 本研究 (提案) 既存語彙 農作物名 上位概念 農薬登録における適用作物名 農産物等の食品分類表 日本食品標準成分表 オクラ (総称) - - - -オクラ (果実) オクラ (総称) オクラ オクラ オクラ オクラ (花) オクラ (総称) 花オクラ オクラの花 -表 7: 農作物語彙体系の公開履歴. Ver. 更新日 収録語彙数 0.91 2017年 9 月 14 日 1,198語 1.00(公開版) 2017年 10 月 19 日 1,188語 1.05 2017年 11 月 16 日 1,187語 1.12 2018年 1 月 10 日 1,191語
4.1
URI
の実装
農作物語彙体系の作物名は固有の名前空間 (URI) を 持っており,図 1 は「オクラ」の URI 画面である9. URI画面は作物の情報と作物のリスト,外部データへ のリンクに分けられている.上段には科名,英名,別 名,学名と階層構造を持つ作物の場合は上位作物や下 位作物が表示されており,作物の詳細が把握できる.下 段には対応する外部データへのリンクがあり,より詳 細な情報を参照することができる.それぞれの URI で はこれらのデータを SKOS/Turtle 形式でダウンロード ができるリンクがあり,誰もが自由に利活用すること ができる. !"#$% &'()*+#,-. /0-1)2 !"#$%&'34( !"5,67 )%%*+,,-./0-10$2,-/0,34,5,8.9 図 1: 農作物語彙体系の URI. 今回,農作物語彙体系の設計に基盤となった「農薬 登録における適用作物名」,「農産物等の食品分類表」, 「日本食品標準成分表」の重要語彙と独自で整理した CAVOC品種リスト,そして内閣官房による「農業 IT 9オクラ,http://www.cavoc.org/cvo/ns/1/オクラ システムで用いる農作物の名称に関する個別ガイドラ イン」に対して名前空間を作成し,共通農業語彙にて 農作物語彙体系とともにに公開した.それぞれの語彙 が持つ作物名称の情報とそれに該当する農作物語彙体 系の作物名へのリンク,そしてデータを SKOS/Turtle 形式でダウンロードができるリンクがある.図は「農 薬登録における適用作物名」の「オクラ」の例である. !"#$% &!"'()*+,-.!/0"12#34-564789 !#$%&'(:;" !"<3=> )&&*+,,-./0-10%2,-/0,34,&(5670$830$4.5$90&$,,-. 図 2: 「農薬登録における適用作物名」の「オクラ」. 共通農業語彙では農作物語彙体系を中心に日本の公 的機関が発行した語彙と国際機関による AGROVOC と NCBI,そしてウィキペディアの項目とのリンクを 提供しており,作物に関する多様な情報を参照するこ とができる.図 3 は農作物語彙体系の「オクラ (果実)」 を中心としたデータの連携を表す図である.4.2
データの公開
農作物語彙体系はそれぞれの語彙に対して CSV と SKOS/Turtle形式のデータを公開している.システム ベンダーや研究者はこれらのデータを用いて IT システ ムのデータを連携・統合することができ,農業分野に おける様々なデータの分析やシステムの開発が可能と なる.また,公的機関による語彙もデータの構造,文 字コードなどの機械可読性を改善し,エクセル,CSV, Turtle形式で公開した10. 10「農業 IT システムで用いる農作物の名称に関する個別ガイド ライン」はエクセル,CSV 形式のみ.!""#$%%&'()&*)+,%&()%-.%./)01!2-3,4-+/)1%!"# !""#$%%&'()&*)+,%&()%-.%"402/)13-)1.'015)"1%!"# !""#$%%&'()&*)+,%&()%-.%./)01!2-361-+12%!"# !""#$%%&'()&*)+,%&()%-.%7%!"#8$%9 &'()*+,-./012 &31456789: ;<67=>?8: &01@ABC &D:;EFGHI/J-&0152K*LM-NOPQR#QS !""#$%%&'()&*)+,%&()%-.%-)1.'015)"15423,12<4=2-4%!"# TUVWXUY >?@ABAC DCE: !"# FGGHFG !"# !""#$%%&'()&*)+,%&()%-.%7%!"#8$%9*""= 図 3: 外部データとの連携.
4.3
関連 API とアプリケーション
共通農業語彙では農作物語彙に関する API とアプリ ケーションを公開しており,誰もが自由に用いること ができる. 農作物語彙体系には農作物の生物学情報や同義語,英 名など多様な情報が収録されている.提供している関 連 API を用いると ICT システムは農作物の様々な情 報を利活用することができる.また,農作物語彙体系 では様々な語彙の農作物名称との対応関係を示し,そ れぞれの語彙には作物に関する情報がある.こういっ た連携を用いるとデータ横断的活用が可能となる.例 えば,農作物の分類情報しか記載されていない「農薬 登録における適用作物名」の作物名から「日本食品標 準成分表」に収録されている食品の原料となる生物種 の英名や学名を取得することが可能となる. 現在,日本の農業分野で用いられている農作物語彙 は発行している公的機関の目的によって定義された名 称であり,農家や管理団体はそれぞれの公的機関の管 轄領域によって語彙を変換しなければならない状況で ある.例えば,一般的には「じゃがいも」と呼ばれる ことが多いが農薬使用における表記は「ばれいしょ」, 残留農薬基については「ばれいしょ」と「じゃがいも」, 準食品成分に関しては「じゃがいも」が表記となる.そ こで,それぞれ目的によって語彙名称を選択できるよ うに農作物語彙体系を用いた作物名称の検索サービス を実装し,公開した. 図 4 は「じゃがいも」の検索例 である.5
考察と今後の課題
農作物語彙体系に収録されている農作物名は既存の 語彙を参考としながら属性を用いて定義を行い,それ ぞれ分類した語彙である.農作物名には品種,地方名 など多様な名称が存在しており,異なる名称であって も同一作物とみられるの場合もあった.こういった曖 昧性のある作物は今後,有識者と協議をしながら,整 理していく予定である. 今回,国際的な標準語彙である AGROVOC と農作物 語彙体系との対応関係を調査する際に AGROVOC の情図 4: 農作物語彙体系を用いた農作物名称サーチ. 報に一部誤謬がみられた.これは日本に比べ国際的に知 名度が低い作物から多くみられ,例えば,AGROVOC ではシソとエゴマ,わさびとだいこんわさびが同じ作 物として転送処理されていた.今後,協力を通じて修 正・更新ができる農作物語彙の協議体を提案していき たい. 筆者らは農作業の標準語彙として農作業基本オント ロジーを構築し,普及を推進してきた [7].農作業基本 オントロジーでは農作業を定義する際に作物を属性と して用いる.しかし,その値は「イネ」や「ムギ」の ように農作物名になる場合もあるが,「掘取り」は「根 菜類」のように分類名を持つ.今後の連携を考慮する と抽象的な概念としての作物名と対応する作物の情報 を持つ中間階層の構築が必要である.