• 検索結果がありません。

農業ナレッジグラフの構築に関する考察による領域ナレッジグラフの構築モデルの提案

N/A
N/A
Protected

Academic year: 2021

シェア "農業ナレッジグラフの構築に関する考察による領域ナレッジグラフの構築モデルの提案"

Copied!
10
0
0

読み込み中.... (全文を見る)

全文

(1)

人工知能学会研究会資料 SIG-SWO-047-10

農業ナレッジグラフの構築に関する考察による

領域ナレッジグラフの構築モデルの提案

A Building Model for Domain Knowledge Graph based on

Agricultural Knowledge Graph

朱 成敏

1

小出 誠二

2

武田 英明

1,3

法隆 大輔

4

竹崎 あかね

4

吉田 智一

4

Sungmin JOO

1

Seiji KOIDE

2

Hideaki TAKEDA

1

Daisuke HORYU

3

Akane TAKEZAKI

3

Tomokazu YOSHIDA

3

1

国立情報学研究所

1

National Institute of Informatics

2

オントロミー共同会社

2

Ontolonomy, LLC

3

総合研究大学院大学

3

SOKENDAI University(The Graduate University for Advanced Studies)

4

農業・食品産業技術総合研究機構

4

National Agriculture and Food Research Organization

Abstract: The Knowledge Graph systematically links knowledge and constructs a semantic network to represent the knowledge domain. Knowledge graphs enable data integration, knowledge discovery and advanced analyses. We have constructed graphical knowledge graphs and provided related services focusing on agriculture activity and crop. This paper discusses not only the process of constructing the knowledge graph in agriculture but also the process of constructing the domain knowledge graph and the points to be noted.

1

はじめに

ナレッジグラフは知識を体系的に連結し,リンクと して表した知識のネットワークである.ナレッジグラ フを用いるとデータの連携・統合や知識の発見,高度 な分析が可能となり,意思決定やプロセスの最適化の 支援にも繋がる.そのため,蓄積された知識を基盤と する処理によって正確性と有用性の向上が要求される 農業や医療などの専門領域におけるナレッジグラフの 利活用が期待されている. 筆者らは先行研究として農作業と農作物を体系化し, 連携させることで農業分野のナレッジグラフを構築し た.農業ナレッジグラフによって農業データの連携・統 合が可能となり,データの意味解析や処理の自動化が 可能となった.また,情報学と農学をそれぞれ背景と する研究者が協力して構築したため,近年の農業分野 連絡先:国立情報学研究所       〒 101-8430 東京都千代田区一ツ橋 2-1-2        E-mail: [email protected] が持つ問題の解決に適合したナレッジグラフを構築す ることができた.そして,様々な社会的協力を通じて その利活用を促進している. そこで,本研究では農業分野のナレッジグラフを構 築した過程について考察し,領域ナレッジグラフの構 築に要求される要素と構築過程のモデル化を行う.そ して,領域ナレッジグラフの構築過程において注目す べき点について考察する.

2

農業ナレッジグラフの構築

本章では農業ナレッジグラフの 2 つ要素となる農作 業基本オントロジーと農作物語彙体系の構築過程とそ の連携について述べる.

(2)

2.1

農作業基本オントロジー

農作業基本オントロジー (Agriculture Activity On-tology)はデータ間の相互運用を実現するのために構築 された農作業名における標準語彙である [1].2015 年 5 月 12 日最初公開版である ver.0.94 の公開され,最新版 である ver.2.01 まで約3年間 6 回の更新を行ってきた. 本節ではその構築過程について述べる. 2.1.1 問題の認識 近年の農業現場には様々な農業 ICT システムが普及 されており,各システムからは膨大なデータが発生し ている.これらのデータを連携・統合し,分析すること によって生産量の予測や異常の発見,作業の最適化な ど,有効な利活用が可能となる.しかし,データの連 携において基準となる情報がなく,システムベンダー は独自の方針でデータを作成していた.そのため,異 なるシステム間のデータの連携・統合が困難である.農 作業は営農の計画や実行,農業現場の自動化において 重要な要素であり,データ連携のための標準語彙が必 要となった. 2.1.2 調査 筆者らは農作業名とその定義に対する現状を理解す るために関連資料と関係者との打合わせを通じて調査 を行なった. まず,既存の農業分野で用いられている農作業に関す る資料を調べた.用語集としては国際連合食糧農業機関 (FAO)による AGROVOC[2] と内閣官房による「農業 ITシステムで用いる農作物の名称に関する個別ガイド ライン (以下ガイドライン)[3]」があった.AGROVOC は 35,000 語以上の用語が収録されており,27 言語1 対応している国際的な標準語彙であるが,イネ作の農 作業のように日本では重要視されている農作業名称の 不足が確認された.一方,ガイドラインは重複している 項目や「その他」の項目名が多数存在する問題点があっ た.そして,これらの用語集はそれぞれ関連性で分類さ れているシソーラスのため,その関連性が定義されて いなかった.公開形式は AGROVOC が RDF/XML と Turtle,ガイドラインが EXCEL 形式2となっていた. そして,既存の農業 ICT システムに農作業名がどの ように導入されているのかを調査した.システムベン ターとの打ち合わせと独自の調査を通じて,農作業名 は利用者の自由入力に依存していることがわかった.実 際のデータを観察した結果,同じ農作業にも関わらず に表記や名称が異なる場合が多数あった. 12019年 2 月 21 日時点. 22016年当時は PDF のみ. 一方,それぞれの農作業が持つ意味を収録している資 料としては農業技術事典 (NAROPEDIA)3と Wikipedia 日本語版4があり,両方インターネット上で公開され ている.農業技術辞典では様々な農作業について詳細 な説明が収録されていたが,データ化が困難であり, Wikipedia日本語版は農作業関連の項目が不足してい たことがわかった. 2.1.3 タスクの設定 上記の調査により日本の農業分野における農作業に ついて以下のことが判明した. • 標準語彙の不在. • 明確な定義と構造化がされていない. • 機械可読な形式で公開されていない. こういった現状に対し,筆者らは以下のことをタス クとして設定した. • 農作業の意味を定義 • 概念の構造化 • 表記の整理 • 機械可読性のある形式で公開 そして,タスクを解決するために農作業のためのオ ントロジーを構築することにした.これは概念を明確 化し,その定義から構造化するオントロジーの構築が 最も適切な手段だと判断したからである.また,表記 の揺らぎの問題にも対応することができる. 2.1.4 名称の収集 農作業の名称を収集するために筆者らはガイドライ ンと農林水産省の統計調査から農作業名称を収集した. 最初に収集された農作業名は 145 語であり,うち同義 語は 8 語であった.そして,地方自治体の統計調査や 関連資料の調査により農作業名が追加され,最新版で は 475 語が収録されている. 3農業技術事典,http://lib.ruralnet.or.jp/nrpd/ 4Wikipedia日本語版,https://ja.wikipedia.org

(3)

2.1.5 設計と構造化 収集された農作業名に対して定義を行なった.農作 業基本オントロジーはオントロジーにおける概念を農 作業とし,概念を定義するために属性を用いた.最初 は「目的」,「対象」,「手段」の 3 個の属性を用いたが, 多様な農作業への対応と明確な定義を行うために最新 版では「目的」,「行為」,「対象」,「副対象」,「場所」, 「手段」,「機資材」,「時期」,「対象作物例」,「作業条件」 の 10 個の属性を用いて定義している.これらの属性に 対し,農作業の定義に適切な値を決め,農作業の定義 を行なった.そして,値の包含関係から農作業間の関 係性を定義し,最上位概念を農作業とする農作業の階 層構造を構築した.階層の深さは最初公開版では 5 階 層であったが,更新によって最新版では 10 階層となっ た.また,複数の目的で行われる農作業のために複数 の上位概念を持つ多義的概念を導入した.例えば,代 掻きは砕土と近平,保水作業の 3 つの農作業を上位概 念として持ち,それぞれの属性の値を継承している. そして,農作業名称の多様性に対応するために,定 義された概念に表記を収録した.それぞれの概念は見 出し語の役割をする代表表記と同義語となる別名,英 名を表記として持つ.農作業名が持つ属性の値を基準 に体系化する場合,収集された名称だけでは階層構造 の構築が困難のため,抽象的な意味を持つ農作業名の 定義が必要となった.例えば,「挿し木」と「接ぎ木」, 「は種」は繁殖制御のために行う農作業であるが,それ ぞれの詳細は異なる.そのため,「挿し木」と「接ぎ木」 の上位概念として「栄養繁殖作業」を,「は種」の上位 概念として「種子繁殖作業」を追加した.また,「栄養 繁殖作業」と「種子繁殖作業」は「繁殖制御作業」の下 位概念となる.このように「栄養繁殖作業」や「種子 繁殖作業」,「繁殖制御作業」のように筆者らが独自で 定義した農作業名を「概念」とし,属性を「目的」の みにする農作業として定義した.そして,「挿し木」や 「接ぎ木」,「は種」のように実際ほ場で行われる農作業 名を「用語」とした.そのため,農作業の階層構造に おいて上位階層は「概念」,詳細な定義となる下位階 層は「用語」で構成されている. 農作業基本オントロジーは記述論理に基づいて設計 された.そのため矛盾や同一性など農作業名称が持つ 曖昧さを解消できる論理的構造として構築することが できた.なお,こういったオントロジーにおける論理 的な基盤はデータの意味解析や推論のような高度な知 識処理も可能とした. 図 1 は農作業基本オントロジーにおける「挿し木」の 関連知識のグラフである. 図 1: 農作業基本オントロジーにおける「挿し木」. 2.1.6 データ化 農作業基本オントロジーの農作業名は固有の名前空 間 (URI) を持ち,共通農業基盤5にて運用されている. それぞれの URI には表記に関する情報や上位/下位概 念,属性の値など基本情報が表示される.また,対応 する Wikipedia と AGROVOC,農業技術事典の項目 へのリンクがあり,URI 画面を閲覧することで農作業 の意味を理解することが可能である.これらの情報は OWLで書かれており,Turtle/RDF 形式で公開した. また,Turtle 形式の場合,その利用が困難だという現 場の意見があり,必要な項目を選択して CSV 形式でダ ウンロードする機能を追加した. 2.1.7 関連サービスの開発 まず,既存のコンテンツやシステムの語彙を標準語 彙に変換させるために農作業基本オントロジーの表記 5共通農業基盤,http://www.cavoc.org

(4)

情報を利用する語彙変換 API を開発した.同義語を代 表表記に,そして英名に変換することができる.また, 農作業名称を定義している属性の値を用いることで農 作業の意味を自動的に自然言語で説明する用語集を開 発した.それぞれの属性が持つ意味を形容する自然言 語の表現と合わせて値を出力することで説明文が生成 され,農作業に対する意味の理解を容易とする. 2.1.8 検証と更新 農作業は対象となる作物によって様々な農作業が存 在し,さらに地域によって異なる場合もある.そのた め各専門家に収録情報の検証を依頼し,属性の値や表 記の修正を行ってきた.また,新しい用語の追加と構 造の修正も行い,約3年間 6 回の更新を行ってきた. 2.1.9 社会的協力 農作業基本オントロジーは農作業における標準語彙 として日本の農業に最も適合しており,かつ明確な定 義と論理的構造で構築されていることから,平成 28 年 度のガイドライン (本格運用版) に反映された [4].ま た,収録されている情報は誰もが自由に利用できるよ うにデータと関連サービスを全て公開しているため,関 連研究やサービスの開発での利用が容易である.その 例として台湾の食品安全プログラムである Traceable Agriculture Product (TAP)[5]とタイ語への用語変換 に関する研究 [6] が挙げられる.また,岩手県の農業研 究センターと連携して農作業基本オントロジーを基盤 とする複数作物の経営指標を比較して提示するシステ ムを開発した [7].

海外との研究協力も進めており,EU の Diversity In-ternational,フランスの INRA(French National Insti-tute for Agricultural Research)と研究面で協力をして いる.

2.2

農作物語彙体系

農作物語彙体系 (Crop Vocabulary) はフードチェー ンにおけるデータの連携・統合のために開発された農 作物の標準語彙である [8].2017 年 9 月 14 日最初公開 版である ver0.91 が公開され,最新版である ver1.52 に は 1,249 語の農作物の名称が収録されている. 2.2.1 問題の認識 近年の食品安全に対する社会的要望により,生産か ら加工,流通まで一貫性のある管理が期待されている. しかし,農作物は作物としての名称や品種名,加工後 食品としての名称などフードチェーンの各段階におけ る名称が異なり,管理するシステム間のデータ連携が 困難である.そのためフードチェーンにおける農作物 の標準語彙が必要となった. 2.2.2 調査 筆者らは農業現場や食品管理で用いられている農作 物名に対し,関連資料を調査するとともに流通関連の 団体を訪問して現場について意見交換を行なった. まず,公的機関が発行している農作物の語彙につい て調べた.現在 3 つの語彙が主に用いられており,それ ぞれ発行機関と利用目的が異なった.農林水産省によ る「農薬登録における適用農作物名」は農薬の使用に, 厚生労働省による「農作物等の食品分類表」は残留農 薬の基準に,文部科学省による「日本食品標準成分表」 は栄養管理に関する目的で管理されていた [9][10][11]. そのうち,農家では農薬使用に関する基準である「農 薬登録における適用農作物名」が重要視されているこ とがわかった. 一方,これら語彙は同じ農作物にも関わらず,異な る名称で扱われていることが多数発見された.「農薬登 録における適用農作物名」の「ばれいしょ」の場合,他 の語彙では「じゃがいも」と登録されていた.そのほ か,利用部位による名称の違いもあり,「農薬登録にお ける適用農作物名」の「花オクラ」,「わさび (根茎)」が 「農産物等の食品分類表」には「オクラの花」,「わさび の根茎」に収録されていた.そして,それぞれの語彙の 作物名は一般的な農作物名で収録されているが,利用 部位や栽培方法によって限定されることがあった.例 えば,「農薬登録における適用農作物名」における「オ クラ」は「果実を収穫するもの」と,「わさび (根茎)」 は「水系で栽培されるもの」と明記されている.この 場合,利用部位や栽培方法が異なる同じ農作物はその 適用について農家が判断することになる. 公開形式については「農薬登録における適用農作物 名」と「農作物等の食品分類表」は PDF,「日本食品標 準成分表」は EXCEL であった.特に PDF で公開され ている語彙は機械可読が困難であり,加工するときも 濁音の処理などが必要な場合もあった. 2.2.3 タスクの設定 上記の調査により以下のような問題を発見した. • 同じ農作物に対する既存の語彙の名称が異なる. • 利用部位や栽培方法によって名称が異なる. • 機械可読な形式で公開されていない.

(5)

これに対して農作物の標準語彙に必要な条件として 以下のタスクを設定した. • フードチェーンの各段階での対応 • 利用部位,栽培方法に対応 • 既存語彙との互換性 • 機械可読なデータ形式 農作物の場合,行動を定義した農作業と異なり,すで に植物学として定義されているものが対象である.そ のため,既存の定義に目的による名称を対応させる構 築方針を決めた. 2.2.4 名称の収集 農作物名の収集はまず,既存の 3 つの語彙に収録さ れている名称を収集した.それぞれの農作物名に対し て果実や花などの利用部位,栽培方法によって限定さ れているか確認を行なった.そして,農研機構が管理 している品種名を中心に品種名の収集も行なった. 2.2.5 設計と構造化 農作物の対象範囲はほ場での栽培から加工までの過 程にし,分類における第一基準は植物学的定義にした. 全ての代表表記は栽培方法による名称を除き,カタカ ナの表記とした.利用部位については「農作物名 (部位 名)」のような形式で表記し,農作物名の下位概念とす る階層構造で表現した.例えば,「農薬登録における適 用農作物名」の「花オクラ」は「オクラ (花)」となり 「オクラ」の下位概念となる.ここで,上位概念となる 農作物名は総称にし,一般的な名称にも対応できるよ うにした.栽培方法は名称に表示することで分類する ことにした.例えば,わさびは「水ワサビ」と「畑ワ サビ」があり,根茎を利用する場合はそれぞれ「水ワ サビ (根茎)」と「畑ワサビ (根茎)」となる. 表記を標準化したあとは農作物名に対し,既存語彙 の作物名 (または食品名),Wikipedia の項目名,NCBI の taxonomy ID との対応関係を収録した.例えば,果 実に限定している「農薬登録における適用農作物名」の 「オクラ」は「オクラ (花)」に,Wikipedia 日本語版の 項目名「オクラ」は総称の「オクラ」に対応させ,そ れぞれリンクとして同一関係を表現した. 図 2 は農作物語彙体系における「オクラ (果実)」の 関連知識を表したグラフである. 図 2: 農作物語彙体系における「オクラ (果実)」. 2.2.6 データ化 農作物語彙体系の農作物名は農作業基本オントロジー と同様に共通農業基盤で運用されており,URI と関連 データが公開されている.URI には農作物の基本情報 と利用部位で分類されている場合は階層構造が表示さ れる.全ての情報は SKOS/Turtle の形式でダウンロー ドすることができる.また,EXCEL 形式や利用者が 必要な情報を選択して CSV の形式でダウンロードでき る機能も提供している. 既存の語彙についてもそれぞれ URI を実装し,農作 物語彙体系の対応農作物名へのリンクを表示した.既 存の語彙が PDF 形式になっているため利活用が困難 だという要望があり,それぞれ URI の実装と EXCEL, CSV, SKOS/Turtleの形式で加工したファイルも公開 した.なお,名称を収集した際に集めた品種名 30,302 件を別途のデータとして公開し,同じように URI と EXCEL,CSV,SKOS/Turtle 形式で公開した. 2.2.7 関連サービスの開発 農作物語彙体系には既存の語彙と NCBI の Taxonomy DB,Wikipedia 日本語版の項目との対応関係が定義さ れており,横断的利活用が可能である.共通農業基盤 で提供している API を用いると語彙や関連情報の変換 が容易にできる.また,公的機関が発行した語彙の農

(6)

作物名がお互い異なり,関連資料の作成における語彙 の選択が困難だという意見があり,既存語彙別に関連 農作物名を表示する検索サービスも実装して提供して いる. 2.2.8 検証と更新 農作物の語彙は植物学的名称や一般名称,品種名な ど品種改良や商品化によって多様な名称が混在してお り,今後さらに増えていく傾向である.そのため,農 作物名の追加とともに同一性の検証が重要である.農 作物語彙体系は各専門家に情報の検証を依頼をし,同 一性の判定を行なっている.情報の更新はこれまで 5 回行ってきた. 2.2.9 社会的協力 農作物名が持つ多様性に対する問題認識は農業シス テム開発分野に特に共感を得ており,語彙情報について 協力をしている.農薬登録情報を無料で提供している ACFinder6に協力をしており,データの提供を行なっ ている.

2.3

農作業基本オントロジーと農作物基本

体系の連携

筆者らは農作業基本オントロジーと農作物語彙体系 を構築した後,農業分野全般における知識体系を構築 するために 2 つの知識体系の連携を試した [12].農作 業と農作物以外に農作を目的とする活動に必要な要素 である農業機械や資材,設備などの関連語彙を整理し, 今後の拡張における基盤とする目的である.本節では その連携の過程について述べる. 2.3.1 問題の認識 農作業と農作物は農業分野の一部分であり,お互い 密接な関連があるが,連携において語彙間の対応に考 慮しなければならない問題があった.例えば,農作業 の一つである「掘取り」は根菜において地面を掘って, 収穫する作業である.農作業基本オントロジーでは属 性「対象作物」の値として根菜が収録されている.一 方,農作物語彙体系では農作物名を植物学的分類を基 準に定義したため,根菜との対応が困難である.根菜 に分類される農作物名を農作業基本オントロジーの属 性の値として全部収録した場合,その管理はさらに手 間がかかる.各知識体系の管理を考慮すると,最低限 6農薬登録情報検索クライアント,https://acfinder.kabe. info/ の情報を収録することが妥当であり,別途の体系を構 築することが利活用や管理においても適切だと考えた. 2.3.2 タスクの設定 農業分野におけるナレッジグラフ間の連携のために 語彙間の対応を定義する必要があり,そのため,属性 の値のようにナレッジグラフで用いられている語彙を 定義することにした.各語彙の情報と対応関係を定義 し,2 つのナレッジグラフへの対応関係をリンクとし て表現するデータ化を行うタスクをことにした. 2.3.3 設計と構造化 農作業基本オントロジーに用いられている語彙を属 性ごとに分類し,農作業名と農作物語彙体系の農作物 名との対応関係についてリンクとして表現した.これ により 2 つのナレッジグラフが連携することができ,農 業分野のナレッジグラフとして拡張された.図 3 はそ の全体を表した図である. 2.3.4 データ化 各語彙に URI を実装し,英名と属性,関連農作業名 と農作物名へのリンクを表示した.

2.4

考察

本節では 3 つの農業分野のナレッジグラフ構築の各 段階に対して考察する.筆者らは情報系の研究者と農 業系の研究者で構成されている.それぞれの役割と立 場に注目して考察を行う. 2.4.1 調査 まず,情報系の研究者は農業に対する基礎的な知識 を学習する必要があった.関連資料や書籍を参考しな がら栽培過程や農作業の意味,農業用語について学習 した. 公的機関の担当者やシステムベンダーとの打ち合わ せが現状の理解に最も重要だった.まず,同じ用語や 概念についても主体の立場によって異なることがあり, 適切な対応が必要だった.例えば,イネの収穫物は一 般的に米だと判断されるが,農家では籾殻も収穫物の 一部であり,農作業の資材としても用いられる.概念 の定義にこういった立場の違いを理解しないと適用範 囲が狭くなることがわかった.そして,筆者らは関連 資料に掲載されている農作業名を優先する予定であっ たが,打ち合わせを通じて類似農作業を含む通称の農

(7)

!"#$ !" #$ %& '( )*+ ,-./ ,012 34 5,06789:;<= ,-,->? ,->@ ,->A ,->B CDEF !"%$ G> &$ HI 5,-JKLM "%$ NOP=Q> COP=Q> RS 5TUVWXYZ[\,-> ]^> _-`ab> c> d7]^efghi '($ ]^hj 5k-la]^hji mnopqpr stutvwxty zr{| }~a•€LM H> `•> &$)*+ b> ‚> ƒ„…† ‡ˆ b> ‚> ƒ„,-‰hj Chj Nhj ^`>Š ‹-`j c> Œ•Ž• UVŽ• 50|•‘’“”•\–Z5,-a>ŠW—˜Z™‚š›œ•›9 rmqpr^`ž’: 図 3: 農業ナレッジグラフの全体図. 作業名として用いられたことがわかった.最後に同じ 公的機関の中でも管轄によって名称が異なり,同じ機 関にも関わらず用語を統一していないことがわかった. システムベンダーの場合は,用語の統一について問題 認識は共有しているが,利用者の便宜のために事前の 指定などが現実的に困難であることがわかった.その ため,筆者らは対応関係を重視し,利用者側ではなく システムの処理によって連携と統合に注目することに なった. 2.4.2 タスクの設定 近年,農業分野では就農人口の減少により労働力と 生産性の向上のために ICT システムが急激に普及され ている.一方,データの連携や統合による利活用は考 慮されていない現状があった.したがって,データ連 携のための標準語彙の構築と機械可読性のあるデータ 化が第一のタスクとなった. 2.4.3 用語の収集 それぞれの名称はまず,既存の語彙から収集した.そ して,農林水産省や地方自治体が発行した統計調査や 技術体系からも収集した.農作物語彙の場合は登録さ れている品種名を含め地方名など様々な品種名があり, 可能な限り収集を行なった.これらの作業は農業系研 究者が行った. 2.4.4 設計と構造化 農作業の場合,ものとして存在する農作物と異なり, 行動が対象である.また,明確な定義がなく,先に標準 化を行う必要があったため,行動を明確に定義し,構 造化するためにオントロジーの構築を具体的なタスク とした.農作物の場合は植物的分類を基準にしたため 農作業のように複雑な意味構造を持つ体系化ではなく, 簡潔な構造に設計した. 図 4: 共同作業による農作業の構造化. まず,共同作業のためにファイル共有システムを用 い,作業は EXCEL ファイルで行った (図 4).階層造 像や分類,属性の値をコラムに記入して構造化を行っ た.農業系研究者が収集された用語とその定義を記入 し,情報系研究者は包含関係や同一性を確認しながら 構造を構築した.構造の変更や,値の変更は協議しが ら行い,定期的に打ち合わせも行った.

(8)

農作業はすでに存在する語彙を収集し,対応関係を 表す参照情報を中心とする形で構築されている.その ため,既存の語彙との対応関係に対する調査に時間と 努力が必要となり,農業系研究者の負担が大きくなっ た.また,農薬に関する情報が含まれており,国民の 健康問題と深く関連していることから公的機関による 制約が多かった.これらの制約が多く反映されている 「農薬登録における適用作物名」との対応関係には大変 注意が必要だった. これらの作業を繰り返しながら筆者らはお互いの分 野の知識が増え,安定的に運用ができる時期からはあ る程度の決定は独自で行うことができた. 2.4.5 データ化 農作業と農作物は違う構造で設計されたため,農作 業基本オントロジーは OWL,農作物語彙体系は SKOS を表現形式にした.各名称は固有の URI を実装し,そ れぞれの URI から Turtle ファイルで個別の情報を,そ して全体の情報も公開した.また,Turtle ファイルの 利用が困難だという現場の要望があり,CSV ファイル での公開も行った.必要な情報のみ利用したい利用者 の要望もあり,情報体系の中で必要な項目を選択し,動 的に CSV を生成する機能も実装した.CSV での公開 により農業関連のサービスを提供しているベンターの 利用が促進されるきっかけとなって,協力を通じてエ ラーの発見や改善ができた. 2.4.6 関連サービスの開発 関連サービスは農作業基本オントロジーと農作物語 彙体系の構築が終わり,必要だと予想される API を開 発した.その後は関連団体とシステムベンダーとの打 ち合わせを通じて現場から要求されるサービスを開発 した.それにより情報の更新やデータや運用システム の管理に対する改善点を発見することができた. 2.4.7 検証と更新 農業分野にも詳細分野があり,全て情報を筆者らの 調査を通じて行うことが難しく,各分野の専門家に依 頼を行い,検証と修正を行った.これにより収録され るデータが増え,充実な知識体系となった.農作物語 彙体系に比べて複雑な構造を持つ農作業は更新される 情報に対し,同一性や階層構造での関係性を再確認す る必要があった.農作物語彙体系は既存の語彙との対 応関係が定義されているため既存語彙の更新を反映し なければならない問題がある.また,品種名や地方名 などが混在しているため検証によって同一性が発見さ れ,同義語として統合される場合もあった.そのため, 収録語彙数が減少した更新もあった. 2.4.8 社会的協力 筆者らは農作業基本オントロジーと農作物語彙体系 の利用を推進するため,農業関連の既存団体やシステ ムベンターとの連携を促進した.問題認識を共感する 団体と協力を行い,要求される関連サービスの開発や データの加工を行った.これにより,利用の普及とと もに問題点の発見や改善が可能となった.社会的協力 活動を通じて標準語彙の開発と運用において既存の現 場との連携は最も重要であり,社会の一部として運用 されることによって影響力が強化されることがわかっ た.また,これはより充実な更新と関連サービスの開 発ができるきっかけともなる.

3

領域ナレッジグラフの構築モデル

の提案

本章では農業分野のナレッジグラフを構築した経験 から考察した領域ナレッジグラフの構築手順について 述べる.そして,構築手順において注目すべき点につ いても考察する. 図 5: 領域ナレッジグラフの構築モデル.

3.1

構築手順のモデル化

本研究では領域ナレッジグラフの構築手順について 以下のように 4 つのプロセスを提案する (図 5).

(9)

3.1.1 知識の観察 各領域では目的を果たす過程において経験と勘によ る知識を中心に環境の変化によって新しい知識が生成 されている.しかし,環境の変化によって目的の達成 が困難になる場合,問題を認識することになる.これ を解決する方法をタスクとして設定し,アプリケーショ ンやサービスの提供など具体的な解決方法を想定する. 3.1.2 知識の体系化 領域における様々な知識があり,それぞれ形式や利 用形態も異なる.また,地域や役割によって異なる場 合もある.そのため,知識を整理し,定義,または再 定義する必要があり,関連資料の調査と現場との意見 交換を通じて知識を明確化する.そして,知識の体系 化を利用目的に応じる形で行い,ナレッジグラフを構 築する. 3.1.3 知識の ICT 化 構築されたナレッジグラフに対して Linked Data の 形式でデータ化を行う.また,現場の要望を調査し,現 場での利活用が可能な形式のデータを作成する.そし て,「問題の認識」で設定したタスクを解決するために 必要な関連サービスを作成したデータを基盤にして開 発する. 3.1.4 知識の社会化 ナレッジグラフを基盤とするデータと関連サービス を公開し,領域の現場が抱えている問題を解決するた めに導入する.また,データと開発したサービスを公 開し,領域での利活用を推進する.こうすることによっ て必要性の発見と改善点の発見が可能となる.そして, ナレッジグラフは領域の一部として「知識の観察」か ら「知識の利用と発見」へと繋がり,知識の追加や類 似分野の知識へと発展させることができる.このよう に領域の中で循環することによってより有用なナレッ ジグラフとなる.

3.2

考察

本節では前節で提案した領域ナレッジグラフの構築 過程において注目すべき点について考察する. 3.2.1 知識体系の決定 「問題の認識」からタスクを設定する段階では領域 ナレッジグラフにおいて有効な知識体系を決めなけれ ばならない.オントロジーの場合,意味的構成要素と哲 学的な考察の深さによって様々な種類が存在する [13]. 対象となる知識が手続き知識である場合,より高度な 構造のオントロジーの構築が必要となる.そのため,対 象となる知識の体系に最も適切なものを選ぶ必要があ る.選択する際にはデータや関連サービスの開発,「社 会的協力」も考慮しなければならない.例えば,生成 されたデータが複雑な構造を持つ場合は現場での利活 用に困難が生じ,簡略化する必要がある.また,関連 サービスの開発にも手間と検証においてコストが上が り,更新への負担が発生する.そのため,知識を表現 できる最低限の意味的構成要素を持ち,かつ最も簡単 な構造で構築することが必要だと考えられる.このよ うに知識体系の決定は「知識のデータ化」と「知識の 社会化」に深く関連している. 3.2.2 領域専門家との協業 領域ナレッジグラフを構築することにあたり,領域 専門家との協業が必要となる.特に「知識の観察」と 「知識の体系化」の段階ではその役割が特に大きい.領 域専門家との協業は,領域の専門知識を明確にするこ とでナレッジグラフの正確性と,構築する目的となる 問題の認識を正確に判断することで有用性を向上させ ることができる.領域には様々な制約があり,こういっ たガバナンスを理解し,ナレッジグラフに反映するた めにも領域専門家との協力が領域ナレッジグラフの構 築において重要である. 3.2.3 社会的協力と継続性 領域ナレッジグラフの構築と利活用は「問題の認識」 を共有している領域の現場において効率の向上に必要 な手段となる.また,データの公開はシステムベンダー に貴重な資料であり,協力を通じて問題の解決を加速 化することもできる.社会的協力を通じてナレッジグ ラフは領域の一部となり,その利活用によって修正や 更新に対する要望と期待も高まる.そして,現場の協 力を得ることによってナレッジグラフの更新や拡張が 容易となる.「社会的協力」はナレッジグラフの継続性 に大きく影響を与えており,ナレッジグラフが領域に 対してどのぐらい有用なのかの評価基準にもなる.

(10)

4

おわりに

本研究では農作業と農作物を中心とした農業分野の ナレッジグラフの構築過程を概観し,考察を通じて領 域ナレッジグラフの構築モデルを提案した.領域ナレッ ジグラフは知識の観察,体系化,データ化,社会化の 過程で構築される.そして,領域専門家との協業は領 域における正確性と有用性を向上させ,継続性に大き く影響を与えることがわかった.今後は領域の知識に ついて分析を行い,知識の分類に適合する詳細な構築 方法をモデル化していきたい.

謝辞

本研究(の一部)は,総合科学技術・イノベーション 会議の SIP(戦 略的イノベーション創造プログラム) 「次世代農林水産業創造技術」(管理法人:農研機構生 物系特定産業技術研究支援センター)の支援を受けて 行った.

参考文献

[1] 朱 成敏, 小出 誠二, 武田 英明, 法隆 大輔, 竹崎 あ かね, 吉田 智一 : 記述論理に基づく農作業オント ロジーの設計と応用, 第 38 回人工知能学会セマン ティックウェブとオントロジー研究会, 06, 2016. [2] AGROVOC Multilingual agricultural

thesaurus,<http://aims.fao.org/vest- registry/vocabularies/agrovoc-multilingual-agricultural-thesaurus> 2015 年 9 月 21 日 参照 [3] 内閣官房, 農業 IT システムで用いる農作物の名 称に関する個別ガイドライン(第2版), <http: //www.kantei.go.jp/jp/singi/it2/senmon_ bunka/shiryo/170310gl3_besshi.xlsx> 2019 年 3 月 1 日参照. [4] 内 閣 官 房, 農 業 IT シ ス テ ム で 用 い る 農 作 業 の 名 称 に 関 す る 個 別 ガ イ ド ラ イ ン( 本 格 運 用 版 ), <https://www.knowledge.maff.go.jp/ uploads/H28-GL1.pdf> 2019年 3 月 1 日参照. [5] Deng, Dongpo, Guan-Shuo Mai, and Steven

Shiau. : Construction and Reuse of Linked Agri-culture Data: An Experience of Taiwan Govern-ment Open Data, Joint International Semantic Technology Conference. Springer, Cham, 2018.

[6] Tanavongchinda, Pipatpol, and Yukinobu Koyama. : Development of Common Agricul-tural Vocabulary in Thai, Memoirs of National Institute of Technology, Oita College, 54, 25-26, 2017. [7] 竹崎あかね, 前山薫, 朱成敏, 武田英明,吉田智一 : 農作業基本オントロジーを共通語彙とした野菜 栽培体系間の農作業比較,2019 年度人工知能学会 全国大会 (第 33 回), 2019 (発表予定). [8] 竹崎あかね, 法隆大輔, 吉田智一, 朱成敏, 武田英 明 : 農業 IT システム間のデータ連携を可能にす る農作物の名称表現, 電子情報通信学会技術研究 報告,知的環境とセンサネットワーク研究会, pp. 133-134, 2016. [9] 農林水産省, 農薬登録における適用作物名, <https://www.acis.famic.go.jp/shinsei/ 3986/3986beppyou1.pdf> 2019年 3 月 1 日参照. [10] 厚生労働省, 農産物等の食品分類表, <http://www.mhlw.go.jp/file/ 06-Seisakujouhou-11130500-Shokuhinanzenbu/ 0000159254.pdf> 2019年 3 月 1 日参照. [11] 文部科学省, 日本食品標準成分表,資料 2 食品の 原料となる生物種の英名・学名, <http://www.mext.go.jp/component/a_menu/ science/detail/__icsFiles/afieldfile/ 2017/06/22/1365334-1-0321r2.xlsx> 2019年 3月 1 日参照. [12] 朱成敏, 武田英明, 竹崎あかね, 吉田智一: 農業 データ連携のためのナレッジグラフに基づく標準 語彙の運用 2018 年度人工知能学会全国大会 (第 32 回), No. 2G2-OS-10b-01, 2018. [13] 古崎晃司,來村徳信,溝口理一郎 : Web2.0 時代の オントロジー利用雑感-ライトウェイトからヘビー ウェイトまで, 第 14 回人工知能学会セマンティッ クウェブとオントロジー研究会(SIGSWO), 06, 2006.

参照

関連したドキュメント

Key Words : CIM(Construction Information Modeling),River Project,Model Building Method, Construction Life Cycle Management.

担い手に農地を集積するための土地利用調整に関する話し合いや農家の意

~農業の景況、新型コロナウイルス感染症拡大による影響

FSIS が実施する HACCP の検証には、基本的検証と HACCP 運用に関する検証から構 成されている。基本的検証では、危害分析などの

燃料取り出しを安全・着実に進めるための準備・作業に取り組んでいます。 【燃料取り出しに向けての主な作業】

3.仕事(業務量)の繁閑に対応するため

作業項⽬ 10⽉ 11⽉ 2019年度 12⽉

チャオプラヤ川(タイ)は 157,927km 2 という広