オントロジー開発手順
オントロジー開発手順 (現在)
1.Scope決定(利用目的,タスク:検索改善、KM、QA…)
2.再利用(ワードネット,オントロジー検索エンジン)
3.用語枚挙(自然言語処理)
4.クラス定義
5.
プロパティ定義:テーマによって標準的語彙がある
6.制約定義
7.インスタンス定義
8.Scopeから考えて4-7は妥当か? Go to 4
determine scope consider reuse enumerate terms define classes define properties define constraints create instances 2Ontologies: Vocabulary (= Standard Property Set)
XML: Name Space Prefix, DB: Metadata
rdf http://www.w3.org/1999/02/22-rdf-syntax-ns# rdfs http://www.w3.org/2000/01/rdf-schema# owl http://www.w3.org/2002/07/owl# SKOS http://www.w3.org/TR/skos-reference/ dc http://purl.org/dc/elements/1.1/ 書誌 OAI-ORE: http://www.openarchives.org/ore/ アーカイブ vCard: http://www.w3.org/Submission/vcard-rdf/ カード rev http://dannyayers.com/xmlns/rev/# 評価 foaf http://xmlns.com/foaf/0.1/ 人 SIOC:http://rdfs.org/sioc/spec/ オンラインコミュニティ geo http://www.w3.org/2003/01/geo/wgs84_pos# 位置 gn http://www.geonames.org/ontology# 地理 gr http://purl.org/goodrelations/v1# 商品 Music http://musicontology.com/ 音楽 POhttp://purl.org/ontology/po/ メディア DOAP: http://trac.usefulinc.com/doap プロジェクト wikiont_class http://www.yamaguti.comp.ae.keio.ac.jp/wikipedia_ontology/class/ wikiont_property http://www.yamaguti.comp.ae.keio.ac.jp/wikipedia_ontology/property/ ldc※ http://www.yamaguti.comp.ae.keio.ac.jp/ld/class/ ldp※ http://www.yamaguti.comp.ae.keio.ac.jp/ld/property/ 3
DC(Dublin Core) プロパティ 書誌語彙
http://dublincore.org/documents/dcmi-terms/
title リソースに与えられた名前 description リソースに関する説明 date リソースのライフサイクル中の出来事に関連する日時もしくは期間 creator リソースの作成*に主たる責任を持つ実体 contributor リソースへの協力、貢献に責任を持つ実体 publisher リソースを利用可能にすることに責任を持つ実体 type リソースの性質もしくはジャンル format ファイル形式、物理メディア、リソースのサイズなど language リソースの言語 identifier ある文脈における、リソースへの曖昧さのない参照 rights リソースに適用される権利に関する情報 relation 関連するリソース source リソースの派生元リソース subject リソースのトピック coverage リソースの空間的あるいは時間的トピック、or適用対象、リソースが有効となる地域など 4geo(GeoVocabulary) 位置語彙
http://www.w3.org/2003/01/geo/wgs84_pos#
SpatialThing
空間を表現
TemporalThing
時間を表現
Event
ある特定の日時に開催されるイベント
Point
ある地点を表現
lat
緯度
time
日時
location
ある特定の地点などとの関係を表現
long
経度
alt
標高
lat_long
緯度経度(カンマで分けて表現)
5geonameid GeoNamesID name 地理名称 asciiname 地理名称(ASCIIコードで表現) alternatenames 代替名称 latitude 緯度 longitude 経度
featureClass see http://www.geonames.org/export/codes.html
featureCode see http://www.geonames.org/export/codes.html
countryCode 国名ID cc2 代替国名ID population 人口 elevation 海抜 gtopo30 900m×900m毎の平均海抜 timezone タイムゾーン modification date 修正日時 locatedIn どこに位置するか表現 nearby 近くに何があるか表現
gn(GeoNames) 地理語彙
http://www.geonames.org/ontology#
6geo(GeoVocabulary) 具体例
LOV
(Linked Open Vocabulary)
LOD
(Linked Open Data)
Web上で公開され,相互に連結し合っているRDFデータ
これまで多く研究されてきた抽象的な概念構造が
現実的な有用性を生むには依然高いハードルがある
具体物であるインスタンスの記述をしたRDF(Linked Open Data)の
データベースを公開・共有し合うべきという風潮が高まっている 2007年5月 2008年5月 2011年9月
LODの普及
10Linked Data Cloud
メディア
地理
政府
生命科学
クロスドメイン
出版物
ユーザー生成
コンテンツ
295のデータセット、310億を超えるトリプル
11DBpedia
•http://www.dbpedia.org
•WikipediaのInfoboxを利用し、大規模なDBを構築
•LODにおいて、ハブとして広く利用されている
DBpedia Japanese
(by NII)
http://ja.dbpedia.org/
• Dbpedia:Wikipedia英語版を対象
• DBpedia Japanese:Wikipedia日本語版を対象
Linked Open Data Initiative
2012年8月に発足
LODを普及促進する活動 日本語LOD Cloudの作成日本語LOD Cloud
2008年の欧米と同程度の規模
DBpedia Japaneseと相互リンクと
なっているのは以下の3つのみ
本家DBpedia
日本語WordNet
日本語Wikipediaオントロジー
DBpedia Japaneseが持って
いない概念階層関係の補完
として,日本語LODハブの一
つとして期待されている
14 DBpedia Japanese DBpedia 日本語WordNet 日本語WikipediaオントロジーWikipediaからオントロジー(言葉階層木,言葉の ネットワーク)に自動変換して, 人工物に言葉の意味(Sense)を理解させる →日本語Wikipediaオントロジー 人間には,ウィキペディアの内容(意味) が判るけど人工物(コンピュータ,スマ フォ,ロボット...)には判らない
日本語Wikipediaオントロジー
15日本語Wikipediaオントロジー(文学)
17
さらにズームアップ(模式図)
日本の 小説家 小説家 作家 人物 文学 文化 芥川龍之介 文化活動 家族 日本史 の人物 代表作 職業 職業 プロパティ定義域 クラス-インスタンス関係 Is-a関係・プロパティ上位下位関係 トリプル プロパティ値域 日本の 大学 日本の 小説 日本 存命人物 羅生門 蜘蛛の糸 鼻 小説家 塚本文 芥川也寸志 芥川貴之志 短編小説 日本 東京帝国 大学英文科 日本の映 画作品 作曲家 日本のクラ シック音楽 の作曲家 オペラ 作曲家 夏目漱石 明治の 人物 明治大学 の人物 門下生 津田青楓 坊っちゃん こゝろ 小説 時代小説・ 歴史小説 作家 誕生 最終学歴 配偶者 子供 著作 国籍 親族 ジャンル 死没 東京都出 身の人物 日本出身 の人物 文庫本 クラス プロパティ インスタンス 俳人日本語Wikipediaオントロジー
http://www.wikipediaontology.org/
日本における行政LOD実践
http://citydata.jp/ http://spending.jp/ 神奈川県横浜市 http://yokohama.spending.jp/ 千葉県千葉市 http://chiba.spending.jp/ 宮城県仙台市 http://sendai-miyagi.spending.jp/ 福岡県福岡市版 http://fukuoka.spending.jp/ 愛知県北名古屋市 http://kitanagoya.spending.jp/ 宮城県南三陸町 http://minamisanriku-cho.spending.jp/ 北海道江別市 http://ebetsu.spending.jp/ 北海道札幌市 http://sapporo.spending.jp/ 京都府京都市 http://kyoto-city.spending.jp/ 東京都小金井市 http://koganei.spending.jp/ 東京都武蔵野市 http://musashino.spending.jp/ 宮城県石巻市 http://ishinomaki.spending.jp/ 北海道旭川市 http://asahikawa.spending.jp/ 茨城県水戸市 http://mito.spending.jp/ 東京都杉並区 http://suginami.spending.jp/ 東京都中野区 http://nakano-ku.spending.jp/ 東京都調布市 http://chofu.spending.jp/ 東京都葛飾区 http://katsushika.spending.jp/ 大阪府吹田市 http://suita.spending.jp/ 福島県会津若松市 http://aizuwakamatsu.spending.jp/ 新潟県新潟市 http://niigata.spending.jp/ 20 http://www.data.go.jp http://data.city.sabae.lg.jp/LOS
(Linked Open Service)
• 業務分析から業務知識を分類し構造化する
– マニュアル分析+熟練者インタビュー+現場見学と体験
複合知識ベース(MKB)の開発
22 作業A 作業B 作業C 判断 A 作業Dワークフロー
オントロジー
&LOD
作業・装置関連 用語の意味とデータ 作業A ルールB ルールC 理由 理由 理由ゴールツリー
When型
順序
Why型
理由
How型
どのように
What型
意味
if (?LED点灯状態?電圧) then (?基板A交換) if (?センサ反応?電圧) then (?電源交換)ルールベース
if A then B 2018/6/26 LODチャレンジ2017• 高速道路ETCレーン故障診断
– ETC装置故障時の
アラーム
からの復旧
– アラーム発生は予期できず、アラームによって
は、
保守員は対応できない
– スマートグラスなどの支援機器が必要
支援対象業務
23警報発生
故障対応
2018/6/26 LODチャレンジ2017作業A 作業B 作業C 判断 A 作業D ワークフロー ドメイン オントロジー 作業に関連する 用語の意味 作業A ルールB ルールC 理由 理由 理由 ゴールツリー if (?LED点灯状態?電圧) then (?基板A交換) if (?センサ反応?電圧) then (?電源交換) ルールベース if A then B マルチメディア
知識リソース
24 作業者 質問応答システム ディスプレイ ・作業手順 ・業務ルール ・図・動画 ・質問リスト ・選択された 質問の回答 ・ヒアリング ・現場体験 ・ドキュメント分析 熟練者 マニュアル分析した
マニュアル
ETC装置マニュアル
(20ファイル)
インタビュー
担当者
業務熟練者(約10年)
獲得方法
インタビュー(6回)
点検作業体験見学(2回)
予備品見学(1回)
2018/6/26 LODチャレンジ2017Application 質問応答システム
構築した複合知識ベース
25 作業者 熟練者 マニュアル ・ヒアリング ・現場体験 ・ドキュメント分析 ディスプレイ ・作業手順 ・業務ルール ・図・動画 ・質問リスト ・選択された 質問の回答 獲得した 知識 ワークフロー 13 判断ルール 47 作業 オントロジー クラス 23 インスタンス 81 トリプル 約500 装置 オントロジー クラス 16 インスタンス 64 トリプル 約400 動画 67本 図 128個 作業A 作業B 作業C 判断 A 作業D ワークフロー ドメイン オントロジー 作業に関連する 用語の意味 作業A ルールB ルールC 理由 理由 理由 ゴールツリー if (?LED点灯状態?電圧) then (?基板A交換) if (?センサ反応?電圧) then (?電源交換) ルールベース if A then B マルチメディア 2018/6/26 LODチャレンジ2017マルチメディア ドメイン オントロジー 作業に関連する 用語の意味 作業A ルールB ルールC 理由 理由 理由 ゴールツリー if (?LED点灯状態?電圧) then (?基板A交換) if (?センサ反応?電圧) then (?電源交換) ルールベース if A then B
ワークフロー
26 作業者 熟練者 マニュアル ・ヒアリング ・現場体験 ・ドキュメント分析 ディスプレイ ・作業手順 ・業務ルール ・図・動画 ・質問リスト ・選択された 質問の回答 Application 質問応答システム 作業A 作業B 作業C 判断 A 作業D ワークフロー 2018/6/26 LODチャレンジ2017• 点検診断の手順知識であるが、悪構造知識
であり、粗粒度から細粒度に洗練されていく
(2030年インフラ輸出市場3000兆円?)
ワークフローの構築
27 予備品準 備 対応 調査 電源基板 入力電圧測定 出力電圧測定 端子取り外し 電源基板交換 Power_LED確認 処置終了 復旧しない 復旧 リセット ? アラーム残 故障データ インタビュー 予備品見学 現場見学 マニュアル分析 2018/6/26 LODチャレンジ2017ワークフロー例
28 処置開始 車両管理ログ 確認作業 車両検知器本体 交換作業 いいえ はい 「光センサ:異常」の場合 以前に光セン サ系のアラー ムが発生し た? 車両検知器光軸 調整作業 車両検知器外観 作業 車両検知器 レベル確認作業 光センサの状 態は? 「光センサ:正常」の場合 処置終了 路側I/Fの方を疑う 車両検知器動作 確認作業 いいえ はい アラームが消 えた? 車両検知器 本体交換作業 路側I/F集約部車両検 知器ログ収集作業 処置終了 路側I/Fの方を疑う 車両検知器動作 確認作業 いいえ はい アラームが消え た? 車両検知器 リセット作業 レーンを開放し て様子を見る 車両検知器光軸 調整作業 アラームが消え た? はい いいえ 処置終了 車両検知器動作 確認作業 車両検知器光軸 調整作業 路側I/Fの方を疑う 路側I/F集約部 リセット作業 処置終了 路側I/F集約部車両検知 制御基板交換作業 車両検知器動作 確認作業 いいえ はい 処置終了 車両検知器動作 確認作業 いいえ アラームが消え た? アラームが消え た? はい 別の故障を疑う、復旧 に時間を要する ※車両検知器センサ系アラーム 2018/6/26 LODチャレンジ2017作業A 作業B 作業C 判断 A 作業D ワークフロー
ゴールツリーとルールベース
29 マルチメディア ドメイン オントロジー 作業に関連する 用語の意味 作業者 熟練者 マニュアル ・ヒアリング ・現場体験 ・ドキュメント分析 ディスプレイ ・作業手順 ・業務ルール ・図・動画 ・質問リスト ・選択された 質問の回答 Application 質問応答システム 作業A ルールB ルールC 理由 理由 理由 ゴールツリー if (?LED点灯状態?電圧) then (?基板A交換) if (?センサ反応?電圧) then (?電源交換) ルールベース if A then B 2018/6/26 LODチャレンジ2017• 業務ルールベース
• ルールを一つの概念(オントロジー)として表現し、
条件部の段階的詳細化、写真・動画をLODとして追記
• ゴールツリー
– なぜそのルールで判断するのか?ルールの背景に潜む
正当性を多段階に表現する(現場レベルの理由から経営レベ
ルの理由へ展開される)
– 常に考える作業員の養成。
– プロジェクトメンバーからプロマネへの成長期待。
ルールベースとゴールツリーの構築
30 if 電源ランプ:消灯の場合 then 電源電圧を測定する KTS-FA-W:理由 発進制御機に電力がきていないと考え, どこまで電力供給がきているか調べる 必要があるため 発進制御機HMI部内の 電源ランプが消灯 HMI部電源 ランプ.jpg KTS-FA-W:図 KTS-FA-W:条件部詳細 2018/6/26 LODチャレンジ2017作業A 作業B 作業C 判断 A 作業D ワークフロー
ドメインオントロジー
31 マルチメディア 作業A ルールB ルールC 理由 理由 理由 ゴールツリー if (?LED点灯状態?電圧) then (?基板A交換) if (?センサ反応?電圧) then (?電源交換) ルールベース if A then B 作業者 熟練者 マニュアル ・ヒアリング ・現場体験 ・ドキュメント分析 ディスプレイ ・作業手順 ・業務ルール ・図・動画 ・質問リスト ・選択された 質問の回答 Application 質問応答システム ドメイン オントロジー 作業に関連する 用語の意味 2018/6/26 LODチャレンジ2017• 作業者の疑問→ドメインオントロジーのプロパティ
– 作業オントロジーのプロパティ:10種類
– 装置オントロジーのプロパティ:9種類
プロパティ選定
32 この作業で 注意する事は?1.電圧の正常値
2.作業の必要道具
3.注意事項
選択 リスト提示 ドメインオントロジー 作業 電圧 正常値 必要 道具 注意 事項 2018/6/26 LODチャレンジ2017– ワークフロー中の作業関連情報を構造化
– プロパティ数:10種類
作業オントロジー
33 ・動画 ・図 ・関連作業 ・注意事項 ・必要道具 ・正常値 ・対象装置 ・作業理由 ・想定される異常状態 ・作業完了条件プロパティの種類
作業 交換作業 測定作業 電圧測 定作業 絶縁抵 抗測定 作業 発進制御機安定化電源 電圧測定作業 単一 作業 複合 作業 リセット 作業 車線サーバ リセット作業 取り外 し作業 ボタン 押下作業 ブレーカーの保護カ バーを取り外す 開閉ボタンを交互に押す 発進制御機 リセット作業 開閉ボタンを交互に押す バーがなめらかに開閉す る ボタンを押しても開閉動作 しない,バーが途中で止 まってしまう 発進制御機 筺体内HMI部 5回程度正常に開閉動 作を行ったとき 開閉動作.mp4 KTS-FA-W:正常状態 KTS-FA-W:動画 KTS-FA-W:想定される異常状態 KTS-FA-W:対象装置 KTS-FA-W:作業完了条件 2018/6/26 LODチャレンジ2017• 装置オントロジー
– 作業対象装置の情報を構造化
– プロパティ数:9種類
装置オントロジー
34 ・図 ・関連装置 ・装置特徴 ・機能 ・位置 ・LED表示 ・正式名称 ・接続装置 ・構成装置プロパティの種類
装置 単一 装置 全体 装置 変換機 能装置 電源機 能装置 測定機 能装置 発進制御機 車両検知器 発進制御機 安定化電源 発進制御機 ブレーカー 踏み板 KTS-FA-W: 構成装置 車両検知器 ブレーカー 4分割装置 発進制御機上部 直流電圧を交流電圧 に変換する KTS-FA-W:機能 KTS-FA-W:位置 KTS-FA-W:図 安定化電源.jpg 発進制御機 安定化電源 発進制御機 ブレーカー 発進制御機安定化電源 ランプ状態確認作業 KTS-FA-W:関連作業 KTS-FA-W:接続装置 2018/6/26 LODチャレンジ2017• ハンズフリーで操作するため、入力はマイクボタンと
音声のみ。だが、自由に音声で質問すると、周辺の
雑音が影響し、精度が悪くなるため、スマートグラス
に質問リストの提示
351.[作業注意]を確認する(4)
2.[必要道具]を確認する(2)
3.フローに戻る
4.動画に戻る
1.[作業注意]を確認する(4)
2.[必要道具]を確認する(2)
3.[対象装置]を確認する(1)
4.フローに戻る
5.動画に戻る
ETC故障診断アプリ特色(1)
2018/6/26 LODチャレンジ2017• 閲覧回数を記録し、閲覧回数の多い順に、
質問リストを提示する
• 作業閲覧回数から、作業理解困難度を推定
ETC故障診断アプリ特色(2)
36 作業を選んで番号で発話してください 1.車両検知器踏み板状態外観確認作業(4) ↓ 2.車両検知器共通制御部踏み板状態確認作業(2) ↓ 3.車両検知器共通制御部ログ収集作業(2) ↓ 閲覧ログ収集 閲覧回数を記録 1.が分かりにくい? 知識改訂の検討 2018/6/26 LODチャレンジ2017LOS 2
(Linked Open Service)
高速道路立ち寄り支援
システム構成
38RDF作成
既存Linked
Dataとの
リンク作成
RDF
Store
Linked Data
ユーザコンテ
キスト取得
SPARQL
Endpoint
DB格納
観光情報表示
SPARQL
クエリ作成
ユーザの
行動表示
SPARQL
クエリ作成
条件入力
モジュール構成図
39ユーザコンテ
キスト取得
SPARQL
Endpoint
観光情報
表示
SPARQL
クエリ作成
ユーザの
行動表示
SPARQL
クエリ作成
条件入力
RDF作成
既存Linked
Dataとの
リンク作成
RDF
Store
Linked Data
DB格納
Linked Dataの拡張
以下のデータを作成
•クーポンデータ
•観光行動データ
•ユーザ行動データ
共同研究先である静岡大学が作成した
CSVデータを変換
利用するLinked Data
40高速道路
交通規制
観光施設
クーポン
日本語
Wikipedia
オントロジー
ふじのくに
オープン
データ
カタログ
Flickr
観光行動
: : : :gn:nearby
dc:subject
owl:sameAs
owl:sameA
s
owl:sameAs
top:has
FlickrPhoto
top:spot
ldp
:規制情報
ユーザ
行動
owl:sameAs
赤
:作成したデータ
青:
変更したデータ
緑
:既存のデータ
クーポンデータ
41 top:attention foaf:phone http://www.yamaguti.com p.ae.keio.ac.jp/shizuoka/i nstance/coupon#20 053-454-6801 他割引券との併用、 二重割引き不可、現 金払いのみ、1グルー プにつき8名様まで top:content top:max 観覧料 通常料 金から20%引き 8 http://www.yamaguti.comp. ae.keio.ac.jp/tourism/class/ 22202cc3300033701浜松市美術館
owl:sameAs
053-454-6801
http://www.yamaguti.comp. ae.keio.ac.jp/shizuoka/inst ance/coupon_spot#20top:coupon foaf:phone foaf:name
クーポン情報
42 http://www.yamag uti.comp.ae.keio.ac .jp/tourism/class/2 014120909291601 37 http://www.yamaguti.com p.ae.keio.ac.jp/tourism/cl ass/themeF80020000000 はままつフルーツパーク 静岡県浜松市西区 舘山寺町195 137.6825 34.76217 浜松西IC gn:nearby gn:locatedIn foaf:name gr:hasOpeningHoursSpecific ation geo:lon g geo:lat rdf:type top:spot http://www.yamag uti.comp.ae.keio.ac .jp/tourism/class/ 見る イルミネーション 21:00 18:00 gr:Wednesday http://www.yamag uti.comp.ae.keio.ac .jp/tourism/class/2 014120909291601 38 17:30 10:00 http://www.yamag uti.comp.ae.keio.ac .jp/tourism/class/ 食べる フルーツバイキング rdf:type top:spot gr:hasOpeningHoursSpecific ation gr:hasOpeningHoursDayOf Week gr:closes gr:opens gr:opens gr:closes top:actionname top:actionname 高速道路情報