• 検索結果がありません。

SemanticWebの応用展望

N/A
N/A
Protected

Academic year: 2021

シェア "SemanticWebの応用展望"

Copied!
60
0
0

読み込み中.... (全文を見る)

全文

(1)

「用語集オントロジからメタデータ活用へ」

(セマンティックWeb その2)

200

200

4

4

.5.19

.5.19

( (株株))リコーリコー ソフトウェア研究開発本部ソフトウェア研究開発本部 野村 野村 直之直之, , 博士博士((理学理学)) 日本ユニシス 日本ユニシス((株株)) 小林 小林 茂茂

(2)

概要:

概要:

時間: 13:45 -14:30 演題: 「用語集オントロジからメタデータ活用へ」 (セマンティックWeb その2) 発表者:小林茂(ユニシス), 野村 直之(リコー) 概要: 産業応用上、オントロジは、メタデータの構造を必要に応じて適切に定義 する仕組み、ととらえることができる。その最も身近なアプローチとして 我々は、表計算シートの裏側にある計算式相当の項目間定義、外部リソース への参照定義(その"可搬化" の1手法がSemanticWebのオントロジ)を例に、 オントロジが日常的に役立つことを示す。これによりメタデータ活用が進展 し、グローバルな情報流通、知識共有へとつながる道の一端を紹介する。

(3)

XML: Web

XML: Web

関連文書規格のおさらい

関連文書規格のおさらい

{ {過去過去=SGML/HTML, =SGML/HTML, 現在現在=XML/=XML/複合文書複合文書, , 未来未来==SemanticWebSemanticWeb}} XML : メタ言語のSyntax,Morphology

XML: 強力な “共通語” と “方言“を両立。

数値系

(基幹系)

と文書系

(情報系)

を統合。

WebService

http

SemanticWeb

(4)

WSとSW: どう、うまく活用、相互補完?

に加えて、最近、様々な場での議論をきっかけに気づいたのが、

XMLの使命2つのうち、各々がどちら寄りであるか、という点:

WS: 「方言」の追求

SW: 「共通語」の追求

ここらを押さえて、ナレッジ・インフラ提供ベンダは、Web標準を

うまく活用した商品・サービス展開をしていくべきでしょう。

(N.Nomura)

WS = 機能の連携・統合

SW = コンテンツの連携・統合

などと言っていた平和な時代は2003年前半で終わり、 WebServiceの上層規格を中心に標準化団体間の戦国時代に突入!

(5)

WSとSW: W3Cによる「縄張り」模索

WebService

WebService

Architecture Requirements

Architecture Requirements

http://www.w3.org/TR/2002/WD

http://www.w3.org/TR/2002/WD--wsawsa--reqsreqs--2002111420021114

その後、IBM, MSがW3C-WS WGから離脱し 混沌とした状態

AC009 should avoid any unnecessary misalignment with the Semanti

AC009 should avoid any unnecessary misalignment with the Semantic Webc Web

- AR009.2 new Web services technologies, developed by W3C Web Services WGs, should be capable of being mapped to RDF/XML. - AR009.3 all conceptual elements should be addressable directly

via a URI.

- AR009.4 the WSA must not preclude the characterization of a Web Service that attempts to make its semantics clear to an automatic system using technologies such as those adopted as

part of the Semantic Web. (↑SWのアプリ系の意味空間を記述するWSを前 提としちゃ駄目)

- AR009.5 Web service descriptions should be capable of referencing concepts identified by a URI in an ontology, such as W3C OWL.

(6)

雑誌CIOの特集『Webサービスの理想と現実』

1.いま、Webサービスが危ない!? (1)Webサービスは金食い虫? (2)将来性の高さがアダに (3)ロイヤリテイへの大きな不安 (4)ベンダー間の争い (5)OASIS対W3Cー巨人達の代理戦争 (6)標準化団体を迂回せよ (7)渦巻く悲観論 (8)今こそ、CIOの行動のとき RI (1) 2.Webサービスのリスクを恐れるなかれ ∼勝利はリスクの先にある RISK1:Webサービスは安全でない (1)定まらぬセキュリテイ標準 (2)窓口を変えずにセキュリテイを確保 (3)突然の仕様変更に備える SK2:Webサービスはシステムを複雑にする ベンダーへの積極的な働きかけ (2)二束のわらじでリスクを分散 RISK3:ベンダーが市場から何時手を引くか分からない (1)ベンダー選定のポイントは製品と人にあり RISK4:パートナーがどんな技術を導入するか予測がで きない (1)外とどうつなぐのか (2)無視できないミドルウエアの効果 RISK5:全社的なROIを実証できない (1)上層部の支持を勝ち取る為に 囲み記事:1.乱立する標準化団体 ーそれぞれのビジョン (1)OASIS (2)WS-I (3)W3C (4)リバテイアライアナス 囲み記事: 2.WebサービスProj.を成功に導く秘訣 (1)パイロット・プロジェクトを繰り返す (2)基盤となるアーキテクチャーの確立に注力する (3)確定したものなど何もないということを再認識する 近未来に、 SemanticWeb 応用製品が似た 誹りを免れるに

(7)

XML

Consortium

Consortium

SemanticWeb

SemanticWeb

WG

WG

19991999-- Java Consortium XMLJava Consortium XML研究会発足研究会発足

– W3CW3C規格を早期に解釈・予測し、紹介する基盤技術規格を早期に解釈・予測し、紹介する基盤技術WG; WG; BosakBosak氏招聘氏招聘etc.etc.

– XMLXML部会昇格;基盤技術部会昇格;基盤技術WG WG ((複合文書複合文書SWG, XMLSWG, XML--DBDB他他)) 小林茂さん

小林茂さん((個人個人sitesiteで日本初ので日本初のXSLTXSLT→→XMLXML開発者の日で佳作受賞開発者の日で佳作受賞))らと各規格をらと各規格を11枚の枚の 絵にした

絵にした『『図解図解XMLXML』』、、NewsMLNewsMLプロトにより最新規格の日本語要約プロトにより最新規格の日本語要約W3C NewsW3C News 発行、配信。

発行、配信。 “Java WorldJava World””誌内誌内 ““XML WorldXML World””誌に連載を分担執筆。誌に連載を分担執筆。

• • 20012001-- XML ConsortiumXML Consortium発足発足 基盤技術部会基盤技術部会 – – 20012001年度:ナレッジ・文書年度:ナレッジ・文書WGWGででSVGSVG--DOMDOMなどクライアント側の新などクライアント側の新UIUI開拓す開拓す る基盤規格、 る基盤規格、XMLXML--DBDB、、XSLXSL--FOFO、複合文書、、複合文書、KMKM向け応用規格等を議論。向け応用規格等を議論。 ( (大坂さん参加大坂さん参加; ; 半ダースほど論文も発表半ダースほど論文も発表) ) – – WebServiceWebService小委員会発足;小委員会発足; 社命で動く戦略組織社命で動く戦略組織 –

20022002年上期:年上期: SemanticWebSemanticWeb WGWG発足発足::技術士技術士, SE, , SE, 営業営業, , 新聞社新聞社, , 研究者の混成研究者の混成 W3C

W3C基盤基盤WGWGとしての位置付け;としての位置付け; WebServiceWebService以外との以外との KM, EC

KM, EC中心に自由にアプリを議論;中心に自由にアプリを議論;「常識検索」「常識検索」デモ試作;デモ試作;

IDG

IDG ““XML WorldXML World”” Conference Conference ““KM & XMLKM & XML”” にに10301030名来場;名来場;

– 20022002年下期年下期: : モデル研究部会と合併;モデル研究部会と合併; 4WG4WG体制に体制に::

Web

WebサービスサービスWG; WG; セマンティックセマンティックWeb WGWeb WG; XML; XML--DB WG;DB WG;複合コンテンツ複合コンテンツWG;WG; より、足が地に着いたアプリ追求、普及促進活動の一貫として

より、足が地に着いたアプリ追求、普及促進活動の一貫として【【メタデータメタデータ】】に注力に注力;; を着想、試作、発表;

(8)

SemanticWeb

SemanticWeb

WG

WG

で表向き掲げた9テーマ

で表向き掲げた9テーマ

2002.9

2002.9

-

-(a) 常識検索

→試作済

(b) 個別アプリ構築

→各種アイディア放談のみ

(c) 既存ツールの調査

→RSS関係とWebLog;

WebAnnotea@W3Cもやりたいが。。

(d) セマンティックWeb利用Webサイトの調査

(e) 規格調査

(f) メタデータ自動生成

→SigDDと協調して研究会

(g) メタデータ変換

→RSsS/NewsML to Excel

(h) セマンティックWeb用のXML-DB

(i) セマンティックWebとセキュリティ

(9)

2002

2002

年上期

年上期

:

:

様々なアプリのアイディア達 1/9

様々なアプリのアイディア達

・あいまい検索+オントロジ・スイッチイングによる常識検索:

私鉄乗車案内1:「急行」「快速」「特急」「快速急行」..

→小さな ‘認識世界’ をスイッチして便利に。

私鉄乗車案内2: 「こんど」 vs 「次」

→コトバの曖昧さが日常生活で問題となる例

・マーケット情報配信

Web Service

にgood/badの価値判断付け

て提供

(ナイーブな意味での”Semantic Web Service”)

・天気情報にgood/badの価値判断付けて

例: 農家向け:「明日は嬉しいことに雨です」

・観光情報をSemanticWebで付加価値化して提供

個人プロファイル、過去の行動履歴(福岡2回、大阪3回..)

に基づき、 “旅窓”などよりずっと高度に、精密に、パーソナラ

イズド情報を提供。

(10)

2/9

(順不同) 一般の精度向上→ [山名2003]

あいまい検索

+

オントロジ利用の常識検索の続き:

・SemanticWeb活用でGoogleを超える :

例: Naoyuki Nomura では現状、同姓同名、別ペルソ

(e.g.ホルン奏者, DAT-heads)

で大半が検索ノイズが多い。

→検索者の作業コンテクスト

(e.g. DeskTop上のバイリンガル html文書)

から漢字列を推定:

「尚幸」でなく「直之」

ペルソナを特定するRDFを併用して適合率向上。

例: NLP研究者が仕事中に検索している時に、

作曲家「のむちゃんの頁」は欲しくない。見たくもない

はず

・他、メタデータと、現在時刻・場所を照合して絞込み。

・‘常識’の活用:

固定的DB:“最近”; 流動的DB:“好みの曲”

(11)

3/9

(順不同)

・メタデータによる絞り込みをデフォルトで自動実行

5W1H(Boolean), リンク指定 AND 本文内容情報

・メタデータの信頼性チェックを自動実行

RDF のデータはリソースは実在している、という前提だが。。

・高速道路の渋滞情報:

無関係な道路の交通ニュースは聞きたくない;

現在地&目的地 経路候補のみの渋滞情報;

実現方法の検討:

カーナビ内部構造情報の普遍化:

点 と 線

(SVGの<path>要素)

, 距離情報, text情報(caption)

→いずれも双方向で使えるように、どうSemantic Webの

規格で表現するか?

→テンポラリな情報(工事・占有許可/事故/個室トイレ

( (体感精度体感精度)) 適合率向上 適合率向上

(12)

4/9

(順不同)

・組込XML とSemanticWeb

:

−装置の障害情報(log)をSemanticWeb形式で提供できないか?

→ イベントや部品間の関係をRDF[-S]で表現

− 因果関係(現象と原因?) →オントロジ DAML?

− コトバと数値の対応付け:例:計算式も‘リソース’

−原因解析・対処用の事例ベースエンジン(異種DB)へexport

cf 定性推論、パタン学習 →計算式を分離することで装置の開発

工数削減できそう。=SemanticWebのメリット

SemanticWeb

形式の障害ログ解析ツールで計算量低減。

シスコのIPv6ルータみたいな、SemanticWebのRDF

「アドレス変換」

(リソースたぐり寄せ)

をハードウェア化

(13)

5/9

(順不同)

☆SemanticWebは、「機械(同志)が意味を理解する」規

格だから、組込系と相性悪いはずないのだ。(笑)

☆AI, 翻訳支援システム(例:語彙の分類自体が人によっ

て/文脈によって違う)

→今のとんちんかんな訳語

を産出しまくる機械翻訳エンジンをSemanticWebのオ

ントロジで改善?

→ 文脈選択の適合率(精度)向上

→ 誤解防止、誤解の危険性

(隠れた曖昧性)を

指摘。

☆マーケット情報の解釈オントロジ: ファンドマネージャ

がどんなニュース見て、銘柄推奨を決めているか?

「ファンダメンタルズ」,「材料」,「テクニカル」,「過去の履歴・経

(14)

6/9

(順不同)

☆メタデータの共通化によりコンテンツ再利用を促進。

デジカメのメタデータで、現地の天候やイベント情報を

自動検索

→「場ログ」@NII

−赤っぽい文書:類似画像検索,マルチモーダル検索

−画像情報のメタデータ利用検索

− RGB, CMKY とコトバ(主観語)との対応付けをオン

トロジで? cf. MPEG7 画像中の背景と主題

クエリ(検索式)だけの転送による超高圧縮率伝送

hyper-compression

(15)

7/9

(順不同)

−美術館での検索

感性検索

−医療応用: 緑内障の視野狭窄の度合いを、どう

構造表現するか? 色の変換、評価方法によって

かわる。評価基準の統一が嬉しい。

−「音のカタログ」に感性語、個人語

(青春の思い出etc.)

のメタデータを付加

∼こんな気分の時何を聴く?

−静脈、網膜、虹彩、指紋のパタンの表現の統一

−住基ネットをSemanticWebで?(爆笑)

親族関係のRDF-S; 刑務所に入っていると権利関係の

フラグは停止するけど義務関係は残る?

−eJapanのプライバシー保護を技術的に徹底する

ために、SemanticWeb上位層のセキュリティで?

(16)

8/9

(順不同) ☆メタ・データ自動生成 (文書createや受発信時、雛形利用等) 地道なKM(文書管理)、分散拠点で協同開発するためのツール/インフラ など。 仕 様開発、マニュアル開発。 ☆メタ・データ管理用のXML-DB

RDF群をコンパイルした専用インデックスをnativeに備えたDB;

SemanticGrid?? ; テキスト・インデクシング型(○)、RDB(◎)、ODB(△→◎? 不 定形スキーマを多種扱うなら):構造が一定でシンプルなのが良い? cf. データ・グリッド ; XQueryが違う形のXMLで取り出せるように、スキーマ解釈付き入出力? ☆汎用アプリの探索・構築 −創造性指向のKMにSemanticWebがどう使える? −ホワイトカラー、普通のビジネスマン、、CRM、マーケティング、SFA、 、などの既 存企業情報システムをどう強化できるか

単一の「キラー・アプリ」でなく多数の既存アプリ、インフラ全体を再

活性化、強化すべき。

(17)

メタデータの地道な活用

(だけで)

も大いに有望

9/9

• 伝統的な文書管理から発展した知識管理・情報共有 • 商用カタログのリポジトリ標準化 • Webの把握 ・Webのほころびの自動改修 • 情報流通、通信・放送におけるメタデータ流通: EPG • eLearning Contents共有・再利用,配信・管理標準

– eLearning技術標準化 LOM (Learning Object Metadata) MetadataのデータモデルとXML Bindingを規程

コンテンツ自体はアナログも、人のパフォーマンスも指定可

−学習者属性を記述するメタデータLIP (Learner Information Package) 氏名、ID、学習目的、保有資格、学習履歴、スキル、知識、Passwd

• 草の根の情報発信の活用拡大 (P2P)

• 橋田さん: Enterprise Architecture (task ontology; Wf定義; task横断 ontology)にSemanticWebを? 普段からBM変える: オントロジ屋さん support

(18)

2002

2002

年上期

年上期

:

:

「常識検索の夢と

「常識検索の夢と

SemanticWeb

SemanticWeb

「常識を備えた 「常識を備えたSemanticWebSemanticWebのエージェントに検索させるのエージェントに検索させる ∼「若い奴は演歌は聴かない」って知ってる検索エンジンの試作イメージ」 ∼「若い奴は演歌は聴かない」って知ってる検索エンジンの試作イメージ」 2002. 6 XML Consortium Week 2002. 6 XML Consortium Weekよりより 講演者:大泉 講演者:大泉(JIEC), (JIEC), 野村野村((法政大法政大)) 趣旨: 趣旨: 機械間の機械間の ‘理解理解’’ のフレームワーク、のフレームワーク、SemanticWebSemanticWeb にはどんなキラー・アプリが考えられだろうか。 にはどんなキラー・アプリが考えられだろうか。 1つの象徴は1つの象徴は 「エージェント」技術といわれる。ナレッジ 「エージェント」技術といわれる。ナレッジWGWGでは、では、RDFRDF、、DAMLDAML の一部を使って、いわゆる常識知識を複数種類に分け、 の一部を使って、いわゆる常識知識を複数種類に分け、 各々について、自然な構造表現を施し、いろいろな場所に 各々について、自然な構造表現を施し、いろいろな場所に オントロジとして配備し、利用者のプロファイルをもとにオン オントロジとして配備し、利用者のプロファイルをもとにオン トロジを調べ、「音楽をDLしたいんだけど最近流行ってる曲は?」 トロジを調べ、「音楽をDLしたいんだけど最近流行ってる曲は?」 という質問に少量の最適な回答ができるような検討、試作を行ってきた。 という質問に少量の最適な回答ができるような検討、試作を行ってきた。 今回の講演では、「若者」「中年」といった年齢に関する常識と、 今回の講演では、「若者」「中年」といった年齢に関する常識と、 歌の好みに関する常識とを実装した試作システムのデモを行い、 歌の好みに関する常識とを実装した試作システムのデモを行い、 RDF, DAML RDF, DAMLを活かす方策を実感して頂くことを目指す。を活かす方策を実感して頂くことを目指す。

(19)

「常識検索」試作イメージ

「常識を備えたSemanticWebのエージェントに検索させてみる」

『若い奴は演歌は聴かない』って知ってる検索エンジンの試作

イメージ」

http://www.xmlconsortium.org/seminar/w01/prog_4.html 異種の “知識” : 分散管理され、権利関係も異なる:

・「若さ」:年齢層区分の常識知識 → 検索者との相対関係?

・年齢層ごとの好みの音楽ジャンル →有料調査データをWSで

・推薦に際して個人プロファイルや、問い合わせのコンテクスト

(e.g. 異性へのプレゼントの楽曲選び?)

、目的、一緒に揃えるモノ、

サービス

(自作の写真etc.)

などとメタデータを摺り合せ、適合度を

計算。バランスにも配慮。

(20)

「常識検索」デモの主要リソース

インターフェース :search.html オントロジ検索エンジン:rdfsearch.xsl Web検索エンジン :search.xsl 個人情報ファイル :personinfo.xml オントロジ記述ファイル:kensaku.rdf 音楽データファイル:data1(歌、演歌、氷川きよし、きよしのズンドコ節 ) :data2(歌、ポップス、SMAP、freebird、) :data3(歌、演歌、水森かおり 、東尋坊 ) :data4(歌、ポップス、宇多田ヒカル、SAKURAドロップス) :data5(歌、洋楽、マライアキャリー、恋人たちのクリスマス) :data6(歌、童謡、不明、うさぎとかめ ) :data7(歌、童謡、不明 、線路はつづくよどこまでも )

XSLT

e.g. xalan

(21)

構造化類似検索

,常識検索への

SemanticWebの貢献

• スキーマ記述標準化への求心力; 低コスト開発

• スキーマ所在探索

w/ WebService

• スキーマ取得

(Retrieval Agent)

w/ WebService

• スキーマ照合 w/ XQuery, オントロジ

• スキーマ中の必要箇所の絞り込み

• スキーマ構造変換 (意味構造の翻訳)

• 接続技術の標準化 w/ WebServices

(22)

キラー・アプリはやはり検索か

?

「構造化

(structured)類似検索」から常識検索へ

cf. cf.この近所で水曜に空いている歯医者はこの近所で水曜に空いている歯医者は?? ((©©萩野萩野))

「昨年のスダチの生産高が10万トン

以上の県はいくつ?」

ノイズ多いが

少しでも関連

ありそうな文

書が上位から

類似検索

文書DB

直接の回答: 「1」

:

将来のエンジン

情報系

基幹系

スキーマで補完/ 曖昧性解消

NL2XQL

XML-DB

RDB

(23)

2002

2002

年下期

年下期

:

:

RSsS

RSsS

for Controlled Sites

for Controlled Sites

Summarization

Summarization

試作

試作

→→詳細は添付論文およびスライド資料詳細は添付論文およびスライド資料 RSS RSSがあまり普及しない。があまり普及しない。 →→手作業で連動させるのが非現実的だからでは?手作業で連動させるのが非現実的だからでは? “ “自動要約自動要約”” 研究も曲がり角。研究も曲がり角。→→著者、編者、読者の3者がワガママに恣意的に著者、編者、読者の3者がワガママに恣意的に サマライズしたい/して欲しいのを叶える手段が無い! サマライズしたい/して欲しいのを叶える手段が無い! RSsS

RSsS: : ““Controlled Sites SummaryControlled Sites Summary””生成生成 ↓↓cf. RSScf. RSSは外付けは外付け by RDF

by RDFををClassClass属性に埋め込んで、属性に埋め込んで、<body><body>要素内部に抽出箇所指定!要素内部に抽出箇所指定!

SVG z XHTML,イメージ,SVG z 1つのXHTMLに6個の話題 (6省分) 今週の官庁 経済産業省 外務省 環境省 国土交通省

(24)

RSsS

RSsS

:

:

Controlled Sites Summary

Controlled Sites Summary

生成のため

生成のため

<

<

xhtml

xhtml

> <body>

> <body>

にメタデータ埋め込み

にメタデータ埋め込み

XHTML

XHTML

の文法

の文法

(

(

スキーマ

スキーマ

)

)

の中では

の中では

class

class

タグを利用する方法を採用;

タグを利用する方法を採用;

SVG

SVG

も同様

も同様

簡便な規則を設定

簡便な規則を設定

<div class="meta__item"> </div> <a name="1" />

<span class="meta__item__xxxx"> </span>

<div class="meta__item__yyyyy">

</div> meta__item属

性のあるブロッ ク内でメタデー

(25)

Sample codes

Sample codes

<div class="meta__item">

<a name="1" />

<font size="4"><b>1 <span class="meta__item__Title">抗菌加工製品の・・・ </span></b></font><br />

<img src="images/koukinkakourei.gif" border="0" align="right" hspace="5" width="200"/>

<span class="meta__item__Creator">経済産業省</span>

<font size="4">【<span class="meta__item__Subject">経済産業省報道発表

</span>】</font><br /><br /> ◆本件の概要: <span class="meta__item__Description">経済産業省では、・・・ ・・・・・・・ </div> • 要素内容は無いので表示 には無関係。 • head,bodyどちらにも入れ られる。外部でもよい <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:dc="http://purl.org/dc/elements/1.1/" > <rdf:Description about="http://www.xmlconsortium.org/xml-day-2003-03-04#1" dc:title="抗菌加工製品のガイドラインのフォローアップ結果について" dc:subject="経済産業省報道発表" dc:description="経済産業省では、抗菌加工製品のガイドラインのフォ dc:publisher="SemanticWeb WG" dc:creator="経済産業省" dc:date="2003-02-24" dc:format="text/xhtml" dc:language="ja" > </rdf:Description>

(26)

メタデータから

メタデータから

RSS

RSS

を生成

を生成

• • スタイルシートスタイルシート(XSLT)(XSLT)で試行するで試行する ・・44種類の「今週の官庁」に対し検討種類の「今週の官庁」に対し検討 • • オリジナルページオリジナルページ •

<title><title>今週の官庁今週の官庁/2003/2003--0202--24</title>24</title>

<div style="font<div style="font--size:20pt; textsize:20pt; text--align:center;">align:center;">○○今週の官庁今週の官庁 (2003(2003--0202- -24)</div>

24)</div>

• ヘッダ部のヘッダ部のmetametaタグからの抽出タグからの抽出

<title><title>今週の官庁今週の官庁/2003/2003--0202--24</title>24</title>

<meta name="DC.Creator" content="<meta name="DC.Creator" content="経済産業省経済産業省"/>"/>

• ボディ部のボディ部のclassclass属性からの抽出属性からの抽出

<div class="<div class="meta__itemmeta__item">">

<a name="6" /><a name="6" />

<font size="4"><b>6<font size="4"><b>6 <span class="<span class="meta__item__Titlemeta__item__Title">">[図説][図説] 財政財政 の現状と・・・・・

の現状と・・・・・

RDFRDF記述からの抽出記述からの抽出

<<rdfrdf:Description about="http://www.xmlconsortium.org/xml:Description about="http://www.xmlconsortium.org/xml--dayday--20032003- -03

03--04#1"04#1"

(27)

meta

meta

タグから

タグから

RSS

RSS

を生成

を生成

<xsl:for-each select="head/meta"> <xsl:for-each select="@name='dc:*' "> ・・・・・・・・・・ <xsl:when test="name()='DC.Creator' "> <dc:creator> <xsl:value-of select="@content“/> </dc:creator> </xsl:when> ・・・・・・・・・・ </xsl:for-each> </xsl:for-each>

class

class

属性

属性

(

(

meta__item

meta__item

)

)

から

から

<xsl:for-each select="//*[@class='meta__item']"> <xsl:choose> <xsl:when test="a[@name]"> <rdf:li rdf:resource="{$default-uri}#{a/@name}"/> </xsl:when> </xsl:choose> </xsl:for-each> <rss:items> <rdf:Seq> ・・・・・ <rdf:li rdf:resource="今週の官庁-2.xml.htm#1" /> ・・・・・ </rdf:Seq> </rss:items> <dc:creator>経済産業省</dc:creator> RDF RDFデータからデータからRSSRSSを生成を生成 <xsl:for-each select="rdf:RDF"> <xsl:for-each select="rdf:RDF/rdf:Description/@dc:*"> ・・・・・・・・・・ <xsl:when test="local-name()='title' "> <dc:title><xsl:value-of select="."/></dc:title> </xsl:when> RS RSssSSからデータベースにからデータベースに EXCEL VBA EXCEL VBAでの利用での利用

(28)

RSS応用の1つ:Webログ(ブログ)

∼一番普及しているSemanticWeb関連アプリ?

• サーバで時系列にログを書き込むことを起源

• インターネット上でWebを利用したコミュニケー

ション,コラボレーション,情報配信,情報収集

などを行う仕組み

• Userland社(創業者:Dave Winer)を中心に開発

• サーバ側で提供するRSSを活用。情報発信,他

サイト情報の取り込み機能を持つツールを利用

(29)

Webログの仕組み

RSS HTML HTML HTML RSS feed HTML HTML HTML XML HTML HTML HTML RSSリーダ Web ブラウザ

RSSリーダ

サーバ上 クライアントPC Webサイト www.w3.org/Graphics/SVG/

(30)

SemanticWeb

SemanticWeb

Day

Day

in XML Consortium Week, 2003.5.27 Tue.

「SemanticWebの概要と応用展望」 法政大学 野村直之 概要: 次世代Webの基本アーキテクチャSemanticWebが昨年来急速に注目を集めている。「機能の連携」を 担うWebServicesと相補的に、SemanticWebは「コンテンツの連携;リポジトリ」を担う。講演では、 SemanticWebの全体像から「常識検索」「ノイズレス検索」やEAI、KM、複合情報提供(エージェント)等、 有望なアプリケーションのイメージを紹介するとともに、新ビジネスモデルの可能性や、今後の課題につ いてお話しいたします。 「メタデータ利用の効果 ∼メタデータ標準の活用事例 ∼メタデータ自動抽出の要素技術はどこまでいけてるか?」 ジャストシステム 川崎洋治 概要: メタデータは、コンテンツ管理の基盤技術であり、情報流通を大きく促進すると考えられます。伝統的な図書館の10進分 類、Dublin Core、MPEG7、SemanticWebのリソース管理の標準規格からオントロジ、Webサービスの各種プロセス記述 まで、多彩な分野で注目されています。本講演では、既存の様々なメタデータ標準をどう評価し、取捨選択してアプリに適 用すべきかの活用事例、ならびに、メタデータ普及の鍵を握る「既存コンテンツからのメタデータ自動抽出」の要素技術の 現状と展望についてお話しいたします。 「XHTML, SVGにRDFを埋め込んでWebサマリー生成コントロール (RSsS)」

日本ユニシス 小林 茂 cf. 5/23 Fri. IPSJ Sig-DD@BusinessShow 概要: セマンティックWebで最も基本的かつ重要な概念であるメタデータとその応用に焦点を当て,XHTMLに埋め込んだメタ データからRSS標準に準拠したSite Summaryを自動抽出する方法を紹介いたします。これは、コンテンツ主導の情報統 合という流れに沿って、XML文書スタイル関係の属性をオブジェクト指向的に統一管理し、著者や編集者の意図を反映し たサマリーやデータベース・レコードへの情報抽出の処理内容をSemanticWebのメタデータ標準で統一的に記述する試 みであります。

(31)

メタデータと情報流通 Mar-28 FI&DD研

‘特集’

@IPSJ会議室

“ メタデータはコンテンツ管理の基盤的な技術標準であり、情報流通一般の発展を促すと考えられ る。メタデータは、伝統的な図書館の10進分類、ISO等による専門用語の分類、電子図書館 研究コミュニティの産み出したDublin Core、セマンティック・ウェブにおけるリソース管理の標 準規格から、オントロジ、Webサービスの各種プロセス記述まで、多彩な分野で注目を集めて いる。また、今後、メタデータを活用したコンテンツの分類、体系化が進むことにより、肌理の 細かい、高度な情報流通が実現するものと期待される。セマンティック・ウェブに代表される次 世代Webにおいて、メタデータの整備により、現状よりも「かしこい」検索・配信が実現すること も期待されている。・・・ メタデータを知識社会の基本的なインフラとしたときの情報流通のあり方を考 え、予測するのも、重要な課題である。メタデータは情報の流通においてノ イズを抑止し(適合率の向上)、むだな計算量・試行回数の低減、ひいては ネット帯域幅の有効活用に貢献するはずである。また、情報内容に対する 視点や、利用目的、所属などの属性がメタデータで明示されることにより、 異種のコンテンツを安心して混在させ、流通できるようになる、とも期待され る。 このような情報流通には、コンテンツの構成要素ごとに細やかに設定し制御で きるセキュリティも重要である。“

(32)

メタデータとコンテンツ

(本文内容)

間の自動連携

のニーズと利点

(33)

KM: 知識運用

[=知識を使って情報創造・解釈・

加工]

の質の向上にメタデータは不可欠

[野村2003]

のメタファ:

文書メタデータ

→ アプリにとってはパケットのヘッダのようなもの

類似検索だけでは絞込み精度

(適合率)

低いので

・コンテンツの構造化

(by modular xMLs)

・メタデータ介してマルチモーダル連携

・メタデータと本文の間の連携、融通

(34)

アプリ設計時に何が本来「メタ」

アプリ設計時に何が本来「メタ」

かを

かを

判断するのは案外難しい

判断するのは案外難しい

eDealML

eDealML

[[野村野村2002]2002]

の4W3H

の4W3H

:

:

モノ、サービス実体に付属させればメタデータモノ、サービス実体に付属させればメタデータ

WHAT =

WHAT =

商品

商品

((モノモノ))

、サービス自体の属性

、サービス自体の属性

((色色,,形形,,大きさ大きさ....))

WHO =

WHO =

取引相手の属性

取引相手の属性

((様々な与信様々な与信))

WHEN =

WHEN =

注文日時

注文日時

WHERE =

WHERE =

商品配送、サービス実現の場所

商品配送、サービス実現の場所

HOW

HOW

=

=

取引手法

取引手法

((市場・マッチング手法・課金手法・決済手段の指定等市場・マッチング手法・課金手法・決済手段の指定等))

HOW MUCH =

HOW MUCH =

価格

価格

HOW LONG =

HOW LONG =

納期

納期

■各項が下位構造をもつ

■注文は2種類:売 or 買

(35)

5W1H

5W1H

だからといってメタデータとは限らない

だからといってメタデータとは限らない

「取引相手」

「取引相手」

WHOWHO

の品質(

の品質(

5W1H

5W1H

の下部属性)

の下部属性)

• • 格付け機関の信頼性のグレード格付け機関の信頼性のグレード(格付け機関名の集合(格付け機関名の集合etc.etc.)) • • 財政状況?財政状況? 債務超過?債務超過? 連続赤字?連続赤字? キャッシュフロー?メインバンク?キャッシュフロー?メインバンク? • • 過去の自分/過去の自分/eMPeMPとの取引履歴との取引履歴(全部満足だったか)(全部満足だったか)

必要なだけ木構造を深くして説明能力追加

必要なだけ木構造を深くして説明能力追加

例:格付け者格付け者の格付け・・・例:格付け者格付け者の格付け・・・

物流にも品質

物流にも品質

WHERE, HOW LONGWHERE, HOW LONG 物流の主属性: 物流の主属性: availability, availability, 納期納期, , 料金料金 物流の品質 物流の品質((下位属性下位属性)):: • •確実につくか(保証性)確実につくか(保証性) • •品物が無事か(安全性)品物が無事か(安全性) • •確実につかない場合の対処(補償のグレード)確実につかない場合の対処(補償のグレード) • •時期が確定(幅がせまいのがよい)時期が確定(幅がせまいのがよい)

(36)

「用語集オントロジー」

「用語集オントロジー」

SemanticWeb

SemanticWeb

はどう使ったら役立ちそうか?

はどう使ったら役立ちそうか?

SemanticWeb自身の用語集を題材にした用語集オントロジ

・オントロジの構築&利用イメージを身近な題材で具

体化し,次世代Webの姿をもっと分かりやすく。

・セマンティックWebによる情報[構造]の付加が利益

を内在しているかをもっと具体的に考えましょう!

(37)

なぜ「用語集オントロジー」か?

なぜ「用語集オントロジー」か?

昨年までの常識検索、

昨年までの常識検索、

RSsS

RSsS

,

,

各種アイディア・考察など

各種アイディア・考察など

(以下の「補足(おさらい):」参照)

は、実は皆、新しいアプリ、御

は、実は皆、新しいアプリ、御

利益で有り過ぎた。(足が地に着いていなかったかも)

利益で有り過ぎた。(足が地に着いていなかったかも)

潜在していた課題:

潜在していた課題:

・セマンティックWebのうま味が未だ出ていない。

・オントロジの構成は正しいか。より上手く使うた

めには何を加味すればよいか。

・アプリケーションを具体化したい(複数の用語集

からの効果的な利用等)。 →身近な、現実の問

題発見・解決を踏まえて新しい御利益を。

(38)

表にまとめた「用語集」の背後にある知識

表にまとめた「用語集」の背後にある知識

• 辞書、事典の「凡例」頁(読み方、理解の仕方、使い

方)に込められた知識

– 理解や利用のために使っている知識 を明示化

– 単なるオブジェクト指向設計ではない

– 本当に動く(機械が理解する)設計を目指す

• これをSemanticWebで機械理解可能にしたい

• 図表は非常に曖昧

– ヒトもわかった気になっていても実はわかってないことが多

い; 異種情報の混在や誤解も多い;

(39)
(40)
(41)

最初のStep: 技術用語集の作成

• XMLテクノロジ部会で

WGごとに用語集を作

– ASCII24,INTAP等の用 語集と共存し、利用者 が混乱なく使えるように

• 用語集を作る過程で,

メタデータ,オントロジ

を考える

• 各WGで作る用語集の

形式を出来れば統一し

たい

(42)

用語集の構造化

∼オブジェクト指向的設計

用語集 カテゴリ 関連する用語 詳細情報へのポインタ 最新バージョン/ステータス 日本語名/略称 英語名 提案/開発/作成者 解説文章 用語 カテゴリ 関連用語 詳細情報リンク バージョン 日本語名 英語名 提案者 用語 日本語略称 英語略称 開発者 作成者 ステータス キーワード 参照リンク テーマ 解説文章(素人) 解説文章(一般) 解説文章(玄人) 解説文章(悪魔)

(43)

検討事項

• カテゴリに関する語彙 – セマンティックWeb メタデータ,オントロジ,エージェント – Webサービス HTTP,SOAP,WSDL,UDDI – 複合コンテンツ XHTML,SVG,XSL-FO – データベース XML-DB,Xquery,XPath

– セキュリティ WS-Security,XML Signature,XML Encryption

• 聴衆による見え方の差 <dc:audience> に応じて説明を切 り替えるべし! – 例:オントロジ • セマンティックWeb研究者には • 哲学者には – 例:タクソノミ • 哲学者には • XBRL利用者には,語彙定義(分 • 開発者に関する語彙 – W3C – INTAP – OASIS – XMLコンソーシアムXMLテクノロジ部会 – セマンティックWeb WG

(44)

用語集のイメージ(1)

OWL DTD, XML ・・・・・ Schema 関連用語 解説文章 セマンティッ クWeb ・・・・ sem-wg ontorogy オントロジ セマンティッ クWeb ・・・・・・・・ sem-wg metadata メタデータ 基盤技術 ・・・・・・・・ ・・・・・ ・・・・・・・・ sem-wg schema スキーマ カテゴリ 作成者 英語名 日本語名 用語に関する メタデータの項目 用語 用語

(45)

用語集のイメージ(2)

RDF 関連する 用語 その他 ・・・・ RSS-DEV RDF Site Summary RSS その他 ・・・・・・・ ・・・・・・ Netscape Rich Site Summary RSS 基盤技術 ・・・・・・・ ・・・・・・・ ・・・・・・・ W3C Extensible Markup Language XML カテゴリ 解説 提案者 フル スペル 略称 略語に関する メタデータの項目 略語 略語

(46)

用語集のイメージ(統合)

基盤技術 ・・・・・・・・・ ・・・・・・・・・ ・・・ W3C Extensible Markup Language XML 基盤技術 ・・・・・・・・・ ・・・・・・・・・ ・・・ sem-wg schema スキーマ セマン ティック Web DTD, XML Schema ・・・・・・・・・ ・・・・ sem-wg metadata メタデータ セマン ティック Web OWL ・・・・ sem-wg ontorogy オントロジ RDF 関連する 用語 その他 ・・・・ RSS-DEV RDF Site Summary RSS その他 ・・・・・・・・・ ・・・・ Netscape Rich Site Summary RSS カテゴリ 解説文章 提案/開発/ 作成者 英語名 日本語名/ 略称 用語/略語 に関するメタ データの項目 略語 用語 用語 略語

(47)

用語集のイメージ(統合)

基盤技術 ・・・・・・・・・・ ・・・・・・・・・・ ・ W3C Extensible Markup Language XML 基盤技術 ・・・・・・・・・・ ・・・・・・・・・・ ・ sem-wg schema スキーマ RDF 関連す る用語 その他 ・・・・ RSS-DEV RDF Site Summary RSS その他 ・・・・・・・・・・ ・・・ Netscape Rich Site Summary RSS カテゴリ 解説文章 提案/開発/ 作成者 英語名 日本語名/ 略称 用語又は略語 用語又は略語 のプロパティ 用語又は略語 に関するメタ データの項目

(48)

プロパティの定義

カテゴリ 関連する 用語 解説文 章 提案/開発 /作成者 英語名 日本語名/ 略称

用語又は略語

のプロパティ 文字列 用語 英語名 titleEn カテゴリ 関連する用語 解説文章 作成者 開発者 提案者 フルスペル 略称 日本語名 ラベル 文字列 用語又は略語 category 用語又は略語 用語又は略語 relatedTerm 文字列 用語又は略語 createdBy 文字列 用語又は略語 developpedBy 文字列 用語又は略語 proposedBy 文字列 略語 fullSpell 文字列 略語 abbreviation 文字列 用語 titleJa レンジ ドメイン プロパティ名 解説文章

コンテンツとして作成

(49)

用語集XMLとメタデータのイメージ

用語集XML : http://www.xmlconsortium.org/wg-tech-semweb/term.xml

<用語集>

<用語 ID="IDxx" titleJa="スキーマ" titleEn="schema" ・・・・・ プロパティn="値n" > <!-- ・・・・・ 用語xxに関する解説文章 ・・・・・-->

</用語>

<!-- ・・・・・ 用語又は略語の繰り返し ・・・・・-->

<略語 ID="IDyy" abbrevString="RDF"

fullSpell="Resource Description Framework" ・・・・・ プロパティn="値n" > <!-- ・・・・・ 略語yyに関する解説文章 ・・・・・-->

</略語>

<!-- ・・・・・ 用語又は略語の繰り返し ・・・・・-->

(50)

用語集メタデータ:RDFによる記述

用語集メタデータ:RDFによる記述 <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:sw="http://www.xmlconsortium.org/wg-tech-semweb/term" >

<sw:term rdf:about="http://www.xmlconsortium.org/wg-tech-semweb/term.xml#IDxx" > <sw:titleJa>スキーマ</sw:titleJa>

<sw:titleEn>schema</sw:titleEn>

<!-- ・・・・・ プロパティの繰り返し ・・・・・--> </sw:term>

<!-- ・・・・・ term又はabbreviation要素の繰り返し ・・・・・-->

<sw:abbreviation rdf:about="http://www.xmlconsortium.org/wg-tech-semweb/term.xml#IDxx" >

<sw:abbrevString>RDF</sw:abbrevString>

<sw:fullSpell>Resource Description Framework</sw:fullSpell> <!-- ・・・・・ プロパティの繰り返し ・・・・・-->

</sw:abbreviation>

<!-- ・・・・・ Term又はAbbreviation要素の繰り返し ・・・・・--> </rdf:RDF>

(51)

用語RDFスキーマの記述

用語集のRDFスキーマ記述例

<rdf:RDF xmlns:rdf="&rdf;" xmlns:rdfs="&rdfs;" xml:base="&sw;" > <rdfs:Class rdf:ID="techTerm"/>

<rdfs:Class rdf:ID="term">

<rdfs:subClassOf rdf:resource="#techTerm"/>

</rdfs:Class>

<rdfs:Class rdf:ID="abbreviation">

<rdfs:subClassOf rdf:resource="#techTerm"/>

</rdfs:Class>

<rdf:Property rdf:ID="titleJa">

<rdfs:domain rdf:resource="#techTerm"/> <rdfs:range rdf:resource="&xsd;string"/> <rdfs:comment>日本語の題名</rdfs:comment> <rdfs:label>日本語名</rdfs:label> </rdf:Property> <!-- ・・・・・ クラス定義,プロパティ定義 他の繰り返し ・・・・・--> プロパティの定義

(52)

OWL の構造

ヘッダ情報 バージョン,インポート等 クラス定義 プロパティ定義 インディビデュアル定義 インスタンス情報 owl:ObjectProperty owl:DatatypeProperty owl:Ontology rdf:RDF owl:Class 順序は自由

(53)

OWLによる用語スキーマの記述(1)

用語オントロジ : OWL記述 <!DOCTYPE rdf:RDF [

<!ENTITY tm "http://www.xmlconsortium.org/bukai/xml-tech/semWeb/techTerm#" > <!ENTITY owl "http://www.w3.org/2002/07/owl#" >

<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#" > ]> <rdf:RDF xmlns = "&tm;" xml:base = "&tm;" xmlns:owl = "http://www.w3.org/2002/07/owl#" xmlns:rdf = "http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs= "http://www.w3.org/2000/01/rdf-schema#" xmlns:xsd = "&xsd;" > <owl:Ontology rdf:about=""> <owl:versionInfo>xmlTechTermOntology-2004-05-19</owl:versionInfo> <dc:creator>小林 茂</dc:creator> </owl:Ontology> <!-- ・・・・・ クラス定義,プロパティ定義 他の繰り返し ・・・・・--> オントロジヘッダ挿入

(54)

OWLによる用語スキーマの記述(2)

用語オントロジ : OWL記述

<rdf:RDF ・・・・中略・・・・・・ >

<!-- ヘッダ部 省略 -->

<owl:Class rdf:ID="techTerm"/> <owl:Class rdf:ID="term"> <rdfs:subClassOf rdf:resource="#techTerm"/> </owl:Class> <owl:Class rdf:ID="abbreviation"> <rdfs:subClassOf rdf:resource="#techTerm"/> </owl:Class>

<owl:DatatypeProperty rdf:ID="titleJa"> <rdfs:domain rdf:resource="#techTerm"/> <rdfs:range rdf:resource="&xsd;string"/> <rdfs:comment>日本語の題名</rdfs:comment> <rdfs:label>日本語名</rdfs:label> </owl:DatatypeProperty> <!-- ・・・・・ クラス定義,プロパティ定義 他の繰り返し ・・・・・--> クラス定義 rdfs:Class→owl:Class rdfs:Property → owl:DatatypeProperty プロパティ定義

(55)

OWLによる関連情報の付加

<owl:DatatypeProperty rdf:ID="titleJa">

<rdfs:domain rdf:resource="#techTerm"/>

<rdfs:range rdf:resource="&xsd;string"/>

<rdfs:comment>日本語の題名</rdfs:comment>

<rdfs:label>日本語名</rdfs:label>

<owl:equivalentProperty rdf:resource="&dc;title"/>

</owl:DatatypeProperty>

owl:equivalentProperty 利用により dc:title を引用

(56)

OWLによる関連情報の付加

<!-- 聴衆 -->

<owl:ObjectProperty rdf:ID="audience"> <rdfs:domain rdf:resource="#techTerm"/> <rdfs:range rdf:resource="#audienceLevel"/>

<owl:equivalentProperty rdf:resource="&dcterms;audience"/>

</owl:ObjectProperty>

<owl:Class rdf:ID="audienceLevel"> <owl:oneOf rdf:parseType="Collection">

<owl:Thing rdf:about="#primary" /> <owl:Thing rdf:about="#advanced" /> </owl:oneOf>

</owl:Class>

<termCategory rdf:ID="primary">

<rdfs:label xml:lang="ja">初級</rdfs:label>

<rdfs:label xml:lang="en">Primary Level</rdfs:label> </termCategory>

<termCategory rdf:ID="advanced">

<rdfs:label xml:lang="ja">上級</rdfs:label>

<rdfs:label xml:lang="en">Advanced Level</rdfs:label>

dcterms:audeience を引用

プロパティの定義

プロパティ値のクラス定義

インスタンス定義

(57)

OWLによるプロパティタイプの付加

<!-- 関連する用語 -->

<owl:no rdf:ID="relatedTerm">

<rdf:type rdf:resource="&owl;SymmetricProperty" />

<rdfs:domain rdf:resource="#techTerm"/>

<rdfs:range rdf:resource="#techTerm"/>

<rdfs:label xml:lang="ja">関連する用語</rdfs:label>

<rdfs:label xml:lang="en">Related Term</rdfs:label>

</owl:ObjectProperty>

対称属性の付加。 対称性を持った関係

(58)

EXCEL中にメタデータを指示

色により用語/ 略語を区別 区切り用の文字 列を挿入し属性 を付加

(59)

用語集XMLの例

タイトル行から抽 出 区切り用の文字 列を挿入し属性 を付加 略語 用語

(60)

“用語集オントロジー”

今後の課題

• セマンティックWeb活用のうま味が未だ出ていない

• オントロジの構成は正しいか。より上手く使うために

は何を加味すればよいか

• 活用アプリケーションをさらに具体化したい(複数の

用語集からの効果的な利用等)

• まずは,メタデータ,オントロジの準備を今からはじ

めよう

参照

関連したドキュメント

Aの語り手の立場の語りは、状況説明や大まかな進行を語るときに有効に用いられてい

 さて,日本語として定着しつつある「ポスト真実」の原語は,英語の 'post- truth' である。この語が英語で市民権を得ることになったのは,2016年

地蔵の名字、という名称は、明治以前の文献に存在する'が、学術用語と

用 語 本要綱において用いる用語の意味は、次のとおりとする。 (1)レーザー(LASER:Light Amplification by Stimulated Emission of Radiation)

平成 28 年度は発行回数を年3回(9 月、12 月、3

 英語の関学の伝統を継承するのが「子どもと英 語」です。初等教育における英語教育に対応でき

フランス語 ドイツ語 中国語 朝鮮語 スペイン語 ロシア語 イタリア語 ポルトガル語 アラビア語 インドネシア語

卒論の 使用言語 選考要件. 志望者への