Subject-centric, Linked and Structured
トピックマップ及びΨ(PSI)
2010年9月9日 株式会社ナレッジ・シナジー 内藤 求 ([email protected]) Ψ http://psi.ontopedia.net/Motomu_Naito目 次
1.トピックマップとは
2.情報/知識の管理方法
3.トピックマップとその関連技術
4.適用分野、適用事例
5.トピックマップ利用のメリット
6.お知らせ、関連サイト
1.トピックマップとは
・ 情報/知識を利用者の概念体系に合わせて分類、整
理、構造化、体系化するための情報技術
・ サイバースペースにおける高度に構造化された索引
・ 知的活動をこれまでよりも人に優しく支援することを
目指す
・ ISOの標準
- 1990年代の初期に、XMLの基となったSGMLの作
成者を中心に構想された
- 以下の規格群からなる
データモデル、構文、問合せ言語、制約言語、
その他
トピックマップによる情報/知識の組織化
現在
膨大な情報が孤立して存在している主題
主題
主題
主題、
、
、
、主題間
主題間
主題間
主題間の
の
の
の関係
関係に
関係
関係
に
に合
に
合
合わせて
合
わせて
わせて
わせて
情報
情報
情報
情報を
を
を体系化
を
体系化
体系化
体系化、
、
、
、組織化
組織化
組織化
組織化
トピックマップ トピックマップ トピックマップ トピックマップははは、は、、情報実体、情報実体情報実体から情報実体からから独立から独立独立独立 それ それ それ それ自体自体自体自体ががが共有が共有共有、共有、交換、、交換交換交換、、、流通可能、流通可能流通可能流通可能 トピックマップ トピックマップ トピックマップ トピックマップ2.情報/知識の管理方法
(1) メタデータ (文書中心)
情報オブジェクトについてのデータ
(2) 主題に基づく分類方法 (主題中心)
他の主題との関係で主題を位置づけ
・ Taxonomies (タクソノミ)
・ Thesauri (シソーラス)
・ Faceted classification (ファセット分類法)
・ Topic Maps (トピックマップ)
・ cf: Ontology (オントロジ)
2.1 メタデータ
・ データについてのデータ
・ 文書やWebページなどの情報リソース(オブジェクト)
についてのデータ
・ 情報リソースの管理に有効、
・ “ほぼこんな主題” のものを見つけたい場合の効果は限定的
・ 例:Dublin Core
Title Creator Subject Description Publisher
Contributor Date Type Format Identifier
Source Language Relation Coverage Rights
(出展: 以下2章は、Metadata? Thesauri? Taxonomies? Topic Maps! : Making sense of it all,
2.2 主題に基づく分類法
(1) Taxonomies (タクソノミ)
・ 主題(概念)間の関係は、広義-狭義関係のみ
・ 主題(概念)の階層的な分類
例:
動物界 脊椎動物門 ホ乳網 サル目(霊長目) ウサギ目 ネズミ目 ヒト科 ホモ属 サピエンス 種主題に基づく分類法
(2) Thesauri (シソーラス)
・ 定義された複数の主題(概念)間の関係
- 主題(概念)の階層的な分類
広義語(BT: Broader Term)-狭義語(NT: Narrower Term)
- 関連語(RT: Related Term)
- 反義語(AT: Antonym)
- 同義語(SY: Synonym)
- “を見よ”参照、優先語(USE)
- “を見よ”参照、非優先語(UF: Use For)
- 最上位語(TT: Top Term)
・ 語の意味の説明
- スコープノート(SN: Scope Note)
主題に基づく分類法
(3) Faceted classification (ファセット分類法)
・ 複数の軸によって分類
(Ranganathan は、personality, matter, energy, space,
time の5つのファセットを提案)
例:本のタイトル “昭和中期の日本の田舎の家”
- personality(最重要ファセット、事物): 建築
- matter(物質、部分や性質): 木材
- energy(動作): 設計
- space(空間): 日本の田舎
- time(時代): 昭和中期
9
主題に基づく分類法
(4) Topic Maps (トピックマップ) No.1
・主題(トピック:Topics) と関連(Associations) の集合
・主題に関係する情報リソースへのリンク (出現: Occurrence) を持つ
・規格で定義された2種類の主題間の関係
- supertype-subtype (上位-下位)
- type-instance
に加えて、新しい関係 (関連) を自由に定義可能
・主題を一意に識別する機構を持つ
(名前で識別するのでなく、IRI: Internationalized Resource Identifier
or URI: Uniform Resource Identifier で識別)
・有効範囲 (スコープ:Scope) の指定機能を持つ
・マージ機能を持つ
主題に基づく分類法
(4) Topic Maps (トピックマップ) No.2
動物界 脊椎動物門 ホ乳網 サル目(霊長目) イルカ フリッパー サンディ 人 酸素 大気 陸上 水中 クジラ目 地球系 supertype-subtype supertype-subtype supertype-subtype supertype-subtype supertype-subtype supertype-subtype type-instance type-instance 仲良し 棲む 構成する 住む 包む 含む 取り込む 構成する 構成する 含む 取り込む主題に基づく分類法
(cf.) Ontology (オントロジ)
・ いろいろな定義が存在
・ コンピュータ科学で用いられるOntology
「人間が対象世界をどのように見ているかという根源的な問題
意識をもって物事をその成り立ちから解きあかし、それをコン
ピュータと人間が理解を共有できるように書き記したもの」
・ Ontology の構成物
- Ontology の本質である、対象世界から基本概念を切り出した
結果としての「概念」の集合
- 概念の is-a 関係 (上位・下位関係) による階層化
- is-a 関係以外で必要となる概念間の関係
- 抽出した概念と関係の定義、あるいは意味制約の公理化
(出展: オントロジー工学、溝口理一郎著、ISBN4-274-20017-5 より)3.トピックマップとその関連技術
・ 利用可能なトピックマップ関連技術
(1) Topic Maps
・ 意味的に構造化されたデータ
(2) Published Subjects
・ 任意の主題をグローバルに同定
(3) 分類、体系化された知識 (主題)
(4) Remote Access Protocol
・ ネットワーク上でのfragmentの交換、統合、フィルタリング
(5) Query Language
(1) 本の索引(インデックス)
・ 目次以外に “情報” へのアクセス手段を提供
(2) 多くの本に対して
・ 共通の索引があると便利
索引
索引
索引
索引
ISO ・・・ 本1 70-71, 234-236 本2 45, 120-131 OASIS ・・・ 本1 41-45, 211-228, 308 本2 16-33, 88-90, 267 本3 52-65, 155-158 W3C ・・・ 本1 26, 69, 274-275 : :3.1 トピックマップ
(3) サイバースペースにも適用可能
・ デジタル情報の索引があったら!! → Topic Maps
デジタル
デジタル
デジタル
デジタル情報
情報
情報
情報の
の
の
の索引
索引
索引
索引
ISO ・・・ IRI1, IRI2, OASIS ・・・ IRI3, IRI4,
: :
PSI ・・・ IRIa, IRIb, Topic Maps ・・・ IRIc, IRId, XML ・・・ IRIe, IRIf : 情報空間 情報空間 情報空間 情報空間
15
Let’s look at some TAOs in the Omnigator…
Topic Mapsの基本モデル
• 出現出現出現出現 (Occurrences) – 主題に関連する情報リソースへのリンク • 情報情報情報情報プールプールプールプール – 任意の型、フォーマット、ロケーション information • Knowledge layer をををを構成構成構成する構成するするする: knowledge • トピックトピックトピックトピック(Topics) – 問題領域でのキーとなる主題群を表現 プッチーニ トスカ Lucca 蝶々夫人 • 関連関連関連関連 (Associations) – 主題間の関係を表現 作曲 作曲 作曲 作曲したしたしたした 生 生生 生まれたまれたまれたまれた 作曲 作曲作曲 作曲したしたしたした= The TAO of Topic Maps (トピックマップトピックマップトピックマップトピックマップ道道道道)
– トピック、関連、出現は型を持ち、その型自身ト
ピック
3.2 Published Subjects (公開された主題)
Published Subjects は、トピック (主題) を識別、同定可能にする仕組みで、 ネットワーク上で永続的に公開し、トピックの共有/交換を容易にすることを 目的にしている。 ・ トピックマップ標準に含まれているメカニズム ・ 主題にIRI (URI) を割り当てて、主題識別 (2つの主題を同一とする、 又は、1つの主題をもう一方の主題と区別する) を可能にする ・ コンピュータ、人間の両方に主題識別のメカニズムを提供- Published Subject Identifier (PSI): コンピュータが利用可能な主題識別子 - Published Subject Descriptor (PSD) or Published Subject Indicator :
人が主題の識別に利用可能な主題についての記述
・ コンピュータ内の情報リソース、実世界の対象物の両方に適用可能 ・ 誰でも公開可、いいものが生き残る
主題
主題
主題
主題:
::
:Motomu Naito の
の
の PSI と
の
と
と PSD の
と
の
の
の例
例
例
例
http://psi.ontopedia.net/Motomu_Naito
(所在は、ONTOPEDIA社の PSI Server 上)
PSD
3.3 分類、体系化された知識 (主題)
・ 既に多くのものが存在している 例:
- NDLSH (National Diet Library Subject Headings)
国立国会図書館件名標目表
- NDLC (National Diet Library Classification)
国立国会図書館分類表
- LCSH (Library of Congress Subject Headings)
データ形式: RDF
- UNSPSC (Universal Standard Products and Services Classification)
製品およびサービスの分類体系
データ形式:Topic Map (http://www.techquila.com/tm-samples.html)
- SWEET (Semantic Web for Earth and Environmental Terminology )
地球環境に関するターミノロジ
データ形式:OWL (http://sweet.jpl.nasa.gov/index.html)
- ISO 19115 Geographic information -- Metadata
地理情報、データ形式:PDF ・・・・
3
3
3
3.
.
.4
.
4
4 Remote Access Protocol
4
・ ネットワーク上の他マシンに存在するトピックマップへの
アクセス、フラグメントの交換を可能にするプロトコル
・ 今は、まだ標準がない
・ 標準が必要
・ いくつかの提案、実装がなされている
- TMRAP (Ontopia社)
- TopicMapster (techquila社)
TMRAP
・ TMRAP (Topic Maps Remote Access Protocol) は、
Web サービスインターフェース
・ リモートにあるTopic Maps フラグメントの検索が可能
・ HTTP, SOAP の2種類のプロトコルを利用可能
・ メソッド
- get-topic
- get-topic-page
- get-tolog
- add-fragment
- delete-topic
3.5 Query Language (問合せ言語)
• Topic Maps の問合せ、更新
• ISO 18048: TMQL
– ISO SC34にてCD (Committee Draft)
• 現在 draft の状態
– tolog をベース
– 推論付きのグラフ-マッチング
– path 表現能力
– select 文風の検索式
– Xquery風の出力構築能力(FLWR式)
tolog
• Ontopia社
社
社
社の
の
の
のトピックマップ
トピックマップ問合
トピックマップ
トピックマップ
問合
問合せ
問合
せ
せ
せ言語
言語
言語
言語
– 基本的には、トピックマップに適合させた Datalog
– 6 年以上利用され続けている
– いくつかの商用アプリケーションで利用
– オープンソースである TM4J engine の中でも実装
• 基本的
基本的
基本的
基本的な
な
な特性
な
特性
特性
特性
– グラフマッチング (Datalog 節)
– AND/OR/NOT のサポート
– 推論ルールのサポート
– 集計機能 (SQL 風)
– ソート機能 (SQL 風)
• 拡張予定
拡張予定
拡張予定
拡張予定
– 文字列述語と比較述語
Seamless Knowledge
トピックマップ及び関連技術の組合せにより実現可能
T T T TT 同同じ 同同じ じ PSI じ PSI PSI PSI をを参照をを参照参照参照しているしているしているしているトピックトピックトピックトピック
は はは は、、、同、同同同じじじじ主題主題を主題主題ををを表表表している表しているしているしている Topic Maps or Ontology 参照
Published Subject Indicator
Published Subject Indicator
Topic Maps or Ontology Topic Maps or Ontology 参照 参照 参照 T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T イルカ イルカ イルカ イルカ サンディ サンディ サンディ サンディ 同 同 同
同じ じ じ じ PSI PSI PSI PSI をを参照をを参照参照参照しているしているしているしているトピックトピックトピックトピック は は は は、、、、同同同同じじじじ主題主題を主題主題ををを表表表している表しているしているしている 同 同同 同じじじじ主題主題主題主題をを持をを持持持つつつトピックつトピックはトピックトピックははは、、、、マージマージマージマージされるされるされるされる。。。。
トピックマップ トピックマップ トピックマップ トピックマップ トピックマップ トピックマップトピックマップ トピックマップ PSI Server トピックマップ トピックマップトピックマップ トピックマップ フラグメント フラグメントフラグメント フラグメント交換交換交換交換 フラグメント フラグメントフラグメント フラグメント交換交換交換交換
識別
識別
識別
識別された
された
された
された主題
主題
主題
主題の
の
の
のネットワーキング
ネットワーキング
ネットワーキング
ネットワーキング
( Identified Subjects Networking ) の
の
の提案
の
提案
提案
提案
PSI Server 特化、専門化された半クローズドな Web アプリケーションが
4
4
4
4.
.
.適用分野
.
適用分野
適用分野、
適用分野
、
、適用事例
、
適用事例
適用事例
適用事例
適用分野の例
・ 共通語彙の提供
・ 意味検索
・ 情報/知識の構造化、体系化、組織化
・ 情報/知識管理
・ コンテンツ管理
・ 情報抽出
・ Webポータル
・ 製造管理
・ 情報公開
・ 学習支援
・ その他
適用事例
適用事例
適用事例
適用事例
以下 以下 以下 以下ののののサイトサイトサイトでサイトでで多で多くの多多くのくのくの適用事例適用事例適用事例適用事例をみることができるをみることができるをみることができるをみることができる ・ fuzzzy.com http://www.fuzzzy.com/tag/?id=2238・ Ontopia’s success stories
http://www.ontopia.net/success.jsp
・ トピックマップ適用事例トピックマップ
http://www.garshol.priv.no/tmcase1/
・ AToMS – Asian Topic Maps Summit 2007
http://www.knowledge-synergy.com/news/atoms2007-program.html
・ TMJP – Topic Maps Japan 2010
http://www.knowledge-synergy.com/events/tmjp2010-program.html
・ TOPICMAPS.COMMUNITY
http://www.topicmaps.com/tmc/
・ TMRA (Topic Maps Research and Applicaitons)
学習支援
学習支援
学習支援
学習支援の
の
の
の例
例
例
例
・ Everyday Physics on Web (EPW), 松浦先生, 東京学芸大学
http://tm.u-gakugei.ac.jp:8080/epw/
・ 人文知を再配置する, 東京大学
http://www.knowledge-synergy.com/events/documents/TMJP2010u-tokyo100201.pdf
・ BrainBank Learning, Cerpus社, ノルウェー
http://cmc.ihmc.us/papers/cmc2004-013.pdf
・ Common portal for the University of Bergen, University of Bergen, ノルウェー
http://www.uib.no/en
・ Bridging the Gap between Educational Psychology and Information Sciences
-Topic Maps in Elearning, Concordia University, カナダ
http://www.topicmaps.com/tm2007/venkatesh.pdf
・ Open Educational Topic Maps: A Text-oriented Perspective, University of
Southern Denmark, デンマーク
http://www.informatik.uni-leipzig.de/~tmra/2007/slides/johnsen_TMRA2007.pdf
・ Polyscopic Topic Maps in Flexible E-learning and Collaborative Knowledge
Creation, University of Oslo, ノルウェー
トピックマップアプリケーション
トピックマップアプリケーション
トピックマップアプリケーション
トピックマップアプリケーションの
の
の
のデモ
デモ
デモ
デモ
・ トピックマップ適用事例トピックマップ
・ NDLSH トピックマップ
・ LCSHトピックマップ
・ Lars Marius’s photos トピックマップ
・ その他
5
5
5
5.
.
.トピックマップ利用のメリット
.
・ 概念、意味レベルでの情報操作
・ 情報実体とメタデータの分離
- 情報実体の変更なしに情報の組織化、体系化が可能
- 概念体系のメタレイアでのモデル化が容易
- ディジタルコンテンツの整理、分類、管理に有効
・ 主題を文脈 (Context) とともに管理可能
・ 主題の厳密な識別が可能 → 多義性問題を解決
・ 直観的な馴染みやすさ
・ 標準に準拠
- 情報資源の永続性の確保
- 多様なツール選択、利用が可能
- プラットフォーム、ベンダー等に非依存
・ 情報資源に対する多様な視点の設定および視点間の
ナビゲートが可能
(1) イベント
・ TMRA 2010 (2010.9.29 - 10.1 ドイツ、ライプチヒ)
http://tmra.de/2010/
(2)トピックマップ関連サイト
・ ナレッジ・シナジー (www.knowledge-synergy.com) ・ Ontopia Project (http://code.google.com/p/ontopia/) ・ Ontopia’s Blog (http://ontopia.wordpress.com/)
・ Ontopia社 (http://www.ontopia.net/)
・ ONTOPEDIA’s PSI Server (http://psi.ontopedia.net/) ・ Subj3ct (https://subj3ct.com/)
・ Topic Map Lab (http://www.topicmapslab.de/)
・ Topic Maps case examples (http://www.garshol.priv.no/tmcase1/) ・ Fuzzzy.com (http://www.fuzzzy.com/tag/?id=2238)
・ TOPICMAPS.COMMUNITY (http://www.topicmaps.com/tmc/) ・ Larsblog (www.garshol.priv.no/blog)
・ Lars Marius’s photos (http://www.garshol.priv.no/tmphoto/) ・ SC34 WG3 (www.isotopicmaps.org) ・ TMAPI (www.tmapi.org)
6
6
6
6.
.
.お知らせ、関連サイト No.1
.
(3) Book
・ 本「トピックマップ入門」、東京電機大学出版局、ISBN4-501-54210-1
・ Scaling Topic Maps, Lutz Maicher, Lars Marius Garshol (Eds.), Springer, ISSN
0302-9743, ISBN 978-3-540-70873-5
・ Leveraging the Semantics of Topic Maps, Lutz Maicher, Alexander Sigel, Lars
Marius Garshol (Eds.), Springer, ISSN 0302-9743, ISBN 978-3-540-71944-1
・ Charting the Topic Maps Research and Applications Landscape, Lutz Maicher,
Jack Park (Eds.), Springer, ISSN 0302-9743, ISBN 3-540-32527-1
(4) ツール ・ Ontopia (2010.9.5日 に現在、version5.1.0) http://code.google.com/p/ontopia/ よりダウンロード可能 トピックマップ作成、トピックマップWebアプリケーション開発、運用ツール ・ tmphoto (2009.8.13日 現在、version 0.1 a3 ) 写真のタグ付け、トピックマップ生成、トピックマップWebアプリケーション生成
お知らせ、関連サイト No.2
(5) トピックマップ講習 ・ コース - トピックマップ入門 - トピックマップ作成手順 - トピックマップ作成演習 - トピックマップ生成 DB2TM - トピックマップ問合せ言語 tolog
- トピックマップWebアプリケーション開発 Navigator Framework - トピックマップモデリング