• 検索結果がありません。

<4D F736F F F696E74202D208A778F708FEE95F197AC92CA82F08EC08CBB82B782E98B5A8F E97708B5A8F70816A5F94D196EC8D758E742E >

N/A
N/A
Protected

Academic year: 2021

シェア "<4D F736F F F696E74202D208A778F708FEE95F197AC92CA82F08EC08CBB82B782E98B5A8F E97708B5A8F70816A5F94D196EC8D758E742E >"

Copied!
28
0
0

読み込み中.... (全文を見る)

全文

(1)

講義(5)

「学術情報流通を実現する技術(2)‐応⽤技術」

佛教⼤学図書館 専⾨員

飯野勝則

平成25年度学術情報ウェブサービス担当者研修

2013

年9⽉25⽇ at NII

(2)
(3)

⾝近な例

(4)

CiNii

(NII‐ELS)に

(5)

TSV

(Tab Separated Value)形式

E

データ項⽬をタブによって切り分けたテーブルを連想させるフォーマット

簡単なデータの流通フォーマットとしてCSVと並び古くから利⽤されている

⼈の⽬では判別しにくい部分もある

(6)

タグ形式

K

各⾏の先頭に「タグ」と呼ばれるメタデータ項⽬を判別するための⽬印をいれ、

(7)

NII‐ELS

で採⽤された情報流通⽅式

⼈の⼿を介したプリミティブな学術情報流通の技術

TSV

はCSVとともに⻑い歴史があり、現在でも広く受容

シンプルであるという点にフォーマットとしての価値

(8)

少し⾼度な学術情報流通

(⾃動化の技術)

(9)

CiNii

(NII‐ELS)に

⼤量のデータを登録する(2)

(10)

①OAI‐PMH

(Open Archives Initiative ‐ Protocol for Metadata Harvesting)

Open Archives Initiative

により策定されたメタデータを流

通(交換)させるためのプロトコル(規格)

XML

形式で作成されたメタデータをHTTPプロトコルを⽤

いて流通させる

ウェブスケールディスカバリなどが、⾃動で他のデータ

ベースのメタデータを収集する「ハーベスト」作業の際

などに標準的に⽤いられる

(11)

②API

(Application Programming Interface)

あるソフトウェアが外部のソフトウェアに対して提供す

るインターフェース(接続規格)

データの外部からの呼び出しや、交換といった⽤途で⽤

いられる

特にHTTPプロトコルを⽤いて、ウェブ上で⽤いられる

API

をウェブAPIと呼ぶ

(12)

API

の使⽤例

(デスクトップアプリ⇔データベース)

12

Windows

⽤に作った常駐型アプリケーションの検索窓から「ジャパンナレッジ」を

検索し、結果をオリジナルのブラウザで表⽰させる

API

(13)

③XML

(eXtensible Markup Language)

インターネット上のコンテンツを記述するための「データ記述⾔語」(⇔「プ

ログラミング⾔語」)であり、タグによって各項⽬が「マークアップ」されて

いる「マークアップ⾔語」のひとつ

1998

年にW3C(World Wide Web Consortium)によりXML1.0が策定・勧告され、

その後JIS規格化される。2004年にはXML1.1が策定された

HTML

( HyperText Markup Language )と異なり、タグを独⾃に定義できるという

特徴がある

階層構造や親⼦化などの表現が容易であり、データの表⽰などに利⽤しやすい

「要素」と「属性」の使い⽅によって、同⼀のメタデータであっても、記述⽅

法が変わるという特徴がある。どう使うか判断が難しい

(14)

「属性」と「要素」

14

<?xml version="1.0" ?>

<contacts>

<contact name=“⽥中 ⼀郎“ age=“20” tel=“1234‐45△△" /> <contact name=“⼭⽥ 花⼦” age=“64" tel=“4567‐89△△" /> </contacts> <?xml version="1.0" ?> <contacts> <contact> <name>⽥中 ⼀郎</name> <age>20</age> <tel> 1234‐45△△</tel> </contact> <contact> <name>⼭⽥ 花⼦</name> <tel> 4567‐89△△</tel> <age> 64 </age> </contact> </contacts> <?xml version="1.0" ?> <contacts> <contact age=“20”> <name> ⽥中 ⼀郎</name> <tel> 1234‐45△△</tel> </contact> <contact age=“64”> <name>⼭⽥ 花⼦</name> <tel> 4567‐89△△</tel> </contact> </contacts>

適切か否かの判断を抜きにすれば「属性」「要素」の組み合わせにより、いくつもの記述を

⾏うことができてしまう

実際にはタグや属性など構造を規定する「スキーマ」という定義により、データ流通が円滑

に⾏われるように⼯夫されている

(15)

XML

の使⽤例

(For OAI‐PMH)

⼤学のリポジトリに登録したデータを出⼒し、JAIROをはじめとする外部のデータ

ベースやリポジトリにハーベストしてもらう

(16)

ユーザインタフェース上での

学術情報流通

(17)

ウェブサービス間での連携例

①SummonがAjaxを使って

キーワード候補を表⽰する

②RSSを使って別のウェブサ

イトと連携する

③スクレイピングとJSONと

Ajax

を使って、「佛教⼤学デ

ジタルコレクション」とい

うアーカイブと連携する

④APIとAjaxを使って「佛教

⼤学論⽂⽬録リポジトリ」

という機関リポジトリと連

携する

⑤APIを使って「ジャパンナ

レッジ」と連携する

(18)

①Ajax

(Asynchronous JavaScript and XML)

⾮同期通信により、ウェブページの⼀部のみを更新する

技術

すなわち、ウェブページの再読み込みを⾏わずに、リア

ルタイムでその⼀部を書き換えることができる

JavaScript

のAPIであるXMLHttpRequestを利⽤している

18

(19)

Ajax

の例

(20)

②RSS

XML

をベースに策定された

ウェブサイトの更新内容、要約、⾒出しなどを⾃動的に

配信することを⽬的として使⽤される

フォーマットや互換性などが異なる複数のバージョンが

乱⽴している

(21)

RSS

の例

21

(22)

③スクレイピング

HTML

で作成されたウェブページを対象に、必要な部分

だけ取得・整形して、⾃サイトにおいて利⽤する技術

ウェブAPIがないウェブページなどの情報を取得する際

(23)

④JSON

(JavaScript Object Notation)

XML

と同様の「データ記述⾔語」

XML

よりも⼩さく軽量で、かつJavaScriptへの親和性が⾼

いため、ajaxの普及とともに利⽤が盛んになった

「スキーマ」という概念はもともとはなかったが、JSON

の普及が進んだことから、近年その策定が進んでいる

(24)

XML

とJSON

24

{ "contacts": { "contact": [ { "name": "⽥中 ⼀郎", "age": "20", "tel": "1234‐45△△" }, { "name": "⼭⽥ 花⼦", "age": "64", "tel": "4567‐89△△" } ] } } <?xml version="1.0" ?> <contacts> <contact> <name>⽥中 ⼀郎</name> <age>20</age> <tel> 1234‐45△△</tel> </contact> <contact> <name>⼭⽥ 花⼦</name> <age> 64 </age> <tel> 4567‐89△△</tel> </contact> </contacts> { "contacts": { "contact": [ { "‐name": "⽥中 ⼀郎", "‐age": "20", "‐tel": "1234‐45△△" }, { "‐name": "⼭⽥ 花⼦", "‐age": "64", "‐tel": "4567‐89△△" } ] } } <?xml version="1.0" ?> <contacts>

<contact name=“⽥中 ⼀郎“ age=“20” tel=“1234‐45△△" /> <contact name=“⼭⽥ 花⼦” age=“64" tel=“4567‐89△△" /> </contacts>

JSON

XML

(25)

スクレイピングとJSONの例

25

①アーカイブサイト

「佛教⼤学図書館デジタルコレクション」

②HTMLをJSONとして取得

③JavaScript(JQuery)を

使ってスクレイピング

④ポータルサイトにて、

ajax

を使って表⽰

(26)
(27)

図書館員と情報技術

最新の情報技術は図書館が開発したものではない

最新の情報技術は「学術」のためだけに限定されるもので

はない

学術情報を扱う際に必要とされる技術は閉じたものではな

く、ウェブ世界との密接なつながりのなかにある

図書館員は最新の情報技術を知り、教育や研究のために何

ができるのかを常に考える必要があるのでは?

(28)

ご清聴ありがとうございました

参照

関連したドキュメント

OKASAN SECURITIES CO.,LTD Global Monetary Research

51 OSCE Office for Democratic Institutions and Human Rights, OSCE/ODIHR Election Assessment Mission Final Report on the 4 March 2007 Parliamentary Elections in

投与から間質性肺炎の発症までの期間は、一般的には、免疫反応の関与が

学術関係者だけでなく、ヘリウム供給に関わる企業や 報道関係などの幅広い参加者を交えてヘリウム供給 の現状と今後の方策についての

病理診断名(日本語) 英語表記 形態コ-ド 節外性 NK/T 細胞リンパ腫、鼻型 Extranodal NK/T cell lymphoma, nasal-type 9719/3 腸管症型 T 細胞リンパ腫

消防庁 国⺠保護・防災部

(G1、G2 及び G3)のものを扱い、NENs のうち低分化型神経内分泌腫瘍(神経内分泌癌 ; neuroendocrine carcinoma; NEC(G3)

注:一般品についての機種型名は、その部品が最初に使用された機種型名を示します。