• 検索結果がありません。

統制語彙を利用したSBM用ブラウザ機能の試作

N/A
N/A
Protected

Academic year: 2021

シェア "統制語彙を利用したSBM用ブラウザ機能の試作"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会第 73 回全国大会. 5B-3. 統制語彙を利用した SBM 用ブラウザ機能の試作 (Prototype of the browser function using controlled vocaburary for Social Bookmark) 長屋 俊・日本原子力研究開発機構† 板橋 慶造・日本原子力研究開発機構†. NAGAYA Shun・Japan Atomic Energy Agency‡ ITABASHI Keizo・Japan Atomic Energy Agency‡. 1 はじめに ウェブの普及および学術情報流通の電子化と ともに,ウェブ上の情報資源の量が爆発的に増 えている.原子力分野でも図書・雑誌・レポー トを中心とした書誌情報データベースを作成し 学術情報流通の改善を行ってきたが,昨今では 従来の書誌情報だけではなく新たに登場したウ ェブ情報資源の収集とその組織化が課題となっ ている 1.そこで,原子力分野におけるウェブ情 報 資 源 の 組 織 化 の 一 手 法 と し て Social BookMark(以下「SBM」)に焦点をあてた.SBMの 特徴である「自由語によるタグ付け」は,同時 にSBMにおいて「タグの表記揺れ」という欠点に なっている.今回はこの課題を解決するために, 原子力分野で使われている統制語彙であるINIS 2 シ ソ ー ラ ス を WebAPI(Application Programming Interface)化し,それを用いてSBM上で統制語に よるタグの付与を行うためのブラウザ機能の補 助システムの試作を行った. 2 SBM と統制語彙 SBMは以前からウェブ情報資源の組織化の一つ の手法として注目を浴びている.SBMとはウェブ サービス上で利用者同士がブックマークを共有 するという仕組みで,日本でもウェブサービス としていくつかのSBMが提供されている.SBMは ブックマークを共有する際にタグと呼ばれるキ ーワードを付与することで,ブックマークその ものに索引付けを行い組織化する,という機能 を持っている.このように利用者同士が自由に タグ付けを行い組織化を行う仕組みは「フォー クソノミー(folksonomy)」と呼ばれ,専門家が 統制語によるタグ付けをするよりもコストがか からず,なおかつ自由語を付与できる,という メリットがある.しかし,自由語を付与できる ということは,意味として同じタグであっても 利用者によって違うタグがつけられてしまう, という表記揺れの問題も同時に引き起こしてい る 3. 一方,図書館情報学の分野では統制語彙とい う技術が使われてきた.伝統的な書誌情報デー. タベースでは書誌情報毎に統制語を付与し,情 報検索の精度を高めることで利用者の支援を行 っている.しかし,専門家が内容分析を行いキ ーワードを付与する従来のモデルは前述したと おりコストがかかる 4. SBMで統制語彙が利用されない理由としては語 彙の作成および管理にかかるコストの問題,そ して階層構造から統制語を選択する作業などが あり利用のハードルが高い,加えて統制語彙の 掲載メディアが書籍,PDFなどで実用に向かない という 3 点が考えられる.1 つ目の課題は既存の 統制語彙を利用することで解決でき,2 つ目と 3 つ目の課題はシステム側で利用支援を行うこと で解決できると考えた.今回は原子力分野の統 制語彙であるINISシソーラス(国際原子力機関 IAEA 5のINIS本部から提供されているINISデータ ベース 6のためのシソーラス)を利用した.また, 単純にデータベース化するだけでなく将来的な 他システムからの利用も考えWeb API機能を実装 することで相互運用性を高めた. 2.1 原子力分野における統制語彙 INISシソーラス自体はINISへの参加国が新規 ディスクリプタ(シソーラス中の階層構造を持 つキーワード)を提案し,INIS本部にて調整を 行い,更新が行われている.現在,INISシソー ラスはPDF形式で配布されている 7.また機械可 読可能なデータとしてはIAEAがINIS加盟国で公 開しているシソーラスの固定長データがあるの で今回はそれを用いた.そのデータは図 1 のよ うになっている.1 レコード 167byteで固定長デ ータ全体で 301,445 行からなる.シソーラスに 登録された統制語は 30,550 語である(2010 年 12 月現在).必ずしも固定長データの 1 レコー ド=1 ディスクリプタとして構成されているわけ ではなく階層関係(BT,NT,RT,etc)の表現や固定 長に収まりきらないデータの都合上,複数行に 展開されているためファイルの行数に比べ統制 語の数は少なくなる.この固定長データをMySQL 上に展開し,PHPにてINISシソーラスのWebAPI化 を行った.. 1-521. Copyright 2011 Information Processing Society of Japan. All Rights Reserved..

(2) 情報処理学会第 73 回全国大会. 図 1 INIS シソーラスの 167byte 固定長のデータ(一部抜粋) 3 システムの実装 SBMサービスとして「はてなブックマーク」 8を 選択した.はてなブックマークを選択した理由 としてはWeb APIが用意され相互運用性が高くシ ステム連携しやすいこと,国内のSBMとして知名 度が高く最大規模の利用を誇るため利用分析の 実験依頼をしやすい,という 2 点からである. 試作をした本システムの全体像は図 2 の通り である.各利用者はブラウザから bookmarklet を用いて本システムを呼び出す方法を用いた. 利用者は事前に bookmarklet をブラウザのブッ クマークに登録しておき,はてなブックマーク へウェブ情報資源を登録したいときにはブラウ ザ上で bookmarklet を起動することで本システ ムを呼び出すことができる.bookmarklet を使う と,各利用者のブラウザにポップアップで登録 画面が表示される.表示された登録画面上では 自由語だけではなく INIS シソーラスをもとにし た統制語を用いてタグ付をし,はてなブックマ ークに登録することができる仕組みになってい る.また,システムからはてなブックマークへ の登録にははてなが正式に提供している「はて なブックマーク AtomAPI」を利用した. 本システムの詳細については発表にて紹介す る.. 4 おわりに 今後の課題としては自由語によるタグの付与 ではなく統制語を用いてタグを付与していくこ とでウェブ情報資源の組織化にどういった変化 を及ぼすのか,といった視点での利用分析が挙 げられる. また,今回,INISシソーラスをWeb API化した ことは他システムからの相互運用性を考慮した 意図もある.原子力分野といっても幅が広い. 例えば, INISデータベースの収録範囲(原子炉 工学だけではなく,物理,化学,工学,またラ イフサイエンス分野への応用,最近では医学分 野での応用など)からも「原子力」というフィ ールドの広さがわかる 9.INISシソーラスは原子 力分野以外での利用も可能であり,今後の新た な活用方法も検討したい.. [参考文献・参考 URL・注記] 1. Web Harvesting for Nuclear Knowledge Preservation,NUCLEAR ENERGY SERIES No.NG-T6.6,IAEA,2008 http://www.iaea.org/inisnkm/nkm/documents/publ_web _harvesting.pdf 2 INIS:International Nuclear Information System 3. ブラウザ 「登録画面」. ブックマーク. ポップアップ. シソーラス. はてな ブックマーク. bookmarklet システム. 図 2 システムの全体. シソーラス (Web API). 緑川 信之, フォークソノミーの新奇性はどこにある のか, 情報の科学と技術 57(5), 238-243, 2007 4 米澤 稔, 国際原子力情報システム(INIS)データベー スのインデクシング方針, 情報の科学と技術 58(4), 178-183, 2008 5 IAEA:International Atomic Energy Agency 6. INIS Database, http://inisdb.iaea.org/. 7. ETDE/INIS Joint Thesaurus, ETDE/INIS Joint Reference Series No. 1 (Rev.2.3), http://www.iaea.org/inis/Publications/Reference_se ries/etde_inis_2_7_en_rev_2_3.pdf 8 はてなブックマーク, http://b.hatena.ne.jp/ 9. INIS の収録分野-JAEA 図書館, http://jolisfukyu.tokaisc.jaea.go.jp/ird/inis/syuuroku.htm. 1-522. Copyright 2011 Information Processing Society of Japan. All Rights Reserved..

(3)

参照

関連したドキュメント

ル(TMS)誘導体化したうえで検出し,3 種類の重水素化,または安定同位体標識化 OHPAH を内部標準物 質として用いて PM

(2) カタログ類に記載の利用事例、アプリケーション事例はご参考用で

  BCI は脳から得られる情報を利用して,思考によりコ

腐植含量と土壌図や地形図を組み合わせた大縮尺土壌 図の作成 8) も試みられている。また,作土の情報に限 らず,ランドサット TM

このため、都は2021年度に「都政とICTをつなぎ、課題解決を 図る人材」として新たに ICT職

2.本サービスの会費の支払い時に、JAF

設定支援ソフトウェアで設定したときは、データを付属の SD カードに保存した後、 FS-2500EP の設定操 作部を使って SD カードから

試験体は図 図 図 図- -- -1 11 1 に示す疲労試験と同型のものを使用し、高 力ボルトで締め付けを行った試験体とストップホールの