• 検索結果がありません。

平成21年度 情報メディアマネージメント分野

N/A
N/A
Protected

Academic year: 2021

シェア "平成21年度 情報メディアマネージメント分野"

Copied!
59
0
0

読み込み中.... (全文を見る)

全文

(1)

自由語からの主題検索を支援する図書館OPACの構築

~NDCとNDLSHを用いて~

2010

200712418 松本 聖

(2)

0.目次

0. 目次 ... 1 1. はじめに ... 3 2. 先行研究 ... 5 2.1 先行研究の紹介 5 2.2 先行研究と本研究の相違点 6 2.2.1 NDLSHを利用して多様な検索語に対応 6 2.2.2 NDCの階層構造を利用したツリー表示 6 2.2.3 NDC階層構造における不均衡記号と縮約記号への対応 6 2.3 関連する研究 7 3. NDC・MRDF9(NDC機械可読 9 版)からのデータ取得と整形 ... 9 3.1 NDC・MRDF9 のデータ形式と利用する項目 9 3.2 NDC・MRDF9 本表データの整形 10 3.2.1 インデント記号の追加 10 3.2.2 分類深度の追加 11 3.2.3 深度終端フラグの追加 12 3.2.4 整形後のデータ 13 3.3 NDC・MRDF9 相関索引データの整形 14 4. NDLSH(国立国会図書館件名標目表)2008 年度版テキストデータからのデータ取 得と整形 ... 15 4.1 NDLSH2008 のデータ形式と利用する項目 15 4.2 NDLSH2008 データの整形 16 5. データベースの構造とデータの格納 ... 19 5.1 NDCデータを収めるテーブル 19 5.1.1 NDC本表テーブル 19 5.1.2 NDC相関索引テーブル 19 5.2 NDLSHデータを収めるテーブル 20 5.2.1 NDLSHメインテーブル 20 5.2.2 NDLSHサブテーブル 21 5.2.3 NDLSH-NDC対応テーブル 21 6. NDC検索システム ... 22 6.1 トップページ 24 6.2 キーワード選択ページ 25 6.3 分類表表示ページ 30 6.3.1 分類表表示と蔵書検索機能 31

(3)

6.3.2 表示キーワードと関連キーワード 33 6.4 NDLSH詳細ページ 34 7. システムの利用状況とアンケート結果 ... 38 7.1 アクセス元ホストのドメイン 38 7.2 入力されたキーワード 39 7.3 利用者アンケートの結果 39 8. 考察 ... 40 8.1 総記のまとめあげ 40 8.2 範囲分類記号中に不均衡記号が出現する場合の対処 46 8.3 分類記号が一度に二桁以上増えている場合の対処 47 8.4 ユーザビリティへの配慮 48 8.4.1 主題以外の検索項目への対応 48 8.4.2 インクリメンタルサーチ 48 8.4.3 蔵書検索機能 52 8.4.4 分類表での参照項目へのリンク 54 9. まとめ ... 55

(4)

1.はじめに

1980 年代から 2000 年代にかけての図書館目録の電子化(OPAC 化)は、目録を利用 する図書館員や図書館利用者と目録を作成する目録担当者の双方に大きな利益をもたら した。利用者はカード体目録や冊子体目録の書式よりもわかりやすいインターフェース で容易に検索でき、またそれまで前方一致でしか検索できなかったタイトルや著者名を 中間一致で検索可能になり、さらにそれまで検索が難しかった副タイトルやシリーズ名、 目次などからの検索も可能となった。なにより検索に要する時間が圧倒的に短くなった ことが利用者の受けたもっとも大きな恩恵であろう。また目録担当者は、検索のアクセ スポイントの数だけ副出する必要がなくなり、目録の新規作成時や修正時の負担が軽減 された。 では、現在の図書館目録は目録の持つ役割をすべて果たした便利な存在であると言え るだろうか? 目録には、大きく分けて 3 つの機能が求められると言われている1 現在使用されている OPAC において、前者ふたつの機能は、利用者に図書館目録の知 識がなくとも容易に実現可能である。つまり、事前に知っている特定の資料(群)や著 者に関して、タイトルや著者名などの手がかりから検索し、目的の資料へと到達するこ とは特段の知識がなくとも可能である。これは前述のとおり目録の電子化によりアクセ スポイントが増え、それらを一括して中間一致で検索可能になったことと、大規模な著 者典拠の整備により同名異人や異名同人の場合でも目的とする著者に辿り着けるように なったことがその主な理由と考えられる。 。“存 在が確認されている既知資料への既知事項による探索・アクセス機能”、“著者によって集 中させた資料群の探索・アクセス機能”、そして“主題からの探索・アクセス機能”の 3 つ である。 一方、“主題からの探索・アクセス機能”については、利用者に分類や件名の知識がなけ れば主題からの検索は難しい。主題からの検索手段としては分類記号による検索と件名 標目による検索の 2 つが主流であるが、現在図書館に導入されている多くのOPACでは、 分類や件名に対するある程度の知識と理解がなければそれらを自らの検索要求を満たす ツールとして利用することは困難である。よって、主題からの検索を望む利用者の多く は仕方なく主題となると思われるキーワードをタイトル項目などに入力して、主題から の検索要求を満たそうとする2, 3。しかしながら、本来“存在が確認されている既知資料へ の既知事項による探索・アクセス機能”を満たす目的でつくられたタイトル項目からでは、 利用者の満足する検索結果を得ることは難しい。利用者の“主題からの検索を行いたい” という要求は決して少ないとはいえず4, 5 2 、主題検索という認識のない利用者の潜在的な 需要も存在する , 3。よって、そのような利用者の要求を満たし、主題から資料を容易に 検索できるよう支援することは、図書館の必要性の認識を市民に求め、図書館運営の協 力を得る上でも重要である。

(5)

OPACにおける主題検索の必要性と将来に向けての課題について、目録の電子化が最も 盛んであった 1980 年代から 90 年代にかけて強く叫ばれ、さまざまな議論がなされた6 そこで本研究では、現在日本の多くの図書館で用いられている NDC(日本十進分類法) を主として用い、利用者に特段の知識を必要とせずに主題からの検索ができるよう支援 する検索システムの構築を目的とする。具体的には、利用者の入力した検索語を NDLSH (国立国会図書館件名標目表)・NDC 本表・NDC 相関索引から検索し、該当する分類項 目を NDC の持つ階層構造を生かしツリー構造で表示することで利用者の主題検索を支援 する。 。 それから約 30 年がたち、コンピュータの処理能力は当時と比べ飛躍的に向上したが、図 書館における主題検索の利便性は、特に一般利用者が使用することを想定した場合の利 便性は向上が見られないように思われる。少なくとも現在Web上で利用可能なシステム で、図書館の資料を主題から効率的に誰もが探せるようにしたものは見当たらず、図書 館利用者が使う主題検索機能に限って言えば、30 年前と現在のコンピュータ技術の発展 と比べるとほとんど進歩していないといっても過言ではない。 なお、主題検索のためのツールは主に分類と件名の 2 つに分けられるが、件名は館種 や規模、使用する MARC レコードなどによって採用する件名標目が異なる場合がある。 それに対して、NDC は日本の図書館であればほぼ採用されており、図書であれば排架場 所を決定するため 1 資料に最低 1 つは付与されていること、NDC の分類階層が件名標目 のそれと比べてわかりやすく、構造がまとまっていることなどの理由から本研究では NDC を選択した。

(6)

2.先行研究

2.1 先行研究の紹介 1) 上田洋, 村上晴美. Ajaxを用いたNDC検索システムの試作.7 JavaScriptの応用技術であるAjaxを用いてユーザビリティを向上させたNDC検索 システム“NDC Suggest”について製作者が著した論文。当該システムは大阪市立 大学学術情報総合センター基盤支援研究として実験公開されている。 (http://kuroyuri.media.osaka-cu.ac.jp/~ueda/ajax_ndc/) Ajaxを使用することで、Webサーバー-クライアント間の通信量が最低限ですむた め非常に高速な応答を実現している。入力欄にNDC記号またはNDC本表の項目名を 入力するか、NDCの階層構造を辿ることで分類を表示する。 2) 渡邊隆弘. NDC8 を利用したOPACの主題検索支援システム構築の試み.8 NDC機械可読版を利用せず、独自に分類データを収集して主題検索支援システム を構築したもの。NDCの分類階層への考察も深く、“階層レベル”と呼ぶ独自の値 を付与している。また、データベース設計やシステム構築においてユーザビリティ への細かい配慮が窺える。 3) 大塩裕子. 特集, これからの図書館目録に向けて: 創価大学図書館におけるOPAC高 度化の取組み.9 創価大学図書館で運用されているOPACについての論文。新着図書紹介や横断検 索・文献収集システムなど、より利用しやすいOPACとなるようさまざまな工夫が 見られ、4章で主題検索についても触れられている。NDC機械可読8版を利用し、入 力語をNDC8版の相関索引から検索するほか、NDCの階層構造を辿って分類を選択 することもできる。最新の9版ではなく8版のものではあるが、インターネットを通 して誰もがNDCの相関索引を検索することができるシステムは他に例を見ない。 4) 鈴木明子. NDCとBSHを用いたOPAC主題検索支援システム.10 NDCとBSH(基本件名標目表)を用いた主題検索支援システム。NDCの検索結果 では、該当した分類から前後の分類項目と上位・下位の分類項目へのリンクが、BSH の検索結果では該当した項目からTT(最上位語)・BT(上位語)・NT(下位語) へのリンクがそれぞれ貼られ、関連項目を辿ることができるようになっている。

(7)

2.2 先行研究と本研究の相違点 2.2.1 NDLSHを利用して多様な検索語に対応 上記研究のうち、先行研究1)と4)は NDC9 版を、2)と3)は NDC8 版を使用し ている。このうち1)は本表の語のみを、2)と4)は本表と相関索引の語のそれぞれ を検索対象とし、3)は本表と相関索引の語に加えて独自の索引語を付与している9 本研究では NDC9 版の本表と相関索引のほかに、NDC 記号が付与された件名標目表(シ ソーラス)として NDLSH(国立国会図書館件名標目表)2008 年度版テキストデータを 使用している。NDC を軸とした主題検索システムで、NDC に存在しない語から検索でき るものとしては独自の索引語を付与している先行研究3)があるが、体系化されたシソ ーラスを用いて検索可能な語を広げ、利用者の入力する多様な語に対応しているという 点に本研究の新規性があると考える。 なお、同じ件名標目としてBSH(基本件名標目表)の導入も検討したが、NDC機械可 読 9 版のマニュアルに、相関索引の索引語としてBSHの用語データも加えているとの記 載があるため11 2.2.2 NDCの階層構造を利用したツリー表示 導入しなかった。 先行研究では、いずれも入力された検索語を含む分類項目のみを抽出して表示するが、 本研究のシステムでは NDC の階層構造を利用して、検索語を含む分類項目のほかにその 周辺の分類項目(検索語を含む分類項目と同列の分類項目、一階層下の分類項目、該当 する分類項目より上位の分類項目)をツリー構造でひとつの画面に表示する。冊子体の NDC9 版では、この階層構造を分類名辞の字下げにより示していたが、本研究システムで はこれを 3 つの罫線記号(“┃”・“┣”・“┗”)を用いてよりわかりやすく示す。 このツリー構造を用いて、検索して該当した分類項目だけでなくその上位分類項目や 周辺の分類項目を表示することで、従来表現できなかった分類項目の持つ文脈的意味を 表現でき、NDC の構造を知らない利用者にもよりわかりやすい検索システムを提供でき ると考える。なお、詳細は「3.2.1 インデント記号の追加」、「6.3 分類表表 示ページ」において説明する。 2.2.3 NDC階層構造における不均衡記号と縮約記号への対応 さらに本研究では、NDCの階層構造を利用する上で、NDCの不均衡記号と縮約記号を 考慮している。不均衡記号と縮約記号とは、NDC9 版で新たに明記された用語12,13 NDC は十進分類法のひとつであるが、十進分類法にはその性質上ひとつの分類階層の 分類項目(区分肢)の数が最大 10 に固定されてしまうという制約がある。そこで、分類 項目が 10 より多くなった場合には分類階層は同じでも記号の桁を増やして対応したり、 逆に分類項目が極端に少ない場合には階層の異なる分類を同じ桁でまとめて対応したり で、 十進分類の桁数による分類階層表現が、意味上の分類階層と異なっていることを示す記 号である。

(8)

して分類記号を効率的に運用している。これは限られた分類記号を効率的に運用する一 方で、分類記号の桁数による分類階層表現と、実際の分類階層とが異なってしまうとい う問題を持つ。この問題に対処するために用いられるのが不均衡記号と縮約記号である。 不均衡記号は、十進記号法の体系上は下位項目となるが実際には上位項目と同位であ ることを示し、縮約記号は、十進記号法の体系上は分類の展開が行われていないが実際 には分類を展開し下位項目となっていることを示している。NDC ではこのような方法で 分類の階層構造を保っている。冊子体では、不均衡記号は分類項目の名辞を、分類桁数 が示す通常の位置より字上げし、分類記号と分類項目の名辞を接近させることで表現し、 縮約記号は分類項目の名辞を通常の位置より字下げし、分類記号と分類項目の名辞を離 すことで表現している。 本研究システムでは、NDC の桁数に加えてこの不均衡記号と縮約記号の指示を加味す ることでより適切に階層構造を表現する。なお、詳細は「3.2.2 分類深度の追加」 において説明する。 2.3 関連する研究 1) 宍戸奈実. 大学図書館における OPAC の利用者の探索行動 : 学生を対象としたイン タビュー調査.2 1997年10月に、早稲田大学と明治大学の各図書館で行われた調査についての報告。 OPACの利用調査についての先行研究の紹介も行われている。

2) Hancock-Beaulieu, Micheline; Robertson, Stephen; Neilson, Colin. Evaluation of Online Catalogues: Eliciting Information from the User.3

ロンドンの大学図書館におけるOPACの利用調査。その中で、OPACを利用した 181名に対してOPACの利用記録と彼らに対する質問とを組み合わせ、利用者が OPACで行ったと思った操作と実際のログとを分析し、その差異を調査したものが ある。調査の結果、利用者が主題検索だと思って行った操作が、ログでは既知文献 探索であると捕らえるケースが多く見られた2 3) 松井純子, 河手太士. 図書館目録の将来設計--主題検索機能の提供を中心に.4 インターネット環境が浸透した現代における図書館OPACについて、インターネ ットの検索エンジンであるGoogleとの比較を中心として分析し、図書館OPACの将 来について論じている。

4) Markey, Karen. The Online Library Catalog; Paradise Lost and Paradise Regained?.5

(9)

5) 村上晴美, 平田高志, 上田洋. Subject World - 主題の世界 -.14 BSH(基本件名標目表)4版とNDC9版とを組み合わせ、相互の項目において主題 の表す概念と関連とを視覚的に表現するシステム。描画した項目から、図書館蔵書 だけでなくAmazonなどの書籍販売サイトやWebページの検索も可能となっている。 なお、当該システムは大阪市立大学村上研究室にて実験公開されている。 (http://murakami.media.osaka-cu.ac.jp/research/SubjectWorld/)

(10)

3.NDC・MRDF9(NDC機械可読 9 版)からのデータ取得と整形

3.1 NDC・MRDF9 のデータ形式と利用する項目 NDC・MRDF9の構造は図 1 のとおりである。各行は 7 項目からなり、各項目の概要 は表 1 のとおりである。なお、表 1 右端の“利用”の欄は本研究システムにおいて利用 する項目に○を、利用しない項目には×を表示している。 図 1 NDC・MRDF9 の構造(本表部分) 表 1 NDC・MRDF9 の各項目の概要 例: ┌─ 1 ─┐2┌─── 3 ───┐4│5│6 ┌ 7 ─ │00000100│A│000 │0│0│10│総記 │00000200│A│000 │0│0│20│General works ・・・ 番号 名称 桁数 概要 利用 1 管理番号 8桁 上位6桁は0埋めの連番 下位二桁は”00”固定 × 2 表/索引区分 1桁 “A”:本表、”B”:固有補助表、”C”:一般補助表、”X”: 相関索引 × 3 分類記号 19桁 先頭詰めでNDC記号を記載 余分桁は空白 ○ 4 追加項目フラグ 1桁 NDC9版での新規追加分類の場合”1”、8版から存 在する分類は”0” × 5 分類記号の種類 1桁 不均衡記号や縮約記号の指示 ○ 6 事項種別 2桁 項目・注記・参照などの区別 ○ 7 事項 可変長 分類の名辞 ○ 00000100A000 0010総記 00000200A000 0020General works 00000300A002 0010知識.学問.学術 00000400A002 0020Knowledge.Learning 00000500A002 0040各国の学術事情および知的協力は,ここに収める 00000600A002 0041人文科学<一般>は,ここに収める 00000700A002 0050科学方法論→116.5;学術研究奨励→377.7;自然科学→400;社会科 学→300;知識の分類→116.5 00000800A002.7 0010研究法.調査法 00000900A002.7 0040研究や調査に必要な一般的な知識(情報)の集め方および整理法は,ここに収める 00001000A002.7 0050電子計算機による情報処理→007.6 00001100A007 0010情報科学 00001200A007 0020Information science 00001300A007 0040ここには,情報科学<一般>およびソフトウェアを収める 00001400A007 0041電子計算機などのハードウェアは,548に収める 00001500A007 0042別法:548.9;ただし,情報理論(007.1)は548.1 00001600A007 0060→:010 00001700A007.02 0360→007.2

(11)

このデータファイルを、Ruby プログラムを使用して利用する項目のみを抽出し、本研 究システムの目的に合わせて整形し、さらにデータベースに格納するための形式に変換 して利用する。 3.2 NDC・MRDF9 本表データの整形 NDC・MRDF9 ファイルには、表 1 の項目が含まれるが、このうち表右端の“利用” 欄で×印をつけているものは使用しない。本研究システムでは、NDC・MRDF9 の各行の データを必要に応じて結合して用い、新たな番号を振るため、1の管理番号は使用しな い。また、データベースに格納する段階で、本表と相関索引のデータは別テーブルに格 納するため、2の表/索引区分も使用しない。4の追加項目フラグについては、システ ムの目的を考えた場合に、9 版で新たに追加された項目を区別して表示するメリットより も、区別して表示した場合に画面が煩雑となるデメリットのほうが大きいと判断したた め使用しなかった。さらに、地理区分などの一般補助表や固有補助表の項目は除外した。 また、NDC・MRDF9 のデータに直接記述はされていないが、システム実装上必要とな る項目を追加する。追加する項目は、NDC の階層関係を示す“インデント記号”、分類階 層の深さを示す“分類深度”、そして当該分類項目の下位となる分類項目が存在しないこ とを示す“深度終端フラグ”の 3 つである。 なお、データ整形時に、全角の英数字は半角に変換した。 3.2.1 インデント記号の追加 インデント記号は、冊子体の NDC では分類名辞の字下げを行うことにより示されてい た階層関係を、“┃”・“┣”・“┗”の 3 つの罫線記号を用いてよりわかりやすく示したも のである。インデント記号は、図 1 のデータを元に、後述する分類深度を用いて決定す る。図 1 のデータ構造にインデント記号を加え、整形したものを図 2 に示す。 図 2 図 1 にインデント記号を加えて整形したもの ┗ 000 総記 General works ┃ ┣ 002 知識. 学問. 学術 Knowledge. Learning ┃ ┃ *各国の学術事情および知的協力は,ここに収める ┃ ┃ *人文科学<一般>は,ここに収める ┃ ┃ *科学方法論→116.5;学術研究奨励→377.7;自然科学→400;社会科学→300;知識の分類→116.5 ┃ ┗ 002.7 研究法. 調査法 ┃ *研究や調査に必要な一般的な知識(情報)の集め方および整理法は,ここに収める ┃ *電子計算機による情報処理→007.6 ┃ ┣ 007 情報科学 Information science ┃ ┃ *ここには,情報科学<一般>およびソフトウェアを収める ┃ ┃ *電子計算機などのハードウェアは,548に収める ┃ ┃ *別法:548.9;ただし,情報理論(007.1)は548.1 ┃ ┃ →:010 ┃ ┣ [007.02 →007.2]

(12)

3.2.2 分類深度の追加 分類深度は、当該分類項目の階層の深さを示す数値である。NDC の基点である 000、 100、200…… のそれぞれを 0 とする。そして 010、020、030……、110、120、130… … を 1、011、012、013……、111、112、113…… を 2 とするというように、基本的 に分類記号の桁数に応じて分類深度の値は大きくなる。しかし、十進分類の分類記号を 効率的に運用するために分類記号の桁数と分類階層が一致しない場合があるため、前述 2.2.3の不均衡記号と縮約記号の指示を加味して分類深度を決定している。分類深 度とインデント記号について、不均衡記号と縮約記号を加味しないものを図 3 に、加味 したものを図 4 に示す。両図の各行先頭の数字が分類深度である。 図 3 不均衡記号・縮約記号を加味しない場合の分類深度とインデント記号 図 4 不均衡記号・縮約記号を加味した場合の分類深度とインデント記号

1 ┣ 010 図書館. 図書館学 Libraries. Library and information sciences 1 ┃ ┃ *図書館情報学は,ここに収める 1 ┃ ┃ →:007;020 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 2 ┃ ┃ 2 ┃ ┣ 012 図書館建築. 図書館設備 Library buildings 2 ┃ ┃ ┃ *館種の別なく,ここに収める;ただし,一館の建築誌は,016/018に収める 3 ┃ ┃ ┣ 012.1 建築計画:基礎調査,位置,敷地 3 ┃ ┃ ┣ 012.2 建設材料および構造 3 ┃ ┃ ┣ 012.28 改修・改築工事 3 ┃ ┃ ┣ 012.29 維持管理. 保護. 防火. 防水 3 ┃ ┃ ┣ 012.3 建築設計・製図 4 ┃ ┃ ┃ ┣ 012.4 書庫. 書架 4 ┃ ┃ ┃ ┣ 012.5 利用者用諸室:閲覧室,児童室,目録室 4 ┃ ┃ ┃ ┣ 012.6 講堂. 集会室. 展示室. 視聴覚室 4 ┃ ┃ ┃ ┗ 012.7 事務室. その他管理部門の諸室 3 ┃ ┃ ┣ 012.8 図書館設備:衛生設備,機械設備,電気設備 4 ┃ ┃ ┃ ┗ 012.89 ブックモビル 3 ┃ ┃ ┗ 012.9 図書館用品. 図書館備品

縮約記号

不均衡記号

1 ┣ 010 図書館. 図書館学 Libraries. Library and information sciences

1 ┃ ┃ *図書館情報学は,ここに収める 1 ┃ ┃ →:007;020 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 2 ┃ ┃ 2 ┃ ┣ 012 図書館建築. 図書館設備 Library buildings 2 ┃ ┃ ┃ *館種の別なく,ここに収める;ただし,一館の建築誌は,016/018に収める 3 ┃ ┃ ┣ 012.1 建築計画:基礎調査,位置,敷地 3 ┃ ┃ ┣ 012.2 建設材料および構造 4 ┃ ┃ ┃ ┣ 012.28 改修・改築工事 4 ┃ ┃ ┃ ┗ 012.29 維持管理. 保護. 防火. 防水 3 ┃ ┃ ┣ 012.3 建築設計・製図 3 ┃ ┃ ┣ 012.4 書庫. 書架 3 ┃ ┃ ┣ 012.5 利用者用諸室:閲覧室,児童室,目録室 3 ┃ ┃ ┣ 012.6 講堂. 集会室. 展示室. 視聴覚室 3 ┃ ┃ ┣ 012.7 事務室. その他管理部門の諸室 3 ┃ ┃ ┣ 012.8 図書館設備:衛生設備,機械設備,電気設備 4 ┃ ┃ ┃ ┗ 012.89 ブックモビル 3 ┃ ┃ ┗ 012.9 図書館用品. 図書館備品

縮約記号

不均衡記号

(13)

不均衡記号と縮約記号を加味した調整について NDC「012 図書館建築. 図書館設備」 を例に説明する。まず、012.28 と 012.29 は不均衡記号である。つまり、十進記号法の体 系ではこれらの記号は 012.2 の下位項目であるが、意味上の分類階層としてはこれらの 項目は 012.1 や 012.2 と同列である。また、012.4 から 012.7 までの各分類項目は縮約記 号である。つまり、十進記号法の体系ではこれらの項目は 012.2 や 012.3 と同列の項目 であるが、意味上の分類階層としてはこれらの項目は 012.3 の下層となる。 不均衡記号や縮約記号を加味せず、分類記号の桁数のみで分類深度を判断する場合、 図 3 のように意味上の分類階層と異なるツリーとなってしまうが、分類記号の桁数に不 均衡記号や縮約記号を加味して分類深度を決定することで、図 4 のように意味上の分類 階層と矛盾しないツリー表示が可能となる。この例では、「012.28 改修・改築工事」や 「012.29 維持管理」は、「012.2 建設材料および構造」に限定される分類項目ではな いことを、また「012.4 書庫.書架」から「012.7 事務室.その他管理部門の諸室」まで は、「012.3 建築設計・製図」についての分類項目であることを表している。 3.2.3 深度終端フラグの追加 深度終端フラグは、分類階層のツリー構造において当該分類項目が最下層であること を示すフラグである。これは、分類表を表示したときに分類項目が最下層でない場合、 アイコンをクリックすることでその分類の下位項目を表示するという機能を実現するた めに追加するものである。図 5 に深度終端フラグを追加した例を示す。最下層の分類項 目には、各行先頭に表示されている分類深度の右側に“E”と表示した。 図 5 図 4 に深度終端フラグを追加した例

1 ┣ 010 図書館. 図書館学 Libraries. Library and information sciences 1 ┃ ┃ *図書館情報学は,ここに収める 1 ┃ ┃ →:007;020 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 2 ┃ ┃ 2 ┃ ┣ 012 図書館建築. 図書館設備 Library buildings 2 ┃ ┃ ┃ *館種の別なく,ここに収める;ただし,一館の建築誌は,016/018に収める 3E ┃ ┃ ┣ 012.1 建築計画:基礎調査,位置,敷地 3E ┃ ┃ ┣ 012.2 建設材料および構造 3E ┃ ┃ ┣ 012.28 改修・改築工事 3E ┃ ┃ ┣ 012.29 維持管理. 保護. 防火. 防水 3 ┃ ┃ ┣ 012.3 建築設計・製図 4E ┃ ┃ ┃ ┣ 012.4 書庫. 書架 4E ┃ ┃ ┃ ┣ 012.5 利用者用諸室:閲覧室,児童室,目録室 4E ┃ ┃ ┃ ┣ 012.6 講堂. 集会室. 展示室. 視聴覚室 4E ┃ ┃ ┃ ┗ 012.7 事務室. その他管理部門の諸室 3 ┃ ┃ ┣ 012.8 図書館設備:衛生設備,機械設備,電気設備 4E ┃ ┃ ┃ ┗ 012.89 ブックモビル 3E ┃ ┃ ┗ 012.9 図書館用品. 図書館備品

(14)

3.2.4 整形後のデータ 前述のように NDC・MRDF9 ファイルから適宜項目を選択・追加し、最終的に分類記 号・インデント記号・名辞の種類(事項種別データを元に作成したもの)・名辞(事項を 一部変更したもの)・分類深度・深度終端フラグの 6 項目に整形して出力する。名辞にお ける事項の一部変更とは、項目への分類記号と英文項目の併記、注記などの先頭への*(ア スタリスク)の付加を指す。 整形したデータの一部を表形式にしたものを表 2 に示す。なお、表右端の“深”、“終” はそれぞれ分類深度と深度終端フラグを表す。 表 2 図 1 表示部分のデータ整形例 分類記号 インデント記号 名辞の種類 名辞 深 終 000 ┗ 項目 000 総記 General works 0 002 ┃ 1 002 ┣ 項目 002 知識. 学問. 学術 Knowledge. Learning 1 002 ┃ ┃ 注記 *各国の学術事情および知的協力は,ここに収める 1 002 ┃ ┃ 注記 *人文科学<一般>は,ここに収める 1 002 ┃ ┃ 注参照 *科学方法論→116.5;学術研究奨励→377.7;自然科学→400;社 会科学→300;知識の分類→116.5 1 002.7 ┃ ┗ 項目 002.7 研究法. 調査法 2 E 002.7 ┃ 注記 *研究や調査に必要な一般的な知識(情報)の集め方および整理 法は,ここに収める 2 E 002.7 ┃ 注参照 *電子計算機による情報処理→007.6 2 E 007 ┃ 1 007 ┣ 項目 007 情報科学 Information science 1 007 ┃ ┃ 注記 *ここには,情報科学<一般>およびソフトウェアを収める 1 007 ┃ ┃ 注記 *電子計算機などのハードウェアは,548に収める 1 007 ┃ ┃ 注記 *別法:548.9;ただし,情報理論(007.1)は548.1 1 007 ┃ ┃ 参照 →:010 1 007.02 ┃ ┣ 参照 [007.02 →007.2] 2 E

(15)

3.3 NDC・MRDF9 相関索引データの整形 NDC・MRDF9 では、相関索引データも本表データと同じ形式で記録されている。相関 索引部分のデータを図 6 に示す。各行の項目の概要は表 1(9 ページ)と同様である。 図 6 NDC・MRDF9 の構造(相関索引部分) 相関索引データは、NDC・MRDF9 ファイルのうち分類記号と事項の 2 項目のみを利用 する。事項は、検索と表示における利便性と効率を考え、名辞と検索用語句の 2 項目に 分割する。名辞は、事項において“||”で区切られた一つ目の語とし、検索用語句は、事 項の“||”を空白に変換し、半角カタカナを全角化、全角英数字を半角化したものとする。 なお、今回は地理区分などの一般補助表、固有補助表、地理区分や言語区分を含む索 引語は除外した。整形したデータの一部を表形式にしたものを表 3 に示す。 表 3 図 6 表示部分のデータ整形例 名辞 検索用語句 分類記号 あい(作物栽培) あい(作物栽培) アイ(サクモツサイバイ) 617.8 あい(植物学) あい(植物学) アイ(ショクブツガク) 479.64 あい(染料) あい(染料) アイ(センリョウ) 577.99 愛(キリスト教) 愛(キリスト教) アイ(キリストキョウ) 191.7 愛(心理学) 愛(心理学) アイ(シンリガク) 141.62 愛(仏教) 愛(仏教) アイ(ブッキョウ) 181.6 愛(倫理) 愛(倫理) アイ(リンリ) 158 愛玩動物 愛玩動物 アイガンドウブツ 645.9 合気道 合気道 アイキドウ 789.25 間狂言 間狂言 アイキョウゲン 773.9 愛琿条約 愛琿条約 アイグンジョウヤク 319.22 愛国心(倫理) 愛国心(倫理) アイコクシン(リンリ) 154 愛国団体(社会学) 愛国団体(社会学) アイコクダンタイ(シャカイガク) 361.65 あいさつ(言語) あいさつ(言語) アイサツ(ゲンゴ) 809.4 あいさつ(民俗) あいさつ(民俗) アイサツ(ミンゾク) 385.9 00000100X617.8 0070あい(作物栽培)||アイ(サクモツ サイバイ) 00000200X479.64 0070あい(植物学)||アイ(ショクブツガク) 00000300X577.99 0070あい(染料)||アイ(センリョウ) 00000400X191.7 0070愛(キリスト教)||アイ(キリストキョウ) 00000500X141.62 0070愛(心理学)||アイ(シンリガク) 00000600X181.6 0070愛(仏教)||アイ(ブッキョウ) 00000700X158 0070愛(倫理)||アイ(リンリ) 00000800X2-164 0070@相生||アイオイ 00000900X2-5352 0070@アイオワ州||アイオワシュウ 00001000X645.9 0070愛玩動物||アイガン ドウブツ 00001100X789.25 0070合気道||アイキドウ 00001200X773.9 0070間狂言||アイキョウゲン 00001300X319.22 0070愛琿条約||アイグン ジョウヤク 00001400X154 0070愛国心(倫理)||アイコクシン(リンリ) 00001500X361.65 0070愛国団体(社会学)||アイコク ダンタイ(シャカイガク) 00001600X809.4 0070あいさつ(言語)||アイサツ(ゲンゴ) 00001700X385.9 0070あいさつ(民俗)||アイサツ(ミンゾク)

(16)

4.NDLSH(国立国会図書館件名標目表)2008 年度版テキストデ

ータからのデータ取得と整形

4.1 NDLSH2008 のデータ形式と利用する項目 NDLSH2008 の構造は図 7 のとおりである。本来はタブ区切りの tsv ファイルであるが、 表示の都合上タブをコンマに変換し、各行の項目の先頭を一字字下げして表示している。 NDLSH2008 には、件名標目と参照形とが収録されている。どちらも最初が見出し語のよ みで、2 つ目の項目が見出し語であることは同じだが、3 つ目の項目は件名標目の場合に は ID 番号が、参照形の場合には件名標目への参照(USE:を見よ参照)が記される。例 えば、図 7 の項目のうち、1 つ目「安政地震」は件名標目であり、2 つ目「安政東海地震 (1854)」は参照形である。 参照形として収録されている語は、すべて参照先の件名標目の下で、参照されている 語(UF:を見よ参照あり)として記載されているので、本研究では参照形は除外し件名 標目のレコードのみを利用する。また、件名標目のうち細目にのみ使用する件名標目も 除外した。 図 7 NDLSH2008 の構造(一部改変) アンセイジシン,安政地震,ID:00976936,UF:安政の大地震〔アンセイノオオジシン〕 ; 安政の大地震〔アンセイノダ イジシン〕 ; 安政東海地震(1854)〔アンセイトウカイジシン(1854)〕 ; 安政南海地震(1854)〔アンセイナンカイジシ ン(1854)〕 ; 江戸地震(1855)〔エドジシン(1855)〕,NDC(9):210.58;369.31;453.21,NDLC:EG77;GB354;ME75,, アンセイトウカイジシン(1854),安政東海地震(1854),USE:安政地震〔アンセイジシン〕{00976936},,,,, アンセイナンカイジシン(1854),安政南海地震(1854),USE:安政地震〔アンセイジシン〕{00976936},,,,, アンセイノオオジシン,安政の大地震,USE:安政地震〔アンセイジシン〕{00976936},,,,, アンセイノタイゴク(1858),安政の大獄(1858),ID:00560271,UF:日本--歴史--江戸末期--安政の大獄(1858)〔ニホン--レキシ--エドマッキ--アンセイノタイゴク(1858)〕 ; Japan -- History -- Ansei Purge,

1858-1860,NDC(9):210.58,NDLC:GB354,,,, アンセイノダイジシン,安政の大地震,USE:安政地震〔アンセイジシン〕{00976936},,,,,,, アンゼンウンドウ(サンギョウ),安全運動(産業),ID:00560283,UF:産業安全運動〔サンギョウアンゼンウンドウ〕,BT: 社会運動〈地理区分〉〔シャカイウンドウ〕{00571924},RT:産業安全〈地理区分〉〔サンギョウアンゼン〕 {00570113},NDC(9):509.8,NDLC:EL171,, アンゼンカンリ,安全管理〈地理区分〉,ID:00560280,UF:保安管理〔ホアンカンリ〕,BT:危機管理〔キキカンリ〕 {00966427},NT:産業安全〈地理区分〉〔サンギョウアンゼン〕{00570113} ; 交通安全〔コウツウアンゼン〕{00566819} ; 海上保安〔カイジョウホアン〕{00564698} ; 放射線防護〔ホウシャセンボウゴ〕{00563526},RT:安全教育〔アンゼ ンキョウイク〕{00560281} ; 保安装置〔ホアンソウチ〕{00563312},SA:主題細目「安全管理」をも見よ(業種を表 す件名,施設を表す件名,事故や危険を伴うもの・作業を表す件名の細目として用いる.例:自動車産業--安全管理;幼稚園 --安全管理;原子力--安全管理--茨城県--東海村(茨城県);プレス加工--安全管理),NDC(9):509.8,NDLC:EL171;M93 アンゼンカンリ(ガッコウ),安全管理(学校),USE:学校安全〔ガッコウアンゼン〕{00562166},,,,,,, アンゼンキジュン,《安全規準》〈地理区分〉,ID:00944380,USE:主題細目「安全規準」を見よ(例:自動車--安全規準 --アメリカ合衆国),,,,,, アンゼンキョウイク,安全教育,ID:00560281,UF:交通安全教育〔コウツウアンゼンキョウイク〕 ; Safety education,NT:安全教育(学校)〔アンゼンキョウイク(ガッコウ)〕{00934770},RT:安全管理〈地理区分〉〔アンゼンカ ンリ〕{00560280} ; 交通安全〔コウツウアンゼン〕{00566819},SN:学校における安全教育には「安全教育(学校)」 (典拠ID00934770)を使用.,NDC(9):509.8;681.3,NDLC:DK48;EL171, アンゼンキョウイク(ガッコウ),安全教育(学校),ID:00934770,UF:学校安全教育〔ガッコウアンゼンキョウイク〕 ; 交 通安全教育(学校)〔コウツウアンゼンキョウイク(ガッコウ)〕,BT:安全教育〔アンゼンキョウイク〕{00560281},SN: 学校における安全教育について使用. ; 「学校における安全教育及び安全管理」(『日本学校安全会法』に規定された概 念)については「学校安全」(典拠ID00562166)を使用.,NDC(9):374.92,NDLC:FC93,, アンゼンコウツウ,安全交通,USE:交通安全〔コウツウアンゼン〕{00566819},,,,,,, アンゼントウ,※安全灯,ID:00560282,UF:Safety lamps,BT:照明〔ショウメイ〕{00572238},RT:鉱山保安〔コウザン ホアン〕{00566890},NDC(9):561.75,NDLC:PD91,,

(17)

件名標目の各項目の概要は表 4 のとおりである。表の上から順に記載されており、必 須項目である 1 つ目の「件名標目のよみ」と 2 つ目の「件名標目」以外は、すべて導入 句(ID、UF、BT など)につづけて各項目が記載される。なお、表 4 右端の“利用”の 欄は本研究システムにおいて利用する項目に○を、利用しない項目には×を表示してい る。 表 4 NDLSH2008 の各項目の概要(件名標目で使用される項目のみ)15 区分 項目 ※()は導入句 概要 利用 見出し語 件名標目のよみ カナまたは英数字 必須 ○ 件名標目 必須 ○ ID番号(ID) 8桁の数字 件名標目の場合必須 ○ を見よ参照 を見よ参照あり(UF) 当該件名標目に参照がなされている参照形 繰り返し可 ○ をも見よ参照 上位語(BT) 上位語となる件名標目とそのID 繰り返し可 × 下位語(NT) 下位語となる件名標目とそのID 繰り返し可 × 関連語(RT) 関連語となる件名標目とそのID 繰り返し可 ○ 注記 をも見よ参照注記(SA) 下位語を例示する場合などに使用 ○ スコープノート(SN) 一般的な注記 ○ 分類 NDC9版(NDC(9)) 日本十進分類 繰り返し可 ○ NDLC(NDLC) 国立国会図書館分類 繰り返し可 × このデータファイルを、Ruby プログラムを使用して利用する項目のみを抽出し、本研 究システムの目的に合わせて整形し、さらにデータベースに格納するための形式に変換 して利用する。 4.2 NDLSH2008 データの整形 NDLSH2008 ファイルには、表 4 の項目が含まれるが、このうち表右端の“利用”欄 で×印をつけているものは使用しない。上位語と下位語については、NDC を主としたシ ステムを構築する上で、NDC と NDLSH の 2 種類の階層構造が存在することになり、両 者の不整合を避けるため今回は利用しなかった。また、NDLC については、今回は分類に NDC を用いたために利用しなかった。 NDLSH2008 は、正規化のためデータベースの格納テーブルを 3 つに分けた。これは、 表 4 の各項目で利用するもののうち、繰り返しがあり、かつ繰り返される語句を独立さ せる必要があるものとして、「関連語(RT)」と「NDC9 版(NDC(9))」の 2 項目があり、こ れらを別テーブルとする必要があるためである。「を見よ参照あり(UF)」も繰り返しがあ るが、この項目は検索用語句としてのみ用いるので独立させる必要はなく、別テーブル としない。 このため、出力する整形データもテーブルに合わせて 3 種類となる。1 つはメインテー ブルに格納する、「関連語(RT)」と「NDC9 版(NDC(9))」を除いた各項目のデータ、そし てサブテーブルに格納する「関連語(RT)」のデータ、さらに NDC 対応テーブルに格納す る「NDC9 版(NDC(9))」のデータである。整形したそれぞれのデータの一部を表形式に したものを、表 5、表 6、表 7 に示す。

(18)

表 5 図 7 表示部分のデータ整形例(メインテーブル用データ) ID番号 洋書 件名 細目 検索用語句 を見よ参照あり スコープノート をも見よ参照注記 00976936 安政地震 安政地震 アンセイジシン 安政 の大地震 アンセイノオオジシン 安政の大地震 アンセイノダイジ シン 安政東海地震(1854) アン セイトウカイジシン(1854) 安政 南海地震(1854) アンセイナンカ イジシン(1854) 江戸地震(1855) エドジシン(1855) 安政の大地震, 安政の大地震, 安政東海地震 (1854), 安政南 海地震(1854), 江戸地震(1855) 00560271 安政の大 獄(1858) 安政の大獄(1858) アンセイノタ イゴク(1858) 日本--歴史--江戸 末期--安政の大獄(1858) ニホン --レキシ--エドマッキ--アンセ イノタイゴク(1858) Japan -- History -- Ansei Purge, 1858-1860 日本--歴史--江 戸末期--安政の 大獄(1858), Japan -- History -- Ansei Purge, 1858-1860 00560283 安全運動 (産業) 安全運動(産業) アンゼンウンド ウ(サンギョウ) 産業安全運動 サンギョウアンゼンウンドウ 産業安全運動 00560280 安全管理 地理 区分 安全管理 アンゼンカンリ 保安 管理 ホアンカンリ 保安管理 主題細目「安全管理」 をも見よ(業種を表す 件名,施設を表す件 名,事故や危険を伴う もの・作業を表す件名 の細目として用いる. 例:自動車産業--安全 管理;幼稚園--安全管 理;原子力--安全管理 --茨城県--東海村(茨 城県);プレス加工--安全管理) 00560281 安全教育 安全教育 アンゼンキョウイク 交通安全教育 コウツウアンゼン キョウイク Safety education 交通安全教育, Safety education 学校における安 全教育には「安全 教育(学校)」(典 拠ID00934770)を 使用. 00934770 安全教育 (学校) 安全教育(学校) アンゼンキョウ イク(ガッコウ) 学校安全教育 ガッコウアンゼンキョウイク 交 通安全教育(学校) コウツウアン ゼンキョウイク(ガッコウ) 学校安全教育, 交通安全教育(学 校) 学校における安 全教育について 使用. ; 「学校に おける安全教育 及び安全管理」 (『日本学校安全 会法』に規定され た概念)について は「学校安全」(典 拠ID00562166)を 使用. 00560282 Y 安全灯 安全灯 アンゼントウ Safety lamps Safety lamps

(19)

表 6 図 7 表示部分のデータ整形例(サブテーブル用データ) ID番号 参照タイプ 参照件名 参照件名よみ 参照件名ID 00560283 RT 産業安全 サンギョウアンゼン 00570113 00560280 RT 安全教育 アンゼンキョウイク 00560281 00560280 RT 保安装置 ホアンソウチ 00563312 00560281 RT 安全管理 アンゼンカンリ 00560280 00560281 RT 交通安全 コウツウアンゼン 00566819 00560282 RT 鉱山保安 コウザンホアン 00566890 表 7 図 7 表示部分のデータ整形例(NDC 対応テーブル用データ) ID番号 NDC 00976936 210.58 00976936 369.31 00976936 453.21 00560271 210.58 00560283 509.8 00560280 509.8 00560281 509.8 00560281 681.3 00934770 374.92 00560282 561.75 なお、表 5 の“洋書”フィールドは、洋書にのみ使用している件名標目の場合に“Y” とする。これは NDLSH2008 において、件名標目の冒頭に※印がつけられている件名標 目である。また、“細目”フィールドは、地理区分などの細目が付加できるものについて、 その細目の種類を表す。これは、NDLSH2008 において、件名標目につづけて〈〉でくく って付記されているものである。 表 6 の“参照タイプ”フィールドについて、現在は前述した理由から NDLSH2008 の 項目のうち BT(上位語)と NT(下位語)は利用していないため、すべて“RT”(関連語) となるが、今後 BT、NT も何らかの形で利用する可能性を考慮し、フィールドを作成し ている。また、“参照件名”と“参照件名よみ”フィールドのデータは、“参照件名 ID” を元にメインテーブルの件名フィールドなどを参照することで得られるが、データベー スの管理と6章で述べる検索システムの効率化のために作成している。

(20)

5.データベースの構造とデータの格納

本研究システムにおける検索用データベースのテーブルは、NDC データを収めるテー ブルと NDLSH データを収めるテーブルの2つに大別される。NDC データは NDC 本表テ ーブルと NDC 相関索引テーブルの2つに、NDLSH データは NDLSH メインテーブルと NDLSH サブテーブル、NDLSH-NDC 対応テーブルの3つにそれぞれ分けて収められる。 RDBMS(Relational DataBase Management System)として MySQL を使用したが、一 般的な機能のみしか利用していないので他の RDBMS でも実現可能である。 各テーブルのデータは、3章と4章で処理したデータを基に、データベース上で識別 に必要な連番 ID などを加えて格納する。 5.1 NDCデータを収めるテーブル 5.1.1 NDC本表テーブル このテーブルは 7 つのフィールドからなり、その構成は表 8 のとおりである。このテ ーブルに、3.2節で処理した NDC 本表データを格納する。 表 8 NDC 本表テーブルの概要 フィールド 種別 概要 ID int(11) 識別のための連番(自動付与) 分類記号 varchar(20) NDC記号 インデント記号 varchar(50) 階層関係を示す記号(“┃”・“┣”・“┗”) 名辞の種類 varchar(10) 表 1における“事項種別”を基に作成したもの 名辞 text 表 1における“事項”を一部変更したもの 詳細は3.2.4節を参照 分類深度 int(11) 000、100…を0、010、110…を1として分類の深さを表す 詳細は3.2.2節を参照 深度終端フラグ varchar(1) 当該分類項目が最下層であることを示すフラグ 5.1.2 NDC相関索引テーブル このテーブルは 4 つのフィールドからなり、その構成は表 9 のとおりである。このテ ーブルに、3.3節で処理した NDC 相関索引データを格納する。

(21)

表 9 NDC 相関索引テーブルの概要 5.2 NDLSHデータを収めるテーブル NDLSH データを収めるテーブルは、データの正規化のため 3 つに分けられている。そ れぞれのテーブルは、NDLSH_ID フィールドを持ち、この ID を参照することで 3 つのテ ーブルのデータが関連付けられる。 5.2.1 NDLSHメインテーブル このテーブルは 9 つのフィールドからなり、その構成は表 10 のとおりである。このテ ーブルに、4.2節で処理した NDLSH メインデータを格納する。 表 10 NDLSH メインテーブルの概要 フィールド 種別 概要 ID int(11) 識別のための連番(自動付与) 名辞 varchar(100) 相関索引の名辞 検索用語句 varchar(100) 名辞に名辞のよみを加えたもの 相関索引の検索にはこのフィールドを用いる 分類記号 varchar(20) NDC記号 フィールド 種別 概要 ID Int(11) 識別のための連番(自動付与) NDLSH_ID varchar(8) NDLSH2008で付与されているID番号

洋書 varchar(1) 洋書にのみ使用する件名標目であることを示すフラグ 件名 varchar(256) 件名標目 細目 varchar(16) 地理区分などの細目が付加できるものについて、付加でき る細目を表す 検索用語句 text “件名”と“を見よ参照あり”の各語句とそれぞれのよみ を空白文字で区切って羅列する NDLSHの検索にはこのフィールドを用いる を見よ参照あり text 当該件名標目に参照がなされている参照形をコンマと空白 文字のセットで区切って羅列する スコープノート text 一般的な注記 をも見よ参照注記 text 下位語を例示する場合などに使用

(22)

5.2.2 NDLSHサブテーブル このテーブルは 6 つのフィールドからなり、その構成は表 11 のとおりである。このテ ーブルに、4.2節で処理した NDLSH サブデータを格納する。 なお、“参照タイプ”フィールドは、現在はすべて“RT”(関連語)であるが、今後 BT (上位語)と NT(下位語)も何らかの形で利用する可能性を考慮し、フィールドを作成 している。 表 11 NDLSH サブテーブルの概要 5.2.3 NDLSH-NDC対応テーブル このテーブルは 3 つのフィールドからなり、その構成は表 12 のとおりである。このテ ーブルに、4.2節で処理した NDLSH-NDC 対応データを格納する。 表 12 NDLSH-NDC 対応テーブルの概要 フィールド 種別 概要 ID Int(11) 識別のための連番(自動付与) NDLSH_ID varchar(8) NDLSH2008で付与されているID番号

参照タイプ varchar(8) 参照語のタイプ 現在は“RT”(関連語)のみ 参照件名 varchar(256) 参照する件名の名辞

参照件名よみ varchar(512) 参照する件名のよみ 参照件名ID varchar(8) 参照する件名のNDLSH_ID

フィールド 種別 概要

ID Int(11) 識別のための連番(自動付与) NDLSH_ID varchar(8) NDLSH2008で付与されているID番号 分類記号 varchar(20) NDC記号

(23)

6.NDC検索システム

検索システムは、マークアップ言語である HTML に、スクリプト言語である PHP と JavaScript を埋め込んで作成しており、Web ブラウザを用いて使用する。Mozilla Firefox 3.0.11 / 3.5.7、Internet Explorer 6.0 / 7.0 で動作を確認した。 なお、システムの利用対象として図書館の一般利用者を想定しているため、なるべく 図書館固有の、一般で用いられない用語・表現や、一般での用法と異なる用法で用いら れる用語・表現を用いないよう配慮した。そのため、システムの説明において、一部図 書館情報学で通常用いられる用語と異なる用語を使用している場合がある。 検索システムの基幹となるページは、トップページ、キーワード選択ページ、分類表 表示ページ、NDLSH 詳細ページの 4 つのページからなる。この他にアンケート回答ペー ジやヘルプのページ、システムの更新履歴ページなどが存在する。システム基幹部分の ページ遷移図を図 8 に示す。なお、トップページへはどのページからも遷移できる。 トップページに検索語を入力すると、検索ボックス下のラジオボタンの選択により、 キーワード選択ページまたは分類表表示ページへ遷移する。デフォルトではキーワード 選択ページへ遷移するよう設定されている。キーワード選択ページでは、入力された検 索語を NDC 本表と相関索引、NDLSH から検索し、その件数及び該当した NDC 相関索引 の名辞と NDLSH の件名を表示する。この画面で、キーワードの選択もしくは該当したキ ーワードすべてを表示するという選択を行うことで、分類表表示ページへ遷移する。他 方、トップページで分類表表示ページへ遷移するよう選択すると、直接分類表表示ペー ジへ遷移する。分類表表示ページでは、選択または入力したキーワードの分類がツリー 構造で表示される。このページでは、関連分類項目や関連キーワードでの分類表の再描 画や、関連する NDLSH 件名についてその詳細ページへの遷移、表示している分類記号で の蔵書検索(筑波大学附属図書館と東京都立図書館)が可能である。NDLSH 詳細ページ では、分類表表示ページで表示された NDLSH 件名の詳細が確認できるほか、関連語(RT) についてその詳細を再描画することや、表示している件名標目に対応する分類項目を分 類表表示ページへ遷移して確認することが可能である。 なお、各ページの機能の詳細は次の各節で述べる。

(24)

図 8 システム基幹部分のページ遷移図 【トップページ】 【キーワード選択ページ】 【分類表表示ページ】 【NDLSH 詳細ページ】 選択した分類での図書館の 蔵書検索結果ページへ (※外部サイト)

(25)

6.1 トップページ 図 9 トップページの画面構成 トップページは URI:http://inforg.slis.tsukuba.ac.jp/ndcfinder/index.html で識別されるイ ンターネット空間上に存在し、その画面構成は図 9 のとおりである。タイトルロゴ下の リンクは、システムの目的などを説明したヘルプページへのリンクとなっており、その 下にキーワード入力欄と入力後の遷移ページを選択するラジオボタンが存在する。 ラジオボタンで「キーワードを絞り込んで分類表を表示」を選択するとキーワード選 択ページへ遷移し、入力されたキーワードに中間一致する NDC 相関索引名辞や NDLSH 件名が表示される。「すべてのキーワードの分類表を表示」を選択すると分類表表示ペー ジへ遷移し、入力されたキーワードに中間一致するすべての分類項目と NDLSH 件名に対 応する分類項目がツリー構造で表示される。

(26)

6.2 キーワード選択ページ 図 10 キーワード選択ページの画面構成例 キーワード選択ページの画面構成の一例を図 10 に示す。画面上部にある検索ボックス はトップページにあるものと同じ機能を持つ。直近に入力したキーワードがデフォルト 値として入力されている。 検索ボックスの下には入力されたキーワードに該当する分類項目の件数が表示される。 この件数は、NDC 本表、NDC 相関索引、NDLSH それぞれの該当レコード数の合計であ る。件数の下には、すべてのキーワードを分類表で見るか、分類表に表示するキーワー ドを絞り込むかの選択肢が表示される。すべてのキーワードを分類表で見る場合、リン クをクリックするか、リンク左側の アイコンをクリックすることで分類表表示ページ へ遷移する。なお、この場合に生成される分類表は、検索ボックスにおいて「すべての

(27)

キーワードの分類表を表示」として検索した場合のものと同一のものとなる。分類表に 表示するキーワードを絞り込む場合は、下に表示されているキーワード群から分類表に 表示するキーワードを選択する。 「国会件名データベース」とは、NDLSH のことを指す。“国会件名”という名称が、 国立国会図書館件名標目を指すものとして最適であるとはいえないが、他に適当なわか りやすい名称を与えることができなかった。ここで表示されているものは、NDLSH メイ ンテーブルと NDLSH サブテーブルの内容である。 図 10 の NDLSH 表示部分における、「表 10 NDLSH メインテーブルの概要」(20 ペ ージ)と、「表 11 NDLSH サブテーブルの概要」(21 ページ)それぞれのフィールドの 対応を図 11 に示す。 図 11 図 10 の抜粋と表 10・表 11 のフィールドとの対応 さらに、関連キーワードの アイコンをクリックすることで、そのキーワードでの再 検索が可能である。再検索の結果を図 12 に示す。関連キーワードのアイコンで再検索を 行った場合、検索ボックスのキーワードは変更されず入力されたキーワードを保持する。 件名 を見よ参照あり スコープノート をも見よ参照注記 参照件名

(28)

図 12 “カタログ”の関連キーワード“商品”での再検索の結果

なお、NDC 相関索引の表示は、「表 9 NDC 相関索引テーブルの概要」(20 ページ) の名辞のみが表示される。(図 10 参照)

(29)

このキーワード選択ページはシステム公開後に追加したページで、当初のシステム公 開時にはトップページでキーワードを入力すると分類表表示ページに遷移し、中間一致 するすべての分類項目が分類表で表示されていた。 しかしこの方式では、入力されたキーワードによっては該当する分類項目の件数が多 く、生成される分類表が縦に長くなってしまい、目的とする分類項目が他の項目に埋も れて見つけづらくなってしまう場合があった。後述する利用者へのアンケートからも、 『「ペット」を探したいのに、カーペットなど無関係の語句がヒットし不便である。関連 度順に表示できないか。』などの意見が寄せられたために追加した。 “ペット”の中間一致で生成された分類表表示と、NDLSH 件名“ペット”のみから生 成された分類表表示の比較を図 13 に示す。 図 13 キーワード選択ページ導入前(左)と導入後(右)の比較 キーワード選択ページ導入前の“ペット”の中間一致で生成された分類表表示(図 13 左)では、“ペープサート”や“ポジトロン断層撮影” などの分類項目がヒットしてい る。これは、それぞれの項目の「をも見よ参照」に“ペーパーパペットシアター”、“ペ ット(放射線診断学)”が含まれていたためにヒットしたもので、愛玩動物を意味する“ペ ット”は表の上部には表示されていない。キーワード選択ページ導入後は、キーワード 選択ページ(図 14)で「国会件名データベースのキーワード」から“ペット”を選択す ることで、適切な分類表だけを表示することが可能となった。(図 13 右)

(30)
(31)

6.3 分類表表示ページ

(32)

分類表表示ページの画面構成の一例を 図 15 に示す。画面上部にある検索ボックスは トップページにあるものと同じ機能を持つ。直近に入力したキーワードがデフォルト値 として入力されている。検索ボックスの下には、記号(アイコン)の説明があり、その 下部左側に分類表、右側に現在表示中のキーワードと直近に入力された検索語の関連キ ーワードが表示される。 6.3.1 分類表表示と蔵書検索機能 分類表表示ページ左側の分類表は、入力または選択されたキーワードを中心に表示さ れる。表示される分類項目は、「入力されたキーワードに該当する分類項目」を基準とし、 「一階層上の分類項目を基準と共有する項目(基準と同列の項目)」、「基準の一階層下の 項目」、「基準の上位項目のうち分類深度ごとに基準と最も近い一項目」の 3 種類である。 それ以外の分類項目は上位項目にまとめられるか、あるいはつながりのない項目として 表示されない。 分類表で表示される項目を 図 15 を例に説明すると、「基準」は“無機化学”が含ま れる「435 無機化学」(分類深度 2)となる。「一階層上の分類項目を基準と共有する項目」 は、一階層上の分類項目「430 化学」を基準と共有する 431 から 437 までの各項目であ る。なお、438 と 439 は縮約記号であり、共に 437 の下位項目となっているため表示さ れない。「基準の一階層下の項目」は、435.01 から 436 までである。436 も縮約記号であ るため、435 の下位項目となる。「基準の上位項目のうち分類深度ごとに基準と最も近い 一項目」については、まず基準の一階層上である分類深度 1 の項目のうち基準と最も近 い「430 化学」、さらにその一階層上である分類深度 0 の項目のうち基準と最も近い「400 自然科学」がそれぞれ該当する。 検索するデータベーステーブルのフィールドについて、NDC 相関索引と NDLSH につ いてはそれぞれの検索用語句フィールドを検索してその検索結果を NDC 本表に参照して いるが、NDC 本表については名辞フィールドを検索している。しかし、名辞フィールド すべてを検索対象とすると、参照項目なども拾ってしまうため、名辞の種類が「注参照」 (例:「*参考図書の利用法→015.2」など)であるものと「参照」(例:「→:010」など) であるものは検索対象から除外している。 図 15 において、国会件名右側の アイコンをクリックすると、NDLSH 詳細ページ が新しいタブ(ブラウザの設定によっては新しいウィンドウ)で表示される。これにつ いては6.4節で述べる。 この分類表で、青い+アイコン( )がついている分類項目は、下位項目がまとめら れている分類項目である。このアイコンをクリックすることで、その分類項目を中心に 分類表が再描画され、当該分類項目の+アイコンは赤色( )となる。

(33)

図 15 から、「435.3 ハロゲン元素とその化合物」のアイコンをクリックした画面を 図 16 に示す。435.3 の一階層下の項目である 435.33 から 435.37 までの分類項目が表示 されている。また、基準が 435 から 435.3 になったため、435 と同列の項目である 431 から 437 までの項目は表示されなくなった。

(34)

さらに、分類項目右側の 、 のアイコンをクリックすると、それぞ れ筑波大学附属図書館と東京都立図書館の蔵書を検索できる。アイコンをクリックする ことで新しいタブ(またはウィンドウ)が開き、選択した図書館の OPAC で、該当する 分類記号を持つ資料が出版年順に表示される。 6.3.2 表示キーワードと関連キーワード 分類表表示ページ右側の現在表示中のキーワードは、直近に入力または選択したキー ワードが表示されている。ここに表示されるキーワードは、検索ボックスに入力された 語句か、選択された国会件名、NDC 相関索引、NDC 記号のいずれかである。 下の関連キーワードは、直近に入力された検索語の関連キーワードである。ここに表 示されているキーワードを選択することで、左側の分類表が選択したキーワードを中心 に再描画される。関連キーワードの表示は、キーワードや NDC 記号を選択しても変化せ ず、新たなキーワードを検索ボックスに入力した場合にのみ、その表示内容が変化する。 これは、入力したキーワードが検索者の求める主題の中心であると考え、その関連キー ワードを分類表で見比べることを想定しているためである。関連キーワードを選択する たびにこの欄が変化すると、表示される関連キーワードは検索者が最初に想定した主題 からどんどん離れてしまうと考えた。 なお、関連キーワード欄における国会件名には分類表と同様右側に アイコンがあり、 これをクリックすることで、6.4節で述べる NDLSH 詳細ページが新しいタブ(または ウィンドウ)で表示される。

(35)

6.4 NDLSH詳細ページ 図 17 NDLSH 詳細ページの画面構成例 NDLSH 詳細ページの画面構成の一例を図 17 に示す。基本的な構成はキーワード選択 ページにおける国会件名データベースの表示(図 10、図 11)と似ているが、該当する NDC の指示が加わる。該当 NDC は NDLSH-NDC 対応テーブルのデータを使って表示さ れる。 NDLSH 詳細ページの関連キーワード項目の アイコンをクリックして、関連キーワー ドの NDLSH 詳細ページへ遷移する場合は、分類表表示ページから遷移する場合には表示 されない アイコンが表示される(図 18)。

(36)

図 18 図 17 の関連キーワード“商品”を選択した画面 これは、表示されている件名標目を分類表で見るためのアイコンである。分類表表示 ページから NDLSH 詳細ページに遷移する場合には、新規タブ(またはウィンドウ)で開 かれるため、元のタブなどに分類表表示が残っており、そちらを参照できる。そのため、 分類表表示ページから遷移する場合にはこのアイコンは表示していない。アイコンをク リックした場合の画面を図 19 に示す。なお、NDLSH 詳細ページや分類表表示ページか ら分類表表示ページに遷移した場合、画面の中ほどの分類表表示部分が上部に表示され るようスクロールされる。

(37)
(38)

なお、1 つの件名標目に 2 つ以上の NDC 記号がつけられている場合や、NDLSH に対 応する分類記号として参照されている NDC 記号が、補助表を合成したり本表の指示で綱 目表などと合成されたりしたもので、本表内では分類記号として存在しない場合もある。 1 つの件名標目に 2 つ以上の NDC がつけられている場合は、該当 NDC 記号をすべて 表示し、本表に存在しない分類記号が参照されている場合は最も近い NDC 項目を()内 に付記する。図 20 は該当 NDC が 2 つ存在し、そのうちの 1 つ(319.348038)が NDC 本表に存在しない場合の例である。なお、この件名標目には、スコープノート、をも見 よ参照注記、参照件名の各項目は存在しない。 図 20 本表に存在しない NDC 記号が指示されている場合

(39)

7.システムの利用状況とアンケート結果

本システムは、運用テストを行って動作確認をした後、2009 年 10 月 11 日にインター ネットに公開し、広くコメントを求めた。これにより、多数の意見、感想や改善案など が寄せられ、それをもとにより利用しやすいものとなるよう、数度にわたってシステム の変更や調整を行った。なお、システムは現在も公開中であり、引き続きコメントを求 めている。(URI:http://inforg.slis.tsukuba.ac.jp/ndcfinder/index.html) この章では、システムへのアクセス記録や寄せられたコメントについてまとめる。 7.1 アクセス元ホストのドメイン システムを公開した 2009 年 10 月 11 日から、2009 年 12 月 31 日までの間に 3 回以上 アクセスのあったホストのドメインを表 13 にまとめる。なお、アクセス記録には、ごく 一部の例外を除いて製作者によるアクセスは記録されていない。 表 13 システムに 3 回以上アクセスしたホストのドメイン(2009/10/11-12/31) ドメイン アクセス数 全体に占める割合 ac.jp 4562 51.460% ne.jp 2052 23.170% jp 492 5.540% 不明 449 5.100% co.jp 382 4.320% go.jp 230 2.590% com 221 2.500% net 160 1.810% or.jp 144 1.620% ad.jp 107 1.210% ed.jp 11 0.120% 圧倒的に ac.jp からのアクセスが多かった。なお、この 4,562 回のアクセスのうち 2,882 回(全体の 32.7%)は同一組織からのアクセスであった。

表  6  図  7 表示部分のデータ整形例(サブテーブル用データ)  ID番号  参照タイプ  参照件名  参照件名よみ  参照件名ID  00560283  RT  産業安全  サンギョウアンゼン  00570113  00560280  RT  安全教育  アンゼンキョウイク  00560281  00560280  RT  保安装置  ホアンソウチ  00563312  00560281  RT  安全管理  アンゼンカンリ  00560280  00560281  RT  交通安全  コウツウアン
表  9  NDC 相関索引テーブルの概要  5.2 NDLSHデータを収めるテーブル  NDLSH データを収めるテーブルは、データの正規化のため 3 つに分けられている。そ れぞれのテーブルは、NDLSH_ID フィールドを持ち、この ID を参照することで 3 つのテ ーブルのデータが関連付けられる。  5.2.1 NDLSHメインテーブル  このテーブルは 9 つのフィールドからなり、その構成は表  10 のとおりである。このテ ーブルに、4.2節で処理した NDLSH メインデータを格納する。
図  8  システム基幹部分のページ遷移図 【トップページ】 【キーワード選択ページ】 【分類表表示ページ】  【NDLSH 詳細ページ】  選択した分類での図書館の蔵書検索結果ページへ (※外部サイト)
図  12  “カタログ”の関連キーワード“商品”での再検索の結果
+7

参照

関連したドキュメント

平成 21 年東京都告示第 1234 号別記第8号様式 検証結果報告書 A号様式 検証結果の詳細報告書(モニタリング計画).. B号様式

ベニシジミ ショウリョウバッタ 詳細は 32~33 ページ

ダイヤフラム フロア 使用済

活動前 第一部 全体の活動 第一部 0~2歳と3歳以上とで分かれての活動 第二部の活動(3歳以上)

・毎回、色々なことを考えて改善していくこめっこスタッフのみなさん本当にありがとうございます。続けていくことに意味

z 平成20年度経営計画では、平成20-22年度の3年 間平均で投資額6,300億円を見込んでおり、これ は、ピーク時 (平成5年度) と比べ、約3分の1の

ヘッジ対象 燃料購入に係る予定 取引の一部 ロ ヘッジ手段 為替予約 ロ ヘッジ手段 為替予約 ロ ヘッジ手段 為替予約. ヘッジ対象

知的財産別では、商標権の申立てが 348 件(構成比 50.1%、前年比 9.4%増) 、次いで著作隣 接権の申立てが 143 件(同 20.6%、同 31.2%減) 、著作権の申立てが