Title
公文書目録情報のデータベースモデル∼階層構造を持つ
目録情報のリレーショナルデータベースでの実装∼
Author(s)
大城, 博光
Citation
沖縄県公文書館研究紀要 = OKINAWA PREFECTURAL
ARCHIVES BULLETIN OF STUDY(2): 117-123
Issue Date
2000-03-31
URL
http://hdl.handle.net/20.500.12001/8183
公文書 目録情報 のデー タベースモデル
∼階層構造 を持つ 目録情報の リレーシ ョナルデータベースでの実装∼
大城
博光
は じめに 県公文書館 は平成7
年の開館 と同時 にコンピュー タシステムを導入 し、収蔵資料 目録の作成や検索及び所 在管理等 をおこなって保存 と閲覧サ ー ビスに応 えて きた。開館か ら約4
年が経過 したが、これ までの業務経 験 を活か して、公文書館業務 に最適 なシステム像 の設計 をお こなって きた。 通常、設計時の成果 となる設計書や仕様書 には、決定 に至 るまでの経緯 となる 「どの ような手法で設計 し たのか。」、「何故、その ような造 りに したのか。」等の改めてシステムの評価 を行 う際 に もっ とも重要 となる 内容がほ とん ど見 えて こない。 そこで本文では、設計時におけるデー タベースのモデル化 に絞 り、検討過程で使用 した ワークペーパ ーを 用いて、設計の根拠 と手法 を記述 してい きたい と思 う。 リレーショナルデー タベースの設計手順 リレーシ ョナル型デー タベース (以下 :RDBMS)
は、貯 える情報 を行 と列で構成 され る2
次元の表で 現 し、その表 を構成す る要素 (属性 )を自由に組 み合 わせ、 目的の形 (仮想表)で表現す ることがで きる。 全ての情報 を1
つの表で現す と同 じ記述 を何度 もくりかえす ことになるがRDBMS
では、複数の表 を自由 に結合 、分解す ることも可能 に しているOその為RDBMS
の設計では表同士の リレーシ ョンシ ップ (相互 関係)が効率の よいデー タデースシステムを構築す る重要 なポイン トになる0 一般的なRDBMS
の設計手法は、実在する帳票類 を実体表 として捉 え、それを正規化 (*1
) とい う便 利 な指針 に従 って最 も無駄のない構成で、 目的の帳票 となる仮想表 (*2
)を生成 してい く方法である。 本設計では、既存 デー タベースの性能向上 とい う点 もあ り、仮想表の分析 をは じめにお こなった。(*3)
まず、業務 プロセス毎 に必要 とす る仮想表 を洗 い出 し、その仮想表 を構成する要素 を記述の繰 り返 しが存 在 しない ように関連す る要素 同士の グループ化 をお こない、その グループ間の リレーシ ョンシ ップを確立 し データベースモデルを構築 してい く手順 をとった。*
1 効率的なデータベースを設計する為の方法論とその基準。*
2
仮想表には、印刷帳票だけでなくコンピュータ画面に出力される情報も含む。*
3 --・般的に、データベースの実装 ・稼働までには、実体表の正規化までの概念設計、業務プロセス毎の仮想表の検 討までの論理設計、ハー ドウェア構成に準 じておこう物理設計のステップでおこなう。物理設計においてはデー タベースの専門知識が必要となるが、概念設計、論理設計までは業務を熟知 していることが重要となる。概念設 計でおこなう 「正規化」は、きちんと手法と業務を理解 していれば,誰がやってもほぼ同じ結論を導き出せ、デー タベースを構築 したことがある人には自然と身についている技法である。しかし1度もデータベース設計を試み たことのない人には、正規化の目的である 「繰 り返 しをなくす」作業がどういう意味を持つのかピンとこないで あろう。そこで全専門員の共通認識を待やすい仮想表の設計から取 り組むのが日々の業務と密接 し、より理解 し やすい設計手順を踏めると判断した。仮 想表 の分析 と構成要素 の グループ化 デー タベ ース化すべ き項 目を洗 い出す 目的で、 まず検索用 目録 の要素 の検討 をお こなった。 資料 を探 し出す 目的で利用 され る 目録 は、検索者へ どの ような情報 を与 えるか、 またその情報 に どの よう な索 引 を設 け どの ように並べ るかが重要であ る。検索用 目録 の要素 の検討 には、当館 の既存 の 目録構 成要素 の見直 しか らお こない、それ に対 し他 の資料保存機 関の採録項 目も調査 し必要 と思 われる要素 を追加 した。 (*
4
) また、検索用 目録以外 に も、公文書館業務 で は様 々な帳票類 が必要 になる。そ こで 、 シス テ ム改善 要件 (*5
)を考慮 し、各種業務 の流 れ を図式化 した業務 フロー図 (*6
) を作 成 し、業務 の どの プロセス で どの ような帳票類 を必要 とす るのか を分析 した。 この ような流 れで検討 された検索用 目録 や各種 帳票類 を仮想表 と して捉 え、仮想表 を構成す る要素 を関連 す る物 同士 グループ化 した。 (*7) その結果 を図1
に示す。 (*4)資料の受入先で、その資料 目録が既にデジタルデータとして存在する場合は、その目録データを自館用 目録様 式に変換 し利用することにより入力作業を軽減 している。例えば県文書学事課の廃棄台帳データ、県行政情報セ ンターの引渡データ、米国立公文書館のマイクロフィルム目録データ等である。このような他機関の 目録様式と の変換 も考慮 し汎用性を持たせる目的で、国際標準記録史料記述 (ISAD-G)との対応 も検証 した。(
*
5)データベースモデルに影響する主なシステム改善要件 ① 目録の検索時において、キーワー ド検索に頼 り切っているため、検索者が何 らかの文字列を想定 しなければ いけない。また、想定 した文字列に合致する情報が膨大な量の場合には絞 り込みが面倒になる。 (彰日録検索の結果において、箱単位、簿冊単位、件単位の情報が混在 して表示されるのがわか りづらいO ③ある特定 した資料の重複物、複製物等の関連資料の情報検索ができない。 (*6)業務フロー図では、最 も効率的な作業の流れを検討 し作 り上げた。また、その際にコンピュータ処理 として、 現在システム化 されていなかった各種帳票類 も仮想表 として取 り込んだ。(
*
7)グループ化の際には正規化の技法にも従った。図
1
グ ル ー プ要 素 と仮 想 表 の 構 成 受 所 LJr 修 入 蔵餐 イク 復 管 ロ カ 哩 A 料 】影最 ル ⊂コ J、 7一票 受 入 情 報 01 受入 コー ド●
受 入毎 の一連番号 02 受入識別○
引渡 :移管 :寄贈 :寄託 :購 入 :複製作 成 :その他 03 受入 日付○ ○
資料 を受 け入れた年 月 日 04 受入先○ ○
寄贈者 、移 管先 (文書学事 課 )等 05 受入量○
受入単位 の総量 .規模 06 受入資料○
受入資料群 を総称す る名称 07 受入情報○
受入 時の約束事 や受入先が所有す るオ リジナル情 報等 分類 情 報 0089 分類 コー ド資料分類○
○
10 資料分類解説○
内容 情 報 ll 内容 コー ド●
資料 の内容 を特定す る記号 12 タイ トル○ ㊨ ○
資料 の主題 13 サ ブ タイ トル○ ㊨ ○
資料 の副題 14 出所 /編 .著者○ ㊨
出所 または編集者 、著者 15 資料 日付 (自)○ ◎
資料 の作 成 された 日付 (自) 16 資料 日付 (至 ) ○ ◎ 資料 の作 成 された 日付 (至 ) 17 資料解説○ ◎
タイ トルで は不足す る内容 に関す る情報 o 18 発行/ 出版○ ㊨
資料 の発 行/ 出版者 19 数量○ ◎
文字情報 :頁数 映像/音声 情報 :時間 20 資料種 別○ ㊨
文書 ,図書 ,地図,図面 ,空 中写真 ,写真 ,新 聞,映像 ,音声 21 言語種別○ ㊨
資料 の記述 に用 い られている言語 22 個人情報 識別○ ㊨
餐 :有 形態 情 報 23 資料 コー ド㊨
●
●
記録媒体 を特 定す る記号 24 用途識別㊨ ○
閲覧用 :保存用 25 媒体種 別◎ ○ ○
紙,マイクロフィルム,映写テープ,ビデオテープ,カセ ットテープ,CD 26 媒体 形態○
媒体種 別毎 の媒体 形態 27 媒体表題○
記録識別 が1媒体複 数 内容 の際 に、媒体 につ けた名称 28 記録 日付○ ○
媒体 に情報 を記録 した 日付 29 複製元資料 コー ド○ ○
複製物 の複製元資料 コー ド 30 検査 日付○
媒体 の保存状態最終確認 日 31 媒体情報○
媒体 の再生 、修復 、整理 、利用 /公 開制限理 由 .措 置情 報 保 存 情 報 32 修復 日付◎
媒体 を劣化処 置 した 日付 33 修復措 置情 報㊨
媒 体 の保存状態最終確認 日 利 用 情 報 34 閲覧回数 資料 が 閲覧 された回数 35 複写lHl数 資 料が複写 された回数 36 利用識別 通常 :閲覧制 限 :複写制 限(保 存状態 か ら判 断 ) 37 公 開識別 通常 :一部公 開 :非公 開 (資 料 内容 か ら判 断 ) 38 公 開 日付 即 時公 開 :公 開制 限解除西暦 年度 39 最終 閲覧 日付 資料 の最終 閲覧 日付 所 在 情 報 40 所 在識別 書 庫 :閲覧 :館外 :修復 :複製 :整理 :展示 :事務 :編 纂 41 所 在変更 口付 最終 の所 在変更 日付 42 所在備考 所 在変更時の備考 43 収納 コー ド㊨
収納容器記号 注)1)本末では1部の仮想表のみ記載。 2)● :仮想表を一意に決定する要素 (主キー) 〇二仮想表の構成要素 ◎ :仮想表の構成要素で繰 り返 される項 目 3)分類情報と内容情報においてはその後の設計で構造を再検討 した。その構造については第4項 「分類情報 と内容情報の構成」
で述べる。表同士の リレーションシップとその模証 次 にグループ化 した受入情報 :分類情報 :内容情報 :形態情報 :利用情報 :所在情報 :保存情報 を
1
つの 表 として捉 え、それぞれの表の相互関係 を分析 した。結果 を図2
に示す。 図2
表同士の リレーシ ョンシップ (9 「一対一
」(形態情報 :利用情報 :所在情報) 一対一の関係では、片方の表の 1情報 (行 )に対 して、 もう片方のテーブルも1
情報 (行 )だけ関連づけ られる。 この形態は、1
つの表の要素が多い場合やセキュ リテ ィを保つなどの理由で、一つの事柄 に関する 情報 を複数の表 に分けて保存する場合 などに使われる。 形態情報 ・利用情報 ・所在情報は1
つの媒体 を特定するとそれぞれの情報が一意に決定 し、また前述 した 理由 もあてはまらないのであえて分割管理する必要性 もないことか ら媒体情報 として1
つの表に した。 (参 「一対多」
一対多の関係では片方の表の1
情報 (行 )に対 して、 もう片方の表は複数の情報が関連付 け られる。 ・受入情報 :媒体情報1
つの受入先か ら複数の媒体 を受け入れる為、 1
つの受入先が決 まると複数の媒体が存在す る。逆に1
つ の媒体 には受入先 は一意に決定する。 ・媒体情報 :保存情報1
つの媒体の保存情報 (保存状態記録、修復措置記録等)は、検査 または修復 を実施する毎 に複数の記録 が存在する。逆 に1
つの保存情報は1
媒体毎 に管理 される為、媒体は一意に決定する。 ・分類情報 :内容情報 分類情報は、公文書 においては出所 (主管部課)による分類 をとっている。よって1
つの分類 には複数の 資料内容が存在 し、また資料内容は1
つの分類 にあてはまる。 (参 「多対多」(内容情報 :媒体情報) 多対多の関係は 「一対一」
「一対多」 とは異なる特殊 な形態である.2
つの表が多対多の関係 を持つ場合、 RDBM Sでは、この関係 をそのまま実装することはで きない。表同士の リレーシ ョンシップは必ず 1対多(または多対 1)でなければいけない。 しか し、資料 は利用 または保存の 目的で複数の複製物が作成 される。 また、刊行物 においては、同 じ物が何冊 も重複 して存在す る。その場合、内容情報 と媒体情報 は多対多の関 係をもつ ことになる。その ような場合 に、多対多 の関係 を実装す るには
、2
つの表 に対 して1
対多の関係 を もつ結合表 を作成す る必要がある。図3
で示す記録 ア ドレス表がその結合表 になる。 図3
記録 ア ドレス表 による多対多関係表の結合 ′「 ′「 cool 人事関係書 文書MO
O
1
冊子A-0
5
COO2 予算執行綴 文書=
±
≡⊆≡:
二 手
MO
O
2
冊子A-0
6
COO3 工事設計書 文書MO
O
3
マイクロフィルムC-0
2
COO4 工事図面 図面MO
O
4
冊子A-0
7
COO5 会計報告書 刊行物MO
O
5
冊子A-0
8
Li-....- -/
1 謙::::7-…潜等..
.譲葉≡謙二至≡三三 -二 li…≒妻…潮r_L享;::=.:妻…襲蔓≡至co
o
l
MO
O
1CO
O
2
MO
O
2
CO
O
2
MO
O
3
0
0
0
1
コマCO
O
3
MO
O
3
0
0
5
0
コマCO
O
4
MO
O
3
0
1
0
0
コマCO
O
5
MO
O
4
CO
O
5
MO
O
5
cool 人事関係書 文書M
O
O
1
舵A-0
5
COO2 予算執行綴 文書MO
O
2
紙A-0
6
COO2 予算執行綴 文書MO
O
3
0
0
0
1
コマ マイクロフィルムC-0
2
COO3 工事設計書 文書MO
O
3
0
0
5
0
コマ マイクロフィルム C-0
2
COO4 工事図面 図面MO
O
3
0
1
0
0
コマ マイクロフィルム C-0
2
COO5 会計報告書 刊行物 MO
O
4
紙A-0
7
「内容 コー ドと資料 コー ド」 内容 コー ドは、資料の内容 を特定す るコー ドで、同 じ内容の資料 には同 じコー ドが用い られ、図書類の出 版時に印刷 されているISBN
コー ド等 と同様の機能 を持つ。 これはシステム内部での管理 に用 い表面的に は意識 されない。 これに対 し資料 コー ドは、その資料の保存や物流管理 をお こな う為 、それぞれの媒体 自体 に資料 コー ドラ ベルを貼付 し、媒体 を特定す るコー ドになっている。 「記録 ア ドレス表の仕組み」 記録 ア ドレス表 は、内容 コー ドと資料 コー ド及 び媒体 に内容が記録 されているア ドレスの3
つの項 目で構 成 される。記録 ア ドレス表 によ り、内容情報 と媒体情報 をその どちらか らで も操作 で きることが可能になる。 図4
の例で説明す ると、資料 タイ トル 「予算執行綴」 を特定す る と、その情報が記録 されている2
つの媒体 (資料 コー ド:MO
O
2
,
MO
O
3)
の情報 まで取得す ることがで きる。 また、資料 コー ドMO
0
2
の媒体 を特定 す る と媒体 には 1コマ 目に 「予算執行綴」 と
5
0
コマ 目に 「工事設計書」 と1
0
0
コマ 日か ら 「工事 図面」 が記鐘 され ていることがわかる。 これはマイクロフィルムだけでな く、複数の資料の複製 を 1つの媒体 に納める記録媒 体(
CD
等 )で も同様の管理が行 える。 また、情報の登録時においては、従来は記録 した複数資料の総称 を その媒体の タイ トルに していた為、内容情報が不足 していたのに対 し、その媒体 自体の媒体情報 を登録 し複 製元の情報 を選択設定するだけで内容情報の設定が行えるうえ、媒体間の関係 (正副)までシステム管理で きるようになった。 分類情報 と内容情報の構成 検索者が資料 を特定す る上で提供すべ き情報 と方式の検討 を進めてい き、分類情報 を資料 ガイ ドとシリー ズ、内容情報 をタイ トル と内容情報 に分割 し、よ り整理 された方式で情報 を提供で きるように改善 した。 「資料 ガイ ド」 :当館で どの ような資料 を収蔵 しているのかを利用者 に把握 させ る為、資料群 を階層的に分 類する。(*8
)
機能的には、検索時のキーワー ドとの組み合わせ またはによる絞 り込みやキー ワー ドが想 定で きない時には目次的役割 を果たす。 「シリーズ」 :資料 ガイ ドの最下位 レベル配下で、その資料群の個別の分類 としている。公文書 においては 事務分掌 に基づいた仮想の標準 フォルダー となる。 「タイ トルとサブタイ トル」 :行政が 日常の慣例業務か ら発生 した文書 を綴 る簿冊は、逐次刊行物 と同様に 年度や分冊記号 を除 くと殆 ど同 じタイ トルになる。そこで資料の主題 を示す タイ トル と検索時の主題の特定 には直接結びつかない年度や分冊記号等のサブタイ トルに分割 し、同一 タイ トルでグループ化 してサブタイ トル との階層構造 を持たす ことによ り、検索の応答時によ り整理 された帳票形式で応答することがで きる。 上記で述べたそれぞれの表の関係 を図4
に示す。 図4
資料内容 に関する情報の構成 「検索時における画面体系」 資料 ガイ ド- シリーズ表- タイ トル表-内容情報表は全て1
対多の階層構造で結 びついている。この階層構 造 を持つ資料 目録 を図5
に示す階層的な画面体系で表現/応答する。(
*
8)資料ガイドは2次元の表で管理するが、最大10レベルの階層体系をアプリケーションで動的に表現する仕組み になっている。図
5
検索時の画面体系 設計 を終 えて。 行政にもリス トラの波は押 し寄せて きている。 リス トラクチ ャ(
r
e
s
t
r
uc
t
u
r
e:
再構 築 ) は人減 ら しばか りが手段 ではない。例 えばこれ まで3
人月かかっていた作業 を1
人月で済むよう業務の効率化 をはかるの も リス トラである。その際 に夜通 し作業 していて もコス トのかか らない コンピュータを利用 し、作業の効率 を 上げ、サービスを向上 させ るのは大 きな意味 を持つ と思 う.そ うい う意味で今 回のシステム設計 も稼働時に はリス トラとしての成果があがることであろう。 最後に、2
1
世紀のス ター トに合わせ、ここで紹介 した検索 システム を'ア-カス2
1
'(
Ar
c
has
:
Ar
c
hi
v
e
s
Admi
n
i
s
t
r
at
i
onSys
t
e
m)
とい う名称 (仮 )で当館のホームページでの稼働 を予定 してい る。 この ような 設計を経て構築 された検索サー ビスを実際に利用 していただ き、評価 していただきたい。今後はア-カス