Author(s)
黎, 三羊; 野村, 直美(訳)
Citation
沖縄史料編集紀要 = BULLETIN OF THE
HISTORIOGRAPHICAL INSTITUTE(38): 77-82
Issue Date
2015-03-27
URL
http://hdl.handle.net/20.500.12001/18767
所蔵檔案のデジタルデータの安全管理について
中国第一歴史檔案館網絡処副処長 黎 三羊 翻訳:野村 直美 明清檔案は中華民族の比類なき至宝であり、同時に重要な世界的歴史文化遺産でもある。 これら貴重な檔案史料は体系的に整っているばかりでなく、内容も豊富であり、さらに非 常に高い歴史的価値、文化的価値かつ研究的価値が備わっている。檔案は国家と社会の記 憶を構成するだけでなく、情報社会の基礎であり、特殊で独特な情報資源として、人間の 社会活動において歴史の真実を記録することで、歴史を伝承し証言する役割を担ってきた。 一 所蔵檔案デジタルデータの形成 所蔵檔案のデジタル化によって、社会に大量の歴史檔案の情報データを提供し、その利 用価値を見いだし、その潜在的な能力を発揮させることは、檔案に携わる者の重要な任務 である。所蔵檔案のデジタルデータは明清歴史檔案を主として、檔案の整理、デジタル化、 書誌データの記録など各段階に及び、内容は主に檔案の目録データ、デジタル画像、全文 データなどが含まれる。 2011 年 5 月、当館は正式に明清歴史檔案の整理とデジタル化補修プロジェクトを始動 させ、専門業者の力も借りながら、本館の専門データ管理を統合し、所蔵する全檔案史 料を対象に一件ごとの整理を行った。当館が保存する明清檔案は約 1000 万件余、全部で 74 の全宗に分かれており、その大部分は清代の檔案で、明代の檔案は約 3600 件余である。 当館は3年余りの歳月にわたって、明清歴史檔案の整理とデジタル化を推進する中で、現 在までに文書単位の目録を 800 万件余、詳細な書誌データの記録による検索が可能な目 録が 300 万件余、デジタル檔案が 400 万件余、檔案のデジタル画像が 4800 万枚余、7 種類の簿冊(帳簿)式の檔案全文デジタル化を完成させ、全文檔案は1億 7300 万字に及ぶ。 現在、当館は檔案の情報化プロセスを加速させ、現代のコンピュータネットワーク技術を 利用することにより、明清檔案を適宜デジタル檔案データに変換させている。LI Sanyang, transl. NOMURA Naomi: On the Security Digitization Management Project for Records at the First Historical Archives of China
二 所蔵檔案デジタルデータのネットワーク上の安全保障について 所蔵檔案の整理とデジタル化プロジェクトは大幅に進展し、明清檔案のデジタルデータ は、毎日約2テラバイトの勢いでデジタル化が進んでいる。当館の檔案デジタルデータの メモリー容量とバックアップ総量はすでにテラバイト(TB)からペタバイト(PB)に 到達しており、大容量デジタルデータの生産に対応するために、従来のコンピュータ室お よびコンピュータネットワークを新しく改造し、容量を拡張することが急務となっている。 1.コンピュータ室の改造とネットワーク展開及び設備の更新 コンピュータ室は各種コンピュータシステムと関連設備の専用スペースであり、コン ピュータ室の安全性を保証することによってはじめてデジタルデータの安全が保証される。 当館は明清歴史檔案の整理とデジタル化プロジェクトが正式に始動した際に、7部屋のコ ンピュータ室の温度や湿度、空気清浄度、静電気防止、電磁波妨害の防止およびコンピュー タ室の空調通風システム、無停電電源装置、静電気防止板、防火設備などをリニューアル した。同時に、コンピュータ室のネット環境及び設備に対して、二度にわたり改造と更新 を行った。 現在のネットワーク構造は二層(ハブ-アクセス)になっており、まず1台のハブを 中心として 1,000 メガベースの基幹デジタル生産ネットワーク環境をつくり、その下に 100 メガベースの事務用ネットワーク環境を構築し、ネットワークアクセス端末を 900 余、さらにハブ 45 台、サーバー 25 台を装備した。全館の IP アドレスを 19 のセグメン ト(1)に分割し、アクセス制限を設けることで、LAN によるデータ共有と利用を実現している。 ネットワークデータの主要サーバー設備は5組で、その中の EMC CX-120(2)は部分的にデ ジタル完成品データ(JP 2)のバックアップ、HDS AMS-2500(3)は主にデータ加工したり、 情報公開のプラットホームや、データベース、JP 2規格の完成品データ保存等に用いられ、 同時にデータの読み取りを制限することで高速データ読み取りと書き込みも可能にしてい る。つまり、アイシロン社(4)のシステムを主にデジタル化と完成品データの記録において使 用し、また、事務ネットワークデータの保存、磁気テープデータ庫をメモリーネットワー ク(SAN)(5)及び各主要サーバーと連接し、TIFF 規格データを磁気テープへ書き込むことで バックアップをとり整理保存する。そのために我々はコンピュータ端末 500 台余、プリ (1) コンピュータ関連で、ひとまとまりのグループを指す用語。 (2) サーバーの商品名。 (3) サーバーの商品名。 (4)Islion Systems。米国・シアトルのシステム会社。
(5)Strage Area Network。サーバー(ハードディスク)や磁気テープ装置など外部記憶装置間の専用ネッ トワーク。一般的な LAN に比べ、大容量データの一括管理に向くとされている。
ンター 90 台余、スキャナー 120 台余を揃えた。現在までに、檔案の情報化管理システムは、 既に5つの主要プラットホーム、4項目の WEB サービス、5つの業務サブシステム、6 つの作業用ソフトが開発され、6つのデータベースが構築されている。現在では、業務上 密接なつながりを持つ檔案の出入庫、整理、デジタル化、書誌データの記録、検索利用な どをオート化し、迅速かつ連続して行う事ができるようになった。 2.所蔵檔案のデジタルデータの安全な受理と科学的な管理 デジタル檔案の安全な受理の全行程を監督管理する中で、作業システム、技術基準、作 業プロセスを確立し、大容量のデジタル檔案の出入庫作業などの関連付けを実現する。 大容量のデジタルデータ管理の作業において、データベースはまず先にシステムの作業 条件を満たすものでなければならない。データ同士の関係を明らかにし、データの確実性 と合致性を保証し、機密安全性を高め、プログラムの操作或いは応用を迅速に行い、複数 サーバーからのデータの読み取り速度を高め、検索効率を高める必要がある。またオラク ルデータベース(6)技術は専門的に大容量のデータ管理並びに応用技術に対応しており、大型 データベースの管理に適したオラクルデータベースを選択したことにより、今後データが さらに増えた時、データ移行の手間を省くことができる。 同時にオラクルデータガード技術(7)を採用し、データベースのバックアップをとること は、(運用上の避けられない)処理待ち時間や突発的に起こる事故・故障などによっても たらされるデータベース機能停止の際、迅速に復旧作業に切り替え、データの安全性を確 保することができる。 オラクルデータベースは、データベースシステムの各種データ、つまり構造化データ(8)と 非構造化データ(9)を集中して蓄積、管理することができる。オラクルが保護した構造化デー タとその情報は比較的扱いが簡単だが、一つの情報を構造的な形式から非構造的な形式に 変換するとき、状況は一変し非常に複雑なものになる。さらに非構造化データが増えてい く速度は構造化データの 10 倍から 20 倍になる。非構造化データに関して、私たちは集 中管理モデルを採用し、データセンターを立ち上げ、集中して各部門の檔案データの受理、 統計分類、データの保存、保護運用、データの更新、共有、合致性の検査、バックアップ、 修復などデジタルデータ管理作業の確実性を保証している。 オラクルのデータベースはパーティション技術を通して大容量データのバックアップを (6) 世界的に最も広く使用されている商用データベース。
(7)Oracle Data Guard。自然災害などが発生した場合に、遠隔地の予備データベースにネットワーク経由 で自動的作業に切り替える機能。
(8) 項目や入力形式を予め決めて作られるデータ。 (9) 形式に決まりがなく、不揃いなデータ。
可能にし、不揃いな規格のデジタルデータの特徴に基づき、選別保存する対策を取ってい る。つまり、主にオンライン、ニアライン 、オフラインの三つの方法である。オンライン メモリーは主に生産加工されたデジタルデータ、完成品データの受理と利用データの保存、 ニアラインメモリーは主に檔案データの整理保存、オフラインメモリーは整理保存した檔 案データを多種多様なメディアにバックアップを取るために用いる。 檔案情報管理システムを利用することで、大容量デジタルデータの安全な受理が実現可 能となった。デジタル檔案の安全な受理は、デジタル画像の生産段階における加工部門で、 画像生産時に MD 5値(10)を計算し、同時に MD 5値を基準に基づいて自動的に受理し、デー タの受理、移行、バックアップおよびデータの修復など、各作業段階において再計算した MD 5値との比較検証を行うことで、データの完成度、合致性と有効性を確実に保証する ことができる。 3.所蔵檔案のデジタル情報の様々な形でのバックアップ 所蔵檔案のデジタル情報の長期保存に関する安全問題は、檔案館のデジタル化を行うに 当たり無視できない重要な事項である。檔案館のデジタル化事業において、デジタル檔案 情報に安全な保護措置が取られることで、はじめてデジタル檔案情報の安全性が確保でき るのである。当館の檔案デジタル化は各種の紙による檔案から、電子スキャンを経て、そ の情報が圧縮処理されてデジタル情報へと変換され、コンピュータネットワーク設備によ り、保存、整理、書誌情報が記録され、利用される。従って、デジタル情報の長期保存は、 記録媒体の性質上の特性から、デジタル処理と保存形式の変換に関する条件も含んでいる。 デジタル情報の長期的な保存のためにも、情報の完成度と有効性を統一する必要があり、 合理的な形式変換の方法と記録媒体の変更を通して、情報の有効性を保証し、そしてはじ めて情報データの継承を保証する。加えて、当館で作成された檔案のデジタル情報は、長 期保存だけでなく永久保存が求められているのである。 デジタル檔案情報の多様な媒体によるバックアップは、様々な技術、例えば光ディスク、 ハードディスク、磁気テープ、マイクロフィルムなどを用い、すべて様々な形態で、様々 な場所でのバックアップが可能である。同時にこれは、各種技術の統合的な利用であり、 このデジタル情報の様々な形、様々な場所でのバックアップの各段階に応じて合理的な実 施規則を制定し、システム化の基準とし、これによって各作業段階を合理的につなげ、所 蔵デジタル檔案の正確さ、完成度、有効性が確保される。大容量データの整理保存のバッ (10) 認証やデジタル署名などに使われるハッシュ関数(一方向要約関数)のひとつ。原文を元に「ハッシ ュ値」を発生し、通信経路の両端で比較することで、通信途中で原文が改ざんされていないかを検出 することができる。
クアップ媒体として、当館は大型の磁気テープデータ庫を採用しており、データのバック アップが成功したか否か、デジタルが復元できたか否か、復元されたデータが完全に使え るかどうかについては、厳密に確認しなければならない。従って、私たちはデータのロー ルバック検証システム(11)を採用し、磁気テープデータ庫の機能システムテストを踏まえた上 で、それぞれの完成したバックアップデータから抽出してロールバックテストを行い、磁 気テープから復元したデータの読み取りが可能か、情報の破損や消失がないかどうか確認 する。 三 所蔵檔案デジタルデータの LAN 内での安全な共同利用 コンピュータネットワークの出現によって檔案情報データの一大プラットホームへの提 供が可能となり、明清歴史檔案のデジタル化は、ネット技術による檔案領域での基本情報 の提供を可能にし、それは明清檔案の今後の利用にとって充分な裏付けとなる。インター ネットの安全性を保証するために、当館が所有するローカルエリアネットワーク (LAN) へ アクセスするコンピュータには全て「中軟」(12)のセキュリティシステム(13)がインストールされ ている。様々な管理方法を用いてコンピュータのローカルエリアネットワーク (LAN) へ のアクセス、移動メモリー(USB メモリーなど)の使用、ダイヤルログインなどを監督し、 ウイルス駆除ソフト ESET NOD32(14)を通してウイルスやトロイの木馬に対して駆除と防御 を行っている。 檔案館におけるコンピュータネットワーク技術の利用によって、檔案利用者は伝統的な 利用方式、つまり時間・空間・檔案の数量及び利用形式等、檔案資料の調査方法を凌駕す ることができる。デジタル檔案情報は、利用するという点において、伝統的な紙の檔案情 報よりも復元性に優れており、使用しやすく、検索速度も速く、探しあてた文書も正確で ある。デジタル檔案提供閲覧サービスを利用することは、紙の檔案原本の頻繁な出納や閲 覧をやめ、紙原本の破損や盗難を防ぐことになり、原本の長期保存にも有効であり、紙原 本の安全性をより一層高める。同時に檔案の利用率を高め、遠隔地の檔案利用者がネット を通して情報データを共有することを実現させ、気軽にインターネットで自分の必要とす る資料を探し出す事ができ、遠隔地における檔案調査の課題を解決する事ができる。閉ざ (11) データベースに障害が発生したときに、自動的に元の(正常な)状態までデータを巻き戻して、改め て処理を開始すること。 (12) 中軟国際有限公司。2000 年に創立された中国大手の総合的なソフトウェアと情報サービス企業。 (13) ホストコンピュータ管制と監査システム及びネットアクセス制御に関する危機管理システム。 (14) スロバキアの Ese 社が開発したウイルス駆除ソフト。
された檔案サービスから開放された社会サービスへと拡大するのである。 明清檔案情報化事業は、長期的かつ困難なプロジェクトである。当館は、現在、大々的 に檔案の整理と檔案のデジタル化を推進しており、明清代の所蔵檔案のデジタルデータは 国内の檔案関係機関において屈指のものであり、檔案デジタルデータ及びバックアップの 総量は既に所蔵する檔案史料の現物、マイクロフィッシュと並ぶ重要な所蔵資料となった。 また、所蔵檔案の詳細な書誌データの記録、および全文データ化などの作業もさらに続 き、所蔵檔案のデジタルデータの管理業務はより厳しく、より一層の試練を受けるであろ うことが予想される。従って、今後我々は常に積極的に模索し、研鑽を積み、経験を総括し、 常に各セクションの業務システムと基準を改善し、所蔵檔案デジタルデータの安全管理業 務の質を高めていかなければならないのである。 ※本稿は 2014 年 11 月 21 日(金)、平成 26 年度沖縄県歴代宝案編集委員会において、中国第一 歴史檔案館の黎三羊網絡処副処長が行った報告「浅談館蔵檔案数字資源安全管理」の翻訳である。 副知事表敬(2014 年 11 月 20 日) 左:王小紅女史 中央:高良倉吉副知事(当時) 右:黎三羊氏