• 検索結果がありません。

歴史資料を解析する─歴史知識学の創成─

N/A
N/A
Protected

Academic year: 2021

シェア "歴史資料を解析する─歴史知識学の創成─"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

1.は じ め に

「歴史知識学」は歴史事象を分析し,多様な目的に合 わせた形式化の方式を研究する学問領域である.歴史事 象とは,現時点を基点に過去に発生した事象を指すが, その事象を分析する以上,その事象が何らかの記録状態 にある事象に限る.記録状態は時代によって異なり,記 録媒体の変遷に伴い分析の方式も異なる.例えば古代に おいては洞窟内の壁画であったり,土器であったりする. 中世以降は紙資料(史料)が主流となり,記録化する道具・ 材料も多様で,表現形態も多様である. 一方,歴史事象の利用目的は多様であり,事前にすべ ての利用目的を想定して要求事項を列挙することは困難 である.歴史事象の利用例として,宅地造成計画におい て「古地図」の分析をもとに「古道」を特定するという 事例があげられる.歴史事象は主に人類(人間)の営み に関わる事象である.その歴史事象を史料を解析し抽出 するには,表出された既知の歴史知識(例:「古道」の存在) を回帰的に利用する人工知能の諸方式が有効である.こ の方式の確立を目的に,本稿においては,2 章で歴史知 識学について説明し,3 章で史料データの管理・提供シ ステムの機能について述べる.また,4 章で史料データ を分析し歴史理解を支援するツールと事例を紹介し,歴 史知識学は専門家である歴史学者に有用であるだけにと どまらず,史料解読や歴史理解の楽しみを,一般の歴史 愛好家にまで広げるものであることを示す.

2.歴 史 知 識 学

史料を発見し,何らかの形態に収納・保管し,内容を 解読し,歴史的事項を表出し,整理し,公表する過程を「編 纂」と呼ぶ.またこの過程を対象とする学問を「史料学」 という.史料学において,その対象となる史料は,原史 料そのもの,もしくはその完全な写しでなければ,編纂 に供することができない.そのため,史料の収納・保存 管理,また史料の模写あるいは撮影(近年ではディジタ ル撮影)が重要な機能となる.この史料管理から編纂結 果の提供までの過程をシステム化する方法の研究を行う 学問を「歴史情報学(historical information science)」 と呼ぶ.特に史料のディジタル変換,史料情報(メタデー タ)の作成・提供過程の最適化が主要な課題となる. 史料解読・編纂には多種多様な歴史知識が駆使される. さらに歴史事象の活用(参照)には,史料の内容理解が 必要になる.史料からの歴史知識の抽出は,現時点では, 歴史学者の知的活動に依存している.しかし,歴史学者 が人間である以上,コストや精度の問題が生じる.この 問題を解消するには,史料からの分析知と史料解読・編 纂の Know-How(暗黙知)を駆使し,史料解読の効率化 のための機能,および分析知(歴史知識),暗黙知(経験値) の管理・提供の機能を確立する必要がある.この機能の 確立を図る学問を「歴史知識学(historical knowledge-based science)」[横山 09] という. 本稿では,特に,歴史情報学および歴史知識学に関 連した課題を中心に取り上げ,史料のディジタル化や データ化に関連した課題は,別稿に委ねる.これまで, 石川は主に史料管理から編纂結果の提供までの機能研 究を推進し,ADEAC(A System of Digitalization and Exhibition for Archive Collections)を構築,現在,運 用に供している.赤石は主に歴史知識の抽出・理解支援 機能の研究を推進し,多様な可視化システムを構築・公 表している.両機能の研究は,相互に依存し合う.そこで, 以下,提供機能と可視化機能について概説する.

歴史資料を解析する

─歴史知識学の創成─

Historical Knowledge-based Intelligent Tools for History Explorations

赤石 美奈

法政大学情報科学部

Mina Akaishi Faculty of Computer and Information Sciences, Hosei University. mina@hosei.ac.jp

石川 徹也

TRC-ADEAC株式会社

Tetsuya Ishikawa TRC-ADEAC Inc.

ishikawa@toshokanshinko.or.jp

Keywords:

historical knowledge-based science, visual analysis tool. 「人工知能と歴史」─歴史を知る─

(2)

3.史料の管理と提供

史料から歴史知識を抽出し,その結果を検証(比定) するには,原史料を誰もが閲覧できなければできない. しかし,我が国において史料は,個人,寺社などの組織体, 図書館・博物館などの公共施設,大学といった多様な機 関(場所)に所蔵(存在)されていて,その存在実態は, 依然,わからない状態にある.歴史学者は,研究の過程 で史料の存在を推測し,所蔵機関に問合せ存在の確認を 行い,所蔵機関の許諾のもとに,その場で書取り(模写) したり,あるいは撮影したりし,それをもとに解読など を行っている.ときに原史料が,歴史学者が所属する機 関に寄託あるいは寄贈される場合もある.対して,我々 市井の民は,原史料にしろ,模写にしろ,一般的には所 蔵機関の展示物(モノ)を見る以外ない.常設展示にし ても,また企画展示にしても,限られた展示角度(視点) からのみ見ることになり,史料の子細までは実際にはわ からない.そこで,史料データの管理・提供機能の確立 が必要になる.本章では,史料を,我々にいかに身近な モノにするかを目的に,考察し開発したディジタルアー (図 1 参照)[石川 13].当研究開発の最大の課題は,個々 の課題の機能研究に終わるのではなく,運用の実現を優 先に,実用性(usability)と実現性(operability)を重 点に研究することが重要となる.そこで,産学連携研究 を目指し,5 社の参画を得て推進し*1,成果の利用に関 して最終的に大学から民間での運用許可を得て,TRC-ADEAC 株式会社が組織され,現在,クラウド型プラッ トフォームシステムとして運用されている [ADEAC]. 2016年 8 月末現在 52 機関(holder)の史料約 17 000 点(史料点数の計上は実際には難しいので約とする)を インターネットで検索・閲覧に供している.検索・閲覧 は原則無料である. ADEACには,ディジタル化された歴史資料とメタ データが格納され,それをもとに,①全文テキスト検索, ②原本の高精細画像の閲覧,③歴史資料の横断検索など の機能が提供される [田山 16].本章においてシステム 機能の一部を紹介する. 3・1 史料のテキスト検索 ADEACのテキスト検索機能として本文中の文字列 (史料の翻刻データ,史料のメタデータ内の解説)を対 象に,各種史料を横断検索することが可能である.この ため,おのおのの史料の範疇を超えて,注目したい情報 を探すことが可能である.例えば,「本多正純」をキーワー ドとして検索した場合,①高根沢町図書館/高根沢町史 ほか,②石川県立図書館/大型絵図・石川県史,③長野 県立歴史館/信濃史料,④西尾市岩瀬文庫/古典籍書誌 データベース,⑤堺市立中央図書館/堺市の史料が得ら れる.東京大学史料編纂所の大日本史料総合データベー スでは「本多正純」と「真田信繁」の直接の関係を見つ けることはできなかった(2016 年 8 月現在)が,③の 信濃史料という地方の史料においてその関係を見つけら れた.このことは,地方史として編纂される歴史事象の 表出が,中央で編纂される正史と融合することにより, より豊かな歴史編纂が可能であることを示している. 3・2 史料の閲覧機能 ADEACでは,高精細画像として格納されている原史 料(文書や絵図など)をブラウザ上でシームレスに拡大・ 縮小することが可能である.ADEAC に搭載されている ビューアには以下の機能をもたせ,史料とそれを解釈す るための補助資料を連携させて提供している. ①重ね・並べ:翻刻文や異なる地図など,二つの画像 を同時に表示する.重ねは,二つの画像を重ね合わ せ,重畳表示を可能とする.並べは,二つの画像を 並べ,同じ内容の箇所が表示されるように連動表示 図 1 ADEAC のシステム概念図 図 2 キーワード「本多正純」による横断検索結果例 *1 大日本印刷(株),丸善(株)(株)雄松堂(当時),(株)コンテンツ.(当時),(株)図書館流通センター,

(3)

する(図 3 参照). ②ジャンプ:画像の特定箇所へのリンクを辿り,当該 箇所を拡大表示する(図 4 参照). ③ 3D 表示:3D 画像とインタラクティブな 360°回転 表示を可能とする. 3・3 ADEAC の運用効果 ADEACにより,公開が難しかった多様な歴史資料を 容易に閲覧することができるようになった.これにより, 一地方に埋もれていた貴重な史料(例:地方文書)を, 広く世界に知らせることができ,新たな学説の展開を生 みだし,さらには当該地域への来訪者の増加など,その 地域の地域学習・文化活動の活性化に寄与しだしている. さらに,史料がディジタル化されることにより,そのデー タをもとにレプリカを作成するなど,多様な利用により, 地域の産業・経済活動の発展に結び付く可能性がでてき ている.このように,ディジタルの世界と現実の世界が 互いに影響を及ぼしながら,歴史知識の深淵を探ること を可能にしている.

4.歴史知識の抽出と歴史理解支援機能

政治史,地方史などの編纂された歴史は,為政者や有 力者の命により,各地に残されている史料をもとに,取 捨選択されたものである.現在,ADEAC などのシステ ムにより,原史料の直接閲覧による検証や各種のメタ データの付与や参照が可能となり,一個人が所有する データと併用することによって,独自の歴史解釈を展開 することが可能となってきた. 大量の情報を保持し,検索要求に対して正確かつ高速 にアクセスする機能を提供するコンピュータは,曖昧な 検索要求に対して,融通を利かせて返答することは不得 手である.これに対して,人間は,情報を圧縮し,必要 に応じて情報を再生して再編集することに長けている. 歴史的事象という点と点をつなぎ,因果関係を推測し, その検証を行うためには,人間の柔軟な発想を原点とし, 各種史料に基づき,人間の解釈や説明を裏付けしていく ことが必要とされる. そこで,大量の史料から,ある程度の確からしさを もつ連想を誘導する仕組みを提供することにより,不 確実な事項から,関連する事項を読み出し,歴史事象 間の関係を提示することを可能とするツールの開発を進 めている.本章では,編年型データ解析ツール(CAT: Chronicle Analysis Tool)についてその仕組みと事例を 紹介する. 4・1 属性データの関係性の俯瞰 大量のデータから,有用な知識を獲得しようとする場 合に,データの概要や属性の関係性がわかっている場合 には,テキストマイニングやデータマイニングの手法を 適用することが可能である.しかしながら,属性間にど のような関係があるのかわからない場合には,ユーザが 試行錯誤しながら,関係を見つけていく作業が必要とな る.関係や規則を明示的に記述できる場合は,自動化・ 高速化の技術を利用することが可能であるが,その前提 として,どのような関係を見つければよいか自体を探る ことが必要とされる. そこで,著者らは編年型データ(時間属性とその他の メタデータを付与されたテキストデータ)を解析するた めの汎用的な方法論,および,手段の提供を目的として, データを視覚化する CAT の開発を進めている. 4・2 編年型データ解析ツール CATは,大量の編年型データを対象とし,さまざま な視点から,データの経年変化を視覚化し,その分布や パターンの変化の発見から,漠然と認識していたことの 数値的な確認や,新たな発見のための気付きの獲得を支 援するためのツールである.具体的には,scope,axis, focusのパラメータを設定することで,情報の時系列分 図 3 土方歳三書簡(小島資料館,東京都) 図 4 善光寺道名所図会(嘉永 2 年,1849 年) (信州地域史料アーカイブ,長野県)

(4)

布状況を俯瞰し,解析の観点を見つけ,詳細分析に至る 解析プロセスを支援するシステムである. 図 5 に,CAT の構成を示す.下層の第 1 層では,デー タをフィルタリングし,対象データの絞り込み方を変化 させることにより,上層でのデータ分布,および値の変 移パターンへの影響を見ることを可能とする.scope は, 扱うデータの時間属性に関する範囲を規定する period と時間属性以外の属性に関する制約条件を規定する viewpointにより構成され,データに対する絞り込み条 件を規定する. 中間の第 2 層においては,絞り込まれたデータに対し て,視覚化のための軸を設定し,データ分布を概観し, 分布パターンの発見を促す.パラメータ axis は,時間 軸である横軸(horizontal axis)と,ユーザが興味のあ る属性を軸として選択可能である縦軸(vertical axis) から構成される.軸の設定を変化させることにより,分 布のパターンが変化し,そこから,ユーザの興味を引く 状況を見つけだすことを視覚的に支援する.データ分布 の上部に位置するヒストグラムは,時間軸に沿った期間 ごとのデータ件数を示し,左部のヒストグラムは,選択 された属性の値ごとのデータ件数を示す. 最上部の第 3 層においては,ユーザの興味を視点とし て属性値の変移を視覚化し,それぞれの変移パターンの 詳細を視覚化して提供する.ユーザの興味の視点は,パ ラメータ focus によって属性を選択することにより設定 する. 4・3 試行錯誤による歴史探訪 CATは,データにアクセスしながら疑問や仮説を検 証するためのサイクルを提供する.やみくもな試行錯誤 ではなく,4・2 節で示した解析プロセスに基づき,視点 を精緻化する方向性のあるシステマティックな試行錯誤 により,歴史知識の創出を支援するものである. 図 6 では,「本多正純」と「徳川家康」を人名属性に 含む史料綱文の事項属性のデータ分布を表示している. このとき,「大坂城」,「法制」,「鐘銘」,「公家法度」など の事項データが高頻度で出現し,さらに,それらの史料 が 1613 年頃に集中していることが読み取れる.一方,「本 多正純」と「徳川秀忠」という人名でデータを絞り込み, 同様に事項の分布を見ると,「改易*2」,「幕府」,「訴訟」,「最 低」,「不忠」,「接収」などの語が高頻度で出現し,それ らは,1621 年頃に集中していることがわかる.これら の対比から,本多正純が 1613 年頃は,家康のもとで大 阪方との折衝にあたり,各種の法整備に携わった時期で あることが推測される.また,徳川秀忠のもとでは,改 易や訴訟などに係る事柄が 1621 年頃に頻発したことが 見て取れる.このようなデータ分布やその比較から気付 く疑問をもとに,さらに実際の史料を検討して,歴史デー タに基づくさまざまな仮説の検証を進めることとなる. ここでは,「改易」という事項に興味を抱いたと仮定す る(図 7 参照).その際には,再度,解析対象データを 「改易」というキーワードで絞り込み直し,関連する事 項の分布を CAT において表示する.「改易」と高頻度で 共起する「処罰」という語を見つけ,解析対象データを 「改易 or 処罰」として絞り込み,再度,関連する事項間 の出現分布を表示する.すると,先ほどと同様に,高頻 図 5 編年型データ分析ツールと解析プロセス 図 7 データ俯瞰から着眼点獲得の変遷例 図 6 「本多正純」と「徳川家康」,「徳川秀忠」との関連事項の 違いの比較 *2 (名・他スル)江戸時代,士族を平民に落とし,領地・家屋敷 を取り上げた刑.切腹より軽く,蟄居より重い(旺文社・国語 辞典).

(5)

度で出現する事項リストに「処罰」,「処刑」,「追放」,「改 易」,「切腹」などという,他の処罰も列挙されることと なる.これらの処罰の頻度を比較すると,幕府の力が比 較的強いと考えられる鎌倉時代,室町時代に比べ,江戸 時代の「改易」の突出した多さが,きわめて特徴的であ ることがわかる. このように,(i)データ全体の俯瞰,(ii)分析の着眼 点の獲得,(iii)詳細分析を繰り返すことにより次々と 疑問が生じ,さらなる仮説が生まれるというサイクルが 促進される. 4・4 視点に基づく人間関係の表示機構 本章では,CAT の第 3 層が提供する視点に基づく視 覚化について述べる.まず,図 8 に,CAT の第 2 層を 用いて,大日本史料データベースの 1550 ∼ 1650 年に おける「贈答」に関わるデータの分布状況を属性“人名” を縦軸として示す.ここでは,当時の有力武将と天皇 との相関関係が分布パターンとして視覚化されている. 図 8 では,どの時代においても天皇と有力武将がペアに なっている様子が示されている.ここから,当時は,「贈 答」という行為を通して,“権力者”と“権威者”が密 接な関係をもっていたことが読み取れる. さらに,CAT の第 3 層の視覚化機能により,詳細情 報として,織田信長を取り巻く人間関係を示したのが 図 9 左上部であり,徳川家康を取り巻く人間関係を示し たのが図 9 左下部に相当する.信長が時の権威者に直接 関わっていたのに対して,家康は秀忠を伴って権威者と の関係を形成していたことが見て取れる. さらには,「贈答」という観点に対して,「戦」という 観点からデータを絞り込み,同様に人間関係を視覚化し たものが図 9 右部である.多数の人物と関わった信長に 対して,特定の人物と長期にわたり関わっていた家康の 状況が視覚的に示されている. これらの視覚化されたデータをトリガーとして,さら に思考を進め,高度な知識が抽出されるためのツールと して CAT が利用されることを期待する. 4・5 視点に基づく人間関係の時間的変化 図 10 は,CAT の第 3 層を拡張し,時間軸に基づく 三次元空間に各時間に応じたネットワークを可視化する ツール TimeSlice [伊藤 11] を用いて,視点に基づく人 間関係の時間的変化をネットワークの構造変化として表 示させたものである.複数の観点に基づくネットワーク を上下の TimeSlice に分けて表示することで,複数観点 に基づく時間的変化の比較を可能としている. さらに,人物間の関係の時間的変化を捉え視覚化する ことを可能とした.図 11 では,織田信長と武田勝頼の 関係の変化を視覚化した例を示す.人間関係を表す語を あらかじめ選出し,クラスタリングし,関係の種類ごと (ex. 友好,敵対など)に分類しておき,その時間的変化 図 8 「贈答」に基づくデータ分布の例 図 9 視点(「贈答」,「戦」)に基づく人間関係パターンの比較 図 10 視点(「贈答」,「戦」)に基づく人物ネットワークの時間的変化の比較

(6)

を示すことにより,人間関係がどのような変遷をたどっ たのかを示している.このように,ネットワークの構造 変化のみならず,関係のある人物間の関係の種類を解析 し,その関係の変化をも視覚化することにより,関係全 体の変化の理由を類推させることを支援している. 人間関係を可視化するシステム [Heer 05, Nakazono 06, Shen 06, Shi 11]はほかにも多々あるが,[伊藤 11] で提案したシステムでは,さまざまな観点から抽出され た人物間ネットワークに対して,人物依存関係および関 係性質の時間変化を対話的に探索可能であるという特徴 をもつ.

5.お わ り に

史料をディジタル化し広く公開する機能として,現在, 運用している ADEAC について 3 章で示し,さらに史料 の内容の分析をもとに歴史事象の関連性を表出する機能 について 4 章で,それぞれ著者らの研究の成果として示 した. 歴史事象は主に人類(人間)の営みに関わる.人間の 営みの認識・伝達・活用は,基本的にはいわゆる 5W1H をもって行われていると考える.しかし日本における 近世以前の歴史事象は,社会構造,主に支配体制から Why(理由)と How(方式)の 2 項についての記録が なされていない場合が多いとされる.この結果,歴史事 象のいわゆる「因果関係」の抽出が欠落し,この欠落部 分が,例えば「歴史小説・物語」において想像され,我々 はこれら「歴史小説・物語」を通し,歴史事象を認識す る現象が生じているといわれる.また Who(主体・客 体),What(主題・対象),When(時),Where(場所) の項目の欠落も多である.ゆえに近世以前の歴史事象の 解明は,いまだ途上にあるといってよい.そこで,多く に歴史事象のデータをもとに,事象の時系列化を“計り”, 待される.ただし,“計り”,“解し”ても,実証,すな わち裏付けとなる史料が発見されない限り,依然として 推測の域を超えないことになるが,少なくとも現存する 史料を対象に“轍を踏まない”材料出しのための歴史知 識学の役割は大であると考える.また,抽出した歴史知 識をもとに,欠落している Who(主体・客体),What(主 題・対象),When(時),Where(場所)の特定化,さ らには「因果関係」の推定をする研究の促進が望まれる.

◇ 参 考 文 献 ◇

[ADEAC] https://trc-adeac.trc.co.jp/

[Heer 05] Heer, J. and Boyd, D.: Vizster: Visualizing online social networks, InfoVIS 2005, pp. 32-39(2005) [石川 13] 石川徹也,梅田千尋:東京大学史料編纂所研究報告 2012-3(2013) [伊藤 11] 伊藤正彦,赤石美奈:3 次元可視化による史料データに おける人間関係構造変化の俯瞰,第 82 回人工知能基本問題研究 会(SIG-FPAI), pp. 31-36(2011)

[Nakazono 06] Nakazono, N. Misue, K. and Tanaka, J.: NeL2: Network drawing tool for handling layered structured network diagram, APVIS 2006, pp. 109-115(2006)

[Shen 06] Shen, Z., Ogawa, M., Teoh, S. T. and Ma, K.-L.: BiblioViz: A system for visualizing bibliography information,

APVIS 2006, pp. 93-102(2006)

[Shi 11] Shi, L., Wang, C. and Wen, Z.: Dynamic network visualization in 1.5D, PVIS 2011, pp.179-186(2011) [田山 16] 田山健二:最新のデジタルアーカイブ事例,社会教育, No. 843, pp. 28-33(2016) [横山 09] 横山伊徳,石川徹也:「歴史知識学」ことはじめ,勉誠出版, pp. 202(2009),(歴史知識学の創成(2008)の一部再構成) 2016年 9 月 25 日 受理

著 者 紹 介

赤石 美奈(正会員) 1995年北海道大学大学院工学研究科電気工学博士課 程修了.博士(工学).静岡大学,北海道大学,東京 大学を経て,現在,法政大学情報科学部教授.知識 メディア,情報視覚化,物語生成などの研究に従事. 石川 徹也 1971年 3 月慶應義塾大学大学院文学研究科修士課 程修了.富士フイルム株式会社足柄研究所,図書 館短期大学,図書館情報大学,文部省在外研究員 (UCLA,IU),筑波大学,東京大学などを経て,現在, TRC-ADEAC株式会社技術顧問として ADEAC(A System of Digitalization and Exhibition for Archive Collections)の運用に従事.筑波大学名誉教授.工 学博士.情報文化学会賞,言語処理学会優秀発表賞,UNESCO : Eugen Wüster Special Prizeなどを受賞.

図 11 人物間の関係を表すクラスタ成分の可視化

参照

関連したドキュメント

本県は、島しょ県であるがゆえに、その歴史と文化、そして日々の県民生活が、

青面金剛種子庚申待供養塔 有形文化財 歴史資料 平成3年7月4日 石造青面金剛立像 有形文化財 歴史資料 平成3年7月4日

 チェンマイとはタイ語で「新しい城壁都市」を意味する。 「都市」の歴史は マンラーイ王がピン川沿いに建設した

附 箱1合 有形文化財 古文書 平成元年7月10日 青面金剛種子庚申待供養塔 有形文化財 歴史資料 平成3年7月4日 石造青面金剛立像 有形文化財

 このようなパヤタスゴミ処分場の歴史について説明を受けた後,パヤタスに 住む人の家庭を訪問した。そこでは 3 畳あるかないかほどの部屋に

 本計画では、子どもの頃から食に関する正確な知識を提供することで、健全な食生活

モノーは一八六七年一 0 月から翌年の六月までの二学期を︑ ドイツで過ごした︒ ドイツに留学することは︑

・主要なVOCは