• 検索結果がありません。

統合スキーマを利用した ディジタルライブラリィ検索システムの実装

N/A
N/A
Protected

Academic year: 2021

シェア "統合スキーマを利用した ディジタルライブラリィ検索システムの実装"

Copied!
29
0
0

読み込み中.... (全文を見る)

全文

(1)

津波ディジタルライブラリ開発

平成19年11月16日

群馬大学名誉教授

金森 吉成

(2)

内容

z

はじめに

z

津波ディジタルライブラリのシステム概要

(3)

はじめに

z

津波ディジタルライブラリ

約6年間、我々の研究グループで開発し公開してい

るディジタルライブラリである

津波災害に関する新聞記事、災害報告書などの書

籍、ビデオ映像、CG、現地調査写真などのデータか

らなる

(4)
(5)
(6)
(7)
(8)
(9)

津波ディジタルライブラリのシステム概要

z

既存の商用データベースシステム(ORACLE)を

(10)

データベース

z

新聞、書籍はXMLで構造化して、XMLデータ

ベースシステムを利用して管理

z

それ以外のデータはHTML文書内に直接リンク

(11)

XMLデータベースの例(新聞XML文書)

z

掲載面を単位にXMLで構造化

(12)

newspaper

metadata

page

num

article

title

text

article

subject

date

format

language

rights

creator

publisher

source

coverage

description

contributor

type

relation

identifier

title

新聞XML文書のツリー構造

(13)

<?xml version="1.0" encoding="EUC-JP"?> <newspaper> <metadata> <title>東奥日報</title> <creator>東奥日報社</creator> <subject>チリ地震津波</subject> <subject>昭和35年5月24日</subject> <subject>1960年5月24日</subject> <publisher>東奥日報社</publisher> <date>1960-05-30</date> <type>Newspaper</type> <format>text</format> <identifier>1960053002</identifier> <language>ja</language> <rights>津波ディジタルライブラリィ&quot;http://tsunami.dbms.cs.gunma-u.ac.jp/&quot;</rights> </metadata> <page> <num>2</num> <article> <title>一部の工事に手抜き津波にもろかった八戸第二魚市場”東洋一”は名前だけ皮肉にも鮫市場は無キズ</title> <text>チリ地震津波で、八戸市営第二魚市場は水揚げ場の一部が陥没し、使用不可能になった。昨年八月完成、東洋一とまでその偉容をほこ る同市自慢の建物だけに、関係者に与えたショックは大きい。とくに”東洋一”をそのまま信じてきた市民の間には、余りのもろさに 『工事に不正があったのではないか』とか『もともと建設地としては不適当だったのではないか』という疑惑まで広まっている有様。 津波災害対策のため開かれた臨時市議会でも、この問題が大きく取り上げられた。完成一年足らずの間にあえなく事故を起こした原因 はどこにあったのか、これを打診してみよう。同魚市場は市議会をはじめ、同港の水産、港湾関係のトップレベル構成する魚市場建設促進協議会が母体となって計画を進め、日建設 計の設計、監督で戸田組が請け負い一億六千万円の巨費をかけて完成した。また川口港の上に太平洋の荒波がまともにぶつかるところでも大丈夫かという疑問については、日本開 発会社が”最適”の太鼓判を押した。地質は砂地だが建設地としては泥地帯まさること数倍ということだった。二十四日朝の津波の際も関係者は鮫の第一魚市場があぶない、長されそ うだと心配はしたが、第二魚市場には一片の不安も持たなかった。ところが津波ったあとの第二魚市場は、第魚市場がほとんど無傷だったのに比べ、まさにさんたんたる有様。幅七 メートル、長さ二百メートルのエプロン岸壁(漁港岸壁として県が市場とは別個に施工)はめちゃめちゃになり、市場水揚げ場は約十五メートルを四十三メートルにわたってぽっかり穴 があいた。岸壁だけでその損害は約九千万円(八戸港務所調べ)だという。 水揚げ場の陥没は直接には一た押し寄せた波が海に逆流する際附近を流れる下水道を通って水揚げ場下に設けた幅四メートル、深さ二メートルの排水こうに一時に集まり、土台の 土を掘ったのが原因で第一の問題はここにある。この排水側こうは市場の側線にもあるが、鉄道側はこの口を厳重にコンクリートで固めているのに対し、市場は側こう下わずか五十セ ンチ(この部分は土)のところから常に水が流されていた。『一番悪いところをやられてしまった』と工事関係者はいっているが”一番悪いところ”と知っていたなら、なぜその部分も床工事 を鉄筋にしなかったか。また『側線は貨車の重みがかかから鉄道側は厳重に工事した』ともいうが、もっと深く強く固めれ なかったか、と関係者はこの点を強く指摘している。第二の問題は漁港岸壁がくずれたことだが『魚市場を建てる前にできていた岸壁がまさかこんなことになるとは…』と関係者が語る ように、確かに岸壁あっての魚市場だった。 ところが当初四メートルの水深で計画施工した岸壁は、その後六ないし五㍍の水深に変更、しゅんせつされていた。一部だが、設計書通りでない手抜かりがあったし、大きな不正はな いにしても岸壁工事にも市場の排泄こうの設計工事にも落ち度があったことは関係者が認めている。津波の予想はしなかったという。地震国日本、それも三陸津波の被害経験を持つ 三陸海岸の八戸だけに、もっともっと慎重な計画がほしかったし、恒久的施設である同市場ならば、なおさらだとの声が高い。岸壁は今後運輸省の災害査定によって予算を獲得、早急 に復旧に努めるが、くずれた岸壁を引き上げ旧に復すには長い期間が必要なことから、この岸壁はつぶして、さらに前方に岸壁を作る計画ともいわれるが、この場合そうでなくても狭 いといわれる川幅が約十メートルせばめられる結果なる。また現在が限度といわれる水揚げ場の幅も広がり、それだけ機能が失われることにもなりかねない。こののかね合いも関係 者にとっては悩みの種となっている。早急な復旧とともに今後に”こっとう品”(旧鮫魚市場)が新品”より強かったなどと、ふたたび悪口をいわれないよう慎重万全な策で工してもらいたも のだ。</text> </article> </page> </newspaper>

(14)

検索要求の例

z

“「宮古」に関する書籍、新聞、CG、現地写真な

ど全てのデータがほしい“という検索を行うには

別々に存在する検索閲覧システムに対して「宮

古」をキーワードとする検索を繰り返し、その都

度得られるデータを整理して収集する必要があ

(15)

本研究の提案

z

津波ディジタルライブラリ内の全データを検索対

象としてXMLデータベースシステムで管理され

ているデータやHTMLで記述されているデータを

横断的に扱うシステム

(16)

本研究の提案

z

XMLデータベースの統合

統合スキーマの設計

z

統合システムの拡張

要約文の利用

XML文書以外のデータ

(17)

統合スキーマの設計

z

統合スキーマ

様々なデータを網羅し、検索可能とするための共通

(18)

view

substance

title

text

img

caption

link

imgType

keyword

section

section

img

text

caption

link

imgType

title

section

……

section

document

title

document

title

title

text

img

section

……

(19)

統合スキーマによる検索

z

統合スキーマへの検索をそれぞれのデータへの

検索に変換して全てのデータを検索

z

データの異種性を意識することなく全てのデータ

(20)

要約文の利用

z

膨大な量の文書を精読するのは困難

z

XML文書を要約した要約XML文書を利用

z

通常のXML文書か要約XML文書のどちらを検

(21)

<newspaper>

<metadata>

<title>東奥日報</title>

<creator>東奥日報社</creator>

<subject>チリ地震津波</subject>

<subject>昭和35年5月24日</subject>

<subject>1960年5月24日</subject>

<publisher>東奥日報社</publisher>

<date>1960-05-30</date>

<type>Newspaper</type>

<format>text</format>

<identifier>1960053002</identifier>

<language>ja</language>

<rights>津波ディジタルライブラリィ&quot;http://tsunami.dbms.cs.gunma-u.ac.jp/&quot;</rights>

</metadata>

<page>

<num>2</num>

<article>

<title>

一部の工事に手抜き津波にもろかった八戸第二魚市場”東洋一”は名前だけ皮肉にも鮫市場は無キズ

</title>

<text>

チリ地震津波で、八戸市営第二魚市場は水揚げ場の一部が陥没し、使用不可能になった。昨年八月完成、東洋一と

までその偉容をほこる同市自慢の建物だけに、関係者に与えたショックは大きい。津波災害対策のため開かれた臨時

市議会でも、この問題が大きく取り上げられた。

</text>

</page>

</newspaper>

(22)

XML文書以外のデータ

z

HTML文書のタグを除いた部分を統合スキーマの

部分文書とみなす

(23)
(24)

利用者

GUI

キーワードの入力

XMLDBMS

(Oracle XML DB)

検索文の生成

閲覧

キーワード

検索文

新聞XMLDB

検索

XML

データ

データの整形

統合スキーマ形式

のXML文書

文書ごとのXMLスキーマ

形式のXML文書

前置問合わせ

処理部

デー

検索

XML

データ

論文XMLDB

要約XMLDB

検索

XML

データ

HTMLDB

検索

HTML

データ

後置問合わせ

処理部

(25)

検索文の生成

z

各々のデータベースではSQLでデータの操作を

行う

(26)

統合スキーマへの検索

z

部分文書を検索

(27)

Select

$id

, extraxt(

$xmltype

,

$section

).getClobVal()

From

$table

Where contains(

$xmltype

,’

$KEY

inpath(

$sectionchild

) )

order by

$id

SQLのテンプレート

Select

id

,extraxt(

xmldoc

,’

/newspaper/page/article

).getClobVal()

From

newspaper

Where contains(

xmldoc

,’

宮古

inpath(

/newspaper/page//article/title

)’

or

contains(

xmldoc

,’

宮古

inpath(

/newspaper/page//article/text

)’

order by

id

(28)

デモ

(29)

まとめと今後の課題

z

津波ディジタルライブラリィ内の全てのデータを

横断的に検索するシステムを実装

データの異種性を意識することなく一度のキーワード

入力で横断的に検索可能

z

ユーザの評価による改良

参照

関連したドキュメント

Type of notification: Customers must notify ON Semiconductor (&lt;PCN.Support@onsemi.com &gt;) in writing within 90 days of receipt of this notification if they consider

Type of notification: Customers must notify ON Semiconductor (&lt;PCN.Support@onsemi.com &gt;) in writing within 90 days of receipt of this notification if they consider

Type of notification: Customers must notify ON Semiconductor (&lt;PCN.Support@onsemi.com &gt;) in writing within 90 days of receipt of this notification if they consider

When value of &lt;StThr[3:0]&gt; is different from 0 and measured back emf signal is lower than &lt;StThr[3:0]&gt; threshold for 2 succeeding coil current zero−crossings (including