• 検索結果がありません。

著者 中野 洋

N/A
N/A
Protected

Academic year: 2021

シェア "著者 中野 洋"

Copied!
19
0
0

読み込み中.... (全文を見る)

全文

(1)

国立国語研究所学術情報リポジトリ

文献検索システム IRON

著者 中野 洋

雑誌名 電子計算機による国語研究

巻 10

ページ 89‑106

発行年 1980‑03

シリーズ 国立国語研究所報告 ; 67

URL http://doi.org/10.15084/00001306

(2)

文献検索システム二二⑪N

中 野

箭. はじめに

 文献検索は,電子計算機を使った仕事として,国内国外を問わず古くから研 究され,また,実用されているものの一つである。国内では,古くは神戸大学 計算情報センターがあり,大掛りなものは,日本科学技術情報センター(JI CST)の機械検索サービス,オンライン情報検索サービスがある。また,多 くの人に使われているものは,各地の大型計算機センターに登録されている文

:献検索プログラム*がある。文献データも磁気テープわたしでアメリカと霞本,

国本国内での交換利用が行なわれている**。

 このような状況で,なお新しいシステムを作る必要がどこにあるか,それは 以下の通りである。

1)現在の文献検索の閥題点は,いかにねらった内容の文献を見つけるかとい うことにある。つまり,タイトルにもそれに付けられたキ㍊ワードにも,また 抄録文にも直接には語としてあらわれてないある内容を,つまり手掛りがない

,状態で,どのようにして検索しえるかという問題である。

 このことについては,今なお各方面で研究中である。たしかに言えそうなこと は,文献の中の文章をいかに解析し,その意味内容を処理するかという問題が解 決されない限り,本当の意味での文献検索はでぎないだろうということである。

 この問題を考えるためには,現在可能なことは何か,閣題は何かを明らかに するために,実験システムを作る必要がある。第一の瞬的は,この実験システ

ムの作成にある。

* 藁京大学大型計算機センター(TOOL−IR)その他が提供されている。文献10参照。

**JICSTでは,垣内賑外の文献情報約585万件を磁気テープに蓄積し,提供サー   ビスをおこなっている。文献11参照。

      一89一

(3)

2)現在わが書語計量研究部で作られた文献は付録に示したように二百編を越 える。計算機を使用しはじめてから十四年を数え,この間メンバ・・一も変わって いる。岡じような目的を持った文献が数回になるものもある(付録,件名索引 参照)。オンラインキーワード検索を作り実用に供して欲しいという要望もあ

る。これが第二の目的である。

3)毎年業績報告なるものを書かされているがこれを計算機にやらせようとい うのが第3の鶴的である。

4)外国人に計量研究部の業績を紹介するために人間の手をわずらわせること なく欧文目録,件名索引を作成する。これが第4の9的である。

 作成した文献検索プニグラムIRON(lnformation Retrieva10nami&

Na1〈ano)の機能は以下の通りである。

文献囲録の作成 件名索引の作成

オンライン文献検索

 これらの目的は一応達 成した。附録の文献目録 はこのシステムで作成し たものである。

 また,他のシステムに はないと思われる新:しい 機能も付けることができ

た。

任意語による検索機能と ローマ字を五十音順に配 列するプPtグラムである。

2, 方法

2−1 システムチャート

和文目録,欧文圏録

袖文件名索引,欧文件名索引

和文キ・一一ワtrド または 著者による検索 欧文キーワ一戸ド または 著者による検索 指定仮名文字運続による検索

システムチャート1 PDP−11使用

文 献

iNTIRONI

データの蓄積

文献フアィル 検索文字連続

文献ファイル

Sm・一N

狽r,

NIRON2

文献検索

検索紬果

一90一

賛王RO曇3 fータの追加

2次 カ献ファイル

飛正殺ON荏 tァイル変更

文献ファイル

(4)

       システムチャート2

K−8250,窩遼漢字プりンタ使罵

藤這データ

パ ン チ

NユR〔〕N1 よみこみ

漢字ディスプレイ狡正システム を利罵した

秘文文鍍検索

1巳

HITAC−8250と高速漢字プリンタ による文献閉無g件名索弓iの俸成

N.工R〔>N2

「園竃琵化

1

HITAC』825Gによる.

欧文文酸検聲ミ

鶴窯 ti:7イん

︑F 扁ル文ワイ鱒悶7

﹁︾.7

一x

pt  t RO ,k  1S

廉紫珊ファlrvti;

鶉文

#一cr7tV

KbP,ED

コt一ドロンパート

t tn no,ve 編 葉

1

 じVT胴MT.i十K

搬53ミ

捜瀞λテム 澱㌻ディスプレイ

O一@

隈プ1}撮力

駕1RON3 MRO〜捕

戚乳つ【全

践A1DOとu SORT

廊臨装事解畿 5じ轟..ソート

罵声RO〜 7監

編 築

紋正 聖算正

@パンチ

冠置趾0糧45 cΨτPMTJIKi.石

辞翻審戚 緩ブ1 出力

キーワード 熄ソ欝.茜

F帖斜1 臓突 馬.茜ファイル

︸1■婁一︐甕﹂巳一属1 昌 録

MT騨HKP

鑓7リ盤ノ」

■ ド ル弐ワイ駄一γ 聾.7

NlRO麗9

観 舞…

se T

N1玖。麗73 編 集

記舞

CVT−MT,llXli 頴ゲ撃串力

BiblisrAphy

t

1

     彫

CVT−MT.Hxll  摂ブ }鵬力

     額

Sts#leet lndtx

i

1一

臓文 モ.薦フアィル

 駄窯 Lーワー}

tァイル

50RT 50}=丁

ソー}.. ジー}..

蔚【糎。駅ε ディスタ1ヒ

欺突弍駅

tァイル 指.示

}URO煙コ3 襖 索

      ■

@       舘録殴 答

h

一91一

(5)

2.使用機器

 文献目録の作成は,主な作業をH:ITAC−8250でおこない,高速漢字プリン タで出力した。

 文献検索は,欧文による検索をH至TAC−8250で,難文による検索を漢字プ リンタとディスプレイで,カナ文字連続による検索をPDP−11でおこなった。

2−3 データ・フォーマット

 PDP−11によるカナ文字連続の検索では,決ったデータ・フt一マノトは ない。Bacic言語がうけつける長さを最大長とするだけである。

 H−8250,漢字プリンタによる目録作成・検索のチータ・フォーマントにつ いて以下に説明する。

2−3−1基礎データ

 次のページに示したものが,このシステムの基礎データである。普通の文献 カード(これはマルぜンのアナリストカード403)に必要事項を書き込んだも のだが,カードは何でもよい。あるいは,このカードがなくてもよい。筆者は 人問の手による検索・分類・整理に利用するために,これを用いた。

薬ここ      ・

ザレ    、      ・    ∵・

燃  ぐ ・誌麟油脂治民ぜ慰・\

雛、 .・

叢、湿痢羅調細紐

蓼き 一、  }       }      \ \

噴ド・ …  \  ゼ ・   ㌔ 声

ま     マくで   を      ノ

鱗∫       \   ノ 麟£階下瀬躯、/丁丁   ・3、団曾1、

ヘ       ノあセ

       サ ダかげ

…証蜘冷嚇∴認岬}1ミ,

灘』  勾 ・、 、∴ ご 

慕ll愈噸零槻  。,認

 /  \    //    \     ぐ   }\in  t/ ≧▽       \

       一92一

      ミ  へ       ・・露!、ノ 酬騨1』り・

      ,      》   〉

  紬繭醗∫{縛議蘇晦鴇f燕藤臨飛/絃嚢,、

験ジ野市G愉もボ為凝漕曝鱒裁 瞬郷函軽■3

tk

(6)

 パンチ原稿がおりに使っている。

2−3−2 入力データ

 入力デTタは,漢テレによってさん孔された紙テープである。

 一つの文献,つまり一枚の文献カードで一ブロック(最後E/1)を構成L,

各項目(下記)はC/Rで区切られて一レコードを成す。項目のbta序は自由で

ある。

項目記暑

レペー刈

(一字)i (一字)

データ

1 CIR

旨可変)旨一字)

項:目は下記のとおりである。

   (項目)   (項目記畳)

  標題      題   著者・編者   著   資料・・雑誌名 資   ページ      ペ

  発行年    年   欧文題闘    英   欧文名     N   キーワード   K

  件名     件

   (備考)

共著の場合は・(ナカグP)で区切る

×四号××一××  ×:数字

×X×X/×、X/×× ×:数字

共著の場合は・(ナカグロ)で区切る 先tlg和文・()内に欧文・1(ナカグ・)で 区切る。

.下に,例として入カデータを漢字プリンタに出力したものを示す。

 題 .新間における漢語のまぜ露ぎ衷記について  覇 ま:屋 億一

 資 電子齢算機による副司硬究

 べ 7弩9−35  二5手 コ975/3

 英 A Method to wri te Chinese Word in Chlne$e Charac  ter and Kana in Newspapers

 N TSvCHIYA Shin−ichi

 .K ortisu一:cF(a method write chinese word in Chinese char  acter and Kana)・漢語,(chinese wor・6s)。爾一法ぐuse of chara  ・cters)・環代新間(modern newspaper)

       一93一

(7)

2−3−3 出力データ・フォーマット

 次頁以降に出力例を示す。(1)〜㈲は附録参照。

 (11和文著者ファイルから作られる主要記事目録  ②和文キーワードファイルから作られる件名索引  (3>欧文著者ファイルから作られるBibliography  (4)欧文キーワードファイルから作られるSubiect Index  ㈲欧文文献ファイルから,著者を指定して検索された結果  ㈲岡じく,キーワード・和集合指定の検索結果

      積集合措定の検索結果

(7)tw文文献ファイルから,著者またはキーワP・ドを指定して検索された結果 PDP−11によるカナ文字連続指定の検索結果である。

   (5)著者指定検索の結果

XXttlt斉Xtt醤終棘棘競蘇耗鼎飛禽う8繰鞘碁 響      』』    疑   NAKANO 縛!ROSH:        莱 鞍       終 tt A PLAN FOR RECOGNITION O  ,e

§ F MEAN:NG !N しANGUAGE f)A 舞 耗       穏 便賊競斎婚擬嫉蘇蓑賊§粥を蝦う㈱:・ 一;:一 ,,c一 x

賊賊賊賊賊傭船砦猟賊貸費蒼嬬岳縦;ξ斉

軽       碁 誉   NAKANC 『H:ROSH工         うξ

§      甚 tt CGNTRAS「「IVE STUDY ON V〔](二 鐸 li ABULARY IN 51X KINDS OF  nL

憂       畳 賊擬誉竹岡§嫉凝畳鼎蘇斉羅耗耗押競タξ凝 餐嫉嫉蘇耗§嫉鞘誉ラ縦管蘇凝タξ繋止賊羅 賛       斎

ff r;AKAN8 H:ROsHI ,4

舞      ・;ξ

 ON THE FREQUENCY−O;STRIB tS N UTION PAT「ピ}:詮N L OF VO(A8 論 畏      M 競闘茶擬賭擁賊賊鰹耗賊饗蓑碁賊滞ご繰 照貯法割賦顯顯服鞘轍うξ蚤曲論補

擬       葵 聾   NAKAN{3 H:1ミ◎SH…         砦 憂       憐 ff A 了只IAし 〔}F AVT◎MA了.!く SY驚 § 聾 TA⊂了1⊂ ANALYSIS      斉

§       管

鱗襯鰹襯斉襯美日興羅撒羅§賊鞘繋服

⑥ キーワード指定検索の結果 騒擁参罎芙襯嫉碁}8田野嫉酬うξき8繰碁3ξラ3ε 耗      斎 es MIZU T ANI 51ZUO.TANAKA SA ・X きξ       3き

tt ON COeRDINATE CUNNECTOR5 ;C,・

X OF WORD5 OR WORB GROUPS ,.t・

1$       耗 耗婚縦舞聾耗繋鰹潴38冬碁服3繰338縦隔タξうき y(xttscls}xxxxee N{ }esxMxli;u$一xxleft},t一,,e 誓      3ξ・

1  KUSANAGI YUrAKA le・

赫      耗 耗 ρATτE:RN MA丁⊂H正NG OF SN〔】B う}・

le OL4 AND LiNGUiSTIC OPERT {(・・

碁       弊 嫉周回羅耗耗嬬塗8ξ書ξ虫押舞383キ羅蘇羅 耗燦碁羅賊照耗耗襯うを翻耗擁3ξ賊鰍播朕

耗      うそ

IS MIZUTANI SIZUO t,i一

耗      碁 斉 INTRGDU(二TORY NOI E二 〔1握 5NO 斎

li BOL3 :;F

繋       至ξ

3鰹粥ε嫉鰭燃88忌賊斎㈱8888}燗き

ltltttx{.exxMitxxsclfNk xttxtt{exitxestt{;一K・

耗       一;ξ

le MIZUTAN! 5;Zlj6 1}

耗       聾 耗 !NFL.ljEN(二E. GF THE D:FF巳Rξ 曇 x NCE OF SPELLING 5YSI EM5 k

茶       耗 賊撒ラ8を鞭き鰯羅号e8ξ一斉き繕畳うε3縦賊孝9←

一94一

(8)

   (7)漢字ディスプレイによる和文検索の結果:

翻中野 洋

      71号17−24 記文自動解析の認み

癒味鼻面 学扇面鶴 文法辞轡 捻文解析

   (8)カナ文字連続指定による検索結果一線部,応答

     ケ諦ワシタ・・r:コ 漣 ヲィ1フ  1ζヨ      :丁吃バ カナテ鴨㌧ii譜ンメ・台、:τイ:i…iジツ

.⇒   ?:::1ド峯i

     「 A トナ ノ :コト 、Ll. ← ::葺トt :芸≡  ノ ::ユト 1舷  .」  (3 i〈〔3・一・()()毛3

撒ざ}1幽{嚇1譜∵

   (     「:コト モ ノシ ..整磁N(3−lt 9:1,

     「コト :1≡ノ1潜バ ノセカイ..i{3N13一二lll雲;3

     R ff A zs tr一

2−4 プログラムの概要  (1>よみこみ(N王RDN 1)

  原データ(紙テープ)を読み,磁気テープに出力する。

 (2)固定長化(NIRDR 2)

  和文著者ファイル,恥文キーワードファイル,欧文著者ファイル,欧文キ  ーワードファイルを作成する。

  このシステムはMTベースだが,将来はディスクベースにするべきであ  る。データベーースシステムを採用すれば,(1>②が一本化し,データのメイン  テナンス,使用も効率化するはずである。

  次回に,MTフit 一マットを記す。

 〈3)編集(NIRON 8, NIRON 71, NIRON gs NIRON 72)

  畠力デーータフrt・ 一一マット(1>,②,(3),㈲を印字するためのファイルを作成       一95一

(9)

和文著者フrイル

4 4 懸   211  {1 4

和文キーワードファイル

弼  一L

キ⁝ワード キ〜ワ1ドよ.み

同  .i二

4e 4L,

欧文著者ファイル

年 月 田

資料名 典著者

爺:

P者

題目

匿」ま= 同 上

著譜霧じ

番号

秀鴛日 入力番号

so 4 100 , 2  ecK}

欧文キーワードファイル

40 6   6   4

﹁1饗﹂

同  上

ドrj

L・ tL

1ee

する。このファイルは漢字プリンタにかけられ出力印字される。

(4)かな:つけノレーチン

 和文キーワードには,もともとよみがなが付いていない。しかし,件名索 引を五十音順に配列するためにはキーワードによみがなが必要である。この ルーチンは,自動漢字解読と人手による修正によって,よみがなをつけよう とするルーチンである。

(4−1)キーワード紙テーープ出力(NIRON 3)

 漢字表記のキーワー・ドを紙テープに出力する。

(4−2)自動漢字解読(KAのOK)

  4−1の出力紙テープに読み仮名をつける。田中章夫氏作成のフ㌔グラ        一96一

(10)

 ムである。 (田中章夫「漢字かなまじり文を全文カナ書きt.ローマ字書き に変換するシステムについて」電子計算機による国語研究豆 参照)

(4−3)人手による修正

KAIDOKUの出力は紙テープである。これに印字・校正・修正をおこな

う。

(4−4)入力(NIRON 4)

 入力紙テープは次のフit・一マットである。漢字a*:一一一・字ずつによみがながっ けられる。

9N    4,

W  づ一

よみがな

2 2    可 変     2 2

MTに次のフォーマットで出力する。

見 出 し よみがな

so ee

(4−5)辞書の作成(NIRON 45, NIRON 5)

 (4−4)出力のMTによってディスク上によみがな辞書を作成する。同形 語はそのうちの一つを取る(NIRON 45)。

(4−6)かなつけ (NIRON 6)

 三文キーワードファイルに対し辞書によってよみがなをつける。よみがな がっかないデータは,ディスプレイに表示され(紙テープにも畠力),これ を見てコンソールから漢テレ3010コードによって入力することができる。こ の方法を用いないのなら4−3に戻る。

一97一

(11)

3. オンライン文献検索

 機械によるオンラインの文献検索について考えよう。

 オンライン文献検索において大切なことは次のことである。

 必要とする文献を出来るだけ早く検索し,わかりやすく表示すること。

 ここで,「必要とする」の意味は,必要とする文献が必ず入っていて,かつ 必要としない文献は入っていないことである。

 文献検索のスターート時では,「必要とする文献が必ず入っていること」だけ を満足させて,よしとしがちである。しかし,これでは,関連のありそうな文 献をすべて表示すればよく,極端な場合,表示された文献の中から本当に必要

とする文献を探し出すまでにまた時閥がかかることになる。

 では,真に必要とする文献だけをぬき出し,必要としない文献を排除するに はどうすればよいか。

 そのひとつに適切なキーワードをつけることがあげられよう。しかし,万能 のキーーワーードは存在しない。たとえば「文献検索の方法」というタイトルの文 献に対し「文献検索』というキーーワードは,そ;れ自身に.よる検索セこは能力を発 揮するが,同意語rドキュメント リトリューバル」,類義語「文献の探索」,

上位語「文献」「書物」「資料」,下位語「機械検索」「計算機利用」「図書館」

などなどにはそれだけでは無力である。

 これに対し,シソーラスを用意し,それによって関連をとろうとする方法が 行われている。しかしながら,これにもふたつの問題点がある。その一つは,

キーワードの語形・表記上の統一であり,他の一つは用意されたシソーラス以 外のキーワードは使えないということである。つまり,実際上はキーワードつ けは専門家によらねぽならないということになる。

 これはオンライン機械検索もまた,専門家がオペレートしなければならない ことを意味する。というのは,検索を行おうとする入はシソーラスを知らないと 考えなければならないが,シソーラスを持たないで専門語でかつシソーラスに ある語を指定することは,シソーラスや検索したい文献の内容を知らない(こ れはあたりまえ)オペレータには到底無理だからである。つまり,オンライン 文献検索がその効果を発揮しないということを意味する。この点の解決策は       一98一

(12)

IRONシステムにおいて実現されている。あとで詳述する。

 シソーラスを利用することは理想的な文献検索からみると蛇道であり,また 効果的でないことを述べた。では,どうずればよいか。

 この問題は,現在,各界でEll究中である。文献の内容を自動的に抽出するこ と,その上で,効率的な検索方法を考えることが必要になる。その第一歩は自 動単位切りであり,溝文応折であり,文章処理である。わたしは,処理速度は 遅くても言語学的にみて,オーソドックスなアブP一チでこの問題について考 えてみたい。IRONシステムはその実験のためのシステムである。

 次に,現状における文献検索システムの実用化を考えてみよう。

 内容を自動的に抽出すること,範囲を隈って自動的にキーワードをつけるこ と(自動インデキシング)も現在は実用段階ではないb

 このような現状では,適当fsキ・一ワードをつけてキーワ・一一ドの管理を行う方 法とキーワードは全くつけないで題目や抄録文中の語を利用する方法の二つが 考えられる。

 どちらの方法でも肝要なことは,簡単にデータを入力・管理できること,デ ータを手元において,いつでも好きなときにオペレートできることである。

 後者の方法による,ミニコンピュータ,マイクロコンピュータにおいて実用 に供することのできるシステムを作った。データはほとんど加工をくわえず,

そのままで打ち込む。検索は指定した文字列によって行う。したがって,長い 語でも(この場合,該当デーータは多くなる),いくつかの語の維み合わせでも

(この場合,より狙ったデータが選ばれる),名前でも,雑誌名でも検索でき る。しかし,検索血石は,データを頭から調べていくので,長くかかる。個人 用のファイルならそれ程多くないだろうから実用に耐えるだろうという予測で ある。このシステムはミニコンピュータPDP−11で実現している。

 繭者の方法による検索システムはHITAC−8250,高速漢宇プリンタ上で実現 している。繰り返すが,この方法ではキーワードの管理が重要である。異形同 語,類義語,および広範囲の概念を指す上位概念語(実は,これではキーワー

ドの役割を果さないのだが)が頻出する。

 以下,プログラムの概略を示す。

       一99一

(13)

 (1)欧文文献ファイルの検索

  著者による検索とキーーワ…一ドによる検索がある。

  著者による検索では,著者を指定すると出力データフォーマット㈲が表示  される。各文献ごとにMT出力を選択できる。

  キーワードによる検索では,和集合検索と積集合検索を選択することがで

 きる。

  和集合検索は,指定したキーワード(複数)のどれか一つを持っていれば  その文献を表示する。積集合検索は,指定したキーワード(複数)のすべて  を持っている文献を出身データフォ・一一マット(6)によって表示する。

  キーワードは最大5個まで指定できる。

 日常語・専門語翻訳ルーチン

 「連糸」 (string)という語がある。言語学や計宇戸科学の世界で,「文字や 語の連らなり」などの意味で用いられる。計量国語挙69号に水谷静夫著の「連 糸概念の基礎」という論文がある。この論文の内容を示すキーワード「引用,

名前,結合律……」の中に「連系」が含まれている。

 「連糸」についての論述では水谷論文は最も重要なものだから,その内容と 関連がある分野の研究者は当然,その用語も論文も知っているはずである。そ れ以外の分野の研究者にとって,「連糸」という語は一般的ではないと思われ る。その分野やそれに類する内容の文献を探す人にとって,「連糸:という語 を用いるのはほぼ不可能といえる。では,文献検索用のキーワードとして,

「連糸」は働かないのか。この論文において「連糸」は最もよくその内容を示 すキーワードであって,「糸」「連なり」「線」では困る。たとえば,この論 文は「完載」や「計算機」について述べているからといって,「言語」や「計 算機」をキーワードとするとしよう。たしかに,これらの語によって,この論 文は検索されるが,それと岡時に,無数の「書語」や「計算機」に関する論文 が提示される。計量国語学,国語学,言語学のほとんどの論文は「書語」につ いて述べているからである。これではtw 一ワーleとしての働きをなしていない

と言えよう。

 ここに専門語とそれと同様・類義の一般語との翻訳ルーチンの必要が生ず        一 leo 一

(14)

る。

 本システムでは以下に述べる方法によってその機能を実現している。

 バーードウェアの髄約によって,英語キーーワードの翻訳をおこなった。

辞書の作成

 専門語を一般語に言いかえる辞書を作り,これを利用する際には逆に一般語 から専門語を引こうというのである。この場合,専門語を的確に言い換えるた った一つのH常語を用意するより,当らずとも遠からず的な譜をいくつか用意 する方がより良い。検索の手掛りになる手足を多く持っていた方が,キーワー

ドにたどりつきやすいからである。当らずとも還からず的な語はシソーラスで いう上位概念を表わす語や下位概念を表わす語であってもよいが,それでなく てはならないとは考えない。なぜなら,語の意味関係を完全なトリー構造だけ で表わすのには無理があると思われるからである。また,,トリー講造の体系は 新しい概念が入ってきた時に書き直さなければならないという理由もある。メ インテナンスが大変なのである。トリー一構造では,語を用いる時,常に全体構 造を頭に置いていなけれぽならない。語の意味関係はそれほど体系だったもの とは思われない。以上の理由により,文献検索で用いられているシソーラスは 本システムでは使用しない。それにかわるものとして,ネットワーク構造を用 いる。図示すれば次のようになる。

 専門語K1は日常語C 1〜C4で言いかえられる。専門語K 2は賑常語C3 C5で雷いかえられる。鼠常語はC3のようにK 1, K 2の複数の專門語を言 いかえるのに用いる場合もあるし,ただ一つの専門語をいいかえるのに周いる 場合もある。それぞれの臼常語と専門語との関係は,たとえばC4の/が反対 語を示すように示される。関係の種類は現在/の一一つしかない。関係の種類が        一 101 一

(15)

多くないということは,これを利用した形態が多くないことを示している。た とえば,「もっと詳しく」とか「上位概念は?1とかのオペレートができない ことを示している。しかし,そのようなオペレートは何らかの立場に立つもの であるから,その関係が入っている辞書は他の立場から使えないことを示す。

本システムは利用の立場を限定しない。日常語C3を介してK1とK2の関係 を得ることができる。

 この弓造においては,薪しい語を登録するのに何のさしさわりもない。ある 語の構造をおかすということはない。専門語とそれを示すN常語を入れれば全

く自動的に,この構造を作ることができる。

 以上の理由により,既存のシソーラスでも,学術用辞典の解説でも何でもデ

一一^として用いることができる。実際には,学術用語辞典は手元にないため,

またPジ・・ 一一のシソ・・一ラスは登録語が多すぎ実験システムとして適当でないた めに採用せず,同義語・反対語辞典 ( The Natural dictionaly of Engiish Synonyms and Antonyms , edited by G. Elgie Chrlst, LoRdon)を用い

た。例を下に示す。

  String, Cord, file, line, thread, twlne, row, concatenation, series.

  Behaviour, Conduct, deportment, comportment, bearing, demeanour,

   mlen, carriage, air, port, action. Mlsconduct

  Discourse, v. n., Talk, converse, speal〈, expatlate, confer, con−

   fabulate, parley.

   n., Talk, conversation, speech, disquisition, sermon, dissertation,

   homily, D. S. A.

 先頭の語が専門語に当る語であり,それ以降がそれと同義の日常語である。

最後の斜体で示された語は反対語であって,/の記号とともに入力される。小 文字筆記体は品詞を示す。

 プログラムは,オペレータが入力して来た語がキーワードであればよし,な ければ用意された環常語の中を探し,みつかればそれと関連のある専門語(キ ーワード)をすべて示し,選択を要求する。目常語の申にもなければ,ないこ とを表示する。

       一 102 一

(16)

図に応答を示す。

 sy UGO◎oKEIτAI 霧 く 誉 1 や )

       知集$蕎芝

ttltiilllSiilllii±lillSEiESiillillSARg .}D一一F reg

      れ2Pが・llv   TUGr Ne GO KARA ERABE

−1.。。。。晦、、藩。棒ド

ー一一一∫、甑鵬。

一.:ifliU:ue−h.一一一.一.一一.一一一一一一hm一一 TALK a}n th,}i: SPEfCH E}5:31i.

 §耗耗耗耗耗耗§斉憂崇耗誉嬬繕碁耗耗鵜耗§盗耗砦砦葵誉  耗       誉  蒼 M:ZU了AN王 S!ZUO       N

l   N矯、ll虐1鮪

 N STRATEGIES OF VERBAL AC r li  NSCONC:ERNING TWO Aし了ERNA耗

 聾 了:VE (:eN7ENTS       耗  饗      k  憂耗耗耗耗耗耗砦碁憂誉田耗耗舗耗耗§誉蒼耗憂箕砦蓑蓑蓑溢

② 和文文献ファイルの検索

 著者による検索とキ 一一ワードによる検索とがある。

  どちらもMT入力,漢字ディスプレイでの応答である。シーケンシャルな  ファイルなので検索時聞がかかり実用には程遠い。

  プログラムは,漢字プリンタ側のメモリーが少なくてアセンブルができな  いこと,漢字ディスプレイ用の入出力コマンドが難解なことによって,薪た に作成することはあきらめ,すでに用意されている校正・修正システムを利  卜した。

 (3)PDP−11による文献検索

  このプPtグラムはBasicで書かれている。

 (3−1)データ蓄積(NIRON 1)

  フォーマットはどうでもよい,分かち書きにされていてもいなくてもよ い。そのまま,ディスクに蓄積される。

 (3−2)データの追加(NIRON 3)

       一 103 一

下配一一一一一一}一一

R勧〜、ZALK rsキかド・・γ甑さ

(17)

 NIRON 1のファイルにデータを追加する。

(3−3)ファイル名の変更(NIRON 4)

 データの追加が一回のランで終わらなかった場合,文献検索のランをおこ なうとき,MRON 3綴力ファイル名をMRON 1出力ファイル名々こ変更

する。

〈3−4)文献検索

 入力した文字連続(カナ,英文字,門門何でもよい)がファイル中にあれ ぽ,それを全て出力する。出力フォーマットは入力フォーマットと同じであ

る。

 プログラムの全てを下に示す。

 バほほこコねエロ

ユO 〔}PEN .工R〔〕N・NAK. 野『OR OしETPLIT AF FΣしE 群工 i,O PRIN了 ■テ一ヴ言 クイフ9黎ヨ,

懲r, INPUT 自琴 凄くしPR1賊「r 零紘=A琴

「響O PK・INT .デ5−es、 オワ鋼ノカ, yE$=F−XNAL. NO=C.

るO INPI]T B繁

7◎工FE:¥・ FX mAL・rtiV TO gO 30 G口 T⊂13t)

一ヲ。 CL〔i宮E 拝1

.工◎◎ M頴D

10 0PEN 7王RON.NA}ぐ.FOR INF ■T AS、F!LE 牲工 コむ ドロエ   ンケンサワシリイ コリオ ヲイフリセヨゑ

苫◎F,R・INT ll雑ジ・シ  :tl{ {i}、工綬ジテー 40 1NF,VT Aギ

50 1F E煙D #1 THEN llO 60 1NPLIT 幹1;Bギ 70 自=芦t±ξ;(BギひA琴,i)

竃き◎ 工F AmO 61コ To 50  、 e/o PR王N丁 B葦

1◎◎ r=Ct TO 5◎

110 〔LLCIE,E 餐1

ユニこ:}ffN [1

  バゴぽロ ヨコ

1◎.OPEN、,1R〔〕N富NAK, F〔}R INF・UT幽きFIしE#t 20 〔〕PEN ,工RONI.NAK. FOR }⊃りTPIjT AS F叢LE 特2 呂◎ 工F E:N口替1 τHεN 6◎

ミ5 tNFUT 鯵t:A¥

4e・PR工NT 舞2;A¥

5◎ 癌尊 丁±) 30

るO PRINT ,テ 一ヲ言 j>eンチセヨ 70 1NPりT A¥

E【O F幽R工NT #2:《¥

9く塵PRINT ,胃ワリ驚. YE3讐F工NAL7 悼二rttC 1◎◎ INPLIT 欝緊

1工。 XF B¥=:FINAL, G〔玉Tt⊃ 1お0 1三◎ 〔iO TO 70

13◎ なし8.E,E 嚇1 14Q 〔し口零E #L7

150 ENV

 バしほロバるロ

10 1⊃PffN ,1RON. NAK, FOR 1NFI.IT 喬宮 FILE #1 重Q i⊃FEN , IRON.N自Kン FOR or」TPUT A〕ヨ ドエしE 特=

30 工F END 醤1 THEN 6◎

5等 INPし1丁 #工=A¥

4◎ PKI飛丁 #22薩¥

5◎ lso 丁0 3◎

ξ.◎ OL雛$巳 善1 ア◎ 1:1しO忘E 赫2 呂O ENB

4. おわりに

 このシステムは狭い範囲での実用と文献検索自体の実験を目的として作られ た。付録の文献目録,著者名索引,件名索引を作成できたという点では実用爵 的は達成されたと言ってよかろう。オンライン文献検索は実験であったが,新:

しい試みができたという点で三厩の匿標は達成した。

 次に,反省をのべる。

 (1)使労したハードウェアシステムの制限があった。漢字ディスプレイの自 曲な利用ができないため,和文文献検索の実験が十分できなかった。また,

       一 le4 一

(18)

データの修正が容易でなかった。英数字の2/3角文字が印字できなかった。

 ② 本来,このようなシステムはTSSによって動かすべきだと考えるが,

ハー h,ソフ5上の欄限により実現できなかった。文献検索やデータの修正は 云ベレータの思考作業時問が必要であり,かつ,複雑なプnグラムが動かなけ

才しばならない。

 ㈲ これはバッチ処理むきではない。かなりの量のデータが各種に用いら

.れ,かつ,随時データの追加がおこなわれる。したがって用いられた結果,エ ラーが発見されることが多い。このような場合データベース溝造をとるべきだ と考えるが,今回は実現できなかった。

 (4)文献につけられたキーワードに問題があった。語形・表記のゆれがある ことと,キーワードらしくない語がつけられたことである。

 ㈲ このようなマン=マシンシステムでは,スピーードや成功度よりいかに人 澗工学的な配慮がはからわれているかが重要である。使いにくいシステムは結 局使われなくなる。この点の配慮は払われていない。

 (6)当然のことながら,自動インデキシング等に向かわなければならない。

・将来,一貫処理システム(文献12)とのドッキングを考えているが,今回は行

:わなかった◎

 このシステムは,昭和49年国立国語研究所図書館司書の大浪由起夫氏(現在 H本学術会議)と筆者との共同硬究で始めた。システム名王RONは, Informa一

tion Retrieval, Onami&Nakanoの頭文字に由来する。入力項冒の選定やシ ステムの概要を検討した段贈で,種々の理由により中断したが,昭秘1年にな って筆者がこの研究・開発を再開し今賑にいたった。したがって,大浪氏の協 力・助言がなければ,この研究は始められなかったし,完成も見なかったであ ろう。深く感謝の意を表するものである。

 また,プPtグラム・データの作成にあたっては,研究補助員長田厚子・アル バイタ藤生典子の両嬢の協力が大きかった。記して感謝の意を表する。

一105一

(19)

         参考文献

1.森下四郎:AIDORインライン教育文献検索システム 一AIDORシステムと  AIDeR教育シソーーラスについて一,情報管理VQL 2Q Ne.8〜9,1977

2.計量国語学会:第1号一第80号索引,計量国語学11巻附録,1977

3.中野洋:国語研試作版文献検索システムの紹介,計量国語学会第二十一回大会研  究発表要旨,計量国語学11巻3号,1977

4.高松忍・藤鐙米春・西鑓富士央:係り受け関係に基づく文献の検索,情報処理  Vol. 19 No. 12, 1978

5.遠藤勉・田町常夫:文献の主題概念を記述するための書語構造の分析,電気通信  学会技術研究報告AL77−46,1977

6.堂下修司・西照豊明:アブストラク1・による文献検索,電子通信学会技術研究報  告AL78−52,1978

7.飯田三郎・吉田雄二:名書屋大学大型計算機センターにおける文献検索サービス  システムについて,電子通信学会技術研究報告AL78−52,1978

8.神戸大学経済経営研究所経営分析文献センター:文献検索プログラム操作説明  書,昭和44年

9.東京大学大型計算機センターTOOL−IRプロジ=クF利用者マニュアル (上,

 下)第2版,昭和51年

le. 国内のオンライン情報サーービスー一覧。情報処理21−2,1980。

11.中井浩:オンライン情報サービスの現状と今後。情報処理21−2,1980.

12.中野洋:轡語処理における一貫処理の研究。電子計箕機による国語硲究IXI.1978.

一 106 一

参照

関連したドキュメント

契約業者は当該機器の製造業者であ り、当該業務が可能な唯一の業者で あることから、契約の性質又は目的

いずれも深い考察に裏付けられた論考であり、裨益するところ大であるが、一方、広東語

これは基礎論的研究に端を発しつつ、計算機科学寄りの論理学の中で発展してきたもので ある。広義の構成主義者は、哲学思想や基礎論的な立場に縛られず、それどころかいわゆ

しかしながら、世の中には相当情報がはんらんしておりまして、中には怪しいような情 報もあります。先ほど芳住先生からお話があったのは

倫理委員会の各々は,強い道徳的おののきにもかかわらず,生と死につ

自然言語というのは、生得 な文法 があるということです。 生まれつき に、人 に わっている 力を って乳幼児が獲得できる言語だという え です。 語の それ自 も、 から

水難事 故時にパ ニックにな らず対処

では恥ずかしいよね ︒﹂と伝えました ︒そうする と彼も ﹁恥ずかしいです ︒﹂と言うのです