奈良教育大学学術リポジトリNEAR
データベース維持管理上の困難点
著者 山辺 信一
雑誌名 奈良教育大学教育工学センター研究報告
巻 7
ページ 51‑61
発行年 1984‑03‑16
その他のタイトル Difficulties in Maintaining the Data Base
URL http://hdl.handle.net/10105/4597
データベース維持管理上の 困難点
!i ;>j
(教育工学センター)
Difficulties in Maintaining the Data Base
Abstract
The procedure for developing and maintaining a data base is presented. The important steps are (i) to decide the number ofliteratures included in the data base, (ii) to select the indis‑
pensable key words and (iii) to determine the style of the computer‑readable input format.
The Quantum Chemistry Literature Data Base (QCLDB) has been established now in Japan as a service system for non‑specialists as well as for specialists of the quantum chemistry. When the QCLDB system is maintained, some problems are met. They are related to the original data collection from journals. The difficulty in the maintenance and the management of the data base in Japan is discussed.
Key words; data base, data processing, key word sorting
l 研究目的
我々大学教官にとって文献調査は研究の第一歩である。最近は学会誌や商業誌が増加し調査す べき対象がひろがってきている。 1人の研究者が関連したすべての文献を集めることは現在では おそらく不可能だろう。これは各専門領域が複雑に細分化し、近い分野の文献までは手が回らな いことが原因である。,自分では創造的な研究をしたつもりが既に報告されていて、その論文を見落 して大恥をかいた。こんな経験は誰でも1度や2度あるだろう。
最近、多数のデータベースが開発され、その利用が盛んになってきたO一過性の学術上の流行 とも見えるがやはり価値があり時代の要請であろう。文献データベースは上記困難をいくらか解 消してくれる。自分の分野には必ずよく使うキ‑ワードがいくつかあるはずである。キーワード を入力して、それを含む文献をすみやかに拾いあげてくれると調査が非常に容易となる。すみや かに検索(sortingと言う)するためには電子計算機の助けを借りねばならない。利用者は原則 に従ってタイプインさえすればすぐ結果が得られるから、データベースの中味や計算機とのかか わり方は知らなくてよい。自分の研究分野に関係したデータベースがあれば、やはり利用すべき であろう.この情報は東京大学、京都大学、大阪大学等の大型計算センターの図書室に行けば教 えてくれる。
利用者にとって有益なデータベースも作り維持する立場では話が違ってくる。予想以上の苦労
51
LLJ 辺(j ‑
を伴う。利用者の要望と維持管理側の都合がカミ合うまで時間がかかるためである。またデータ ベースに格納するデ‑夕収集上の困難も挙げることができるO今回、データベース設計法と維持 管理上の注意点を述べる。また後者における問題点を列挙する。この説明のため、現在比較的順 調に運転されている量子化学文献データベース( Q岨ntum Chemistry Literature Date Base 、
QCLDB)1'2'を例として用いる。このような紹介は教員養成系大学の学生には意義があると考 えられる。それは、寛在、教育現場で小さなデータベースが多数作られており、教師としてそれ を習得しなければならない環境になってきたためである。例えば、生徒の成績処理や定期健康診 断データ、図書閲覧カードの整理等の使われ方が既に普及している。どの社会でも情報量は必ず 増加する。これを整理して、調べ易くしておくことは必然的な対応である。
Ⅱ データベースの作り方
研究分野で言えば、現在競争が激しく文献調査が大きな比重を占めている部門であろう。また、
多人数の生徒を有する現場では、それらの成績処理のために作る必要がでてくる。作る場合、 4
‑5人のチームを編成しなければならない。データ収集は1人では不可能で、どうしても分担作 業になるからである。
〔1〕チームリーダを決定。研究分野では電子計算機に精通した人が望ましい。現場では、マイ クロコンピューターを使える教師がよいo大量のデータを格納、検索するためにどうしても コンピューターを使わなければならない。
〔2〕データベースで対象とする雑誌を選定する。最初はあまりこの数が多くない方がよい。も ちろんチーム内の人数に依るが、収集の窓口をひろげると、その期限になかなか足並がそろ わない。現場での生徒の保健データならば、最初は試験的に1つの学級に限定して調査すれ ばよい。
〔3〕該当文献を電子計算機の記憶装置に格納しておくための書式決定。図書館の閲覧カードの ように大量のデータを整然と保存するために、計算機判読可能なスタイルを決める。この段 階の作業が最も重要で、かつチーム内のメンバーの意見が分かれる。各研究者の興味、考え 方の違いが書式およびキーワード選定に投影されるO生徒の保健デ‑夕ならば、身長、体重、
胸囲、座高‑・・・といった標準的な項目(item) 4‑5個におさえておくitemが多ければ多 い程、利用する際は便利であるが、反比例して収集上の手間が増える。
〔4〕集められた該当文献を格納、 sortingするためのプログラム作成者を決める。これは30歳 前の若手のメンバーがよい 27‑30歳頃がプログラム作りに一番向いているから。
これだけの条件が揃えばデ‑タベース作りのお膳立てができた。後はデ‑夕収集の協力体制が 固まるかどうかの点だけである。
Ⅲ 量子化学文献データベース(QCLDB)
これは1976年頃より特定研究「情報とシステムの形成過程と学術情報の組織化」の中のC‑5班
「化学構造情報の蓄積と高次処理」の分担課題として開始された。代表者は北海道大学大型計算 機センター長大野公男教授であった。量子化学を専門とする研究者5‑6人を集められ、私も末
52
データベ‑ス維持管理上の困難点
席に加えていただいたO以来、前節で述べた〔1〕 〜 〔4〕の事項を処理しTiがら、QCLDBの 試作品を作った。当時は日本全国共同利用のデータベースを作りあげようといった大それた気持 は全くなかった。集まった研究者がデータベ‑スについて素人ばかりで、その存在の意義さえ疑 問視されたOしかし試作品が作られ、それを作って自分の要求する文献かただちに拾えた時、我 々は必要性を肌で感じるようになった。理由として、量子化学の研究は競争が激烈で、ライバル がどんな仕事をしているか非常に気になる分野であることが挙げられる.以来チ‑ムのメンバー
も増え、内部で分担する仕事も細分化された。また、対象となる学術雑誌の数も増加し、他人様 にもお見せできる格好がついた。現在では日本全国から電話1本とポータブル型TSS装置1台 があればQCLDBを利用できる。定常運転の時期に入ってきたが、そこで新たな問題点、苦労が あらわれた。それは、雑誌から電子計算機判読可能な書式に移し換える手間はどうしても残る、
人手に頼らざるを得ないことである。雑誌の数が増えれば、新たな人手が要る。またその人手は 文献の内容を理解し妥当なキーワードを選定できる量子化学の専門家でなければならない。これ は大学院博士課程1回生以上の力が要求される。その人員確保という仕事が大きな比重を占める ようになってきた。どんなに電子計算機が発達し、優秀なソフトウェアが開発されたとしても、
粗データ収集の手間は依然として残る。 QCLDBが今後維持できるかどうかは結局この段階の可 否にかかっている。
図1にQCLDBの作業の流れ図を示す。左端は各大学の研究室で雑誌より粗データを抽出して
図1量子化学文献データベース(QCLDB)での作業(左‑右)の流れ回
山 辺 信 一
もらう仕事をあらわすO竃子計算機の入力カードを媒体としているが、会話型入力も勿論可能。
年2回に分けて粗データ収集を大学の量子化学の研究室に依頼する。一定の締切日までに粗デー タを集める。集める所は岡崎市の国立分子科学研究所電子計算機センター(図中の太字"IMSつ であるO この粗データをすぐさま、今まで蓄積されているQCLDBデータに追加するわけにはい かない。文献からカードに移し換える時の人的ミスが含まれているからである。ミスは2通りあ
る。 1つは約束した書式が守られていない形式ミス。 2つ目は内容的ミス。これは雑誌より該当 文献抽出し忘れも含む。 1つ目の形式ミスは図中のQCHECKというプログラムで機械的に取り 除くことができる。ただし2つ目はやはり人手に頼らざるを得ない。ある論文の著者がYAMA
BEでなくYAMAPEと入力されていたとしても、 YAMAPEなる人存在するかもしれぬ。
このミスは絶対除かねばならない。今までYAMABEが量子化学のどんな論文を発表したか検 索する時、 YAMAPEで入っている分漏れ落ちてしまう。そこで査読システムが必要となる。
IMSへ集められた粗データはQCHECKにかけ形式ミスを除去した後、収集者グループとは別 の量子化学の専門家に内容査読を依頼しなければならない。粗データ収集‑QCHECK ‑内容査 読を経てやっと既存のQCLDBデータに追加されて、最新版ができあがる。図2は収集,査読の 依頼とQCLDBに含まれる30個(1983年現在)の雑誌である。今までの経験からこの30雑誌に量 子化学の文献が多く含まれていることがわかっている。この収集で漏れ落ちた、つまり他雑誌に 含まれる量子化学の論文はもう1つの関所でひっかかるようにしてある。それはCAS KCherrr ical Abstract Service》の情報検索システムがあって.3)量子化学のキーワードでsortingする。
この操作で最終漏れ落ちを点検する。それではQCLDBなど面倒なことをしなくとも、はじめから CASで全部量子化学の文献をなぜ拾いあげないのか?後述するがQCLDBが単なるキ‑ワード 分類のみのデータバンクでなく、各文献の内容まで立ち入って調べているため、どちらにしても 原雑誌まで戻らなくてはいけない。このため最初にCASにかけても無駄である。なお図2のC ODENとは6ケタの英数字でどんな学術誌にも必ず付いている統一識別名である。
図3は計算機判読可能なQCLDB入力データ形式である i‑vnの項目がスラッシュ/で区切 られて併記される。 Iは論文の著者名。 ⅡはCODEN表示の雑誌名、巻号、ページ数、年。Ⅲは 扱れた化合物。 Ⅳ、 Ⅴ、 Ⅵは技術的な分類でここでは説明を省略する。 ⅦがQCLDBのセール ポイントであり、おそらくこの項目は他のデータベースには含まれていないだろう。コメント欄 で文献の内容の要点が示されるO この項がしっかり書かれていると検索の際、ある論文が自分の 興味を持ったものか否か直ぐ判断できる。またここに収集の際の量子化学の実力が露呈するから、
査読にも神経が使われる。以上がQCLDB維持管理の概略である。著者は収集者、査読者との応 対という事務的な仕事兼内容ミスの除去(査読)を分担している。
次に格納されたデ‑タバンクよりキーワ‑ドを使って必要な文献を拾い出す手順、 sortingを 紹介する。図4で小文字が入力する文字、大文字が出力された情報である。シクロプロパンとい う化合物を量子化学的に扱った論文を捜したい。それはC3H6の分子式を持つ。 item IEの分子式 が利用できるから「C3H6」の文字列を検索すればよい。ただしC3H6には異性体があってプロ ピレンもひっかかってくる。つまり図4で④の入力、「find C3H6」ではシクロプロパンとプロピ レン両方とも、またはどちらかを含む文献を拾いあげてしまう。 "61件もあっtz と注釈されて いる分がそれにあたる。続いて入力⑨で61件の文献の中味を見ることができる。出力は入力の項 目I 、 Ⅱ・‑‑Ⅶを見易い形で列挙してある。やはり打ち出しの中ではComment欄に最初に目が
54 (59ページへ)
データベース維持管理上の問題点
QCLDB (Quantum Chemistry Literature Data Base)データ収集依頼状
昭和58年12月5日(月) 1983年後半(7月〜12月)分。
収集〆切1984年2月29日(水)。データは分子研電子計算機センター 山本茂義まで。
・**** 1983 QCLDB COLLECTORS (S.YAMAMOTO 1983‑10‑26) *****
聖 (N m
‑* 蝣 in
CODEN JOURNAL NAME ASJOAB ASTROPHYSICAL J.
AJCHAS AUSTRALJ.CHEM.
BCSJ A8 BULL.CHEM. SOC.JPN.
CJCHAG CAN.J.CHEM.
CHPLBC CHEM.PHYS.LETTERS
CMPHC2 CHEM.PHYS.
IJQCB2 INT.J.QUANTUM CHEM.
SKI 者 DEF REES MIZUTANI NAGASE AR A KAWA IWA TA KOSUGI HIRAO WATANABE
査 読 者 HOSOYA HOSOYA YAMABE. S IKUTA KOSUGI IWA TA OSAMURA HIROTA IJQSDI INT.J.QUANTUM CHEM,,SYMP. NAKATSUJI NAKATSUJI IJQBDZ INT.J.QUANTUM CHEM..SYMP.BIO. UMEYAMA HIROTA 10 INOCAJ INORG.CHEM.
11 JACSAT J.AM.CHEM.SOC.
12 JCCHDD J.COMPUT.CHEM.
13 JCFTBS J.CHEM.SOC,FARADAY TRANS.2 14 JCPSA6 J.CHEM.PHYS.
15 JESRAW J.ELECTR.SPECTROSC.
16 JMOSA3 J.MOL.SPECTROSC.
1" JMOSB4 J.MOL.STRUCTURE 18 JOCEAH J.ORG.CHEM.
19 JORCAI J.ORGANOMETALL.CHEM.
20 JPAMA4 J.PHYS.B 21 JPCHAX J.PHYS.CHEM.
22 JTBIAP J. THEOR. BIO.
23 MOPHAM MOL.PHYS.
24 NJCHD4 NUOVJ.CHIM.
25 pLRAAN PHYS.REV.A 26 pRBMDO PHYS.REV.B
27 sSCOA4 SOL ID.STATE.COMMUN.
28 TCHAAM Tl寸EORET.CHIM.ACTA
29 THEODJ THEO CHEM.
30 ZSTKAI ZH.STRUCT.KHIM.
TERAM AE MINATO OSAMURA OHTA YAMAGUCHI HUQCL KOSUGI HUQCL TERAMAE NAGASE KITAURA HI ROTA NAKATSUJI UMEYAMA KOGA.N TERAMAE HIRAO KOB AYASHI SATOKO KAMIYA. K KAMIYA,KOGA MIZUTANI
IKUTA
YAMA王3E. S
YAMABE.S NISHIMOTO HUQCL IWA TA HUQCL OBARA OBARA NISHIMOTO OBARA NAKATSUJI AIDA KOSUGI OSAMURA HIROTA KOSUGI KOSUGI YAMABE.S OSAMU RA HOSOYA 図2 データ収集および内容査読依頼状. 30個の学術雑誌からQCLDBデータとして
該当文献を拾い挙げてもらう。
‖」 i2 信
‑
; :
=
・
=
﹂
;
>
>
>
Authorname(s) Journalnamecod
C。mp。undf。rmu藍,volu‑e,page,晶栴巻,‑‑ジ・年
甲ethodsofcalculation(typesofwavefunction)量子化学的計算方法 7つの項目 Basissets│f
Physicalpr。p訟鵠ained計算により得られf=‑這理壷
Free‑stylecommentsontheaimofthepaperandcompoundnames(ifnecessary)論文の要点を書式自 由で入力
72‑ 73 80
72‑ 73 80 Authors/Journal/Compounds/Methods/Basis sets/Properties/Comments
Ill IV VI VII
1枚のカードで表わしきれない時、下のように項目別にカ‑ドを使いわけてよいo
Authors!Journal/
1 11
asterisk signifies the colltinuation
1
詛Compounds/Methods/
Ill IV
'Basis sets/Properties/
V VI
i blank
72‑ ;73 80
72‑ 73
I (
blank
図3 a) QCLDB入力の書式I‑Wの7つの項目が計算機カードで入力される.各カードの上 の小さな数字はケタ数を示す。
I 著書名(この論文では2人) RADOM L.RIGGS N V/
IIH8S」,#,^‑‑^ffi,・IAustralJ.Chem.,35,1071(1982)g>ォ^
*AJCHAS,35,1071,82/
III計算で扱われた化合物(2つの分子式)
*C2NH5O , C3NOH7/
IV,V, VI計算方法,基底,得られた物理量
*1!12/12/
Vll 論文の内容を示すコメ ント。ここではカード2枚を使っているO
*CONFORMATIONAL AND INTERNAL ROTATION BARRIES FOR ACETAMIDE, コメント継続
*N‑METHYLFORMAMIDE AND N‑METHYLACETAMIDE
図3 b) QCLDB入力カードの1例. 6枚の計算機カードを使って1つの論文の内容をあらわし ている。カードの1カラム目の*印が継続行を示す0
56
データベース維持管理上の困難点
ENTER TERMINALTYPE.…..=‥これが出たら復改(CR)を押す。 小文字:利用者の入力 JCT54012A ENTER LOGON 大文字:分子研計算機の
場合の出力 ョ Logon ablcd2 課題を入力する
JET12026A ENTER PASSWORD FOR ABICD3
㊥回‑パスワード。各個人が決めた暗涌番号
[TSS ABICD2 STARTED TIME=09:46: 36 DATE=82‑09‑03 BROADCAST MESSAGES NOT FOUND) READY 出力メッセ‑̲ジ
QCLDBの現状紹介
③直垂] ‑ナQCLDB検索開始
THE EXPLANATION ON SUBCOMMAND OF ORION‑QCLDB CAN BE OBTAINED BY INPUT ̀HOW OR ̀WHAT'.
ORION 03‑03
YOUR USER ID IS USED ELESEWHERE.
CANNOT GET THE PROFILE? REPORT FILE ASSOCIATED WITH YOUR ID. A TEMPORARY FILE WAS CREATED FOR PROFILE? AREPORT USAGE. ANYTHING CREATED IN THIS SESSION WILL NOT BE PERMANENT. WELCOME TO QUANTUM CHEMISTRY LITERATURE DATA BASE LAST UPDATE OF QCLDB IS ON 820720 (DATE), 182546 (TIME) 3661 PAPERS HAVE BEEN COMPLIED IN THE QCLDB
2! find c3h6
;I(
‑C3H6の文字列を含む文献を全部拾い出せ。
61 2/ C3H6 ‑61件もあった。
3! display all ITEM 1
AUTHOR(S) JOURNAL VOLUME PAGE YEAR
‑全部打ち出す。
MCALDUFF E J,HOUK K N
CJCHAG 雑誌名, CODEN (後述)
これは(CanadJ.Chem) (Canad. J. CHEM., 55, 318 (1977) Ill COMPOUNDS(S)
IV METHOD(S) BASIS SET VI PROPERTY VII COMMENT
ITEM 2 AUTHOR(S) JOURNAL VOLUME PAGE YEAR
COMPOUND(S) METHOD(S) BASIS SET PROPERTY COMMENT
ITEM 3 AUTHOR(S) JOURNAL
C3H6, C2H40, C2H80, C3H60, C3H5BR., C3H5CL.,‥.…
RHF GMIN IONZ
IV vI
計算方法, V 用いられた基底を示すキ‑ワ‑ド 計算された物理量を示すキ‑ワード
IONIZATION POTENTIALS OF SUBSTITUTED OXIRANES AND THIIRAN
†
シクロプロパンとは違いそうだ。
LIAKUS A,GALLUP G A IJQCB2
if1 213 77
HL王.,H20,C3H6
RHF.MCSCF GDZP
ONE L,GEOM )
「これは,精度の高い計算で,あまり有機化学的な 意味はなさそうだな‑‑‑」利用者は思う。
DOUBLE SELF‑CONSISTENT‑FIELD METHOD FOR ELECTRON CORRELATION. COMPUTATIONAL PROCEUDRE AND APPLICATION
BOUMA W LVINCENT M A,RADOM L
UQCliコ
以下ITEM61まで続く
図4 公衆回線を利用した会話型でのQCLDB利用法。利用者が長方形ワク内の小文字の入力を すれば、大文字の出力が返って来る。この操作によりキーワードを使って欲しい文献を検索する。
a2 1,7
ENTER YOUR REQUST ゥ
⑦
3/ find c3h6 and cycle * 61 3/
83 4/
6 5/
6/ display all
‑C3H6とCYCL0‑の文字列を持つ文献を見つけよ。 (二重検索) C3H6
CYCLO ( 39 TERMS COMBINED)
C3H6and CYCLO* ‑2つのキ‑ワードをあわせ持つ文献数6つ0
‑ 5ノの6件について, Author,Jonrnal,Volume‥.‥の全てを打ち出す。
ITEM 1 AUTHOR(S) JOURNAL VOLUME PAGE YEAR
COMPOUND(S) METHOD(S) BASIS SET PROPERTY COMMENT
ITEM 2 AUTHOR(S) JOURNAL
DEAKYNE C A.ALLEN L C, CRAIG N C JACSAT
99 3895 77
C3H6, C3H5F, C3H4F2 RHF
GMIN ONEL.GEOM
BOND LENGTH CHANGE BY HALO. SUBSTI.
CYCLOPROPANE
DILL J D,GREENBERG A.LIEBMAN J F JACSAT
i以下ITEM6まで続く
㊥四一検索終り
THE SYSTEM IS LOOKING FORWARD TO SEEING YOU AGAIN!
GOOD BY
*** NORMAL END OF ORION SESSION***
READY
㊨ [遠垂] ‑ ablcd2の課題のTSS on‑lineを切るo
*CPUTIME= 50SEC *ELAPSETIME= 9MIN*REGION= 832KB
PRINT= 17PAGE.…...…=̲…..
最低必要操作の復習
① logon ablcd2‑‑ablcd2課題のSession開始 檀) 1234 日 ‑・パスワ‑ド入力
READY
⑨ gcldb ‑・・ ‑・‑QCLI〕Bデータベース検索開始
㊨ 1/find c3h6 and cyclo*・‑・‑C3H6分子式と, comment欄でcyclo何 がしのキーワ‑ドを持つ文献をさがす。
⑦ 4/display all一一すべて表示
⑧ 5/quit 一一検索終了 READY
㊨ logoff ‑ablcd2のsession終り。
(途中イライラしたらbreakキーを押す。)
58
データベース維持管理上の困難点
分子式C3Hsには2つの異性体がある。
IIH I
㌔・j△C↓蝣H
H
シクロプロパン
(今回、この化合物を含む量 子化学の文献を見たい)
H
.I
班 c・c‑ciH
¥,, H\H
プロピレン (今回は興味ない化合物)
向く。次にもう少し検索の的を絞る。 「C3H6」と「CYCLO*」の2つのキーワ‑ドを有する文 献を捜す。後者はCYCL0‑の後何が付いていても全部(例'. Cyclotron)該当する。しかし2つ を兼ね備えた文献は前述の61件よりかなり少ないはずである。実際、 ⑥の検索で示された如く6 件しかない。それを⑦で早速打ち出すと1個日からシクロプロパン(太矢印)があらわれている。
このような操作でキ‑ワードを用いて目的の文献を深し当ることができる。もっとも今の場合、
「find cyclopropane」で直接分子名でⅦのコメント欄を走査( scan)することも可能である。
ただし、文字列検索であるから、 I、汀‥‑・・Ⅶの項目全部をさがしてくれる。よって「find cy‑
clopropane 」でCyclopropaneという名前を持ったAuthorに行きあたるかもしれないのである。
QCLDBデータは1977年以降発表された文献を集めている。それ以前はどうであるか。この学 問が比較的最近成長してきたので、昔の文献はそれほど多くない。また数少ないことから1977年 以前の分はイギリスの学者によって単行本にまとめられている4) 1983年5月現在で8161の論文 がデータバンクに格納されている。毎年約1000件の文献がデータバンクに追加されているo
QCLDBも開発試作の段階では潜在的であった問題が実用化され始めると浮きぼりになってき た。それらをいくつか列挙する。
(7)粗データ収集に対し謝金を払っているO現在は分子科学研究所のプロジェクトとして校費 が充当されている。しかし、それが何時、打ち切られるかという経済的基盤の弱さがある。
(イ QCLDBの維持、管理に携る人は量子化学の研究者であって、データベースや情報処理に っいてはむしろ素人である。ところが仕事が順調に動きだすと、特定の人の負担が増加する.
電子計算機を使う性格上、徐々に集中管理方式に移行する QCLDB専任のスタッフが必要 となってきた。
(ウ)粗データの信頼性の問題O粗データ収集は図2で示したように全国の大学に依頼しているO 各研究室で誰が実際の粗データ収集にあたるかについて管理者側では注文をつけられないo しかし集まったデータで修士1回生の手になるものと博士2回生のそれとでは歴然と内容に 差がある。特にⅦのコメント欄で論文内容が把握されているか、否かの点で著るしい。一 応、査読で改良されるが、時々そのままデータバンクに追加されてしまう。単純な内容ミス
(例:YAMABE‑YAMAPE)とともに、的外れのコメントも困る。粗データ収集者の実
山 辺 信 一
力の差が、そのままQCLDBデータの中であらわれてしまうO つまり、データの中に質のバ ラツキがある。
(エ) Ⅱデータベ‑スの作り方の節で、 〔3〕の書式決定の過程に触れたO当初、 (I)の項目の AuthorはLast NameCYAMABEのみ、 SHINICHIは省く)だけで入力ということに決 った,1977年から2‑3年この規則で収集していたが、出力を見たある外人からクレームがつ いたInitia王Nameも絶対必要であると言われた.他からも同じ意見が強かったため、途中 からInitialを追加して入力と規則の変更を余儀なくされたOよってQCLDBデータで古い方 はInitialなし、新しい方はありと二重構造になっている。最初の書式決定の際のミスが後ま で響いた。またこれが、維持管理側の都合と利用者の立場がカミ合わなかった例である。
いままでQCLDBの現状と問題点を述べた。 QCLDBはデータベ‑スの中では特異であろう。
論文の中に立ち入って、内容がキーワード表示されている。利用者にとってこれが見られること は非常にありがたい。ある文献が自分に興味あるものか、否かただちに判断できる。ただし、収 集、査読する者には(Ⅶ)コメント欄の表記が最も大変である。今後とも収集対象文献は増加する であろう。この時、負担軽減のためにこれの扱いが問題となる。論文タイトルをそのまま(Ⅶ) に機械的に移し換える等、手間のかからない方式が検討される段階に来ている。
Ⅳ データベースの今後
前節でQCLDBを例に挙げ、製作過程と管理、維持のシステムを述べた。それは大規模で他へ 応用できない部分もあるが、データベースの公式をかなり含んでいると思われる。どんな種類の データベースであれ、5)絶対条件が1つある。それは粗データ収集の人力が定常的に、かつ長期 的に保証されるかどうかの点である。これは管理用ソフトウェアの良し悪し、処理する電子計算 機の性能等技術的条件よりはるかに重要である.データベース存廃の鍵であると言ってもよい。
次の条件は集積されていくデータの管理体制である。大事なデータを紛失したというのは論外で あるが、それとは別に管理者に責任が発生するO生徒の保健管理、個人記録等のデータについて はプライバシー保護の問題がある。保護機能、利用についての規則を設定し、悪用されないよう 最大の注意が必要である。
要するにデータベース製作は簡単だが、続けるのがむつかしい。作る際にはスタッフの熱意が 集中するが、長期的になるとどうしてもずさんな所がでてくる。データベース立案の際、後者に
ういてしっかりとした青写真を持つことが肝要である。
60
データベース維持管理上の困難点
参考文献
1)長村、山辺、広田、細矢、岩田、相木、諸熊、冨樫、小原、田中、大野、
"Quantum Chemistry Literature Data Base", Journal of Chemical Information and Computer Sciences, 21, 86 (1981).
2) K. Ohno and K. Morokuma, "Quantum Chemistry Literature Data Base", Physical Sciences data 12, Elsevier Scientific Publishing Company, Amsterdam (1982).
3) 「ChemicalAbstract Service」 社団法人日本化学情報協会
4) a) W.G. Richards, T.E.H. Walkei and R.K. Hinkley, "A Bibliography of ab initio Molecular Wave‑
functions , Clarendon Press, Oxford (1971).
d) W.G. Richards, T.E.H. Walker, L. Farnell and P.R. Scott, "Bibliography of ab initio Molecular Wavefunctions: Supplement for 1970 ‑ 1973", Clarendon Press, Oxford (1974).
c) W.G. Richards, P.R. Scott, E.A. Colboun and A.F. Marchington, "Bibliography of ab initio Mole‑
cular Wave functions: Supplement for 1974 ‑ 1977", Clarendon Press, Oxford (1978).
5) 「国立大学教育工学センター協議会研究発表論文集」毎年10月発行。毎年4‑5件これらに関連した 研究発表が含まれている。
61