• 検索結果がありません。

情報システムのシステム特性 —シミュレーションによる文献情報システムの費用・効率分析—

N/A
N/A
Protected

Academic year: 2021

シェア "情報システムのシステム特性 —シミュレーションによる文献情報システムの費用・効率分析—"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

特集機データ・ベース………一一...…………m…....・H・....…...・H・-………...園田園田四回目田町四回児玉文雄綴

情報システムのシステム特性

シミュレーションによる文献情報システムの費用・効果分析一一

電子計算機の出現により,情報システム,デー タ・ベース,データ・パンク,情報検索というよ うな言葉が世の中にはんらんするようになった. さらに) ~nÞ 算機の大容量・高速化の進展と,社会 における情報の需給の増大との相乗作用の結果と して,ますます大規模で高度な情報システムの開 発が試みられるようになってきている. このような大型のシステム開発にあたっては, そのシステムが基本的にもっている固有の特性 を,まず理解しておくことが必要不可欠である. しかし,計算機を計算以外の形で利用することに 関しては,その歴史が浅く,充分なデータや基礎 理論が整備されていないので,情報システムのシ ステムとしての特性を分析することは容易ではな

、 1 v -方,情報システムは計-算機の出現と同時に世 の中にあらわれたような錯覚をいだきがちである が,よく考えてみると,文献情報の蓄積や処理を 行なう図書館としづ形で古くから存在 L ,広く利 用されていることに気づく.そして,その歴史の 長さに比例する形で,個々の部分的機能の諸特性 に関する分析は蓄積整備されている.ただし,情 報源から使用者にいたる全体を一つのシステムと して把握することは,計算機の図書館への導入と ともに順次なされつつはあるが,充分とはいえな し、. そこで,本稿においては,科学技術の学術文献 のための情報システムを対象として, ドクメンテ ーションの分野で個別に得られている諸特性を, シミュレーションモデルという形で統合すること により,情報システムのもつ基本的特性を費用・ 1978 年 7 月号 効果という形で明らかにしたい.したがって,特 集テーマであるデータ・ベースを直接的に取扱う ことにはならないが,情報システムの特性分析に 関するモンテカルロ・シミュレーションという O R 的アプローチの一例を提示することにより,こ の分野における OR ワーカーの活躍が今後増大し ていくことを希望したい. なお,本稿の内容は,昭和初年度の大蔵省主計 局の科学的財務管理事例研究として援助を受ける ことにより出発し,以後改良されたものであるこ とを記しておく.

1

.

モデルと設計パラメータ 情報システムの機能を,収集,貯蔵,処理に分 却し,情報源と使用者を環境と考えれば,図 1 に 示すようにモデル化で、きる.システムは,情報源 から一次情報 (primary information) を収集し, これな三次情報 (secondary information) に処理 し,この三次情報を使用者に配布する.そこで, 使用者は配布された二次情報を利用して,必要な 一次情報をシステムから引き出すことができる. 以」二より,情報システムをつぎのように定式化 できる.まず, Si ・情報源に作在する i 種の一次情報の集合 (たとえば,定期刊行物,単行本,テクニ カノレレポート) C: 収集された一次情報の集合 わ:収集された一次情報に対する J 種の処理 (たとえば,抄録する,索引をつくる) Nj: システムにより処理された j 種の二次情報 の集合(たとえば,抄録集,索引集)

4

4

1

© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

(2)

一次情報 収集 (情報源) 二次情報 配布 使用名 [8]. すなわち, システムがランクに したがって-次情報を収集すると仮定 すれば,収集半の設計バラメータは, システムが収集した一次情報の最後の ランクにより決定できる.そして,こ の最後のランクを,情報源に存在する その種類の一次情報のすべての数で割 ることにより , i 種の一次情報の設計 パラメータ , cþi を, 引 =Wi/I ふ 1 , Wi: 収集された i 種の情報の最後 貯蔵 処理 C 図 1 情報システムのモデル とすれば , Nj は J 種の処理むの結果として得 られるものであるから , Tj は C から NJ の上へ の写像であると考えられる. すなわち,

T

j :

C

一一→Nj, である. 上記モテ、ルにしたがえば,システムの設計バラ メータは, 収集する一次情報の種類, その収集 率,実行される処理の種類,の三つである.情報 の種類と処理の種類の設計ハラメータについて は,それぞれ,収集される一次情報の種類の集合 を 1 , 実行される処理の種類の集合をよとする ことにより定式化できる. 同種類の一次情報の中で,どの情報から収集し ていくかの順序については,使用されることの多 い順に収集されるとし寸経験則を採用する.これ は,同種類の一次情報を使用実績の多い )1闘に,ラ ンク (rank) をつけることにより操作化できる のランク ISi い集合ふの要素の数 で定義できる.

2

.

情報需要の分布 使用者の情報需要の分布を知るためには,おの おのの一次情報が使用者にとって必安であったか どうかを示すデータを入手しなけれはならない. この種のデータの典型的なものとして,学術論文 の引用文献をあげることができる.化学分野の論 文の中からランダム抽出によりiOO論文を抽出し, おのおのの論文について i 種の一牟次情報をいくつ (hi コ)引用しているかを調べた結果を相対頻度 の形で表 1 に示す. そこで , R を使用者にとって必要であった宇次 情報の集合とする.収集キとの関係では , R の H 怠の要素のランクがどうであるかが吊安である. 表 1 使用者に必要であった一次情報の数の分イlî 引用された一次 情報の数 (h;) 。 9 一次情報 の種類 (S;)

定期刊行物

0.010.010.02, 0.0川 021 0. 0

o

01!

O

.

0

3

1

O

.

0

5

0 叫 O. 凹 O.

0

2

O

.

0

4

O

.

0

5

O

.

0

8

テクニカノレレポート 単 行 本 メ~斗Z 個 人 的 接' 市虫 (h;) (S;) 定 期 一刊 行 物

4

4

2

2 3 4 5 6 7 8

1

0

1

1

1

2

1

3

1

4

1

5

0

.

7

2

O

.

15 , 0.0~0.ODO.0210.01'0.01

O

.

3

4

O

.

2

7

:

O

.

1

6

0 仰仰のi

O

.

0

1

0.0山川 020.000.02

0

.

9

1

0.06

,

O

.

0

2

i

O

.

O

O

[

O

.

01

,

0

.

7

5

0

.

2

0

:

O

.

0

4

'

O

.

0

1

1

l qペノ 円 u q コ ハツ つ h o o q 4 ヴ Iι q L f o q ,ゐ Fh ノ n r r -A T q L q 3 q L q, b q ,ゐ l q L n u q , h n y 1 00 1 7 t l / O l ハu n u ハ U ー ハ U n u l n u 円 U q 4 n u

ハ U l n u n u q コ ハU

円 u q , L n u ハ U l n u

n u つ 4 n u -n u q L ハU A U r o n u n u 戸h ノ 円 υ n u qコ ハ U

n u r「ノ ハU n U A 守 口 U -n U R ノ ハ U

ハ U

(3)

これに関しては, トクメンテーションの分野で, Brandford-Zipf の法則があり , R の任意の要素 f のランク α が切らよりも低くない確率は, Pγ{α=玉 Wi}=Fi(Wi)=log Wdlogl ふ 1 , で与えられる [1 ].したがって,集合 R の任意の 要素 r が,収集率引のシステムにより収集され ている確率は,日 (φ ・ ISil) で計算できる. 二次情報と情報需要との関係においては,つぎ のことが重要である.すなわち,二次情報という ものは,それ自身が使用者にとって直接に有用な ものではなしそこから一次情報を引き出すとい う意味においてはじめて価値をもつものである. したがって,種々の種類の二次情報,すなわち種 々の処理の効率は,その二次情報によって使用者 が必要な情報を引き出すことができる確率により I汁測することができる.

AS

Ll

B

Cranfield ブ。ロジェクトにおいては, 表 2 に示すフォームにもとづき,種々の処理につ いての評価テストが行なわれている [3J. そこで, nj: 使用者に必要な情報を引き出してくれる j 種の二次情報の集合, とすれば , R の任意の要素 f が j 種の二次情報に より引き出されることは r が Tjーlnj(Tj-l は Tj の逆手像)に属するという形で定式化できる.そ して,その確率は,

Pγ {rE

T

j

-

ln

j}

=a/

(a+c)

で与えられる.

3

.

システムの有効性指標と費用分析 使用者がシステムを利用することにより期待す ることは,必要な一次情報をできるだけ多く知る ことである.したがって,システムの有効性は, 表 2 ASLIB テストの評価フォーム

r

e

l

e

v

a

n

t

non-relevant

(必要不必要)

r

e

t

r

i

e

v

e

d

(ヲ|き出した)

a

b

n

o

t

r

e

t

r

i

e

v

e

d

(リ|き出さなかった) c

d

1978 年 7 月号 S3

.

s

t S. 図 2 有効性指標の計算のためのフェン図 情報源に存在する使用者に必要な一次情報の数 と,システムを利用することにより得られる一次 情報の数との比で指標化できる. 情報システムの設計パラメータ ,

1

,

J

,

cjJi が与 えられたときに, 使用者に必要な情報の集合 R と,システムを利用することにより得られる情報 の集合との関係は, 図 2 に示すフヱン図で表現で きる.図においては ,

1=

{2

,

4

},

J=

{1,

2} であ り,収集率。2,仰で収集される一次情報の集合は C

2

( 山), C

4

( 山)で示されている.システムの使用 により得られる情報の集合は斜線で示されてい る.各集合の聞の関係は,前節で述べたように, すべて確率現象として定式化されている.したが って,モンテカルロ・シミュレーションによりシ ステムの有効性指標を計算することができる. 図 l のモデルにしたがえば,情報システムの運 用費用は,収集費用,貯蔵費用および処理費用の 三つからなる. したがって, 設計ノミラメータが

1

,

J, φ4 であるシステムの費用 C(I, φ, J) は,

C

(1

, cjJ

i

,

J

)

=

L. iel 似・ IS.I ・ cjJár'A(I,cjJi)

+

L

.

j

e

J

ßrBj

(I,

c

j

J

.

)

となる. ここで) 的種の一次情報の収集単価, r: 貯蔵単価,

A(I

,cjJ

t)

:貯蔵数,

4

4

3

© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

(4)

表 3 費用分析のための文献調査結果 (単位:ドル) 単価の 種類 i 報告されている数値 出 典

収集判事期刊行11227 ケ単行本 Williams 伊]

白色 33.71 25.97 36.26 貯蔵単価 0.135

F

u

s

s

l

e

r

[5J

T

処理単価抄録

索引 タイトル索引

y

e

r

[8J

j

26.0 10.0 2.74

L

i

n

d

e

r

[7J ん: j 種の処理単価, Bj(I, ψ)

:

j 種の処理数, であり,各種の文献調査により得られた単価を表 3 に示す.

4

.

情報システムの特性 前節に述べた有効性の分析と費用分析とを組み 合せれば,情報システムの基本的特性を費用・効 果の形で調べることができる.本稿では,以下の 設計パラメータの組合せに限定する.収集の設計 パラメータの要素については,

(

1 ・・ ・・定期刊行物, 1=12 ・・・・・・テクニカルレポート,

¥

3 ・・・・・・単行本, とし,処理の設計パラメータの要素については, 表 4 番号と設計パラメータの対応 150 番号|収集のパラメータ|処理のパラメータ

1

J

{ 1

,

2

,

3 } { 1

,

2} 'I'i

1川 l

2 { 1

,

2

,

3 } 2 } IIJ 4 2

,

3 } {I

,

2} {I

,

2) 10' 7 18011 1 レ 、ー 3 } (I

,

2) 50 13 { 1

,

2

,

{I

,

2) 14I { 1

,

2

,

15 ' { 1

,

2

,

{ 1

,

2} 1d~r 20 I { 1 0.1 21

I

J=[

1

・・・抄録,

'2. …・索引, とした. したがって nJ 能な情報システムの数 は, (231)・ (22-1) =21 通りである. 収集中に ついては,それぞれのシステムが収集するー次↑古 報のすべての種類について ,

Øi=0.25

,

0.50

,

0.75

,

1

.

00 の 4 段階に限定した. 代表的な情報システムについての計算結果を図 3 に示す.図において, 0 印で固まれた番号はお のおのの情報システムに対応し,設計ハラメータ との対応表を表 4 に示す.さらに,おのおのの情 報システムについて,その収集率を変化させるこ とにより,費用・効果曲線が拙かれている. 図 3 の結果を一般化して,情報システムのもつ 基本的特性という見地から検討すれば,以ドのよ うになる. (1)情報システムを④と⑩およびそれ以外の 2 つのグループ。にわけることができる.この|ベ別は 定期刊行物を収集しているかどうかに起因する. 使用者が研究者であることを考慮すれば,当然の 結果といえよう.このことは,収集される-次情 報の種類が情報システムの費用・効果を第→義的 に決定することを意味している. (2) 収集率については,一般的には,有効性が Ql ií~ v ⑬ 0.2 0.3 0.4 U.5 IJ 目 6 7 O.H 9 1.0 イj 効刊指標 図 3 費用・効果の計算結果

(5)

上昇するにつれて費用はほぼ指数的に上昇してい るといえる.しかし,システムが図 3 において左 に位置すればするほど,費用の k昇は激しい.こ のことは,収集する一次情報の種類と実行される 処環の縄類が適当でない場合にはいくら収集率を 卜: '11-させても,有効何ーに限界があると同時に,収 集中を 1: 界させることのメリットが少ないことを 立 l朱している. (3) 費用・効果という評価基準にしたがえば, 同において右下にくるほどよいシステムというこ とになる.したがって,おのおのの費用・効果曲 線の包絡線を描くことにより最適システムを設計 することができる.結論的には,最適システムの 費用・効果的線は費用・信頼性曲線に類似してお り,使用者の要求を 100% 満たす情報システムは 非常にコスト高になる. 以 lニの結果を,今後の情報システムの開発に関 連させれば,つぎのようにいえる. 使用者の要求は多様であるため,情報システム の開発には,多大の労力と費用を投入しなければ 使用者にとって有効なものになり得ない. 一方, 特定の使用者を対象とする小規模で手軽なシステ ムの設計にあたっては,収集する情報や処理につ いて,使用者の利用パターンを充分調査して,決 定していく必要があろう. むすび ここでは,特別な例を対象として,情報システ ムの特性分析への OR 的アプローチの例を示した が,情報システムをとりまく環境や技術は大きく 変化しているので,このような研究は持続的にな されねばならない.したがって,情報システムを 社会システムの一環として分析していくうえで, OR ワーカーの果す役割は大きいといえよう. 参考文献

[

1

]

Brookes

,

B

.

:

The Derivation and Application

o

f

t

h

e

Brandford-Zipf D

i

s

t

r

i

b

u

t

i

o

n

.

The Joumal

of Documentation

,

vo

l

.

24

,

No. 4 (

1

9

6

8

)

.

1978 年 7 月号

[2] Carter

,

L

.

:

National Document-Handling Sysュ

tems for S

c

i

e

n

c

e

and T

e

c

h

n

o

l

o

g

y

.

John Willey

,

1

9

5

7

.

[

3

] Cleverdon

,

C

.

and Keen

,

M.: Factors Deュ

termining t

h

e

Performance o

f

Indexing Systems.

ASLIB Cranj eld

Rese山・ch

PI'oject

,

National

Science Foundation

,

1

9

6

6

.

[4] Coile

,

R

.

:

P

e

r

i

o

d

i

c

a

l

L

i

t

e

r

a

t

u

r

e

f

o

r

E

l

e

c

t

r

i

c

a

l

Engineers.

The J

o

u

r

n

a

l

of Documentation

,

vo

l

.

8

,

No.4 (

1

9

5

2

)

.

[

5

] Fussler

,

H. and Simon

,

J

.

:

P

a

t

t

e

r

n

s

i

n

t

h

e

Use o

f

Books i

n

Large Research L

i

b

r

a

r

i

e

s

.

The

U

lI

i

v

.

of Chicago Library

,

1

9

6

1.

[

6

] Landau

,

B

.

:

The Cost Analysis o

f

Document

S

u

r

r

o

g

a

t

i

o

n

.

American Documentation

,

vo

l

.

20

,

No. .

4

(

1

9

6

9

)

.

[

7

] Linder

,

H. :

Comparative C

o

s

t

s

o

f

Document

Indexing and Book C

a

t

a

l

o

g

i

n

g

.

S

p

e

c

i

a

l

Libraries

,

vo

l

.

5

6

(1

9

6

5

)

.

[

8

] Overmyer

,

L

.

:

Test Program f

o

r

Evaluating

Procedures f

o

r

t

h

e

E

x

p

l

o

i

t

a

t

i

o

n

o

f

L

i

t

e

r

a

t

u

r

e

o

f

I

n

t

e

r

e

s

t

t

o

M

e

t

a

l

l

u

r

g

i

s

t

s

.

A

m

e

r

i

c

a

l

l

Documenュ

tation

,

vo

l

.

1

3

(

1

9

6

2

)

.

[9] Williams

,

C

.

:

Library C

o

s

t

Models. Western

Research Inc.

,

Maryland

,

1

9

6

8

.

こだま・ふみお 1941 年生 埼玉大学教養学部助教授

j

次号予告

特集組合せ理論の応用 組合せ理論の応用への入門 高橋磐郎 ブロック・デザインと符号 中村義作

Consecutive 1

'

s

property について 中野猛夫 2 部グラフの分割理論を利用した概念 構造決定法 杉原厚吉・伊理正夫 OR サロン 学生会員と OR

4

4

5

© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

表 3 費用分析のための文献調査結果 (単位:ドル) 単価の 種類 i 報告されている数値 出 典 収集判事期刊行11227 ケ単行本 Williams 伊] 白色 3 3

参照

関連したドキュメント

文献資料リポジトリとの連携および横断検索の 実現である.複数の機関に分散している多様な

全国の 研究者情報 各大学の.

テキストマイニング は,大量の構 造化されていないテキスト情報を様々な観点から

題が検出されると、トラブルシューティングを開始するために必要なシステム状態の情報が Dell に送 信されます。SupportAssist は、 Windows

「系統情報の公開」に関する留意事項

2-1 船長(とん税法(昭和 32 年法律第 37 号)第4条第2項及び特別とん 税法(昭和 32 年法律第

CREATE TABLE ‘stock_tickly_200807‘ ‘id‘ int11 NOT NULL auto_increment, ‘update_date‘ datetime default NULL, ‘stock_code‘ int11 default NULL, ‘maturity_type‘ int11

 多くの先行研究が,企業の公表する情報における情報移転に関する分析を