• 検索結果がありません。

意味論的情報の量化の可能性と限界

N/A
N/A
Protected

Academic year: 2021

シェア "意味論的情報の量化の可能性と限界"

Copied!
15
0
0

読み込み中.... (全文を見る)

全文

(1)

意味論的情報の量化の可能性と限界

その他のタイトル Possibility and Limit of Quantifying Semantic Information

著者 加藤 雅人

雑誌名 情報研究 : 関西大学総合情報学部紀要

23

ページ 37‑50

発行年 2005‑07‑15

URL http://hdl.handle.net/10112/11867

(2)

意味論的情報の量化の可能性と限界

加藤雅人*

「情報」という概念は,情報理論の対象としては量的概念であるが,意味論の対象としては 質的概念である.一般に自然言語で表現されるものは意味論的(質的)内容をもっているが,

このような自然言語の意味論的情報を情報理論によって量化することの可能性とその限界につ いて,「意外性」と「個人の情報空間」という視点から考察することが本稿の意図である.結 論的には,量的情報と質的情報は「意外性」という甚本概念において通底性があるため,この 基本概念を基準として自然言語の量化は可能である. しかし,それが可能なのは, 自然言語の (1)音素や文字などの非意味論レベル, (2)形態素,語,文などの意味論レベル, (3)実 際の使用という語用論レベルという 3つのレベルのうち, (1)のレベルに限定される. (2)  と (3)のレベルにおいてそれが困難である理由は,「個人の情報空間」の量化に限界がある からである.

P o s s i b i l i t y  and L i m i t  o f  

Quantifying Semantic Information 

Masato KATO 

A b s t r a c t  

I n f o r m a t i o n  i s  both a  q u a n t i t a t i v e  c o n c e p t  i n  i n f o r m a t i o n  t h e o r y ,  and a  q u a l i t a t i v e  one  i n  s e m a n t i c s .  G e n e r a l l y  what i s   e x p r e s s e d  i n  n a t u r a l  l a n g u a g e s  has s e m a n t i c ,  q u a l i t a t i v e   c o n t e n t .  T h i s  p a p e r  i s  t o  d e s c r i b e ,  from t h e  v i e w p o i n t  o f  t h e  n o t i o n  o f  n o v e l t y  and i n d i v i d ‑ u a l  i n f o r m a t i o n  s p a c e ,  t h e  p o s s i b i l i t y  and t h e  l i m i t  o f  q u a n t i f y i n g  s e m a n t i c  i n f o r m a t i o n .   I n  c o n c l u s i o n ,  i t   i s   p o s s i b l e  t o  q u a n t i f y  l i n g u i s t i c  i n f o r m a t i o n  b e c a u s e  q u a n t i t a t i v e  and  q u a l i t a t i v e  i n f o r m a t i o n  has i n  common a  n a t u r e  o f  n o v e l t y .  But i t   i s  o n l y  p o s s i b l e  a t  t h e   nonsemantic l e v e l  s u c h  a s  phonemes and l e t t e r s .  At t h e  s e m a n t i c  l e v e l  s u c h  a s  morphemes,  w o r d s ,  and s e n t e n c e s ,  and a t  t h e  pragmatic l e v e l  o f  p r a c t i c a l  u s e s  o f  l a n g u a g e ,  i t   i s  q u i t e   d i f f i c u l t  b e c a u s e  i n d i v i d u a l  i n f o r m a t i o n  s p a c e  i s  v e r y  hard t o  q u a n t i f y .  

*関西大学総合情報学部

(3)

3 8  

関西大学総合情報学部紀要「情報研究」第

2 3

2005年 7月

はじめに

「情報」という語は,「交通情報」,「投資情報」,「個人情報」といった日常的な用法におい ては,「お知らせ」や「ニュース」などとともに連想される,意味内容をともなった質的概念 をあらわす. このような情報は「意味論」

( s e m a n t i c s )

に関わる.他方,「情報理論」

C i n f o r ‑ mation t h e o r y )

において,情報は確率論的に量化された概念である.つまり,情報は,質的 概念である限りにおいては意味論の対象となり,量的概念である限りにおいてば情報理論の対 象となるのである.では,これら

2

つの概念はいかなる関係にあるのか.質的概念としての情 報(意味論の対象)に,量化の概念(情報理論)を適用することは可能なのか?その可能性と 限界について,これまでの研究によって明確に提示されていない,「意外性」と「個人の情報 空間」という視点から再解釈することが本稿の意図である.考察の手順は以下の通りである.

1 .  

情報の質と量

1 . 1  

情報の質的側面

1 . 2  

情報の量的側面

1 . 3  

意外性

2  . 

情報の確率論的量化

2 . 1  

確率の逆数としての情報

2 . 2  

等確率の信号からなるコード

2 . 3  

不等確率の信号からなるコード

2 . 4  

冗長性と経済性

3  . 

情報理論の自然言語への適用

結語

3 . 1  

言語の量化:非意味論レベル

3 . 2  

言語の量化:意味論レベル

3 . 3  

言語の量化:語用論レベル

WEB

情報源 参考文献

1 .  

情報の質と量

1 . 1  

情報の質的側面

『オックスフォード英語辞典』

(OED)

によれば,「情報」とは, 日常的な語彙としては,

「ある事実や出来事についての知識ないし『ニュース』の伝達」

(communicationo f  t h e  

knowledge or'news'of some f a c t  o r  o c c u r r e n c e )

を意味する. この規定において重要なの

(4)

は次の

2

点である.「情報」

( i n f o r m a t i o n )

とは,

(1)

まず,「コミュニケーション(伝達)」

(communication)

であるということ,

(2)

しかも,「『ニュース』の伝達」であるというこ とである. (1)の要点は,情報はたんにデータの集まりのような静的な名詞的概念ではなく,

それを「伝達し,他者に共有化させること」

( t ocommunicate/communicare), 

すなわち

「知らせること」

( t oinform)

という動的な動詞的概念でもあるということである.

(2)

の 要点は,受け手にとっで情報性を有するのはニュース価値をもつメッセージのみであるという

ことである.既知のものば情報ではないからである. したがって,あるメッセージの情報価値 を決定する要因には,当のメッセージの内容だけでなく,発信者の意図や受信者の理解度といっ た,コミュニケーション次元における語用論的要素も関連する

( C h e r r y ,p . 2 2 8 ) .  

つまり,質 的概念としての情報には,意味論のみならず語用論も関係してくるのである.後で詳述するよ

うに,このことは意味論的情報の量化を困難にする要因となっている.

1 . 2  

情報の量的側面

情報理論において,情報はメッセージの「確率論的特性」とみなされ,意味とは無関係なも のと規定される

( F l o r i d i ,2 0 0 4 ,  p . 4 8 ) .  

ある信号が情報を持つのは,「それの代わりに出現し うる代替信号を排除する限りにおいて」である

( M a r t i n e t ,p . 1 7 3 ) .  

たとえば,

" G i v eme t h e   a ‑

.. "という断片的メッセージにおいて,

a ‑

という文字には何の意味もない.それは無意味 である. しかし,それは無情報ではない.なぜなら,それは aー以外の文字で始まるその他の 語(たとえば

banana

orange

など)を排除するので,その限りにおいて何らかの情報を持っ ているからである.この例のように,英語という記号体系(コード)において,すべてのアル ファベットはそれ自体に意味がなくても何らかの情報を持っている.

a ‑

に続いて

‑ p r

ーという 文字が出現する(つまり

" G i v eme t h e  a p r ‑

.. ")と,さらに多くの代替信号が排除され,再

び無意味ではあるが情報が与えられる.

さらに続いて,

apr

ーの後に

‑ i c o t

が出現して

" G i v eme  t h e  

apricot." となるとき,その—icot は apr—に比べて情報ははるかに少ない.なぜなら,英語では apr- で始まる語は apricot か

apron

しかないので,

" G i v eme  t h e  a p r ‑

….. "まで与えられた時点で,英語話者は—icot か -on のどちらかの出現を

50%

の確率で予想することができ,ー

i c o t

の出現は排除する代替信号が

1

つ(つまり -on) しかないからである.これに対して, apricot 冒頭の a—やその次の -p- や -r­

は非常に多くの代替信号を排除し,予想される出現確率も—icot よりはるかに低いので,それ が出現したときには逆に大きな情報を持っているのである.以上のように,情報理論において は「排除される代替信号の数」や「ある信号の出現が予想される確率」,すなわちメッセージ の確率論的特性が,情報の量化を決定する鍵となっている.排除される代替の数が多い信号と は,多くの信号の中から選ばれた信号であり, したがって予想される出現確率の低い信号であ る. このような信号は,排除される代替の数が少なく, したがって予想される出現確率の高い 信号よりも多くの情報を持っている.

(5)

40  関西大学総合情報学部紀要「情報研究」第23 20057月

1.3  意外性

では,以上のような情報の質と量という

2

側面は互いに無関係なのだろうか.だとすれば,

質的な「情報」と量的な「情報」はまったくの同音異義語であることになり,そもそも意味論 的情報の量化ということ自体,不可能(または,可能だとしても無意味)となるだろう. しか し,われわれの考えによれば,同じ「情報」という語で呼ばれる以上, これら

2

つの情報概念 にはある種の通底性がみられる.そもそも,質的概念としての情報の鍵は「ニュース性」であっ た.ニュース性とは「意外性」と言い換えることができる.既知のものや予想通りのものは情 報価値をもっていないからである.一方,量的概念としての情報の鍵をにぎるのも「意外性」

である.予想される出現確率の低い信号すなわち「意外な信号」ほど多くの情報値を持ってい ると考えられているからである.結局のところ,意味論においても情報理論においても,情報 とはメ、ッセージの「意外性」の尺度であると言えるのではないか. したがって,質的情報と量 的情報とは,この「意外性」という基本概念において通底し,その限りにおいて意味論的(質 的)情報の量化は理論的には可能であると考えられる.

2 .  

情報の確率論的量化

2 . 1  

確率の逆数としての情報

さて,情報理論では,ある長さのメッセージの任意の箇所にある信号が出現すると予想され る確率を基準として,情報値が計算される.すなわち,情報の量化は信号の数,信号の出現確 率,組み合わせ条件などの観点からなされる (Cherry,p.14).  また,情報理論では電気信号 の ON• OFF に対応した 1• 0という 2つの信号のみからなる 2進コードが採用されている ので,自然言語の文字体系や10進法の数体系は 2進コードに翻訳される必要がある.かりに,

ァルファベットと数字の体系を 2進法における256の信号 (00000000から11111111まで)から なるコードに翻訳すると,たとえば, Aは11111111, Kは11110101, Tは11101101などと表す ことができる.特定の文字を表記するためには,この場合

1

0

を次々と

8

回選択する必要が ある.この選択の回数Cは信号の数Nと以下のように対応している.

選択の回数 (C)

信 号 の 数 (N)

2  3  4  5  6  7  8   . .. 4  8  16  32  64  128  256 .  . .

このCとNの関係は次のような式であらわすことができる.

log2N 

この式の値は,ある数の信号からなるコード体系の中からある特定の信号を選び出すのに必要

(6)

な選択の回数を表している.情報理論では, この選択の回数が「ビット」

( b i n a r yd i g i t )

と 呼ばれ,情報値の基本単位となっている. したがって,たとえば信号の数が256の場合,各信 号の情報値は

l o g 2

256 8ビットとなる.また,たとえば10進法の数コード (N10)では,

各々の数字の情報値は

l o g 2

10 

3.32ビットとなる.

すでに見たように,ある信号の情報量はそれが出現する確率の低さに比例して大きくなる.

言い換えると,情報の量は確率の高さに反比例する.つまり,ある信号が持っている情報量

I

はそれの確率

p

の逆数と考えることができる. これを次のように表すことができる.

I = ‑ p  1 

この式は,確率

p

が小さくなればなるほど情報

I

の値が大きくなることを意味している.情報 理論においては,

2

進コードに基づいて計算するので,この式はより厳密には対数を用いて次 のように表記する.

I=  log2‑ p 

この式もまた,確率

p

が小さくなるほど情報

I

の値が大きくなるという点で上の式と同じこと を示している.

ある信号の確率を決める要因は基本的に

2

つある.同一コードに属する信号の数と,あるメッ セージのなかで当の信号が出現する確率,すなわち信号の相対頻度である.信号がすべて等し い頻度すなわち等しい確率で出現する場合,計算方法は比較的単純である

( H a r t l e y ,

pp.535‑

6 3 ) .  

2.2  等確率の信号からなるコード

たとえば,等しい確率で出現する

N

個の信号からなるコードの中から,長さ

m

のメッセー ジを選択する事例として,宝くじの当選番号を例にとろう.この場合,コードは

0

から

9

まで の10進 法 の 数 字 か ら 構 成 さ れ て お り

(N =  1 0 ) ,  

メ ッ セ ー ジ は

7

桁 の 当 選 番 号 と す る (m 

=  7 ) .  

すると,当選番号は

0 0 0 0 0 0 0

から

9 9 9 9 9 9 9

までの任意の番号となる.このようなコー ドの場合,任意の数字

i

がメッセージ中の任意の位置に出現する確率

P i ( i   =  1 ,  

…,

N)

は,つ ねに等し<,

Pi= 

N  1 0  

である.つまり,当選番号を構成するすべての数字が等しく

̲ J ̲

10  の確率を持っている. したがって,当選番号を構成するある任意の数字の情報量~ は,次の 式で表される.

Ii= l o g 2  1 0  

(7)

42  関西大学総合情報学部紀要「情報研究」第23 20057月

当選番号は

7

桁であるから,当選番号全体の情報量は

7

log2 10となる.一般化すると,等確 率で出現する

N

個の信号群からなるコードから長さ

m

のメッセージを選択する場合の情報量 Imは,次のようになる.

Im= 

log210 

2.3  不等確率の信号からなるコード

これに対して,言語コードはすべて,不等な確率で出現する信号から構成されている.その ようなコードにおける信号の情報値は,それらの不等な確率の平均値から計算される.そして,

確率の平均値は信号の相対的頻度から計算される.たとえば,次のテクスト

T

を,不等確率 コードから選択されたメッセージの例とする.

T=aaaabbcd 

このテクストによれば, aの頻度は

b

2

倍で, C

d

4

倍である. このテクストは全部で 8つの個別信号からなるが,信号のタイプは4種類 (a,b, C, d)しかない.テクスト Tにおけ る任意の個別信号

x

の確率Pxは,

x

の相対頻度九と同じである.つまり, Px= hxである.

そして, xの相対頻度hxは xの絶対頻度Hx(xがテクストの中に現れる絶対数)を,メッセー ジの長さ M で割ったもの,すなわちPx= hx =―エである.

テクスト Tの場合,メッセージの長さ M=B,絶対頻度Ha= 4,  Hb = 2,  He = 1, 

=l 4  2 

であるから,テクスト Tにおいて各信号の相対頻度はそれぞれ, h = ‑ hb = ‑ = 

̲ ̲ ! ̲  

8' h 

8 ' c  8' 

加 = ー で あ る . 各 々 の 信 号 タ イ プa,b,c,dの相対頻度すなわち確率は,すべて 0から 1ま

での値で, 0は0 %を , ー は50%を, 1は100%を意味する.そして当然のことながら,確率

の合計はつねに 1 (=100%)となる.

4  2  1  1 

h□ h 戸 hげ加=—+—+—+-=

8  8  8  8 

情 報 値 を 計 算 す る 公 式 に よ れ ば , 信 号

x

の情報値Ixは, Ix= log2 ‑ = log2  である.テ Px  hx 

クスト Tの場合, Ia=lbit,  lb  =2bits,  le  =3bits,  Id  =3bitsである. したがって, aに対し てbは 相 対 頻 度 が 一 で 情 報 量 が 2倍あり,

a

に対して

c

とdは , 相 対 頻 度 が 一 で , 情 報 量 が

2  4 

3

倍ある.

情報通信の理論では,通信の諸条件を考えるため,テクスト全体の情報量だけでなく,その 平均的情報量を知っておくことが重要となる.この値は,個別信号の情報値の合計をメッセー ジの長さ

M

で割った値である.テクスト

T

の場合,「全情報量」 U‑sumT)は,個々の信号の情 報 値Ixに各々の絶対頻度Hxをかけた積の総和である.すなわち,次のようになる.

(8)

LsumT 

=lbitX 4  +2bitsX 2  +3bitsX 1  +3bitsX 1  = 1 4 b i t s  

これの「平均的情報量」 U‑avT) こ の 全 情 報 量 を 信 号 の 数

M

で 割 れ ば よ い . つ ま り

1 4  

‑bits=l.75bits

となる.一般化すると,次の式であらわされる.

J̲sumT 

‑avT 

この値は,結局,各信号タイプの情報量

I

ェにそれの確率凡を加重したものの総和と等しい.

4  2  1  1  1 4  

l b i t X  ‑

+2bitsX — +3bitsX

‑ +3bitsX ‑ = ‑ b i t s = l . 7 5 b i t s  

8  8  8  8  8 

したがって,一般化すると,

m

種類の信号タイプからなるテクスト

T

において,次の式が成 り立つ.

LavT 

=  P 1 f

P

山+…

+pJi

+p

m

これは,次のように簡単に表記できる.

LavT 

=  f  P J i  

1  1  1 

ところで,すでに見たように,

I=l o g 2

ー で あ り , ― =

p ‑ I

であるから,

l o g 2‑ = ‑l o g 2  p 

p  p 

(分数の対数は負の値を取る)となる. したがって,上の式に

Ii=l o g 2   ― ‑ = ‑ l o g 2 P i

を適用

P i  

すると,平均的情報値が

p

の観点のみから得られる.

LavT 

P i  l o g 2  P i  

これがいわゆる「シャノン&ウィーバーの情報理論」

(Shannon &  Weaver, 1 9 4 8 )

である.

2 . 4  

冗長性と経済性

ある信号に文脈制限を加えた確率のことを「条件付き確率」

( c o n d i t i o n a lp r o b a b i l i t y )

いう.たとえば,交通信号というコードにおいて,青信号の後では黄信号は

100%

の確率を持っ ており,英語というコードにおいては,

a p r i c

ーの後では

‑ o t

という文字列は

100%

の確率を持っ

1 0 0  

ている.確率

100%

ということは

= 1

を意味するので, これらの情報値は

l o g

=O

1 0 0  

ある.要するに,青信号の後の黄信号や,

a p r i c ‑

の後の

‑ o t

は完全に予測の範囲内にあるので 何の意外性もなく, したがっで情報値ゼロなのである.情報値ゼロの信号の存在は,いわゆる

(9)

4 4  

関西大学総合情報学部紀要「情報研究」第23号

2 0 0 5

7

「冗長性」

( r e d u n d a n c y )

を生じさせる.

冗長性とは,文脈から予測可能な値を含む「情報過剰」

( i n f o r m a t i o ns u r p l u s )

のことで,

文脈条件なしの等確率の信号からなるコード(たとえば,宝くじの当選番号)の場合には生じ ないものである.冗長性の計算は,あるメッセージが持ちうる「最大情報値」 (!max)と「現実 に伝達された情報値」 (Ix)との「差」 (Jmax‑Jx)の,最大情報値Jmaxに対する百分率としてな される.式であらわすと次のようになる

( C h e r r y ,p . 1 8 5 ) .  

I  ‑I 

冗 長 性 = max  x 

1 0 0   (%)  I 

max 

修辞学における「冗長」

( r e dundan  t i a )

は,「簡潔」

( b r e v i t a s )

という美徳の欠如を意味し

( D u b o i se t  a l . ,  p . 2 5 ) .  

すなわちその語は「過剰」という悪い意味を内包していたのである.

しかし,情報理論において「冗長性」は,通信にとって望ましい特性である.なぜなら,それ はメッセージがノイズによって歪められ誤って理解されるのを防ぐからである.等確率の数コー ドから生み出される冗長性のないメッセージ(たとえば,宝くじの当選番号)の場合,ノイズ によって

1

個の信号が歪められただけでメッセージ(当選番号)は理解不可能となる. これに 対して, 自然言語には約

50%

の冗長性があると言われている

( M o l e s ,p . 5 4 )

が,そのおかげ で送信ミスや送信エラーの修正が可能となるのである.

他方,冗長性は送信におけるコスト要因である.なぜなら,冗長性によって通信路(たとえ ば通信ケーブル)を占有する時間が長くなるからである.さらに第

2

のコスト要因がある.そ れは個々の信号を産出するのに必要な労力という問題である. この労力は送信されるべき信号 の種類と数が増えるに応じて大きくなる.

1 0 0

種類の信号を区別しなければならない送信者は,

2

種類の信号しか区別しなくてよい送信者に比べて,より多く労力がかかる.情報通信におい

2

進コードが採用される理由はまさにここにある.通信時間の経済性と労力の経済性という

2

つの問題は,「量の経済性」

(economyo f  q u a n t i t y )

と「コストの経済性」

(economyo f   c o s t )

として区別されている

( P r i e t o ,p . 1 0 ) .  

3 .  

情報理論の自然言語への適用

さて,以上のような情報の確率論的量化の理論を,意味内容をともなう自然言語の分析に適 用する可能性とその限界について考察しなければならない.情報理論の言語への適用は

3

つの レベルで考察する必要がある.すなわち,音素や文字という非意味論レベル,語や形態素そし て文という意味論レベル,そして言語の実際の使用という語用論(あるいはコミュニケーショ

ン)レベルである.

(10)

3.1  言語の量化:非意味論レベル

言語の非意味論レベルにおける情報値を決定する要因は,個々の音素や文字の出現頻度,そ れらの組み合わせや語の中で占める位置という文脈条件である.たとえば,英語の音素の頻度 計算によると (Miller,p.86),  もっとも頻度の高い音素は/I/(8.53%)で, もっとも頻度の 低い音素は/3/(0.05%)である.個別に計算すると,これらの音素の情報値は, /I/が3.42ビッ

100 

ト(log2100/8.53=,= log2 ll.72),  /3/が10.97ビット (log2 = log2 2000)である. ところ 0.05 

が,音素の組み合わせという文脈条件を考慮すると,その値はかなり変化する.

/ 3 /

が現れる のはほとんど

/ d

ー/の後であるから,9

/ d ‑ /

の後」という文脈条件下においては

/ 3 /

の出現(す なわち,

/ d 3 / )

確率は非常に高<' したがってその情報値は非常に小さいが,その他の位置 では一般に出現確率は非常に低く (0.05%), したがってその情報値は大きい (10.97ビット).

さらに,音素は語の中で占める位置との関係においても出現確率は違ってくる.語末という位 置では, /D/,

/ z / ,   / v /

は出現頻度が非常に高く,語頭という位置では,

/w/ ,  

/j/,  /h/など の出現頻度が非常に高い. したがって,こうした文脈条件下では,それらの音素の情報値は文 脈なしの場合より小さくなる.

一方,文字の場合,英語ではqの後に uが来ることはほぼ100%予測可能である. したがっ て,この位置では

u

の情報値はゼロである.th‑の後という文脈では, eは約83%, iは約 8

%, aは約 3 %の頻度である (GleasonJr., p.381).  このような文脈条件を考慮すると,英語 の文字の平均的情報値は 1文字当たりわずか1.5ビット程度となるが,文脈条件がない場合の 平均値は4.14ビットである (Cherry,p.186).  この差は,文脈条件下では1文字当たりの冗長 性が相対的に大きくなるということを示している.

3.2  言語の量化:意味論レベル

文字や音素といった非意味論レベルにおける情報値の計算に比べると,語や形態素といった 意味論レベルにおける情報値の計算は容易ではない.というのも,個々の話者によって語彙や 言語レパートリーの多様性が大きく異なるからである.『オックスフォード英語辞典』には約 50万(与219)の語彙項目がある. もし,すべての語が同じ出現頻度であると仮定すれば,各語 は約

1 9

ビット (log2500000与log22 = 19)の情報値を持っている計算になる. この情報値19

ビットは,文脈条件なしの5文字の平均的情報値20.7ビット (=5X4.14)とほぼ同じである.

ところが, じっさいには『オックスフォード英語辞典』の語彙項目のほとんどが

5

文字より長 いので,文字数だけから計算すると各語の情報値は20.7ビットより大きく,辞書頻度から計算 した19ビットとの差はもっと広がるはずである.つまり,語や形態素といった意味論レベルの 情報値は,文字や音素といった非意味論レベルの情報値より小さいのである.この差が意味し ているのは,一般に自然言語の意味論レベルは非意味論レベルよりも冗長性が高いということ である.

しかも,平均的な英語話者の語彙数は,『オックスフォード英語辞典』の語彙項目の数(約

(11)

4 6  

関西大学総合情報学部紀要「情報研究」第

2 3

2 0 0 5

年7月

5 0

万)よりはるかに少ないので,平均的話者の語彙という文脈条件の下での各語の出現頻度は,

辞書頻度よりはるかに高く,その情報値は

1 9

ビットよりはるかに小さくなる.たとえば,頻繁 に使われる

5 0

の語タイプが,話し言葉の語数の約

60%,

書き言葉の語数の約

45%

を占めている

( M i l l e r ,   p . 8 9 ) .  

その結果,平均的英語話者の語彙という文脈条件の下で計算した

1

語あたり の情報値

( 1 9

ビットよりはるかに小さい)と,文脈なしに文字数から計算した

1

語あたりの情 報 値

( 2 0 . 7

ビットよりはるかに大きい)との差はさらに大きくなる. この差が意味するのは,

自然言語は意味論レベル(語)において非意味論レベル(文字)よりも冗長性が高いというこ とだけでなく,話者の語彙や言語レパートリの多様性という個別の文脈条件も,情報値に影響 を与えるということである.

さらに,情報理論の確率論的量化という考え方を,文の意味の計算にまで拡大しようとする のは,「形式意味論」

( f o r m a ls e m a n t i c s )

である

( B a r ‑ H i l l e l &  C a r n a p ,  p p . 5 0 3 ‑ 1 2 ) .  

そこで 分析の単位となるのは,「原子文」

( a t o m i cs e n t e n c e )

である.原子文とは出来事を記述し,

真偽の確定が可能な基本命題を表す.命題論理や述語論理のシステムにおいて用いられる形式 言語では,原子文は単純な命題文字や述語文字と個体で表現される.そして原子文を結合子に よって組み合わせることによって複合文が構成され,さらに原子文や複合文の組み合わせによっ て推論が構成される. この場合,原子文の情報値を計算するための確率とは,与えられた証拠 に甚づいて出来事の真偽を確定する際の「論理的確率」

( l o g i c a lp r o b a b i l i t y )

である.ある 命題のもっている情報は,その命題によって排除される論理的な代替命題の数との関係によっ て確率論的に量化される.この情報値の測定に必要な知識フレームは,ある理想的受信者の持っ ている,形式言語の命題によってあらわされる普遍的知識である

( B a r ‑ H i l l e l ,p . 2 2 4 ) .  

したがって,論理的につねに真なる命題つまり主語概念のなかに述語概念が含意されている 分析的命題には情報はない.分析的命題には論理的な代替命題がないので,情報値はゼロなの である

( H i n t i k k a ,p p . 3 1 1 ‑ 3 1 ) .  

これに対して,論理的に偽なる命題は,論理的には無限数の 代替命題を排除するので,理論上は無限量の情報をもっていることになる.他方,主語概念の 中に述語概念が含まれておらず,そのつど真偽が経験的に決まるような総合的命題の情報量は,

分析的命題の場合と論理的に偽なる命題の場合の中間である.

3 . 3  

言語の量化:語用論レベル

情報理論の適用が「語用論的情報」

( p r a g m a t i ci n f o r m a t i o n )

にまで拡大可能であるかど うかは疑問である.その最大の理由は, もし可能ならば,その理論は特定の個人の個々の現実 の言語使用に関して,社会的,情緒的,価値的な個別知識を数量化しなければならなくなるか らである.つまり,メッセージに対する「関心」や「信念」の強さ

( C h e r r y ,p . 2 4 4 ) ,  

メッセー ジの「有用性」や「信頼性」の程度

(NautaJ r . ,  p p . 2 2 0 ‑ 2 5 ;  2 6 7 ‑ 7 1 ) ,  

そしてそれらメッセー ジの「新しさ」や「確かさ」の程度

( W e i z s a c k e r ,p . 2 0 ) ,  

といった「個人の情報空間」を数 値化しなければならなくなるのである. したがって,このような膨大な要因の数値化を必要と

(12)

する計算は大きな困難に直面することになる.

この問題は,一般コードと個別コードの区別という観点から説明されうる.コミュニケーショ ンにおける情報の量化のための基準には,「一般コード」

( g e n e r a lc o d e )

と「個別コード」

( i n d i v i d u a l  c o d e )

がある.すでに見たように,情報理論では,信号の情報値を確率論的平均 という一般コードと関係づけて量化する情報理論の言語への適用に関しては,文字・音素な どの非意味論レベルでは出現頻度,組み合わせや位置という文脈条件からなる一般コードによっ て計算されるが,語や形態素などの意味論レベルでは,そのような一般コードに加えて個人の 語彙という個別コードにも関わってくる.また,語用論(コミュニケーション)レベルでは,

個人の語彙だけでなく個人の信念や関心や知識の体系という個別コードが関わってくるので,

情報値の計算にはこのような「個人の情報空間」をどのように測定するかという難問がともな うのである.

受信者の観点から言えば,コミュニケーションにおいで情報とは「不確実性を取り除いたり 縮小したりするもの」

( A t t n e a v e ,p . 1 )

である.これは,コミュニケーションを「負のエント ロピー」

( n e g a t i v ee n t r o p y )

と捉える観点にもとづく.熱力学の第二法則によれば,閉じた 系の中の気体粒子は,まったくランダムな分布の状態,すなわち空間における完全な無秩序ヘ と向かって不可逆的に運動する. この無秩序の状態は「最大エントロピー」

(maximume n ‑ t r o p y )

と規定される.物理学的世界においてエントロピーが増大する過程は,コミュニケー

ションにおいで情報が増大する過程の逆である. したがって, コミュニケーションは負のエン トロピーなのである.熱力学の過程においては無秩序が徐々に増大するのに対して, コミュニ ケーションは混沌の中から秩序を増大させる過程である.

コミュニケーションの最初,受信者はこれから受け取ろうとするメッセージについて「不確 実性」の程度が高い状態にある.この不確実性の状態は無秩序・混沌ないし最大エントロピー に当たる.すべての信号が等しい確率を持っているので,受信者の「メッセージ空間」

( m e s ‑ s a g e  s p a c e )

はまだ構造化されず,秩序を持っていない. コミュニケーションが始まるのは,

膨大な量の情報伝達が行われて以後である. じっさい,最初すべての信号は膨大な数の代替信 号を排除し,その情報量は大きいが,メッセージが展開するにつれて,その情報量は減少する.

なぜなら,先行する信号によって後続の信号が次々と予測可能になっていくからである.メッ セージの終わりには,不確実性は完全に取り除かれる.要するに,コミュニケーションとは,

秩序の増大と並行して情報量が減少する過程のことである.

したがって,個別コードは,個々の受信者に「期待の構造」

( s t r u c t u r eo f  e x p e c t a t i o n )

を 生み出させるような知識の蓄積(予備知識)である.ある話題についてまったく無知な人はそ の分野に関する予備知識の量が非常に少なく,あるメッセージの内容について深く理解できず,

無関心となる.その人の関心や期待や不確実性は,出現しうる代替の数(予備知識の量)に対 応する. したがって,コミュニケーションされた情報は,メッセージの内容とコミュニケーショ

ン以前に受信者の個別コードの中に蓄積されていた予備知識の量との相対関係によって決まる.

(13)

48  関西大学総合情報学部紀要「情報研究」第23 20057月

しかも, この個別コードは情報の入力がなされる度にどんどん拡大していくものである. した がって, このような考え方は,受信者の期待,好奇心,退屈について (Berlyne,p.22) また驚き,緊張,不安について (Koch,pp.279‑321)の一般的説明とはなりうるが,その量化 はほとんど不可能である.つまり,情報理論の語用論(コミュニケーション)レベルヘの適用 は非常に困難であると言えよう.

結語

以上見たように,量的概念としての「情報」と質的概念としての「情報」は「意外性」とい う基本概念において通底する.その限りにおいて, 自然言語の情報理論による量化は可能であ りまた有意味である.その結果, 自然言語は,意味論レベルにおいて,非意味論レベルと比べ てかなりの冗長性をもっていることが明らかとなった. しかし,自然言語の語用論(コミュニ ケーション)レベルでは,個々の発信者や受信者の「個人の情報空間」という個別コードの量 化がほぼ不可能であるため,量化が非常に困難であることが判明した.このことは,意味論的 情報への量的アプローチの限界を示すと共に,意味論や語用論などの質的アプローチの重要性 を示すものであると思われる.

そもそも情報理論は,コストと信頼性の両面から通信における送信の効率を最大限に高める 可能性を考察する研究計画であった. しかし,情報理論は1960年代以降それほど発展していな いように思われる.その理由は,

1

つには,研究者たちの関心が情報理論という科学的パラダ イムから, もっと実用的な技術的パラダイム,たとえば「システム理論」や「人工知能」など ヘシフトしたということにもよる (Sebeok,pp.56‑58).  しかし,より根本的なのは,本稿で 考察したような,意味論(語用論)的情報への量的アプローチの限界のためであると思われる.

WEB情報源

Feldman, D., A Brief Tutorial on Information Theory, Excess Entropy and Statistical Complexity: 

http://hornacek.coa.edu/ <lave/Tutorial/index.html,2005.5.  Fraundorf, P., Information‑Physics on the Web: 

http://newton.umsl.edu/infophys/infophys.html,2005.5. 

Introduction to Information Theory, by Lucent Technologies Bell Labs Innovation: 

http://www.lucent.com/minds/infotheory/,2005.5.  MacKay, J.C., A Short Course in Information Theory: 

http://www.inference.phy.cam.ac.uk/mackay /info‑theory/ course.html,2005.5.  Shannon, C.E., 1948. A Mathematical Theory of Communication: 

http://cm.bell‑labs.com/cm/ms/what/shannonday /paper.html,2005.5.  Scheider, T., 2000. Information Theory Primer ‑ With an Appendix on Logarithms: 

http://www‑lmmb. ncif crf.gov 

toms/paper /primer /index.html,2005.5.  UT!, the Unified Theory of Information website: 

http://www.uti.at/〉,2005.5. 

(14)

参考文献

Attneave, F.,  Applications of Information Theory to  Psychology, New York, 1959. フレッド・アトニープ

『心理学と情報理論:基本概念,方法,結果』小野茂,羽生義正訳,ラティス, 1968. Bar‑Hillel, Y., Language and Information, Reading Mass.: Addison‑Wesley, 1964. 

Bar‑Hillel, Y. & Carnap, R.,  "Semantic Information", in Willis Jackson ed.,  Communication Theory,  London, 1953, pp.503‑12. 

Barwise, J. & Seligman, J., Information Flow: The Logic of Distributed System, Cambridge U.P., 1997.  Beaugrande, R.D.,  "Artificial  Intelligence",  in  T.A.Sebeok, ed.,  Encyclopedic Dictionary of Semiotics, 

Berlin, 1986, pp.56‑58. 

Berlyne, D.E., "Information and motivation", in A.A.Silverstein, ed., Human Communication, Hillsdale,  N.J.: Erlbaum, 1974. 

Capurro, R., Information, Munchen: KG.Saur, 1978 

Chalmers, D.J., The Conscious Mind: In Search of a Fundamental Theory, Oxford U.P., 1995. 

Cherry, C., On Human Communication, MIT Press, 1957. コリン・チェリー『ヒューマンコミュニケーショ ン』都丸喜成,木納崇共訳,光琳書院, 1961.

Cover, T. & Thomas, J.A., Elements of Information Theory, N.Y.: Chichester, Wiley, 1991.  Devlin, K., Logic and Information, Cambridge U.P., 1991. 

Dubois, J.  et al., Dictionnaire de linguistique, Paris: Larousse, 1970. J. デュボワ他『ラルース言語学用語 辞典』伊藤晃ほか編訳 (5版),大修館書店, 1995.

Dretske, F., Knowledge and the Flow of Information, Cambridge, MA: MIT Press, 1981.  Floridi, L., Philosophy and Computing ‑ An Introduction., London & N.Y.: Routledge, 1999. 

Floridi,  L.,  "Information",  in  L.Floridi  ed.,  The Blackwell Guide to  the  Philosophy of Computing and  Information, Blackwell Pub., 2004, pp.40‑61. 

Franklin, S., Artificial Minds, Cambridge, MA: MIT Press, 1995. 

Gleason Jr., H.A., An Introduction to  Descriptive Linguistics, New York. 1955. H. A. グリースン『記述言 語学』竹林滋横山一郎共訳,大修館書店, 1976.

Hanson, P. ed., Information, Language and Cognition, Vancouver: Univ. of British Columbia Press, 1990.  Hartley, R.V.L., "Transmission of information", Bell System Technical Journal 7,  1928, pp.535‑63.  Hintikka, J.,  "The varieties of Information and scientific explanation", in B.V.Rootselaar & J.F.Staal, 

eds., Logic, Methodology, and Philosophy of Science 3,  Amsterdam, 1968, pp.311‑31. 

Koch, W. A., "Tension and suspense: On the biogenesis and semiogenesis of the detective novel, soccer,  and art", in T.T.Ballmer, ed., Linguistic Dynamics, Berlin, 1985, pp.279‑321. 

Losee, R.M., "A discipline independent definition of information", Journal of the American Society for  Information Science, 48 (3), 1997, pp.254‑69. 

MacKay, D. M., Information, Mechanism, and Meaning, MIT Press, 1969. 

Martinet, A., Elements of General Linguistics, Chicago Univ. Press, 1960. アンドレ・マルティネ『一般言 語学要理』三宅徳嘉訳,岩波書店, 1972.

Miller, G.A., Language and Communication, New York, 1951. 

Mingers, J.,  "The nature of information and its relationship to meaning", in R.L.Winder et al.,  (eds.),  Philosophical Aspects of Information System, London: Taylor and Frabcusm 1997, pp.73‑84. 

Moles, A.A., Information Theory and Esthetic Perception, Univ. of Illinois Press, 1958.  Nauta Jr., D., The Meaning of Information, The Hague, 1972. 

Prieto, L., Messages et signaux, Paris, 1966. ルイ・プリエート『記号学とは何か:メッセージと信号』丸 山圭三郎訳,白水社, 1998(1974). 

Seiffert, H., Information iiber Information, Munchen, 1968. 

(15)

50  関西大学総合情報学部紀要「情報研究」第23 2005年 7月

Shannon, C.E. & Weaver, W., The Mathematical Theory of Communication, Univ. of Illinois Press, 1948.  C.E. シャノン,

w .

ヴィーヴァー『コミュニケーションの数学的理論:情報理論の基礎』長谷川淳,井 上光洋訳,明治図書出版, 1969.

Weizsacker,  E.V.,  "Uberraschung und Bestatigung gibt  Information",  in  Gerhard Schaefer,  ed.,  Information und Ordnung, Koln: Aulis, 1984. 

参照

関連したドキュメント

は,美的な美術史学の枠を越えようとする「イメージ人類学」としての説得力

その一方,概念化可能なすべての意味クラス が語彙化されているわけではない実際,メ タファーの基盤は,語彙化されていない概念 化を既成の語彙を用いて近似することだと 解釈できる. 2.1.2 意味役割名と意味型名の関係 語∗W で表わされる意味クラスC∗W が語Wで 表わされる実例IW で実現されることを“∗W ⇒ W ” で表わすことにする.“捕食者” ⇒

  同書 197 ― 198 頁。 .

曽 01 今まで考えてもみなかったことだから、

計算の意味を考える上で二つのモデルを本論文では扱う 一つは関係モデルで ある 関係モデルは推移的な二項関係と原子記号全体から二項関係の冪への写像との対で

天皇などに対して自ら積極的に関与することは恐怖を伴う。さもなく

Sは、北末の例ではあるが、 「平懐」42すなわち自らとほぼ同格の官人に対する啓の規定であ く118

いると指摘したが,実はこのようなニュアン