し
z
がA に属していないならば,x~A と書きます(この節の下の図)が,こ のとき, I A君は天才だJという文章は,文章の作り方としては間違ってはい なくても,意味的には誤っています(真理値が偽false).~287 これらの集合に属するものは,ほとんど無限で、あって,いくつとい
うことは難しいように思われます.しかしたとえば普遍集合を私たちの大学 の学生と考え,Aを1年生の集まり,Bを19歳の学生の集まりとすると,ど れも数を数えることができます.このようにある集合Aに属する要素の数は
I A I
,集合B
の要素はI B I
というように表されます.このようにある集合に属 する要素の数を,その集合の濃度 densityといいます.例えば幼稚園の「さくら組」を46人の子ども達の集まりだとし,その集合
をSとしますと,
1 8 1 =
46ということになります.4 .
メタ理論の基準の評価!
i 2 8 8
ところで今,言語理論をちょうど幾何学のようなものと考え,いく つかの前提(公理に当る)からいくつかの規則(たとえば代数でいえば足し算,引算,かけ算,わり算のようなもの)を使って,全ての文章を生み出す理論だ と考えます.
このようにある理論によって導出された文章の集合に
I M n N I
p =一一一一一 ついて,ロシアの言語学者アプレシアン
IOp
l1話且e p e ‑
I M I
HI1KOB:I1可
A r r p e C
JiH( 1 9 3 0 ‑
)はイェルムスレウの網羅性A= 区 2 立 1 ( P )
と妥当性( A )
および単純性( 8 )
という基準に「経済I N I
性J(E)という基準を加えて,左の表のように示してい E =一巴己 1
ます.ここでM を対象の集合,すなわち現実に存在しI N I + b
ている対象(実際に使われている文章)の集合,N はモ8= 巴己 1
デルによって生み出される対象の集合(言語のばあいなI N I + c
らば,ある文法によって説明できる文の集合)とします.bは初期概念(公理)の数,
c
はモデルが集合Nを生み出すのに必要な導出規 則(書き換え規則)の数を表すとされています[34,
pp.265・279]・!
i 2 8 9
これらの式に共通するM
とN
の関係は右の図のとおりです.MnN
は集合 M と N の交わっている影のついた部分に当ります.
この部分は集合M から見たばあい,
M
の一部分です
(MnNc M)
ですから,p =
唱 F
は集合 M に属している要素 の数に対するMnN
に属する要素の割合 を求めることになります.つまり,pは 実際に存在している言語の文章のどれだ けを説明できるかを表すことになるので す.したがって P=lに近づくほど,こM N
の理論は現実をよく説明できることになります• P = 1の時は,理論が現実 にあるものを全て説明できることを示しています.これが理論の「網羅性」
を示すものであることは明らかです.
~290 しかし P = lだからといって,この理論が「妥当」なものである ということには,必ずしもなりません.たとえば次の図のように集合 M が 集合 N の部分集合になっているとき,すなわち
M c N
であるときには,MnN=M
ですから,P
はP一 昨ー は れi
となって,たしかにP =
1になり ます.しかしこのばあいには N の部分ではあるがM の部分ではないもの(これを
N‑M
とあらわし ます),すなわち N の内側で M の外側にある部 分が多ければ,この理論は現実に存在しない文 章までも,たくさん説明する(生み出す)ことに な り ま す 二 番 目 のA =
唱 戸 は こ の 「 妥 当 性」を評価するものです.このばあい,一番理 想的な理論はN‑M=O
のとき,すなわち余計H
なものを生み出さないときです.このときは
M=N
となって,二つの集合は 完全に重なり合います.このことからAはできるだけ1に近い方が,理論と して優れていることになります.したがってAは理論の「妥当性Jadequacy を表すものだということになります.~291 例えばもしある自動販売機がかりに「オレンジジュースJ, fグレー フ。ジュースJ, fバナナジュース」しか売れない機械だとするとき,この機械 がこれらの語の外に「お茶j, fコーラj, f紅茶」という語も理解できるような 言語を持っていても,意味がありません.機械をいたずらに複雑にし,製造 費が高く付くだけです.実際に必要なものの集合の元
I M I
は3
なのに,この 機械の言語が生み出す単語の集合の元I N I
の数は6
です.すなわちIMI=3
,I N I =6
でIMnNI= 3
ですから,P =弔 や = 明 = 1 , で は あ り ま す が,A =
弔 戸 = 附=0.5となります理想的なものはlに等しい訳です から,この機械は妥当性に欠けるということになります.~292 アプレシャンによれば,理論の「経済性」はE =桝 に よ っ て
計られると言います.ここでbというのは,先に述べましたように初期概念 (公理)の数です.公理というのは外のどのようなものからも証明できないも ので,どのような理論にも少なくとも一つは必ず存在します.たとえば,既 に述べたように,ユークリッド幾何学の公理は5個あり,それは1)任意の点 と他の任意の点とを結ぶ一本にしてただ一本の直線を引くことができる.2) 任意の線分は,これを左右にいかほどでも延長することができる.3)任意の 点を中心として,任意の半径の円を描くことができる.4)直角はすべて相等 しい.5) 2直線が1直線と交わっているとき,もしその同じ側にある内角の 和が直角よりも小さかったならば, 2直線は,限りなく延長すれば必ずその 側で交わるというものでした(121頁参照).
したがってこの式は結局証明できない公理の数が最低一つは必要として,
できるだけ少ない方が,経済的な理論だと主張することになります.
3
293 最後の式s=
闘 の ば あ い , cはこの理論が公理から出発してい ろいろな文章を説明するために必要な規則,あるいは公理から出発して色々 な定理を導くための規則の数を表します.r
導出規則Jです.この規則の数が 少なければ少ないほど理論は単純なものになります.しかし少なくともこの ような規則は一つなければなりません.全くなければ証明あるいは導出が行 えないからです.したがってcは最低一つなければなりませんが, cの数が少 なければ,それだけSの値が 1に近くなり,理論が単純なものになります.アプレシャンの式は,理論の包括性,妥当性,経済性,単純性などを数値 的に評価することを可能にしていますから,対象を説明する複数の理論があ るとき,どの理論が選りすぐれたものであるかをこれを用いて評価すること ができます.ある同じ対象を説明する複数の理論の優劣を計るものですから,
これはメタ理論に属するものといえます.
第 十 五 章
生成文法と変形文法の挫折 チョムスキー
1. チョムスキーと『文法の構造』
~294 チョムスキーNoamChomsky (1928・)はペンシルヴァニア大学の ハリスのもとで学びましたが,彼が一躍有名になったのは, 1957年に出版さ れた
S y n t a c t i cS t r u c t u r e s
によってでした.これは日本では『文法の構造』という名の下に,勇康男氏によって翻訳されました(cf.[12]& [66]). この訳 者による解説が訳書の末尾にありますが,新しい理論に出会った訳者の「目 の前が開けたよう」な喜びと気負いとが,側々と伝わってきます.
~295 アメリカ言語学の主流をなしていた記述言語学という,データ中 心の記述をこととしていた言語研究に対して,彼は 1.. . . . .言語研究はあた えられた data 1資料」の中にのみ限られるべきものでなく,新しい文を無 限に発話できる speakers 1話し手Jの能力(また新しい文を聞いて理解する hearers 1聞き手」の能力)の中にみられる言語の創造面( creativity")を解明 することも,言語学の大切な課題である.このような課題にとりくむために は, manipulationand arrangeme叫 ofdata"(データをいじくって並べるこ と)に研究を局限する考え方を棄てて,一般言語理論を検討し, develop (展 開)することが必要になってくるJ[66, pp.107‑108]と述べています.彼はさ
らにこのくだりを「かくして,言語の内面にひそむregularities 1法則性」を 深く洞察し,それに基づいて個々の言語の外形を正しく深く理解するために は,まず一般理論を開発研究することの必要なことが理解されようJ(ibid.) と締めくくっています.明らかなように,ここではイェルムスレウの帰納でな く演鐸が理論にとって重要であるとする考え方が投影していると思われます.
(1)チョムスキー言語
~296 さて,チョムスキーは初期の『文法の構造~ [12]という著書の中で,
まず有限状態言語について述べ,自然言語が有限状態言語ではないと主張し
ています.有限状態言語については既に前章において簡単に述べた通りです (128頁参照).
その理由として挙げられているのは,英語のばあい, 8包を単文として,た とえば
(i) If 81
,
then 82・(ii) Either 83
,
or 84・(iii) The man who said that 85, is arriving today.
のような文章構造が普通に見られることをあげ, (i)のばあいにはif...orと は言えないし,また(ii)のばあいには either.• 七.henということもできない.
これはコンマをはさんだ両側の語の聞に従属関係があるからだ,といってい ます.またこの関係は互いに入れ子にできるとして, if, either 81, or 82, then 83・のような文を挙げています
[ 6 6
,p.lO].~297 チョムスキーはこれを一種の鏡像構造を持っている文だ、といいます.
鏡像というのはある要素の繋がり(これを連総 stringといいます)が基本的 なものの逆の繋がりになっているもののことです.たとえばromaの鏡像は amorになります.そしてここでいう鏡像構造というのは,後半の部分が前半 の部分の鏡像となっているもの,たとえばabba,aabbbbaaというようなも のです.このような形の連綿を生み出そうとするといくつかの書き換え規則 はS
→
αSαのような形を持っていなければなりません.たとえばS→
αSα,S
→
b8b,
8→
cという書き換え規則を持っている言語です.この場合これら の規則によって導出される連綿はS→
αSα→
ωSαα→
ααb8bαα→
αabcbαα のような形をとるでしょう.~298 しかしさきにチョムスキーが鏡像構造を持っているとして挙げた例 文は, ααb8bααのように,完全な意味での鏡像構造を持っているわけでもあり ません.彼が言いたいのは,より正確にいえば,たとえば彼のいう「鏡像」的 な連綿α8a'はSの前のαとSの後のdとが義務的なつながりを持っている,
ということであろうと思われます.即ち,例えばS
→
α8a'のような導出規 則がないと S→
if8thenとかS→
either8or,あるいはS→ . . . . .
.man8isというような, either... or, if... then, rnan . . . isのように,現実には最初 の部分によって義務的に書き換えがなされなければならない部分を含む連綿 が生み出せないというのです.
しかしこれは仮に「鏡像的」ということができたとしても,
s
の前後に来 る要素は異なっていますから,厳密な意味では明らかに「鏡像」ではありませ ん.この点,チョムスキーの言い方は厳密性を欠いているといわなければな りません.しかも意味的なものを完全に排除して形式的な条件(either+S+or あるいはif十S+then)という導出規則だけでは,例えばeitherwill doのよう に,すべての場合を壷すことができるとは考えられないのです.~299 このような「鏡像」を考えないとすれば,そしてまた導出規則の右
辺が義務的に末端連綿と非末端連総からなっているとすれば,これは既に述 べた文脈自由文法contextfreegrarnrnarになります.
文脈自由文法では自然言語の導出ができない理由はいくつかあると思われ ます.その一つはチョムスキーが挙げた「鏡像性」の問題ですが,その他に も問題が考えられます.例えば128頁の例を見れば分りますように, itUに よってi七という末端連綿が生成されると U
→
isXによってisXが導出され るのに対してtheyの場合はtheyWから αreYを導出する規則が別に必要に なります.しかもこの itあるいはtheyの位置に立つ可能性のあるものは理論的には 有限であるにせよ,事実上無数にあります.そのすべてについてこれに類似 した導出規則を作るのは事実上不可能です.比較的語順の安定している英語 でもそうですから,語順の自由度の高い言語ではこのような導出の仕方を構 築することは殆ど絶望的でしょう.
~300 この問題をある程度容易に解決する方策としては,導出規則を,集
合の元を表す末端連綿と非末端連総の組を右辺にとる文脈自由文法の形だけ ではなく,集合を表す非末端連総の複数の組み合せも許すことが考えられま す.具体的な英語の場合ならば,もし主語に単数名詞(及び代名調)の集合と 複数名調(及び代名調)の集合の二つを対応させ,それぞ、れに従って二番目の 導出に単数述語の集合と複数述語の集合(より正確には更に自動調の集合と