• 検索結果がありません。

Elyot 、 Marlowe 、 Shakespeare

N/A
N/A
Protected

Academic year: 2021

シェア "Elyot 、 Marlowe 、 Shakespeare"

Copied!
40
0
0

読み込み中.... (全文を見る)

全文

(1)

17 9

El yot

Ma r l owe

Shake s pea r e

の語桑分析 と比較

‑ コ ン ピュー タ利 用 に よ る‑

久 則

は じめ に

近年 の コンピュー タのハ ー ドウェア、 ソフ トウェア両面 にお ける技術 の進 歩 と普及 にはめざましい ものがあ り、処理 の高速化、 メモ リ装置 の大容量化 等が実現 され、 その結果、文学 の研究者個人で さえも必要な コンピュータ機 器 を揃 え、単 にワープロ としてばか りでな く、 テキス ト分析 な どの研究 に役 立 て る ことが可能 になって きた。 とはい え、一面 で は、 テキス トの文章や語 嚢 の分析 な ど研究者個人々々が考 える目的や必要性 に十分応 えて くれ る、公 表 された ソフ トウェアは余 り多 くはない。わずかに

0Ⅹf or dComput i ngSe r ‑ vi ce

が公開 してい る

Mi c r O‑ OCP ( 0Ⅹf or dConco r dancePr ogr am)

が現在

の ところ、パー ソナル コンピュー タで走 らせ る ことが出来、 しか も信頼す る に足 る文章解析用プログラムである とい える(1)。しか し、この

Mi c r O‑ OCP

して も、その主 な機能 は、

W or dl i s t

W or di ndex

、それ に

Conc or danc e

作成 す る ことであ り、例 えば複数 の作品や作家間の比較分析 な どはで きない。

従 って、研究者個人 が 自分 の思 い通 りの目的 を達成 しようとす るな ら、勢 い、

独 自のプログラムを組 まな くて はな らな くなる

幸 いな ことに、 ある程度 の 訓練 さえ積 めば、門外漢 のわれわれ文学や語学 の研究者 で も自分 の 目的 を達

(1)Mi c r o‑ OCP

の他にも、例 えば、

Wo r d Cr u nc he r( El e c t r o ni cTe xtCo r po r a‑

t i o n)

CLOC ( Uni ve r s i t yofBi r mi ngha m)

などのテキス ト分析用のプログ ラムがあるが、残念なが らどの機種ででも使えるというわけではない

。CLOC

ついては

、Chr i s t op he rBut l e r ,Co mput e P : ii nLi n gui s t i c s ( 0Ⅹf o r d, 1 9 6 5 )

OCP

との簡単な比較が記されている。

(2)

180

文 研 究 第

8 3

成 し得 るプログ ラム をパ ー ソナル コンピュータ上で組 め るような簡易言語や デー タベー ス等 のアプ リケー シ ョンソフ トウェアが普及 してお り、 また、大 きなテキス トを扱 うに は どうして も大 きな容 量 の メモ リ装 置 が必 要 にな る が、大容量 のハ ー ドデ ィス クの普及 によって この支障 も緩和 されつつあ る

文学 ・語 学 の分野 にお けるコンピュー タ専 門 のジャーナルで あ る

Li t e y

l

a

ry

andLi ngui s t i cCo mput i ng( 2 )

を見 て も分 か る通 り、現在 、文学 の分野 におい て も多 くの研究者 が コンピュー タを利 用 して文体 や語柔 の分析 に取 り組 んで い る

しか し、残念 な ことに、 その研 究結果 は公表 されて も、 その分析 のた めに使用 されたプログ ラム まで は公 開 され ないのが通例 である。数多 くのプ ログラムが公 開 され、 その中か ら研究者 の 目的 に応 じてプログラム を選択 し て使 用す ることが可能 にな るな ら、文学 の分野 において も、 コンピュー タを 利用 した研 究が飛躍的 に発展 す るで あ ろう。少 な くともある作家 の コンコー ダ ンスや グロサ リー を独 自に作成 し、特定 の語桑 やセ ンテ ンス を拾 い出 した り、 あるい はそれ らの作 品 にお ける分布 を調 べ る といった ように、文学作 品 の研 究 に強力 な武器 とな る道具 を提供 して くれ る と考 え られ る

小 論 で は、筆 者 が独 自 に開発 した テ キ ス ト分 析 用 の プ ログ ラム、

TAS ( TextAnal yzi ng Sys t em) ( 3)

を利 用 して

、Si rThomasEl yot

TheBo ke

(2)oxf or dUni ve r s i t yPr e s s ,1 9 8 6

年以後。それ以前の

Bul l e t i no ft heAs s o c i a t i o n f o rLi t e r a7 ya ndLi n gui s t i cCo mput i n g ( ALLC Bul l e t i n)

J o ur nalo f t he As s o c i at i o nf o rLi t e r 7 a 7 ya ndLi n gui s t i cCo mput i n g

という

ALLC

2

つの機 関誌が統合 されたもので、文学 ・語学のコンピュータ利用による調査研究 をカ バーしているジャーナルである。

(3

)元々 は

dBASEI I( As ht o n‑ Tat e)

で組 まれ てい たが、その後

dBASEI

II

dBASE I I IPLUS

に変更 し、更 に現在では、 この簡易言語の文法に従 って組 ま れた後

、Qui c ksi l ve r( Wo r dTe c h)

によってコンパイルされ、

MS‑ DOS( 3. 3 0 )

のリンカーによりリンクされている。同プログラムを利用 して行った、永原和夫 氏 と共著になる、高等学校英語教科書の分析、「高等学校用英語教科書

Uni co r n

I

、ⅠⅠ、

Ⅰ IB

の語桑分析」小樽女子短期大学 「研究紀要」第 19号 (北村正司学 長追悼論文集

、1 9 9 0

1

月)がある。ただし、今回の分析 に利用 した

TAS

は劇 作品や詩 をも分析できるように改訂 されているので

、TAS

に関する記述 は小論

の記述 とは異なるところがある。

(3)

El yo t 、Ma r l o we 、Sha ke s p e a r e

の語桑分析 と比較

1 81 Name dTheGov e mo ur

を中心 に、Chr

i s t opherMar l owe、Shakes pear e

作品 に用 い られている語桑 の分析 と比較 を主 として行 い、一部文体 に閑わ る 分析 も試 み る

さ らに、現代 イ ギ リス の散 文 と も比 較 す るた め に

Mur i el Spar kの作品数編 も加 えた。その中で、TASプログラムその ものに も若干触

れなが ら、語桑分析 に限 らず この種 のテキス ト分析 にコンピュータを利用す

る上 でのい くつかの問題点 も明 らか にしたい。

1.調査 の対 象 と方法

イギ リスのル ネ ッサ ンスの ヒューマ ニ ス トで あ る

Si r Thomas El yot ( 1 4 9 0 ?‑ 1 5 4 6 )が著 した The Bo ke Name d The Gove r no ur (

以下

The Gov e r no ur

と記す)は英語 によって書かれた最初 の教育論

( 4)

であ り、その中で 彼 は母 国語 による教育 を主張 し、更 には

TheDi c t i o naり ( 1 5 3 8 )

を出版 す る な ど

、 El yot

RogerAs c ham

等 とともに母国語 の擁護者 の一人で ある

。The Go v e r no ur

は、後 に成長 して統治者 になるべ き子弟 の教育 について論 じた も のであるが、スポー ツや音楽 な ど広範囲の話題 について触れてお り

、El yot

主張 の裏付 け として古今 を通 じて豊富 なエ ピソー ドを語 ってい る

特 に、 ア レクサ ンダー大王 や ジュ リアス ・シーザーな どギ リシア、 ローマか らの例が 多 く、 この書物 は当代 ばか りでな く、後 の詩人、劇作 家 な ど、特 に

Shake‑

s pear e

に大 きな影響 を与 えた ことが明 らかにされてい る(5)0

TheGo v e r nour

の中で

El yot

が使用 してい る語桑 や文章 を他 の劇作家 の それ と比較 してみることは無意味 な ことで はない し、 その

W or di ndexない

(4)F. Wat s on( e d. ) ,TheBo k eNa me dTheGo v e mo ur ( Lo ndon,1 9 0 7 ) , pp. xi ‑ Ⅹi i

参照。

(5)D. T. St ar ne s

He myZV

TheMe r c h anto fVe ni c e

などの

Shake s pe a r e

の作品にEl

yot

の影響があることを明 らかにしている。(

" Shake s pe ar e and

El yo t ' SGo v e r no ur

,"

Uni v .o f Te w St udi e si nEn gl i s h ,No. 7( Aus t i n,1 9 2 7 )

,

1 1 21 3 2 ) .Ral ph

M.

Sar ge nt

は特に

TheTwoGe nt l e me no f Ve r o na

に対する影 響を論 じている。(

H Si rThomasEl yota ndt heI nt e gr i t yo f TheTwoGe nt l e me n

o f Ve r o na

,"

PMLA LXV ( 1 9 5 0 ) ,1 1 6 9 ‑ 7 0).

(4)

182

人 文 研 究 第

8 3

Lは

Conc or dance

を用意す る ことは

、Shakes pear e

をはじめ、ルネ ッサ ンス 期 の詩人 や劇作家 の ことばを正確 に知 る上 で も重要 な意義 を有す る と思われ

比較 の対 象 として は、

Chr i s t ophe r Mar l owe ( 1 5 6 4 ‑ 1 5 9 3 )

Wi l l i am Shake s pear e ( 1 5 6 4 ‑ 1 61 6 )

の劇作品か らそれぞれ数編ずつ取 り上 げることに す る。 さ らに現代 イギ リスの散文 の例 として、

Mur i elSpar k ( 1 9 1 8

)の数 編 の作品 も加 えた。

TheGo v e mo ur

1 531

年 にロ ン ドンで

ThomasBe r t hl e t

の印刷 所 で初 めて出版 され、 その後

、1 6

世紀 だ けで も

7

回の改訂版 が出 されてお り

( 6)

、か な り人気 のあった書物 の一つ と考 え られ る

.

この初版

( 1 5 3 1 )

に基づいて

H.

H.S.Cr of t

1 8 8 3

年 に編集 出版 した ものをここで は基本 テキス トとして用 いてい る

( 7)

Mar l owe

の作品 として は

、 Fr eds onBowe r s

Cambr i dge

( 8)

か ら

、 Di do

,

t heQue e no fCar t ha ge( 1 5 9 4

年出版、以下

Di do

と略記)、

Tamb ur l ai ne

一部

( 1 5 9 0

、 1

Tamb ur l a i ne )

、同第二部

( 1 5 9 0 ,2T a mb ur l ai ne )

TheJe w o fMal t a ( 1 6 3 3 ,TheJe u ) ) 、Do c t o rFaus t us ( 1 6 0 4 , Fau s t us )

、それ に

Edwwd t heSe c o nd ( 1 5 9 4 , Edu ) wd)

6

編 の悲劇 を取 り上 げる

詩 と翻訳 の作品 を 除 けば、この

6

編 で

Mar l owe

の劇作品の殆 ど全 てが含 まれ ることになる。こ の他 にはわずか に 1編、

TheMa s s ac r eat P ar i s

を残すだ けである.

Shake s pear e

か らは、

TheTwoGe nt l e me no f Ve r o na (

以下

Ge nt l e me n

と略記),

TheMe r c hanto f Ve ni c e ( Me r c ha nt )

,T

u ) e l j i hNz l ght , Muc hAdo ab o utNo t hi ng ( Ado) ,Ki n gHe n叩 ZV

第一部 (

lHe m3 7ZV)

5

編、

主 に喜劇 を選 んだ。いずれ も

Shake s pear e

の死後

1 623

年 に出版 され た二 つ

(6)Fac s i mi l e

Th eBo k eNa me dt h eGo v e r no u r ( Me ns t o n,1 9 7 0 )

のはしが き を参照。

(7)H. H. S. Cr of t( e d

.

) ,TheBo k eNa me dt heGo v e r no u r ( Lo ndo n, 1 8 8 3 ; r pr n t d.

Ne w Yo r k,1 9 6 7 ) ,2γol s .

(8)Fr e ds o nBo we r s( e d

.)

,TheCo mpl e t eWo r k so fChr i s t o ph e rMa r l o we ( Ca m‑

br i d geUni ve r s i t yPr e s s ,1 9 7 3 ;1 9 8 1 ) ,2 nde d. ,2vo l s .

(5)

El yo t 、Ma r l o we 、Sha ke s p e a r e

の語桑分析 と比較

1 83

折 り本初版

( Fi r s tFol i o) ( 9)

を基本 テキス トとして用 いた。Shakes

pear e

の場 合 には、喜劇 的な作品 を選 んだ ことか ら、人文主義的興味 に富 む ことと、悲 劇 に比べて散文が多 く使 われている点 は、多少 な りともEl

yot

に近づ ける意 図がなか ったわ けで はないが、それ よ りも作品の選択 に関 して は、Mar

l owe

の場合 も同様 で あるが、 その長 さ (使用 されてい る語 の延べ数) を最大 の根 拠 としている

。TheGov e mo ur

の使用語数 は延べ

1 01, 8 83

語で あ り、約

1 0

語 を目処 として

Mar l oweと Shakes pear e

か らそれ ぞれ 6編 の悲劇 と 5編

の喜劇及 び喜劇 的作品 を選 び出 した。

Spar kか らは ThePr i me o f Mi s sJe an Br o di e

TheGi r l s o f Sl e nde r Me ans

TheGo‑ au ) a yBi r d

ThePo r t ob e l l oRo ad

TheDar k Gl a s s e s

長編、短編 の物語合 わせ て5編 を選 んだ。前 2者 は

Pe ngui nBooks

版 を、残

3編 について は

Col l e c t e dSt or i e s

Zに収録 された ものを使用 した

( 10) 0

尚、上記 の基本 テキス トとして使用 した版 の他 に、

TheGo v e mo ur

に関 し て は、Fac

s i mi l e

版、並びに

W at s on

編 の

Eve r yman' sLi br ar y

、Mar l owe

の悲劇 について は J

.B. St eane

編 の

Pe ngui nCl as s i cs

版、また

Shakes pear e

の作品に関 して は

Fi r s tFol i o

Fac s i mi l e

版 と

Ar de n

( ll)

をそれぞれ参照

し、後で触れ るように若干 の修正 を行 う際 に利用 してい る

これ らのテキス トをそれぞれ作品毎 にテキス トファイル

( SDF)と して入

(9)Cha r l t o nHi nma n( e d

.)

,TheNo do nFa c s i mi l e .TheFi r s tFo l i oo fSh a ke 一 頭e we ( Ne w Yor k,1 9 6 8 ) .

( 1 0 )TheGi r l so f Sl e nde rMe a ns ( Har mo nds wor t h,Mi ddl e s e x,1 9 6 3 ;r pr nt d.

1 9 6 6 ) ,ThePr i meo fMi s sJ e a nBr o di e ( Har mo nds wor t h,1 9 6 1 ;r pr nt e d.1 9 6 5 )

を使用 し、

TheGo ‑ a wa yBi r d , ThePo r t o b e l l oRo a d,Th eDaY 滋Gl a s s e s

3編

Co l l e c t e dSt o r i e s I ( Lo ndo n,1 9 67 )から採用 した.

( l l )

参照 した

Ar de n

版テキス トは次の通 りである

。John Rus s e l lBr o wn ( e d. )

,

TheMe r c h anto f Ve ni c e ( London,1 9 5 5 ;r pr nt d.1 9 8 9 ) ;Cl i f f o r dLe e c h( e d. )

,

TheTwoGe nt l e me no f Ve r o na ( Lo ndo n,1 9 6 9;r pr nt d.1 9 8 6 ) ,A.

R

.Hum‑

p hr e ys( e d

.)

,Muc hAdoa b o utNo t hi n g ( Lo ndo n,1 9 81 ;r pr nt d.1 9 8 9 )

,J

.M.

Lo t hi anandT.

W .

Cr ai k( e dd. ) ,Twe

l

j t hN2 ' ght ( Lo ndo n,1 9 7 5 ;r pr nt d.1 9 8 8 )

,

andA.R Humphr e ys( e d. ) ,Th eFi r s tRa7 1o fKi n gHe n7 3 )ZV ( Lo ndon,1 9 6 0 ;

r pr nt d.1 9 8 9 ) .

(6)

184

8 3

力 した。 この ようなテキス ト分析 を行 う場合 にはテキス トファイル をいかに 正確 に作成 するかが重要 であ り、 コンピュータを利用す る上 で、機械可読 の 形式 のテキス トを準備 す る難 しさが大 きな障害 になっている と思われ る

えば

4 0

編近 い劇作 品 と

2

編 の長詩、 ソネ ッ ト、 それ に数編 の詩作 晶 を含 む

Shake s pear e

の全作品 をワープロ等でタイプ入力 し、プ リンタで印刷 し校正 を行 うとすれ ば、考 えただけで利用 を断念 しかねない難作業 になる

文章分 析用 のプログラム同様、 テキス トも機械可読 の形 で公開 され、提供 され るよ

うになれ ば、 この種 の研究 も大 きな発展 を遂 げる ことが可能 になる と考 えら れ る

その意味で、現在多 くのコンピュータ可読 のテキス トを集積 しつつあ

0Ⅹf or dCo mput i ngSe r vi c e

0Ⅹf or dTe xtAr c bi ve ( OTA) (12)

は貴重 な存在で ある。幸 いに筆者 は

Fi r s tFol i o

について はこの

OTA

か ら公表 され ているテキス トファイル を利用す る ことが出来 た

( 13)

。 しか し、 このような場 合 で も、個 別 の プ ロ グ ラム に合 わせ て文 字 ばか りで な く、例 えば

Ac t

Sc e ne

の指示、 ト書 きと台詞 の区別等 をコンピュータが認識で きるようにい わ ばテキス トを加工 しなけれ ばな らない

( e nc odi ng)

とい う問題が残 されて い る

o xf or dTe xtAr c hi ve

Fi r s tFol i o

には独 自の

e ncodi ng

が施 されて い るが、この調査 で は、後 で述べ るように

、TAS

で識別 す ることがで きる記 号 に変更 した上で利用 してい る

TheGo v e r no ur

はタイ トルペ ージ と目次 を除いて巻頭 の

̀ Pr oe m'

か ら最 後 の

̀ TALOS'

まで全 て入力 した。 ただ し、

̀ CHAPTERI

,'

̀ CHAPTERI I '

等 の章番号 は除外 した。 しか し、各章 の見 出 しは、時 として

3

行 に及ぶ文か

ら成 ってい る場合 もあるので、 テキス トとして取 り扱 っている。 またページ 欄外 の小見 出 しは、人名 や書名 (しか も略 されていることが多い)や番号が

(12)

oxf o r dTe xtAr c hi ve

には英語ばか りでな く、ギリシア語、フランス語など 様々な言語のテキス トが集められている

。0Ⅹf o r dCo mp ut i ngSe r vi c e

が出して いる

OT

A

Li s t( Ma y

1991)を参照。

(13)すなわち

OTA Li s t

,

U‑ 1 1 9 ‑ E

。 このテキス トファイルの利用に関 しては

0Ⅹ‑

f o r dUn i v e r s i t yCo mp ut i ngSe r v i c e

に深 く感謝する。

(7)

El y o t 、Ma r l o we 、Sh a k e s p e a r e

の語桑分析 と比較

185

主 なので、 削除 した。

Mar l owe

Shake s pe a r e

の劇作 品 につ いて は、

Dr a ma t i sPe r s onae

を除 いて、タイ トル名 、 ト書 き

、Pr o l ogue

Epi l ogue

も含 めて入力 され て い る

た だ し

、Spe e c hPr e f i x

は入 力 され て い るが、特殊 な記 号 をつ けて テ キス トと は別 の取 扱 い を した。従 って

、Spe e c hPr e f i x

の登場 人 物名 は使 用語 数 に は含 まれ る こ とはない

.Faus t u s

の よ うに

Mar l owe

の劇 に は、劇 全体 が通 し番 号 の行 表 示 だ けで

Ac t

Sc e ne

に分 か れ て い な い劇 が あ るこの場 合 に は

Bo we r s

が [ ]つ きで、

Ac

tと

Sc e ne

を表 示 してい るので、 その表 示 に従 っ

A

ct

、Sc e ne

に分 けてい る。同様 に

、Fi r s tFol i o

の中 に は

Sc e ne

の表 示 が ない劇 が見 られ る。この場 合 に は

、Ar de n

版 に従 って

Sc e ne

の指 定 を行 った。

今 回 の調査 に使 用 したテ キス トフ ァイル に は コン ピュー タが 的確 に識 別 で きるよ うに次 の よ うな原文 に は印刷 され てい な い記号 を施 した。

<C

…>

̀ <C'

と̀>'とで囲 まれた部分 は

Spe e c hPr e f i x

であることを示 し、テ キス ト本文 とは別個 の取扱い となる

<D

…>

̀ <D'

と̀>'とで囲 まれた部分 は劇 の ト書 きのように本文 と区別す る必 要のある時 に使用す る。テキス トとして分析 の対象 となるが、この部分 に 属 す る単語 にはデータベース ファイルで はDの記号が つ け られ てい るの で、 ト書 きとlして識別することが出来 るようになってい る0

The Go u e r ‑ no ur

の各章 の見出 しにもこの記号がつけられている。

〈 H〉

行 の先頭 につけてその行 を行数のカウン トか ら除外す るために使用する。

劇で は詩 としての 1行 を複数 の登場人物 に割 り当てることが よ くある。こ の ような場合 に複数 の行 を

1

行 として数 えるために

2

行 目以下 に この

〈 H

〉をつける。 また、

TheGo u e mo ur

の各章 の見出 しにもこの印 をつけ、

行数 を数 えないようにしている。従 って、ページの先頭か ら章が始 まって いる時 はそのページの0行 目の表示 になる。

このカタカナ用のマル は文 の終 わ りを指示するための記号で、例 えば ト書 きで

̀ Exi

t'とあって ピリオ ドのない ときに この印 をつ けて文 の終 わ りで

(8)

186

人 文 研 究 第

8 3

あることを示す。 さもなければ この語が次の文 の先頭 に属す る ことにな

.

この印 はデータベースファイルで は削除 され る

省略符号 としての ピリオ ドが語 または文字の末尾 についている場合 に終止 符 としてのピリオ ドと区別す るために利用す る。

人名 な どで一人 の名前が空 白を間 に挟んで

2

語か らなるときに、それを

1

語 として取 り扱 う、いわゆるワー ドラップをかけるために使用す る。 この 調査で は

TheGo u e r no ur

So ut h ̲ ha mpt o n

、Fi r s tFol i o

の中で、同 一人物が、例 えば

Gad sHi

llと

Gads ‑ Hi

llの ように空 白 とハイフンとが混 用 されている時 に限って使用 した。データベースファイルで は空 白に変わ

る。

ハイ フンのついた人名 な どをハ イフンで分断す るのを避 けるために通常 のハイフンとは区別 してカナのハイフンを使 う。

アポス トロフィと区別 す るためにシ ングル クォーテー ションの代 わ りに 用いる。

その他 、 テ キス ト名 を登 録 す るた め の記 号

̀ 〜

'や テ キ ス トの章 や劇 の

Ac t

示 す

̀

#'、ペ ー ジや

Sc e ne

を指定 す るた めの ̀*'の記号 を用 いて い る。又

、1

がハ イ フ ンを用 い て

2

行 に またが って 印刷 され て い る場 合

、 TAS

は自動 的 に ハ イ フ ンを取 り除 き、その語 は次 の行 の先頭 に位 置 す る もの として処 理 す る

この よ うな語 が本 来ハ イ フ ンが入 るべ き語 で あ る ときは、 これ を避 け るた め に、語 全体 を前 の行 に繰 り上 げ るか、 次 の行 に送 って、入 力 した

( 1 4 ) 。

テ キス トフ ァイル の記 述 の最後 に、 こ こで次 の点 につ いて それ ぞれ のテ キ ス トを修 正 した こ とを付 記 しな けれ ばな らない

。Cr of t

編 の

TheGo v e mo ur

に は、 明 らか に脱 字 と見 られ る部 分 と活字 の判別 で きない部分 とが

3

箇 所 あ る。これ らは

Fac s i mi l e

版 と

Ever yman' sLi br ar y

版 とを参 照 して訂 正 した。

(14)通常 は語全体 を前行 に繰 り上 げるが、その場合 に次行が空 白になって しまうと きは次の行 に送 って入力 した。

(9)

El yo t 、Ma r l o we 、Sha ke s p e a r e

の語嚢分析 と比較

1 87

又 、 同書 で、 これ は

Facs i mi l e

版 も同 じで あ るが、縮約 され た語 の うち次 の

10

語 、延 べ

21

語 は

t hai ge

の ように空 白 を入 れ て

2

語 とした。尚、その際 に ア ポス トロフ ィはつ けていない、又各語 の うち括 弧書 きの数字 のあ る もの は 延 べ語数 を示 す。

t hai ge

,

t haunci e nt

,

t he nt e nt( 5 )

,

t he f f e c t e d

,

t hone ( 2 )

,

t hot he r ( 2 )

,

t hac c ompl ys s he me nt ,t he mpe r our ,t he publ i ke ( 1 5 ) ,t hac c omp

t.

Fi r s tFol i o

の中で

̀ Her cul es '( MAN,666)

̀ Toby'( TN, 2340)

̀ Si rM. '

(

1 H4,261 2)

3

箇所 が

Speec hPr e f i x

として取 り扱 われ てい るが、

Facs i m‑

i l e

版 に従 って、台詞 の一部 とした(16)他 、次 の よ うな訂正 を施 した。左側 が誤 り、右側 が訂 正 、括弧 内 の作 品名 の後 の数字 は

OTA

のテキス トフ ァイルで作 品 ご とに付 され た行番号 で あ る

l as t l o s t Sal ani o Sl ani o Somme r Sommme r l e tvs l e tvsvs s ol a

,

s ol a,s oユ a.

I nf ai t h l nf ai t h He l peme Hel p

( MV 6 6 0 ) c oz e ni n g f orcoz e ni ng ( 1 H42 2 9 ) ( MV 7 9 3 ) made madewi t h ( 1 H41 0 5 5 ) ( MV 1 27 5 ) f a t f at c h ( 1 H41 1 0 3 ) ( MV 2 4 4 9 ) mos t mos tmos t ( 1 H41 4 4 2 ) ( MV 2 5 9 4 ) ofof of ( 1 H42 0 2 5 ) ( MAN 71 1 ) outal l outofal l ( 1 H42 0 2 5 ) ( MAN 1 5 9 3 )aLaz a r us asLaz ar us ( 1 H42 4 0 0 )

( 1 5 )

この語だけは他の語 と縮約 の性質が異なるので恐 らく誤植 と思われ るが、他の テキス トで も同様であるが、 このような場合 にで も原文通 りとした0

( 1 6)

ただし、実際に参照 した

Fac s i mi l e

版 は

Char l t onHi nman

版で はな く

、Si d‑

ne yLe e

編 になる

Fac s i mi l e

版である

( Si dne yLe e( e d

.)

,Sh a ke 砂e we' sCo m‑

e di e s ,Hi s t o r i e s ,a ndTy l a ge di e s( oxf o r d, 1 9 0 2 ) )

。その他

、Fi r s tFol i o

のテキス トファイルでは、オ リジナルにはないが、付加 された記号のうち

1 0

数カ所訂正 したことも付記 しておかなければならない。尚、作品名の略号 については、次節 の冒頭参照。

(10)

188

8 3

Ar tt hou Ar tt hout hou( MAN 2 34 6 ) St e p St e ps

(

1H425 44 ) anaywo r danaywo r d ( TN 8 29 ) bui l ke bul ke ( 1 H42 699 ) Ma s t e r

M.

( TN 1 9 9 8 ) ye a ge a ( 1 H427 44 ) pauyn panyn ( TN 2 36 3 )

ここに は主 として語形 、語数 に影響 を与 え る ものだ けを挙 げたが、 この他 に 句読 点等 について も修 正 を加 えた。

尚、次 の ような種類 の語 に は以下 に示 す特別 な記号 をつ け特殊 語 として区

した。

*P

人名、国名、地名等の固有名詞 とその形容詞

*L

明 らかにラテン語 として意識 して使用 されている語

(17)

*G

同様なギ リシア語

*M

ラテン語、ギ リシア語以外の外国語

*S

数字、記号、略語等

以上 の ように して作成 され たテキス トフ ァイル は、例 えば

Me r c h ant

の冒 頭 の7行 を見 る と次 の ようになって い る。

〜 MV TheMe r c hantofVe ni c e.

#01

* 1 01

〈H

〉く

D Ac t us * Lpr i mus *

L.)

〈H

)く

D Ent e rAnt honi o * P,Sal a r i no * P,andSal ani o * P.

( 1 7 )

例 えば、

Fa us t us

,

Ⅰ .i .41

に見 られるようなラテン語のセ ンテンスに含 まれ る 語など。但 し、劇 の ト書 きによくある

̀ Exi

t'や

̀ Exe unt '

等 は特殊語 としては取 り 扱っていない。

(11)

El yo t 、Ma r l o we 、Sha ke s pe a r e

の語桑分析 と比較

189

H

〉くC

Ant honi o * P. )

I ns oot hlknow notwhyIam s os ad

,

Ⅰ twe ar i e sme:yous ayi twe ar i e syou;

Butho w lca ughti t ,f oundi t ,orc amebyi t

,

Wha ts t uf f e' t i smadeo f ,whe r eofi ti sbor ne

,

Ia m t ol e ar ne :a nds uc haWant ‑ wi ts adne s s emake sof

H) ne e

,

ThatIha uemuc hadot oknow mys e l f e .

この よ う に して 準 備 され た テ キ ス トフ ァイ ル を デー タ ベース フ ァイ ル (DBF)に読 み込 み、分析 に必要 な一種 のデー タベ ース を作成 す るので あ る が、 このDBF作成 には次 の ような コンピュー タ機器 とソフ トウェア を利 用

した。

コンピュータ

NEC PC9801RA

プ リンタ

EPSON VP1 600

TAS

(私家製 テキス ト分析 プログラム)

dBASE I H PLUS ( As ht on‑ Tat e)

Qui cksi l ver

(W

or dTec h)

(コンパイ ラ)

(18)

Th eGo v e mo ur

で あれ ば各巻毎 に、Mar

l oweと Shake s pear e

の劇 、それ

Spar kの物語 の場合 には作 品毎 にテキス トフ ァイル を読 み込 み、単語単位

に分解 し、テキス ト名、ペ ー ジ (劇 の場合 には

Ac t

Sce ne)

、それ に行番号 をつ けたデー タベ ース フ ァイル を中間 デー タ として作成 す るこの中間 デー

( 1 8 ) dBASE I I IPLUSと Qui c kSi l ve r

はTASを運用する上では必要ない

。TAS

作成に利用 したソフ トウェアである。ただし、前者 はデータの検証並びに一部の 分析にダイレク ト・コマンドで利用 している。

(12)

190 人 文 研 究 第

83

夕で は、テキス トファイルで は単語 に付随す るクオーテー シ ョン ・マー クや ピリオ ドや記号等 は単語 か ら分離 され、他 の ファイルにまとめ られ る。 この 中間 データ を基 に、

The Go v e mo ur

で あれ ば

3

巻 を、劇作 品 の場 合 に は

Mar l owe6

編、

Shake s pear e5

編 の作品 をひ とま とめに して、 それ ぞれ最 終的 なデータベースが作 られ る。このデー タベース は主 として、アル ファベ ッ

ト順 に並べ られ、使用頻度 とコー ドのついた、単語 リス トのファイル と、単 語 の コー ドと出現位置 を登録 した位置 ファイル とか ら構成 され る。 その他、

セ ンテンスの リス ト、ハ イフン語 リス ト、句読点 リス ト

、Spe e c hPr e f i x

の リ ス トな どの

DBF

もこの とき同時 に生成 され る。

分析 や参照 のために利用 され る

Wo r dl i s t

Wor di nde x、Conco r da nc e

作成 に必要 なデー タベース は以上 の ようにテキス トファイルか ら中間データ 作成、 デー タベース構築 の ように

2

段 階 に分 けて作 られ るが、 これ らの処理

TAS

で はテキス トファイル名 と目的 とす るデータベース名 を指定す るだ けで、後 はすべて 自動的 に実行 され る

2.使 用 テ キ ス ト概 観

細 かい分析 に入 る前 に分析 ・比較 の対象 として使用 したテキス トの規模 な どを概観す るために、 ここで、作 品それぞれの出版 の体裁 とペー ジ数、 テキ ス トの行数、総語数、異語数 について まとめてみた。次 の表 1の ようになる

テキス ト名 には

TheGo v e r no ur ( ELT)

BookI( GVl )

BookI I( GV 2

)、

BookI I I( GV 3)

のように省略 して記 し、

Mar l o we ( MRL)

の作 品 は概 ね最初 の

3

文字 を省略形 とし、

Shake s pe ar e( SHK)

C. T. Oni o ns

省略形 を利用 した

(19) 0 Spar k ( SPK)

は、

ThePr i meo fMi s sJ e anBr o di e

( PJB)

TheGi r l so fSl e nde rMe ans ( GSM)

The Go ‑ a wa yBi r d ( GAB)

ThePo r t ob e l l oRo ad ( PBR)

TheDar kGl a s s e s ( DGL)

の ように略記 し

( 19) C.T.Oni o n s ,A Sh a k e 申e weGl o s s a 叩 ( Re vi s e dbyRo be r tD.Ea gl e t o n

,

0Ⅹf o r d,1 9 8 6 ;r p r n t d.1 9 8 9 )

を参照。

(13)

El yo t 、Ma r l o we 、Sha ke s pe a r e

の語柔分析 と比較

191

表 1 テキス トの規模

Te xt s

体裁

pp.

ll

. T. W. D. W.

ELT( 1 5 3 1 ) Quar t o 5 1 5 1 0, 4 1 1 1 01, 8 8 3 9, 5 5 2 GV1 2 01 4, 0 81 3 9, 7 9 1 5, 5 5 2 GV2 1 3 7 2, 7 1 7 2 6, 9 3 2 4, 2 6 6 GV3‑ 1 7 7 ‑ 3, 6 1 3 3 5, 1 6 0 5, 0 5 3

MRL DⅠ D ( 1 5 9 4 ) Quar t o 4 1 5 8 2 1 4, 1, 3 8 3 1 0 4 1 0 1 7, 3, 41 9 3 8 6 1 0, 2, 7 8 5 4 2 6 J EW ( 1 6 3 3 ) Quar t o 7 6 2, 5 8 3 . 1 9, 0 0 9 3, 2 0 6 1 TA ( 1 5 9 0 ) Oc t a vo 7 0 2, 4 2 2 ̲ 1 7, 8 5 6 3, 6 0 9 2 TA ( 1 5 9 0 ) Oc t a vo 7 0 2, 4 4 4 1 8, 2 5 9 3, 5 7 3 EDW ( 1 5 9 4 ) Quar t o 8 2 2, 8 5 3 21, 4 3 7 3, 4 0 0 FA

U

( 1 6 0 4 ) Quar t o 6 8 2, 2 1 4 1 6, 91 7 3, 2 6 3 SHK( 1 6 2 3 ) Fol i o 1 0 9 1 3, 5 01 1 0 4, 3 2 4 9, 5 8 4 TN 21 2, 5 8 5 1 9, 8 9 4 3, 3 61 MAN 21 2, 6 7 6 21, 1 5 0 3, 2 2 7 MV 2 2 2, 7 4 0 21, 3 7 6 3, 5 01 1 H4 2 6 3, 1 8 5 2 4, 6 81 4, 1 4 3

SPK PJB ( 1 9 61 ) 1 8 c m 3 1 6 2 3 4

l

4, l, 6 2 3 3 6 2 1 0 3 3, 9, 0 7 3 4 4 4 9, 5, 0 1 9 81 4 GSM ( 1 9 6 3 ) 1 9 c m 1 3 6 1, 1 0 5 3 3, 1 7 3 4, 9 01 GAB( 1 9 5 8 ) 2 0 c m 5 8 1, 8 7 6 1 7, 01 6 2, 9 3 0 PBR ( 1 9 5 8 ) 2 0 c m 2 8 8 91 8, 21 3 1, 81 1 DGL( 1 9 6 1 ) 2 0 c m 1 7 5 3 2 4, 8 8 8 1, 1 1 4

た。テキス ト名 の後 の括弧書 きの数字 は出版年 を表 し

、Mar l owe

の作品の出 版年 は

Fr edsonBower s

による

( 20)

.また、ペ ージ数 は、

TheGo v e mo ur

につ いて は

Facs i mi l e

( 1 9 7 0 )、Shake s pear eも Facs i mi l e

( 1 9 0 2 )

によるが、

Mar l owe

だけは

Bower s

の校訂が施 されているので

Cambr i dge

版 のペ ージ 数 を入れてある。 これ らの本 の体裁 とページ数 によって印刷 されたテキス ト

( 2 0 )

注 (

8

) を参照。

(14)

192

8 3

の大体 の大 きさが知 られ るで あ ろう

。 TheGo v e mo ur

は四つ折 り本 で延 べ

515ペ ー ジ

、Shake s pe ar e

5編 の劇 は二 つ折 り本 で 109ペ ー ジにな る

( 2

1)0

Spar k

の場合 は本 の高 さで表示 したが、合 わせ て363ペ ー ジにな る.しか し、

この表 に示 した行数 は印刷 のそれで はな く、 テキス トファイル上 で純粋 にテ キス トとして数 え られ る行数 を表 し、空 白行 や

Spe e c hPr e f i x

だ けか らな る 行 な どは含 まない。総語数 (T.W .)はテキス トに用 い られてい る全 ての語 の 延 べ数

( t oke n)

で、異語数

( D. W. )

は同形 の語 が何 回出現 して も

1

として

しか数 えない場 合 の異 な り語

( t ype)

の数であ る

前 に も触 れ た ように、

Mar l owe

Shake s pea r e

の作 品 は

TheGo v e r no ur

の総語数 101,883語 を目処 に選 ばれてい るが、結果 として

Sha ke s pear e

で約

2,500

、 Ma r l owe

で は約5,500

、TheGo v e r no ur

よ りも多 くなっている。

しか し、興味深 い ことには、 これ らのテキス トをその使 用文字数 に よって比 べ る と、

TheGo u e r no u

rは476,275文字 を使 用 してお り、

Shake s pe ar e

422,526

Mar l owe

462,144、 さ らに

Spar k

442,678よ りも多 い ことに な る

( 22

)。従 って、総語数 で は他 の

2

人 に劣 るが、われわれが書物 として接 す る ときのテキス トの大 きさ として は十分比 肩 しうる規模 を有 してい る とい え

3

.文 の長 さ と語

各作家 あ るい は作 品の特徴 を把握 す るために文 の長 さ と語 の長 さについて 調 べてみた。文 の長 さは

1

文 に含 まれ る語 の数 で、又語 の長 さは語 中の文字 数 に よって測 る

平 均語 数 だ けで は、劇 作 品 の場 合 に は ト書 きの

̀ Exi

t'や

(21)面白いことに

Fi r s tFo l i o

lHe m 3 JZV

には記 されたページ番号に2ページ 分欠けているところがあるが、ここに上げた数字 は実質のページ数である。同様 に他の作品にも番号を飛ばしているところがあるが、重複 しているところもある ので最終的には見かけのページと実質のページ数 は一致する。

(22)これ らの文字数 はデータベースファイル として作成 された後の単語 リス トか ら算出しているのでハイフンやアポス トロフィ、句読点や記号 は含 まない。

(15)

El yo t 、Ma r l o we 、Sha ke s pe a r e

の語桑分析 と比較

193

̀ As i de'

な ども

1

文 を構成 してい ることにな り、しか もその頻度 も高いので、

この調査 の ように特 に散文 の作品 と比較 す る場合 には正確 な指標 とはな らな い。 そ こで、平均 の語数 ばか りでな く、 それぞれの長 さの文 の頻度 も調べて みた (表 2a)。語 の長 さについて もそれぞれの文字数の語 の頻度 を調 べてみ ることにす る

2a

文の長 さと頻度

l e ngt h ELT MRL SHE SPK 1 ‑ 5 4 9(1 . 8 4 ) 1 , 3 1 2( 2 1 . 3 5 ) 1 , 7 6 0( 2 7 . 5 1 ) 1 , 4 2 4( 2 0. 2 6 ) 6 ‑1 0 1 5 0(5. 6 2 ) 1 , 8 4 9( 3 0. 0 8 ) 1 , 6 0 6( 2 5 . 1 0 ) 2, 0 0 4( 2 8. 5 2 ) l l ‑1 5 2 4 2(9. 0 7 ) 6 1 7( 1 0. 0 4 ) 7 6 6( l l . 9 7 ) 1 , 2 1 9( 1 7. 3 5 ) 1 6 ‑2 0 2 9 2( 1 0. 9 4 ) 6 3 8( 1 0. 3 8 ) 6 4 0( 1 0. 0 0 ) 8 1 1( l l. 5 4 ) 2 ト 2 5 2 5 9(9. 7 0 ) 4 2 0(6. 8 3 ) 4 1 8(6 . 5 3 ) 5 3 4(7. 6 0 ) 2 6 ‑3 0 2 8 7( 1 0. 7 5 ) 2 7 8(4. 5 2 ) 2 8 6(4. 4 7 ) 3 1 3(4. 4 5 ) 3 1 ‑3 5 2 2 9(8. 5 8 ) 2 8 2(4. 5 9 ) 2 1 8(3. 4 1 ) 2 3 2(3. 3 0 ) 3 6 ‑4 0 2 1 2(7. 9 4 ) 1 5 4(2. 5 1 ) 1 6 2(2. 5 3 ) 1 7 1(2. 4 3 ) 4 1 ‑4 5 1 6 7(6. 2 6 ) 1 2 5(2. 0 3 ) 1 3 5(2. l l ) 1 1 0(1 . 5 7 ) 4 6 ‑5 0 1 5 3(5. 7 3 ) 1 1 3(1 . 8 4 ) 8 2(1 . 2 8 ) 6 6(0. 9 4 ) 5 1 ‑5 5 1 2 0(4. 5 0 ) 7 8(1. 2 7 ) 6 6(1 . 0 3 ) 4 6(0. 6 5 ) 5 6 ‑6 0 8 7(3. 2 6 ) 5 7(0. 9 3 ) 5 3(0 . 8 3 ) 2 9(0 . 4 1 ) 6 ト 6 5 8 1(3. 0 3 ) 5 1(0. 8 3 ) 3 1(0. 4 8 ) 1 7(0. 2 4 ) 6 6 ‑7 0 6 0(2. 2 5 ) 3 3(0. 5 4 ) 3 9(0 . 6 1 ) 1 6(0. 2 3 ) 7 1 ‑7 5 3 9(1. 4 6 ) 2 6(0. 4 2 ) 2 7(0. 4 2 ) 8(0. l l ) 7 6 ‑8 0 4 8(1. 8 0 ) 1 7(0. 2 8 ) 1 8(0. 2 8 ) 4(0. 0 6 ) 8 1 ‑8 5 3 8(1 . 4 2 ) 2 1(0. 3 4 ) 1 8(0 . 2 8 ) 9(0. 1 3 ) 8 6 ‑9 0 2 9(1 . 0 9 ) 2 3(0. 3 7 ) 1 6(0. 2 5 ) 6(0. 0 9 ) 9 1 ‑9 5 1 6(0. 6 0 ) 8(0. 1 3 ) 8(0. 1 3 ) 3(0. 0 4 ) 9 6 ‑ 1 0 0 2 3(0. 8 6 ) 5(0. 0 8 ) 1 0(0 . 1 6 ) 1 ( 0. 0 1

)

1 0 ト1 0 5 1 3(0. 4 9 ) 3(0. 0 5 ) 5(0. 0 8 ) 1(0. 0 1 ) 1 0 6 ‑ 1 1 0 1 3(0. 4 9 ) 5(0. 0 8 ) 4(0 . 0 6 ) 0 ( 0. 0

0)

1 1 1 ‑ 1 1 5 l l(0. 4 1 ) 5(0. 0 8 ) 6(0 . 0 9 ) 2(0. 0 3 ) 1 1 6 ‑ 1 2 0 7(0. 2 6 ) 4(0. 0 7 ) 3(0. 0 5 ) 0 ( 0. 0 0 ) 1 2 ト 4 4(1. 6 5 ) 2 2(0. 3 6 ) 2 1(0 . 3 3 ) 1(0. 0

1)

To t a l 2 . , 6 6 9( l o o. 0

1)

6, 1 4 6( 1 0 0 . 0 0 ) 6, 3 9 8( 9 9. 9 9 ) 7 , 0 2 7( 9 9. 9 8 ) T. W. 1 0 1 , 8 8 3 1 0 7, 4 1 6 1 0 4, 3 2 4 1 0 3 , 0 3 4

括弧 内の数字 は各 テキス トの文 の合計 か ら見 た百分率 を表す。

(16)

194

83

文 の長 さは

A. Q. Mor t on

Li t e m7 7 De t e c t i on

の中で利用 した文 の長 さ の集計法

( 23)

に基 づいて、語数

1

か ら

5

まで

、6

か ら

1 0

までの ように

5

語刻 み で まとめてある。ただ し

、1 2 1

語以上 の長 さの文 は‑ まとめにして表示 した。

この表か ら分か るように、平均語数 の長 さ として は

Spa r k

1 4. 6 6

で一番短

、El yo t

は平均

3 8. 1 7

語 の長 さの文 を使用 してお り

、Ma r l o we

1 7. 4 8

語、

Shake s pe ar e

1 6. 31

語 よ りも長 く、他 の

3

者 の

2. 2 ‑2. 6

倍 の長 さである。

また、他 の

3

人 は

1 ‑ 5 、6 ‑ 1 0

の一番短 い方の文 を約

5 0%

の割合 で使用 してい るのに対 し

、El yot

1 6 ‑ 2 0

の文 を最 も多 く使用 し、前

2

者同様 に過半数 を越 える ところまで頻度 の高い順 に選 んで行 くと

、l l ‑1 5

か ら

3 6 ‑ 4 0

までにな り、

1 5 0

語 を越 える特 に長 い文 も

1 9

回見 られ る

この傾 向 は、興味深 い ことに作 品毎 に

( El yo t

は各巻毎 に)見 た場合 も変わ らない

( Appe ndi x I

の表

A

参照)。従 って作品の傾 向 とい うよ りは作者 の特徴 を表す もの と考 えられ る0 ちなみに

El yo t

の最 も長 い文 は

2 7 5

語で

2

回使用 されてい る

。Shake s pe a r e

2 7 1

語 とい う

El yot

に匹敵 す る よ うな長 さの文 を使 ってい る

しか し、

El yot

の文が他 の

2

人 に比 べて長 いの は、散文 で書かれ、しか も論文である こ とを考慮 しなければな らない。 しか も、劇 には比較的短 い ト書 きが多 く使 わ れている ことも考 え併 せ るべ きであ ろうそ こで、 もう少 し細 か く見 るため

3

人 の作者が最 も多 く使 ってい る文 を頻度 の高 い方か ら順番 に

1 0

位 まで 拾 い出 してみる と

、El yot

2 7

語か ら成 る文 を最 も多 く用い、最 も短 い文 は

1 4

語で ある。それに対 し、

Ma r l owe

1 6

語が一番長 く

、Shake s pe a r e

はす べて

1 0

語以下 の文 である (

2

b)0

Mar l o we、Shake s pear e

に共通 して語数

1

2

3

4

の文が入 ってい るが、これ は短 い ト書 きと関係が あるか も知 れない。ト書 きに多 く用い られ、

しか も頻度 も高 い と考 えられ る

̀ e xi

t

' 、̀ e xe un

t

' 、̀ e nt e r

'

、̀ a s i de'

4

語 に限っ てその頻度 を調べ る と下記 の表

3a

の ようになる

勿論 これ らの語が全 て ト

( 2 3 )Li t e r a 7 yDe t e c t i o n ( Ne wYo r k,1 9 7 8 ) 、p p. 4 6 1 4 7 .

(17)

El yo t 、Ma r l o we 、Sha ke s p e a r e

の語桑分析 と比較

195

2b

使用頻度の高い文の長 さ

ELT MRL SH拡 SPK

Fr e q . Le n. Fr e q. Le n. Fr e q . Le n. Fr e q . Le n.

7 0(2. 6 2 ) 2 7 4 8 8(7. 9 4 ) 8 4 9 7(7. 7 7 ) 4 4 4 7(6. 3 6 ) 6 6 7(2. 5 1 ) 2 6 4 5 7(7. 4 4 ) 9 3 6 0(5. 6 3 ) 2 4 3 2(6. 1 5 ) 7 6 3(2. 3 6 ) ◆2 3 4 0 0(6. 5 1 ) 7 3 5 5(5. 5 5 ) 8 4 1 8(5. 9 5 ) 5 6 2(2. 3 2 ) 1 7 3 3 2(5. 4 0 ) 4 3 4 8(5. 4 4 ) 9 4 0 3(5. 7 4 ) 8 6 2(?. 3 2 ) 1 8 2 9 4(4. 7 8 ) 6 3 4 5(5. 3 9 ) 6 3 9 5(5. 6 2 ) 9 6 0(2. 2 5 ) 1 6 2 8 6(4. 6 5 ) 2 3 4 2(5. 3 5 ) 5 3 8

1

(5. 4 2 ) 4 5 9(2. 2 1

)

1 9 2 7 2(4. 4 3 ) 1 3 0 6(4. 7 8 ) 7 3 2 7(4. 6 5 ) 1 0 5 8(2. 1 7 ) 2 1 2 2 2(3. 6

1)

3 2 9 3(4. 5 8 ) 3 2 9

1

(4. 1 4 ) l l 5 6(2. 1 0 ) 1 5 2 1 0(3. 4 2 ) 1 0 2 6 8(4. 1 9 ) 1 2 8 6(4. 0 7 ) 3 5 5(2. 0 6 ) 1 4 2 0 3(3. 3 0 ) 1 6 2 5 2(3. 9 4 ) 1 0 2 5 3(3. 6 0 ) 1 2 6 1 2( 2 2. 9 2 ) 3, 1 6 4( 5 1, 4 8 ) 3, 3 6 6( 5 2. 6 2 ) 3, 6 3 3( 5 1. 7 0 )

書 きに用 い られて短 い文 を作 ってい るわ けで はないが、 そのか な りの部分 は 短 文 を増 加 させ て い る と思 わ れ る

.

念 の た め に この うち一 番 頻 度 の高 い

̀ e nt er'

は、文 の長 さ もい ろい ろな例 が考 え られ るので、 この語 が含 まれ る文 の長 さを調べてみた

。 TAS

で はある特定 の語 についてそれ を含 む文 を画面上 で見 なが ら、 その語 の性質、機能 な どを入力 し、性質、機能別 に集計 す る こ

とがで きる機能 を備 えてい る

この機能 を利用す る とこの種 の調査 は比較 的 容易 であ る。それ によれ ば、Mar

l oweと Shakes pear e

で は

、̀ ent er'

を含 む文 の長 さは表

3bの よ うにな り 、Mar l owe

で約半数が、また

Shakes pear e

で は

3a

ト書 きに多い語の頻度

3b en t er

を含む文の長 さ

Wor ds MRL SHK

e xi t 1 1 1 8 6 e xe unt 1 6 3 8 5 as i de 3 3 8 2 3 4 To t al 6 9 2 4 1 5

Le n. MRL SHK

1 0 1

2 5 3 6 4

3 4 6 2 4

4 4 0 3 9

5 2 8 2 3

6 1 71 8 3

To t al 3 3 8 2 3 4

(18)

196

人 文 研 究 第

8 3

3分 の25語以下 の短 い文 に含 まれてい る。

各作 品毎 に最 も多 く使 われてい る文 の長 さを見 てみ る (AppendixI B)

と興 味深 い ことが分 か る。MarloweShakespeareで は上位 の10番以 内 は 殆 ど変わ らない。特 にShakespeareで は順位 は多少変 わ るが 5編全 て におい 1語 か ら10語 までの文 が 占めてい る。Marloweで は総合 テキス トで最 も 頻度 の高 い

7、8、9

語 の文が順番 が入れ替 わ りなが らも

6

編 中

FA

U を除 い

( 23)

5編 でや は り上 3位 を占め (ただ し、 2TAで は7語文 が 15語文 と同 位 )、最 も多 く使 われ る文 の長 さは8語 で ある。Shakespeareで は4語 の文 と

い うことにな り、作品 によってあ ま り変わ らない ところか ら作 品 とい うよ り は作者 の特徴 を表す もの と考 えて よいので はなか ろうか。しか し、Elyotで は それ ほ どはっ き りした特徴 は現れていない。総合 テキス トで上位 の26、27語 文 、それ に

1 8

語文 が各 テキス トで も比較的上位 に入 ってい るのが分 か る程度 で ある

Elyotの場合長 い文 を多 く使 ってい るため に語数 は他 の2人 とほぼ 同 じで も、文 の数 は半分以下 に しか な らない。 その結果頻度 の差 が余 り大 き くない (総合 テキス トで も1位 と10位 の差 はわずか に19回で あ る) ので、

はっ きりした特徴 が出 ない とも思われ る もしそ うだ とすれ ば、 もっ と多 く の テ キス トを追加 す れ ば差 が 出 て来 るか も知 れ な い。 しか しなが ら、

The Go u e r no ur

に関す る限 りで はElyotはい ろい ろな長 さの文 を、しか も比較 的 長 い文 を使 うところか ら、い うなれ ば丘原型 の分布 を示 し、他 の

3

者 はいず れ も、比較 的短 い文 を集 中 して使用 し、長 い文 は極端 に少 ないので、懸崖型 にその分布 の特徴 が あ る とい える

長 さか ら見 た文 の分布 の この傾 向 は図

1

に示 したグラフに顕著 に現れ てい る。

次 に、ElyotMarlowe、Shakespeare、Spark4人 が使用 してい る語 の

( 24)

FAU はMarloweの作品の中で も最 も本文の異同の激 しいテキス トである

(BowersFAU の̀Textuallntroduction'を参照)ことと関係があるか も知れ ないが今 はその検討の余裕 はないし、上位 10位に入っている文の種類 は総合テ キス トと大 きく変わってはいないのでそこまで考 える必要 はないのか も知れな

い 。

(19)

El yo t 、Mar l o we、Shake s pe ar e

の語桑分析 と比較

197

単 位 ・千

5 1 5 2 5 3 5 4 5 5 与 6 5

7 5 8 5

95

1 15 12 1

1 0 2 8 38 40 5 9 6 8

71I 80

9日 IBB

I18 12 E )

‑ ELT . ・ ・ ・ ・ ・nR

L ‑

I SH

I( ・一一

SPK

1

長 さから見た文の分布

長 さについて比較 してみ ることにす る

語 の長 さは語 に含 まれ る文字数で測 るが、 アポス トロフィやハイ フン、 それ にワー ドラップの空 白は文字数 とし て算入 していない。例 えば、

' e m、Bi l i a‑ bor z a、GadsHi l

l等 はそれぞれ

2

、10文字、

8

文字 の長 さ として計算 され る

文 の長 さ と同様 に平均文字数 だけでな く、 それぞれの長 さの語 の使用頻度 を異語数 と総語数 の両方 の場合 についてその分布 も調べてみ る と表

4

のようにな り、 この表 に基づいてグラ フを描 くと図

2

のようになる。

El yot

は異語数で平均

7. 5 8

文字、総語数で

4. 6 7

文字 の長 さの語 を使 い、

4

人 の中で は最 も長 く

、Mar l o we

6. 6 6 、4. 3 0

文字

、Shake s pe ar e

6. 6 4

4. 0 5

文字 と較 べ る と、それぞれ

Mar l o we

よ り

0. 9 8、0. 2 7 、Shake s pear e

0. 9 6、0. 6 2

文字 も長 い ことになる。同 じ散文 の

Spar k

の平均 の長 さ

( 7. 0 3 , 4. 3 0)

と較べてみて も

0. 5 5、0. 2 7

の差が見 られ る。各作家 の最 も多 く用い る 語 の長 さは、異語数で較べ ると

、El yot

7

文字語

、 Shake s pear e

Ma r l owe

6

文字語 で あ り

、Spar k

7

文字語 と

6

文 字語 が ほぼ同 じ位使 用 して い る。総語数で較べ ると、他 の

3

人 が

3

文字語が一番多 いのに対 して

、El yot

2

文字語 を最 も多 く使用 してい る

(20)

1 98

8 3

表 4 語 の長 さ と頻 度

Le n. D. W. ELT T. W. D. W. MRL T. W.

1 7 ( 0. 07 ) 2, 2 29 ( 2. 1 9 ) 1 0 ( 0. 09 ) 3, 75 7 ( 3. 5 0 ) 2 5 0 ( 0. 5 2) 21, 1 27 (2 0. 7 4) 63 ( 0. 5 9) 1 7, 50 0 (1 6. 2 9) 3 1 2 4 ( 1. 30 ) 1 8, 97 0 (1 8. 6 2) 3 32 ( 3. 0 9) 22, 94 2 (21. 36 ) 4 47 0 ( 4. 92 ) 1 4, 34 8 (1 4. 0 8) 9 92 ( 9. 2 2) 21, 65 8 (20. 1 6 ) 5 1, 05 9 (

l

l. 09 ) l l, 789 (

l

l. 5 7) 1, 8 01 (1 6. 7 4) 1 5, 0 8 5 (1 4. 04 ) 6 1, 50 8 (1 5. 7 9 ) 1 0, 7 35 (1 0. 5 4) 2, 21 2 (20. 57 ) 1 0, 1 2 5 ( 9. 43 ) 7 1, 62 8 (1 7. 04 ) 6, 7 66 ( 6. 6 4) 1, 9 8 5 (1 8. 45 ) 7, 11 2 ( 6. 6 2 ) 8 1, 5 51 (1 6. 2 4 ) 6, 1 69 ( 6. 0 5) 1, 4 79 (1 3. 75 ) 4, 51 5 ( 4. 2 0) 9 1, 2 9 0 (1 3. 51 ) 4, 3 66 ( 4. 2 9) 9 45 ( 8. 7 9 ) 2, 71 6 ( 2. 53 ) 1 0 91 1 ( 9. 5 4 ) 2, 75 3 ( 2. 7 0) 5 47 ( 5. 09 ) 1, 201( 1. 1 2 ) l l 5 2 4 ( 5. 49 ) 1, 51 8 ( 1. 4 9) 2 32 ( 2. 1 6 ) 50 5 ( 0. 47 ) 1 2 25 4 ( 2. 66 ) ‑ 731 ( 0. 7 2 ) 1 05 ( 0. 9 8 ) 1 51 ( 0. 1 4 ) 1 3 11 2 ( 1. 1 7 ) 25 8 ( 0. 2 5) 41 ( 0. 3 8) 61 ( 0. 06 ) 1 4 4 7 ( 0. 49 ) 97 ( 0. 1 0) 8 ( 0. 0

7)

8 4 ( 0. 08 ) 1 5 1 2 ( 0. 1 3 ) 1 7 ( 0. 0 2) 3 ( 0. 0 3) 3 ( 0. 00 ) 1 6 5 ( 0. 05 ) 1 0 ( 0. 01 ) 1( 0. 01 ) 1 ( 0. 00 ) To t al 9, 55 2 ( 1 0 0. 01 ) 1 01, 883 ( 1 0 0. 0 1 ) 1 0, 7 5 6 ( 1 00. 0 2) 1 07, 41 6 ( 1 00. 0 0 )

Le n. D. W. SHK T. W. D. W. SPK T. W.

1 1 4 ( 0. 1 5 ) 5, 71 2 ( 5. 4 8) 1 7 ( 0. 1 8) 3, 4 6 0 ( 3. 3 6 )

2 6 5 ( 0. 68 ) 1 8, 069 (1 7. 3 2) 7 4 ( 0. 80 ) 1 6, 5 6 8 (1 6. 0 8 )

3 31 6 ( 3. 3 0 ) 2 3, 7 34 (2 2. 7 5) 2 7 6 ( 3. 00 ) 25, 31 3 (24. 57 )

4 91 8 ( 9. 5 8 ) 2 1, 67 2 (2 0. 7 7) 91 6 ( 9. 96 ) 20, 381(1 9. 78 )

5 1, 6 9 2 (1 7. 6 5) 1 3, 7 94 (1 3. 2 2) 1, 2 60 (1 3. 7 0 ) ll, 84 6 (ll. 50 )

6 1, 91 9 (2 0. 0 2) 8, 77 7 ( 8. 41 )

̲

1, 5 1 5 (1 6. 4 8 ) 9, 04 3 ( 8. 78 )

8 1, 20 3 (1 2. 55 ) 3, 28 4 ( 3. 1 5) 1, 2 71 (1 3. 8 2) 4, 221 ( 4. 1 0 )

9 7 9 9 ( 8. 34 ) 2, 081( 1. 9 9) 9 3 8 (1 0. 20 ) 2, 56 4 ( 2. 4 9 )

1 0 49 7 ( 5. 1 9 ) 890 ( 0. 8 5) 6 3 2 ( 6. 87 ) 1, 53 5 ( 1. 49 )

l l 2 7 5 ( 2. 87 ) 4 37 ( 0. 4 2) 3 73 ( 4. 06 ) 69 5 ( 0. 67 )

1 2 1 0 7 ( 1. 1 2 ) 1 5 4 ( 0. 1 5) 21 1( 2. 29 ) 36 9 ( 0. 36 )

1 3 4 2 ( 0. 4 4) 5 5 ( 0. 0 5) 1 02 (

1

. l l ) 1 6 9 ( 0. 1 6 )

1 4 1 2 ( 0. 1 3 ) 21( 0. 0 2) 42 ( 0. 4 6 ) 5 4 ( 0. 0 5 )

1 5 6 ( 0. 06 ) 9 ( 0. 01 ) 1 0 ( 0. ll ) 1 7 ( 0. 0 2)

1 6 1 ( 0. 01

)

1 ( 0. 0 0) 6 ( 0. 07 ) 7 ( 0. 0

1)

To t a l 9, 5 8 4 ( 1 0 0. 02) 1 0 4, 3 24 (9 9. 9 9) 9, 1 94 (9 9. 9 8 ) 1 0 3, 0 3 4 ( 1 0 0. 01 )

表 3a ト書 きに多い語の頻度 表 3b en t er を含む文の長 さ Wor ds MRL SHK e xi t 1 1 1 8 6 e xe unt 1 6 3 8 5 as i de 3 3 8 2 3 4 To t al 6 9 2 4 1 5 Le n

参照

関連したドキュメント

地図 9 “ソラマメ”の語形 語形と分類 徽州で“ソラマメ”を表す語形は二つある。それぞれ「碧豆」[pɵ thiu], 「蚕豆」[tsh thiu]である。

明治33年8月,小学校令が改正され,それま で,国語科関係では,読書,作文,習字の三教

そのほか,2つのそれをもつ州が1つあった。そして,6都市がそれぞれ造

編﹁新しき命﹂の最後の一節である︒この作品は弥生子が次男︵茂吉

奥付の記載が西暦の場合にも、一貫性を考えて、 []付きで元号を付した。また、奥付等の数

奥付の記載が西暦の場合にも、一貫性を考えて、 []付きで元号を付した。また、奥付等の数

(注)本報告書に掲載している数値は端数を四捨五入しているため、表中の数値の合計が表に示されている合計

“〇~□までの数字を表示する”というプログラムを組み、micro:bit