17 9
El yot
、Ma r l owe
、Shake s pea r e
の語桑分析 と比較‑ コ ン ピュー タ利 用 に よ る‑
君 羅 久 則
は じめ に
近年 の コンピュー タのハ ー ドウェア、 ソフ トウェア両面 にお ける技術 の進 歩 と普及 にはめざましい ものがあ り、処理 の高速化、 メモ リ装置 の大容量化 等が実現 され、 その結果、文学 の研究者個人で さえも必要な コンピュータ機 器 を揃 え、単 にワープロ としてばか りでな く、 テキス ト分析 な どの研究 に役 立 て る ことが可能 になって きた。 とはい え、一面 で は、 テキス トの文章や語 嚢 の分析 な ど研究者個人々々が考 える目的や必要性 に十分応 えて くれ る、公 表 された ソフ トウェアは余 り多 くはない。わずかに
0Ⅹf or dComput i ngSe r ‑ vi ce
が公開 してい るMi c r O‑ OCP ( 0Ⅹf or dConco r dancePr ogr am)
が現在の ところ、パー ソナル コンピュー タで走 らせ る ことが出来、 しか も信頼す る に足 る文章解析用プログラムである とい える(1)。しか し、この
Mi c r O‑ OCP
に して も、その主 な機能 は、W or dl i s t
、W or di ndex
、それ にConc or danc e
を 作成 す る ことであ り、例 えば複数 の作品や作家間の比較分析 な どはで きない。従 って、研究者個人 が 自分 の思 い通 りの目的 を達成 しようとす るな ら、勢 い、
独 自のプログラムを組 まな くて はな らな くなる
。
幸 いな ことに、 ある程度 の 訓練 さえ積 めば、門外漢 のわれわれ文学や語学 の研究者 で も自分 の 目的 を達(1)Mi c r o‑ OCP
の他にも、例 えば、Wo r d Cr u nc he r( El e c t r o ni cTe xtCo r po r a‑
t i o n)
やCLOC ( Uni ve r s i t yofBi r mi ngha m)
などのテキス ト分析用のプログ ラムがあるが、残念なが らどの機種ででも使えるというわけではない。CLOC
に ついては、Chr i s t op he rBut l e r ,Co mput e P : ii nLi n gui s t i c s ( 0Ⅹf o r d, 1 9 6 5 )
にOCP
との簡単な比較が記されている。
180
人 文 研 究 第8 3
輯成 し得 るプログ ラム をパ ー ソナル コンピュータ上で組 め るような簡易言語や デー タベー ス等 のアプ リケー シ ョンソフ トウェアが普及 してお り、 また、大 きなテキス トを扱 うに は どうして も大 きな容 量 の メモ リ装 置 が必 要 にな る が、大容量 のハ ー ドデ ィス クの普及 によって この支障 も緩和 されつつあ る
。
文学 ・語 学 の分野 にお けるコンピュー タ専 門 のジャーナルで あ る
Li t e y
la
ryandLi ngui s t i cCo mput i ng( 2 )
を見 て も分 か る通 り、現在 、文学 の分野 におい て も多 くの研究者 が コンピュー タを利 用 して文体 や語柔 の分析 に取 り組 んで い る。
しか し、残念 な ことに、 その研 究結果 は公表 されて も、 その分析 のた めに使用 されたプログ ラム まで は公 開 され ないのが通例 である。数多 くのプ ログラムが公 開 され、 その中か ら研究者 の 目的 に応 じてプログラム を選択 し て使 用す ることが可能 にな るな ら、文学 の分野 において も、 コンピュー タを 利用 した研 究が飛躍的 に発展 す るで あ ろう。少 な くともある作家 の コンコー ダ ンスや グロサ リー を独 自に作成 し、特定 の語桑 やセ ンテ ンス を拾 い出 した り、 あるい はそれ らの作 品 にお ける分布 を調 べ る といった ように、文学作 品 の研 究 に強力 な武器 とな る道具 を提供 して くれ る と考 え られ る。
小 論 で は、筆 者 が独 自 に開発 した テ キ ス ト分 析 用 の プ ログ ラム、
TAS ( TextAnal yzi ng Sys t em) ( 3)
を利 用 して、Si rThomasEl yot
のTheBo ke
(2)oxf or dUni ve r s i t yPr e s s ,1 9 8 6
年以後。それ以前のBul l e t i no ft heAs s o c i a t i o n f o rLi t e r a7 ya ndLi n gui s t i cCo mput i n g ( ALLC Bul l e t i n)
とJ o ur nalo f t he As s o c i at i o nf o rLi t e r 7 a 7 ya ndLi n gui s t i cCo mput i n g
というALLC
の2
つの機 関誌が統合 されたもので、文学 ・語学のコンピュータ利用による調査研究 をカ バーしているジャーナルである。(3
)元々 はdBASEI I( As ht o n‑ Tat e)
で組 まれ てい たが、その後dBASEI
II、dBASE I I IPLUS
に変更 し、更 に現在では、 この簡易言語の文法に従 って組 ま れた後、Qui c ksi l ve r( Wo r dTe c h)
によってコンパイルされ、MS‑ DOS( 3. 3 0 )
のリンカーによりリンクされている。同プログラムを利用 して行った、永原和夫 氏 と共著になる、高等学校英語教科書の分析、「高等学校用英語教科書Uni co r n
I
、ⅠⅠ、Ⅰ IB
の語桑分析」小樽女子短期大学 「研究紀要」第 19号 (北村正司学 長追悼論文集、1 9 9 0
年1
月)がある。ただし、今回の分析 に利用 したTAS
は劇 作品や詩 をも分析できるように改訂 されているので、TAS
に関する記述 は小論の記述 とは異なるところがある。
El yo t 、Ma r l o we 、Sha ke s p e a r e
の語桑分析 と比較1 81 Name dTheGov e mo ur
を中心 に、Chri s t opherMar l owe、Shakes pear e
の 作品 に用 い られている語桑 の分析 と比較 を主 として行 い、一部文体 に閑わ る 分析 も試 み る。
さ らに、現代 イ ギ リス の散 文 と も比 較 す るた め にMur i el Spar kの作品数編 も加 えた。その中で、TASプログラムその ものに も若干触
れなが ら、語桑分析 に限 らず この種 のテキス ト分析 にコンピュータを利用する上 でのい くつかの問題点 も明 らか にしたい。
1.調査 の対 象 と方法
イギ リスのル ネ ッサ ンスの ヒューマ ニ ス トで あ る
Si r Thomas El yot ( 1 4 9 0 ?‑ 1 5 4 6 )が著 した The Bo ke Name d The Gove r no ur (
以下The Gov e r no ur
と記す)は英語 によって書かれた最初 の教育論( 4)
であ り、その中で 彼 は母 国語 による教育 を主張 し、更 にはTheDi c t i o naり ( 1 5 3 8 )
を出版 す る な ど、 El yot
はRogerAs c ham
等 とともに母国語 の擁護者 の一人で ある。The Go v e r no ur
は、後 に成長 して統治者 になるべ き子弟 の教育 について論 じた も のであるが、スポー ツや音楽 な ど広範囲の話題 について触れてお り、El yot
の 主張 の裏付 け として古今 を通 じて豊富 なエ ピソー ドを語 ってい る。
特 に、 ア レクサ ンダー大王 や ジュ リアス ・シーザーな どギ リシア、 ローマか らの例が 多 く、 この書物 は当代 ばか りでな く、後 の詩人、劇作 家 な ど、特 にShake‑
s pear e
に大 きな影響 を与 えた ことが明 らかにされてい る(5)0TheGo v e r nour
の中でEl yot
が使用 してい る語桑 や文章 を他 の劇作家 の それ と比較 してみることは無意味 な ことで はない し、 そのW or di ndexない
(4)F. Wat s on( e d. ) ,TheBo k eNa me dTheGo v e mo ur ( Lo ndon,1 9 0 7 ) , pp. xi ‑ Ⅹi i
参照。(5)D. T. St ar ne s
はHe myZV
やTheMe r c h anto fVe ni c e
などのShake s pe a r e
の作品にElyot
の影響があることを明 らかにしている。(" Shake s pe ar e and
El yo t ' SGo v e r no ur
,"Uni v .o f Te w St udi e si nEn gl i s h ,No. 7( Aus t i n,1 9 2 7 )
,1 1 21 3 2 ) .Ral ph
M.Sar ge nt
は特にTheTwoGe nt l e me no f Ve r o na
に対する影 響を論 じている。(H Si rThomasEl yota ndt heI nt e gr i t yo f TheTwoGe nt l e me n
o f Ve r o na
,"PMLA LXV ( 1 9 5 0 ) ,1 1 6 9 ‑ 7 0).
182
人 文 研 究 第8 3
輯Lは
Conc or dance
を用意す る ことは、Shakes pear e
をはじめ、ルネ ッサ ンス 期 の詩人 や劇作家 の ことばを正確 に知 る上 で も重要 な意義 を有す る と思われ る。
比較 の対 象 として は、Chr i s t ophe r Mar l owe ( 1 5 6 4 ‑ 1 5 9 3 )
とWi l l i am Shake s pear e ( 1 5 6 4 ‑ 1 61 6 )
の劇作品か らそれぞれ数編ずつ取 り上 げることに す る。 さ らに現代 イギ リスの散文 の例 として、Mur i elSpar k ( 1 9 1 8
‑)の数 編 の作品 も加 えた。TheGo v e mo ur
は1 531
年 にロ ン ドンでThomasBe r t hl e t
の印刷 所 で初 めて出版 され、 その後、1 6
世紀 だ けで も7
回の改訂版 が出 されてお り( 6)
、か な り人気 のあった書物 の一つ と考 え られ る.
この初版( 1 5 3 1 )
に基づいてH.
H.S.Cr of t
が1 8 8 3
年 に編集 出版 した ものをここで は基本 テキス トとして用 いてい る( 7)
。Mar l owe
の作品 として は、 Fr eds onBowe r s
編Cambr i dge
版( 8)
か ら、 Di do
,t heQue e no fCar t ha ge( 1 5 9 4
年出版、以下Di do
と略記)、Tamb ur l ai ne
第 一部( 1 5 9 0
、 1Tamb ur l a i ne )
、同第二部( 1 5 9 0 ,2T a mb ur l ai ne )
、TheJe w o fMal t a ( 1 6 3 3 ,TheJe u ) ) 、Do c t o rFaus t us ( 1 6 0 4 , Fau s t us )
、それ にEdwwd t heSe c o nd ( 1 5 9 4 , Edu ) wd)
の6
編 の悲劇 を取 り上 げる。
詩 と翻訳 の作品 を 除 けば、この6
編 でMar l owe
の劇作品の殆 ど全 てが含 まれ ることになる。こ の他 にはわずか に 1編、TheMa s s ac r eat P ar i s
を残すだ けである.Shake s pear e
か らは、TheTwoGe nt l e me no f Ve r o na (
以下Ge nt l e me n
と略記),TheMe r c hanto f Ve ni c e ( Me r c ha nt )
,Tu ) e l j i hNz l ght , Muc hAdo ab o utNo t hi ng ( Ado) ,Ki n gHe n叩 ZV
第一部 (lHe m3 7ZV)
の5
編、主 に喜劇 を選 んだ。いずれ も
Shake s pear e
の死後1 623
年 に出版 され た二 つ(6)Fac s i mi l e
版Th eBo k eNa me dt h eGo v e r no u r ( Me ns t o n,1 9 7 0 )
のはしが き を参照。(7)H. H. S. Cr of t( e d
.) ,TheBo k eNa me dt heGo v e r no u r ( Lo ndo n, 1 8 8 3 ; r pr n t d.
Ne w Yo r k,1 9 6 7 ) ,2γol s .
(8)Fr e ds o nBo we r s( e d
.),TheCo mpl e t eWo r k so fChr i s t o ph e rMa r l o we ( Ca m‑
br i d geUni ve r s i t yPr e s s ,1 9 7 3 ;1 9 8 1 ) ,2 nde d. ,2vo l s .
El yo t 、Ma r l o we 、Sha ke s p e a r e
の語桑分析 と比較1 83
折 り本初版( Fi r s tFol i o) ( 9)
を基本 テキス トとして用 いた。Shakespear e
の場 合 には、喜劇 的な作品 を選 んだ ことか ら、人文主義的興味 に富 む ことと、悲 劇 に比べて散文が多 く使 われている点 は、多少 な りともElyot
に近づ ける意 図がなか ったわ けで はないが、それ よ りも作品の選択 に関 して は、Marl owe
の場合 も同様 で あるが、 その長 さ (使用 されてい る語 の延べ数) を最大 の根 拠 としている。TheGov e mo ur
の使用語数 は延べ1 01, 8 83
語で あ り、約1 0
万 語 を目処 としてMar l oweと Shakes pear e
か らそれ ぞれ 6編 の悲劇 と 5編の喜劇及 び喜劇 的作品 を選 び出 した。
Spar kか らは ThePr i me o f Mi s sJe an Br o di e
、TheGi r l s o f Sl e nde r Me ans
、TheGo‑ au ) a yBi r d
、ThePo r t ob e l l oRo ad
、TheDar k Gl a s s e s
の 長編、短編 の物語合 わせ て5編 を選 んだ。前 2者 はPe ngui nBooks
版 を、残り3編 について は
Col l e c t e dSt or i e s
Zに収録 された ものを使用 した( 10) 0
尚、上記 の基本 テキス トとして使用 した版 の他 に、
TheGo v e mo ur
に関 し て は、Facs i mi l e
版、並びにW at s on
編 のEve r yman' sLi br ar y
版、Mar l owe
の悲劇 について は J.B. St eane
編 のPe ngui nCl as s i cs
版、またShakes pear e
の作品に関 して はFi r s tFol i o
のFac s i mi l e
版 とAr de n
版( ll)
をそれぞれ参照し、後で触れ るように若干 の修正 を行 う際 に利用 してい る。
これ らのテキス トをそれぞれ作品毎 にテキス トファイル
( SDF)と して入
(9)Cha r l t o nHi nma n( e d
.),TheNo do nFa c s i mi l e .TheFi r s tFo l i oo fSh a ke 一 頭e we ( Ne w Yor k,1 9 6 8 ) .
( 1 0 )TheGi r l so f Sl e nde rMe a ns ( Har mo nds wor t h,Mi ddl e s e x,1 9 6 3 ;r pr nt d.
1 9 6 6 ) ,ThePr i meo fMi s sJ e a nBr o di e ( Har mo nds wor t h,1 9 6 1 ;r pr nt e d.1 9 6 5 )
を使用 し、TheGo ‑ a wa yBi r d , ThePo r t o b e l l oRo a d,Th eDaY 滋Gl a s s e s
の3編 はCo l l e c t e dSt o r i e s I ( Lo ndo n,1 9 67 )から採用 した.
( l l )
参照 したAr de n
版テキス トは次の通 りである。John Rus s e l lBr o wn ( e d. )
,TheMe r c h anto f Ve ni c e ( London,1 9 5 5 ;r pr nt d.1 9 8 9 ) ;Cl i f f o r dLe e c h( e d. )
,TheTwoGe nt l e me no f Ve r o na ( Lo ndo n,1 9 6 9;r pr nt d.1 9 8 6 ) ,A.
R.Hum‑
p hr e ys( e d
.),Muc hAdoa b o utNo t hi n g ( Lo ndo n,1 9 81 ;r pr nt d.1 9 8 9 )
,J.M.
Lo t hi anandT.
W .Cr ai k( e dd. ) ,Twe
lj t hN2 ' ght ( Lo ndo n,1 9 7 5 ;r pr nt d.1 9 8 8 )
,andA.R Humphr e ys( e d. ) ,Th eFi r s tRa7 1o fKi n gHe n7 3 )ZV ( Lo ndon,1 9 6 0 ;
r pr nt d.1 9 8 9 ) .
184
人 文 研 究 第8 3
輯力 した。 この ようなテキス ト分析 を行 う場合 にはテキス トファイル をいかに 正確 に作成 するかが重要 であ り、 コンピュータを利用す る上 で、機械可読 の 形式 のテキス トを準備 す る難 しさが大 きな障害 になっている と思われ る
。
例 えば4 0
編近 い劇作 品 と2
編 の長詩、 ソネ ッ ト、 それ に数編 の詩作 晶 を含 むShake s pear e
の全作品 をワープロ等でタイプ入力 し、プ リンタで印刷 し校正 を行 うとすれ ば、考 えただけで利用 を断念 しかねない難作業 になる。
文章分 析用 のプログラム同様、 テキス トも機械可読 の形 で公開 され、提供 され るようになれ ば、 この種 の研究 も大 きな発展 を遂 げる ことが可能 になる と考 えら れ る
。
その意味で、現在多 くのコンピュータ可読 のテキス トを集積 しつつあ る0Ⅹf or dCo mput i ngSe r vi c e
の0Ⅹf or dTe xtAr c bi ve ( OTA) (12)
は貴重 な存在で ある。幸 いに筆者 はFi r s tFol i o
について はこのOTA
か ら公表 され ているテキス トファイル を利用す る ことが出来 た( 13)
。 しか し、 このような場 合 で も、個 別 の プ ロ グ ラム に合 わせ て文 字 ばか りで な く、例 えばAc t
やSc e ne
の指示、 ト書 きと台詞 の区別等 をコンピュータが認識で きるようにい わ ばテキス トを加工 しなけれ ばな らない( e nc odi ng)
とい う問題が残 されて い る。 o xf or dTe xtAr c hi ve
のFi r s tFol i o
には独 自のe ncodi ng
が施 されて い るが、この調査 で は、後 で述べ るように、TAS
で識別 す ることがで きる記 号 に変更 した上で利用 してい る。
TheGo v e r no ur
はタイ トルペ ージ と目次 を除いて巻頭 の̀ Pr oe m'
か ら最 後 の̀ TALOS'
まで全 て入力 した。 ただ し、̀ CHAPTERI
,'̀ CHAPTERI I '
等 の章番号 は除外 した。 しか し、各章 の見 出 しは、時 として3
行 に及ぶ文から成 ってい る場合 もあるので、 テキス トとして取 り扱 っている。 またページ 欄外 の小見 出 しは、人名 や書名 (しか も略 されていることが多い)や番号が
(12)
oxf o r dTe xtAr c hi ve
には英語ばか りでな く、ギリシア語、フランス語など 様々な言語のテキス トが集められている。0Ⅹf o r dCo mp ut i ngSe r vi c e
が出して いるOT
ALi s t( Ma y
1991)を参照。(13)すなわち
OTA Li s t
,U‑ 1 1 9 ‑ E
。 このテキス トファイルの利用に関 しては0Ⅹ‑
f o r dUn i v e r s i t yCo mp ut i ngSe r v i c e
に深 く感謝する。El y o t 、Ma r l o we 、Sh a k e s p e a r e
の語桑分析 と比較185
主 なので、 削除 した。Mar l owe
とShake s pe a r e
の劇作 品 につ いて は、Dr a ma t i sPe r s onae
を除 いて、タイ トル名 、 ト書 き、Pr o l ogue
やEpi l ogue
も含 めて入力 され て い る。た だ し
、Spe e c hPr e f i x
は入 力 され て い るが、特殊 な記 号 をつ けて テ キス トと は別 の取 扱 い を した。従 って、Spe e c hPr e f i x
の登場 人 物名 は使 用語 数 に は含 まれ る こ とはない.Faus t u s
の よ うにMar l owe
の劇 に は、劇 全体 が通 し番 号 の行 表 示 だ けでAc t
やSc e ne
に分 か れ て い な い劇 が あ る。 この場 合 に はBo we r s
が [ ]つ きで、Ac
tとSc e ne
を表 示 してい るので、 その表 示 に従 っ てA
ct、Sc e ne
に分 けてい る。同様 に、Fi r s tFol i o
の中 に はSc e ne
の表 示 が ない劇 が見 られ る。この場 合 に は、Ar de n
版 に従 ってSc e ne
の指 定 を行 った。今 回 の調査 に使 用 したテ キス トフ ァイル に は コン ピュー タが 的確 に識 別 で きるよ うに次 の よ うな原文 に は印刷 され てい な い記号 を施 した。
<C
…>̀ <C'
と̀>'とで囲 まれた部分 はSpe e c hPr e f i x
であることを示 し、テ キス ト本文 とは別個 の取扱い となる。<D
…>̀ <D'
と̀>'とで囲 まれた部分 は劇 の ト書 きのように本文 と区別す る必 要のある時 に使用す る。テキス トとして分析 の対象 となるが、この部分 に 属 す る単語 にはデータベース ファイルで はDの記号が つ け られ てい るの で、 ト書 きとlして識別することが出来 るようになってい る0The Go u e r ‑ no ur
の各章 の見出 しにもこの記号がつけられている。〈 H〉
行 の先頭 につけてその行 を行数のカウン トか ら除外す るために使用する。劇で は詩 としての 1行 を複数 の登場人物 に割 り当てることが よ くある。こ の ような場合 に複数 の行 を
1
行 として数 えるために2
行 目以下 に この〈 H
〉をつける。 また、TheGo u e mo ur
の各章 の見出 しにもこの印 をつけ、行数 を数 えないようにしている。従 って、ページの先頭か ら章が始 まって いる時 はそのページの0行 目の表示 になる。
。
このカタカナ用のマル は文 の終 わ りを指示するための記号で、例 えば ト書 きで̀ Exi
t'とあって ピリオ ドのない ときに この印 をつ けて文 の終 わ りで186
人 文 研 究 第8 3
輯あることを示す。 さもなければ この語が次の文 の先頭 に属す る ことにな る
.
この印 はデータベースファイルで は削除 され る。省略符号 としての ピリオ ドが語 または文字の末尾 についている場合 に終止 符 としてのピリオ ドと区別す るために利用す る。
人名 な どで一人 の名前が空 白を間 に挟んで
2
語か らなるときに、それを1
語 として取 り扱 う、いわゆるワー ドラップをかけるために使用す る。 この 調査で はTheGo u e r no ur
のSo ut h ̲ ha mpt o n
と、Fi r s tFol i o
の中で、同 一人物が、例 えばGad sHi
llとGads ‑ Hi
llの ように空 白 とハイフンとが混 用 されている時 に限って使用 した。データベースファイルで は空 白に変わる。
ハイ フンのついた人名 な どをハ イフンで分断す るのを避 けるために通常 のハイフンとは区別 してカナのハイフンを使 う。
アポス トロフィと区別 す るためにシ ングル クォーテー ションの代 わ りに 用いる。
その他 、 テ キス ト名 を登 録 す るた め の記 号
̀ 〜
'や テ キ ス トの章 や劇 のAc t
を 示 す̀
#'、ペ ー ジやSc e ne
を指定 す るた めの ̀*'の記号 を用 いて い る。又、1
語 がハ イ フ ンを用 い て2
行 に またが って 印刷 され て い る場 合、 TAS
は自動 的 に ハ イ フ ンを取 り除 き、その語 は次 の行 の先頭 に位 置 す る もの として処 理 す る。
この よ うな語 が本 来ハ イ フ ンが入 るべ き語 で あ る ときは、 これ を避 け るた め に、語 全体 を前 の行 に繰 り上 げ るか、 次 の行 に送 って、入 力 した
( 1 4 ) 。
テ キス トフ ァイル の記 述 の最後 に、 こ こで次 の点 につ いて それ ぞれ のテ キ ス トを修 正 した こ とを付 記 しな けれ ばな らない
。Cr of t
編 のTheGo v e mo ur
に は、 明 らか に脱 字 と見 られ る部 分 と活字 の判別 で きない部分 とが
3
箇 所 あ る。これ らはFac s i mi l e
版 とEver yman' sLi br ar y
版 とを参 照 して訂 正 した。(14)通常 は語全体 を前行 に繰 り上 げるが、その場合 に次行が空 白になって しまうと きは次の行 に送 って入力 した。
El yo t 、Ma r l o we 、Sha ke s p e a r e
の語嚢分析 と比較1 87
又 、 同書 で、 これ はFacs i mi l e
版 も同 じで あ るが、縮約 され た語 の うち次 の10
語 、延 べ21
語 はt hai ge
の ように空 白 を入 れ て2
語 とした。尚、その際 に ア ポス トロフ ィはつ けていない、又各語 の うち括 弧書 きの数字 のあ る もの は 延 べ語数 を示 す。t hai ge
,t haunci e nt
,t he nt e nt( 5 )
,t he f f e c t e d
,t hone ( 2 )
,t hot he r ( 2 )
,t hac c ompl ys s he me nt ,t he mpe r our ,t he publ i ke ( 1 5 ) ,t hac c omp
t.Fi r s tFol i o
の中で̀ Her cul es '( MAN,666)
、̀ Toby'( TN, 2340)
、̀ Si rM. '
(1 H4,261 2)
の3
箇所 がSpeec hPr e f i x
として取 り扱 われ てい るが、Facs i m‑
i l e
版 に従 って、台詞 の一部 とした(16)他 、次 の よ うな訂正 を施 した。左側 が誤 り、右側 が訂 正 、括弧 内 の作 品名 の後 の数字 はOTA
のテキス トフ ァイルで作 品 ご とに付 され た行番号 で あ る。
l as t l o s t Sal ani o Sl ani o Somme r Sommme r l e tvs l e tvsvs s ol a
,s ol a,s oユ a.
I nf ai t h l nf ai t h He l peme Hel p
( MV 6 6 0 ) c oz e ni n g f orcoz e ni ng ( 1 H42 2 9 ) ( MV 7 9 3 ) made madewi t h ( 1 H41 0 5 5 ) ( MV 1 27 5 ) f a t f at c h ( 1 H41 1 0 3 ) ( MV 2 4 4 9 ) mos t mos tmos t ( 1 H41 4 4 2 ) ( MV 2 5 9 4 ) ofof of ( 1 H42 0 2 5 ) ( MAN 71 1 ) outal l outofal l ( 1 H42 0 2 5 ) ( MAN 1 5 9 3 )aLaz a r us asLaz ar us ( 1 H42 4 0 0 )
( 1 5 )
この語だけは他の語 と縮約 の性質が異なるので恐 らく誤植 と思われ るが、他の テキス トで も同様であるが、 このような場合 にで も原文通 りとした0( 1 6)
ただし、実際に参照 したFac s i mi l e
版 はChar l t onHi nman
版で はな く、Si d‑
ne yLe e
編 になるFac s i mi l e
版である( Si dne yLe e( e d
.),Sh a ke 砂e we' sCo m‑
e di e s ,Hi s t o r i e s ,a ndTy l a ge di e s( oxf o r d, 1 9 0 2 ) )
。その他、Fi r s tFol i o
のテキス トファイルでは、オ リジナルにはないが、付加 された記号のうち1 0
数カ所訂正 したことも付記 しておかなければならない。尚、作品名の略号 については、次節 の冒頭参照。188
人 文 研 究 第8 3
輯Ar tt hou Ar tt hout hou( MAN 2 34 6 ) St e p St e ps
(1H425 44 ) anaywo r danaywo r d ( TN 8 29 ) bui l ke bul ke ( 1 H42 699 ) Ma s t e r
M.( TN 1 9 9 8 ) ye a ge a ( 1 H427 44 ) pauyn panyn ( TN 2 36 3 )
ここに は主 として語形 、語数 に影響 を与 え る ものだ けを挙 げたが、 この他 に 句読 点等 について も修 正 を加 えた。
尚、次 の ような種類 の語 に は以下 に示 す特別 な記号 をつ け特殊 語 として区
別した。
*P
人名、国名、地名等の固有名詞 とその形容詞*L
明 らかにラテン語 として意識 して使用 されている語(17)
*G
同様なギ リシア語*M
ラテン語、ギ リシア語以外の外国語*S
数字、記号、略語等以上 の ように して作成 され たテキス トフ ァイル は、例 えば
Me r c h ant
の冒 頭 の7行 を見 る と次 の ようになって い る。〜 MV TheMe r c hantofVe ni c e.
#01
* 1 01
〈H
〉くD Ac t us * Lpr i mus *
L.)〈H
)くD Ent e rAnt honi o * P,Sal a r i no * P,andSal ani o * P. 〉
( 1 7 )
例 えば、Fa us t us
,Ⅰ .i .41
に見 られるようなラテン語のセ ンテンスに含 まれ る 語など。但 し、劇 の ト書 きによくある̀ Exi
t'や̀ Exe unt '
等 は特殊語 としては取 り 扱っていない。El yo t 、Ma r l o we 、Sha ke s pe a r e
の語桑分析 と比較189
く
H
〉くCAnt honi o * P. )
I ns oot hlknow notwhyIam s os ad
,Ⅰ twe ar i e sme:yous ayi twe ar i e syou;
Butho w lca ughti t ,f oundi t ,orc amebyi t
,Wha ts t uf f e' t i smadeo f ,whe r eofi ti sbor ne
,Ia m t ol e ar ne :a nds uc haWant ‑ wi ts adne s s emake sof
く
H) ne e
,ThatIha uemuc hadot oknow mys e l f e .
この よ う に して 準 備 され た テ キ ス トフ ァイ ル を デー タ ベース フ ァイ ル (DBF)に読 み込 み、分析 に必要 な一種 のデー タベ ース を作成 す るので あ る が、 このDBF作成 には次 の ような コンピュー タ機器 とソフ トウェア を利 用
した。
コンピュータ
NEC PC9801RA
プ リンタEPSON VP1 600
TAS
(私家製 テキス ト分析 プログラム)dBASE I H PLUS ( As ht on‑ Tat e)
Qui cksi l ver
(Wor dTec h)
(コンパイ ラ)(18)
Th eGo v e mo ur
で あれ ば各巻毎 に、Marl oweと Shake s pear e
の劇 、それ にSpar kの物語 の場合 には作 品毎 にテキス トフ ァイル を読 み込 み、単語単位
に分解 し、テキス ト名、ペ ー ジ (劇 の場合 にはAc t
とSce ne)
、それ に行番号 をつ けたデー タベ ース フ ァイル を中間 デー タ として作成 す る。 この中間 デー( 1 8 ) dBASE I I IPLUSと Qui c kSi l ve r
はTASを運用する上では必要ない。TAS
作成に利用 したソフ トウェアである。ただし、前者 はデータの検証並びに一部の 分析にダイレク ト・コマンドで利用 している。190 人 文 研 究 第
83
輯夕で は、テキス トファイルで は単語 に付随す るクオーテー シ ョン ・マー クや ピリオ ドや記号等 は単語 か ら分離 され、他 の ファイルにまとめ られ る。 この 中間 データ を基 に、
The Go v e mo ur
で あれ ば3
巻 を、劇作 品 の場 合 に はMar l owe6
編、Shake s pear e5
編 の作品 をひ とま とめに して、 それ ぞれ最 終的 なデータベースが作 られ る。このデー タベース は主 として、アル ファベ ット順 に並べ られ、使用頻度 とコー ドのついた、単語 リス トのファイル と、単 語 の コー ドと出現位置 を登録 した位置 ファイル とか ら構成 され る。 その他、
セ ンテンスの リス ト、ハ イフン語 リス ト、句読点 リス ト
、Spe e c hPr e f i x
の リ ス トな どのDBF
もこの とき同時 に生成 され る。分析 や参照 のために利用 され る
Wo r dl i s t
、Wor di nde x、Conco r da nc e
の 作成 に必要 なデー タベース は以上 の ようにテキス トファイルか ら中間データ 作成、 デー タベース構築 の ように2
段 階 に分 けて作 られ るが、 これ らの処理は
TAS
で はテキス トファイル名 と目的 とす るデータベース名 を指定す るだ けで、後 はすべて 自動的 に実行 され る。
2.使 用 テ キ ス ト概 観
細 かい分析 に入 る前 に分析 ・比較 の対象 として使用 したテキス トの規模 な どを概観す るために、 ここで、作 品それぞれの出版 の体裁 とペー ジ数、 テキ ス トの行数、総語数、異語数 について まとめてみた。次 の表 1の ようになる
。
テキス ト名 には
TheGo v e r no ur ( ELT)
、BookI( GVl )
、BookI I( GV 2
)、BookI I I( GV 3)
のように省略 して記 し、Mar l o we ( MRL)
の作 品 は概 ね最初 の3
文字 を省略形 とし、Shake s pe ar e( SHK)
はC. T. Oni o ns
の 省略形 を利用 した(19) 0 Spar k ( SPK)
は、ThePr i meo fMi s sJ e anBr o di e
( PJB)
、TheGi r l so fSl e nde rMe ans ( GSM)
、The Go ‑ a wa yBi r d ( GAB)
、ThePo r t ob e l l oRo ad ( PBR)
、TheDar kGl a s s e s ( DGL)
の ように略記 し( 19) C.T.Oni o n s ,A Sh a k e 申e weGl o s s a 叩 ( Re vi s e dbyRo be r tD.Ea gl e t o n
,0Ⅹf o r d,1 9 8 6 ;r p r n t d.1 9 8 9 )
を参照。El yo t 、Ma r l o we 、Sha ke s pe a r e
の語柔分析 と比較191
表 1 テキス トの規模Te xt s
体裁pp.
ll. T. W. D. W.
ELT( 1 5 3 1 ) Quar t o 5 1 5 1 0, 4 1 1 1 01, 8 8 3 9, 5 5 2 GV1 2 01 4, 0 81 3 9, 7 9 1 5, 5 5 2 GV2 1 3 7 2, 7 1 7 2 6, 9 3 2 4, 2 6 6 GV3‑ 1 7 7 ‑ 3, 6 1 3 3 5, 1 6 0 5, 0 5 3
MRL DⅠ D ( 1 5 9 4 ) Quar t o 4 1 5 8 2 1 4, 1, 3 8 3 1 0 4 1 0 1 7, 3, 41 9 3 8 6 1 0, 2, 7 8 5 4 2 6 J EW ( 1 6 3 3 ) Quar t o 7 6 2, 5 8 3 . 1 9, 0 0 9 3, 2 0 6 1 TA ( 1 5 9 0 ) Oc t a vo 7 0 2, 4 2 2 ̲ 1 7, 8 5 6 3, 6 0 9 2 TA ( 1 5 9 0 ) Oc t a vo 7 0 2, 4 4 4 1 8, 2 5 9 3, 5 7 3 EDW ( 1 5 9 4 ) Quar t o 8 2 2, 8 5 3 21, 4 3 7 3, 4 0 0 FA
U( 1 6 0 4 ) Quar t o 6 8 2, 2 1 4 1 6, 91 7 3, 2 6 3 SHK( 1 6 2 3 ) Fol i o 1 0 9 1 3, 5 01 1 0 4, 3 2 4 9, 5 8 4 TN 21 2, 5 8 5 1 9, 8 9 4 3, 3 61 MAN 21 2, 6 7 6 21, 1 5 0 3, 2 2 7 MV 2 2 2, 7 4 0 21, 3 7 6 3, 5 01 1 H4 2 6 3, 1 8 5 2 4, 6 81 4, 1 4 3
SPK PJB ( 1 9 61 ) 1 8 c m 3 1 6 2 3 4
l4, l, 6 2 3 3 6 2 1 0 3 3, 9, 0 7 3 4 4 4 9, 5, 0 1 9 81 4 GSM ( 1 9 6 3 ) 1 9 c m 1 3 6 1, 1 0 5 3 3, 1 7 3 4, 9 01 GAB( 1 9 5 8 ) 2 0 c m 5 8 1, 8 7 6 1 7, 01 6 2, 9 3 0 PBR ( 1 9 5 8 ) 2 0 c m 2 8 8 91 8, 21 3 1, 81 1 DGL( 1 9 6 1 ) 2 0 c m 1 7 5 3 2 4, 8 8 8 1, 1 1 4
た。テキス ト名 の後 の括弧書 きの数字 は出版年 を表 し
、Mar l owe
の作品の出 版年 はFr edsonBower s
による( 20)
.また、ペ ージ数 は、TheGo v e mo ur
につ いて はFacs i mi l e
版( 1 9 7 0 )、Shake s pear eも Facs i mi l e
版( 1 9 0 2 )
によるが、Mar l owe
だけはBower s
の校訂が施 されているのでCambr i dge
版 のペ ージ 数 を入れてある。 これ らの本 の体裁 とページ数 によって印刷 されたテキス ト( 2 0 )
注 (8
) を参照。192
人 文 研 究 第8 3
輯の大体 の大 きさが知 られ るで あ ろう
。 TheGo v e mo ur
は四つ折 り本 で延 べ515ペ ー ジ
、Shake s pe ar e
の5編 の劇 は二 つ折 り本 で 109ペ ー ジにな る( 2
1)0Spar k
の場合 は本 の高 さで表示 したが、合 わせ て363ペ ー ジにな る.しか し、この表 に示 した行数 は印刷 のそれで はな く、 テキス トファイル上 で純粋 にテ キス トとして数 え られ る行数 を表 し、空 白行 や
Spe e c hPr e f i x
だ けか らな る 行 な どは含 まない。総語数 (T.W .)はテキス トに用 い られてい る全 ての語 の 延 べ数( t oke n)
で、異語数( D. W. )
は同形 の語 が何 回出現 して も1
としてしか数 えない場 合 の異 な り語
( t ype)
の数であ る。
前 に も触 れ た ように、
Mar l owe
とShake s pea r e
の作 品 はTheGo v e r no ur
の総語数 101,883語 を目処 に選 ばれてい るが、結果 としてSha ke s pear e
で約2,500語
、 Ma r l owe
で は約5,500語、TheGo v e r no ur
よ りも多 くなっている。しか し、興味深 い ことには、 これ らのテキス トをその使 用文字数 に よって比 べ る と、
TheGo u e r no u
rは476,275文字 を使 用 してお り、Shake s pe ar e
の422,526、
Mar l owe
の462,144、 さ らにSpar k
の442,678よ りも多 い ことに な る( 22
)。従 って、総語数 で は他 の2
人 に劣 るが、われわれが書物 として接 す る ときのテキス トの大 きさ として は十分比 肩 しうる規模 を有 してい る とい え る。
3
.文 の長 さ と語各作家 あ るい は作 品の特徴 を把握 す るために文 の長 さ と語 の長 さについて 調 べてみた。文 の長 さは
1
文 に含 まれ る語 の数 で、又語 の長 さは語 中の文字 数 に よって測 る。
平 均語 数 だ けで は、劇 作 品 の場 合 に は ト書 きの̀ Exi
t'や(21)面白いことに
Fi r s tFo l i o
のlHe m 3 JZV
には記 されたページ番号に2ページ 分欠けているところがあるが、ここに上げた数字 は実質のページ数である。同様 に他の作品にも番号を飛ばしているところがあるが、重複 しているところもある ので最終的には見かけのページと実質のページ数 は一致する。(22)これ らの文字数 はデータベースファイル として作成 された後の単語 リス トか ら算出しているのでハイフンやアポス トロフィ、句読点や記号 は含 まない。
El yo t 、Ma r l o we 、Sha ke s pe a r e
の語桑分析 と比較193
̀ As i de'
な ども1
文 を構成 してい ることにな り、しか もその頻度 も高いので、この調査 の ように特 に散文 の作品 と比較 す る場合 には正確 な指標 とはな らな い。 そ こで、平均 の語数 ばか りでな く、 それぞれの長 さの文 の頻度 も調べて みた (表 2a)。語 の長 さについて もそれぞれの文字数の語 の頻度 を調 べてみ ることにす る
。
表
2a
文の長 さと頻度l e ngt h ELT MRL SHE SPK 1 ‑ 5 4 9(1 . 8 4 ) 1 , 3 1 2( 2 1 . 3 5 ) 1 , 7 6 0( 2 7 . 5 1 ) 1 , 4 2 4( 2 0. 2 6 ) 6 ‑1 0 1 5 0(5. 6 2 ) 1 , 8 4 9( 3 0. 0 8 ) 1 , 6 0 6( 2 5 . 1 0 ) 2, 0 0 4( 2 8. 5 2 ) l l ‑1 5 2 4 2(9. 0 7 ) 6 1 7( 1 0. 0 4 ) 7 6 6( l l . 9 7 ) 1 , 2 1 9( 1 7. 3 5 ) 1 6 ‑2 0 2 9 2( 1 0. 9 4 ) 6 3 8( 1 0. 3 8 ) 6 4 0( 1 0. 0 0 ) 8 1 1( l l. 5 4 ) 2 ト 2 5 2 5 9(9. 7 0 ) 4 2 0(6. 8 3 ) 4 1 8(6 . 5 3 ) 5 3 4(7. 6 0 ) 2 6 ‑3 0 2 8 7( 1 0. 7 5 ) 2 7 8(4. 5 2 ) 2 8 6(4. 4 7 ) 3 1 3(4. 4 5 ) 3 1 ‑3 5 2 2 9(8. 5 8 ) 2 8 2(4. 5 9 ) 2 1 8(3. 4 1 ) 2 3 2(3. 3 0 ) 3 6 ‑4 0 2 1 2(7. 9 4 ) 1 5 4(2. 5 1 ) 1 6 2(2. 5 3 ) 1 7 1(2. 4 3 ) 4 1 ‑4 5 1 6 7(6. 2 6 ) 1 2 5(2. 0 3 ) 1 3 5(2. l l ) 1 1 0(1 . 5 7 ) 4 6 ‑5 0 1 5 3(5. 7 3 ) 1 1 3(1 . 8 4 ) 8 2(1 . 2 8 ) 6 6(0. 9 4 ) 5 1 ‑5 5 1 2 0(4. 5 0 ) 7 8(1. 2 7 ) 6 6(1 . 0 3 ) 4 6(0. 6 5 ) 5 6 ‑6 0 8 7(3. 2 6 ) 5 7(0. 9 3 ) 5 3(0 . 8 3 ) 2 9(0 . 4 1 ) 6 ト 6 5 8 1(3. 0 3 ) 5 1(0. 8 3 ) 3 1(0. 4 8 ) 1 7(0. 2 4 ) 6 6 ‑7 0 6 0(2. 2 5 ) 3 3(0. 5 4 ) 3 9(0 . 6 1 ) 1 6(0. 2 3 ) 7 1 ‑7 5 3 9(1. 4 6 ) 2 6(0. 4 2 ) 2 7(0. 4 2 ) 8(0. l l ) 7 6 ‑8 0 4 8(1. 8 0 ) 1 7(0. 2 8 ) 1 8(0. 2 8 ) 4(0. 0 6 ) 8 1 ‑8 5 3 8(1 . 4 2 ) 2 1(0. 3 4 ) 1 8(0 . 2 8 ) 9(0. 1 3 ) 8 6 ‑9 0 2 9(1 . 0 9 ) 2 3(0. 3 7 ) 1 6(0. 2 5 ) 6(0. 0 9 ) 9 1 ‑9 5 1 6(0. 6 0 ) 8(0. 1 3 ) 8(0. 1 3 ) 3(0. 0 4 ) 9 6 ‑ 1 0 0 2 3(0. 8 6 ) 5(0. 0 8 ) 1 0(0 . 1 6 ) 1 ( 0. 0 1
)1 0 ト1 0 5 1 3(0. 4 9 ) 3(0. 0 5 ) 5(0. 0 8 ) 1(0. 0 1 ) 1 0 6 ‑ 1 1 0 1 3(0. 4 9 ) 5(0. 0 8 ) 4(0 . 0 6 ) 0 ( 0. 0
0)1 1 1 ‑ 1 1 5 l l(0. 4 1 ) 5(0. 0 8 ) 6(0 . 0 9 ) 2(0. 0 3 ) 1 1 6 ‑ 1 2 0 7(0. 2 6 ) 4(0. 0 7 ) 3(0. 0 5 ) 0 ( 0. 0 0 ) 1 2 ト 4 4(1. 6 5 ) 2 2(0. 3 6 ) 2 1(0 . 3 3 ) 1(0. 0
1)To t a l 2 . , 6 6 9( l o o. 0
1)6, 1 4 6( 1 0 0 . 0 0 ) 6, 3 9 8( 9 9. 9 9 ) 7 , 0 2 7( 9 9. 9 8 ) T. W. 1 0 1 , 8 8 3 1 0 7, 4 1 6 1 0 4, 3 2 4 1 0 3 , 0 3 4
括弧 内の数字 は各 テキス トの文 の合計 か ら見 た百分率 を表す。
194
人 文 研 究 第83
輯文 の長 さは
A. Q. Mor t on
がLi t e m7 7 De t e c t i on
の中で利用 した文 の長 さ の集計法( 23)
に基 づいて、語数1
か ら5
まで、6
か ら1 0
までの ように5
語刻 み で まとめてある。ただ し、1 2 1
語以上 の長 さの文 は‑ まとめにして表示 した。この表か ら分か るように、平均語数 の長 さ として は
Spa r k
が1 4. 6 6
で一番短 く、El yo t
は平均3 8. 1 7
語 の長 さの文 を使用 してお り、Ma r l o we
の1 7. 4 8
語、Shake s pe ar e
の1 6. 31
語 よ りも長 く、他 の3
者 の2. 2 ‑2. 6
倍 の長 さである。また、他 の
3
人 は1 ‑ 5 、6 ‑ 1 0
の一番短 い方の文 を約5 0%
の割合 で使用 してい るのに対 し、El yot
は1 6 ‑ 2 0
の文 を最 も多 く使用 し、前2
者同様 に過半数 を越 える ところまで頻度 の高い順 に選 んで行 くと、l l ‑1 5
か ら3 6 ‑ 4 0
までにな り、1 5 0
語 を越 える特 に長 い文 も1 9
回見 られ る。
この傾 向 は、興味深 い ことに作 品毎 に( El yo t
は各巻毎 に)見 た場合 も変わ らない( Appe ndi x I
の表A
を 参照)。従 って作品の傾 向 とい うよ りは作者 の特徴 を表す もの と考 えられ る0 ちなみにEl yo t
の最 も長 い文 は2 7 5
語で2
回使用 されてい る。Shake s pe a r e
も2 7 1
語 とい うEl yot
に匹敵 す る よ うな長 さの文 を使 ってい る。
しか し、El yot
の文が他 の2
人 に比 べて長 いの は、散文 で書かれ、しか も論文である こ とを考慮 しなければな らない。 しか も、劇 には比較的短 い ト書 きが多 く使 わ れている ことも考 え併 せ るべ きであ ろう。 そ こで、 もう少 し細 か く見 るため に3
人 の作者が最 も多 く使 ってい る文 を頻度 の高 い方か ら順番 に1 0
位 まで 拾 い出 してみる と、El yot
は2 7
語か ら成 る文 を最 も多 く用い、最 も短 い文 は1 4
語で ある。それに対 し、Ma r l owe
は1 6
語が一番長 く、Shake s pe a r e
はす べて1 0
語以下 の文 である (表2
b)0Mar l o we、Shake s pear e
に共通 して語数1
、2
、3
、4
の文が入 ってい るが、これ は短 い ト書 きと関係が あるか も知 れない。ト書 きに多 く用い られ、しか も頻度 も高 い と考 えられ る
̀ e xi
t' 、̀ e xe un
t' 、̀ e nt e r
'、̀ a s i de'
の4
語 に限っ てその頻度 を調べ る と下記 の表3a
の ようになる。
勿論 これ らの語が全 て ト( 2 3 )Li t e r a 7 yDe t e c t i o n ( Ne wYo r k,1 9 7 8 ) 、p p. 4 6 1 4 7 .
El yo t 、Ma r l o we 、Sha ke s p e a r e
の語桑分析 と比較195
表2b
使用頻度の高い文の長 さELT MRL SH拡 SPK
Fr e q . Le n. Fr e q. Le n. Fr e q . Le n. Fr e q . Le n.
7 0(2. 6 2 ) 2 7 4 8 8(7. 9 4 ) 8 4 9 7(7. 7 7 ) 4 4 4 7(6. 3 6 ) 6 6 7(2. 5 1 ) 2 6 4 5 7(7. 4 4 ) 9 3 6 0(5. 6 3 ) 2 4 3 2(6. 1 5 ) 7 6 3(2. 3 6 ) ◆2 3 4 0 0(6. 5 1 ) 7 3 5 5(5. 5 5 ) 8 4 1 8(5. 9 5 ) 5 6 2(2. 3 2 ) 1 7 3 3 2(5. 4 0 ) 4 3 4 8(5. 4 4 ) 9 4 0 3(5. 7 4 ) 8 6 2(?. 3 2 ) 1 8 2 9 4(4. 7 8 ) 6 3 4 5(5. 3 9 ) 6 3 9 5(5. 6 2 ) 9 6 0(2. 2 5 ) 1 6 2 8 6(4. 6 5 ) 2 3 4 2(5. 3 5 ) 5 3 8
1(5. 4 2 ) 4 5 9(2. 2 1
)1 9 2 7 2(4. 4 3 ) 1 3 0 6(4. 7 8 ) 7 3 2 7(4. 6 5 ) 1 0 5 8(2. 1 7 ) 2 1 2 2 2(3. 6
1)3 2 9 3(4. 5 8 ) 3 2 9
1(4. 1 4 ) l l 5 6(2. 1 0 ) 1 5 2 1 0(3. 4 2 ) 1 0 2 6 8(4. 1 9 ) 1 2 8 6(4. 0 7 ) 3 5 5(2. 0 6 ) 1 4 2 0 3(3. 3 0 ) 1 6 2 5 2(3. 9 4 ) 1 0 2 5 3(3. 6 0 ) 1 2 6 1 2( 2 2. 9 2 ) 3, 1 6 4( 5 1, 4 8 ) 3, 3 6 6( 5 2. 6 2 ) 3, 6 3 3( 5 1. 7 0 )
書 きに用 い られて短 い文 を作 ってい るわ けで はないが、 そのか な りの部分 は 短 文 を増 加 させ て い る と思 わ れ る
.
念 の た め に この うち一 番 頻 度 の高 い̀ e nt er'
は、文 の長 さ もい ろい ろな例 が考 え られ るので、 この語 が含 まれ る文 の長 さを調べてみた。 TAS
で はある特定 の語 についてそれ を含 む文 を画面上 で見 なが ら、 その語 の性質、機能 な どを入力 し、性質、機能別 に集計 す る ことがで きる機能 を備 えてい る
。
この機能 を利用す る とこの種 の調査 は比較 的 容易 であ る。それ によれ ば、Marl oweと Shakes pear e
で は、̀ ent er'
を含 む文 の長 さは表3bの よ うにな り 、Mar l owe
で約半数が、またShakes pear e
で は表
3a
ト書 きに多い語の頻度 表3b en t er
を含む文の長 さWor ds MRL SHK
e xi t 1 1 1 8 6 e xe unt 1 6 3 8 5 as i de 3 3 8 2 3 4 To t al 6 9 2 4 1 5
Le n. MRL SHK
1 0 1
2 5 3 6 4
3 4 6 2 4
4 4 0 3 9
5 2 8 2 3
6 1 71 8 3
To t al 3 3 8 2 3 4
196
人 文 研 究 第8 3
輯 3分 の2が5語以下 の短 い文 に含 まれてい る。各作 品毎 に最 も多 く使 われてい る文 の長 さを見 てみ る (AppendixI表 B)
と興 味深 い ことが分 か る。MarloweとShakespeareで は上位 の10番以 内 は 殆 ど変わ らない。特 にShakespeareで は順位 は多少変 わ るが 5編全 て におい て 1語 か ら10語 までの文 が 占めてい る。Marloweで は総合 テキス トで最 も 頻度 の高 い
7、8、9
語 の文が順番 が入れ替 わ りなが らも6
編 中FA
U を除 いた
( 23)
5編 でや は り上 3位 を占め (ただ し、 2TAで は7語文 が 15語文 と同 位 )、最 も多 く使 われ る文 の長 さは8語 で ある。Shakespeareで は4語 の文 とい うことにな り、作品 によってあ ま り変わ らない ところか ら作 品 とい うよ り は作者 の特徴 を表す もの と考 えて よいので はなか ろうか。しか し、Elyotで は それ ほ どはっ き りした特徴 は現れていない。総合 テキス トで上位 の26、27語 文 、それ に
1 8
語文 が各 テキス トで も比較的上位 に入 ってい るのが分 か る程度 で ある。
Elyotの場合長 い文 を多 く使 ってい るため に語数 は他 の2人 とほぼ 同 じで も、文 の数 は半分以下 に しか な らない。 その結果頻度 の差 が余 り大 き くない (総合 テキス トで も1位 と10位 の差 はわずか に19回で あ る) ので、はっ きりした特徴 が出 ない とも思われ る。 もしそ うだ とすれ ば、 もっ と多 く の テ キス トを追加 す れ ば差 が 出 て来 るか も知 れ な い。 しか しなが ら、
The Go u e r no ur
に関す る限 りで は、Elyotはい ろい ろな長 さの文 を、しか も比較 的 長 い文 を使 うところか ら、い うなれ ば丘原型 の分布 を示 し、他 の3
者 はいず れ も、比較 的短 い文 を集 中 して使用 し、長 い文 は極端 に少 ないので、懸崖型 にその分布 の特徴 が あ る とい える。
長 さか ら見 た文 の分布 の この傾 向 は図1
に示 したグラフに顕著 に現れ てい る。次 に、Elyot、Marlowe、Shakespeare、Sparkの4人 が使用 してい る語 の
( 24)
FAU はMarloweの作品の中で も最 も本文の異同の激 しいテキス トである(BowersのFAU の̀Textuallntroduction'を参照)ことと関係があるか も知れ ないが今 はその検討の余裕 はないし、上位 10位に入っている文の種類 は総合テ キス トと大 きく変わってはいないのでそこまで考 える必要 はないのか も知れな
い 。
El yo t 、Mar l o we、Shake s pe ar e
の語桑分析 と比較197
単 位 ・千
5 1 5 2 5 3 5 4 5 5 与 6 5
7 5 8 595
日 は 1 15 12 11 0 2 8 38 40 5 9 6 8
71I 809日 IBB
I18 12 E )‑ ELT . ・ ・ ・ ・ ・nR
L ‑‑I SH
I( ・一一SPK
図
1
長 さから見た文の分布長 さについて比較 してみ ることにす る
。
語 の長 さは語 に含 まれ る文字数で測 るが、 アポス トロフィやハイ フン、 それ にワー ドラップの空 白は文字数 とし て算入 していない。例 えば、' e m、Bi l i a‑ bor z a、GadsHi l
l等 はそれぞれ2
文 字、10文字、8
文字 の長 さ として計算 され る。
文 の長 さ と同様 に平均文字数 だけでな く、 それぞれの長 さの語 の使用頻度 を異語数 と総語数 の両方 の場合 についてその分布 も調べてみ る と表4
のようにな り、 この表 に基づいてグラ フを描 くと図2
のようになる。El yot
は異語数で平均7. 5 8
文字、総語数で4. 6 7
文字 の長 さの語 を使 い、4
人 の中で は最 も長 く、Mar l o we
の6. 6 6 、4. 3 0
文字、Shake s pe ar e
の6. 6 4
、4. 0 5
文字 と較 べ る と、それぞれMar l o we
よ り0. 9 8、0. 2 7 、Shake s pear e
より
0. 9 6、0. 6 2
文字 も長 い ことになる。同 じ散文 のSpar k
の平均 の長 さ( 7. 0 3 , 4. 3 0)
と較べてみて も0. 5 5、0. 2 7
の差が見 られ る。各作家 の最 も多 く用い る 語 の長 さは、異語数で較べ ると、El yot
は7
文字語、 Shake s pear e
とMa r l owe
は