第5章GAJ助詞項目の共通語化パターン
5.1.目的
本章と第6章では,GAJにおける共通語の分布パターンを多変量解析である数量化 3類を用いて共通語化の構造について分析を進めたい.GAJの項目による性格の違い を考慮して,助詞項目を主とする第1集と,活用形項目を主とする第2・3集の分析は 別個におこなうこととした.
5.1.1.研究の位置づけ
本章では,助詞項目が主体であるGAJ第1集における共通語形の分布パタv・一一・ンの計 量的分析をおこなうことが目的である.
語彙における共通語形の分布パターンの研究としては,第2章で示したLAJ r河西 データ」について因子分析を適用した井上・河西(1982)がある.また,文法項目につ いては,GAJの予備調査である『表現法の全国的調査研究』(国立国語研究所1979)か
ら39項目をデータベー一一一・一一ス化して数量化3類を適用した井上(1983)などがあり,助詞項 目も含まれている.
本章で用いるGAJ第1集のデータの計量的分析は,限定的ではあるが沢木(2002)に よっておこなわれている.GAJデータの計量的分析は,第4章でも述べたように,ほ とんど用いられていない.そのわずかな分析の中で,沢木(2002)は,GAJ第1集を用 いているため,唯一の先行研究ということができる.
沢木は,コンピュータの統計ソフトの項目上限の都合上,全807地点によるクラス ター分析が不可能であったため,サンプリングによって100地点のデータを抽出した.
そして,100地点についてGAJ第1集60項目の地点間類似行列を作成し,クラスター 分析をおこなった.
結果のデンドログラム(図5−1)から,「琉球(主にA)/九州(主にB)・東北(C)/それ 89
以外(DEFG)」という形で,「周辺」対「中央」の対立構造が明らかになった.しかし地 理的分布の説明は曖昧な表現にとどまり,沢木自身は,
「中央」の内部は,D以下のグループの地理的な正確付けが明確でないために,デンドログ ラムのパターンを地理的に表現することが不可能である.(p.442)
「このデンドログラムから得られた結果は方言区画論とはうまく整合しないようにも見え る」(p.442)
と,分析結果に対して消極的な意見を述べている.
全国で100地点のランダムサンプルであるため,岡山,島根で5地点,岩手で4地 点が選ばれている反面,東京,神奈川,大阪,奈良では地点が選ばれていない,とい
う偏りが生じている.それにもかかわらず都道府県単位で分析をおこなっているため,
解釈は明確にならなかったのではないかと思われる.
距離
P3∧∪5ハU 5
A B C D E F G
図5−1・沢木(2002)によるデンドログラム
しかし,この沢木の結果について,井上(2002.9)が地図化をおこなった(図5−2).
そして,「ちょっと大胆だが」と前置きしながらも,「中央」(図5−1のDEFG)の中に,
さらに「周辺」(DE)と「中央」(FG)の対立構造を読み取れるとして,一定の評価を与 えている.ランダムサンプリングであるため,都道府県単位で分類するよりも地点の 位置そのものに注目した地図化からの分析のほうが,傾向をつかみやすいであろう.
井上,沢木の両者ともGAJ第1集の個々の図からは,デンドログラムと同じグルー 90
プ分けの地図はなかったとしている.
これは多変量解析の特徴でもあり,井上はGAJデータに対して初めて多変量解析が 適用されたという点も踏まえ,成果を強調したとも考えられる.
本章では,先行研究を踏まえ,共通語使用という別の観点から同じデータを分析す ることで分布構造の解明を試みる.
三駕・83脳
89●96
99●一●
A ;一
B2
土♂
ぢ・s
訂
図5−2・井上(2002.9)による沢木のクラスター分析の解釈
91
5.1.2.共通語データの作成
データ作成の手続きや,主な問題点については,第4章ですでに述べたとおりであ る.ここでは第1集固有の処理について述べる.
5.1.2.1,語形の統合
第1集は助詞や助詞に準じる形式について尋ねている.そのため後続する動詞部分 などの違いは,語形上の対応がある場合は,地図上でも統合されている.しかし第4 図の「〜が飲みたい」においては,「ノモーゴタル」のように「〜タイ」と異なる語形 に別の記号が割り当てられている.この点については,本研究では助詞部分のみを考 慮して統合した.また第50図「くらい」については,見出し語は「くらい」だが,「ぐ
らい」も共通語形とみなした33.
5.1.2.2.分析対象外の項目
第1集は60項目からなるが,6項目を分析対象外とした.これは助詞に接続する形 式を尋ねる場合に,助詞以外の要素を含んだ地図も存在するからである.第8〜9図「そ んなことを」では,「そんな」の部分が単独の地図(第8図)になっている.また,第 33〜34図「だから」と第34〜35図「なので」についても助動詞部分の「だ」(第34 図),「な」(第36図)が地図化されている.この3図は分析から除外した.
さらに助動詞単独ではない「ことを」(第9図),「という」(第32図),「誰やら」(第 57図)の3図は助詞以外の形式についてもあわせて地図化しているため除外した34.こ の点に関しては,後述する活用形項目とは異なる.
以上から,本章ではGAJ第1集より54図のデータを分析に使用した.
33グの部分が鼻濁音の場合も統合した.
34第8章の語形間距離を求める際には音声内容を用いており,第13図「おれの」について,音 声内容からは自称詞部分の除外が困難と判断し,分析から除外した.そのため,第8章では,GAJ 第1集のデータは53図からなる.
92
5.2.重心グラフ法
県別の単純集計については第4章で示した.単純集計の結果(図4−4)から,助詞項 目の共通語形の地域分布をみると,琉球,東北,九州の周辺の3地方で共通語化の度 合いが低く,中央部の共通語化が進んでいる(4.5.1節参照).
単純集計からさらに踏み込んで,GAJ第1集54図の個々の共通語形の分布状況を把 握するために,井上(1996.4)によって提唱された「重心グラフ法」を適用する.重心 グラフ法については第2章で説明したように,各項目における使用者の地点の平均位 置である重心と,各項目の共通語形使用率を組み合わせたグラフである.使用率が分 布域の広さと相関関係にあると考えられるため,各項目の使用域の勢力範囲を知るこ
とができる(井上2001).
本研究では,各項目の経度を横軸に,使用率を縦軸にとった散布図を作成する.GAJ デー・一一iタは,第4章の表4−1で示したように,地点番号と語形という対応になっている.
地点番号は緯度・経度と対応関係に変換できるため,地理的な位置関係との変換は容 易である.また,日本列島の形状が細長く直線的であるため,地理的な位置を緯度も
しくは経度のみで表現しても大きな支障はないと考えられる.
経度から計算した各項目の分布重心と,共通語使用率の散布図である「重心グラフ」
を図5−3にあらわす.使用率が高くなれば,それだけ全地点での重心に近づくため,
グラフの全体として山型の形状をなす.例として図5−4に「(大工)に(第23図;以 下地図番号のみ示す)」の共通語形の分布を示す.
そのため,周圏分布と中央のみの分布の区別がつかないという問題点がある.しかし 第1集には,共通語形で周圏分布を示す語形はないため,図5−3で中央に位置する語 形は,基本的には図5−5「(おれ)を(7)」のように関東から関西にかけて分布するよ
うな語形である.
93
100%
90%
80%
70%
60% 一
雀,。、
40%
30%
20%
10%
0%
134
:elwaで
●neosapee!一 i 5泥棒の
e1maに纏鍵でも ゜6繍ミ
.哺,°縄縦
●2c S京に
♂4脇擢紺o緩封こ
●4酒が飲
●56やら:
135 京136 137 138 139 東140
都 平均経度 京
図5−3・重心グラフ法によるGAJ第1集の共通語形分布
141
使用率が低い語形になると,中部地方の分布がやや薄れ,左右(東西)に散らばる.
左側に集まっている語形は西日本を中心として用いられている語形(図5−6「(東京)
に(20),図5−7「一やら一やら(58)」など),右側に集まっている語形は東日本を中心 として用いられている語形(図5−8「おれの(13)35」,図5−9「(子供)(な)ので(37)」な ど)ということがわかる.
全体的にみて,西側のほうで使用率が高く,使用率が著しく低い項目の多くは東側 に位置している.東日本だけで使用されている語形は,共通語形であるにもかかわら ず全国的に支持されていないことがわかる.
35 ス変量解析では除外項目
94
023大工に
(なった)
007おれを
(連れて行ってくれ)
図5−4・「(大工)に」の共通語形分布 図5−5・「(おれ)を」の共通語形分布
020東京に
備いた)
図5−6・「(東京)に」の共通語形分布
013おれの
(手拭)
058筆やら紙やら
(たくさんもらった)
図5−7・「(筆)やら(紙)やら」の共通語形分布 037(子ども)(な)ので
Gtっカ、らなかった)
図5−8・「おれの(手拭)」
の共通語形分布
図5−9・「(子ども)(な)ので」
の共通語形分布
95
5.3.数量化3類の適用
重心グラフ法は多変量解析との結果の類似点がみられ(井上1996),分布構造につい ての考察に有効であるとされている.たしかにこの手法を使用すると,東西差が明確 にあらわれ,東北と九州の非共通語化部分のパターンに共通性がみられることがわか
る.
しかし重心グラフ法自体は,最初から日本列島を経度によって要約しており,東西 差という要因の存在を仮定した分析ということもできる.このため地点ごとの客観的 な区分は困難である.
井上(1986)では,GAJの予備調査項目について東西対立と周圏分布の側面を客観的 に説明するために多変量解析である数量化3類を用いている.本研究においても,共 通語形の分布パターンを多変量解析によって分析することにする.
助詞項目54項目の共通語形使用に関する行列に対して数量化3類を適用した36.す でに単純集計でみてきたように,沖縄県ではほとんどの地点で共通語回答が0に近い ため,沖縄県を入れて分析する場合に,沖縄県だけが著しく本土と離れた位置に分布 してしまう.これでは本土内部での関係がわかりにくくなることが懸念される.しか し沖縄と本土が言語的に離れているという結果もまた,日本語の歴史の上で意味のあ ることであろう.
本研究では数量化3類の計算が不可能になる欠損値のある地点を除き805地点を分 析の対象とした.固有値・相関係数を表5−1に示す.第1軸でも相関係数は約0.3と,
全体的に低いといえるだろう.
36数量化3類の計算は,群馬大学青木繁信氏のウェブサイト(http://aoki2. si. gunma−u. ac. jp)
で公開されているawkスクリプトをperlに移植して使用している.
96
軸 固有値 相関係数
1 0.09114 0.30190 2 0.06852 0.26176 3 0.05757 0.23994
表5−1・固有値・相関係数
5.4.第1軸一琉球
図5−10は,数量化3類の第1軸の話者の値を,都道府県別に集計して地図化した ものである.最大値と最小値を自動的に20段階の濃度によって出力した.大きい値の ほうが濃くなっている.
第1軸では,予想どおり沖縄県が非常に著しいマイナス値を示した.本土と琉球列 島の間に大きな隔たりがあることがわかる.奄美諸島が含まれる鹿児島県も若干値が 低くなり,マイナス値となっている.
プラス側では東北地方が高い値を示しているが,全体を見た場合には,沖縄県とそ れ以外という分け方が妥当であろう.
一13.60
図5−10・第1軸の都道府県別地図 97
語形からの分布の第1軸と第2軸による散布図を図5−11に示す.沖縄県が大きな マイナス値をつけている第1軸のマイナス側では,図5−12「(百円)ぶん(52)」が,図 から外に大きくはみだしている(値は一10.06).図から,琉球列島での広い使用がみら れることが影響しているとみられる.しかし,このほかの語形をみると,たしかに図 5−13「(酒)ガ(4)」では,琉球での使用がみられるが,図5−14「(寒い)けれども(38)」,
図5−15「(行く)のでは(17)」のように,ほとんど全国で共通語形が分布しない語形も みられる.
揖N搬
−
一1.5 ・2先i』が
・38けれども
●17のでは
゜33か
の51しか
゜tpma
・59だの一だの
・41ながら 亀4難静
゜3糠鰯の
∵蕊・㌶転
・14先生の
・26!息笥5ほど
.1A二゜3°1万円で
第1軸 40のに
θ・$7(な)ので 22仕事に
は゜35(だ}から @.54なんかi
−.;耀凝㍗
・4・劇39だ,ナど、、がて、i
・50くらい6酒を1雨がだれやら
0.S 1
3
図5−11・第1軸と第2軸の語形からの散布図 98
052百円ぶん
(ください)
.£・籔
図5−12・「(百円)ぶん」の共通語形分布
038寒いけれども
伽まんしよう)
002先生が
侠られた)
図5−13・「(先生)が」の共通語形分布
017行くのでは
(ないか)
図5・−14・「(寒い)けれども」の共通語形分布図5−15・「(行く)のでは」
の共通語形分布
逆に,第1軸プラス側の語形をみると,図5−16「(食い)ながら(41)」,図5−17「(船)
で(29)」,図5−18「(食い)ながら(15)」,図5−−19「(船)で(18)」ともに,本土に広く分 布している.図5−13「(先生)が(2)」も分布の広さからすれば第1軸プラス側に位置 するように思えるが,琉球列島での使用がみられるため,マイナス側に位置するのだ
と思われる.
以上から,第1軸はプラス側が本土,マイナス側が琉球(全国的な共通語形不使用 も含む)と考えられる.琉球での共通語形の使用地点の多い語形がほとんど存在しな いため,計算上突出してしまった,ということであろう.
99
このように,琉球のために,第1軸と第2軸による散布図を用いた解釈は困難な点 が多くなった.琉球で使用される共通語形はわずかであり,共通語形使用の多い他の 都道府県使用との関係を捉えることが難しいと思われる.
そのため,第2軸については,第3軸との散布図によって解釈することにする.
041食いながら
(歩くな)
029船で
(来た)
図5−16・「(食い)ながら」の共通語形分布 図5−17・「(船)で」の共通語形分布
015どうぽうの 028運動場で
図5−18・r(どろぼう)の」の共通語形分布 図5−19・「(運動場)で」の共通語形分布
100
5.5.第2軸一東北
図5−20に第2軸の都道府県別集計の地図を示す.第2軸においても沖縄県が突出 している.濃淡であるためわかりにくいが,第1軸よりは東北地方が濃くなっている.
第2軸は東北地方をあらわすものと予想される.
AXIS 2
一1.3573
蜴.
〆
図5−20・第2軸の都道府県別平均値
101
.ssv、一やら 2摘
| 2先{が ・5酒hM{
1÷
・一・欝畔゜鍵:_ 二
ご……ご… O三籔㌫認三1:=㌦叢評…;……∵一…1
・7俺を
゜晦⇒に・・8…:
禦㌦
2↑
●59だの一だの ・39だけど 35{だ)カ1ら
・53ごと 一3 1 i
●491まカ、り
・SO〈らい ・4
・38けれども
.5・与・
・37靭ので
一6
・17のでは ・7
図5−21・第2軸と第3軸の語形分布図
102
この点について語形からの考察をおこなう.図5−21の第2軸と第3軸による散布 図で分析をおこなう.
第2軸のプラス側には,予想した東北地方に分布する語,というよりは,九州以外 の日本に広く分布する語が特徴的である.最大値となるのは第1図で極端な値だった
「(百円)ぶん(52)」であるが,第2軸の話者の値で沖縄県が突出していることと関係 があるだろう.
その他については,東北のみの分布という語形はない.図5−22「一だの一だの(59)」
は,東日本を中心に一部山陰にもみられる周圏分布だが,全体的に回答地点数がやや
少ない.図5−−23「(お茶)でも(44)」や図5−24「(パン)でも(御飯)でも(45)」,図5−25
「(ここ)に(24)」などは,九州以外の全国に分布する語形が分布している.
059行くだの行かないだの
(ぐ ずぐず言うな)
図5−22・「(行く)だの(行かない)だの」
の共通語形分布
045パンでも御飯でも
Q子きな方を食べなさい)
044お茶でも
(飲もう)
図5−23・「(お茶)でも」の共通語形分布
024ここに
(有る)
図5−24・「(パン)でも(御飯)でも」 図5−25・「(ここ)の」に共通語形分布
の共通語形分布
103
むしろマイナス側のほうに東北地方の特徴が現れているといえる.
最小値となる前掲図5−19「(行くの)では(17)」は,使用地点の少なさから極端な値 を示したと思われるが,図5−26「(酒)が(4)」,図5−27「(雨)が(1)」など,東北地方 に広がる格助詞が無助詞となる項目が分布している.
図5−28「(何がおこる)やら(56)」や,図5−29「(買物)がてら(42)」といった東北 で使用しないだけでなく,九州で使用の少ない語形の値も高い.
以上から,第2軸は東北をあらわすものと思われるが,実際には東北単独であらわ れる共通語分布はなく,逆の東北のみ共通語形不使用,という場合のみである.
004酒が
(飲みたい)
OO 1雨が
腱ってきた)
図5−26・「(酒)が」の共通語形分布 図5−27・「(雨)が」の共通語形分布
゜56{蛾蕊るやら ・42買驚雰ら
.一..一.......・J
図5−28・「(何がおこる)やら」
の共通語形分布
一...一一...//i
図5−29・「(買物)」がてら」
の共通語形分布
104
5.6.第3軸一九州
つづいて,第3軸をみる.第3軸の値を都道府県別に集計した地図を図5−30に示 す.第3軸でも,沖縄県の値が突出してしまうため,他の地域がみな薄くなってしま
う.
琉球以外の部分をみると,九州地方の南部3県と佐賀県が濃くなっており,九州地 方に特色があることがわかる.
一1.
図5−30・第3軸の都道府県別平均値
105
図5−21の語形分布をみると,第3軸のプラス側には,九州に分布する,というよ りは東北・東日本以外に分布する語が並んでいる.これも第2軸と同様に,九州とい うよりは,西日本を中心に分布する語形,と解釈することができるであろう.
最大値である前掲図5−7の「(筆)やら(紙)やら(58)」は,図5−3からもわかるよう に,最も西側に語形の重心がある語形である.しかし九州単独の分布ではなく,西日 本一帯に広がる分布である.第2軸のマイナス側に類似して,東北にのみ分布しない 語形である,図5−31「(酒)が(5)」をはじめとする東北での無助詞表現が並んでいる.
このほかでは,図5−32「(酒)は(12)」,図5−33「(百円)しか(51)」など,基本的には 東北地方で不使用の語形が位置している.全国に広がる図5−34「(先生)の(14)」の値
も高い.
九州での使用といっても,九州のみに分布する共通語形はないことがわかる.
005酒が 012酒は
解きだ) 倣む)
図5−−31・「(酒)が」の共通語形分布 図5−32・「(酒)は」の共通語形分布
051百円しか 014先生の
(ない) (手拭)
図5−33・「(百円)しか」の共通語形分布 図5−34・「(先生)の」の共通語形分布 106
次に第3軸マイナス側をみると,全国的に使用率の非常に低い語形が並ぶ.図5−19
「のでは(17)」,図5−9「ので(37)」,図5−17「けれども(38)」をはじめ,関東から新 潟県にまばらに分布するだけの語形が多い.ある程度分布のみられる語形をみても,
図5−35「(皮)ごと(53)」や,図5−36「だけど(39)」のように,狭い分布の語形が多い.
東北の場合には,東北以外に全国に分布する共通語形があったが,九州の場合には,
九州以外に全国に分布する語形が存在しないためだと思われる.
053皮ごと
(食ぺた)
039だけど
(行かなければならない)
図5・35・「(皮)ごと」の共通語形分布 図5・36・「だけど」の共通語形分布
107
5.7.結論
以上から,助詞項目の共通語化の構造は,
第1軸 本土一琉球 第2軸 東北一非東北 第3軸 九州一非九州
(全国的に使用される共通語形)
(東日本中心に分布する共通語形)
(西日本中心に分布する共通語形)
となることがわかった.琉球・東北・九州という3つの地域的特長をもつと思われる 地域が抽出されたことだけをみれば,多変量解析によらずとも,共通語使用率の地図 である図4−4,重心グラフ法による図5−3からもわかる.東北地方と九州地方が共通 語化されていないことからして,方言形が周辺部に位置することを示すのであろう.
しかし,項目ごとの分布パターンによる分類で,東北と九州が異なる要素として分類 されたことは意味のあることと考える.
琉球と本土は大きくかけ離れており,使用語形も共通語形とは全く異なっている.
本土では助詞項目は広く共通しており,非共通語地域の分布によって,パタV・一・ン分類 されたのであろう.すなわち非共通語形が東北地方中心に分布することは共通語形が 西日本中心に分布することを表しており,同様に,非共通語形が九州以外の地域に分 布することは共通語形が東日本中心に分布することを表している.また,西日本中心 の分布のほうが,東日本中心の分布よりも中心的位置を占めることがわかった.
この結果,GAJ第1集の助詞項目は,
琉球 / 九州 / 東北 / その他(東北・九州以外の本州)
と4つに分類される.GAJ第1集の計量的分析の先行研究である,沢木(2002)のクラ スター分析や,沢木の分析に対する井上(2002.9)の解釈のとおり,本研究においても,
周圏的な分布が明確にあらわれたといえるだろう.
沢木が集計に利用したデータが方言形の地点間の一致度であり,方言形が考慮され
108
るのに対して,本研究は井上(1983)のように共通語形使用に関するデータでしかない.
しかし沢木のデータでは地点間の語形一致率という情報だけになるため個々の語形の 分布情報が消えてしまうのに対して,本研究では共通語形とはいえ,地点ごとの語形 の分布パターンの分析である.
沢木(2002)では,第1集の周圏分布では両端の語形が同一でないことを指摘し,「九 州・琉球と東北が大きくひとつにまとまるのは,まず九州・琉球などのグループがま
とまり,そのグルS・・一・・プの一部が他のグループの一部と共通の見出し語形を持つという 形でっながりができるから」としている.沢木は例として,第31図「それより」で,
九州南部と岩手県雫石町で共通するヨッカ(jokka)を挙げており,周圏分布の両端にわ ずかなつながりがあることが原因ではないか推定している.
本研究は共通語形からの分析であるが,同一の結果がみられることから,共通する 見出し語形というのは,共通語形ではないかと思われる.沢木の手法でも,本研究の 手法でも,どの語形が地点間の語形一致率に貢献しているかの検証が必要だが,全国 的に分布する共通語形によって両者は結びついているのではないかと推測される.
図5−1のデンドログラムから中央部のクラスター(DEFG)は周辺部のクラスター
(ABC)と極端に距離が離れている.すなわち,中央部では共通語形による相互の語形一 致率が高いために同一のクラスターを形成し,周辺部同士は割合としては同程度に共 通語形と一致していることが同一パターンとみなされてクラスターを形成したのでは
ないだろうか.
助詞の共通語形の多くは日本語における基礎語彙であることを考慮すると,分布域 に京都中心,東京中心といった明確な核がみえず,広域に普及が進んでいる助詞の語 形の分布状態は,かつての中央語が,東は関東まで,西は中国・四国にまで普及した 結果と考えることもできる.
もうひとつは,基礎的な語彙であるために,中央では規範が強くはたらき,辺境で しか変化することがない,という考えも可能であろう.多くが1〜2モーラで変化の 109
バリエーションが少ない助詞は,使用頻度が高い場合には変化しにくいとも考えられ る.たとえば,かつての中央語「様へ」「様に」からの変化とされる,東北・九州のサ 系の助詞(小林1994)などは,辺境に古形が残る例であるが,「へ」「二」自体も変化す ることなく用いられており,辺境での変化の例と考えることもできるだろう.
本研究は共通語形のみの分析であるが,今後は方言形を含めた分析をすることが課 題である.
110