第2部『方言文法全国地図』における共通語化過程 の分析
第2部では,国立国語研究所編『方言文法全国地図(以下GAJとも)』のデータを用 いて,日本語の文法項目における共通語化過程についてさまざまな角度から考察する.
第4章では,GAJデータの解説と全体的な単純集計に関する考察をおこなう, GAJ データは,文法項目の性格の違いから,第1集の助詞項目と,第2・3集の活用形項目
とに分けて分析することとした.前者は第5章で,後者は第6章で分析をおこなう.
各項目各地点で共通語形を使用するか否かという1/0の行列を作成し数量化3類を適
用した.
第7章では,共通語化の得点化に関して,単なる一致か否かではなく,音声記号同 士を文字列比較して回答語形と共通語形との間の距離を計算した.この「共通語度」
の行列をもとにクラスター分析を適用し,共通語形からみた全国の計量的区画をおこ
なった.
最後に第8章では,共通語形以外の東京方言,京都方言の広がりがどうであったか について「鉄道距離」の指標を用いて示し,共通語化の史的構造を分析した.
GAJの話者の平均生年は1911年であり,GAJの話者の言語形成期である1920年前 後の日本語の状態を反映していると考えてよいだろう.この時代は,江戸時代と現代 をつなぐ重要な時代である.この時代における共通語化のパターンを明らかにするこ とで,日本における共通語化の進展の過程を考察することが,第2部の目的である.
第4章『方言文法全国地図(GAJ)』の共通語形分布
4.1.目的
国立国語研究所による『方言文法全国地図(GAJ)』のデータベースについての概要 を示す.GAJは,語彙に関する全国規模の言語地図である『日本言語地図(LAJ)』(国 立国語研究所1966−74)に続く,文法事象に関する全国規模の地図として1989年から 2006年にかけて刊行されたものである.調査地点数807,調査項目267の面接調査か
ら,350枚の言語地図が作成された.
GAJは作成時から電子化を意識して作成されたため,刊行からまもなく電子データ も無償公開された.これにより全国規模の方言分布に関する計量的研究を可能にして
いる.
本章では,こうしたGAJのデ・・一一・ タについて解説し,さらに第5・6章における共通 語形の分布のデータを作成するための手順について説明する.また,共通語化使用率 のデータを用いた単純集計についても,この章で扱うことにする.そして,助詞項目 である第1集と,活用形項目である第2・3集の性格の違いから,第5章以降での分析 において分けた分析が必要であることを示す.
4.2.大規模データベースを用いた計量研究
4.2.1.これまでの研究
第2章でも述べたように,全国規模のデータベースを利用した計量的研究はあまり 多くない.国内では,1980年代に作成されたLAJ第3集のデータベースを用いたもの
として,沢木(1988)の孤例の研究や,熊谷(1996)のネットワーク法による方言区画の 研究などがあるのみである.海外では,VIERECK and RAMISCH(1997)によるイングラン
ドの方言データを用いた研究や,GOEBL(2002)によるALF(フランス言語地図)のデータ ベースを用いた研究など,方言データに多変量解析を適用した研究がさかんになりつ
つある.
かつてはコンピュータの性能の問題などから,データの情報量や,地点数,項目数 などを制限せざるをえなかったと思われる.しかしこれらの問題点は克服されつつあ る.近年は,コンピュータの性能の向上とインターネットの発達によって,巨大なデ ータの転送も容易になった,かつては整理するだけで大変であった大規模な方言資料 のデータベース化が進み,個人のコンピュータでも処理できるようになったことで,
ようやく本格的な分析段階に入ったといえるだろう.
4.2.2.GAJデータの公開と利用
GAJは,2006年春に第6集を刊行し,全6巻の刊行作業が終了した. GAJの調査デ ータは,刊行とほぼ同時に国立国語研究所のウェブサイトにて公開されている21.807 地点383項目22におよぶ大規模データが一般公開されていることは貴重である.地図 集ごとに全データが1つのテキストファイルで提供されている.
2000年のデータ公開時には,第1集では,各地点の回答語形のデータと,言語地図 での見出し語と地点の対応データとに分離されていたのに対して,第2集以降は,両
2t http://www2. kokken. go, jp/hogen/index. htm1
者が統合された1つのデータになっており,第1集と第2集以降のデータフォーマッ トが異なっていた.そのため統一して分析する場合にはデータの変換作業を必要とす るという問題点があった.
2003年以降,煩雑な処理は不要となるように,第1集のデータも同様のフォーマッ トとなった.そして2006年以降はそれまでカード形式だったフォーマットを,表形式 に変更し,さらに地図ごと分かれていたデー一一・ タを1つのデータに統合された23.従来 に比べてデ・・一・・タ処理はさらに簡単になったといえる.データ解説は十分されており,
多少のコンピュータ処理ができる人であれば取り扱いはさほど難解ではないが,依然 としてデータ処理を必要とする点で,利用の障害になっているともいえよう.
現時点ではGAJデv−・…タの数量的分析はほとんどないといってよい. GAJ第1集のデ ータベs…一・ スの作成に従事した沢木幹栄による,GAJ第1集データを利用した分析(沢木 1992,2002)がある.沢木(1992)は,1地点しか回答がない孤例の出現する地点の地理
的分布についての考察であり,GAJデ・・一一…タベv−・一・スによる集計の例といえる.
沢木(2002)はGAJ第1集のデー一一・タより100地点をサンプリングして,地点間の使用 語形の一致度行列を作成し,クラスター分析を適用する試論をおこなっている.しか
し,試論段階ということで,分析結果に対して消極的な結論を述べている.この結果 は井上(2002.9)によって評価されているものの,実質的に本格的な分析はされていな い状態といってよいだろう.沢木の研究については第5章で述べる.
しかし,近年はGAJデータのGIS(地理情報システム)における利用という観点から,
松丸(2003),大西(2004),中井(2005)などでデータの利用方法についての解説がなさ れ,研究環境は整備されつつある.
2006年にGAJ全集が刊行されると,同年に国立国語研究所の公開研究発表会で地図 作成に従事した研究者24(筆者は除く)による試論が発表され(国立国語研究所2006),
23ファイルサイズの都合上,集ごとにファイルをわけている(ただし第2集と第3集は同一ファ
イル)
24筆者はGAJの地図作成作業に関与したのみで,内容面での関与はしていない,
さらに他の研究者の分析も加えた論文集が出版された(明治書院2007).
この中で,大西(2007.9)によりGAJデータのフォーマットの解説がされている.数 量的研究としての利用としては,沢木(2007)がデータベー一一...ス処理の方法について論じ
ているほか,小西(2007)によってGAJの回答語数に関する論考や,鑓水(2007)による,
「共通語度」を計算した分析(第8章参照)がある.
また,高橋(2007)は,自身の地図作成システムSugdasでGAJデータを利用できる ように改変したGAJ−Sugdasを開発し,研究に利用している.
GAJデータに対して計量的な分析を適用した例は未だ少ないが,独自の地図の書き 直しなど,データの再利用という点では利用は増加しており,今後のさらなる積極的 な利用が望まれる.
4.3.GAJデータの概要
本研究で用いるGAJデータの概要について述べる.なお,本研究では共通語形の確 定が容易なGAJ第1〜3集のデータを用いているため,第4集以降のデータは使用して いない.そのため,本研究でいうrGAJデータ」とは,第1〜3集のデv−一・・タを指してい る点,注意する必要がある.
4.3.1.GAJ調査概要
4.3.1.1.調査項目
はじめに,GAJの調査について述べる.『方言文法全国地図(GAJ)』の調査は,1979 年から1982年にかけて実施された.調査地点数は全国で807地点,調査項目数は267
項目であった.
調査項目は,活用形,助詞,表現法の3種類がおこなわれた.項目の選定は,1976 年から実施された予備調査(180項目)の結果に基づいている.原則として,
(1) 共通語と異なる形式が一定の領域をもって分布する項目を採用する (2) 琉球(奄美・沖縄)地域にのみ地域差が認められる項目は採用しない
が挙げられている.すなわち,琉球を除く本土において地域差が出ない項目は原則と して採用されていない.これは調査効率を考える上ではやむを得ないことであるが,
GAJの項目が上記の偏りをもっているという点は考慮しなければならない.
4.3.1.2.調査方法
GAJ調査の質問形式は,調査者による質問法によって求められている.自然談話の 資料に基づくものではないため,話者の回答はあくまで使用していると思っている語 形である.実際に使用している語形が出ていない可能性がある.調査という場面自体 が話者にとって非日常的なものである点は,十分注意しなければならない.
質問法は,共通語による質問文(の一部)を方言に翻訳してもらう「共通語翻訳式」
を採用している.また,共通語形を提示することにより,方言形が出にくくなること を避けるため,調査地域で使用されると予想される方言形を調査者が誘導して提示す ることもおこなっている.そのため,アンケート的な側面も一部有している.
これに対して,共通語形を示さずに,対象語形が引き出されるような文脈を提示し て,方言形を回答させようとする「なぞなぞ式」があるが,加藤(1985)は,必ずしも
「なぞなぞ式」が方言形のすべてを引き出せるものでないことを指摘している.
GAJの調査者数は全国で73名である.一人で全地点を調査する場合には,調査方法 の基準が一定であるという利点があるが,大規模調査を短期間でおこなうことが不可 能に近い.一方,複数の調査員による場合には,その地域の方言に精通しているため,
方言形を引き出しやすい,という利点があるが,調査者ごとに基準が一定していない 可能性がある.
GAJの調査者による影響について,小西(2007)は, GAJの各項目・話者ごとの回答 数を集計し,考察をおこなっている.その結果,「回答数の多寡の分布境界が都道府県 境界に一致することが多い」ことが明らかになった.このことは,調査者が都道府県 単位で割り当てられているために,調査者によって引き出される回答の違いが大きい
ことを示唆している.
、以上のように,調査データに示される回答語形が,調査地点における言語状況をす べて反映しているわけではないことは注意すべきであろう.本研究の第9章以降では,
GAJデータと現代の方言調査データとの組み合わせをおこなっている.この場合には さらに調査時期の違いや調査者の経験の違いなども大きく影響していることを十分に 考慮しなければならない.
4.3.1.3.調査対象
調査対象である話者は,原則として1925年(大正末年)以前に生まれた男性であ る.調査当時の年齢が60〜75歳で,他の地域での居住歴がない,言語感覚が鋭く,発 音が明瞭で協力的であることが望ましいとされた.
調査地点は807地点だが,調査項目の前半と後半で話者が異なるといった地点も多 く,話者数はのべ901人である.話者の生年の構成を図4−1に示す.平均生年は1910.96 年であり,最高齢話者(1891年生まれ,調査時89歳)と,最若年齢話者(1931年生まれ,
調査時50歳)との年齢差は40年にもなる.生年のばらつきが広範囲である点は注意が
必要である,
70
60
50
40
30
20
10
0
▼−NCつ寸動口oトODσr o−−Nζつrオ』n o rN coΦo−−rv cv)寸1Ω◎〈ooΦo▼一・ CN cv)寸nζ◎トooΦoマー oσ》e)e)oΦσ}mooooooooooo▼一▼一▼一▼一▼一▼一 ▼−v−7−NNe、」ou N ou rv o∨ cJ cu co Oつ co co co co co◎O OO OO ooΦσ》oΦσ>oツσ㌃Φ◎}◎)σrσ㌻σ}σrσn o orΦσ}oor oσ}oΦOODΦor oΦo
図4−1・GAJの生年分布
4.3.2.GAJデータ概要
4.3.2.1.データ書式
っついてGAJデータの書式について述べる.国立国語研究所のサイトよりダウン ロードできるデータは表形式となっている.話者の回答1つが1レコードとなり,そ れぞれ以下の12項目の情報からなっている.
1.地図集 2.地図番号 3.質問番号 4.地点番号 5.地点コード 6.回答語形 7.注記コード 8.文章による注記 9.見出しコード 10.見出し
11.音声内容コード 12.音声内容
回答語形には,「6.回答語形」「12.音声内容」「10.見出し」の3つの段階がある.
まず話者の回答したそのままの回答が「回答語形」,次に,質問文が注目する部分を抜 き出して整理したものが「音声内容」,そして言語地図として表すために回答を統合・
整理したものが「見出し」である.
また「7.注記コード」「8.文章による注記」は,調査者による誘導や,話者による 補足(世代差,文体差,使用頻度等)の情報である.
4.3.2.2,「国研方式地点番号」
っついて方言データベ・一一一 スの基本情報の一つである位置情報について,GAJで採用 されている「国研方式地点番号」について解説する.調査地点の位置を表す手法とし て,GAJデータをはじめとする日本の言語地図の多くが,経度・緯度ではなく,この 方式を採用している.「国研方式」の名前にあるとおり,国立国語研究所が『日本言語 地図(LAJ)』を作成するために用いた方法である(国立国語研究所1957).
図4−2は,国研方式地点番号の解説の図である(大西2003).国土地理院発行の5万
分の1の地図を単位としており,日本全土は,横10×縦13の5万分の1の地図によ
って覆うことが可能である(図の上段).日本列島の最も北西の図を基準として,縦横 順番に番号を振る.琉球列島は縦の数が10を超えるが,日本列島の形状から,10の 位を省いてもても北海道と重ならない.こうして日本列島全土を10×10のコードに収め,縦横の順に2桁の数値で表す.
また各5万分の1の地図は,内部を縦横10×10に100等分し,その位置を縦横2
つの数字で示し,先の2桁とあわせて4桁の数値にする.これを5万分の1の地図の 番号としている(図の中段).
さらに詳細に100等分した番号は,地点番号の小数点以下としてあらわす(図の下 段),こうすることで,調査地点を正確な位置を表しつつ,大まかな位置を容易に知る
ことができるように工夫したものが地点番号である.GAJは全国規模であるため,2 桁ごとに3段階(=6桁)で表現されているが,地域レベルの詳細調査の場合には,さ
らに100等分した8桁の地点番号が用いられることもある.
口
!o
リロ リエド
〜o
ra
40
ぐ ロ エ み
A [・o
…汲
70
Tg 一一
− ロ−−ぽ や び ■i■チコ ロの の
0} O〜 03 1 ¢ u
〜1 .2〜 〜』
】●.7.
31
41
●t
61
1T
・..
81
Sl
・肩 ..
罷一
^ 7? .
..ウ_二..
8〜
92
1:3
1 1三.t
siH
v3−
コ コ−i o
|4
ロ−■ i
24
オ・
」4
石
5i−一
..::...
ヨ
.・
s4 Sl
・−
{
〜5
鮪
コね ,
45
シひ マロさ
s5
、 ...・.
95
…
:轍
゜9
丙
oo・l leeフ6 『
i畔1:;
/
/
● o ■ ■
■
一
堰gOo 6501 !02・一. …醐『弓
i鋸 :砧24
当ぱ!
p(Lぶ@r i8533 .榔、一 、1蜘 薗w、1竺ぼ:,ピ、 6綱3 :6644 ‡
@ .亀iρ・ .
1粋鍾 2 656, i6554 f.、.♂÷へ
さ ir 『
〜ぷ
、.聴45
。.、IL,ノ
1 、 i 、 4−一一..
酷…ー515 髄 面 68一
16 18 癒 ζ 乏6 2否
1・
、
、
、
、
、
、
■
l l 7 飴1・ 165 9:
]. i .
已聴
1 ま i醐 臼・ i l l ・一
as・V。弓勒鍋一醐幽の聴
粋dn 獅凵Ers・3 iua l eseg :as o i.v
i65 5− Sls :●5tr i i
4 1 .一
6525 …6526 . ●52,
墾il細・
i6 F
●5S6
ザ1蜘』,6島●1・1 エ ,
t
∞臼
i66「o{紡 i,
品77,
.,〜
…η
●5 i鱈65 : :
、. .1
ば
●5生.言領乃 i
5與
●
、
.●5,6 、
」
ト
一s
8
呼」
1喘…醐
595 ●5ss r
言●547 タ
i●日7
コ ら 967
.
、
蜘 ●549 1
. ; 一
寧・ノ「 56● l l
.巴レiTes i「
桔・・同
6i i6ses 1
但7 田S
鍋
㈱
i
3が
、 1ア
、s 、、
、、
、 、 、 も
、 、 、
、
、
…
uい㌔「 …
_→__、_.→_ ◆0.堰@ ∵, L▼・@ ・ 、 .仰1@ …シ
@ ・⑩ ・臼1 ・,2言
C i i l 、 塩蛛f雪 旧…・パ 顯三 ・1gi
O 1
・京当♂}諾i竃当で偶
@ .ト:・@.1.〆@・27.÷.1マ・・
@
拍i
1|ト
.裂一一一
当引ド妄習酬プ 4,
L_・_一 ..」
AD . .
G田:・.1・
C
引i屹iζ勾i⑭ 5宴フ竺 ・了Or: , :肩冝?E・1 パ、㌧
・38i ・9!
」_ユ」
v .
ξ饗. ・58i ・59: i i .:
i 60 ・1, ・62 嚇ザ唱 ●
鱗
F〉、s、
蓮:蘂: パ∴こ7} 逼ザ当 i
・ . 71i 7Z】 し ηi 74
@…
〜.:1::苓ご1ば曽.,.∧〜匂
8堅元6 ・?7.
♂i 1
・ ● ・ ! ・62 ・87 ・6 臼!
1粥 1卍 、 ・83オ ;,.酒:ロ ・亨冷,ご1:き:8 ・85
欝
揮z ・91 92 .・93ごく 饗 ・97 98 的
卍
麟
.己:・・96f.怜;:∨.〜135 45
、
、
、1鱒 10°
t36 35
4.3.2.3.経緯度への変換
GAJにおいても位置データは,国研方式地点番号によって示されている.しかしこ のコードは,国立国語研究所における言語地図作業用の独自の規格である.数量的分 析に用いる場合,縦横の情報が混在した,この方式はそのまま用いることができない.
他のシステムに互換可能な座標システム(経緯度など)への変換が必要である.単純 に座標として変換するには,
国研方式地点番号ylxly2x2y3x3(6桁の数字)の場合
x = x1 . x2 x3
y=yl.y2 y3
. ヘ小数点)
とすればよい.地点番号「368956」であれば,(6.96,3.85)という座標になる.ただ し北緯29度未満の場合, y1は10を超えるため1の位のみで表現されている.琉球 方言地域の多くが該当し,北海道とy1の値が重なるが,日本列島の形状により,y1 が0,1,2のときに,北海道(x1;6以上)と琉球(x1=3未満)でx1の値が重なることはな い.すなわち「126116」は,(2.16,1.61)ではなく,(2.16,11.61)となる25.
このようなシステム固有の例外処理は,他の座標システムでの利用を考えると望ま しいものではない.地点番号を座標と対応させるのであれば,xo, yOをもうけて,8 桁化するのが望ましいだろう26.
座標から経緯度情報へは以下のように容易に変換可能である27.なお,前述のy座 標の例外処理(y1が0,1,2の場合のy1への10加算)はなされているものとする.
25LAJ, GAJでは北海道と琉球列島は実際とは異なる配置となっている.視覚的に地理的連続性 が保たれなくなる問題が,方言学において北海道方言と琉球方言は本土方言と分けられることが多 く,スペースの節約を優先させてもさほど支障はない.
26それでも日本専用という点でも汎用性に欠けている.
27大西拓一郎「国立国語研究所『調査地点番号システム』の経度緯度座標化」
http://www2, kokken. go. jp/〜takoni/GISME/from_chiten_no_to_xy. htm
に解説がある.地点番号の示す経緯度はメッシュの西南端であり,実際に地図記号をプロットす
経度 =東経122度30分 + x×2度30分
緯度=北緯45度40分 一 y×1度40分
このように,欠点がみられる「国研方式地点番号」ではあるが,LAJ作成当時から 入手が容易であった5万分の1の地形図を基礎とした地点コードは,手作業時代の言 語地図の作成にも貢献していると思われる.
また,1960年代という早期に,地点番号の統一がなされたことは,全国各地での方 言調査の地点番号の統一に貢献している.荻野(1977)は,国研方式地点番号の利点と
して「すでに日本言語地図がその方式によって作られていること」を挙げている.荻 野は前年(1976年)に制定されたJIS規格の「地域メッシュコード」28の利用を提唱し たが,使用されることはなく,その後も国研方式地点番号の利用が続いた.
今後の方言調査では,GIS(地理情報システム)の普及により,単純に経度・緯度に よる地点管理が増加するものと思われる.
4.4.GAJにおける共通語形使用行列の作成
本研究では,GAJデータは,主に共通語形の使用という観点から分析される.その ため,共通語形の処理の中で生じる問題を整理し,共通語使用行列を作成する.
データベースの処理は,多分に技術的・労力的な側面が強い.この点が,研究者と 計量的分析とを隔てる大きな要因でもある.本研究の多くは,河西(1981)と同様に共 通語形を目安にして分類している.これは利用者がテキスト処理言語によるプログラ ム作成能力さえあれば比較的容易といえる.
4.4.1.分析対象となるデータ
本研究では,GAJ第1〜3集を分析対象として扱う.文法項目の性格の違いを考慮し て,多くの分析で,助詞項目中心の第1集のデータと第2・3集の動詞・形容詞等の活 用形に関する項目とを分けて処理している.また,第4集以降は表現法項目が中心で あるため,共通語の認定という段階から慎重に取り扱う必要があり,本研究からは除 外した.今後の課題としたい.
公開されているデー…タベースには,各調査地点における音声記号による回答語形と,
刊行されたGAJ各図の見出し語形の両方がある.見出し語形では,音声的に微細な差 異は統合されている.本研究でもこのような差異は重要ではないと考え,見出し語形
を利用した.
4.4.2.「共通語」の定義
GAJデータにおける「共通語」は,河西(1981),井上(1983)等にならって「質問文 の語形」とした.質問文を共通語とみなすことの妥当性という問題は残るが,GAJの 調査が「方言翻訳式」,すなわち共通語を方言に翻訳する方式を採用しているため,こ の定義が妥当であると考えた.
なお,河西(1981)は同じ定義で「標準語」という術語を用いているが,GAJの解説
や井上(1983)で用いられている「共通語」で統一した.本研究では「標準語」と「共 通語」の区別をしていないため,術語の違いは特に問題視しない.
4.4.3.音声の統合
GAJの各項目における凡例において,共通語形とみなされる見出し語形は必ずしも 1図に一つとは限らない.そのため次の原則に従って最小限の統合をおこなった.
①ガ行鼻音[o]の,[g]との統合
②終止形に後続する終助詞の有無による区別の統合
上記に該当する場合は,質問文の語形以外の見出し語形であっても共通語形とみな した.逆に上記の原則以外では統合をおこなわない.したがって,たとえば,第2・3 集において,活用語尾の部分が共通語形と同じであっても,動詞語幹部分で有声化等 の音変化が生じていた場合には非共通語形と判定されてしまうことになる.すなわち 活用形以外の部分も判定基準に含まれることになる点は注意しなければならない.
また,共通語との違いがわずかであっても非共通語とされてしまう点も問題が残る.
たとえば,打消の助動詞「ナイ」は,連母音の融合した「ネー」が非共通語形と判定 されるため,分布が非常に限定されてしまう.この点も注意が必要である.
第3章では,共通語との類似性について,「共通語との音声変異形」「共通語形と異 なる語形」のように非共通語形を2種類に分けた.この方法では分析者による主観が かかわる29ため,本研究では計量的な解決方法として語形間類似度を用いた試論をお こなった.これについては第7章で紹介する.
こうしてGAJ第1〜3集の150図の各地点(807地点)において,共通語形を使用した か否かにっいての行列を作成した.共通語形使用は1,不使用は0で,併用回答の場 合は使用を優先した.
表4−1は作成した行列の一部を示したものである.縦方向に集計すれば各語形にお
ける共通語形使用率が,横方向に集計すれば各地点における共通語形使用率が計算で きる.各地点番号が属する都道府県は,GAJ第1集解説の「調査地点一覧」(国立国語 研究所1989)の情報を入力した.
地点 都道 61 62
i63
卵 67 ど†48 稗9 15◎番号 府県 起きる飽きるi 勧る鞠ける海せる 寝る 霧く タ ● ■ …静かiだった だろう静か ξ
テパ
ならi藪±鰍煕識薫薫、07蹴211熊海薫oア24,95 北溝道 ぷ
.烹_、勺、.1 Ω o i ・ 1 1 勺 { 1 4、㍉㍉AA㍉㍉、㍉AA
@4
@董
i 督 1
ト㍉ 予 び
P〆 o{・
f 1{↑ f 董v、、㍉ 、 v
@o @o
1㍉
i ¶
トす…
P {}
ロ へ 、
@o楊 肇
;i4{
: : 号 : : i {
: i : : : : i: : ・i
2◎ア469沖縄県 〉 導 O l ヌ 0
ioi⑥
o o ●● ● i・ O i袈85,織沖縄曝 o o
}o
i o o ぶ o o 艸袖● !0 ooi
虎
表4−1・加工したGAJデータの行列の一部
図4−3は,GAJ第2図「(先生)が(来られた)」の共通語形「ガ」の使用地点をプロ ットしたものである.左下が原点で右上が(1000,1000)となる.北緯29度未満の補正 をしていないため,琉球列島が左上に表示されてしまう.しかし,結果として図のス ペース節約に貢献しているなお,本研究では,共通語形の分布を表す際には,図4−3 の方式で作成した図を示す.本論文の資料としてGAJ第1図〜第150図の共通語形の
分布図を示す.
002先生が
(来られた)
図4−3・共通語形分布地図の例(GAJ第2図)
4.5.都道府県別共通語使用率
4.5.1.GAJ第1〜3集の都道府県別共通語使用率
分析対象としたのはGAJ第1〜3集150項目中,144項目である(第5章で述べるが 第1集で6項目を除外した).144項目の平均共通語使用率は,35.8%である.これは 河西(1981)におけるLAJ82項目「河西データ」の37%とほぼ同様である.
図4−4は各地点における共通語形使用率を,都道府県別に集計して地図化したもの である.各使用率の最大値と最小値の間を20等分して塗り分けている.房総半島付近 の正方形は東京都の島喚部の値を示している.
図をみると,関東西部から中部地方東部にかけて共通語形使用率が高く,東北地方 と九州地方南部,沖縄で著しく低い.河西(1981)が選定したLAJ項目(「河西データ」)
の共通語形と同様に,GAJ第1〜3集における共通語形も関東地方を中心に使用されて いることが分かる.
STANDARD FORMS
0.13% 64.9%
}工彦 i擢i…i……1{ 懇1111111翻麺圃■
〆
4.5.2.GAJ第1集の都道府県別共通語使用率
GAJは,第1集と第2・3集で性格が異なる.第1集は助詞相当の項目を扱ったもの であり,第2・3集は活用形に関する項目を扱ったものである.やや性格の異なる二つ の項目については分けて集計したものが,図4−5と図4−6である.
まず助詞項目に関する図4−5をみる.図4−4と同様に,関東地方で最も高く,東北・
九州・琉球では低い値を示すことにかわりはない.しかし大きく異なるのは,東側は 東北地方の宮城県まで使用率が高く,西も東九州まで使用率の高い地域が広がってい
る.第1集はかなり広い範囲で共通語形使用率が高いことがわかる.
GAJI STD
図4−5・GAJ第1集の都道府県別共通語形使用率
4.5.3.GAJ第2〜3集の都道府県別共通語使用率
第1〜3集の図4−4と,第1集の図4−5で大きく異なっていることから,第2・3集 の図4−6は,図4−5とは大きい違いが予想されるが,実際に図をみると,関東地方に 最大値があるほかは,中部地方にかけてはやや濃いものの,西日本ではあまり高くな い.また,東北北海道でもほとんどすべてにおいて低く,関東地方を中心とした分布 になっていることがわかる.図4−4と類似しているものの,西日本でではやや使用率 が低くなっていることがわかる.
図4−6が図4−4の図に類似しているのは,第1集が54語,第2・3集が90語とい
う地図の枚数の違いも影響しているだろう.
助詞項目であるGAJ第1集と,活用形項目であるGAJ第2・3集では,性質がかな り異なっていることがわかる.このため,以下,第1集と,第2・3集をわけて分析す
る.
4.6.「全国中学校言語使用調査」との比較
GAJにおける共通語形使用率の地理的な広がりをみた.っついて,全体の使用率に っいて,現代の調査データと比較して,GAJデータの時代的状況について考察したい.
比較対照データは,井上(1997)の「全国中学校言語使用調査」のデータである.こ の調査は,1993〜1996年にかけて,井上史雄により全国102中学校の中学生と保護者 の2世代について実施されたアンケート調査である.中学校は,原則として各都道府 県とも,都市部と農村部の2箇所の中学校に対して実施しており,なるべく属性によ る偏りを排除するよう考慮されている.語彙項目には「河西データ」82項目を含み,
その後の井上の研究に利用されている(第2章参照).文法項目は39項目あり,そのう ち,GAJ第1〜3集に相当する項目は以下の22項目が含まれている.
【第1集】 4酒が,27犬に,29船で,33から,38けれども,41ながら,49ばかり,
50くらい,53ごと,58やら一やら,
【第2・3集】61起きる,68死ぬ,70する,72起きない,83来ない,85起きろ,
103飲んだ,106起きよう,123書かせた,
124書かせよう,141高かった,146静かな(ところ)
調査時期が1993〜1996年であるため,生年は便宜的に1981年生まれとみなす.GAJ の生年平均は1911年であり,差は70年となる.
全国中学調査のデータを平均して比較したものが表4−2である.共通する22項目 の共通語使用率をGAJと中学調査とで示している.並び順はGAJの共通語使用率の低
い順である.
全22項目平均の共通語使用率は,GAJが37.6%,全国中学調査が87.3%と,その差 は,約50%である.井上(2002)は,同じ全国中学調査におけるLAJ項目である「河西 データ」との結果とほとんど同じであったとしている.LAJの平均生年は, GAJより約 17年さかのぼる1894年であるため,GAJの項目のほうがLAJの項目よりも短期間で共 通語化が進展したことになる.
表4−2において,使用率を,「無(10%未満」「低(50%未満)」「中(70%未満)」「高(90%
未満)」「全(90%以上」と分類し3°,GAJ時点の割合と中学調査の割合を項目ごとに分類 すると,一部ずれる部分もあるが,大きく5分できることがわかる.
GAJ(1911)[無(10%未満)]→中学生(1981)[中(70%未満)] A(Al)
GAJ(1911)[無(10%未満)]→中学生(1981)[高(90%未満)] A(A2)
GAJ(1911)[低(50%未満)]→中学生(1981)[全(90%以上)] E GAJ(1911)[低(50%未満)]→中学生(1981)[高(90%未満)] B GAJ(1911)[中(70%未満)]→中学生(1981)[全(90%以上)] C GAJ(1911)[高(90%未満)]→中学生(1981)[全(90%以上)] D
表4−2をグラフ化したものが図4−7である.全体としてみると共通語化は急速に進 んでいることがわかる.また,図4−8は各グループの平均値をグラフにしたものであ る.Eグループを除いては, GAJにおけるA〈B〈CくDという使用率順が,中学生におい ても保たれていることがわかる.
つまり,GAJにおいて使用率の低い語形は,若年層でも共通語化の進展が遅いこと になる.このことから,共通語化の普及速度は多くの項目であまり変わらないことが 予想される.
例外としたEグループは,非常に共通語化の速度が速い項目で,図4−7をみると,
GAJ段階ではAグループに近いにもかかわらず,中学生調査ではBグループより使用 率が高く,Cグループにも迫っており,70年間でほぼ普及の全過程が完了している.
Eグルv・一一・プは,GAJでは「べ一」「オギレ(語中の有声化)」といった有名な東北方 言といえる.そのため,アンケート場面での規範意識が強く働いた可能性もある.ま た,集計では共通語回答が優先されているため,実際の使用状況を観察すると方言形
との併用が多いのではないだろうか.これは全項目にいえることである.
逆に,最も普及が遅いと思われるA項目をみてみる.特に普及の遅いA1をみると,
逆説の接続詞「けれども」は東京でも「けど」という縮約形が優勢であり,「ばかり」
についても,「ばっかし」という東京でも多くみられるりからシへの変化現象がある.
3°単に10%から20%刻みにするならば「30%未満」を入れるべきだが,相当する項目がなかったた
また,普及がやや進んでいるA2の項目は打消の助動詞「ナイ」であり,方言形として 回答されている連母音の融合形「ネー」は,東京においても低文体という条件つきだ が許容されている.
これらから,Aの4項目はどれも東京で非共通語形が認められている項目というこ とができる.東北における共通語化は,関東地方との隣接により,東京方言の影響が 強いため,Aのように共通語化の力の弱い語形については,方言形が保たれが,逆にE のように共通語との違いが明確な場合には,急速な共通語化が進む可能性もある.
グループ 項目 GAJ
P911)
全国中学
@1985
A1 38けれども 3.7% 54.7%
A A2̀2 72起きないW3来ない 5.3%U.1% 73.8%V4.5%
A1 49ばかし 7.5% 59.2%
124書かせよう 10.9% 92.4%
E 106起きよう W5起きろ
14.4%
P5.8%
91.4%
W8.0%
53ごと 16.6% 97.0%
58やら一やら 28.7% 75.3%
50くらい 31.1% 92.5%
B 33から 33.3% 86.6%
4酒が飲 34.2% 81.9%
123 か た 383% 83.2%
141高かった 52.3% 94.3%
68死ぬ 54.3% 97.6%
C 146静かな(ところ)
S1ながら
55.0%
T7.9%
97.7%
X6.1%
61起きる 61」% 97.9%
70する 64.2% 96.4%
103飲んだ 71.9% 98.9%
D 27犬に 81.5% 96.1%
29餅で 83.4% 97.2%
表4−2・GAJと『全国中学調査』の共通語使用率の比較
100%
80%
冊60%
旺
胤竪
M〈40%
20%
ll難
D
to3飲んだ 70する 61起きる C 41ながら 146静ゐ、な6観お t4i高かった
123書かせた
B 4i鯛
50くらい
58やら一やら
E 1・纏¶ξ 124ロかせよう
AI徽
一丁__ __+−L−⇔.._一_一
0%
186o 188o 1 goo 192o 194o 196o 198o 2ooo 2o2o
生年
1繊鏡,i 醗・ { 蹴せたi
l鎚賦ト i
49ばかり :
38。れども i
i
i i l
....一一L−一一一..一...J.一.一.一.....
図4−7・表4−2のグラフ化
0
0
0
0V
%
堅々 0
0
8
7
0
0
6
5
0%
4
3 眺胱㎝頒
一一一一一一一 . 遮.__
・▲
竺_ _一一弓
↓θ 了o 1θ
一一一 ___」L _一一一
・F
−
o
.1@ ◆
!
r 一一一
@___⊥一一L
一二丁一 ^一一一一●・ / →L − 一 一一一
レ
@ ! 1ノ ㌶ I卜 ,.
!
一一黹 一}一^一
× グ
一一一 _i
GAJ 全国中学
匡
う図4−8・グループ別共通語使用率比較
Eの項目を除き,A〜Dの70年間の使用率の変化がA〈B〈C〈Dという順を追った関係 になっていることから,変化過程における各段階を示しているとみなし,エイチスン
(1999)や井上(1995)などでいわれる「変化のSカーブ」にあてはめてみる.
変化曲線は,slow−quick−quick−slowとなるとされ, A〜Dの変化を時間軸でずらし て正規分布の累積関数であるSカーブ曲線にあてはめたものが図4−9である31.
これは数学的なあてはめではなく,傾きからある程度当てはまるだろうという推測 にすぎないが32,井上(1995)にみられるように,Sカーブモデルの適合は可能であろ
う.適合ができれば,変化の速度を推測することができ,使用率の予測が可能となる,
31特に数学的処理をしたものではない.
32異なる語形,異なる調査を比較した予想であり,ロジスティック回帰を用いた分析には適さな いと思われる.しかし,仮にどの語形も一定の速度で変化しているとした場合に変化曲線の形状と
共通語化には,京都からの影響で,全国に広がっている語彙もあるため,そうした 語を考慮にいれると,すべてが0%から始まったという仮定より,基礎的に共通する割 合をある程度考慮に入れたほうがよいと思われる.
Eのように,GAJの段階で,共通語使用率が非常に低かった語でも,70年後の中学 生の段階でほぼ普及が完了している語があることから,全体とすると東京からの共通 語化の速度は急速であったことがうかがえる.
冊旺坦出閣報
一160 −140 −120 −100 −80 −60 −40 −20 0 20 40 60 80 1CO 120 140 160
年
図4−9・時期をずらした表示
4.7.結論
以上,本章では,GAJデータの概観と,使用率の単純集計を概観した.都道府県別
集計の結果,
・共通語形は関東地方を中心として使用されている
・東北,九州,琉球において著しく使用率が低い
・助詞項目と活用形項目では使用パターンが異なる
という結果となった.特に,助詞項目と活用形項目において傾向が異なることは,今 後の分析に影響を与えることが予想される.そのため本研究では,助詞項目と活用形 項目とにわけて分析をおこない,第5部以降でそれぞれの共通語形の使用パターンに ついて考察していきたい.
つづいて単純集計結果を,井上(1997)による現代の中学生のアンケート結果と比較 した.GAJと中学生調査では70年の開きがある.両者に共通な22項目の共通語形使 用率を比較したところ,中学生では非常に高い共通語形の普及がみられた.
ただし中学生で高い使用率を示した語の多くは,GAJの段階でも使用率が高く,逆 に中学生においても使用率の低い語は,GAJの段階での使用率が著しく低い語であっ たこともわかった.これは普及のSカーブを描いているのではないか,と予想したが,
この検証は今後の課題である.こうした世代差の問題については,これは第3部以降 の分析においてあきらかにしていきたい.
また,こうした使用率において,共通語と方言の併用の問題も考慮に入れる必要が あり,この点も今後の課題である.