第 5 章 東西分類に有効なモーラ unigram から見た方言分類
5.3 モーラ unigram の組み合わせから見た方言分類
5.3.1 変数選択
5.3.1.1 カイ二乗値による変数選択
43
44
表 16 東西におけるモーラunigramのカイ二乗値(上位30)
モーラ
unigram
西 東 χ2
1
ダ0.73 3.34 4725.22
2
ネ1.06 2.27 1191.85
3
ァ0.05 0.46 947.00
4
ジャ0.60 0.15 630.14
5 (o)
ー4.22 3.07 471.41
6
イ4.12 3.01 447.92
7
ヤ1.77 1.07 436.86
8
ヂャ0.15 0.00 341.06
9
グ0.17 0.41 271.53
10
チョ0.26 0.09 207.53
11
ト2.64 2.03 206.02
12 (e)
ー1.52 2.04 202.47
13
ホ1.20 0.81 196.37
14 (a)
ー3.09 2.45 193.34
15
ズ0.29 0.54 188.80
16
ニャ0.19 0.05 187.56
17
ド0.92 1.30 177.20
18
ナ3.85 3.16 177.03
19
ッ(促音)3.42 4.12 175.27
20
サ0.93 1.31 167.86
21
ギ0.13 0.28 142.34
22
レ1.09 1.45 133.66
23 (u)
ー1.39 1.04 128.49
24
フ0.62 0.40 123.74
25
チュ0.26 0.12 123.55
26
ロ0.66 0.43 120.15
27
ベ0.18 0.33 118.34
28
シェ0.19 0.08 115.21
29
テ2.31 2.77 109.73
30
タ3.38 2.88 103.08
45
西と東の列の数値は,東西それぞれのグループにおけるモーラ
unigram
の百分率(使用率)を示している。
表
16
の1「ダ」, 4「ジャ」, 7「ヤ」 , 8「ヂャ」は断定の助動詞の違いを反映していると思
われる。「ダ」は東部方言において,使用率が高く,「ジャ・ヤ・ヂャ」は西部方言において使 用率が高い。2「ネ」, 20「サ」は東部方言で使用率が高いが助詞が関係していることが考え られる。18の「ナ」は西部方言で使用率が高い。これも助詞が理由の一つとして挙げられよ う。
3
の小書きの「ァ」が東部方言で使用率が高いのも何らかの音変化を表している可能性が あり大変興味深い。『資料13』は録音文字化資料であるため,おのずと限界もあることは否め
ない。2.2節で記したように,「ネァ」「シァ」「ズァ」「ドァ」「レァ」など,「ア」を小さく添 え書きしたものは,拗音として1
モーラともみなせるもの,引き音節を含んだ2
モーラとも みなせるものが混在しており,その音価を定めることができないものが多い。これらの精査 は課題として残るが,いずれにせよ,母音融合などが生じた結果を反映しているものが多い と思われる。5
のオ段引き音節,14
のア段引き音節,23
のウ段引き音節は,西部方言で使用率が高いが,ハ行四段活用動詞音便と形容詞連用形音便,1 音節名詞の長呼が関係していることが考えら れる。一方,
12
のエ段引き音節は東部方言で使用率が高いが,これは先述の「ネ」の影響や,母音連続「V + i」がエ段引き音節となることとの関連が考えられる。6の「イ」は西部方言 で使用率が高い。1.3.2.1で,サ行イ音便にかかわる「出シた」「出イた」などの音便化しない かするかについて述べたが,西部方言では音便化するので,理由の一つとして考えられる。
19
の促音の使用率が東部方言において高いのも先行研究で指摘されている通りである。10, 16
の「チョ・ニャ」は西部方言で使用率が高い。これは,「シテオル→シチョル」「セネバ→セニャ」のように,二つ以上の単位が音の転訛などによって一つに変化する音融合が起 こっていることが関係している。27の「べ」は
1.3.2.1
で述べた,未来(意思・推量表現)に ベーを使うか否かが関係していると思われるため,東部方言において使用率が高い。最後に13
の「ホ」が西部方言において使用率が高い点であるが,サ行がハ行に交替する現象が考え られる。「ソレ」「ソンナ」が西部では「ホレ」「ホンナ」となる。東西におけるモーラ
unigram
のそれぞれの比率をプロットしたものを図9
から図11
に示 す。46
図 9 東西におけるモーラunigramの比率上位1-10
図 10 東西におけるモーラunigramの比率上位11-20 0.73
1.06
0.05
0.60
4.22 4.12
1.77
0.15 0.17 0.26 3.34
2.27
0.46
0.15
3.07 3.01
1.07
0.00
0.41
0.09 0.00
0.50 1.00 1.50 2.00 2.50 3.00 3.50 4.00 4.50
ダ ネ ァ ジャ (o)ー イ ヤ ヂャ グ チョ
西 東
2.64
1.52
1.20
3.09
0.29 0.19
0.92
3.85
3.42
0.93 2.03 2.04
0.81
2.45
0.54
0.05
1.30
3.16
4.12
1.31
0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50 4.00 4.50
ト (e)ー ホ (a)ー ズ ニャ ド ナ ッ サ 西 東
47
図 11 東西におけるモーラunigramの比率上位21-30
1.3.2
項で述べた文法項目と音韻項目における東西方言の違いが如実に反映されている。モーラ
unigram
の頻度と東西方言の特徴との関連が見えてくる。1.3.2.3 で述べた東西方言間の音韻の違いのうち,本研究に関連する項目を表
17
に示す。表 17 東西方言間の音韻の違い
言語事象 西部方言 東部方言 ハ行四段活用動詞音便 ウ音便 促音便 形容詞連用形音便 ウ音便 原形 促音化・促音挿入語 少ない 多い
1
音節名詞 長呼 短呼 動詞命令形 ヨ>イ ロ 断定の助動詞 ジャ>ヤ ダ 追加:母音連続「V + i」 非融合 融合0.13
1.09
1.39
0.62
0.26
0.66
0.18 0.19
2.31
3.38
0.28
1.45
1.04
0.40
0.12
0.43 0.33
0.08
2.77 2.88
0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50 4.00
ギ レ (u)ー フ チュ ロ ベ シェ テ タ
西 東