第 4 章 線形判別分析による東西所属決定
4.3 各地点の東西所属決定
39
として用い,Guilherme & Flávia(2018)は,ホシクサ科の植物のラミート(1個体から栄 養的に繁殖した子孫の各個体)を持つ土壌と持たない土壌の違いを分析する際の変数を選択 する方法として用いて,植物の生態学的要素が土壌にどのように影響するかを分析している。
本研究では,統計処理ソフト
R
のklaR
パッケージ(Weihs ら,2005)に入っているgreedy.wilks
関数を用い,niveau=0.025として変数選択を行った。40
4.3.2 線形判別分析による東西所属決定
東西所属にゆれのあった,愛知・岐阜・石川・福井を除いたデータを学習データとし,愛 知・岐阜・石川・福井をテストデータとして,線形判別分析を行った。用いた変数は,表
13
から,学習データの東部方言18
地点において,出現しない「ヅ・フィ」,テストデータであ る愛知・岐阜・石川・福井の4
地点において,出現しない「ヅ・フィ・スェ・ュ」,つまり「ヅ・フィ・スェ・ュ」の
4
変数を除いた12
変数を用いた。判別係数は第
1
判別関数のみ返された。判別関数式の𝑥1,𝑥2,… 𝑥12は,ダ,ネ,レ,チョ,ク゜,(ン)ー,ク,キ゜,ヌ,クヮ,ヤ,ホを示す。定数項は,グループの平均と判別係数 との線形結合の平均値である。判別関数の式を以下に示す。
Y = 195.3𝑥1+ 43.8𝑥2+ 124.7𝑥3− 145.0𝑥4+ 1023.5𝑥5+ 113.1𝑥6+ 113.2𝑥7+ 230.9𝑥8
− 81.7𝑥9− 1860.3𝑥10− 80.6𝑥11− 86.3𝑥12+ 6.6
学習データの判別結果の正解率は
100.0%であった。判別関数で得られた判別得点のグル
ープごとのヒストグラムを図8
に示す。重なる領域がなく,誤判別率が低いことがわかる。図 8 学習データの第1判別関数得点の分布(モーラunigram)
求めた判別関数を用いて,愛知・岐阜・石川・福井の東西所属についての判別分析を行っ た結果,愛知は,東の所属,岐阜・石川・福井は西の所属に分類された。以上において,本研 究における各地点の東西所属を決定し,表
14
に示す。41
表 14 本研究における各地点の東西所属一覧 東部方言
19地点
西部方言29地点
北海道,青森,岩手,宮城,秋田,
山形,福島,茨城,栃木,群馬,埼玉,
千葉,東京,神奈川,新潟,山梨,
長野,静岡,愛知
富山,石川,福井,岐阜,三重,滋賀,京都,大阪,
兵庫,奈良,和歌山,鳥取,島根,岡山,広島,山 口,徳島,香川,愛媛,高知,福岡,佐賀,長崎,
熊本,大分,宮崎,鹿児島,沖縄,宮古島
1.3.1項の主な方言研究者による方言区画を示した表1における結果とは異なり,愛知は東
部に,岐阜は西部に分類されることとなった。1.3.4項の井上・河西(1982b)は語彙を調査 し,計量的に分析した結果,愛知は東に,岐阜は西に分類される結果となったが,本研究で も同様の結果となった。つまり,本研究では,語彙・文法項目のいずれかか,その両方,ある いは,何らかの形態音韻論的特徴を重視した分類であると考えられる。アクセントを反映し ないデータを用いた線形判別分析による分類がこれらと同じ結果となったことは,このこと に依存すると考える。ここで,『資料13』における岐阜・愛知・長野・山梨・静岡・新潟の調査地点について述べ る。岐阜は中津川市苗木,愛知は常滑市矢田,長野は木曽郡開田村大字西野,山梨は塩山市 中萩原,静岡は静岡市足久保奥組,新潟は糸魚川市上刈である。
1.3.3項の表6で触れたように,糸魚川と浜名湖を結ぶ線は,東西方言の接触地帯であり,両
者の特徴の境界線の多くが,この地を様々に通っているため,どの地点の調査であるかが重 要だからである。表15は,これらの地点を牛山(1969)の分類(50才以上の人の言い分)で東西に分けたも のである。混用としたのは,凡例に「等分ニ混用」とある場合で,「少シク混用」の場合は,
多い方に分類したが,『資料13』の文法解説に記述がある場合は,それに従った。
表 15 『資料13』における各地点の項目別東西所属
項目 東/西 東に分類 西に分類 混用
①動詞の命令形 ミロ/ミヨ・ミイ 山 岐,愛,長,静 新
②動詞の音便形 ハ ラ ッ タ / ハ ロ ー タ・ハルタ
岐,愛,長,山,静,
新
③形容詞の音便形 ヒロクナル/ヒロー ナル・ヒルーナル
長,山,静 岐,愛,新
④否定の助動詞 シナイ/セヌ・セン 静 岐,愛,長,山,
新
⑤断定の助動詞 ダ/ジャ・ヤ 愛,長,山,静,新 岐
42
岐阜のみが西に分類されている項目は,⑤の断定の助動詞による分類である。自然談話に おけるモーラunigramの頻度をデータとして,愛知・岐阜・石川・福井の4地点を除いて判別 モデルを構築し,そのモデルに基づき,先述の4地点を判別した結果が,⑤の断定の助動詞に よる分類と一致しているのは単なる偶然の一致ではないと考えられる。