第 2 章 本研究の謝罪言語行動の研究方法
第 4 節 調査データの分析方法と手順
4.1 調査データの分析方法
調査データの分析には二つの方法を用いる。一つは回答の言語表現を整理するにあたって、
意味公式に分割することであり、もう一つは意味公式の使用傾向を分析するために用いる統 計の方法である。意味公式の分類に関しては、第 3 章で詳細に述べるので、ここでは意味公 式の集計方法およびデータの比較、分析に使用する統計法について説明する。
まず調査データの集計は、次のような手順と原則に基づいて行われた。
1)今回の調査は一つの設問に対してどのような意味公式が使用されるかをみることが目 的であるため、一人の回答者の、一つの設問への回答に、同一の意味公式(例えば、「ごめ
2)一人の回答者の一つの設問への回答に例えば、「ごめんなさい、すみません」のように 異なる形態が使用されれば、〔ごめん系〕と〔すまない系〕の項目にそれぞれ 1 と計算する。
こうすることにより、各形態が選択された場面を正確に把握できる。ただし、同一人物が同 一回答の中において異なる形態の表現を使った場合、それぞれ 1 と計算されるため、数値は 実際の回答者人数を超えることがあるが、そうした例はわずかしかないので、統計上大きな 問題は生じない。
統計についての解説書や指南書は数多くあるが、本研究は言語関係の研究であることから、
『言語研究のための統計入門』(石川・前田・山崎編 2011)を参考にした。本研究ではデー タ間の比較においてデータ間の差が実質的に有意な差であるかどうかを検証するために、カ イ二乗検定という仮説検定の手法を用いる。カイ二乗検定について、前掲書ではコーパス研 究の例を挙げながら、次のように説明している。
カイ二乗には,ピアソンのカイ二乗検定(Pearson’s chi-square test)や対数尤度比 検定(log-likelihood ratio test)などがあるが,広く用いられているのはピアソンのカ イ二乗検定で,単にカイ二乗検定と言った場合にはふつうこれを指す。
仮説検定として行うカイ二乗検定は,2 群以上の出現比率に差があるかどうかを調べる比 率検定と言える。したがって,A コーパス中の単語 X の頻度と B コーパス中の単語 X の頻度 を比較する場合,当該語の頻度だけをみるのではなく,「A コーパス中の単語 X の頻度とそ れ以外の語の総頻度」と「B コーパス中の単語 X 頻度とそれ以外の語の総頻度」をみている ことになる。
(石川・前田・山崎編 2011:60)
本研究においては、各意味公式の使用率を比較するものであるため、カイ二乗検定が適切
であると判断できる。カイ二乗統計量を求めるには、専用の公式を用いるほか、専門の統計 ソフトや excel を利用することができるが、今回は前掲書付属の CD-ROM に収録されたカイ 二乗検定用 Excel®ファイル(chi_test.xls)を使用する。結果の表記については、カイ二 乗統計量(χ²)、自由度(degree of freedom:
df
)、p
値(p-value:p
)の三つを添え書き するのが慣例である(前掲書、p.63)。ここでいう自由度とは、頻度データのうち、合計の 値を変えずに自由に値を変えることができるデータの個数のことで、行と列のデータの個数 からぞれぞれ 1 を引いて得られた値をお互いに掛け合わせた数である。限界値とは、選択し た有意水準に対応するカイ二乗統計量の値のことであり、統計学の入門書の巻末などに載っ ている「カイ二乗統計量の限界値表」で調べられる(前掲書:62-63)。例えば、カイ二乗統 計量が 4.78、自由度が 1、有意水準が 5%のカイ二乗統計量の限界値(3.84)を超えている ので、5%水準で有意差があるという結果を述べるときに、単語 X の頻度は、コーパス A,B 間において有意水準 5%で差があった(χ²=4.78,
df
=1,
p
<0.5)というように通例、定型的な表現を用いる。もし、有意差がない(not significant)場合 は、通例 ns という略号を使い、
p
値を記載する(前掲書:63)。なお、APA(アメリカ心理学)の推奨する記法では、理論的に 1 を超えない値は最初の 0 を省略するため、例えば
p
値が 0.05 の場合、しばしば.05 のように書かれる(前掲書:63)。本研究におけるp
値の記述もこ れに従う。次に、5.2 で行われる場面 1 の定型表現の日本語と中国語の比較を例に、説明する。
表 11 場面 1 における定型表現の頻度表
A コーパス(日本語) B コーパス(中国語)
総語数(全有効回答数) 443 217
語 1(定型表現) 374 60
表 11 は前掲書のコーパス研究例にならって、作成した場面 1 の日中の定型表現の頻度表 である。A コーパスと B コーパスはそれぞれ日本語と中国語、総語数は場面 1 の日本語と中 国語それぞれの有効回答数、語 1 は定型表現が入る。次に、これらの数値を、カイ二乗検定 用 Excel®ファイル(chi_test.xls)にある「実測値入力用」シートに入力する。その結果 は、次のようになる(コーパス 1 が日本語、コーパス 2 が中国語。このシートには最大 5 つのコーパスの、15 語までの頻度データの入力が可能だが、語 2~15 の行は非表示にして いる)。
表 12 「実測値入力用」シートに表 11 のデータを入力した結果
総語数 443 217 660
コーパス1 コーパス2 コーパス3 コーパス4 コーパス5 計
語1 374 60 439
その他の語 68 153 0 0 0 221
計 443 217 0 0 0 660
検定の結果には、次のような項目が表示される。
表 13 「2 コーパス間の 2×2 の検定結果一覧」シートの表示 コーパス1とコーパス2における各語のカイ二乗検定結果一覧 個別の
語
カイ二 乗値
p値
自由度
(df)
個別の語の頻度の差の有意性 判定
頻度が高い コーパス
5以下の実測値 または期待値
語1 196.49 0.0000 1
有意水準0.1%で有意差あり
(χ2=196.49, p=.000)
コーパス1 無し
この結果に基づいて、定型表現は日本語と中国語の間において、有意水準 0.1%で差があ った(χ²=196.49,
df
=1,p
=.000)ということができる。なお、カイ二乗検定を行うとき、期待値(「差がない」と仮定した場合に予測される頻度 のことである)の中に 5 未満の値がある場合、カイ二乗検定の結果が不正確になるので、フ ィッシャーの正確検定(Fischer’s exact test)を用いることが推奨されている(前掲書:
64)。本研究においては期待値が 5 以下の場合、フィッシャーの正確確率検定を用いる2。 なお、こうした場合は、フィッシャーの正確確率検定によって求められた
p
値のみを表示す る。以上、本研究におけるデータ間の差を検証するのに用いられたカイ二乗検定およびフィッ シャーの正確確率検定について、定義、記述方法、留意点などの説明を行った。次に、デー タの分析の手順について述べる。
4.2 分析の手順
分析は、基本的に言語表現(意味公式)の分類、言語表現(意味公式)の使用状況、およ びそれについての考察という順で行う。
まず、第Ⅰ部の第 3 章では、アンケート調査に現れる日本語と中国語の謝罪の言語表現を
具体的にみていき、回答に現れた言語表現にどのような要素が含まれるのかを詳細に考察す るために用いる、意味公式の分類法について説明する。
次に、第Ⅰ部の第 4 章と第 5 章では、日本語と中国語のそれぞれの調査結果を、意味公式 の種類と各場面の意味公式の使用率の二つの面から提示する。意味公式の使用率をみる際に は、日本語と中国語の全体的な意味公式の使用傾向を把握し、そのうえで東京と大阪、大連 と杭州のそれぞれ 2 都市間における意味公式の使用傾向について検討する。
第Ⅱ部の第 1 章、第 2 章、第 3 章は考察の部分である。主に言語的特徴、対人関係、地方 差と言語表現との関係に着目し論を進める。第 1 章では、日本語と中国語の各場面の意味公 式を合計して、その傾向を詳しく分析し、両言語の謝罪の差異を言語的な特徴から検討して いく。
第 2 章では、対母親と対親友の謝罪言語行動を日中で比較し、そこに現れた意味公式の使 用傾向の相異について、日中の対人関係観の視点から考察を行う。
第 3 章では、地方差という視点から、東京と大阪、大連と杭州における意味公式の使用に ついて、対母親と対親友に分けて考察を行い、そこに現れる相違の原因を検討する。
注
1 2014 年の大連調査以前、2011 年 9 月に大連で同じ調査を行っている。しかし、アンケー トの場面設定に他のアンケートとは異なる文言があったため、このアンケート調査の結 果は本論文では使用していない。しかしこの 2011 年調査の結果からは非常に大きな収穫 を得ている。すなわち、調査結果が中国南部出身である筆者の内省と一致しない点が多々 あったため、地方差に注目する研究を推し進める必要がみえてきたのである。この後、
南部の都市である杭州で調査を始め、日本でも東京と対比するために大阪で調査する ことにしたのは、この調査結果に負うところが大きい。
2 この検定法の
p
値を求めるには、公式があるが、本研究では群馬大学の青木繁伸氏が作成し公開しているフィッシャーの正確確率検定の実行フォーマットを利用した。URL は 参考文献一覧を参照のこと。