第三章 連体修飾節への対応方略法の調査・分析
3.3 統計と結果
書き起こしされた話者と通訳者の発話データから連体修飾節を抽出 した。日本語話 者の発話データより抽出した連体修飾節は全部で 139件であった。起点言語である日 本語の語順のまま順送りで訳している例(修飾部+主要部)を SLS(Source Language
Specific)とし、目標言語である英語の語順に即した訳出を TLS(Target Language
Specific)として分類した。その結果、SLSが44 件、TLS が95件であった(図3参
照)。訳出方略区分の比率とすると、SLSが 32%、TLSが 68%である。
図3: 連体修飾節における訳出方略区分の比率
連体修飾節における方略区分の比率
TLS, 95, 68%
SLS, 44,
32% SLS
TLS
3.3.2 統計処理‐連体修飾節の時間的な長さ
抽出された 139件の連体修飾節の時間的長さを調べ、TLSと SLSそれぞれで発生頻 度を分布した(図4参照)。TLS は発話時間が 5秒くらいの連体修飾節がもっとも多く、
18%を占めている。しかし、SLS はそれほど特定の発話時間に集中している傾向は無
いことが見受けられる。4秒台、5 秒台、7秒台、8 秒台に11%ほど分布している。TLS は 19 秒台という非常に長い時間をかけて発話された連体修飾節にも見られたものの、
6 秒台を境にして減少している傾向がある。SLS は比較的広く分布している。連体修 飾節の発話平均時間は、SLSが8.92秒、TLSが 6.34秒であった。
図4: 連体修飾節の発話時間別発生頻度分布(百分比)
連体修飾節の発話時間別発生頻度分布において、TLS群と SLS群の間に有意差があ るのかを調べるために ANOVA検定を行った。ANOVAとは Analysis of Variance(分 散分析法)であり、多群比較に利用される検定である。 図5に検定結果を示すが、全 139データについての詳細情報は付録に統計資料として付録する。
この結果 p=0.001となり、p<0.05の条件を満たすため有意差が見られる。連体修 飾節の発話時間の長さにより、同時通訳者が SLS か TLS かのいずれかの訳出方略を 選択するかという結果には有意差が見られると結論付けられる。詳細な分析について は 3.4にて述べる。
0 2 4 6 8 10 12 14 16 18
発生頻度(%)
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 発話時間(秒)
連体修飾節の発話時間別発生頻度分布(百分比)
SLS TLS
SLS TLS
N= 44 95
AVG(平均値) 8.919 6.337832 SD(標準偏差) 5.386276 3.466453
F 11.547
p 0.001
df(自由度) 1
図5: 発話時間別発生頻度分布における ANOVA検定
3.3.3 統計処理‐連体修飾節の形態素数
抽出された 139件の連体修飾節の形態素数をカウントし、TLSとSLSそれぞれで発 生頻度を分布した(図6参照)。TLSは形態素数11~15個の段階がもっとも多く発生 している。SLSにはそれほど特定の集中傾向は見られない。形態素が11個という比較 的短文の場合でも SLSで訳す場合が見られた。連体修飾節の平均形態素数は、SLSが 20個、TLS が15個であった。
図6: 連体修飾節の形態素数別発生頻度分布(百分比)
0 5 10 15 20 25 30 35
発生頻度(%)
~5 ~15 ~25 ~35 ~45 ~55 ~65 形態素数(個)
形態素数別発生頻度分布(百分比)
SLS TLS
連体修飾節の形態素数別発生頻度分布においても、TLS群と SLS群の間に有意差が あるのかを調べるために ANOVA検定を行った。図7に検定結果を示すが、全 139デ ータについての詳細情報は付録に統計資料として付録する。
この結果 p=0.004となり、p<0.05の条件を満たすため有意差が見られる。連体修 飾節の形態素数により、同時通訳者が SLS か TLS かのいずれかの訳出方略を選択す るかという結果には有意差が見られると結論付けられる。詳細な分析については 3.4 にて述べる。
SLS TLS
N= 44 95
AV(平均値) 20.25 15.49474
SD(標準偏差) 10.89725 7.610007
F 8.83
p 0.004
df(自由度) 1
図7: 形態素数別発生頻度分布における ANOVA検定