音声的個性の Sound Recognition への影響について

(1)

`gf)ilftYma{!I!cD

Sound

Recognition

_{/ ×}

(DtcW}CDLi'C

7k'g

l:iL

pt*

The

Infiuence

of

Allophonic

Variants

of

English

Native

Speakers

upon

Japanese

Learners

in

the

Reeognition

of

Sound

Contrasts

Tsutomu

SHIBUYA

It

is

very often observed

that

Japanese

learners

of

English

have

great

difficulty

in

acquiring the recgnition ability of certain English

phonemic

contrasts shown by a contrastive study of

the sound structures of

English

and

Japanese.

A

close examination of this tendency,

however,

reveals that the degree of the difficultyisdifferent arnong those examiners who are speakers of

the same

dialect

and read the test materials similarly

in

the natural style.

The

present study

has

the _purpose of

drawing

a clear _picture of the nature of this

kind

of

difference with three

Americans

as naitve infQrmants and with

fifty-five

Japanese

college freshmen as examinees.

Test

materials

for

this purpose were

based

on the

Test

of

Aural

Perception

in

English

for

Japanese

Students

_prepared

by

R.

Lado and

R.

D. Andrade, but with many

altera-tions

both

on test

items

and on

listener's

responses.

As

a communication equipment

for

these

series of tests the

language

laboratory was used, whose limits

in

the system

frequency

response were minutely examined in relation to the acoustic characteristics of each of the target sounds.

The

data

obtained

from

the experiment were closely compared with the writer's auditory

impres-sions of the speakers' taped voices, which

leads

to the

following

conclusion.

Aural perception of _phonemic contrasts isto discriminate an allophone of one _phoneme from

an allophone belenging to the other phoneme inthe same phonetic environment.

Each

allophone has its own

prominence

associated with such

factors

as

_quality,

length,

stress and pitch.

In

the

first

two

factors

conditiDned

by

the context or the situation, there are

likely

to

be

slight

variations _pertaining to the speaker's speech habits. Moreover, in the stream of speech, these factors are strongly affected by the

_prosodic

features having more

personal

nuance. Thus phonetically the

_degree

of _prominence of the same allophone israther different among speakers

when spoken under

the

same eonditions,

Once

two

allophones are _put

in

contrast as reeognition items, the

difference

of this sort tends to become _quite marked. These allophonic variations of

the

speaker may cause

little

trouble to the native

listeners

of the same

language,

but

they

come to exert a more powerful influence on

Japanese

learners

whose common core with the

speaker

in

speech cernmunication

is

still smaller in _their _present stage, with varying degreesof

its

infiuence

in accordance with vowels, consonants and

_pair

words, _pair sentences.

As

for

vowels, far _greater than consonants in _power, the infiuence of allophonic variations

of the speaker,

if

in

_pair words,

is

not _great enough to _give any trouble

in

recognizing the

contrasts; while

in

pair sentences, the quality and the

length,

the rnost significant cue

for

the vowel recognition, colored

in

different tints

by

the

prosodic

features,

diversify the students'

ability in discriminating the same vowel contrasts.

On the other hand, the recognition of consonant eontrasts

is

subject to

be

affected

by

any

kind

of small energy

both

in

pair words and

in

pair sentences, so

that

the

consonant

recogni-*

_senptge.

(2)

-39-i

相模工業大学紀要　第 2巻　第 1号

tion　

is

　net 　on 且y　

far

　more 　difHcult　than 　the　vowe 且 recegnition

，

but

　also 　suffers 　

from

　the　strong

influence

　_of

_phonetic

_variants _ofthe_speaker

，　showing 　wide 　variations 　among 　the　recognition

data 　by　different　speakers

．

But　the　degree　of　this　difference　varies 　 according topairwords

and 　pair　sentences ： the　difference　in　the　latter　isperceived tobe1essgreatthan　that　in　the

former ．

ま　え　が　き

Contrastive

phonetics

　eよ最近の音声学の

1

つの傾向である。しかし外国語と母国語の音体系の

音

素論的比較によって予知できる学習上の

trouble

　spots は，　

production

と recognition に必ず

しも共通に生ずるとは限らず，両者は区別して考慮する必要がある。また実際の speech 　commu

・

nication において話者の立場としての

production

は

，

phonemic

features

の正確な習得段階に

おいて

一

応「訛り」はあっても誤解されることはないが，後者に関しては，

distinctive

features

が

識別

しにくく redundant 　

features

に

_依存す

る

場合

がしばしば

起

る。したがって recognition に

おいては， phonemes ばかりでなくそれに属する種々の allophones の特徴の十分な理解にまで及

ばねばならない。しかし allophones と

phonetic

　centext および situation との間には，なお

speaker の

personal

　shades が関係していると思われる。そのような sound 　shades は，多くの

場合， native 　speaker 自身には意識されにくいようであるが，われわれ日本語を母国

語

とする

1istener

には，同

一

dlalect

の speaker による同

一

音声環境の allophone にも種々の

personal

shades が

感

じられ

，

それが sound 　recognition に _{影響}を与える場合をよく

経

験する

。

しかし

，

こ

れまでこの種類の影

響

の

_実

_態は十分明らかにされていない _。それは

_{，自}

からの _中に

_幾

つかの _{有力}な

variables を含む speech 　communication 　system において，　 allophone を生成する諸要素の中

から speaker の

personal

　shades による影響を客観的に取り出すこ _とが甚だ困難であることによ

ると

思

わ

れ

る。この

研究

は，

3 人

の

English

　native 　speakers を

informants

として行なった

recognition の資料と筆者の聴覚印象との比較から，相対的に以上の問題を究明しようと試みたも

ので

_あ

る。

1 ．

Test

　_materials

　

Sound

　recognition には，

常

にそれに附随する variables の

影響

を

無

視することはできない。

したがって，

本

論に入る

前

に，その

性格

と

　

recognition への干

渉度

を

予

め

検

討しておく必

要

が

あ

ろうと思われる。

　

はじめに比

較資料

を

得

るために

用

いた

test

　rnaterials について

考

えるこ _とにしたい _。

_英語音

の recognition の客観的評価は，それが単なる知識ではなく技能に属する評価であるため従来非常に

困難視

されていたが，言

語

の

音素

比

較

の

応

用によってより

高

い validity と reliability とが

得

られるようになった。つまり発音の基本的な聴取力というのは，音声の phonetic 　

differences

を聴

き分

ける

力

ではなく

phonemic

　contrasts を

_識

別す_る力を意味す_るのであり，　

Robert

Lado

はこ

のような

phonemic

principle

_{によ} _っ _て_{母国語}_と_{外国語}_の_{音声組織}_{を比}_較 _し_種々の

_有

_効な

test

の

作

成に

貢

献している。

彼

と

Richard

D

．

Andrade

の

協力

による

“

_Test

　of　

Aural

Perception

for

Japanese

Students

” は，日本人の

英語音

の

聴

取能

力

を診断するのに極めて正確なものといわれて

(3)

音声的個性の

Sound

Recognition

への影響について　（渋谷　勉）

いる。われわれ日本人の立場からはこれにはなお検討すべき問題があるが，

書

記号に

頼

らないこの

直接的

な

test 方法

には

高

い reliability _を

_与

_{えられ} るように

思

われる。因みに

Lado

にょれば，

ラテソアメリカ

人

に

用

いた “

Test

　of　

Aural

Perception

for

Latin

−

A

皿 erican 　

Students

”

の信頼

度

は，

0 ．

90

±

O

．

02

と非常に

高

いことが

報告

されている

1〕

。今回用いた

test

は，その理

論的背景

，

問題形式および解答方法に関しては

Lado

の test に準じているがその内容は異なる

。

ここでは

聴

取上の問題点を

10

組の

phonemic

　contrasts に

制

限し

，

　vowels としてノ

ij

ノ

ー

1i1

，

！aNe _！

_，

fe1

−

_／or！

，

／uw ／

−

1u1

，！ow ／

−

_fof

_の

₅

_組

，および consonants からは！s！

−

〆

e1

，

1zf

−

16

〆，！

1

／

一

_∫_r1 ，

1b1

−

_1v

_！，／

f

／

一

／

h1

の 5 組を選び，各 contrast ごとに音

声

環

境

の異なる

5

組の

pair

　words と

2

組の

pair

　sentences

を基礎にして

3

つの words

あ

るいは sentences の

組

み

合

せを

作

りこれを

test

　materials _と_し

た。

Listener

は native 　

informant

によって明瞭な自然な sty 且e で読まれるこれら

3

つの words

または sentences の _組み合せから対立をなす

phonemes

の _{異同を}

4

つの _{選択肢}によって答えるように指示される。ところで

一

_般_に _multiPle

−

_choice

_tyPe

_の_{問題}_{では}

，選択肢は

4

つ以上設けるこ

とが望ましいと

考

えられている。

Lado

では

3

つと

も

異なる組み合せを含めて

5

つの

選択肢

が用意

されているが，その場合は特定の

phonemic

　contrast に対する

資

料になり得ないのでここでは割

愛した。なお

後述

するように，この調査の communication 　equipment の音響伝達条件において

は，

選択肢

の

増

加は

SIN

低減効果につながり，　

listenability

を低下させる遠因となることも考

慮

に入れる必

要

があった。つ

ぎ

に

予想

される問

題点

は，

pair

　words ，

特

に

pair

　sentences の組み合

せ順

序

による

識

別へ _の影響_であ_る

。

それ_は聴覚像が瞬間的_で_不安定_であ_{るから}

記憶

_の_{要素}_{が入り}

，

同

一 phoneme

の生ずる組み合せ順

序

には若干

handicap

が伴なうのではないかという危惧であ

る。そこで比較的識別困難な！

i1

−

_1jif

_の _contrast _を _もつ _同

一

の

pair

　words と

pair

　sentences

_，

および

識

別容易な

1i

／

一

／

ij1

の

pair

　sentences による組み合せを，順

序

を

変

え

重複

させて作成した

72

問の test　materials による

3

，

888

例により調査した。その結果

4

種類の解答形式による識別

の _{差異}ぱ若干生じてぽいるが，それがある特定の解答形式に偏していると判断できるほどの明

瞭

な

傾向を見出すことは不可能であった。なお用いた

test

の相関係数は，

0 ．

87

であることなどを綜合

す

ると

，今

回の

test

　materials はその方法を含めて比

較的高

い reliability _を

_有

していると

考

えることができよう。

2

．

Communication

　equipment

　

音声

に _含まれる周波

数

は

100 〜10 ，

000cps

にわたるといわれるが2｝，録音

tape

による再生音を用いる場

合

は，再生回路の

音響条

件によって大

ぎ

な

制約

を

受け

る。したがって外国語

音

の

識別

のためには忠実度の _最も高い _{再生装置}を用いることが望ましいが，現状ではある程度の制約から免れる

ことはでぎないので

，識

別の _対

_象

となる

phonemes

の acoustic 　characteristics との _{関連}におい

て， communication 　equipment による recognition への干渉度を明らかにしておかなければな

らない _。

　

再

生

音

を用いる

方法

としては

普

通

2

つの

方

法が考えられる。

1

つは

1

台の

tape

　recorder から

一

_斉

_に_{聴取す}_{る場}

_合

_で _あ _り

，

他

は

最

近著しい普及を示している

language

laboratory

l

！こおいて

earphone から個別に聴く場合である。いずれの

方

法をとるにしても

，

　 system 　

frequency

　re

−

sponse は，

一

_般_に_{回路}_の _も_つ

音

響特性より低い speaker _あるいは earphone の

特

性によって

殆

んど決まると考えることができよう。またその特性においては speaker は earphone より

高

いも

(4)

相模工業大学紀要　第 2巻　第1号のを得ることができるが，

listener

の位

置

，部屋の残響および外部雑

音

などの影響があり平等な

listenab

三

lity

を

得

ることは

困難

で

あ

る。

実験

によれば s｝，　 speaker の

中

心

線

から

30

° 〜

60

° の

_{範囲}

の

位

置では，

3

，

000

　cps 以上の再生

特

性が

低

下し，その

範

囲を越えると特性は甚だ不良になることが

知られている。

listenability

のこのような不均衡は earphone によって是正されるが，　earphone

の再生能

力

には，

そ

の

種類構造

などによってかなりの

差

がある

i［

。普通のクリスタル

型

では，

200 〜

4

，

000cps

であり，これにビニ

ー

ルの adapter を装着すると ±

8db

の範囲が，ほぼ

500 〜3

，

000

cps になるといわ

れ

る5）

。

本調査

の communication 　equipment としては，

本学

の

language

laboratory

（

Sony

ER

−

7

D

_{）を用}いたが，その earphone は上と同

種類

の

Sony

C

−

₄

_型_で，周波数

特性

は

Fig

．

1

の

_通

りで

_あ

るe｝。

3

，

000

　cps

附近

にクリスタル固

有振

動の影響が見られるが，

大

体

5

，

000cps

までの

範

囲をとることがでぎるように思われる。 b10

・

d

一

艮o

一

20 Fig

．

1

．

使用 Earphone の周波数特性 CP5

1 　

さて母

音

の基本周

波

数は最低で

75cps

とい _わ _れるが7⊃ ，母音の音色決

定

に特に関係があり

識

別

に

重要

な

役割

をもつ

第

1formant

と

第

2formant

は

，

Gleason

によれば次のように

300 〜

2

，

100

cps に分布しているs）。

［

i

】400 ，2

，

100 【

e

】

500

，

1

，

800

［ae

］

650

，

1

，

700 田 300

，

1

，

500 ［

o］

600

，

1

，

300 ［

a

】

700

，

1

，

100 ［

u

］450

，

1

，

000 ［

01550 ，

900 ［

o

］650

，

800 ．

これらの

数値

は

観察

者

によってやや

異

なるようであるが，母音の

識

別に関しては equipment による

障害

は殆んどないと判断できるように

思

う。

　

これに反して子音では energy

_分布

の

_最

_{も多}い _{周波数範囲}は

3

，

000 〜7

，

000

　cps であるといわれており，特に高い周波数をもつ

fricatives

への影響が大きいことが予想される。　

Gimson

によれ邑ゴ9）

，

　

alveolars

　

3

，

600

〜

8

，

000

　cps

，

　

Plato・

alveolars

　

2

，

000 〜

7

，

000

　cps ，

　

labio・

dentals

　

1

，

500 〜

7

，

000cps

，

dentals

1

，

400

〜

8

，

000

　cps ，　

glottal

500 〜

6

，

500

　cps と

fricatives

の

中

にも相違がある

ことが判る。しかし sound 　spectrograph による

formants

の分

析

は

，

このような noise 　com

・

ponent

の

部分構造以

上に vowel 　

transition

が子

音

の

識別

に

重要

な

役割

を果していることを明ら

かにしているiO）

。したがって周波数範囲の比

較

のみから

識

別への干渉度を判断することは

甚

だ

危

険

であり，この意味で

実際

の co皿 munication において両

者

の

関

係を調

査

した

G

・

A

・

Miller

の

資料

が非常に参考になる11 ，。つまり彼は system 　

frequency

　response を

200 〜

300， 200

〜

400 ，

200 〜

600

，

200 〜

1

，

200

，

200 〜2

，

500

，

200 〜

5 ，

000

および

200 〜6

，

500

と

変化

させた場合の articulation

score の影響を，アメリカ人女性

4

人，カナダ人女性

1

人の

計

5

人を

被験者

として，

16

の子音につ

(5)

音声的個性の

SQund

Recognition

への影響につ _いて

_（渋谷

　

勉） 1［Sl 踟 6

「

丿

4r） 20 gps

Fig．2．

Frequency

Response

と

Consonant

Recognition

_との開係

いて実験している。その資料から今回の調査に用いられた

7 個

の子音を選び_，それぞれの応

答

数全

体に対する正しい stimulus

−

response のパ

ー

センテ

ー

ジを算出すると

Fig

．

2

のようになる

。

なお

この実験では・

SXN

は十

12

db

に固定し，使用 earphone の周波

数特

性は

200

〜

6 ，

500

　cps であ

る。

F

三9

・

2

からは

high

frequencies

除去による

fricatives

識別への影響が明らかに見られるが_，

その_{程度}はさきに調べ _た

fricatives

の _{周波数範}_囲の比

較

から予想されるほどには大きくないよう

である

。

なお

1

θ

1

は

200 〜

6 ，

500cps

の _{範囲}｝こおいてもなお

69

％の識別にとどまっているが，こ

れは verbal 　context および visual 　observation の欠如などの影響にもよるものと思われる

。

次

に

Fig ．2

にもとついて，今回の調査の communication 　equipment の特性による各

phonemic

contrast

識

別へ _の

影響

_を

考

_え_る_こ_{とにした}い _。ま

ず

／z1

−

161

については，

共

に

識別

は

劣

るが両者の

識別条件には殆んど差異はないと見ることができる。

1b1

−

！v／では，破裂音の

1b1

は高い周波数の

影響がなく識別に

有

利な条件を

有

してはいるが，

fvt

との差異が特に

著

しいとは

考

えられない _。し

かし！sf

−

_〆θ

f

においては，周波数が高いほど両者の差が増す傾向があり，

101

の低い識別を考慮に入

れる必要が_ある。〆

f1−

〆

h

！に関しては，！

h

！のより詳しい資料を

Lehiste

の実験結果に求めると12｝_，

その

for

皿 ants は

initial

position

において

F1400

〜690

　cps _，　

F

2950

・

−

2 ，

130

　cps

，

F

31 ，

810

〜

2

，

670

　cps の範囲にあることが判る。またその spectrogram は常に後続母音の

formant

　structure

に _{酷似す}るとい _う

特

_{微を有} しているので， equipment の影響は非

常

に

少

ないことが予

想

される。したがって倒との間に識別条件の相違があることに注意しなければならない。また

11f

−

1r

！にっいては，

Gimson

から再び引用すると 13），！

11

の

F1

は後続母音の

F1

に近く

360

　cps 以上であり，

F2

は

840

〜

1

，

800

　cps ，また／rノとの識別に重要な役割をもつ

F3

は

1

，

920

　cps から

後続

母音の

F3

に _近い_範囲に _ある。！r！では，　

F

1120 〜600

　cps ，　

F

2600

〜

1

，

560

　cps ，　

F

3840 〜1 ，

920

cps である

．

これから〆

IHr1

の

_識別

に

関

しては母

音

と同

様

equipment の

_影

響がないものと

_判断

できる。

　

なおこの調査に用いた

lab

の earphQne と

tape

　recorder

（

Sony

TC

−777A

_）の speaker にょ

る recognition の比

較

を，本調

査

とは別の

group

50

人によって

実

施したところ

Fig

．

3

のような結果を得た。ただし教室では被験者全員が speaker の中心線から

6Q °

以内の座席に配麗されてい

(6)

1

相模工業大学紀要　第2巻　第羣号る。

Fig

．

3

には earphone ，　speaker に関し

て

一

般に予想される差異1 ％よなく，両者殆んど変らないが，

fricatives

の

識

別では ear

・

phone の

特

性の

方

が speaker の特性およびその

環境条件

よりも

強

い _影

_響力

_を

_有

していると見ることがで _きよう。

3 ．

Listeners

　

英語音

の

_識

_別は被

験者

としての

listeners

の

_有

する条件によってその結果に差異が生ずることは，経験から，また

2

，

3

の

資

料 15）の比

較

からも十分に推測できることで

あ

る。し 80

哩

弼 4り 20loii ，　

／

Zt

’

鴬

珈

胤

影傷

ル，，

ll

，亠，

Fig ．3．

Earphone

　と　

Speaker

　とによる

　　 Sound 　Recognition

たがって

調査結果

の

分析

に際しては，被験者集団およびその構成員の特徴の十分な理

解

が

伴

なわな

けれぽならない _。

　

この

調査

の

1isteners

は

40 年

度本学

1 年

次

学

生

55

人である。彼等は全

員選択英語

として

英

語

発音

矯

正の前期授業を終了している。その内容は毎週

1

時間

1ab

において習得上の

trouble

　spots

を， r ognition および

production

の両面にわたって

重点的

に

練

習

す

る。　

Fig

．4

は

学生

の診断

用および授業効果測定用として

4

月および

10

月に実施した

50

問の aural 　perception 　test の結

果

を

得

点カテゴ _リ

ー

_別に分類したもので

あ

る。これによってこの

group

の英語音

識

別に関する

特

徴を知ることができる。まず練習による識別能力の向上は顕

著

で

，

それは

2

つの大きな group を

形成していることが

注

目される

。

これを平均値でみると，

pre −test

43 ．

4

，　

post−test

65 ．

8

でその間

の向上

率

は

51 ．

6

％となる。さらに個人別に調べると

，

1

人の例

外

もなく

識

別能力が向上しており，

pre −

test の _下

_位者

から上位者に至る

向

上

率

の

推移

は大

体

好ましいカ

ー

ブを

_描

いていることが判る。また

学生

の欠席回数は比較的少なく，

欠席時間数

（

X

）

と

識

別

力向

上値（

Y

）との相関係数は

一

_〇

_．

₅₄₃

で，その回帰

直線

は

Y

＝

−

_3X

_＋

₂₅

_．

₉₉

_（

₀

_≦

_X

_≦

₇

_）

_で

_表

_{わされる} 。このことは

毎時間

の

練習

が

効

果的に _行なわれたことを間接的に実証しているわけであるが，

lab

のような機械学習においては学習者の学習に対する関心度がその

効

果に

_少

なからず影

響

を与えることを

考

えると，その

原

因の

1

つを学生の側に帰することができるようである。この点をさらに明確にするために，この選択学生

1 」

_；_o Ll）「rl

Fig．4．

Listeners

の

Recegnition

Ability

_{分布}

(7)

音声的個性の

Sound

Recognition

への影響につ v

・

_て_（_{渋谷} _{勉）}

（つまり本調査の _{被験者）}に _対して行なったものと全く同

一

の test を

，

41

年

度

1

年次学生全員（

lab

授業は必修で，前

期授

業の内

容

は選択の場合と殆んど同

一

）に実施したところ

， pre ・

test

36 ．

7

，

post−test

49 ．

6 ，

その間の

_向

上

率

35 ．

2

％を

得

た。この

数値

は両

者

の

pre

・

test

の

差異

から

選択学

生

の約半分の向上率と見敬すことができよう

。一

般に sound 　recognition においては

，

学習

者

の

_質

的要素よりも

集中

的

練

習による量的要素の方がその能力向上に深く関係する傾向があるから，ここに見られる両者の向上率の _差の _{大部}分を

，

その

_学

習意欲乃至関心度の _{量的}

_差

_異と

解

することがで _きるように思う。

以

上を

綜

合

す

ると，本調査の

listeners

は学習に対する関心度は非常に

高

く，

授業

の最終段階で行なわれた今回の

一

連の

test

に対しても積極的な関心を示し，　

test

結果に偶然性の要素が介入することが少なかったものと推測でき，したがって

被験

者としての信頼

性

は比

較

的

高

いと結論するこ _とができるように _{思う}

。

4 ．

Native

informants

　この比較研究のために選んだ native 　

informants

は，すでにわが国の英語教育界において知名

の米人

V

．Brown

氏と

J

．

Callender

_{女史}_{および}_{本学英}_語_講_師

J

．

Moes

女史の

3

人である。

Brown

に _関しては

，

その著

Improving

Your

Pronunciation

附属

tapei5

）

，

また

Callender

に

っいては，

ELEC

English

Course

，　part 　

2 ，

　vol

．

1

附属

tape17

｝

からそれぞれ

test

用の

tape

を

19cm

_！sec の speed で編集した。　

Moes

は本学講師として

1964 年 9 月

から約

1 年

間

教

鞭をとる

と共に

lab

教材の録音編集に協力した

Califernia

出身の米人であり，その tape は本学の

lab

附

属録音室

で

Sony

C

−37

A

　microphone と

TC

−777

A

tape

　recorder を用い

19cm

！sec で

test

materials _を_{録音} したものである。

　

なおこ _{れら}の _{使用}

tape

に

tape

　noise の

問題

が

考

えられるが，これにはさ

き

の

Miller

による他の実

験

結果が参考になるls）

。っまり彼は

frequency

　response を

200 〜6

，

500

　cps に

一

定

にしておいて，

SIN

を

一18db 〜

＋

12

db

の

範

囲で変化させた時の子

音

の

perceptual

　confusions

を

調

べ _た_{わけ}で

_あ

るが

，

その

_資料

を

整

理してみると

Fig

．

2

と同じような

傾

向を示

す

ことが判る。また同時に，通常の範囲内では

SIN

による recognitiQn への影響は，さきの周波数範囲による場合よりもかなり

少

ないことが理解できる

。

また

tape

編集の際の recopy による

録音特

性低下の問題，あるいは

tape

　speed の影響なども無視でき

『

ないであろうが，これらに関する実験報告によれ

ば19 ＞，その影響はこの調査の system 　

frequency

　response の

limits

を越えたかなり高い周波

数

に現われることが判る。したがってここではその影

響

を検討する必要はなかろう。

5 。

Vowel

　recognition 　

5 ・

1

3

人の native 　

informants

による sound 　recognition の

_結果

をま

ず

母音について _{検討す}ることにしたい _。

Fig ．

5

から

判

るように words

中

に

含

まれる

phonemic

　contrasts の

_識

別に関しては， speakers の間に

大き

な

違

いは見られな

い _。

_最

_{も大き}い _{差異}で

1uw

！

−

fu1

の

Brown

100 Sl 50 　　　 ’i」厂　

一

ii

，

F

・

₁

_・

40

　　

i

（

慧

窪

む

1 「

Fig ．5。

Speakers

_と

Words

_中_の

Vowel

RecognitiOn

との _関係

(8)

5 相模工業大学紀要第

2

巻第

1

号 contrasts の場合について

Fig

，

6

を

概

観したい。全体の平均は words の場合より

10

％ほど

低

下しており，それは

Moes

が

最

も

少

な

く 4 ．

5

％，っいで

BrOwn

の

5 ．

3

％，

Callender

には

19 ．

5

％もの減少が見られる

。

各

phonemic

　contrast における

識別

の差

異

は words よりも遙かに著しく，

10w

！

一

！o ！の

Brown

・

Callender

間

の

23 ．

6

％を最高に

，20

％以上の

差

異が

10f

−

1er

ノおよび

fuw1

−

1u

！にも

現

われているのが大

き

な

特

徴である。

Moes

間の

5 ．

1

％で

_あ

る。

5

組の

phonemic

　contrasts の中では！a1

−

foX

の

識

別が最も劣り他と

の間に

20

％以上の差があるが，この傾向はどの speaker にも現われているのでその間の開きは

ない

。

しかしこの

phonemic

　contrast のために用いた各問題ごとに，

3

者共正解した

listeners

の割合の平

均

は

39 ．

6

％で

あ

り，

他

の contrast の

半分以下

で

あ

ることから，

1a1

−

1e

！

の

識

別

には speakers による難易差が

感

じられたことが推察できる。

　

5 ・

2 次

に sentences の

中

の

phonemic

　　　鴨　　　　　　　　　　　　　　　　　　　　　　　　　　　　　 lijt

−、

「

ii 　　　 1りo

　　　　　　　　　　　　　　　　　　　　　　　、

　　　、　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　f？i

−

1●rJ 　　　、　　　丶　　　　

，

　　　　tvwi

−

1ut 　　　 N　　　　　ノ　　s 　　　　ev _{＼／} _丶

・

_、

f

’ 　 t。i

＿

i。1 　　　　＞

’

M鳴　　　　

’

、

／　 _，。w，

一

∫。，　　　》 OD 40 BrOvvnCalltnder

，

iji　 ivwt　／ow ノ　溜　　rit_BrOwn（lalSendtr　　Mees 　 l　　 l　　 l　　 I　　 I

〃　　lu厂　

」

，

01　ρ r’　 i；1

Fig ．

6

．

Speakers

と

Sentences

中の

Vowel

Recognition

との関係

　　　　　　　　　　

なお

listener

個人別による speakers の識別の差は！

ij

！

−

／

i

！を除きかなり

著

しく， words と同

様

1a

！

−

fef

の場

合

が

最

も大

きい_。

次

に vowel 　recognition に

大き

な

差

異を生

じた

pair

　words または

pair

　sentences _を，

筆者

の auditory 　

impression

による

分析

と比

較検

討しながらその影響因子を明らかにしたい。

　

5 ・

31ij

！

−

1if

．

Words

，　sentences とも

識別

は

非常

によ

く

，また speaker による差異は殆んどな

いが，聴覚印象では

3

者間に若干の相違が感じられる。まず音色にっいて

3

者を比較すると，！

ij1

は

Callender

がより

tense

であり，ノ

i

ノでは

Brown

がより

1ax

に

聞

える。両

音

の

音

色の

相対的

な差は

Brown

が最も大きい _。しかし同

一

音声環境にあるため

，

このような

quality

よりも

1ength

の差の _印

_象

の

_方

_が

_遙

かに

強

い _。

_各

speaker とも

1

三

j1

，！

i1

は後続子音の性

質

による

1ength

の

違

い

が

認

められるが，

3

者を比

較

すると！

ij1

では

Brown

，　

Callender

，　

Moes

の順に

僅

かながら長目に

なっている

。

しかし〆

i

！との相対

的

な

length

差

は

3 者

共非

常

に明

瞭

で

あ

る。また sentences の

場

合

は両音が sentence 　stress をもつためややゆっくり強く発音される傾

向

が

見

られ_る

。なお

Moes

の _文の

tempo

は他の speakers よりも筐かに遅く

length

の

差

がさらに

明白

になる。

　

5 ・

41uw

！

−

1u1

．

Words

による識別では

3

者間に大差はない

。ここでも！

il1

−

！

i1

と同様，　

distinctive

feature

で

あ

る

quality

よりも redundant 　

feature

の

length

の方が

識

別に大きな

役割

を

果

しているこ _とが

_認

められる。

Callender

と

Moes

の間には両者共

1ength

差が殆んどないが，　

Brown

の！uw1 ，

1uf

はそれより短か目である。音色については，！uw1 の唇や舌の

緊

張を

伴

なう

硬

い

感

じ

は

一

致

しているが，

Moes

の！u！はやや

lip

・

rounded な感じに聞える。また

Callender

のノuw1

は他の speakers よりも

louder

である。

　

Sentences

では words

と異なり

speakers の

間

に

_識

別

の

差

異が生じており，　

Brown

・

Callender

間

20

％，

Moes

・

Callender

間

11 ．

8

％の開きがある。

3

者共文

中

の両音には stress が

あ

るが，

その

程度

には

_幾

らか

相違

が

あ

り

Brown

の場合が

_最

も

強

くしたがって

両

音

の

差

を

聴取

しや

す

い。

Moes

では音色の差は

Brown

より

僅

かに劣るが，

1ength

の

違

いは明

瞭

である。また

Callender

1 一

₄₆

一

(9)

音声的個性の Sound 　Recognition への影響につ _い _て_（_{渋谷} _勉_）

の

発音

では

length

の差は

Moes

よりやや少なく

Brown

とほぼ同じ程度であるが，　

quality

の

差

は他の

2

人よりも

少

ない

。

それは words 中の発音と比較しても明らかに認められる特徴であり，

これが sentences による

識別

を

21 ．

8

％も

減少

させている

有力

な

原

因と

考

えられる。

5 ・

₅

_／_ow1

−

_！₀₁

_．

Words

には speakers による

識

別の差は殆んど

見

られない。この

phonemic

contrast では

1ength

よりも

quality

が識別の cue であることは

3

者に共通した

特

徴である。し

かし！ow _！

_，

_ノo_！の音色には speakers の shades があり，これが sentences 中ではさらに広い範

囲に及び識別に大きな影

響

を与えてい _るこ _とが認められる。

Sentences

の平

均値

では

Brown

・

Ca11ender

間

23 ．

6

％

，

Brown

・

Moes

_間

16 ，

3

_％であるが，問

題

の

中

で

特

に

著

しい

差異

が生じたの

は，

bowl

−

ball

をもつ

pair

　sentellces で，　

Brown

の

識別

が

92 ．

7

％，　

Moes

が

76 ．

4

％，さらに

Callender

は

58 ．

2

％と低くなっている。　

Brown

は sentence 　stress がある場合，他の speakers

よりも

強

くゆっくりと明瞭な発音になるので，両者の

音

色の

特

徴を比

較

しやすい。ここでは！o〆の

硬い _感じが

特

に識別を

助

けている

。

しかし両音の長さは単語の場合と同

様殆

んど

変

らない _。

Cal

−

lender

では！ow1 の

1w1

が

Brown

より

も弱

く，両音の音色の差はやや縮少している。また

Moes

の場合は

10wf

の _発

_音

は

Callender

とほ _ぼ同性質であるが，！oノの

硬

い

感

じは

Brown

と

Cal

−

lender

との中間程度である。このように

10w

ノに関してはその

diphthongization

の程度に差が見

られる。なお

3

者共平

均

値は words の場合よりも劣るが，　

Callender

では

28 ．

9

％

減

と顕

著

で

あ

る。

5 ・

₆

_！eiL _！erf

．

Words

の平均値では speakers の

差異

は大きくないが，

5

間中

pus

−

purse

の

pair

　words では，　

Callender

100

％，　

Brown

98 ．

2

％に対して

Moes

は

78 ・

2

％である。　

for1

は

3 者共

1r

！の _響きをもち比較的長く発音されている。／o！については

，

Moes

は他の speakers よ

りも前よりでやや長目の

発音

で

あ

ることが／orX との識別を妨げているように思われる。　

Caljender

の！a1 は！er _〆よりもやや

louder

に _聞えるのでこれが識別に役立っている。　

Brown

の

1

θr！，

10

！は

共に比

較

的短かい発

音

であるが

，

両音の _{相対的}な長さの_差は，他の

2

人よりも大きい。

　

Sentences

の

場合

は，　

Brown

・

Ca

】

lender

間

20

％

，

Moes

・

_Callender

_間

₁₉

_．

₁

_％ _の

_{大き}

_い

_相違

が

見

られる。文中に

gulls−girls

をもつ問題についてみると，　

Moes

87 ．

3

％

，

Brown

80 ．

0

％，　

Cal

−

1ender

56 ．

4

_％と speakers の _差は平

均値

よりも

遙

かに大きい。　

Brown

では

文

尾の rising 　

in

−

tonation の影

響

で

fo1

が長目に発音され

1er

／の長さに近いが，

音

色の

差

はかなりよく

識

別できる。

Callender

の！e ！もやはり

長

目で

あ

るため，両者の識別はその

quality

に

頼

ることになるが，

後

続する

dark

1

_［_†】のため

1erlf

の

fr

／の _{響き}が十分に聞えず

1elf

との区別が困難である。これに

対

して

Moes

は

tempo

が他の

2

人よりもやや遅く！erl _！が長目に発音されているので，　

Callender

よりもノr1 の響きを聴取しやすい _。

5 ・

7 ！

af

−

fe1

．

_調査

に

用

いた

母音

の

中

で

最

も

識別困難

な

phonemic

　contrast であるが，　words の

平均値では speakers による差異は殆んど見られない _。しかし問題別では

20

％以上の相違が生じている場

合

が

あ

るのでその

特

徴を概

観す

ることにしたい _。

pop

−

pup

の

_識

別は

Callender

70 ．

9 ％

，

Brown

65 ．

5

_％であるのに対して

Moes

は

36 ．

4

％と著しく劣っている

。

Brown

の！a！は〆eノよ

りも sonorous であり

区別

は比

較的容易

で

あ

る。　

Callender

の場合も

1a

！の

方

が

長

目の

発音

で

sonority が高い。しかし

Moes

には

length

の差が殆んどない上に，　

fo

／は

Brown

ほど明瞭で

なく，やや中央

寄

りの

【

e

］

に近いのでノa！との音色の差は他の speakers ほど明らかでない。さら

に組合わせられた

3

語の中，最初の語がやや

強

く

発音

されているので，

listener

の立場からは各

語

(10)

相模工業大学紀要　第2巻　第 1号（の

loudness

の差に妨げられて，その

phonemic

　contrast が識別し難い。また robber

−

rubber

の

pair

　words では，　

Moes

83 ．

6

％，　

Callender

70

．

9

％，　

Brown

58 ．

2

％と上の場合とは逆に

Moes

の識別が

非

常によいが，その

原

因の主なものは

length

の差にあると思われる

。

つまり

Moes

の

1a

ノはここでは

【

q

’

_】の発音であり，！of との

音

色の

差

以上に

1ength

の

差

が明らかで

あ

る。この差

は

3

者の _中で _最も大きい _。

Callender

の音色は

Moes

とほぼ同程度の差異があるが，

1ength

差は

より

少

ない。

Brown

では

音色

の

差

は

Moes

，

Callender

よりやや明

瞭

であるが，　

length

には

殆

ん

ど差が

見

出されない。

American

English

の！eノ，

1a1

にはかなり

広

い

範

囲の allophones があるこ

とは，この

3

人の speakers にも

認

められるが，その recognition 　score から判断

す

ると

1isteners

はここでも

quality

よりも

1ength

の _差に敏感であると言えよう。このことは，その母国語として

の日本語がこの

phonemic

　_contrast _{を含まな}いこと，および

1engt

血は日本

語

では有力な

dis

・

tinctive

feature

_で

_あ

_ることなどからも十

分

理

解

し

得

る。

　

次

に

pair

　sentences による識別を見ると，　

Moes

・

Brown

間

12 ．

8

％

，

Moes

・

Callender

間

19 ．

1

％の

差

が

生

じており，

特

に

Moes

では，　 words よりも

逆

に

7

％

高

く

3

者中最

も

よい

識別

であることが注目される。問題としては， shot

−

shut を

含

む sentences において

Moes

80 ．

0

％

，

Brown

60 ．

O

％

，

Callender

50 ．

9

％の差が現われている。これは，　 words の場合に

見

られた

1a1

，

ノe ！の allophones の

personal

　shades が sentences ではさらに

prosodic

features

の影

響

を

受

けるためと思われる。つまり

3

者共， sentence 　stress をもっ両音は強く発音されてはいるが，そ

の _程

_度

に _相

_違

_が

_あ

るので

quality

および

1ength

にかなりの

_個

_{人差が生じ}ている

。特

に

Moes

の

1a

！は長く

louder

であり

10

！との識別が容易である。これとは対照的に

Callender

の〆a！，！e1

の音色の差は他の speakers よりも少なく，また

length

の差は

Brown

よりも小さい

。

したが

って綜合的な prominence の差異は

3

者中で最も目立たない。

　

5 ・

8 以

上 vowel 　recognition における speakers の

音声的

特

徴

の

_影響

を

概

観したのであるが，

母

音

にはその

quality

および

length

に speaker の shades がかなりあることが

認

められ，

phonetic

な立場からは speakers の

_差

は大きいと言えよう

。

しかし母音がその性格として

，

平均

9 〜47microwatt2

°）

の大きな

power

を有しているので，　speaker のもつ

phonetic

　shades は相

対的

に

_{弱く}

， words

中

ではその

音

声環境

による

変

化

は

見

られるけれども，母

音

固

有

の energy に

強い _{影響}を

与

えるほどではなく

，

したがって speakers 間の識別の差異は全体的に僅少である。

　

しかしながら sentences においては

事情

が大分異なる。この場合セこはさらに

prosodic

features

の _影_響が加わるが，それは標準的な言葉を自然の style で読むという同

一

条件ecおいても，なおあ

る程

度

の

個

人差が

あ

るため

，

words において

見

られた各 speaker の allophonic 　sh∂

des

は，よ

り大きな energy をもつようになると同時に _個人的色彩を

一

層濃くする。特に母音の

prominence

の

_重要

な要素である

length

への影

響

が

著

しく，それは

直

ちに

識

別に影響を与えることになる。

一

般

に sentences では words と異なり co皿

text

による

補

足

効果

が

働

くと

考

えられるが，この種類

の sound 　recognltion の性格から

，

比

較的高

い識別においては殆んどその効果はなく，むしろ

syllable の

_増

加に伴なう

識

別低

減

効

果

の

_方

が大きい

。

しかしこの場合にも，文の

tempo ，

intona

・

tion

，　rhythm などと

関係

して speakers の

個人

差が

現

われる。このように sentences において

は，母音が speakers の音

声

的

個

性と関係する要素が多くなり，またその energy も相対的に大き

く

なるので，

識

別

に

大き

な

差異

が

生ず

るものと

推論

で

き

よ

う

。

剣

(11)

音声的個性の Sound 　Recognition への影響について　（渋谷　勉）

6 ．

Words

中

の consonant 　recognition

　 6 ・

1 子音

への _影

_響

をま

ず

pair

　words に関して

考

えることにしたい。

Fig

．

7

の

特

徴は speakers の _識別の差が著しいことである。これは母音の場

合

の

Fig

．

5

および

Fig

．

6

_との比較からも容易に判る。

1f

！

−

！

h1

以

外

のすべ _ての

phonemic

　contrasts において

20

％以上の

_識

別の差が

あ

り，特に

1s

_！

−

t

θ

f

の

Brown

と

Moes

の _{間 a}＝　

47 ．

6

％もの開きが見られる。平

均

値では

Cal

−

1ender

と

MoeS

は殆んど変らないが，

Brown

はそれよりも

20

％近く

高

い _。 _次に

　　　

／

’

_h

「

_i

_’

s

　

1

’

i 　 i”

’

画

母音の場合と同様，識別の差異の原因を筆

　　　

Fig

．

7

．

Speakers

と

Words

中の Consonant

者

の

_聴

_{覚印象}にもとついて検討してみた

　　　　　

Recognition

との関係

い。

6 ・

2

！

f

！

一

！

h1．

平均値においては speakers の間の相違が比

較

的少ないが

，

問題によって相当の開

き

が生じている。

fold

−hold

における

Callender

96 ．

4

％，　

Brown

70 ．

9

％，　

Moes

60 ．

O

％，および

feet−heat

の

Callender

89 ．

1

％，　

Brown

72 ．

7

％，　

Moes

63 ．

6

％の

2

組が特に著しく，ともに

Cal

−

lender ・

Moes

間に

36 ．

4

％および

25 ．

5

％の_大

_差

が

_あ

るが，その

要

因は！

f1

の

摩擦

の

強

さによる

と

思

われる。

Callender

の場合には，

後

続母音の影響があっても！

ff

は常に非常に激しい摩擦を伴

って発音されておりその持続時間も長目である。したがって，かなり強い呼気の流れる

1h

ノとの識

別は極めて容易で _ある

。

これに比較すると

Brown

と

Moes

の

ff

！の摩

擦

はずっと弱く，

Moes

で

はさらに

弱

いが，それは

聴覚

でも

十

分聴取できる程度の弱さであって，先述の communication

equipment の影響を過大視する必要はないように思う。なお摩擦の持続時間は

Moes

の方が

Brown

よりも僅かに長い。

6 ・

3111 −

fr1

．

平均値では

Brown

が他の

2

人よりも

23

％ほど優れており，

5

間中

4

問の

pair

words に

20

％以上の大

差

が現われている。まず alive

−

arrive では

Brown

89 ．

1

％，　

Callender

69 ．

1

％

，

Moes

67 ．

1

_％の_識別を示している

。

Brown

の

fl

！は

後

続母

音

の_{影響}のわりには比

較

的

暗

い _感じが少ないのに_対し，

1r

／はやや深い音色であるので両音は

識

別しやすい

。

Callender

の／

1

！は，

Brown

よりも

dark

な感じが強い。また

1r

ノの響きには

Brown

ほどの深さがない。　

Moes

の〆

11

の音色は

Callender

とほぼ同程

度

であるが，

1r

ノは

Callender

より

僅

かに

重

く聞える。また col

・

lect−

correct では

，

Brown

78 ．

2

％

，

Callender

45 ．

5

％，　

Moes

30 ．

9

％と speaker にょる識別の

差異が

一層

著しいが， speakers の音

声

的特

徴

は上の場合と変らない。ただし

Moes

の！

1

！，ノrノを

含む syllable の _{発音}は他の

2

人ほど強い stress がない

。

Phonemic

　contrast が

initial

position

にある

1ake

−

rake の識別では，　

Brown85

．

5

％，　

Moes

63 ．

6

％，　

Callender

58 ．

2

％と僅かでは

あ

る

が

Moes

の

方

が

Callender

より

も優

れている。両音の音色の

差

は

Brown

が

最

も明

瞭

であり，

Callender

では！

11

の sonority がやや高い_。またこの位置では，　

Moes

は

Callender

よりも僅

かながら音色の _差が大きい

。

cloud

−

crowd は consonant 　cluster の識別問題であるが，

3 者

共に