`gf)ilftYma{!I!cD
Sound
Recognition
/ ×(DtcW}CDLi'C
7k'g
l:iL
pt*
The
Infiuence
ofAllophonic
Variants
ofEnglish
Native
Speakers
upon
Japanese
Learners
in
the
Reeognition
ofSound
Contrasts
Tsutomu
SHIBUYA
It
is
very often observedthat
Japanese
learners
ofEnglish
have
greatdifficulty
in
acquiring the recgnition ability of certain Englishphonemic
contrasts shown by a contrastive study ofthe sound structures of
English
andJapanese.
A
close examination of this tendency,however,
reveals that the degree of the difficultyisdifferent arnong those examiners who are speakers of
the same
dialect
and read the test materials similarlyin
the natural style.
The
present studyhas
the purpose ofdrawing
a clear picture of the nature of thiskind
ofdifference with three
Americans
as naitve infQrmants and withfifty-five
Japanese
college freshmen as examinees.Test
materialsfor
this purpose werebased
on theTest
ofAural
Perception
in
English
for
Japanese
Students
preparedby
R.
Lado andR.
D. Andrade, but with manyaltera-tions
both
on testitems
and onlistener's
responses.As
a communication equipmentfor
theseseries of tests the
language
laboratory was used, whose limitsin
the systemfrequency
response were minutely examined in relation to the acoustic characteristics of each of the target sounds.The
data
obtainedfrom
the experiment were closely compared with the writer's auditory impres-sions of the speakers' taped voices, whichleads
to thefollowing
conclusion.Aural perception of phonemic contrasts isto discriminate an allophone of one phoneme from
an allophone belenging to the other phoneme inthe same phonetic environment.
Each
allophone has its ownprominence
associated with suchfactors
asquality,
length,
stress and pitch.In
thefirst
twofactors
conditiDnedby
the context or the situation, there arelikely
tobe
slightvariations pertaining to the speaker's speech habits. Moreover, in the stream of speech, these factors are strongly affected by the
prosodic
features having morepersonal
nuance. Thus phonetically thedegree
of prominence of the same allophone israther different among speakerswhen spoken under
the
same eonditions,Once
two
allophones are putin
contrast as reeognition items, thedifference
of this sort tends to become quite marked. These allophonic variations ofthe
speaker may causelittle
trouble to the nativelisteners
of the samelanguage,
but
theycome to exert a more powerful influence on
Japanese
learners
whose common core with thespeaker
in
speech cernmunicationis
still smaller in their present stage, with varying degreesofits
infiuence
in accordance with vowels, consonants andpair
words, pair sentences.As
for
vowels, far greater than consonants in power, the infiuence of allophonic variationsof the speaker,
if
in
pair words,is
not great enough to give any troublein
recognizing thecontrasts; while
in
pair sentences, the quality and thelength,
the rnost significant cuefor
the vowel recognition, coloredin
different tintsby
theprosodic
features,
diversify the students'ability in discriminating the same vowel contrasts.
On the other hand, the recognition of consonant eontrasts
is
subject tobe
affectedby
anykind
of small energyboth
in
pair words andin
pair sentences, sothat
the
consonantrecogni-*
senptge.
-39-i
相 模工 業 大 学 紀 要 第 2巻 第 1号
tion
is
net on 且yfar
more difHcult than the vowe 且 recegnition,
but
also suffersfrom
the stronginfluence
ofphonetic
variants of the speaker, showing wide variations among the recognition
data by different speakers
.
But the degree of this difference varies according to pair wordsand pair sentences : the difference in the latter is perceived to be 1ess great than that in the
former .
ま え が き
Contrastive
phonetics
eよ最 近の 音 声 学 の1
つ の傾 向で ある。 しか し外 国 語 と母 国 語の 音 体 系の音
素 論 的 比 較に よっ て予 知で きる学 習上 のtrouble
spots は,production
と recognition に必 ずし も共 通に生 ず るとは限 らず, 両 者は区 別 して考 慮 する必 要 が ある。 ま た 実 際の speech commu
・
nication に おい て 話 者の 立場と しての
production
は,
phonemic
features
の 正確な習 得段階にお い て
一
応 「訛 り」 はあ っ て も誤解さ れ るこ とは ない が , 後 者に 関 して は,distinctive
features
が
識別
しに く く redundantfeatures
に依存す
る場合
がしばしば起
る。 し たがっ て recognition にお い ては , phonemes ば か りで な くそ れに属 する種 々 の allophones の 特 徴の 十 分 な理 解に まで及
ば ね ば な ら ない。 しか し allophones と
phonetic
centext お よ び situation との間に は, なおspeaker の
personal
shades が 関 係して い る と思わ れる。 そ の ような sound shades は , 多 くの場 合, native speaker 自 身に は意 識 さ れに くい ようで あるが, わ れ わ れ 日本 語を 母 国
語
とする1istener
に は, 同一
dlalect
の speaker に よ る 同一
音 声 環 境の allophone に も 種々 のpersonal
shades が
感
じ ら れ,
そ れ が sound recognition に 影 響を与え る場 合を よ く経
験 する。
しか し,
これ まで こ の種 類の 影
響
の実
態は十 分 明ら か に さ れて い ない 。 そ れ は, 自
か らの 中に幾
つ かの 有 力なvariables を含 む speech communication system に お い て, allophone を 生 成 する諸 要 素の中
か ら speaker の
personal
shades に よ る影 響を客 観 的に 取 り出 す こ とが甚 だ 困 難である こ とに よる と
思
われ
る。 こ の研究
は,3
人
のEnglish
native speakers をinformants
とし て行 なっ たrecognition の 資 料 と筆 者の聴 覚 印 象 との比 較か ら, 相 対 的に 以 上の問 題 を 究 明 し よ うと試み た も
の で
あ
る。1
.
Test
materialsSound
recognition に は,常
に それに 附 随 する variables の影響
を無
視 する ことは で き ない。し たがっ て,
本
論に 入 る前
に, そ の性格
とrecognition へ の干
渉度
を予
め検
討 し て お く必要
があ
ろ う と思われる。は じ め に比
較資料
を得
る た め に用
い たtest
rnaterials につ い て考
え るこ とに し たい 。英語音
の recognition の客 観 的 評 価は, そ れが単 なる知 識で は な く技 能に 属 す る評 価である た め 従 来 非 常に困難視
されて い たが, 言語
の音素
比較
の応
用に よっ て よ り高
い validity と reliability とが得
ら れ る よ うに なっ た。 つ ま り発 音の 基 本 的 な聴 取力 とい うの は , 音 声の phoneticdifferences
を聴き分
け る力
で はな くphonemic
contrasts を識
別 する力 を 意 味 するの で あ り,Robert
Lado
は この ような
phonemic
principle
に よ っ て母 国 語と外 国 語の音 声 組 織を 比較 し種 々 の有
効なtest
の作
成に貢
献し て い る。彼
とRichard
D
.
Andrade
の協力
に よる“
Test
of
Aural
Perception
for
Japanese
Students
” は, 日 本 人の英 語音
の聴
取 能力
を診 断 す るの に 極め て 正確な もの とい わ れて音 声 的 個 性 の
Sound
Recognition
へ の 影響につ い て (渋 谷 勉)い る。 わ れ わ れ 日本 人の立 場か らは これに はなお検 討 すべ き問 題があるが,
書
記号に頼
ら ない こ の直接 的
なtest 方法
に は高
い reliability を与
え られ るよ うに思
わ れる。 因みにLado
に ょ れ ば,ラ テ ソ アメ リ カ
人
に用
い た “Test
of
Aural
Perception
for
Latin
−
A
皿 ericanStudents
”
の 信 頼度
は,0
.
90
±O
.
02
と非 常に高
い こ と が報告
されてい る1〕
。 今 回 用いた
test
は, その理論 的背景
,問題形式お よ び解 答 方 法に 関して は
Lado
の test に準 じて い るがその 内 容は 異な る。
こ こで は聴
取 上の問 題 点 を
10
組のphonemic
contrasts に制
限 し,
vowels と して ノij
ノー
1i1
,
!aNe !,
fe1
−
/or!,
/uw /
−
1u1
,!ow /−
fof
の5
組
, お よび consonants か らは !s!−
〆e1
,1zf
−
16
〆, !1
/一
∫r1 ,1b1
−
1v
! , /f
/一
/h1
の 5 組を選び, 各 contrast ごとに 音
声
環境
の 異な る5
組のpair
words と2
組 のpair
sentencesを 基 礎に して
3
つ の wordsあ
るい は sentences の組
み合
せ を作
りこ れ をtest
materials とした。
Listener
は nativeinformant
に よっ て 明 瞭な自 然な sty 且e で 読 まれるこ れ ら3
つ の wordsま た は sentences の 組み合せか ら対 立 を な す
phonemes
の 異 同 を4
つ の 選 択 肢に よっ て答え る よ うに指 示 される。 とこ ろ で一
般に multiPle−
choicetyPe
の問 題で は, 選 択 肢は
4
つ 以 上設 ける ことが 望 ま しい と
考
え られてい る。Lado
では3
つ とも
異 なる組み合せ を 含め て5
つ の選択肢
が用 意されてい る が, その場 合は 特 定の
phonemic
contrast に対 する資
料に な り得ない の で こ こで は割愛 し た。 な お
後述
する よ うに , こ の 調 査の communication equipment の音 響 伝 達 条 件に お い ては ,
選択肢
の増
加はSIN
低 減 効 果につ なが り,listenability
を 低 下 さ せ る遠 因 と な るこ と も考慮
に 入 れ る必
要
があっ た。 つぎ
に予想
さ れる 問題点
は,pair
words ,特
にpair
sentences の 組み合せ 順
序
に よ る識
別へ の 影 響で ある。
そ れは聴 覚 像が瞬 間 的で不 安 定で ある か ら記憶
の要 素が 入 り,
同一 phoneme
の生 ず る組み合せ 順序
に は若干handicap
が伴な うの で はない か とい う危 惧である。 そ こ で 比較的 識別 困 難な !
i1
−
1jif
の contrast を もつ 同一
のpair
words とpair
sentences,
お よび
識
別 容 易 な1i
/一
/ij1
のpair
sentences に よ る組 み 合せを, 順序
を変
え重複
させ て作 成 した72
問の test materials に よる3
,888
例に よ り調 査 し た。 その 結 果4
種 類の 解 答 形 式に よ る識 別の 差 異ぱ若 干 生 じて ぽ い るが, そ れ がある特 定の解 答 形 式に 偏 して い る と判 断で きる ほ どの 明
瞭
な傾 向を見 出 すこ とは不 可 能 であ っ た。 な お 用い た
test
の相 関 係 数は,0
.
87
で あるこ と な ど を綜 合す
る と,今
回 のtest
materials はその方 法 を 含め て比較 的高
い reliability を有
してい る と考
え る こ と がで きよ う。2
.Communication
equipment音 声
に 含ま れ る 周波数
は100 〜10 ,
000cps
に わ た る とい わ れ るが2} , 録 音tape
に よる再生 音を 用い る場合
は, 再 生 回 路の音響条
件に よっ て大ぎ
な制約
を受け
る。 し た が っ て外 国 語音
の識別
の た め に は忠 実 度の 最も高い 再 生 装 置を 用い る こ と が望ま しい が, 現 状で は ある程 度の 制 約か ら免 れるこ とは で ぎ ない ので
,識
別の 対象
と な るphonemes
の acoustic characteristics との 関 連に お いて, communication equipment に よ る recognition へ の干 渉 度を明 らか に し て お か な ければ な
らない 。
再
生音
を用い る方法
と して は普
通2
つ の方
法が考 え られ る。1
つ は1
台のtape
recorder か ら一
斉
に聴 取 する 場合
で あ り,
他
は最
近 著しい普 及 を 示し て い るlanguage
laboratory
l
!こお い てearphone か ら個 別に 聴 く場 合で ある。 い ずれ の
方
法を と るに して も,
systemfrequency
re−
sponse は,
一
般に回 路の もつ音
響 特 性 よ り低い speaker あるい は earphone の特
性に よ っ て殆
ん ど 決ま る と考え るこ と がで きよ う。 ま た そ の特 性に お い て は speaker は earphone よ り
高
い も相 模工 業 大 学 紀 要 第 2巻 第1号 の を 得る こ と がで きる が,
listener
の 位置
, 部 屋の 残 響お よ び 外 部 雑音
な どの影 響が あ り平 等 なlistenab
三lity
を得
る こ とは困難
であ
る。実験
に よれ ば s} , speaker の中
心線
か ら30
° 〜60
° の範 囲
の位
置で は,3
,000
cps 以上 の再 生特
性が低
下 し,そ の範
囲を越え る と特 性は甚だ不 良に なる こ と が知 られて い る。
listenability
の こ の よ う な 不 均 衡は earphone に よっ て是正 される が, earphoneの 再 生 能
力
に は,そ
の種類構造
な どに よっ て か な りの差
が あるi[
。 普 通の ク リス タル
型
で は,200
〜
4
,000cps
で あ り, これ に ビニー
ル の adapter を装 着 する と ±8db
の範 囲が, ほ ぼ500 〜3
,000
cps に なるとい わ
れ
る5)。
本調査
の communication equipment とし て は,本学
のlanguage
laboratory
(Sony
ER
−
7
D
) を 用い た が, その earphone は 上 と 同種類
のSony
C
−
4
型で , 周 波 数特性
はFig
.
1
の通
りであ
るe}。3
,000
cps附近
に ク リス タ ル 固有振
動の 影 響が見 られ るが,大
体5
,000cps
ま での範
囲を と るこ とがで ぎる ように思 わ れる。 b10・
d一
艮o一
20 Fig.
1.
使 用 Earphone の 周 波 数特性 CP51
さて母
音
の基 本周波
数は最 低で75cps
とい わ れるが7⊃ , 母 音の 音 色 決定
に 特に 関 係があり識
別に
重 要
な役割
を もつ第
1formant
と第
2formant
は,
Gleason
に よれ ば 次の よ うに300
〜
2
,100
cps に分 布してい るs) 。
[
i
】400 ,2
,100
【
e】
500
,1
,800
[ae]
650
,1
,700
田 300
,1
,500
[
o]600
,1
,300
[
a】
700
,1
,100
[
u]450
,1
,000
[
01550 ,900
[
o]650
,800 .
こ れ らの数値
は観察
者
に よっ てや や異
な る よ う であるが, 母 音の識
別に関 して は equipment に よ る障害
は殆ん ど ない と判 断で きるよ うに思
う。こ れに 反し て子 音で は energy
分布
の最
も 多い 周 波 数 範 囲は3
,000 〜7
,000
cps である とい わ れ てお り, 特に 高い 周 波 数を もつfricatives
へ の 影響 が 大 きい こ とが予 想 さ れ る。Gimson
に よ れ 邑ゴ9),
alveolars
3
,600
〜8
,000
cps,
Plato・
alveolars2
,000
〜
7
,000
cps ,labio・
dentals
1
,500
〜
7
,000cps
,
dentals
1
,400
〜8
,000
cps ,glottal
500 〜
6
,500
cps とfricatives
の中
に も相 違 が あるこ とが判 る。 し か し sound spectrograph に よ る
formants
の 分析
は,
こ の よ う な noise com・
ponent
の部分構造 以
上に voweltransition
が 子音
の識別
に重要
な役 割
を 果 してい るこ とを 明 らかに し てい るiO)
。 し た が っ て周 波 数 範 囲の比
較
の み か ら識
別へ の干 渉 度 を 判 断 するこ とは甚
だ危
険で あ り, こ の意 味で
実 際
の co皿 munication に お い て両者
の関
係を調査
し たG
・
A
・
Miller
の資料
が非 常に参 考に なる11 ,。 つ ま り彼は system
frequency
response を200 〜
300, 200〜
400 ,200 〜
600
,200
〜
1
,200
,200 〜2
,500
,200
〜
5
,
000
お よ び200
〜6
,500
と変化
させ た場 合の articulationscore の 影 響を, ア メ リカ人女 性
4
人, カ ナ ダ人 女 性1
人の計
5
人 を被験者
と し て,16
の 子 音につ音声的個 性の
SQund
Recognition
へ の 影響につ いて(渋谷
勉 ) 1[Sl 踟 6
「
丿
4r) 20 gpsFig.2.
Frequency
Response
とConsonant
Recognition
との 開 係い て実 験して い る。 その 資 料か ら今 回の 調 査に 用い ら れ た
7 個
の子 音を選び, そ れ ぞ れの応答
数 全体に対する正 しい stimulus
−
response のパー
セ ン テー
ジを算 出 する とFig
.
2
の よ うに なる。
なおこ の実 験で は・
SXN
は 十12
db
に 固 定し, 使 用 earphone の 周 波数特
性は200
〜6
,
500
cps である。
F
三9・
2
か らはhigh
frequencies
除 去に よ るfricatives
識別へ の 影 響が 明 らかに 見 られる が,そ の程 度は さきに調べ た
fricatives
の 周 波 数 範囲の 比較
か ら予 想される ほ どには大 きく ない よ うで ある
。
な お1
θ1
は200
〜
6
,
500cps
の 範 囲}こおい てもなお69
% の識 別に と ど まっ てい る が, これは verbal context お よ び visual observation の欠 如 な どの影 響に もよ る もの と思 わ れる
。
次に
Fig .2
に も と つ い て , 今回 の 調 査の communication equipment の 特性に よ る各phonemic
contrast
識
別へ の影響
を考
えること に し たい 。 まず
/z1−
161
につ い ては,共
に識別
は劣
る が両 者の識 別 条 件に は殆ん ど差 異は ない と見るこ とがで きる。
1b1
−
!v/で は, 破 裂音の1b1
は高い 周 波 数の影 響 が な く識 別に
有
利 な 条 件 を有
してはい る が,fvt
との差 異が特に著
しい とは考
え られ ない 。 しか し !sf
−
〆θf
に おい て は , 周 波 数が高い ほ ど両 者の差が増 す 傾 向があ り,101
の 低い識 別を考 慮に 入れ る 必要がある。 〆
f1−
〆h
!に関しては, !h
!の よ り詳しい 資 料 をLehiste
の 実 験 結 果に求め る と12},その
for
皿 ants はinitial
position
におい てF1400
〜690
cps ,F
2950
・
−
2
,
130
cps,
F
31 ,
810
〜2
,670
cps の範 囲にあるこ と が判る。またその spectrogram は常に 後 続母音のformant
structureに 酷 似 するとい う
特
微 を 有 し て い るの で, equipment の影 響は 非常
に少
ない こ と が予想
される。 し た が っ て 倒 との間に識 別 条 件の相 違がある ことに注 意しな け ればな ら ない。 ま た11f
−
1r
!にっ い て は,Gimson
か ら再び引用する と 13) , !11
のF1
は後 続母音のF1
に近く360
cps 以 上であ り,F2
は840
〜1
,800
cps , また /rノとの識 別に重 要 な 役 割 を もつF3
は1
,920
cps か ら後続
母 音のF3
に 近い範囲に ある。 !r! で は ,F
1120 〜600
cps ,F
2600
〜1
,560
cps ,F
3840 〜1 ,
920
cps である.
これか ら 〆IHr1
の識別
に関
し て は母音
と同様
equipment の影
響がない もの と判断
で きる。なお こ の 調 査に 用い た
lab
の earphQne とtape
recorder(
Sony
TC
−777A
)の speaker に ょる recognition の比
較
を, 本調査
と は 別のgroup
50
人 に よっ て実
施し た とこ ろFig
.
3
の ような 結果 を得た。 た だ し 教室で は被験 者全員が speaker の 中心線か ら6Q °
以 内の 座 席に配 麗 されて い1
相模工業大学 紀 要 第2巻 第 羣号 る。
Fig
.
3
に は earphone , speaker に関 して
一
般に 予 想 さ れ る差 異1 % よな く, 両 者 殆ん ど変 らない が,fricatives
の識
別 で は ear・
phone の特
性の方
が speaker の 特 性お よび その環境条件
よ り も強
い 影響力
を有
し てい る と見るこ とがで きよ う。3
.
Listeners
英語音
の識
別は 被験 者
と して のlisteners
の有
す る 条件に よっ てその結 果に差 異が 生ず るこ と は, 経 験か ら, ま た2
,3
の資
料 15) の 比較
か らも十 分に推 測で きるこ とであ
る。 し 80哩
弼 4り 20loii ,/
Zt
’鴬
珈
胤
影 傷
ル, ,ll
,亠,Fig .3.
Earphone
とSpeaker
とに よ るSound Recognition
た が っ て
調査結果
の分析
に際し て は, 被 験 者 集 団お よ びその 構 成 員の特 徴の十 分 な 理解
が伴
なわ なけ れ ぽ な ら ない 。
こ の
調査
の1isteners
は40
年
度 本 学1 年
次学
生55
人で ある。 彼 等は全員選択英語
と し て英
語発 音
矯
正の前 期 授 業 を 終 了してい る。 その 内 容は毎 週1
時 間1ab
に お い て習 得上 のtrouble
spotsを, r ognition お よ び
production
の両 面にわ た っ て重 点的
に練
習す
る。Fig
.4
は学生
の 診 断用お よ び授業 効果測定用 と し て
4
月お よ び10
月 に 実 施 し た50
問の aural perception test の結果
を得
点カ テ ゴ リー
別に分 類 し た もの であ
る。 これに よっ てこ のgroup
の英 語 音識
別に 関 す る特
徴を知 るこ と がで きる。 まず 練 習に よ る識別 能力の 向 上は顕著
で,
そ れは2
つ の 大 きな group を形 成 して い るこ と が
注
目され る。
これ を 平 均 値で み ると,pre −test
43 .
4
,post−test
65
.
8
で その間の 向上
率
は51 .
6
% と な る。 さ らに個 人 別に調べ る と,
1
人の 例外
もな く識
別 能 力 が 向 上 して お り,pre −
test の 下位者
か ら 上位 者に至 る向
上率
の推移
は大体
好ま しい カー
ブ を描
い てい るこ とが判 る。 ま た学生
の 欠 席 回 数は比 較 的 少 な く,欠席時間数
(X
)
と識
別力向
上 値 (Y
)との 相 関 係 数は一
〇.
543
で , その回 帰直線
はY
=−
3X
+25
.
99
(
0
≦X
≦7
)
で表
わ さ れ る 。 こ の こ とは毎時間
の練習
が効
果 的に 行なわ れた こ とを 間接 的に実 証 し て い るわ けで あ るが ,lab
の よう な機 械 学 習に お い て は学 習 者の 学 習に対 する関心度 が その効
果に少
な か らず 影響
を 与 えること を考
えると, その原
因の1
つ を学 生の 側に 帰 す るこ とが で きる よ う である。 こ の 点 を さ らに 明確に す る た め に , こ の 選 択 学 生1
」
;o Ll) 「rlFig.4.
Listeners
のRecegnition
Ability
分 布音 声 的個性の
Sound
Recognition
へ の 影 響につ v・
て (渋 谷 勉 )(つ ま り 本調 査の 被 験 者 )に 対して行なっ た もの と 全 く同
一
の test を,
41年
度1
年 次 学 生 全 員 (lab
授 業は必 修で , 前期授
業の 内容
は選 択の場 合 と殆ん ど同一
)に実 施 し た とこ ろ, pre ・
test
36
.
7
,post−test
49
.
6
,
その間の向
上率
35
.
2
% を得
た。 この数値
は両者
のpre
・
test
の差 異
か ら選択学
生の 約 半 分の 向上率 と見 敬 す こ とがで きよ う
。一
般に sound recognition に おい て は,
学習者
の質
的 要 素よ りも集中
的練
習に よ る量 的 要 素の方がその能 力 向 上に深 く関 係 する傾 向があるか ら, こ こ に 見られ る両 者の向上 率の 差の 大 部分 を,
そ の学
習意 欲 乃至関心度の 量 的差
異 と解
するこ と がで き る ように思 う。以
上を綜
合す
ると, 本 調 査のlisteners
は学 習に対 す る関 心 度は非 常に高
く,授業
の 最 終 段 階で行 なわれた今 回の一
連のtest
に対して も積 極 的な関心 を 示 し,test
結 果に偶 然 性の 要 素が介 入 するこ とが 少 なか っ た もの と推 測で き, し たがっ て被験
者 とし ての信 頼性
は比較
的高
い と結 論 するこ とがで きる ように 思 う。
4
.
Native
informants
こ の比 較 研 究の た め に選ん だ nativeinformants
は , すで に わ が国の英 語 教 育 界に おい て知 名の 米人
V
.Brown
氏 とJ
.
Callender
女 史お よ び本 学 英語講師J
.
Moes
女 史の3
人で ある。Brown
に 関して は,
その著Improving
Your
Pronunciation
附 属tapei5
),
またCallender
にっ い て は ,
ELEC
English
Course
, part2
,
vol.
1
附 属tape17
}
か らそ れ ぞ れ
test
用のtape
を19cm
!sec の speed で編 集し た。Moes
は本 学 講 師 と して1964 年 9 月
か ら約1 年
間教
鞭 を とると共に
lab
教 材の 録 音 編 集に 協 力したCalifernia
出 身の 米 人であ り, その tape は 本 学のlab
附属 録音室
でSony
C
−37
A
microphone とTC
−777
A
tape
recorder を 用い19cm
!sec でtest
materials を録 音 し た もの で あ る。
なお こ れ らの 使 用
tape
に関連
してtape
noise の問題
が考
え られ る が, これに はさき
のMiller
に よる他の実
験
結 果が参 考になるls)。 っ ま り彼は
frequency
response を200
〜6
,500
cps に一
定
に し て お い て,
SIN
を一18db 〜
+12
db
の範
囲で変 化させ た 時の子音
のperceptual
confusionsを
調
べ たわ けであ
るが,
そ の資料
を整
理 し て み る とFig
.
2
と 同じ よう な傾
向を 示す
こ と が判る。 ま た 同時に, 通 常の 範囲内で はSIN
に よる recognitiQn へ の影 響は, さ きの 周 波数 範囲に よ る場 合よ りもか な り少
ない こ とが理解で きる。
ま たtape
編 集の 際の recopy に よ る録音特
性 低下 の問 題, あ るい はtape
speed の 影 響な ど も 無視で き『
ない で あ ろ う が, こ れ らに 関す る実 験 報 告に よれば19 >, その影 響は こ の調 査の system
frequency
response のlimits
を越 えた か な り高い 周 波数
に現わ れ る こ と が判る。 し た が っ て こ こ ではそ の 影
響
を検討する 必要は なか ろ う。5
。
Vowel
recognition5
・
1
3
人の nativeinformants
に よ る sound recognition の結果
を まず
母 音につ い て 検 討 するこ と に し た い 。Fig .
5
か ら判
る ように words中
に含
まれるphonemic
contrasts の識
別に 関し て は, speakers の間に大 き
な違
い は 見 ら れ ない 。
最
も 大 きい 差 異で1uw
!−
fu1
のBrown
100 Sl 50 ’i」厂
一
ii,
F・
1
・
40i
(
慧
窪
む
1
「
Fig .5。
Speakers
とWords
中のVowel
RecognitiOn
との 関係5 相模工業大学 紀要 第
2
巻 第1
号 contrasts の場 合につ いてFig
,
6
を概
観 し たい。 全 体の 平 均は words の場 合 よ り10
% ほ ど低
下 してお り, そ れはMoes
が最
も少
なく 4 .
5
%, っ い でBrOwn
の5
.
3
% ,Callender
に は19 .
5
% もの 減 少が見 ら れる。
各phonemic
contrast に お け る識別
の差異
は words よ りも遙 か に 著 し く,10w
!一
!o !のBrown
・Callender
間
の23
.
6
% を最 高に,20
% 以 上 の差
異が10f
−
1er
ノお よびfuw1
−
1u
!に も現
わ れてい るの が 大き
な特
徴である。Moes
間の5 .
1
% であ
る。5
組のphonemic
contrasts の中で は !a1−
foX
の識
別が最 も劣り他 との間に
20
% 以上の 差があるが, こ の 傾 向は どの speaker に も現われてい るの でその 間 の 開 きはない
。
しか しこ のphonemic
contrast の た め に用い た 各問題ご とに ,3
者 共 正 解したlisteners
の割 合の平
均
は39
.
6
% であ
り,他
の contrast の半分以下
であ
るこ とか ら,1a1
−
1e
!
の識
別
には speakers に よる難 易 差が感
じられた こ とが推 察で きる。5
・
2
次
に sentences の中
のphonemic
鴨 lijt−、
「
ii 1りo、
、 f?i−
1●rJ 、 丶,
tvwi−
1ut N ノ s ev \ / 丶・
、
f
’ t。i_
i。1 >’
M鳴’
、
/ ,。w,一
∫。, 》 OD 40 BrOvvnCalltnder,
iji ivwt /ow ノ 溜 rit BrOwn (lalSendtr Mees l l l I I
〃 lu厂
」
,
01 ρ r’ i;1Fig .
6.
Speakers
とSentences
中のVowel
Recognition
との 関 係なお
listener
個 人 別に よ る speakers の識 別の差は !ij
!−
/i
!を 除 きかなり著
しく, words と 同様
1a
!−
fef
の場合
が最
も大
きい。次
に vowel recognition に大 き
な差
異 を 生じ た
pair
words ま た はpair
sentences を,筆者
の auditoryimpression
に よ る分析
と比較検
討しなが らその影 響 因 子 を 明 らか に し た い。
5 ・
31ij
!−
1if
.
Words
, sentences とも識 別
は非常
に よく
, ま た speaker に よ る差 異は殆ん ど ないが, 聴 覚 印 象で は
3
者 間に若 干の 相 違 が 感 じ ら れ る。 まず 音 色に っ い て3
者を比 較 す る と, !ij1
は
Callender
がよ りtense
で あり, ノi
ノで はBrown
が よ り1ax
に聞
える。 両音
の音
色の相対的
な差は
Brown
が最 も大 きい 。 しか し同一
音 声 環 境にある た め,
こ の よう なquality
よ りも1ength
の差の 印
象
の方
が遙
か に強
い 。各
speaker とも1
三j1
, !i1
は後 続 子 音の性質
に よ る1ength
の違
いが
認
め ら れるが,3
者 を 比較
する と !ij1
で はBrown
,Callender
,Moes
の順に僅
か なが ら長 目になっ てい る
。
しか し 〆i
! との 相 対的
なlength
差
は3 者
共 非常
に明瞭
であ
る。 ま た sentences の場
合
は 両 音 が sentence stress を もつ た め や やゆっ くり強 く 発 音 され る 傾向
が見
られる。 な お
Moes
の 文のtempo
は他の speakers よ りも 筐かに遅 くlength
の差
がさ ら に明白
に な る。5
・
41uw
!−
1u1
.
Words
に よる識 別で は3
者 間に 大 差は ない。 こ こ で も!
il1
−
!i1
と同 様,distinctive
feature
であ
るquality
よ りも redundantfeature
のlength
の方 が識
別に 大 きな役割
を果
して いる こ とが認
め られ る。Callender
とMoes
の 間に は 両 者 共1ength
差が殆ん ど ない が,Brown
の !uw1 ,
1uf
はそれ よ り短か 目であ る。 音 色に つ い て は , !uw1 の 唇や舌の緊
張を伴
な う硬
い感
じは
一
致
し てい るが,Moes
の !u!は や やlip
・
rounded な 感 じに 聞 える。 ま たCallender
の ノuw1は他の speakers よ り も
louder
である。Sentences
で は wordsと異な り
speakers の間
に識
別
の差
異 が 生 じて お り,Brown
・
Callender
間
20
%,Moes
・Callender
間11 .
8
% の開 き が ある。3
者 共 文中
の 両 音には stress があ
るが,その
程 度
に は幾
らか相違
があ
りBrown
の場 合が最
も強
くし たがっ て両
音
の差
を聴取
し やす
い 。Moes
では音 色の差はBrown
より僅
かに 劣るが,1ength
の違
い は 明瞭
である。 ま たCallender
1
一
46一
音 声 的個性 の Sound Recognition へ の 影 響に つ い て (渋 谷 勉)
の
発音
ではlength
の 差はMoes
よりや や少 な くBrown
とほ ぼ 同じ程 度であるが,quality
の差
は他の2
人よ り も少
ない。
そ れは words 中の 発 音 と比 較し て も 明 らか に認め られる特 徴であ り,これ が sentences に よ る
識別
を21
.
8
% も減少
させ てい る有 力
な原
因 と考
え られ る。5
・
5
/ow1−
!01.
Words
に は speakers に よ る識
別の差は 殆ん ど見
ら れ な い。 こ のphonemic
contrast で は
1ength
よ りもquality
が識 別の cue で あるこ とは3
者に共 通 し た特
徴である。 しか し !ow !
,
ノo!の音 色に は speakers の shades があり, こ れが sentences 中で は さ らに 広い 範囲に及び識 別に 大 きな 影
響
を 与え てい るこ とが 認め られる。Sentences
の 平均値
で はBrown
・
Ca11ender
間23 .
6
%,
Brown
・
Moes
間16
,
3
% で あるが, 問題
の中
で特
に著
しい差 異
が生 じ たのは,
bowl
−
ball
を もつpair
sentellces で,Brown
の識 別
が92
.
7
%,Moes
が76
.
4
%, さ ら にCallender
は58
.
2
% と低 く なっ てい る。Brown
は sentence stress がある場 合, 他の speakersよ り も
強
く ゆ っ くり と明 瞭な発 音に な るの で, 両 者の音
色の特
徴を 比較
し やすい 。 こ こ では !o〆の硬い 感 じ が
特
に識別 を助
け てい る。
しか し 両 音の長 さは 単 語の場 合と 同様 殆
ん ど変
ら ない 。Cal
−
lender
では !ow1 の1w1
がBrown
よ りも弱
く, 両 音の音 色の差はや や 縮 少 してい る。 またMoes
の場 合は
10wf
の 発音
はCallender
とほ ぼ同性 質で あ る が, !oノの硬
い感
じはBrown
とCal
−
lender
との 中間 程 度である。 こ の よ うに10w
ノに関 してはそのdiphthongization
の程 度に差が見ら れ る。 な お
3
者 共 平均
値は words の場 合よ りも 劣るが,Callender
で は28 .
9
%減
と顕著
であ
る。
5
・
6
!eiL !erf.
Words
の平 均 値で は speakers の差 異
は 大 き くない が,5
間 中pus
−
purse
のpair
words では,Callender
100
%,Brown
98 .
2
% に 対し てMoes
は78 ・
2
% である。for1
は3 者共
1r
!の 響き を も ち 比較的 長 く発 音さ れ てい る。 /o!に つ い て は,
Moes
は他の speakers よりも前 よ り でや や 長 目の
発音
であ
るこ とが /orX との識 別 を 妨 げてい る ように思 わ れる。Caljender
の !a1 は !er 〆よ り も や や
louder
に 聞え るの で こ れ が識 別に役 立っ て い る。Brown
の1
θr!,10
!は共に比
較
的 短か い 発音
で あるが,
両 音の 相 対 的な長さの差は, 他の2
人 よ りも大 きい 。Sentences
の場 合
は,Brown
・
Ca
】lender
間20
%,
Moes
・
Callender
間19
.
1
% の大 き
い相違
が
見
ら れ る。 文 中にgulls−girls
を もつ 問 題につ い て み る と,Moes
87 .
3
%,
Brown
80 .
0
%,Cal
−
1ender
56 .
4
% と speakers の 差は平均値
よ りも遙
か に 大 きい。Brown
で は文
尾の risingin
−
tonation の 影
響
でfo1
が 長 目に 発 音 さ れ1er
/の 長さに近い が,音
色の差
はか な り よく識
別できる。Callender
の !e ! もやは り長
目であ
る た め, 両 者の識 別はそのquality
に頼
る ことに なる が,後
続 する
dark
1
[†】の た め1erlf
のfr
/の 響 きが十 分に聞えず1elf
との 区 別が困 難で ある。 こ れ に対
してMoes
はtempo
が他の2
人 よ りもや や遅 く !erl !が長 目に発 音 さ れて い る の で,Callender
よ りも ノr1 の響 き を 聴 取し やすい 。
5
・
7
!
af−
fe1
.
調査
に用
い た母音
の中
で最
も識別 困難
なphonemic
contrast であ るが, words の平 均 値で は speakers に よ る差 異は殆ん ど見ら れ ない 。 し か し 問 題 別で は
20
% 以 上の 相 違 が 生 じ てい る場合
があ
るの で その特
徴 を 概観す
るこ とに し たい 。pop
−
pup
の識
別はCallender
70
.
9
%
,Brown
65
.
5
% である の に対 してMoes
は36 .
4
% と著 し く劣っ て い る。
Brown
の !a!は 〆eノより も sonorous で あ り
区別
は 比較 的容易
であ
る。Callender
の場 合 も1a
!の方
が長
目の発音
でsonority が 高い 。 しか し
Moes
に はlength
の 差が殆ん ど ない 上 に ,fo
/はBrown
ほ ど 明瞭でな く, や や中 央
寄
りの【
e]
に近い の で ノa! との 音 色の 差は他の speakers ほ ど 明 らかでない 。 さ らに 組 合 わせ られた
3
語の中, 最 初の語がやや強
く発音
さ れ てい るの で,listener
の立 場か らは 各語
相模工 業大 学紀要 第2巻 第 1号 ( の
loudness
の差に妨 げ られ て, そ のphonemic
contrast が 識 別 し難い 。 ま た robber−
rubberの
pair
words で は,Moes
83
.
6
%,Callender
70
.
9
%,Brown
58 .
2
% と 上 の 場 合 と は逆にMoes
の識 別が
非
常に よい が, そ の原
因の 主 な もの はlength
の 差に ある と思 わ れ る。
つ ま りMoes
の1a
ノは こ こ で は【
q’
】の発 音で あ り, !of との音
色の差
以上に1ength
の差
が 明ら か であ
る。 こ の差は
3
者の 中で 最も大きい 。Callender
の 音色 はMoes
とほ ぼ 同 程 度の 差 異が ある が,1ength
差はよ り
少
ない。Brown
で は音色
の差
はMoes
,
Callender
よ りや や明瞭
で あるが,length
に は殆
んど差 が
見
出 さ れ ない。American
English
の !eノ,1a1
に は か な り広
い範
囲の allophones が あることは, こ の
3
人の speakers に も認
め られるが, そ の recognition score か ら判 断す
ると1isteners
は こ こ で も
quality
よ り も1ength
の 差に敏 感であると 言 え よう。 こ の こ とは, そ の 母 国語 とし ての 日本 語 がこ の
phonemic
contrast を 含 ま ない こ と, お よ び1engt
血 は 日本語
で は有 力 なdis
・
tinctive
feature
であ
るこ と な ど か らも十分
理解
し得
る。次
にpair
sentences に よ る識 別を見 ると,Moes
・Brown
間12 .
8
%,
Moes
・
Callender
間19
.
1
% の差
が生
じて お り,特
にMoes
で は, words よ り も逆
に7
%高
く3
者 中 最も
よい識 別
で あるこ と が注 目され る。 問 題と して は, shot−
shut を含
む sentences に お い てMoes
80 .
0
%,
Brown
60
.
O
%,
Callender
50
.
9
% の差が現われて い る。 こ れは, words の 場合に見
ら れ た1a1
,ノe !の allophones の
personal
shades が sentences では さ ら にprosodic
features
の影響
を受
け る た め と思われる。 つ ま り
3
者 共, sentence stress を もっ 両 音は強く発 音 さ れて はい るが, その 程
度
に 相違
があ
るの でquality
お よび1ength
に か な りの個
人 差 が 生 じてい る。特
にMoes
の1a
!は長 くlouder
であ り10
!との識 別が容 易で ある。 これ とは対照的にCallender
の 〆a!, !e1の音 色の差は 他の speakers よ り も 少な く, ま た
length
の差はBrown
よ り も小さい。
し たがっ て 綜 合 的 な prominence の 差 異は
3
者 中で 最 も目 立たない 。5
・
8
以
上 vowel recognition に おける speakers の音 声的
特徴
の影響
を概
観 し たのであるが,母
音
にはそのquality
お よびlength
に speaker の shades が か な り あるこ とが認
め られ,phonetic
な 立場か らは speakers の差
は大 きい と言え よ う。
しか し母 音がその性 格と して,
平均9
〜47microwatt2
°)の大 き な
power
を有して い るの で , speaker の もつphonetic
shades は相対 的
に弱 く
, words中
で はその音
声環境
に よる変
化
は見
られ るけ れ ど も, 母音
固有
の energy に強い 影 響を
与
え るほ どで は な く,
し たがっ て speakers 間の 識 別の差 異は全 体 的に僅 少で ある。し か し なが ら sentences に おい て は
事情
が 大 分 異 なる。 こ の場 合セこは さ らにprosodic
features
の 影響が加わ るが, そ れは標 準 的な 言葉を 自 然の style で 読 む とい う 同
一
条 件ecおい て も, な お ある程
度
の個
人差 があ
る た め,
words に おい て見
られた各 speaker の allophonic sh∂des
は , より大 きな energy を もつ よ うに な ると 同時に 個人 的 色彩を
一
層 濃 くす る。 特に母音のprominence
の
重要
な 要 素で あるlength
へ の影響
が著
し く, そ れは直
ちに識
別に 影 響を与え るこ とになる。一
般
に sentences で は words と異な り co皿text
に よ る補
足効果
が働
くと考
え られる が, こ の種 類の sound recognltion の性 格か ら
,
比較 的高
い 識 別に お いては殆ん ど その 効 果 は な く, む し ろsyllable の
増
加に伴な う識
別 低減
効果
の方
が大 きい。
し か しこ の 場 合に も, 文のtempo ,
intona
・
tion
, rhythm な ど と関 係
し て speakers の個人
差 が現
わ れ る。 こ の よ うに sentences に おい ては , 母 音が speakers の 音
声
的個
性と関 係 する要 素 が 多 くなり, またその energy も相 対 的に 大きく
なるの で,識
別
に大 き
な差 異
が生ず
るもの と推論
でき
よう
。剣
音声的 個 性の Sound Recognition へ の 影 響につ いて (渋谷 勉 )
6
.
Words
中
の consonant recognition6 ・
1
子音
へ の 影響
を まず
pair
words に関 し て考
えること に し たい。Fig
.
7
の特
徴は speakers の 識別の 差 が著しい こ と で ある。 これは母音の 場合
のFig
.
5
お よ びFig
.
6
との比 較からも 容 易に判る。1f
!−
!h1
以外
の すべ てのphonemic
contrasts において20
% 以上 の識
別の差 があ
り, 特 に1s
!−
t
θf
のBrown
とMoes
の 間 a=47 .
6
% もの開 きが見ら れ る。 平均
値で はCal
−
1ender
とMoeS
は殆ん ど変 らな い が,Brown
は それ よ りも20
% 近く高
い 。 次に/
’
h「
i’
s1
’
i i”’
画母 音の場 合と同 様, 識 別の差 異の原 因を筆
Fig
.
7.
Speakers
とWords
中の Consonant者
の聴
覚 印 象に も とつ い て検 討 し て み たRecognition
との関係い。
6
・
2
!f
!一
!h1.
平 均 値に お い て は speakers の間の 相 違が 比較
的 少ない が,
問 題に よっ て相当の開き
が生じ て い る。fold
−hold
に おけるCallender
96 .
4
%,Brown
70 .
9
%,Moes
60 .
O
%, お よびfeet−heat
のCallender
89
.
1
%,Brown
72 .
7
%,Moes
63 .
6
% の2
組が特に著 し く, ともにCal
−
lender ・
Moes
間に36 .
4
% お よび25 .
5
% の大差
があ
るが, その要
因は !f1
の摩擦
の強
さに よると
思
われ る。Callender
の場 合に は,後
続 母 音の影 響があっ て も !ff
は常に非 常に激しい 摩 擦を伴っ て発 音されて お りその 持 続 時 間 も長目で ある。 し た が っ て, か な り強い 呼 気の 流れ る
1h
ノ との識別は極め て容 易で ある
。
こ れに 比 較 す る とBrown
とMoes
のff
!の摩擦
はずっ と弱 く,Moes
では さ らに
弱
いが, それは聴 覚
で も十
分 聴 取 で き る程 度の弱さであっ て, 先 述の communicationequipment の 影響を過大視 する必要はない よ うに 思 う。 なお摩 擦の 持 続 時 間は
Moes
の方がBrown
よ りも僅か に長い 。6
・
3111 −
fr1
.
平 均 値で はBrown
が 他の2
人より も23
% ほ ど優 れて お り,5
間 中4
問のpair
words に
20
% 以 上の大差
が現わ れて い る。 まず alive−
arrive ではBrown
89
.
1
%,Callender
69 .
1
%,
Moes
67 .
1
% の識別 を示し てい る。
Brown
のfl
!は後
続母音
の影 響の わ りに は比較
的暗
い 感じが 少 ない の に対し,
1r
/はやや深い音 色であるの で両 音は識
別し やすい。
Callender
の /1
!は ,Brown
より もdark
な感じが強い 。 ま た1r
ノの 響 きに はBrown
ほどの 深さ が ない。Moes
の 〆11
の音 色は
Callender
とほ ぼ 同 程度
である が,1r
ノはCallender
より僅
か に重
く聞 える。 ま た col・
lect−
correct で は,
Brown
78 .
2
%,
Callender
45 .
5
%,Moes
30 .
9
% と speaker に ょ る識 別の差 異が
一層
著しい が, speakers の音声
的 特徴
は上の場 合 と変らない 。 た だ しMoes
の !1
!, ノrノ を含む syllable の 発 音は他の
2
人ほ ど強い stress がない。
Phonemic
contrast がinitial
position
に ある
1ake
−
rake の識 別では,Brown85
.
5
%,Moes
63
.
6
%,Callender
58
.
2
% と僅か ではあ
るが
Moes
の方
がCallender
よりも優
れて い る。 両 音の音 色の差
はBrown
が最
も 明瞭
であり,Callender
で は !11
の sonority が やや高い。 ま た こ の位 置で は,Moes
はCallender
より も僅か な が ら音 色の 差が大 きい