Kyushu University Institutional Repository
パターン認識における有意差検定と音声認識システ ムの評価法
中川, 聖一
豊橋技術科学大学情報工学系
高木, 英行
松下電器産業中央研究所
http://hdl.handle.net/2324/4488440
出版情報:日本音響学会誌. 50 (10), pp.849-854, 1994. 日本音響学会 バージョン:
権利関係:
日本音 響学会誌50巻 10号 (1994>, pp.849−854 849
解 説 パ ター ン 認 臓 に おけ る 有意差検定 と
音声 認 臓 シ ス テ厶の評 価法
*中 川 聖
一 (豊 橋 技 術 科 学 大 学 情 報工 学 系 )** ・高 木
英行
(松下電 器 産 業 中 央研究 所)’*’1
.は じ め に今ま で, パ ターン認識の研究が数 多 く発表さ れ
て きた が, アル ゴ リ ズム や実験の有効 性の検定は あま り はなさ れ て こ なか っ た。 多 くの場合, 発 表
の ア イデア の お も し ろ さ は読み取れ て も, 本当に
有効な手法な の か どうか の確 認を する こ とが なか
な か で き な か っ た。 研究 活動は池に石を落 とす が ごと く他の研 究者や社会に波 紋を広 げて 学術の 発 展に寄 与し て い く もの と思 うが , 発 表の有 効 性が 確 認で きない ようで は, 波紋を 広 げる こ とが で き
ない 。 発表者にして も, す ば ら しい ア イ デ アが,
検定
で その有
効性
を示さ なか っ た が た め に疑い の目で評価さ れ るの も惜 しい 話で あ る。
筆 者 ら は統計 学を専 門 と し てい る わ け で は な く, ユ ーザ と し て統 計検定を利 用し て い る。 こ の
立場か ら, 教科 書的な厳 密性は多少 犠牲に し て で も, パ ターン認 識を行っ て い る 工学 者が す ぐ使 え
る こ と を意 図し て解 説を行う。 更に実務の立 場 か ら, 具体 的な音 声認 識の検定の現状につ いて も触
れ,
議
論す る。 なお , 本解説
記事
は,筆者
ら が既に研究会で発表 し た 資料5)を も とに して い る。 入 手 困難な研 究会資料で も あ り, 何か のお役 に立て
ば とい う 思い で, 再 掲 ・加 筆 し た もの で あ る。
2
.有 意
差検 定
方 法1 (2
項 分布
の平
均の 差の検
定)
認識 対 象の データベ ース を共 有し た上で認 識性
寧
Statistical
methods for comparing pattern recogni − tion algorithms and comments on evaluating speech recognition performance .牌 Seiichi Nakagawa (Department of InfQrmatlon and Computer Sciences, Toyohash 量University of Tech − nology , Toyohash量,441)
串 宰 零 Hideyuki Takagi (Central Research Laboratories,
Matsushita Electric Industrial Co ., Ltd,, Kyoto ,
619−02)
能を比 較 する場 合の検 定方法で ある。 最近 は共通 音声 データベ ース の整備な ど に よ り, 複数の研究 機 関で 開発 された認識アル ゴ リズム を比較 する こ
とが可能に なっ て き た。 本 節の検 定方 法 はこの よ うな場 合や同一研究 機 関で も異なる アル ゴ リズ ム
の比 較に利用で き る。
この 検 定 方法
1
は2
項 分布を 正規 分布に近似
する こ と に基づ い てい る。以 後の議 論 は, 実用 上の 近似 条 件 と言わ れて い る表一1が 満 た さ れて い る 場 合につ い て有効で ある。
2
.1
問 題の 定 式 化問題
nA 個の データ を 用 い て認識 方法
A
の性 能を 調べ た と こ ろ, 誤認識 数がT
.で あっ た。一方
nB 個の データ を用い て認 識 方法
B
の性 能を 調べ た ところ, 誤認 識数がT
,で あっ た。 認識 方法A
とB
の間に性能 差は ある か個々 のパ ターン に対す る認識は, 1 (誤認 識 )と
0
(認識)の 2 値を そ れ ぞ れ 確率P
と (1 −P
)とで 取る確 率変数X
でモ デル化で きる。 この確率
変 数X
は2
項 分布B ( 1
,P
), つ ま り (O
,1
)分布に従 う。実
際に は各
パ ターン ごとの認識
の し易さ が異なっ てい るの で, 正確に は
2
項分布 と は言え ない が, 近 似 的に2
項 分布で あ るとす る。 また , 評価 用 データが異 な る 母 集 団か らの抽 出サ ン プル で あ れ ば, 両 アル ゴ リスム は直接 比 較 で き ない の で ,同じ母集団か ら抽 出さ れ た サ ンプル と す る。
以 下, 新 しい 確 率 変 数
Y
・= nX =Σ獨 濫 を導 入し て議 論を展開する。2 .2 検定の ための モ デル化 確 率変 数
X
は2
項 分布B
(1
,P
)に従 う。 確 率 変 数
Y
は 付 録 の定 理1
よ り2
項 分 布850
表一1 本 手 法が適 用できる条 件 誤 確 認 率
p
の範囲 n の条件0 .1〜0 .3
e
.3
−−O
.4
0 .4〜0 .6 0 .6〜0 .7
0
,7〜0
.9200以 上
100
以 上50以上
100以 上
200以 上 n はデータ数
B
(n,P
)に従 う。表
1
の条 件 が満 た さ れ る と き, 付 録の2
項 分布の正 規 分 布 近 似か ら, 確率変 数
y
は 正規 分 布N
(nP . nP(
1−P
))
に従 うと近似で き る。付 録の定 理
2
よ り確率変 数X
は 正規分布N ( P
.2
(1 ;,))
に従 う。 確 率変 数
X
の誤 認識 率は確 率変 数X
の 誤 認識率
と同ff
p
で ある。Z3 誤認 職 串の薤の分布と有意差検定
さて , 二 つ の認 識 方 式の誤 認識 率の差 ρA一
加 を 考え よ う。 確 率 変
tWXA
−XB
は 付 録の補助 定 理 1に よ り正規分布
N ( PA
−PB
,PA ( 1
nA−PA )
・2
・( 宏
命) )
(1
)に従う。
今, 仮 説
H
。 :PA
≡PB
=p
。 (既知)が成 り立つ もの とし よ う。 す ると (1)式 と付録の系よ り,
T
.T
,nA nB
(
2
)z
「=P
。( 1
−th ) 1
+
1
nA nB
は規 準正規 分布
N
(0
,1
)に従う。な お, 実 際の パ ターン認 識で は
Pe
が既知でな いの で, 全サ ンプル か ら最尤推定
値
^ 鉱 +
T
.
P
=nA 十nB
を求め,
A
の推 定値 と して 用い る。正規 分布表よ り,
1
)( { IZI
⊇≧1
.96
})=0
,05
で ある。 す なわ ち, 確率
5
%で{ Zl
≧ 1 .96}
(
3
)が起 き れ ば, 仮説
H
。を否 定し, 起 こら な け れ ば危日本 音 響 学 会 誌 50巻 10号 (1994) 表一2 有意な 認識率の差
誤 認 識 率 サ ンプル 数
Po
nA = nB有 意 水準 (危険率) 5% 10% 20%
5
%
200
5001
,0002
,0005
,
000
4 .27% 3 .59% 2 .78 % 2.70 2.27 1.76 1,91 1.61 1 ,25 1.
35
1
.14
0
.88 0
.85
0
.72 0 .56200
500 10% 1,000
2
,000
5 ,000
5
.88
4
,95
3.72 3 .13 2 .63 2.21
1
.86
1.57 1.18 0.993
.842
.431
.721
,210
.
77
200
500 15% 1 ,
000
2
,000 5,000
7
.00
5.89
4 .43 3.73
3
.16
2 .66 2 .21 1.861
.40
1
.18
4 .572
.
892
.061
.
450
.
91
200
500 20%
1
,000
2 ,000
5
,000
7 .84 6.60 4 .96 4.
17
3 .51 2.95 2 .48
2
.09 1
,57
1
.32
5.123
.242
.291
.
621
.
02
200
500 30% 1,
000
2,000
5
,000
8 .98 7 .56
5
.68
4
.78
4.02 3 .38 2.84 2 .39
1
.80
1
.515 .873
.
712
.621
.851
,21
険率
5
%で仮説を認め る こ とにす る (厳密に は仮 説H
。を否定で き ない だ けで あるが)。従っ て,パ ターン認 識 の場合,
2
.2
節の近似 条 件が成 り立つ 場 合の検定は, 事 象際
一号
⊇≧
1
.96
(4
)Pt
(・−P
・)( 去
・羨
が成 り立つ か ど うか を判定し, 成 り立て ば認識 結 果に有意差あり, 成 り立た なけれ ば認識性 能に有 意差な し と す る。 た だ し
p
。は (3
)式で代 用 す る。
5
%以外の危 険率で有意差 検定を する場合は,正 規 分布表か ら,1
.96
に代わ る値を 用い る。 例え ば,危険率 1%,
10
%,20
%の場合は正規分 布表よ り,2 .58, 1 .
65
, 1 .28 をそ れぞれ 用い れ ばよい 。 表一2は主な n,
P
の組
み合
わせ と危険率
5%と 10%,20%に対す る有 意差の認 識率の差を 示し てい る。
パ ターン認識にお け る有意 差検定 と音声 認識シ ス テム の 評価 法 851 なお,
2
.2
節の条件を満た さない 場 合 と連 続 型分 布で ない た めの補正 と して, (
2
)式の分子に・
參 講
(・)を加え る と よい 。 符 号は分 子の大き さが小 さ く な る よ うに決め る2 }。
2A
検 定 方 法1
の ま とめ初め に表一
1
の適 用 条件を満た すか どうか を調べ る。 次に, (
1
)式が成 り立つか ど うか で危 険率 5%の有 意 差 判 定を行 う。 (4
)式 中のp
。は (3
)式で 代 用 し,他の記 号 は
2
.1
節の問題 を参照の こ と。危険率
1
% や 10%で検定 する場合は,右辺1
.96
の代わ りに
2
.58
や1
,65
を 用い る。 簡 易 的に は表一2
を参 考にす る。
表一3 符 号 検 定 表。3 .1節の 物 と raの小 さい 方の 数 値が
表中の値以下で あれ ば, 有 意 差 あり。 (N = n2+ns) 危険 率 (% ) 危 険 率 (% )
1V 1 5 10 N 1 5 10
3
.有 意 差 検 定 方法2 (
符 号 検定
,sign
test )
2
章で述べ た検 定 方法1
を 現実の音声 認 識 に適 用 し よ う と する と, 有意差を 示すた め に必要なデ ータ数が 不足す る こ と が多い と思わ れ る。 現実の 音 声 データベ ース の規模か ら す る と, 数 千の テス トデータ を 用意す る こと は相 当困難で あり, 認 識 率が100
% に近 くか つ 認識率
の 差 が 少 ない 場合 は,有 意 差検定 が ほと ん ど不可能になっ て し まう。この よ う な 場合, 符号検 定がで きれ ばテ ス トデ ータ 数 を 大 き く 削 減 するこ と がで きる。 そ の代わ
り認 識データベ ース を 共
有
する だ けで な く,一つ 一つ の テス ト データに対 す る認 識 結 果 を 比較す る
こ と が求め られる。 他研究機 関の手 法 と比 較 す る 場 合に は, 何 番目の データで誤認識を起 こ し たか
とい う データ をお互い が持つ 必 要が ある。
3 .1 検定 方法
問題
認 識 方 法
A
とB
を同じパ ターンサ ンプル 集 合に適 用 して認識実 験 を行っ た結 果, 次の ような結 果が得ら れ た 。
方法
A
,B
ともに正解 …・… ……… …・・nl 個方 法
A
で 正解, 方法B
で 誤 認識 ……n2 個方 法
A
で誤 認識, 方法B
で正解 …… m 個 方 法 A ,B と もに誤認 識 … ……… ……n4 個 認識方法A
とB
の間に性 能差はある か123456789012345678901234567890123456789012345
111111111122222222223333333333444444
00001112223334445566677788999001112233
111111111
0001112223344455566777889990011222334455
1111111111
工
11
00011
工
22333445556677788990001122333445566
1111111111111111
464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990111111111111111222222222222222222222222333333344555667778899000112223344555667788899001112111111111122222222222222222222222333333333333566778889900111223344555667788899001122233445111111122222222222222222222222333333333333333
677889900011223344455667788899001122333445566
こ こ で, 認 識結 果が異なっ た n2 と n3 に つ い て
考え る。
N
= n・+n3 と し,2V
が決まっ た とい う条 件の 下で の 物 とn3 の 起 こ る確 率をPi
とA
とす852
る。 も し方 法
A
と 方 法B
の問に性能 差が なけ れ ば m と n3 は大体 同じ数になる はずで ある。仮
説H
。 :A
≡ ρ2(=1
/2
)と し よ う。 こ の とき,実際 の観 測 値 n2 (n3 で も よい )は
2
項 分布B
(N
,1
/2
)に従 う。そこで前 節と同様に して n2−1
>/2
z
==師
と お くと
Z
は規 準正規分布 N (0
, 1)に従うか ら,前節 と同様の手 順で検 定で き る。実 際に は, (
5
) 式 と同様に して ,n2 − 」へ厂/
2
±112
z
=(
6
)駟
と お く。 以下で は, もっ と簡 便に利用で きる手順 を紹 介する。
n2と n3 が 大体 同じ か どうか は表一
3
に 基づ い て 検 定す る。 合計 数N
= (n、+n、)個 と検定 危険 率で表
をひ き, n2 と n3の小さい 方の数値が表の値よ り 等 しい か小 さい 場 合 は, n2 とn3 は大体 同じ とは言えず有 意な差が ある, と判 断 する。
1V
が 90 を 越 える場合は,
(
N
−1
)/2
一脚価
厂再 ア
よ り小で最も近 い 整数を採用し, 比較す る。 た だ し, 々 は危 険 率が 1,
5
,10
%の と き, そ れぞ れ1
.2879
,0
.9800
,0
.8224
で ある2)’3) g
3
.2
例 題例えば, 二 つ の認識 方法の結果が異な っ た数を 調べ る と, n2 = 12 個, n3 =
28
個で あっ た場 合を考 えて み よ う。 合計40
個で ある か ら表2
のN
=40
を 見て み る と, n2 とn3 の小 さい方の数 が
11
個以 下で あ れ ば 危 険率 1%で有意 差 あ り,13
個以下で あ れば危 険率5
%で有意 差 あ り と言 える。 この例 題の場合小さい 方は n2 ・ ・12
個なの で, 危険率
1%で は有意な差が ある と は言えな い が, 危 険率
5
%で は認 識 方法
B
の 方が有 意に 性 能が高い と言 え る。 もち ろ ん, (6
)式を用い て も,IZI
=2
.37
な ので 同じ結論 が言える。
4
.有 意
差 検定方
法3 ( 整
合 対 検定
,Matched
−Pair
test )
3)・4)テス トサ ンプル 集 合をセ グメ ン トに分割 し, そ れ それ の セ グメ ン トで, 誤 り数の差 が 測定で きる 場合には, 次の検定 法を利用で き る。
日本 音 響 学 会 誌 50巻 IO号 (1994)
問題
テ ス ト サ ン プル
集合
が n 個の部 分 集 合 に分 割され, 部 分サ ン プル集 合i
での認識方 法A
と
B
に よ る誤認 識 数をTAi
,T
,,t
す る σ=1
,2
, …, n)。 認識手 法
A
とB
の間に性 能差はある か 。
T
,=TA
,−T
. , (i
”1
,2
, … , n)T
=歯 1
i=1 咒
v
・−t
− 、自 ( T
,−T ) 1
と お く。 仮 説
H
。’T
=O
が 成 り立つ と き,T
の分散の推定 値は
σT・= ⊥
y2
n
とな り, n が十分 大 きい とき (例え ば n >
50
),z
=2
σT
は, 規 準正規 分 布
N
(0
,1
)に従 う。従っ て, 仮 説H
。 :T
…O
の検 定は第2
節 と同 様の手 順 で検 定で きる。厳 密に は,Z
は自由 度 n−1
のt
分布に従 うか ら, n が小 さい と き は ’検定を用い る必 要が あ る3)。
セ グメ ン トへ の分割の 方法や
T
,の定義は,誤 り が セ グメ ン ト間で独立で あ る 限 り任意で ある。 例えば音韻 認識で ,
1
文 ごとに置換誤 り, 脱落
誤 り, 挿入誤 りの総数の差 をT
,と定 義し て よい し,不特 定話 者の 認識 実験で は, 話者ごとの 二 つ のアル ゴリズム に よ る誤 り数の差を
T
,と し て も よい 。5
.評 価 法の適用 と音
声 認 識 研 究の 現 状 分 析以 上述べ た統計 的検 定法 を 音 声 認識シス テ ム に 適用 する際に 注 意 すべ き点を列挙する。
1
.2
章で述べ た検定方法1
は, nA 個の テス トサ ンプル と nB 個の テ ス ト サ ン プル は, 同一の
母集団か らの抽出サ ン プル で あ ると仮 定 し
てい る。 音 声認
識
の評 価の場 合, 両者のテストサ ン プル が 同一の場 合が普通で ある。 こ の
場 合は,
3
章で述べ た符 号検定 法の方 が適切である。 2章の検 定 方 法 1 よ りも有意差の条 件が少 し ゆ る く な る と思 わ れる。
パ ターン認識に お け る有 意 差 検 定 と音 声 認 識シ ス テム の評 価法
2
.1
人の話 者の1
,000
個の データ と10
人 の話者の各
100
個の データ を 用いた と き,そ れ ぞ
れ同じ認識 率の差が生 じて も統計 的に は同
じ で も後 者の方が一般に信 頼で きる結 果 と 言える。 な ぜな ら, 話者が代わ ればパ ターン
の分布 も変わ り,認 識アル ゴ リズ ム が
特
異 な 分布だ け に整 合する こ と が除 外で き る か ら で ある。 すな わ ち,2
章 (3
章 )の検 定方 法 で はサ ンプル が同一の 母集 団 (同一サ ンプル 集合〉か ら得 られ て い る とい う仮 定が あっ た。 しか し, ある特 定話者の み, 非 常に有効 で あ り,他の話 者に はあま り有効で な くて も全
体
と して有効で ある とい う結論にな るこ とも あ る。 こ の場合は,4
章で述べ た方法が 適切で あ る。3
.上 記2
と本 質 的 に同 じこと だ が,同じ発話 環境の データだ け よ り も種々 の 環境の データ
を含ん で い る方が信頼 性が高い 。例 え ば, 母
音をフレ ーム単位で認 識す る 場 合,
1
か所 の母 音か ら,数 多くの フ レ ーム を サン プル と し て用い る の はあま り意 味が ない 。
手軽に入 手で きる資料として,過 去
2
年間
(1989 年〜1990
年)の 日本音 響 学会誌と電子情報通信 学 会論 文誌の音声 認識に関す る論 文37
件に対 し て2
章の検 定 方法 1 を適用 し, 調査 し た5 )。 こめ結果, 発表 論文で有効 と結論づ け ら れ た 方 法の うち,4
割以 上が 有意 水 準
5
%で,3
割 以 上 が有意 水準10
%で有 意で ない と言え た。
3
章の符 号検 定を 用 い れ ば更に救 済された論文 も 増 え たか も知 れ ない が,一般 に論文で は符 号検 定に必要なデータは開
示 さ れ ない の で各 著者に お任せす る しか ない。 6.
音
声 認 識 シ ス テ厶 の 評価法 と研 究 指 針最近, 音 声 データベ ース が充実 して きて , 評価 用 データ も多量 にな り, 信頼 で きる結 果の報告が 増えて き た。 更に研究 成果 が 蓄積される た め に,
必 要 な項 目を列挙して お く。
1
.共 通 データベ ース の構
築 と利
用(他機 関と比 較のため)2
.実験 条件の明記 (学習サ ンプル の話者 数とサンプル数,評価サ ンプル の話 者数と サ ン プル
数 (特 定/多数話 者 /不 特定 ), 語 彙 数, パー
プレ キシティ, 録音 条件など)
853
3
。標 準 と なる方 式 との 同じ データベ ース を用 い た 比較 (同一機 関 内での 評 価のた め)●標準 認 識 方 式 と して は
DP
マ ッ チン グ,
HMM
, バ ッ フ ァ 式多 層パ ーセプ トロ ン,
ベ イズ の二次識別関数, マ ルチテ ン プレ ー ト法 な どが考え られ る。
●
特
徴パ ラ メ ータと して は,LPC
メル ケ プス ト ラ ム,回帰係数の併 用 な ど が考え ら れ る。
4
.2
章で述べ た検 定方 法1
に よっ て基準 と なる方式 と比べ て提
案
する方式 の認 識 率が 向上 し, 有意な差を 示せ れば, その方 式 は有 効
で あるに は違い ない 。しか し, そ れ が 必 ず し
も意 味の あ る結果で あ る と は 限 ら ない 。例え
ば, ある方式あ るい は 目 的 と す る 認識 率が
90
%の と き, 従 来比 較 対 象の 方 式が 70%
で あり, こ れ に比べ て提 案す る方 式が 75%に向上 し そ の差が有 意であっ て も,
90
% と比べれ ば あま りに も差が大き過 ぎる。話者 適応 や
雑音下で の音 声 認識の研 究 に は こ の 種の研 究 例が多 くみ られ る。抜本 的な新 しい 方式を
追及 すべ きで あろう。
5
.本 解説で 述べ た検定法 は第1
位 候 補の 認 識結果に よ る もの で あっ た。 当然, 第
1
位 候 補の認識 率が 同じ で あっ て も第 2 位 候 補 以 内
に正解が含ま れ る率に差 が ある と 全体の 性
能が異なる。 この差が 有意で ある か ど うか に
も 同 じ手 法 が使える。単語認 識結 果を
複
数 個 出 力 (単 語ラ テ ィス)し, これ を 用い て文 を 認識す る場 合に第1
候 補の認 識が 同 じで も 差が 出て くる。どの程 度の差が 出る かは 別の評 価 法で
検
討で きる6}。6
.棄却 率も性 能の評 価 尺度 と して重要で ある。我々の検討 で は, 妥 当 な棄 却 法を採 用すれ
ば,認識 率と棄
却率
は強い相 関が ある こ とを 見 出 してい る7)。7
.ま と め本 文で はパ ターン ごと に認 識 方式
A
とB
の認 識結 果の対 応を考
え ない 場 合 と考える場 合の検定 方 法を紹 介し, 音声 認識へ の適 用に際し て私 見を 述べた。統計に基づ く検 定 は,あ る仮 定の下に行 わ れる。
854
例え ば,データ数はある一定以 上 必要で あ ると か ,
認 識データ の認識難 易度はほ ぼ同 じで
2
項 分布が 仮 定で きるな どで ある。 検 定結
果の信頼性
には この よ う な条件の吟味が必要で ある が, 従来の 多 く の発 表に見 られ た ような検 定を する こ とな く感 覚 的に提 案手 法は性 能が良さ そ う だ, と結 論 付 け る よ りは よ ほ ど読者の た めにな り, ひ い て は学術 の 寄与に役 立つ と信 じる。 さ りと て, 筆者らの発 表 で もい つ も検 定結果を 述べ てい るわけ で はない。
自戒を 込 め た解説と し たい 。
謝 辞
検定 方法につ い て, 大 阪 工業大学 経営工 学科の 奥田徹示 教 授 と久留米 大学商 学部の 河野和正 教授
の ご指導 を賜っ た。 厚 く御礼 申し上げます。
文 献
D
裏西 久男, 加 納省吾, 河 野 和正, 瀬口常 民, 統 計 解 析 入 門, 修 正 13版 (廣川書 店,東 京,1974>.2)奥津 恭,工場にお け る推計学の 問 題と その解き方 (共 立 出 版, 東 京, 1951).
3)森口繁一編
, 統 計的 方 法, 新 編 改 訂 版 (日本 規 格 協 会, 東京, 1989).
4)L ,Gilick and S.
J
. Cox ,“Some statistical issues in the comparison of speech recognition algorithms ,” IEEE Int. Conf. Acoustic Speech Signal Process.(ICASSP ’89),532−535 (1988). 5)中川 聖一
,高 木 英 行,
“パ
ターン認 識に お ける有 意 差と 音 声 認 識シ ス テ ム の評 価,
” 信 学 会 第 2種 研 資 SPREC − 91−7 (1991.7).
6)中川 聖一
,
“音 声認識・理解システム の評 価 とデータベ ース
,
”信 学会誌73, 1304−1310 (1ggO). 7) 甲斐 充彦,中川 聖一
,
“未 知 語 検 出 率の シ ミュ レ ーシ ョ
ン と孤 立単 語及 び 文音 声認識に よ る評 価,” 信 学 技 報
SP 94−25 (1994).
【定理
1
】日本 音 響学会 誌 50巻 10号 (1994)
付 録
1)標本 確率 変
tw
X
,(1
≦i
≦ n )が 確 率p
で1
の値を, 確率
1
−p
で0
の値をとるとす る と, n
Y
・ = nX = Σx , i≡1は
2
項分布B
(N
,p
)に従 う。 従っ て平均と分散は,
E
[y
]=nP ,1
厂[ Y ]
; nP (1
−1
))
o 【定理2
】確 率変数
X
が 正規分 布N (
μ,σ2)に従うと き,任意の実数 σ,
b
(a≠0
)に対して, 確率 変数Y
=aX +
b
は正規分 布N
(a”+b
,σ2σ2)に従 う。【補 助定理
1
】互い に独 立な二 つ の確 率変 数 瓦 }厂 が そ れ ぞ れ 正規分布
N (
k ,(r。2) と
N (
陶,ay2)に従う な ら ば,0
で ない実 数 α,b
に対 し, 確 率 変ta
aX +by
は正規 分 布
N (
ak +b
μy, α2σノ+がσの に従う。
【
系】
確率 変数
x
が正 規 分布N (
μ, σ2) に従 うとき,
z
=2 ⊆
二Eσ
は
規
準正規
分布 N ( 0
, 1)
に従
う。【
2項 分 布の 正 規 分 布 近 似】
n が大 き く, か つ ,
p
が0
又 は 1 に近 く ない とき,