• 検索結果がありません。

第 5 章 音声中の検索語検出のための検 索方法の改善索方法の改善

5.3 編集距離ベースの誤検出抑制パラメータの組合せによ る検索性能 (2)る検索性能(2)

5.3.3 評価実験

5.3 編集距離ベースの誤検出抑制パラメータの組合せによ

表 5.4: 誤検出抑制パラメータの組み合わせ(2)

検索方法 誤検出抑制パラメータ

Only EditDist ——————–

+ Voting Cost “Only EditDist” + Voting

+ CM Cost “Only EditDist” + CMCor + CMDel + CMIns + ArcWidth Cost “Only EditDist” + ArcWidth

+ CM(cor) “Only EditDist” + CMCor

+ CM(del) “Only EditDist” + CMDel

+ CM(ins) “Only EditDist” + CMIns

+ Vot+CM Cost “Only EditDist” + Voting + CMCor + CMDel + CMIns + Vot+CM(cor) “Only EditDist” + Voting + CMCor

+ Vot+CM(del) “Only EditDist” + Voting + CMDel + Vot+CM(ins) “Only EditDist” + Voting + CMIns

+ Acw+CM Cost “Only EditDist” + ArcWidth + CMCor + CMDel + CMIns + Acw+CM(cor) “Only EditDist” + ArcWidth + CMCor

+ Acw+CM(del) “Only EditDist” + ArcWidth + CMDel + Acw+CM(ins) “Only EditDist” + ArcWidth + CMIns + Vot+Acw Cost “Only EditDist” + Voting + ArcWidth + Vot+Acw+CM(cor) “Only EditDist” + Voting + ArcWidth + CMCor + Vot+Acw+CM(del) “Only EditDist” + Voting + ArcWidth + CMDel + Vot+Acw+CM(ins) “Only EditDist” + Voting + ArcWidth + CMIns

+ All Cost All Parameters

VotingとArcWidthを加味した距離計算に対して1種類の誤検出抑制パラメータを加

えた場合のRecall-Precisionカーブを表す.図5.9は,編集距離のみに対して2種類の 誤検出抑制パラメータを加えた場合のRecall-Precision カーブを表す.

実験結果から示されるように,CM スコアを利用する計算式を変更したことによっ て,検索性能の低下が軽減された.また,MRPにおいては,編集距離のみの場合と比 較して,検索性能が僅かではあるが向上していることがわかる.

以上より,CM スコアの導入方法を検討することによって,更なる検索性能の改善 が行える可能性が示された.

表 5.5: 誤検出抑制パラメータの組み合わせによる検索性能の比較2

検索方法 F-measure MAP MRP

Only EditDist 0.64 0.81 0.75 + Voting Cost 0.71 0.86 0.81

+ CM Cost 0.60 0.80 0.76

+ ArcWidth Cost 0.63 0.82 0.78

+ CM(cor) 0.62 0.81 0.76

+ CM(del) 0.64 0.80 0.76

+ CM(ins) 0.63 0.80 0.75

+ Vot+CM Cost 0.61 0.82 0.77 + Vot+CM(cor) 0.64 0.82 0.77 + Vot+CM(del) 0.71 0.85 0.79 + Vot+CM(ins) 0.71 0.86 0.79 + Acw+CM Cost 0.58 0.81 0.76 + Acw+CM(cor) 0.58 0.81 0.77 + Acw+CM(del) 0.63 0.82 0.78 + Acw+CM(ins) 0.63 0.82 0.76 + Vot+Acw Cost 0.74 0.85 0.79 + Vot+Acw+CM(cor) 0.64 0.82 0.78 + Vot+Acw+CM(del) 0.73 0.85 0.79 + Vot+Acw+CM(ins) 0.72 0.85 0.78 + All Cost 0.62 0.82 0.79

2011/1/25

1

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Precision[%]

Recall[%]

Only EditDist All Cost + Voting Cost + CM Cost + ArcWidth Cost

図 5.4: 1種類の誤検出抑制パラメータを導入した検索性能の比較

2011/1/25

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Precision[%]

Recall[%]

Only EditDist + CM Cost + CM(cor) + CM(del) + CM(ins)

図 5.5: CM スコアを導入した検索性能の比較

59

2011/1/25

1

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Precision[%]

Recall[%]

Only EditDist + Voting Cost + Vot+CM Cost + Vot+CM(cor) + Vot+CM(del) + Vot+CM(ins)

図 5.6: VotingにCMスコアを導入した検索性能の比較

2011/1/25

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Precision[%]

Recall[%]

Only EditDist + ArcWidth Cost + Acw+CM Cost + Acw+CM(cor) + Acw+CM(del) + Acw+CM(ins)

図 5.7: ArcWidthにCM スコアを導入した検索性能の比較

60

2011/1/25

1

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Precision[%]

Recall[%]

Only EditDist + Vot+Acw Cost + Vot+Acw+CM(cor) + Vot+Acw+CM(del) + Vot+Acw+CM(ins)

図 5.8: VotingとArcWidthにCMスコアを導入した検索性能の比較

2011/1/25

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Precision[%]

Recall[%]

Only EditDist All Cost + Vot+Acw Cost + Vot+CM Cost + Acw+CM Cost

図 5.9: 複数の誤検出抑制パラメータを導入した検索性能の比較

61

5.4 まとめ

本章では,複数の音声認識システムの出力を利用したネットワーク型インデックス に対する,誤検出を抑制した検索語の検出方法について述べた.

誤検出を抑制するパラメータとして,3種類の情報を利用し,導入の方法によって 計5種類の誤検出抑制パラメータを検討した.これらの誤検出抑制パラメータを,DP の距離計算式に導入することによって,誤検出が抑制されることが実験結果より示さ れた.

特に,音素を認識した音声認識システムの数であるVotingを導入することによって,

大幅に検索性能が改善された.他のパラメータにおいても,編集距離のみを用いたDP の距離計算式を用いた場合より誤検出が抑制され,検索性能が改善された.しかし,CM スコアに関しては,導入する方法を再検討した結果,MRPにおいて僅かに改善された 程度であった.

これらの誤検出抑制パラメータの導入方法をさらに検討することによって,STDの 性能がより改善されることが期待できる.

本手法は,2011年12月に開催されたNTCIR-9 (Proceedings of NTCIR-9 Workshop Meeting) のSTDタスクにおいて最も優れた検索性能を示した[47].

6 章 音声中の検索語検出のための誤