• 検索結果がありません。

第 7 章 音声中の検索誤検出の応用

7.2 音声電子ノート作成支援システムへの応用

7.2.3 被験者実験

STDの有効性を評価するために,STDの使用者と不使用者の電子ノート見直し作業 にかかる時間の比較実験を行った.

被験者実験では,被験者10名によるノート見直し作業にかかる時間を測定した.被 験者は大学生・大学院生の10名である.作業内容は,一か月前に被験者が作成した講 義内容の電子ノートを参照しながら試験問題に解答するというものである.この解答

図 7.4: STD による検索結果の表示例

表 7.2: 実験で使用したSTDの性能 STD性能 F-measure=約0.17

Recall=約61%, Precion=約10%

検索語延べ数 108語 検索語種類数 49語 平均検索語数 22語/人

検索時間 約10秒/検索語(内,約7秒はインデックス構築時間) 平均音素数 9音素(最短4,最長20)

がすべて正答となるまでの時間を計測した.なお,ノート参照の際,全被験者の内半 数にはSTDを使用する.

ノート見直し作業時のSTD性能を表7.2に示す.この講義音声の単語認識率は約 26%であったが,STDのRecallは約61しかし,Precisionは約10これは,検索語とし て“実”や“ダル”等の音素数が短い検索語の湧き出し誤りが原因である.これら2語を 除いた際のSTD性能は,Recallが約67%,Precisionが約20%,F-measureが約30%で あった.

STDを使用した5名と不使用の被験者5名の正答時間の平均値と標準偏差を表7.3 に示す.STDの使用者5名と不使用者5名の設問ごとの平均正答時間を表7.4に示す.

表 7.3: STD使用者と不使用者の正答時間の平均値と標準偏差[分’秒”]

不使用者 使用者 平均値 40’58” 35’25”

標準偏差 14’34” 6’17”

表 7.4: STD使用者と不使用者の設問ごとの正答時間の平均値 [分’秒”]

設問 不使用者 使用者 差 1 2’27” 2’46” 0’19”

2 6’33” 1’28” -5’05”

3 5’11” 6’18” 1’07”

4 2’43” 3’49” 1’06”

5 14’33” 11’55” -2’38”

6 3’02” 4’03” 1’01”

7 3’55” 2’05” -1’50”

8 2’34” 3’00” 0’26”

表7.3の平均値から,STDの使用者は不使用者に比べ,5分程速く解答できている(た だし,危険率5%で有意差なし).標準偏差では,STDの使用者は不使用者に比べ正答 時間の個人差が小さいことが確認できる.

STD使用者には,電子ノート見直し作業の後にSTDに関するアンケートに回答して 頂いた.5段階評価でSTDの必要性が4.2と高い評価を得られた.

また,全ての被験者には,電子ノート見直し作業の後に自由記述のアンケートに回 答して頂いた.STD不使用者のアンケートの結果では

認識ができていない単語が多かった

認識ができていない場合,広い範囲の音声を聞くことになり,解答に必要な箇所 を見つけ出すのに苦労した

との回答があった.

一方,STD使用者のアンケート結果では

認識結果にない単語も,STD を使用することで検索ができたため役立った

誤りがある場合でも聞くべき範囲を視覚的に特定できたため,解答に必要な箇所 を見つけ出せた(シークバーの位置に対応した検索結果表示)

検索速度が遅いと感じた との回答があった.

以上より,電子ノート見直し作業において,STDは有効である可能性があるという ことが示された.

しかし,アンケート結果に“検索速度が遅いと感じた”という回答があったことから 検索速度の向上が必要であることが示された.

7.3 まとめ

本章では,提案した音声中の検索語検出手法をシステムソリューションに用いるこ とが可能であるかを考察した.まず,提案した音声中の検索語検出手法を,大語彙連 続認識システムで用いる言語モデルの学習データ選別や,認識単語の選別に用いるこ とで,音声認識性能を向上させることが可能かを考察した.STDを用いた語彙推定処 理により,認識辞書の語彙を大幅に削減することが可能となり,それに伴い,すべて の講演・講義で音声認識率が改善することが示された.

また,電子ノート作成支援システム[38]に提案したSTD手法を利用し,その効果を 考察した.結果として,電子ノート見直し作業において,STDは有効である可能性が あるということが示された.しかし,検索速度の向上が必要であることが課題として明 らかになった.この検索速度が遅いことについては,NTCIR-9[47],NTCIR-10[37]に おいても明らかである.これは,提案手法が検索性能に重点を置いているためである.