遠野物語におけ
方言音声
キーワード検索
実現
Realization of keyword search for dialect voice of Tono old tales
感性情報学講
0312014016
飯田
英仁
指
教員:伊藤慶明
嶋和徳
1.
じめに
近 ,大 ビ タ 特定 キ
ワ 検索 機能 求 ,音声中
検索語検出(STD: Spoken Term Detection) 関 研究 盛 行わ い . ,
ン等 普及 伴い,音声 キ ワ 入
力 SQ-STD(Spoken Query STD) 研究 活性 化 い .
標 準 語 音 声 対 音 声 自 動 認 識 や 検 索
高い精 実現さ い ,方言や訛 あ
音声 自動認識 困 あ .方言 自動認識
,方言 学習 タ 作成 ,音声
認識 学習さ 必要 あ .方言 学
習 タ 作成 ,方言音声 書 起 必要
あ 困 作業 あ .一方,方言音声 音
節 や 音 素 単 語 さ い 単 位 ワ
認識 ,キ ワ 与え キ あ
い 音 声 検 索 実 現 可 能 あ
考え .
遠 物 語 岩 手 県 語 い 昔 話 訛
や方言 巧 使用 ,趣 出 ,遠
週,岩手県内 ホ 定期的 公演
行わ い . ,遠 物語 公演 県
外 来 人 視聴 際, 要 キ ワ
方 言 や 訛 内 容 十 理 解
い 多い.語 部(遠 物語 語 手) 解説 行 い い 現状 あ .
物語中, 要 キ ワ 話さ 時
客席 ,隣 ニタ 用意 , 方言
用語 解説 表示 ,公演 聞い い 人
理解 う い 考え .字幕
全 言葉 ニタ 表示 う ,画面表
示 注目 い,遠 物語 趣 損
う ,キ ワ 解説表示
.
2.
提案シス
ム
提案 イ 図1 示 .
物語 キ ワ 解説 予 用意
図1:提案 イ 図
表1:ワ 各 ワ 表記例
word 川
syllable ワ
monophone k a w a
triphone #-k+a k-a+w a-w+a w-a+#
demiphone #1k k2a k1a a2w a1w w2a w1a a2#
SPS #k kk ka aa aw ww wa aa a#
く.語 部 物語 語 い 時 用意さ キ
ワ 話さ 際, キ ワ 解説
ニタ 表示 .
実現 ,方言 学習
タ い 未 知 語 等 処 理 対 応
考え,単語 さ 音声言語単位 ワ
用い 検索 行う. 時,予 用意 キ
ワ 与え 際, キ 音声 い
有効 STD 用い 評価 . ワ
音節,triphone,demiphone 1),SPS 2) あ , 表1 表記例 示 .demiphone triphone 時 間的 2 割 ,SPS IPA音声記号
音響物理的特性 考慮 SPS 記号 割 あ .本研究 方言 検索 有効
ワ 実験 検証 .
3.
評価
ータ
2 語 部 2 物語 語 い(表
2), 音声 発話 区 ,検索対象 .
物 語 い キ ワ 考 え 言 葉 抽
出 . 表3 示 .
無音区間 自動 発話 方法 あ ,
表2:遠 物語 キ ン 一覧
表3:遠 物語 キ ワ 数 正解数( 均,最 ,最大)
3.1
キーワード作成条件
表3 い , 要 考え 用語 キ ワ 選定 . キ ワ 発話さ
い 区間 見 際 ,正 い書 起 文
い ,遠 物語 公演口調 記さ い
本 参 考 音 声 聴 キ キ ワ
作成 行 .3) 4)
音声キ ワ い 男性5 ,女性5 計10 音声 聴 作成 キ キ ワ 発 話 (視 聴 無 キ ワ ) 音声 聴い い,発音 似 作成 キ
キ ワ 参 考 発 話
(視 聴 有 キ ワ ) 音 声 キ ワ い
.
4.
評価実験
4.1
実験条件
音響 ,言語 学習 日本語話
言 葉 コ パ (CSJ:Corpus of Spontaneous
Japanese) 全2702講演 ,評価用 用い
177 講演 除い 2525 講演 う 偶数講演 (1255 講演,約287 時間) 使用 .単語 音
節 triphone 場合,音響 3状態 イ ン系列 構成 ,状態系列 3009状 態 .SPS 場合,音響 3 状態
1482状態 あ .demiphone 場合,音響
3状態 5259状態 あ .混合数 32混合
. 評 価 指 標 い MAP(Mean Average
Precision) 用い .
表4:音声 キ 検索精 (MAP[%])
図2:認識別検索精 比較図(MAP[%])
4.2
実験結果
表 4 ,音声 キ 方 約 10pt ほ 精 違い 表 .原因 今回使用
音声認識 CSJ 標準語 学習 タ あ , キ ン 音声キ ワ
認識結果 誤差 生 , キ キ ワ
精 高く 考え .
図2 認識方法 変更 ,検索 結 果 あ .一番検索精 高い SPS認識 あ
,状態 少 い方 精 高く 傾向
あ 考え .
5.
おわ
に
本 論 文 音 声 キ 検 索 精 認 識
方法 検索精 評価 行 . ,評
価 タ タ 少 く 正 い 結 果
あ 言え い. 徐々 タ 増
や , 論文 取 上 結果 再算出 行う
,他 手法 提案 考察 いく.
参考文献
1) 岩田耕 ,伊藤慶明, 嶋和徳,石亀昌明, 田中和世,李時旭, 語彙 音声文書検 索手法 新 い ワ
ワ 音響距 有効性 検証, 情処学 論,vol.48, no.5, pp.1990–2000, May 2007.
2) K.Tanaka and H. Kojima,“A between-word distance calculation in a symbol domain and its
applications to speech recognition,” Proc.
International Conference on Neural Information Processing (ICONIP-97), pp.1107–1111, 1997. 3) 贈 物 佐々木イセ物語集
初版 2008/1/12
4) 遠 正部家 物語集
続 続, 第4集 初版 1993/5/1, 1995/8/1
語 部 物語 収録時間
( :秒)
発話区
間数
佐々木イセ
五徳 話 2:25 37
長生 薬 2:20 40
正部家
ソ 5:15 69
金 鉈 2:50 36
五徳 話 長生 薬 ソ 金 鉈
キ ワ
数
9 9 11 10
正
解
数
均 3.2 2.89 5.18 4.2
最 1 1 1 1
最大 10 5 11 9
視聴有音声 視聴無音声 キ
52.17 53.21 62.25
61.83 62.25 63.08 58.18
64.94
55 60 65 70
w
or
d
sy
ll
a
b
le
tr
ip
h
on
e
d
em
ip
h
on
e
S
P
S
M
A
P
[
%