• 検索結果がありません。

感性情報学講座

N/A
N/A
Protected

Academic year: 2018

シェア "感性情報学講座"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

遠野物語におけ

方言音声

キーワード検索

実現

Realization of keyword search for dialect voice of Tono old tales

感性情報学講

0312014016

飯田

英仁

教員:伊藤慶明

嶋和徳

1.

じめに

近 ,大 ビ タ 特定 キ

ワ 検索 機能 求 ,音声中

検索語検出(STD: Spoken Term Detection) 関 研究 盛 行わ い . ,

ン等 普及 伴い,音声 キ ワ 入

力 SQ-STD(Spoken Query STD) 研究 活性 化 い .

標 準 語 音 声 対 音 声 自 動 認 識 や 検 索

高い精 実現さ い ,方言や訛 あ

音声 自動認識 困 あ .方言 自動認識

,方言 学習 タ 作成 ,音声

認識 学習さ 必要 あ .方言 学

習 タ 作成 ,方言音声 書 起 必要

あ 困 作業 あ .一方,方言音声 音

節 や 音 素 単 語 さ い 単 位 ワ

認識 ,キ ワ 与え キ あ

い 音 声 検 索 実 現 可 能 あ

考え .

遠 物 語 岩 手 県 語 い 昔 話 訛

や方言 巧 使用 ,趣 出 ,遠

週,岩手県内 ホ 定期的 公演

行わ い . ,遠 物語 公演 県

外 来 人 視聴 際, 要 キ ワ

方 言 や 訛 内 容 十 理 解

い 多い.語 部(遠 物語 語 手) 解説 行 い い 現状 あ .

物語中, 要 キ ワ 話さ 時

客席 ,隣 ニタ 用意 , 方言

用語 解説 表示 ,公演 聞い い 人

理解 う い 考え .字幕

全 言葉 ニタ 表示 う ,画面表

示 注目 い,遠 物語 趣 損

う ,キ ワ 解説表示

2.

提案シス

提案 イ 図1 示 .

物語 キ ワ 解説 予 用意

図1:提案 イ 図

表1:ワ 各 ワ 表記例

word 川

syllable ワ

monophone k a w a

triphone #-k+a k-a+w a-w+a w-a+#

demiphone #1k k2a k1a a2w a1w w2a w1a a2#

SPS #k kk ka aa aw ww wa aa a#

く.語 部 物語 語 い 時 用意さ キ

ワ 話さ 際, キ ワ 解説

ニタ 表示 .

実現 ,方言 学習

タ い 未 知 語 等 処 理 対 応

考え,単語 さ 音声言語単位 ワ

用い 検索 行う. 時,予 用意 キ

ワ 与え 際, キ 音声 い

有効 STD 用い 評価 . ワ

音節,triphone,demiphone 1),SPS 2) あ , 表1 表記例 示 .demiphone triphone 時 間的 2 割 ,SPS IPA音声記号

音響物理的特性 考慮 SPS 記号 割 あ .本研究 方言 検索 有効

ワ 実験 検証 .

3.

評価

ータ

2 語 部 2 物語 語 い(表

2), 音声 発話 区 ,検索対象 .

物 語 い キ ワ 考 え 言 葉 抽

出 . 表3 示 .

無音区間 自動 発話 方法 あ ,

(2)

表2:遠 物語 キ ン 一覧

表3:遠 物語 キ ワ 数 正解数( 均,最 ,最大)

3.1

キーワード作成条件

表3 い , 要 考え 用語 キ ワ 選定 . キ ワ 発話さ

い 区間 見 際 ,正 い書 起 文

い ,遠 物語 公演口調 記さ い

本 参 考 音 声 聴 キ キ ワ

作成 行 .3) 4)

音声キ ワ い 男性5 ,女性5 計10 音声 聴 作成 キ キ ワ 発 話 (視 聴 無 キ ワ ) 音声 聴い い,発音 似 作成 キ

キ ワ 参 考 発 話

(視 聴 有 キ ワ ) 音 声 キ ワ い

4.

評価実験

4.1

実験条件

音響 ,言語 学習 日本語話

言 葉 コ パ (CSJ:Corpus of Spontaneous

Japanese) 全2702講演 ,評価用 用い

177 講演 除い 2525 講演 う 偶数講演 (1255 講演,約287 時間) 使用 .単語 音

節 triphone 場合,音響 3状態 イ ン系列 構成 ,状態系列 3009状 態 .SPS 場合,音響 3 状態

1482状態 あ .demiphone 場合,音響

3状態 5259状態 あ .混合数 32混合

. 評 価 指 標 い MAP(Mean Average

Precision) 用い .

表4:音声 キ 検索精 (MAP[%])

図2:認識別検索精 比較図(MAP[%])

4.2

実験結果

表 4 ,音声 キ 方 約 10pt ほ 精 違い 表 .原因 今回使用

音声認識 CSJ 標準語 学習 タ あ , キ ン 音声キ ワ

認識結果 誤差 生 , キ キ ワ

精 高く 考え .

図2 認識方法 変更 ,検索 結 果 あ .一番検索精 高い SPS認識 あ

,状態 少 い方 精 高く 傾向

あ 考え .

5.

おわ

本 論 文 音 声 キ 検 索 精 認 識

方法 検索精 評価 行 . ,評

価 タ タ 少 く 正 い 結 果

あ 言え い. 徐々 タ 増

や , 論文 取 上 結果 再算出 行う

,他 手法 提案 考察 いく.

参考文献

1) 岩田耕 ,伊藤慶明, 嶋和徳,石亀昌明, 田中和世,李時旭, 語彙 音声文書検 索手法 新 い ワ

ワ 音響距 有効性 検証, 情処学 論,vol.48, no.5, pp.1990–2000, May 2007.

2) K.Tanaka and H. Kojima,“A between-word distance calculation in a symbol domain and its

applications to speech recognition,” Proc.

International Conference on Neural Information Processing (ICONIP-97), pp.1107–1111, 1997. 3) 贈 物 佐々木イセ物語集

初版 2008/1/12

4) 遠 正部家 物語集

続 続, 第4集 初版 1993/5/1, 1995/8/1

語 部 物語 収録時間

( :秒)

発話区

間数

佐々木イセ

五徳 話 2:25 37

長生 薬 2:20 40

正部家

ソ 5:15 69

金 鉈 2:50 36

五徳 話 長生 薬 ソ 金 鉈

キ ワ

9 9 11 10

均 3.2 2.89 5.18 4.2

最 1 1 1 1

最大 10 5 11 9

視聴有音声 視聴無音声 キ

52.17 53.21 62.25

61.83 62.25 63.08 58.18

64.94

55 60 65 70

w

or

d

sy

ll

a

b

le

tr

ip

h

on

e

d

em

ip

h

on

e

S

P

S

M

A

P

[

参照

関連したドキュメント

理工学部・情報理工学部・生命科学部・薬学部 AO 英語基準入学試験【4 月入学】 国際関係学部・グローバル教養学部・情報理工学部 AO

の総体と言える。事例の客観的な情報とは、事例に関わる人の感性によって多様な色付けが行われ

しかし,物質報酬群と言語報酬群に分けてみると,言語報酬群については,言語報酬を与

2008 “The BioScope corpus: annotation for negation, uncertainty and their scope in biomedical texts,” Proceedings of the Workshop on Current Trends in Biomedical Natural

関谷 直也 東京大学大学院情報学環総合防災情報研究センター准教授 小宮山 庄一 危機管理室⻑. 岩田 直子

By the method I, emotional recognition rate is 60% for close data, and 50% for open data(8 sentence speech of another speaker).The method II improves drastically the recognition

エドワーズ コナー 英語常勤講師(I.E.F.L.) 工学部 秋学期 英語コミュニケーションIB19 エドワーズ コナー

学側からより、たくさんの情報 提供してほしいなあと感じて います。講議 まま に関して、うるさ すぎる学生、講議 まま