• 検索結果がありません。

音声認識

N/A
N/A
Protected

Academic year: 2021

シェア "音声認識"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

Copyright © by Takeshi Kawabata

音声認識

音声認識

音声認識とは?

音声認識の枠組み

音声認識の基本技術

音声認識システムの構成

技術各論>音声区間検出

音声認識 (2)

技術各論>特徴抽出

技術各論>音響モデル

技術各論>言語モデル

技術各論>解の探索

(2)

Copyright © by Takeshi Kawabata

音声認識

音声認識とは

第一会議室を 予約して

ください

第一会議室を 予約です

か?

音声認識の枠組み

単語認識 あか

赤(あか)

青(あお)

黄(きいろ)

類似度計算 単語辞書

「赤」

類似度の最も 大きな単語

を選択

(3)

Copyright © by Takeshi Kawabata

音声認識

音声認識の枠組み (2)

定型文認識

あかい ぼうしを

みせて ください

類似度計算 「赤い帽子を見せて

下さい」

赤い 青い

帽子

単語辞書

文=形容詞+

名詞+助詞

+…

文法

音声認識の枠組み (3)

ディクテーション

ほんじつは にしのかぜ

はれ

類似度計算 「本日は西の風

本日 明日

晴れ

単語辞書

単語の連鎖

する確率

(話題に強く依存)

言語モデル

(4)

Copyright © by Takeshi Kawabata

音声認識

音声認識の基本技術

不特定話者

任意語彙

連続音声

音声認識システムの構成

(5)

Copyright © by Takeshi Kawabata

音声認識

音声認識システムの構成 (2)

分析処理

音声区間検出 探索処理 音響モデル

文法 言語モデル

入力音声 認識結果

技術各論>音声区間検出

背景音<音声>背景音

認識対象とする音声区間の

」と「 」を決定する

音声信号の を利用

(6)

Copyright © by Takeshi Kawabata

音声認識

技術各論>音声区間検出 (2)

一定間隔ごとに、「 」を計算

time

技術各論>音声区間検出 (3)

パワーが

とき「区間開始」

pow

設定 レベル

×短い 区間開始

(7)

Copyright © by Takeshi Kawabata

音声認識

技術各論>音声区間検出 (4)

パワーが

とき「区間終了」

×

time pow

設定 レベル

短い

区間開始 区間終了

ここまでのポイント

1. 音声認識とは?

2. 音声認識の枠組み 3. 音声認識の基本技術

4. 音声認識システムの構成 5. 技術各論>音声区間検出

参照

関連したドキュメント

下する.そこで本デコーダでは on-the-fly 合成と同 時に WFST の最適化を行う「最適化付き

システムのあらまし 字幕サーバ 利用者 ダウンロード (ブラウザベース) エディタ アップロード 音声チェック 音声認識セットアップ 音声認識・自動整形

℡ ト ラ ン ク 音声応答部 認 識 部 ト ラ ン ク 自動ダイヤル 発 信 器 父 換 機

まえがき ダイナミックプログラミング (D P) が音声認 識の分野で重用されるようになって

In addition, we also describe a wireless headset using Bluetooth technologies and Android version of VoiceDo as a trial to extend the applicable area of speech

音声入力型情報検索のための音声認識手法と検索要求生 成手法について検討を行った.具体的には,ベイズリスク 最小化音声認識を行い,その結果得られた

Kyushu University Institutional

Kyushu University Institutional Repository..