• 検索結果がありません。

音声対話システム

N/A
N/A
Protected

Academic year: 2021

シェア "音声対話システム"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

Copyright © by Takeshi Kawabata

音声対話システム

音声対話システム

• 音声情報技術の利用シーン分類

• インタラクションの重要性

• 音声対話の技術要素

• 音声対話システムの実例

音声情報技術の利用シーン分類

• バッチ的な利用シーン

音声認識

⇒ –

音声合成

• インタラクティブな利用シーン

認識・合成

(2)

Copyright © by Takeshi Kawabata

音声対話システム

インタラクションの重要性

• 音声は最も慣れ親しんだ情報交換手段

• 音声認識には誤りがつきもの

• 五官を総動員

(マルチモーダルインタラクション)

インタラクションと対話

• インタラクション (Interaction)

• 対話 (Dialog)

インタラクション ⊃ 対話

(3)

Copyright © by Takeshi Kawabata

音声対話システム

音声対話の技術要素

• 対話の最小単位

• 対話の進行

• 対話の調整とは?

対話の最小単位:

プロンプト&アンサー (prompt & answer)

音声 合成 音声 認識

どの会議室を 予約しますか?

プロンプトを合成

第一会議室 第二会議室

認識用文法及び単語辞書を設定

どの会議室 を予約します

か?

第一会議室を お願いします

(4)

Copyright © by Takeshi Kawabata

音声対話システム

対話の進行:

状態遷移モデル (state transition model)

プロンプト: 新規ご予約でしょうか、

内容のご確認ですか?

アンサー:{新規|確認}認識文法 状態1

プロンプト: 予約ご希望の日時を どうぞ

アンサー: (日時認識用文法) 状態2

プロンプト: 予約番号をどうぞ?

アンサー:(予約番号認識用文法) 状態3

新規

確認

対話の進行:

状態遷移モデル (state transition model)

何月ですか?

1月でOK?

2月でOK?

もう一度

…月でOK?

1月

2月

(エラー)

何日ですか?

はい

はい

はい いいえ

(5)

Copyright © by Takeshi Kawabata

音声対話システム

対話の進行:

対話の主導権 (initiative)

システム主導型

(system initiative)

ユーザ主導型

(user initiative)

混合主導型

(mixed initiative)

対話の進行:

システム主導型の対話例

S:どの会議室を予約しますか?

U:第一会議室

S:第一会議室でよろしいでしょうか?

U:はい

S:何曜日を予約しますか?

U:水曜日

S:水曜日でよろしいでしょうか?

U:はい

S:何時からですか?

U:…

(6)

Copyright © by Takeshi Kawabata

音声対話システム

対話の進行:

ユーザ主導型の対話例

U:会議室を予約します S:はい

U:第一会議室、水曜日、午後一時から午後三時まで S:はい

U:確認してください

S:第一会議室、水曜日、午後一時から午後三時までの 予約を承っております

U:予約してください S:予約しました

対話の進行:

混合主導型の対話例

U:お願いします S:はい

U:水曜日の第一会議室を予約してください

S:第一会議室のご予約ですね? 水曜日の何時から 何時までですか?

U:午後一時から午後三時までお願いします

S:水曜日、第一会議室、午後一時から午後三時まで、

新規ご予約ということでよろしいでしょうか?

U:結構です

S:かしこまりました

(7)

Copyright © by Takeshi Kawabata

音声対話システム

対話の進行:

混合主導型の実現法(一例)

スロット 会議室 第一会議室

曜日 水曜日 開始時刻

終了時刻

対話の調整とは?:

音声対話システムの透過性

• 対話の調整 (coordination)

– –

• 透過性 (transparency)

(8)

Copyright © by Takeshi Kawabata

音声対話システム

音声対話システムの実例

• 電話サービスの自動化

• コンピュータ・情報家電の操作

• 案内・展示・エンターテイメント

– –

ここまでのポイント

1. 対話の最小単位である

「プロンプト&アンサー」とは何か?

2. 状態遷移モデルにおいて、次の状態

(遷移先)は何で決まるか?

3. 対話の主導権制御(3種類)を説明せよ

参照

関連したドキュメント

[形態コード P117~] [性状 P110~] [分化度 P112~]. 形態コード

 TV会議やハンズフリー電話においては、音声のスピーカからマイク

11) 青木利晃 , 片山卓也 : オブジェクト指向方法論 のための形式的モデル , 日本ソフトウェア科学会 学会誌 コンピュータソフトウェア

(Theorem 7.5) The left determined Olschok model category CSTS is Quillen equivalent to the full subcategory of Cattani-Sassone transition systems having at most one state equipped

In this state space model, the stochastic system model is represented by the stochastic Equations (4) and (5) and the probability distributions given in Section (2.3); the

On the other hand, for the Weisskopf-Wigner (WW) model (i.e., the Dicke model in the rotating wave approximation), we know that a non-perturbative ground state appears in the case

The RCM problem uses a MILP formulation to determine a schedule of runway configuration changes to maximize efficiency, given forecasted available configurations and demand. RCM is one

Classroom 上で PowerPoint をプレビューした状態だと音声は再生されません。一旦、自分の PC