• 検索結果がありません。

漸次的発話生成法の概観

ドキュメント内 音声対話システムの構成法に関する研究 (ページ 75-78)

図4.3に漸次的発話生成のシステム構成を示す.システムは,問題解決,発話プ ランニング,発話実行,音声合成,対話制御,音声認識,言語理解の各構成部から 成る.

ここでは,タスク指向型対話において,解くべき問題が与えられ,システムが 問題の解をユーザに提案するために発話を行うという状況を想定している.提案 法のシステム構成における問題解決部の役割は,ユーザに対する伝達内容全体を 組み立てることである.問題解決部の実装はタスクによって異なる.たとえば,天 気情報案内タスクの場合は,問題解決部はデータベースへの検索プログラムとし

વ㆐ᷣߺߩ࡙࡯ࠩߦ ᖱႎߩᦝᣂ

⊒⹤ࡊ࡜ࡦታᣉਛߩ ߩ⸥㍳

㖸ჿ⹺⼂

⸒⺆ℂ⸃

⊒⹤ࡊ࡜ࡦ࠾ࡦࠣ

⊒⹤ታⴕ

㖸ჿวᚑ ኻ⹤೙ᓮ

ኻ⹤⁁ᘒ

࡙࡯ࠩ⊒⹤ ࠪࠬ࠹ࡓ⊒⹤

ࡐ࡯࠭⋙ⷞ

໧㗴⸃᳿

• ታᣉਛߩ⊒⹤ࡊ࡜ࡦ

• ࡙࡯ࠩߦવ㆐ᷣߺߩᖱႎ

• ࡙࡯ࠩᔕ╵ߩጁᱧ

• ᵈⷞ⁁ᘒ

⊒⹤ࡊ࡜ࡦ

⸒⺆⴫⃻

⸒⺆⴫⃻

࡙࡯ࠩᔕ╵

࠲ࠗࡊ ኻ⹤⋡ᮡ

໧㗴

࠼ࡔࠗࡦࡊ࡜ࡦ ኻ⹤⁁ᘒෳᾖ

࡙࡯ࠩᔕ╵

ጁᱧߩ⸥㍳

ᤨ㑆೙㒢⿥ㆊ ߩว࿑

⊒⹤↢ᚑ

⊒⹤ℂ⸃

図4.3: 漸次的発話生成のシステム構成

て実装されるであろう.本章では,タスクとして交通経路案内を取り上げ,問題 解決部は,問題(交通経路探索)が与えられると,問題の解としてドメインプラン

(交通経路)を立案するものとして実装され,ドメインプランは,階層的プランニ ングの技法[76]を用いて,段階的に詳細化されることを想定する.

発話プランニングは,談話生成を担当する構成部であり,ドメインプランの内容 をユーザに提案するという対話目標を達成するための発話プランを生成する.発 話プランは,対話相手に情報を伝達することを目的とする対話行為の列である.発 話プランは,階層的プランニング技法[76]を用いて,段階的に詳細化される.最 終的には,話し言葉に特有の小さな発話単位に対応する表層的な対話行為の列に まで詳細化され,発話実行部に送られる.

発話実行部は発話プラン内の表層的な対話行為に対応する言語表現を生成し,音 声合成部に送る.本章では,発話単位の表層言語生成はテンプレートマッチング 法[72]によって実現するものとする.音声合成部は音声として言語表現を出力す る.音声合成部は,それぞれの発話単位の発話が完了したら,そのことを発話実 行部に知らせる.ポーズ監視部は,ポーズが一定の時間制限を越えたら,そのこ とを対話制御部に知らせる.

各構成部は,対話状態と呼ばれる情報を共有し,対話状態の参照・更新を行う.

対話状態には,実施中の発話プラン,ユーザに伝達済みの情報,ユーザ応答の履 歴,注視状態[34]が書き込まれる.生成される談話が適切であることと,ユーザ からの応答に適切に対処することを保証するために協調的談話原則が用いられる.

協調的対話原則としては,これまでに説明した対話データの分析に基づく原則の 他に,4.4節で述べる言語学的な知見に基づく原則も用いる.

各構成部は並列に動作する.既に述べたように,ドメインプランと発話プラン は階層的プランニング技法[76]に基づいて段階的に詳細化される.ドメインプラ ンが完全に具体化されるのを待たずに,部分的に決定されたドメインプランの内 容をユーザに伝達するための発話プランが立案される.発話プランは,表層的な 対話行為の列にまで段階的に具体化され,表層的な対話行為が得られた時点で発 話実行部に送られ,発話が開始される.発話が行なわれている間にドメインプラ ンは詳細化されていく.ドメインプランが詳細化された時点で発話プランは再立 案される.古い発話プランに基づく発話は中断され,新しい発話プランに基づく

発話が再開される.このように,発話内容が完全に決定するのを待たずに,話し 言葉特有の小さな発話単位による発話が可能となった時点で発話を開始できるの で,システムは発話すべきときに即座に発話を開始することが容易となる.以上 の方法によっても時間制限内に発話を開始することができず,ポーズ監視部によっ てポーズが一定の時間制限を越えたことが検出された場合には,対話制御部は発 話生成部につなぎ語(例:「えーっと」)を出力するように命じる5

システム発話の途中にユーザからのアイヅチや割り込み発話が発生すると,発 話生成部は,発話理解部,対話制御部と連動して,協調的対話原則にしたがって ユーザのアイヅチ,割り込み発話に対処する.発話理解部は,現在の対話状態に 依存してユーザ応答タイプを分類し,対話制御部に知らせる.システムのどの対 話行為に対してユーザ応答が起きたのかが対話状態に書き込まれる.対話制御部 は,応答タイプと協調的対話原則にしたがって,必要なら発話を中断し,発話プ ランを変更するように発話プランニング部に指令する.システムは話し言葉特有 の小さな発話単位を使って段階的に情報を伝達しているので,ユーザのアイヅチ や割り込みに即座に対処でき,協調的対話原則にしたがって臨機応変に話の進め 方を変更しながら,自然な発話を生成することができる.

ドキュメント内 音声対話システムの構成法に関する研究 (ページ 75-78)