協調的対話原則と対話状態

発話が再開される．このように，発話内容が完全に決定するのを待たずに，話し言葉特有の小さな発話単位による発話が可能となった時点で発話を開始できるので，システムは発話すべきときに即座に発話を開始することが容易となる．以上の方法によっても時間制限内に発話を開始することができず，ポーズ監視部によってポーズが一定の時間制限を越えたことが検出された場合には，対話制御部は発話生成部につなぎ語(例：「えーっと」)を出力するように命じる⁵．

システム発話の途中にユーザからのアイヅチや割り込み発話が発生すると，発話生成部は，発話理解部，対話制御部と連動して，協調的対話原則にしたがってユーザのアイヅチ，割り込み発話に対処する．発話理解部は，現在の対話状態に依存してユーザ応答タイプを分類し，対話制御部に知らせる．システムのどの対話行為に対してユーザ応答が起きたのかが対話状態に書き込まれる．対話制御部は，応答タイプと協調的対話原則にしたがって，必要なら発話を中断し，発話プランを変更するように発話プランニング部に指令する．システムは話し言葉特有の小さな発話単位を使って段階的に情報を伝達しているので，ユーザのアイヅチや割り込みに即座に対処でき，協調的対話原則にしたがって臨機応変に話の進め方を変更しながら，自然な発話を生成することができる．

これらはGriceによる協調の原則 [33]の一例とみなすことができる．協調的対話原則7と協調的対話原則8は，整然と話せ，簡潔な言い方をせよというGriceの様態の原則の一例であり，協調的対話原則 9は，現在の対話目的と関連のあることを話せという関連性の原則の一例である．

対話状態には，発話プラン，ユーザに伝達済みの情報，ユーザ応答の履歴，注視状態 [34]が書き込まれる．発話プランニング部は発話プランを対話状態に書き込む．発話実行部は，発話プランに含まれる個々の対話行為の実行が完了したら，

その対話行為が実行済みであることを対話状態に書き込む．このことによってユーザに伝達済みの情報が何かを判断することができる．発話理解部は，システムの発話に対してユーザからの応答が発生したら，ユーザ応答がどのシステム対話行為に対して行われたかを対話状態に書き込む．

注視状態の追跡は，注視状態の移行を伴う言語表現ごとに，注視状態を追跡するためのルールを書くことによって行っている．たとえば，交通経路案内の対話において場所S から路線Lで場所D まで移動するという行為の内容を「行く」，

「出る」といった主動詞を使って記述するための一連の発話を行うとする．この一連の発話が実行された後では，注視される対象はDに移行する．また，この一連の発話が注視状態に対して適切であるためには，発話を開始した時点で場所Sが注視されている必要がある．もし場所Sが注視されていないなら，場所Sを提題化する必要がある．

4.5 ^問題解決

問題解決とは与えられた問題を解くドメインプランを立案することである．ドメインプランはドメイン行為の列として表される．交通経路案内に関する対話では，ドメイン行為は主としてある場所から別の場所まで交通機関を使って行くという移動行為である．ドメインプランは階層的プランニングの技法を使って段階的に詳細化されるとする．問題解決のメカニズムは漸次的発話生成手法の理解に直接関与しないので，その詳細には立ち入らない．ここでは，図4.4に示す路線図において武蔵野センタから厚木センタまで行くという問題が与えられた場合を例にとって，問題解決部の振舞いを例示する．

ෘᧁ⎇ⓥ࠮ࡦ࠲

ᱞ⬿㊁⎇ⓥ࠮ࡦ࠲

ਃ㣔 ศ␽ኹ

ᣂኋ

ਅർᴛ

ᗲ↲⍹↰

ࡃࠬ ࡃࠬ ਛᄩ✢

ዊ↰ᕆ✢

੗ߩ㗡✢

ࡃࠬ

図 4.4: 路線図の例

この場合，最初に立案されるドメインプランは，武蔵野センタからバスでその最寄り駅に移動し，そこから厚木センタの最寄り駅まで移動し，そこからバスで厚木センタに移動するという3つの行為 a1, a2, a3 から成る抽象的なドメインプランである．このプランは次の表現(4.1)で表され，各行為の情報内容は(4.2)のように表される．cont(X, Y)はXの情報内容が論理式の集合Y で表されることを意味する．また，行為の行為者を表す引数は本章を通じて簡単のため省略する．

plan([a1, a2, a3]). (4.1)

cont(a1, {type(a1, move), source(a1, x1), (4.2) manner(a1, x2), dest(a1, x3)}).

cont(x1, {type(x1, building), named(x1, “武蔵野センタ”)}).

cont(x2, {type(x2, bus)}).

cont(x3, {type(x3, station), nearest(x3, x1)}).

cont(a2, {type(a2, move), source(a2, x3), dest(a2, x4)}).

cont(a3, {type(a3, move), source(a3, x4),

manner(a3, x5), dest(a3, x6)}).

cont(x4, {type(x4, station), nearest(x4, x6)}).

cont(x5, {type(x5, bus)}).

cont(x6, {type(x6, building), named(x6, “厚木センタ”)}).

次に，問題解決部はより詳細なドメインプランの立案を進める．与えられた問題を解く二つ以上のドメインプランが可能なら，最短時間で目的地点まで移動できるドメインプランを選択する．図 4.4に示す路線図においては，選択されるドメインプランは，武蔵野センタからバスで吉祥寺へ移動し，そこから井の頭線で下北沢へ移動し，そこから小田急線で愛甲石田へ移動し，そこからバスで厚木センタへ移動するという4つの行為a4, a5, a6, a7 から成るプランである．このプラ

ンは次の(4.3)で表され，行為a4の情報内容は(4.4)で表される．他の3つの行為

a5, a6, a7の内容を記述するための表現は簡単のため省略する．

plan([a4, a5, a6, a7]). (4.3)

cont(a4, {type(a4, move), source(a4, x1), (4.4) manner(a4, x2), dest(a4, x7)}).

cont(x7, {type(x7, station), named(x7, “吉祥寺”)}).

ドキュメント内音声対話システムの構成法に関する研究 (ページ 78-81)

4.5 問題解決

4.5 ^問題解決