エージェント - Sentence Similarity

Sentence Similarity

5.3 エージェント

本節では，前節の語彙獲得のモデルを用いたエージェントのモデルを提案する．本モデルは，第⁴章で提案した文法獲得のモデルと統合することを意図して構築されている．

5.3.1

エージェントとコミュニケーション

本モデルにおけるエージェントは，自分の語彙識別の能力を示す指標である類似度の閾値²ⁱ^(t)をコミュニケーションによって時間とともに変化させる．エージェント間のコミュニケーションは，以下の手順で行なう．

0．発話：あるエージェントが，自分の類似度の閾値以上の語を用いて発話する．この文を^S とする．

1．理解：その発話を次のエージェントが意味的に理解しようと試みる．発話された文の

類似度 ^sim(S;^C^k⁾ が，そのエージェントの閾値以上であれば理解できたとする．

2．発話：

2-1 1で理解できたエージェントは，その文で用いられた語と，類似度が閾値以上の語を用いて発話する．

2-2 1で理解できなかったエージェントは，類似度が閾値以上の語をランダムに用いて発話する．

3．計算：ⁿ 回の発話が終ったとき，全エージェントは類似度計算とクラスタリングを行なう．このとき，ある閾値以下の語は捨てられる．¹ へ戻る．

エージェントの類似度の閾値の計算は，以下のように行なう．ここで，^Aはこのコミュニティにおけるエージェントのインデックスの集合，^Sij

()(i;j 2A)は第ⁱエージェントから第^jエージェントへ時刻に発話された文であり，^jS^ij⁽^)jはその長さ（語数）である．

いま，第 ⁱエージェントが第 ^jエージェントに対して発話したとする．このとき，第ⁱ エージェントは，その発話した文における語と語の間の類似度の平均^U^ij⁽⁾を計算する．

sim

i (W

)は，第ⁱエージェントの持つ行列における語^W^kと^W^lの類似度である．同様に，その発話を聞いた第^jエージェントも類似度の平均^L^ij⁽⁾を計算する．

発話（^Utterance）

ij ()=

ij ()j

k 2S

ij ()

l 2S

ij ();k 6=l

sim

i (W

) (5:8)

聴取（^Listening）

ij ()=

ij ()j

k 2S

ij ()

l 2S

ij ();k 6=l

sim

j (W

) (5:9)

発話を理解した場合，理解された場合の閾値の増減は，これらの^U^ij⁽^);^L^ij⁽⁾ を用いて，

以下のように定義される．

理解する（recognizing）

ij ()=

10L

(); iは^jの発話を理解できた．

(); iは^jの発話を理解できなかった．

(5:10)

理解される（^being ^recognized）

ij ()=

10U

(); iの発話は^jに理解された．

(); iの発話は^jに理解されなかった．

(5:11)

以上の定義より，類似度の低い語からなる文を理解したときの閾値の上昇は大きく，理解できなかったときの閾値の低下は小さい．しかし，類似度の高い語からなる文を理解したときは閾値の上昇は小さいが，理解できなかったときの閾値の低下は大きい．これは，「理解される」においても同様である．つまり，あまり使われていない語の並びを発話した場合は理解されない危険が大きいが，理解されたときの利益は大きい．逆に，よく使われている語の並びを発話した場合は理解される確率が高いが，理解されなかった場合の不利益は大きいことを意味する．

第ⁱ エージェントの類似度の閾値の関数 ²ⁱ^(t) は，以下のように定義される．ここで，

bは，発話を理解した，もしくは，理解されたときの閾値の上昇・低下に関わるパラメータであり，^p^tは時間減衰のパラメータである．

(t)=p

r 1

jAj P

j2A P

2[t01;t]

()+p

b 1

jAj P

j2A P

2[t01;t]

()+p

t 2

(t01): (5.12)

式（^5.12）は，第⁴章で提案したエネルギー量の漸化式（式（^4.5））と同様の定義を行なっている．つまり，閾値の関数は，他のエージェントとのコミュニケーションがない限り，時間を追って指数関数的に減少する関数となっている．これは，文法のモデルと語彙のモデルの統合を意図しているためである（詳細は，第^5.4.3節で述べる）．

5.3.2

コミュニケーションと語彙の獲得

式（^5.12）により求められた時刻^tにおける類似度の閾値²i

(t) は，クラスタリングの際の閾値にも対応する．つまり，言語の異なるエージェントと接した場合，コミュニケーションが成立せず，その閾値は低下する．これに対応して，クラスタリングの閾値が下がり，これまで持っていなかった語彙を獲得しやすくなる．新しい語彙を獲得し，それをコミュニケーションに用いることで，閾値を大きく上昇させることが可能となり，徐々に確実なコミュニケーションが可能となっていく．このプロセスを本モデルでは，語彙獲得の過程とみなす．

本モデルの手法のように，「意味」を直接的に扱わないのでは，語彙を獲得してもコミュニケーションには役に立たないと考えるかもしれない．しかし，^Karovらの研究^[20]でも，

機械可読式の辞書を併用することで，これらの類似度から語義の曖昧性を解消している．

本モデルにおいても，今後，他のモーダルからの入力を統合処理することにより，本来の

「意味」を表現することは可能であると考える．

ドキュメント内 JAIST Repository (ページ 86-89)