非対面状況下のノンバーバル表現に対するぬいぐるみロボットの影響

全文

(1)社団法人情報処理学会研究報告 IPSJ SIG Technical Report. 2004−HI−111 (3) 2004／11／11. 非対面状況下のノンバーバル表現に対するぬいぐるみロボットの影響米澤朋子*1，鈴木紀子*2，間瀬健二*3 *1，小暮潔 *1 *1 ATR 知能ロボティクス研究所，*2 ATR メディア情報科学研究所，*3 名古屋大学概要本稿では，人と人のコミュニケーションに対し，既存のコミュニケーションチャンネルと並行した，ぬいぐるみの新しい表現形式としての可能性に着目し，ぬいぐるみロボットの動きと音声を通じた会話による非対面コミュニケーションを観察する．そして，ぬいぐるみの実体性や外観がユーザの発話および意識的・無意識的ノンバーバル表現に及ぼす影響について実験的に分析する．そのため，1) 実存するぬいぐるみを用いた場合と二次元画面上に現れるぬいぐるみを用いた場合，2) ぬいぐるみを用いた場合とむき出しのロボットを用いた場合をそれぞれ対比較する．その結果，ぬいぐるみの実体性. や外観が，それぞれユーザの発話や動作に作用することが確認された．. Non-verbal Expression in Non-face-to-face Communication using a Puppet-Robot Tomoko Yonezawa*1，Noriko Suzuki*2，Kenji Mase*3 *1，Kiyoshi Kogure*1 *1 ATR Intelligent Robotics and Communication Laboratories, *2 ATR Media Information Science Laboratories, *3 Nagoya University abstract Puppets could become a new tool for expressive communication, parallel to traditional communication channels in human-human interaction. A puppet-robot was used in a non-face-to-face communication experiment, which allowed expression via motion and vocal cues. Two conditions were explored, one in which the subject could see the real puppet-robot and the other in which the user viewed the puppet-robot via a video link. The results demonstrated the importance of the physical presence of the puppet-robot for communication. We also explored the effect of the appearance of the puppet-robot. In one condition, the puppet-robot was placed inside a stuffed bear, whereas in the other condition a skeleton robot was used. Based on analysis of the subject’s movements and utterances, we found that the appearance of the stuffed bear puppet-robot was more effective for communication. We conclude the physical presence and appearance of the puppet-robot play an important role in non-verbal communication with the robot. 仮想キャラクタを用いたアバターチャットシステムさぱり(Sony) [2]なども，ノンバーバル情報を導入した遠人と人の対面コミュニケーションではさまざまなノ隔コミュニケーション支援といえるが，個々の没入感ンバーバル表現が交わされる．その一方で電話などのの度合に依存する．それに対しより直感的なコミュニ即時性のある非対面コミュニケーションでは，対面のケーションのために実体性を伴ったノンバーバル擬人場合と比べて，伝えることのできるノンバーバル情報化表現が有効だと考えた．は通常減少すると考えられる．我々はぬいぐるみの情操性を活かしたコミュニケーしかし，昨今遠隔コミュニケーションにおける視覚ションを狙いとし，これまでに既存のコミュニケーシ情報の共有や新しいグループウェアの形態が提案され，ョンチャンネルと並行した，ぬいぐるみを用いた新し対面コミュニケーションに類似したノンバーバル情報い表現を提案してきた[3]．この過程においてぬいぐるを提供することや，これまでにない新しいコミュニケみ（図 1 左）と音楽表現を用いた対面対話実験を行い，ーション形態を実現するものが出現している．遠隔でぬいぐるみを用いると会話の主導権が不規則に変化す同じ室内にいるような感覚を共有するシステム[1]や， 1.. はじめに. −13− -1/8-.

(2) る現象が確認された[4]．ぬいぐるみによるコミュニケーションを精密に設計するには，この不規則な変化の要因を明らかにすることが望まれる．そこで本研究では，ぬいぐるみの特性を形成する要素として 1) 実体性，2) 外観が重要であると仮定し，それぞれの影響を，非対面コミュニケーションにおいて確認することを目的として実験を行った．まず，ぬいぐるみを通じた動作と音声の通信を行うことのできるシステム IPRobotPhone™[5]を用い非対面対話実験を行い，実験の過程を録音・録画した．データに対し発話や動作が行われた時間区間をラベル付与した．1) 実体性の異なる条件間:ぬいぐるみと対面した場合と，ぬいぐるみが映された二次元画面と対面した場合と，2) 外観の異なる条件間: ぬいぐるみと対面しながら人対人の非対面対話を行った場合と，ロボットと対面しながら非対面対話を行った場合のそれぞれにおいて被験者の行動を比較する．そして，ぬいぐるみの持つ要素としての外観と実体性の影響について個別に考察し，それぞれの有効性を確かめる． 2.. 関連研究. 異なる影響を受け，会話の主導権が不規則に変化することがわかった（図 1 右グラフ参照）．この結果は，ぬいぐるみが持ついくつかの要素が影響したためと考えられる．本稿ではぬいぐるみのもつ外観と実体性に着目して，ぬいぐるみを用いた非対面対話におけるユーザの行動を観察し，ぬいぐるみの実世界における実体性の影響を調べるために，ぬいぐるみ自身による場合とぬいぐるみの映像が二次元の画面上に表示される，いわば実世界での実体性がないぬいぐるみによる場合との比較を行う．また，やわらかい表面素材で覆われているぬいぐるみの外観の影響を調べるために，ぬいぐるみの内部のロボットによる場合との比較も行う．神田ら[11]はロボットと人とのコミュニケーションを量的に観察し，モーションキャプチャシステムを利用して身体動作を測定し，人-ロボット間の相互作用におけるユーザの主観的評価と身体動作の関連を示している．このように，音声による対話の様子だけではなく，ユーザの身体動作を観察するため，対話と身体動作の両方を比較する実験を設計した． piano(x), no-device(y). no-device. doll(x), no-device(y) 擬人化システムとして，Robovie[6]など社会的反応を piano, no_dev EX doll, no_dev EX 2 するよう設計されたシステムが多く発表されている． line(piano(x), no_device(y)) line(doll(x), no_device(y)) 一方で，ネコロ[7]他多数のペットロボットシステムも，ぬいぐるみを用いた擬人化表現を行っている．これらは擬人化表現を用いて人を惹きつけたり癒したりする 1 目的が主である． y = 0.0953x + 0.9249 それに対し，Actimate-burney[8]のようにぬいぐるみ R = 0.0225 · Pressure sensor *2 を通じた教育など「ぬいぐるみとの接触」以外に目的 y = 0.5212x + 0.4506 x 軸:デバイスあり · Bend sensor *4 R = 0.801 を持たせたシステムがある．ぬいぐるみの役割を愛玩 y 軸:デバイスなし 0 の対象から擬人化できる部分を別の目的に活かしてい 0 0.5 1 1.5 2 2.5 るといえる．会話のバランス（話者 A の発話量／話者 B の発話量）図 1: ぬいぐるみを用いた対面実験の結果 MTC「おかえりぷるる」[9]は，メッセージ内蔵型ぬいぐるみ電話である．留守電の機能に擬人化要素が付 puppet, 上カメラ monitor or 加したものと考えられる．このような従来の電話機能 robot の一部としてぬいぐるみをとらえているものから，正面カメラ RobotPhone[10]のようにぬいぐるみに動きを取り込み，左カメラぬいぐるみをアバター／アクチュエータとしての両面で擬人化してコミュニケーションのツールとして用い ball headphone るものもある．これはぬいぐるみの内部にセンサとロ microphone ボットを埋め込み，ユーザの動作入力をもう一方のユ LAN ーザがもつぬいぐるみ動作に反映するシステムである．我々はぬいぐるみの擬人性を用いて音楽コミュニケぬいぐるみコントロール信号受信 PC ーションを行うために Com-music[3]を提案した．この図 2: 実験システム（被験者側）システムは多種多様なセンサを内包し，ぬいぐるみの from microphone to headphone 状況に応じた音楽生成を行うシステムである．そして，ぬいぐるみコントロール信号送信 PC from 3 cameras 対面コミュニケーションでの Com-music システムにお mixer LAN ける「ぬいぐるみというデバイス」の効果について分 video unit 析するため，ピアノ・ぬいぐるみ・何も持たないとい DV recorder タイミング制御 Wizard of Oz audio う表現デバイスの異なる条件で対面対話実験を行い， L:ぬいぐるみ音声ユーザの音声対話を観察した[4]．その結果，ぬいぐる R: 被験者音声ぬいぐるみ音声出力 PC みという対象を持つことによる影響は対話ペアにより 2. 2. 図 3: 実験システム（実験者側）. −14− -2/8-.

(3) 3.. 実験. これまでに，音楽的な表現を伴う対面対話実験においてぬいぐるみが人同士の会話の主導権に不規則な影響を与えることがわかっている[4]．その不規則性の要因を明らかにするために，非対面状況下の対話実験を設定した．人と人のコミュニケーションを前提とし，ぬいぐるみの要素としての概観，実体性と接触の影響がどのような影響を及ぼすかに焦点を当てた．ぬいぐるみの動作表現を含めたコミュニケーションを考慮し，本実験では，動作表現と音声の両チャンネルでのコミュニケーションを可能とするロボットが必要である．そこで，この条件を満足する RobotPhone[9] の製品版である IPRobotPhone を使用する．このシステムは，ぬいぐるみの首，腕（x2）の 3 関節がそれぞれ 2 自由度，計 6 自由度の制御が可能なロボット内蔵型ぬいぐるみである．目的：ぬいぐるみの外観と実体性が非対面対話に与える影響があるのか，条件比較を行う．被験者： 20 代-30 代前半までの 21 名（男 15 名女 6 名）実験条件：実験条件は対話する際の対面する対象を a) ぬいぐるみ，b) 画面の中のぬいぐるみ，c)ロボットの 3 種類とした．これらを以後対面対象と呼ぶ．以下に示す条件で対面対象を設定した．そして，puppet 条件と monitor 条件の間，また puppet 条件と robot 条件の間で比較を行った． puppet 条件‥‥ぬいぐるみ monitor 条件‥‥ぬいぐるみを映した画面 robot 条件‥‥ぬいぐるみを剥いだ内部のロボット実験システム：対話相手との相互作用によって様々な影響を受けることを考慮し，人対人のコミュニケーションを想定した，実験者によってコントロールされ，あらかじめ決められたあらすじ通りに反応を返すシステムを，以下のように設定した．被験者は，防音設備のある部屋で 1) 対話音声情報と 2) ネットワークで実験者の IPRobotPhone と接続された IPRobotPhone の動作情報の二つを得る．音声による対話は，あらかじめ決められた対話の流れ（付録 A に示す）にそって対話実験を行うものとした．対話相手の台詞部分は同じ抑揚になるよう，ナレーターではない 20 代女性の音声をあらかじめ録音し，ピッチ加工（1.3 倍，時間長は元音声のまま）したものを用いた．以降ぬいぐるみ音声と呼ぶ．対話内容（ぬいぐるみ音声の台詞のみ）を被験者に紙面で提示し，対話ストーリーの大枠をつかませてから対話実験を開始し，自由に返答するよう指示した．ぬいぐるみ音声の出力タイミングは被験者の発話終了. から 2 秒後とした．ただし，発話 08 は 0.5sec 後とした．同時に，Wizard of Oz 法によって付録 A のぬいぐるみ音声と同期させて付録 B の動作情報を再現した．被験者にロボットの作動音が聞こえにくくするため，ヘッドセットを介して対話音声を通信した．ぬいぐるみ音声をヘッドフォンへ送り，ヘッドセットのマイクから被験者の音声を録音した．音声・ぬいぐるみコントロール信号の送受信システム全体を図 2, 3 に示す． monitor 条件の場合図 2 の中の対面対象はカラーモニターであり，そこに見かけ上等身大のぬいぐるみの映像が映す．このぬいぐるみの映像は他の部屋に設置された IPRobotPhone を他の条件と同様に外部から操作し，その映像を映したものである．被験者の様子は，頭上，正面，左真横からカメラで記録し，被験者の発話音声も同期させて録音した．教示内容：知人との人対人のコミュニケーションを想定させるため，「対話の相手は声の高さを変えてあるが被験者の知人であり，対話と同時にぬいぐるみを操作している」と設定し説明した．対話内容（付録 A）を示し，対話が限定されたストーリーに沿っていると同時に，被験者は自由な内容の返答ができることを教示した．観察（観測）内容： WaveSurfer[12]を用い，以下に記載するラベルについて，視認によるハンドラベリングによって各ラベルを付与した（図 4 参照）．その後ラベリング結果を条件ごとにまとめた． A. 聴取，音声波形視認による発話ラベリング各ぬいぐるみ音声に対する被験者の返答の発話タイミングをラベル付与した．発話中は付録 A の番号に応じ返答部分に番号ラベルを付与した．発話区間外は[#] を付与した．また，これらの発話を書き起こした．これらにより，以下のデータを得た． (1) 発話時間：被験者の各返答の時間長を発話タイミングより算出 (2) 発話遅延：ぬいぐるみ音声の発話終了時間から被験者の発話開始区間までの時間差を計測 (3) 発話モーラ数：被験者の各発話におけるモーラ数を計測今回の実験ではフィラーに別ラベルを付与しなかった．これは，通常ではフィラーと考えられる発話が返答そのものになるケースが目立ち，フィラーと意味のある発話の分別が難しいためである． B. 視認による動作ラベリング下記のラベルについて，開始時と終了時にマークをつけた．動作回数を計測するものは対話実験の時間長にかかわらず回数をそのまま使用し，時間長を計測するものは対話実験の時間長で正規化した．. −15− -3/8-.

(4) ぬいぐるみ側音声. ぬいぐるみ側発話タイミングラベル. 被験者の音声. 被験者側発話タイミングラベル. 被験者動作情報ラベル. 図 4:発話タイミングおよび動作情報のラベリング. (1) 視線 [look] 対面対象を見ている [look-ball] ボールを見ている [switch] 視線の対象の切り替わりをカウント (2) 表情 [smiling] 声を出す出さないにかかわらず，笑っている状態 (3) 対面対象の存在が前提で出現しやすい動作 [hands-wave] 対面対象に向かって手を挙げる，振る [mimicry] 対面対象の動作を真似る (4) 非対面対話でも使う可能性のある動作 [nod] うなづく [make-a- bow] お辞儀や会釈をする [head-incline] 首を曲げる動作 [body-incline] 胴体を移動させる動作 (5) 対話への関連性の低い動作 [touch-ball] ぬいぐるみ音声 04 以降の ball への接触 C. 簡易主観アンケートぬいぐるみもしくはロボットへの意識や，コミュニケーションの相手への意識について主観的意見を調べるため，以下の三つの簡単なアンケートを行った．また，対話実験についての自由回答を求め，本実験におけるコミュニケーションの形態について感じることを主題とし，全員から回答を得た． Q-A) 相手の人を想像したか Q-B) 対面対象に愛着を感じたか Q-C) 会話している間，コミュニケーションの相手の人，もしくは，対面対象のどちらを（どちらかといえば）意識したか. 4.. 実験結果. 4.1. 観察例各条件における実験風景を図 5，6，7 に示す． puppet 条件の実験の様子を主に観察したところ，被験者が片手を挙げて呼びかけや挨拶に返答したり，視線を合わせながら笑いかけるなどの対面対話でも見られる種類の行動が見られた．特に手を振る，挙げるなどは電話での非対面コミュニケーションではあまり見られないため，対面対象の存在が対話に及ぼす影響が存在すると考えられる． 4.2. アンケート結果アンケート項目のうち，Q-A と Q-B はそれぞれ独立事項であり，Q-C は二者択一である．そのため，まず Q-A と Q-B の回答の組み合わせを集計した（表 1）． Q-A と Q-B の回答の相関は-0.61 である．これは，全条件を通して，対面対象と対話相手のいずれかを意識する傾向があることを示している．しかし，個別の条件に関しては興味深い傾向が見られた．puppet 条件以外では Q-A と Q-B ともに Yes と回答した被験者はいなかったが，puppet 条件では 8 人中 3 人が両者を Yes とした．一方，monitor 条件において Q-B のみに Yes と回答した被験者が多かった．robot 条件では被験者全員 Q-A と Q-B どちらかにのみ Yes と回答していた．ここで， puppet 条件では，ぬいぐるみ音声を発している「相手」のアバターになる対象（ぬいぐるみ）に対し親しみを感じるとともに対話相手とのコミュニケーションにも意識がある被験者が数人見られたが，他の条件では見られなかったことを示している．robot 条件では特に被. −16− -4/8-.

(5) 験者は対面対象と対話相手のどちらかに意識が集中したと推測する．monitor 条件では Q-B のみを Yes とした割合が高く，二次元画面上であってもぬいぐるみの映像に興味を惹かれた人が多かったことを示している． Q-C において，puppet 条件と monitor 条件においては各一人ずつが対話相手を意識したのに対し，robot 条件では 6 人中 3 人が対面対象を意識した．この 3 人は全員 Q-A が No，Q-B が Yes であった．この結果は上で述べた robot における意識の対象が集中したという推測を裏付けている．左カメラ. 上カメラ. 4.3. ユーザ動作の分析被験者の動作分析では，look，smiling，touch-ball によって実験全体におけるユーザの関心について分析する．また，対面対象の存在が前提で出現しやすい動作と，非対面対話でも出現する可能性のある動作の出現回数を比較する．有意差の検定を行う際にはサンプル数などを考慮し，F 検定により分散の検定を行い，それに適した T 検定(α=0.05)を行った．look，smiling， touch-ball については，全体の時間で正規化したものをそれぞれ looking-rate，smiling-rate，touch-ball-rate として図 8 に示す．. 正面カメラ. 図 5: 実験風景 [puppet] 左カメラ. 上カメラ. モニタ上のぬいぐるみ映像. 動作分析 1: touch-ball の割合では，puppet 条件と robot 条件の間で T(7)=-2.60, p<.05 と有意差があったが， puppet 条件と monitor 条件の間では T(9)= -1.92，p=0.09 と有意傾向にとどまった．実際 touch-ball を行った被験者数は， puppet 条件で 1 人（8 人中）， monitor 条件で 4 人（7 人中）， robot 条件で 5 人（6 人中）であった． touch-ball は対話とは直接関係せず無意識的な「手癖」であり，対面コミュニケーションでは減少すると推測した．そして，上記の結果はぬいぐるみが実体であることが手癖を減少させた，また，ぬいぐるみの外見がロボットのままと比較して手癖を減少させると考える．. 正面カメラ. 図 6: 実験風景 [monitor] 左カメラ. 自由回答（付録 C）では，ぬいぐるみ音声に関する感想が monitor 条件で 2 人（7 人中），robot 条件で 2 人（6 人中）から得られた．対話を通じたコミュニケーションにおいて，対面対象が新規のものであっても音声のモダリティが重要であることが伺える．相槌やうなずきがよかったとする意見がすべての条件において見られた．puppet 条件と robot 条件では動作やジェスチャに対する感想が見られたのに対し，monitor 条件では実体が存在したらよかったという感想が見られた．その他否定的な回答としては，puppet 条件で，ぬいぐるみと向かい合う形態のコミュニケーションに抵抗を示す回答が一点あった．monitor 条件ではつかみどころがない感覚だったという回答があった．. 上カメラ. 正面カメラ. 図 7: 実験風景 [robot]. 表 1: Q-A と Q-B の回答パターン集計 condition. Q-A&Q-B. Q-A only. Q-B only. none. (all). puppet monitor robot. 3 0 0. 2 1 3. 3 5 3. 0 1 0. 8 7 6. 動作分析 2: smiling-rate の puppet 条件と monitor 条件間で T(8)=1.95, p=0.09 と有意傾向にとどまったが，puppet 条件と robot 条件間では T(7)=2.53, p<.05 となり，有意差が確認された．また，looking-rate は puppet - monitor 条件間では T(13)=-0.17, p= 0.86 で有意差はなく， puppet - robot 条件間では T(12)=2.32, p<.05 となり有意差が認められた．ユーザの笑う表情は画面の中のぬいぐるみより実体性を伴った対面対象のほうが比較的出やすいが，注視率は変わらなかった．つまり，実体性が視線をひきつけるとは限らず，二次元画面でも視線をひきつけると考えられる．一方外見の差については，ぬいぐるみの外観によりユーザが笑顔を見せ，ぬいぐるみを注視し，楽しんで集中したことを示唆している．. −17− -5/8-.

(6) 1.4 1.2 1. puppet. 0.8. monitor. 0.6. robot. 0.4 0.2 0 looking-rate. smiling-rate. touch-ball-rate. 図 8: 各ラベルの全体に対する時間長の割合 looking-rate vs smiling-rate. smiling. 0.6 0.5 0.4 0.3. puppet monitor robot. 0.2 0.1 0 0. 0.2. 0.4. 0.6. 0.8. なかったため分散が大きくなったが，puppet 条件と比べ robot 条件で対面対象の存在が前提で出現する動作の出現が少なかった．有意差は確認できなかったが，ぬいぐるみの外観が人と対面したときのように親しみやすく，これらの表現がなされたとも考えられる．動作分析 5: 非対面対話でも出現する可能性がある動作の集計を図 11 に示す．head-incline と body-incline は被験者の意思表示とは限らず，結果でも有意な差は見られなかった．nod と make-a-bow は電話など非対面状況においても無意識的にも行われる挨拶や意思表示行動だと考えられる．この二種類の表現が robot において少なかったため（puppet - robot 条件間において nod と make -a-bow の回数の和を検定，T(8)=3.11, p<.05 で有意差あり），外観の違いによりコミュニケーションに対する関心が低下したと予想される．. 1. 動作分析 6: 視点のスイッチのタイミングを A: ぬいぐるみ音声発話中，A’: ぬいぐるみ音声終了後から被験者発話までの間，B: 被験者発話中，B’: 被験者発話終 6 了後とし，A または B のタイミングで視点がスイッチ 5 した回数と A’または B’のタイミングで視点がスイッ 4 puppet チした回数を散布図に示す（図 12 参照）．視点スイッ 3 monitor 2 robot チ回数の合計では各条件間で大きな差は見られなかっ 1 たが，図 12 の散布図は線形近似すると puppet 条件の 0 R2 値が最も高かった（0.80）．これについて対話時の視 hand-wave mimicry 点スイッチが落ち着きを示すものだと仮定すると，発図 10: 対面対象の存在が前提で出現しやすい動作回数話時と非発話時の落ち着きの程度が変化せず，他の条件では少々変化したということができる． looking. times. 図 9: looking-rate と smiling-rate の関係. 10 8 puppet. times. 6. monitor 4. robot. 2 0 head-incline. body-incline. nod. make-a-bow. 図 11: 非対面対話でも使う可能性のある動作回数 AB vs A'B' in switch. 25. A'B' (times). 20 puppet. 15. monitor 10. robot. 5. 4.4. 発話分析被験者の発話分析は，ぬいぐるみ音声に応じた返答ごとの 1) 発話量（時間長），2) 発話遅延（ぬいぐるみ音声の発話終了から被験者の発話開始までの時間長）， 3) 発話モーラ数を用いた．ぬいぐるみ音声 01, 09, 10 に対応する被験者の発話を「定型挨拶」に対する発話とし，03, 08 に対応する被験者の発話を「相槌反応」， 02, 04, 07 に対応する被験者の発話を「質問」，05, 06 に対する被験者の発話を「主張」に対する発話として，それぞれ被験者ごとに平均値を出した．条件ごとの平均値を図 13, 14, 15 に示す．これらのデータの検定でも，動作の分析と同様に F 検定により分散の検定を行い，適した T 検定(α=0.05)を行った．. 0. 発話分析 1: 特に発話の多かった「質問」と「主張」に対応する被験者の発話量を散布図に示した（図 16）．図 12:視点スイッチのタイミング（発話中，非発話中）ここでは puppet 条件を基準としてみると monitor 条件動作分析 3: 図 9 で looking, smiling の散布図では robot では右下のほうに集中しているといえる．robot 条件は「質問」に対応す条件と monitor 条件は puppet 条件に比べて左右下方にほとんど同様に分布している．また，分布している．ぬいぐるみの外観／実体性のそれぞれる被験者の発話量において puppet - monitor 条件間ではが及ぼす影響は異なるベクトルである可能性がある． monitor 条件の発話量が比較的多く，検定の結果は T(10)=-2.53, p<.05 となり有意差が認められた．そのほ動作分析 4: 対面対象の存在が前提で出現すると考えかの返答では各条件間（puppet - monitor 条件間，puppet られる動作の回数を集計し図 10 に示す．観測回数が少 - robot 条件間）で有意差は見られなかった．質問に対 0. 5. 10. 15. 20. 25. 30. AB (times). −18− -6/8-.

(7) 発話分析 2: 発話遅延では親しみやすさや会話への没入が現れると考えたが，どのデータも各条件間で有意差は見られなかった．これは，同日中事前にテスト対話を行ってはいたが，実験当日がこの形態での対話が始めてであった事と，ぬいぐるみ音声が誰のものか分からなくなっているため，没入までいたらなかったと考えられる．発話分析 3: 発話モーラ数では，「定型挨拶」に対する応答で puppet - monitor 条件間で T(13)=2.13, p=0.05 となり有意傾向がみられ，puppet 条件がやや多く応答しているといえる（図 15）．さらに挨拶に対する応答はある程度定型であることが多いため，対面対象が画面上のぬいぐるみになると挨拶が簡素化したと考えられる．また，発話量で有意差のあった「質問」に対する応答で，puppet - monitor 条件間で発話モーラ数も有意差があった（T(13)=-2.57, p=.05）．このことから，画面上のぬいぐるみが対面対象であるとき，発話時間だけでなく発話内容も増加する傾向があるといえる． utterance 5. sec.. 4. puppet. 3. monitor. 2. robot. 1 0 定型挨拶. 相槌反応. 質問. 主張. 図 13: 各条件における発話時間長 delay 3 2.5 puppet. sec.. 2. monitor. 1.5 1. robot. 0.5 0 定型挨拶. 相槌反応. 質問. 主張. 図 14: 各条件における発話遅延発話モーラ数 30. utterance 質問vs主張. 主張(sec.). する応答では，Yes, No の返答以外に様々な応答を行う可能性が考えられる．ぬいぐるみが対面対象であるときよりも，画面の中のぬいぐるみが対面対象であるときのほうがより多くの Yes, No 以外の応答が得られたと考えられる．. 7 6 5 4 3 2 1 0. puppet monitor robot. 0. 1. 2. 3. 4. 質問(sec.). 図 16: 「質問」「主張」に対する発話時間長の散布図. 5.. 考察. まず，主観評価の分析より，ユーザはぬいぐるみに対して親しみを感じると同時に対話相手とのコミュニケーションにも意識を持ちやすいという可能性が考えられる．さらにユーザ動作の分析において，ぬいぐるみの外観が手癖を減少させていたことから，非対面状況下であっても，ぬいぐるみが人と対面したときのような対面状況を想定させ，ユーザの無意識的な行動に反映されたとも考えられる．それに対して外観が無機質なロボットでは，主観評価においてユーザの意識の対象が対話相手かロボットかに分かれていた．発話の比較においては puppet robot 条件間で有意な差は認められなかったが，動作の分析より，外観がぬいぐるみである時に比べ，笑顔になる率が低く，視線も向けていないことが分かった．これらのことから，外観がぬいぐるみであることで，より楽しみ集中できると考える．一方，ぬいぐるみの実体性は，動作分析において， touch-ball の手癖を減少させていた．また，発話分析において，挨拶や質問に対する応答を増加させた．対面対象が画面上であると返答が簡素化していたと考えると，実体性を持つことでユーザが積極的に対話に参加できる可能性がある．ぬいぐるみの要素を削減した各条件で，図 9，16 の散布図において近い箇所に集中する傾向があった．このことから，ぬいぐるみという対面対象を介した発話が不規則に変化したこと[4]は，各要素による異なる影響が加わったことが原因だと推測される．主観評価の自由回答や発話遅延の結果から，聴取される対話音声による影響が大きいと考えられ，今後の実験の構成を検討する必要がある．また，擬人化を用いたコミュニケーションシステムを設計する際，音声対話に偏ったコミュニケーションとならないよう，実体性を強調するデザインが重要である．その際ぬいぐるみの実体性は有効であると考える．. モーラ数. 25 20. puppet. 15. monitor. 10. robot. 5 0 定型挨拶. 相槌反応. 質問. 主張. 図 15: 各条件における発話モーラ数. 6.. おわりに. 本稿ではぬいぐるみの新しい表現形式としての可能性に着目し，ぬいぐるみロボットの動きと音声を通じた会話による非対面対話を観察した．そして，ぬいぐるみの実体性や外観の影響が，いくつかのユーザの動作や発話にそれぞれ作用したことを発見し，ぬいぐるみの持つ要素として外観と実体性が個別に影響してい. −19− -7/8-.

(8) ると考察した．今後は，対話ラベルと同時に動作ラベルを複合的にラベル付けし，ユーザ傾向を測定する手法を検討していきたい．また，ぬいぐるみの存在そのものだけではなく，ユーザによるぬいぐるみとの接触や制御などの行動を観察する必要があると考えている．今回の実験では音声の重要性を指摘するユーザもいたことから，ぬいぐるみを用いたコミュニケーションにおける音声表現について別途検討する必要があると考えている．謝辞本研究は情報通信研究機構の研究委託により実施したものである．研究の機会を下さった ATR IRC 所長萩田紀博氏に感謝する．また，実験にご協力いただいた ATR IRC／ATR MIS の皆様に感謝する．参考文献 [1] 原田康徳，“同室感通信”，インタラクティブシステムとソフトウェア 6，日本ソフトウェア学会, pp. 53-60, 1999. [2] SONY, さぱりミレニアム, http://sapacafe.sub.jp/sapari.htm, 2000. [3] Yonezawa, T., Clarkson, B., Yasumura, M., and Mase, K., “Context-aware Sensor-doll as a Music Expression Device,” CHI2001 Extended Abstracts, pp. 307-308, ACM SIGCHI, 2001. [4] Yonezawa, T. and Mase, K., “Musically Expressive Doll in Face-to-face Communication,” IEEE International Conference of Multimodal Interfaces Proceedings, pp. 417-422, 2002. [5] イワヤ株式会社，IPRobotPhone, http://www.iwaya.co. jp/ Files/phone-j.html, 2002. [6] 小野哲雄，今井倫太，石黒浩，中津良平， “身体表現を用いた人とロボットの共創対話,” 情報処理学会論文誌，Vol. 42, NO. 6, pp. 1348-1358, 2001. [7] SONY, “ネコロ,” http://pcweb.mycom.co.jp/news/2001 /news/2001/12/11/10.html [8] Strommen, E., “When the Interface is a Talking Dinosaur: Lerning across Media with ActiMates Barney,” CHI98 Proceedings, pp. 288-295, 1998. [9] MTC, “ おかえりぷるる,” http://ktai.impress.co.jp/ cda/article/news_toppage/16832.html, http://suntec.scn-net. ne.jp/~mtc/pururu/pururu.htm [10] Sekiguchi, D., Inami, M., and Tachi, S., “RobotPHONE:RUI for Interpersonal Communication,” CHI2001 Extended Abstracts, pp. 277-278, 2001. [11] 神田崇行，今井倫太，小野哲雄，石黒浩，“人-ロボット相互作用における身体動作の数値解析,” 情報処理学会論文誌，Vol. 41, No. 6, 2000. [12] Sjölander, K., and Beskow, J., WaveSurfer, http://www. speech.kth.se/wavesurfer/. 付録 A: ぬいぐるみ音声台詞 01：ただいまー。 02：なんか最近、いいことない？ 03：そっかー。 04：あ，それ，そこの青いボール、やわらかい？ 05：そのボールこのくらいの大きさでしょ、このくらい大きいのも欲しい。 06：私はネット三昧で暮らしてるから、楽しいよー。 07：そうそう、ネットに『○○（Web サイト名）は頭に良くない』っていうのが載ってたの。 08：うんうん。 09：今日は、ありがとう。 10：また、こうやって話しようよ。. 付録 B: ぬいぐるみ音声対応動作 01-M: 両手をあげる 02-M: 首をひねる 03-M: うなずく 04-M: 左手で示す 05-M: 前に手をそろえて出し，下げてから，横に出す 06-M: 軽くうなづく 07-M: 両手を前後に動かす 08-M: 2 回うなづく 09-M: 右手を挙げる 10-M: 両手を前後に動かす. 付録 C: 自由回答 -puppet・あいづちが重要・音声だけより親近感が生まれた．・電話より実態があってコミュニケーションしやすい・声が聞こえるとぬいぐるみを思わず見てしまう．・知らない人かすごく仲がいい人が相手だといい・慣れたら楽しめそう・指差し動作は理解できたがジェスチャ解釈が難しい・動作がもっとほしい・一人で話している感じがして，恥ずかしい. -monitor・うなずきが重要・人と話している感覚はないが孤独感はなくなる・つかみ所がない，画面を見て話すのには慣れない・実体があるといい・実体があえば目が合う向きに変えた・声の質がキャラクタ的・声が気になる. -robot・あいづちが重要・うなずき，大きさ指示が電話よりよい・人間の存在は意識しなかった・もし操作するなら逆向きにしたい・ロボットの動きが怖い・動作が大きいほどよい・ロボットとは別の存在として声を意識・声の影響（かわいい）. −20− -8/8-.

(9)