ペットロボットを用いた感情認識システムに関する 研究
著者 館 宜伸
著者別名 Tachi, Yoshinobu
雑誌名 博士学位論文要旨 論文内容の要旨および論文審査
結果の要旨/金沢大学大学院自然科学研究科
巻 平成19年3月
ページ 15‑18
発行年 2007‑03‑01
URL http://hdl.handle.net/2297/14580
氏名 学位の種類 学位記番号 学位授与の日付 学位授与の要件 学位授与の題目 論文審査委員(主査)
論文審査委員(副査)
館宜伸 博士(工学)
博甲第752号 平成17年3月31日
課程博士(学位規則第4条第1項)
ペットロボットを用いた感情認識システムに関する研究 木村春彦(自然科学研究科・教授)
村本健一郎(自然科学研究科・教授),山根智(自然科学研究科・教授)
藤田政之(自然科学研究科・教授),南保英孝(自然科学研究科・講師)
ペットロボットを用いた感情認識システムに関する研究
StudiesontheEmotionRecognitionSystenlUsingaPetRobot
Ibday,sincechangeoftheemploymentfbrmofthecompany,whichsaidfromlifetimeemploymenttothe
annualsalarysystem,instabilityofthecoiltentsofservice,andanincome,theincreaseintheunelnployment
rate,and1changeofthesocialenvironlnentofchildren,searlyeducationyoungandoldofbothsexes,
uneasinessincreases,andtheheartofthehumanbeings,wearewild,rbrthisreason,thewish,,Cure,,is,
whichhasbecolnestrongfUrther、Inthispaper,thefeelingofacomplaintisrecognizedinordertorelieve suchpeople,sheart,anditconsideredmakingthereSponseunitedWiththefeelingnodback、Asapreceding paragraphstoryfbrthat,thispaperpresentsamethodfbrrecognizinghumanemotionsandshowseHicientof theproposedmethodwitheXperimentalresults.
1はじめに ない利点もある.後者は発話者が特定話者の場合には,
学習により認識率を向上させることができるが,不特定 話者の場合には認識率が低くなる場合があり,実用に耐 え得ることができなかった.尚,最近では前者と後者の 手法を併せ持つ感情認識を行う製品が開発されているが,
詳細については不明である.
本論文では,文献で用いたペットロボットを導入し,
ペットロポットを撫でながら音声入力をしてもらうこと 近年,終身雇用から年俸制へといった企業の雇用形態
の変化や,勤務内容,収入の不安定さ,完全失業率の増加,
更には子供達の早期教育といった社会環境の変動から,
老若男女の不安が増大し,我々人間の心が荒んできてい る.このため,癒されたいという願望はいっそう強まっ ている.本研究では,このような人々の心を癒すために,
愚痴の感`情を認識し,その感`情に合わせた相槌をうたせ ることを考えた.本論文では,そのための前段階として,
ペットロポットを撫でながら音声入力してもらうことに より発話者の感`情を認識する方法を提案する.
発話者の感情を認識することは,臨場感ある対話シス テムの開発やケアシステム作成に役立つ.感`情認識の研 究には,単語や会話の意味解釈がら判別するものや,発 話者の音声から判別するものがある.前者は,会話文を 自然言語解析することで感情判別を行うため,誤った感 情を判断することもある.例えば,怒りの感情で弔辞を 読む場合である.文面から悲しみの感情と誤認識される.
ただし,会話文に対して感情別のキーワードとなる言葉 を解析しているため,発話者の特定.不特定に左右され
鼬、、
,図1:本研究で用いられるアザラシ型ペットロポット
(4)登録中の識別データに同じものがなければ,O を出力する.
尚,将来的には,古い識別データを削除していく,
により,不特定話者の感情認識を行うシステムを提案す る.これは撫で方のパターンごとに音声の韻律`情報を割 り当て,同じ撫で方であれば同一人物と仮定し,個別に 学習させることにより,不特定話者の感情認識の信頼度 を向上させようとするものである.尚,ペットロボット を撫でるという行為には,癒し効果があることが知られ
ている.
2.2感情認識アルゴリズム
本論文で音声`情報から抽出する韻律情報は,先ず,ピッ チ,ピッチ速度,ピッチ速度の絶対値,パワー,残差パ ワー,スペクトル量の6種類である.この各韻律情報に 対して,平均値,分散値,最大値,最小値,範囲の値を求 める.ここで,ほとんどの音声でピッチ速度の絶対値の 最小値はOをとる.また,範囲の値は最大値一最小値で 求めるため,ピッチ速度の絶対値の範囲の値は最大値と 同じ値をとる.このため,ピッチ速度の絶対値の最小値 と範囲の値の特徴量を除外した.そして上記の特徴量に 加えて,パワーが設定した閾値を超える時間の割合を求 める.従来手法の韻律情報との違いは,「発話継続時間 を母音数で割った値」,「有ピッチ時間を母音数で割っ た値」を除外し,「パワーが設定した閾値を超える時間 の割合」を追加したことである.
本研究では,愚痴の感情を認識し,その感情に合わせ た相槌をうたせることを目標にしているので,対象とす る感情は相槌にかかわってくる「平静」,「喜び」,「怒 り」,「悲しみ」の4つとした.
尚,アルゴリズム2は,登録者の音声データと撫で方 のパターンを予め学習データとして入力し,識別データ と韻律情報を求め,各識別データごとに各感情ごとの韻 律情報をまとめておくことが必要である.以下に感情認 識のアルゴリズムを示す.
2ペットロボットを用いた感情認識シ
ステム
ペットロボット(図1)を導入し,音声からの感情判 別に触覚入力を組み合わせることで,不特定話者の感情 判別の認識率向上を図るものである.
先ず,撫で方の既知/未知の判別を説明し,感情認識の
アルゴリズムを示す.
対象とするペットロボットは,ぬいぐるみ型で毛皮の 下に合計10個の圧力型触覚センサが装備されている.
2.1撫で方の既知/未知の判別
本論文では,撫で方のパターンごとに音声の韻律情報 を割り当て,同じ撫で方であれば同一人物と仮定し,個 別に学習させることにより,不特定話者の感`情認識率の 向上を図る.以下に撫で方の既知/未知の判別アルゴリ
ズムを示す.
アルゴリズム1
【入力】1回撫でる.
アルゴリズム2
【入力】時系列的に撫で方のパターンと音声データを 入力する.
【出力】入力された「撫で方」の識別データが,登録し てあるどの識別データと同じかを判定する.出力値 は,登録中の識別データのNo.である.また,同じ ものがなければ,0(該当するものなし)を出力す る.ただし,1回の撫で方から複数の識別データが 生成される場合がある.
【出力】音声データごとに判定した感情を出力する.
【操作】
(1)アルゴリズム1を用いて,入力された撫で方の パターンから識別データを生成し,各識別デー タごとに登録中の同じ識別データのNo.を求め る.また,登録中の識別データに同じものがな いものにはOを与える~
(2)入力された音声データの韻律,情報を求める.
(3)各識別データと音声データを対応付ける.以下 は各識別データに対して行う.
【操作】
(1)入力された「撫で方」から識別データを生成 する.
(2)生成された全ての識別データに対し,以下の操 作を繰り返す.
(3)登録中の識別データから同じものを探す.見つ かれば登録中の識別データのNo.を出力する.
(4)対応付けられた識別データDDjと音声データ
VDfから,登録中の同じ識別データに付加され ている4つの感情の韻律情報のデータベースを 引き出す.ただし,識別データのNo.が0(登録 中の識別データに同じものがない)であれば,
従来手法の操作で感'情判別を行ってから,(6)
へ飛ぶ.
(5)音声データVDiの韻律`情報の特徴量と,(4)
の操作で引き出した4つの感情の韻律情報の特 徴量とのマハラノビス距離を求め,最も近い感 情を識別データDDjに対する判別結果とする.
ただし,(4)の操作で引き出した4つのデータ ベースの中に,韻律情報の件数がβ以下のもの があれば,従来手法の操作で感`情判別を行う.
(6)音声データVDfと対応付けられた他の識別デー タで,まだ感`情の判別結果が出ていないものが あれば,(4)へ戻る.音声データVDjと対応 付けられた全ての識別データに対し,感情の判 別結果が出たのであれば,(7)へ進む.
(7)音声データVDjと対応付けられた全ての識別 データに対し,出された判別結果の多数決を取 り,最も多かった感情を音声データVDjの判 別結果として出力する.但し,同点が複数ある
ときには乱数を使用して判別結果を決める.
(8)感`情の判別結果が出ていない音声データがあれ ば,(4)へ戻る.なければ終了する.
尚,(1)~(3)の操作は,撫で方のパターンや音 声データが入力される都度,常時実行されるものと
する.
3実験
提案手法の有効性を従来手法と比較実験することによ り示す.また,複数の音声データから感'情判別する実験 を試みる。
従来手法の実験結果を表1に示す.また,提案手法の 実験結果を表2に示す.両者を比べると,全ての正解率 において提案手法の方が勝っており,全体平均では従来 手法が65.5%に対し提案手法では86.8%であり,有効性 が十分示せたことになる.実験結果を表3に示す.偶数 回,つまり偶数個の音声データで感`情判定を行った場合 の正解率が若干落ちているところがあるが,これは音声 データ数が偶数のため,同点になる場合があるからであ るご音声データ数が1つ,3つ,5つ,7つで判定すれば,
全体平均で,86.8%,93.2%,96.0%,97.8%の正解率が得 られ,一層の改善がなされる.
4まとめ
表1:従来手法を用いたときの感情判別の正解率
被験者平静富℃怒りしみ平均 本論文では,不特定の話者に対する感`情認識に注目し,
ペットロボットに内蔵した圧力型触覚センサにより得ら れる撫で方のパターンを用いて,発話者の感情判定の正 解率を向上させる方法を提案した.また,実験により有 効性を明らかにした.実験1の結果の表1と表2から,
不特定話者の感情認証に対し,正解率が向上したことが わかる.特に,従来手法で極端に低かった感情の正解率 は,他の感情とほとんど変わらない正解率となった.
さらに,複数の音声データから感情判別を行う場合に ついても試し,有効性を示した.
A(演劇女性)88397804433J785 B)850967011744868 C子子)875522922600730
,子子)63J633233789572 回子子)950300200322443 F子子)492367511767534 7816286205046局5
表2:提案手法を用いたときの感情判別の正解率
A(演劇女性)958989967744915 B)9751000911900g47 C子子 975789889878883
,(子学生)942800756889847 回(子学)950644622811757 F子子 958856856767859 9608468338J1868
目杢けび)壱 ,
鶴浮二章再=各1二F=』葬竺:辿=:雪具竺I 蕊=芒平静 96.0 92.1 99.6 99.5 100.0 100.0 100.0
喜び 84 6 73 0 90 8 go 1 93.8 95.2 96.7 怒り 83 4 70 6 90 5 90 4 94.1 94.7 96.6 悲しみ一口一 83 2 69 4 92 0 91 0 96.0 96.1 98.0 z均 86 8 76 3 93 2 92 8 96.0 96.5 97.8
学位論文審査結果の要旨
平成17年1月25曰に第1回学位論文審査委員会を開催、1月27曰に口頭発表その後に第2回審査委 員会を開催し、慎重審議の結果以下の通り判定し○なお、口頭発表における質疑を最終試験に代えるものと
した。
本論文は、ペットロボットを導入し、ペットロボットを撫でながら音声入力をしてもらうことにより、不 特定話者の感情認識を行うシステムを提案した。これまで、特定話者の感情認識であれば、音声入力から韻 律情報と音韻情報を求め、マハラノピス距離を用いることにより実用的な信頼度で認識ができたが、不特定 多数の被験者の感情認識を行うことはできなかった。提案手法は、撫で方の近似しているものを同じパター ンとして認識させるために、撫で方のパターンに量子化と標準化を施し、同一人物の撫で方のパターン内、
頻度の高いパターンが他人の頻度に出てくるパターンと一致することが殆どないという特性を用いて、頻度 の高い撫で方のパターンから被験者を分類し、各パターンごとに各感情の韻律情報のデータベースを付加し て、マハラノビス距離を求めて感情認識するものである。これにより、不特定話者の感情認識が30%以上 向上したことを実験により示した。
以上の研究成果は、感情認識の研究に大きく貢献するものであり、本論文は博士(工学)に値するものと
判定した。