PDFファイル 4B1 「コミュニケーション支援」

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

ン

け

議論状態

変

検出

Detecting Discussion State Shifts in Group Discussions

瓶

芙巳雄

*1

林

佑樹

*1

中

有紀子

*1

Fumio NIHEI Yuki HAYASHI Yukiko NAKANO

*1

成蹊大学理

学部

Faculty of Science and Technology, Seikei University

In recent years, group discussion is used in job interview process to assess the candidates’ social abilities such as communication skill, leadership. However, the measurement of such abilities solely relies on interviewer’s subjective judgments. Aiming at approaching this problem from multimodal corpus analysis, this study, first, collected conversation corpus for group discussion by four people. The collected data include speech, head motions, face images, eye gaze, bone data, and personality traits. Focusing on speech audio and head motions, we analyzed discussion state changes, and defined three kinds of discussion states: ordered, unordered, and discontinuity. By applying SVM, we created a discussion state recognition model, and found that the model performed very well for ordered and discontinuity states (F-measure were 0.85 and 0.76 respectively), but not very well for unordered state (F-measure 0.47).

1. じめに

採用選考，被面接者一人場や複数場，

多様面接行わ．最近，マをえ数人被

面接者ンを，様子評価を

決定頻繁行わい．，評価面接者

異場あ，ンけ

被面接者行動対，客観的評価をえ，被

面接者対，く評価支援を行う，

基くン析必要

あ考え．

，ンを議論，互い

意見や提案を述あう，意思決定け意確を，

議論停滞い，い様々状態あ，議論支援

やを行うを実現，議

論状態変を検知，議論状態応支援を行う必要

あ．

以課題組，本研究，(1) 採用選考

けンを対象，多様非言語行動

を含ン対話を構築．

(2) ，収集対話を析，

ンけ議論状態変を検知を構築．本

研究音声非言語情報あ韻情報，発話有

無音圧，加え加速ン頭部置変着

目，機械学習を用いを作成．，

を収集対話適用，議論活発行

わい，停滞いを自動的

を検証．

2.

3. 対話データ

収集

3.1 対話収集実験

実施

ン対話を構築，対

話収集実験を行．4 被験者構成，

採用面接けン用いう

課題組，各種機材各被験者言語非言語

行動を記録．

連絡先：瓶芙巳雄，成蹊大学理学部，東京都武蔵市

祥寺 3-3-1，[email protected]

(2)

- 2 -

(1) 被験者

被験者男性32 ，女性12 ，計44 大学生あ．

被験者学部や学，学様々あ．4 人被験者を 1

，計 11 を形成．各

，能限就職活動経験者を1 入，男女数

う，知い含いう．

(2) 実験課題

ン課題を選定，，採

用面接けンく扱わ議題を

前調査．結果，ン議題，

自討論型，ン型，型，

型い類わ．今回実

験，ン型議題を 1 ，型

議題を2 ，計3 議題を設定．

ン型課題，代表う，

複数目対優先を議論決課

題あ．本研究，をン，15人

有人をえ，学園祭呼びいをン付け

学園祭有人ンキンいう課題を設定．

型課題，あ問題対，解決策立案

や問題点析を行うあ．本研究，学園祭出

店計学園祭出店計，外国人を日本招い旅行

ン外国人友人計 2 を設定．

(3) 実験環境

実験を行うあ，専用実験環境を用意．実験環境

を 1 示．，環境い実験を実施い様

子を 2 示．実験一辺を450cm 空間あ

，辺端点中点支柱を立，間を黒

ンあい白い壁．各支柱ンキ

OptiTrack用赤外線，全体様子を

録ビを設置．，実験中心

一辺 120cm を配置，をう 4

人被験者を着席．中心各被験者向

けを 4 設置，被験者顔映像を得．

Kinect ン被験者近いほう深情報や骨格情報を

得やいわ． Kinect ンを被験者近け各被験者背支柱を立 Kinect ン

を設置，対面被験者計測を行．

図 1 実験環境

図 2 実験の様子

(4) 手続き

対話収集実験先立，各被験者性格を実施．

性格詳細 3.2(7)節詳述．，各被験者各

種ンを装着い 3 ，各ン必要キ

ンを行．各種ンい詳細 3.2節述

．

図 3 各センサ装着の様子

各被験者述学園祭有人ンキン，学

園祭出店計，外国人友人計課題

い議論う，3会話を収録．課題序

影響を除去，各け課題

ン．各課題制限時間ン型 15 ，

型 20 ．各課題組前，

各自者相談考え時間を 2 設け．制

限時間を示マ，各被験者見出来置 2

個所配置あ，制限時間終了時，を鳴

知．

3.2 実験データ

取得

44 被験者 11 被験者構成，各

対 3 ン実施， 132人言

語非言語を収集．

(1) 音声

被験者マ audio-technica：HYP-190H を

装着い，各被験者発話音声を得．各

マ入力，PC 接続

ン Roland：UA-1000 集積，音声編集ソ DigiOnSound5を用い録音．複数ン

時録音対応ソあ．実験終了，各被験者

音声をwav形式変換保存．一部

損，最終的得音声 128

(3)

- 3 -

(2) 頭部動き量

被験者頭部加速ン ATR-Promotions：

WAA-010 を付け，x，y，z 3 軸け加速，角速を 33msec 計測，各被験者頭部動情報

を得．加速ン出力 Bluetoothを使用送信

，信側キ保存．

(3) ーションキプチデータ

被験者ンキ用マを付け帽

子を装着い，帽子を1 識，

x, y, z 標回転角を計測 4 ．，マを

肩，肘，手首付け服を着い，中指マ

を巻付けう， 4 マ

収集．

図 4 ッドボディ

(4) 顔映像

中心各被験者正面顔撮影角

Logicool：HD Pro Webcam C920t を設置，被験者

顔映像を得．被験者距離約1m あ

，録際被験者顔を録．顔映像

録，使用標準搭載いソ

を使用．

(5) 骨格情報

各被験者背配置 Kinect ン，対面い

被験者骨格情報深情報を得 5参照．

図 5 Kinectの配置

(6) 視線情報

被験者視線追跡用装置あ型

Tobii：Tobii Glasses Eye Tracker を装着い，各被験者

視線情報を得．視線 SD 保存，

実験専用ソ TobiiStudio 処理，

被験者視点ン映像，畳被験者注視

点をavi形式映像保存．

(7) 性格特性

実験開始前， NEO-FFI性格特性評定を実施．

性格，BigFiveScale 基設定 60 目

質問紙形式あ．活気あ所い好

や，抽象的考え方や理論を楽くあい

質問目対，非常う全くうい 5

段階回答う， BigFive 性格特性目あ

経験開放性，勤勉性，外向性，協調性，情緒

安定性 5 目い評定得．

4. 議論状態把握

デル

音声加速ンを用い議論状態を把握

を作成．，各加方法を以述．

4.1 音声情報

収録音声を 0.01 単割，各区間い

，発話有無韻情報を付．発話有無い，

各区間各被験者発話状態を0, 1 表現．具体的，

音声析ソ Praat 算出音圧値一定以

場 1を，音圧値閾値以あ場 0を

え．4人被験者対様処理を行う，0.01

単構成員発話状態を0, 1 ビン

表．0000 誰発話をいい状態 (Ptn0)， 0010や0001 う，1 所け値 1 いン

一人被験者発話い状態 (Ptn1)，0110や0111

う 2 所以 1 あン複数被験者時

発話い状態 (Ptn2)を表．，発話状態変考慮，誰発話いい状態移行 (ShiftToPtn0)，一人被験者発話状態移行(ShiftToPtn1) 含

，計5種類発話状態を定義．

韻情報い，0.01 各区間け音圧をPraat

計測，値を使用．

4.2 加速度情報

加速ン 3 軸け加速，角速を

33msec 出力．本研究加速ン得

加速情報を用い，各被験者頭部人均的

姿勢程変を求，を被験者け頭

部置変，以計算式算出．

け変 √ ̅ ̅ ̅

，任意時点 t け軸加速

を， ̅ ̅ ̅ ンを通軸け加速均

を表．

4.3 議論状態

分析

3 章収集ン様子をビ観察

， 3種類議論状態類考え．

ordered：参加者番発言，マン整

然行わい状態

unordered：複数人時発言を，発話

，マン乱い状態

discontinuity：発言，話途状態

本研究， 3 状態を自動的ば，議論

活発あ停滞いを断有益情報

(4)

- 4 -

，教師を作成，ビ対，記3

種類議論状態を，ビン ELANを用い

ン．，実験実施 3 種類課題

う，提示課題対解決案を話う，

型課題あ学園祭出店計を析対象

．，音声加速一部損い，最

終的 11 中8 を学習用い．

4.4 議論状態把握

デル

学習

4.1, 4.2節準備 0.01 単を1 単集

計頻を作成，を機械学習用い．具体的

，1 区間い，4.1節定義 5種類

発話状態各発生回数，4 参加者音圧計，

び頭部置変計を算出． 7種類特徴

い，1 前，び2 前履歴情報追加，計21

特徴を設定．

要属性を削除，方法

を用い，属性選択を行．結果，Ptn0，Ptn1，Ptn2 頻

，音圧計，一前区間け Ptn1, Ptn2 頻

残，加速情報選択． 6 種類特徴

学習を用い，SVM 機械学習を行．

，4 多式を使用，C

1.0 設定．

評価 leave-one-group-out法を用い．

評価結果を表 1 示．議論途あ discontinuity

ン交代整然，円滑行わい ordered 状態， F-measure 0.755，0.851 高い精得．

対，マン乱い unordered 状態推定 0.467 ．原因再現率あ．本，unordered あ箇所を十精検出

いい言え．

表 1 各クに対する分類の評価結果

Class Precision Recall F-Measure

discontinuity 0.807 0.709 0.755

ordered 0.798 0.911 0.851

unordered 0.742 0.341 0.467

4.5 議論状態把握

デル

考察

4.4 節得議論状態推定を学習利用い

い適用結果を 6 示．，20 間

議論け，discontinuity，ordered，unordered 各状態

推定回数を5 単集計結果を示い．

図 6 議論状態の推定

誰発言，話途状態あ discontinuity

多い，議論停滞い能性高い考え，

議論い半ほ discontinuity 推定回数増加

，時間経過伴い議論停滞いく状況示唆．

実際ビを観察示う傾向見

を確．

5. おわりに

本研究，，ン対話収集実

験を行う，対話を構築． 4

人構成被験者対，

ン課題をえ，課題遂行中各被験者発話音声，頭

部動，ンキ，顔向映像，骨格情

報，視線情報を計測作成，行動

加え，全被験者質問紙性格特性検査を行．

，構築を観察，discontinuity，ordered， unordered 3 議論状態を定義，発話状態ン

頭部置変を学習， 3状態を

をSVM 作成．結果，発話状態ン

を用い得．，作成を新

対話適用，議論状態推定結果，議論活発，

停滞いをを確．

本研究，ビ観察基議論状態を独自定義

，社会学や議論学知見を利用，議論状態定義を

再検討必要あ考え．，提案言語情報

依存い，今回対象議論以外適用

能性あ．今，汎用性い検証いく予

定あ．

参考文献

[堀 2004] 堀公俊 : ン入門，日経文庫 (2004). [Jovanovic 2005] N. Jovanovic, R. op den Akke, and A. Nijholt:

A corpus for studying addressing behavior in multi-party dialogues, In Proc. of The 6th SigDial conference on Discourse and Dialogue (2005).

[Jurafsky 1997] D. Jurafsky, et al.: Automatic Detection of Discourse Structure for Speech Recognition and Understanding, In Proc. of IEEE Workshop on Speech Recognition and Understanding (1997).

[大本 2010] 大本義正, 戸泰 , 植一博, 西豊明: 議論

参加態非言語情報基くン析,

情報処理学会論文 , Vol.52, No.12, pp.1234–1245 (2011). [Pianesi 2007] F. Pianesi, M. Zancanaro, B. Lepri, and A. Cappelletti: A multimodal annotated corpus of consensus decision making meetings, Language Resources and Evaluation, 41:409–429 (2007).

PDFファイル 4B1 「コミュニケーション支援」

- 1 -

ン

け

議論状態

変

検出

Detecting Discussion State Shifts in Group Discussions

瓶

芙巳雄

林

佑樹

中

有紀子

成蹊大学理

学部

1.

じめに

2.

関連研究

3.

対話データ

収集

3.1

対話収集実験

実施

- 2 -

3.2

実験データ

取得

- 3 -

4.

議論状態把握

デル

4.1

音声情報

4.2

加速度情報

4.3

議論状態

分析

- 4 -

4.4

議論状態把握

デル

学習

4.5

議論状態把握

デル

考察

5.

おわりに

参考文献

0

50

100

150

200

250

0~299

300~599

600~899

900~1199