• 検索結果がありません。

データ前処理

ドキュメント内 JAIST Repository https://dspace.jaist.ac.jp/ (ページ 65-69)

第 5 章第4章

4.6 データ前処理

4.6 発表者の様子

4.7 処理前の音声データ

4.8 処理後の音声データ

4.2 得られた発表の詳細

テストケース 内容 参加者数 総チャット発言数 全体時間

ケース1 進捗 9人 73 50:44 (3044sec)

ケース2 進捗 9人 37 27:08 (1628sec)

ケース3 進捗 5人 45 23:21 (1401sec)

ケース4 進捗 5人 55 40:07 (2407sec)

ケース5 進捗 7人 137 35:43 (2143sec)

4.6.1 関連づけデータ収集実験

データの収集で得られた5つのテストケースのうち,3つのテストケースについてデー タの関連付けを行う.チャット発言と口頭発言との関連性に限定して,評価者が関連性

があると判断したチャット発言と口頭発言を全てリストアップしてもらう方法を用いる.

データ関連付けは,各テストケースについて最低で3人以上の評価者によって行う.

データ関連付けは,チャット発言と口頭発言とに関して,意味的・内容的に関係を認め られるものをリストアップすることによって行う.チャット発言・口頭発言ともに,いつ 発言されたかという情報は関係性の理解に必要不可欠な情報である.本章が対象としてい るチャット発言と口頭発言の間の関連性について検証する場合,まず第一に,口頭発言同 士だけではなくチャット発言も含めて時間的に同期して状態を再現できるアプリケーショ ンが必要である.第二に,口頭発言に関していつ誰が喋った発言であるかをより直感的に 入力するために,発話状態を視覚的に表示する必要がある.

これらの必要条件を満たすために,Voice-Text Association Tool(図4.9)を作成した.

Voice-Text Association Toolは,チャット発言と口頭発言の時間的同期を保った状態で,

ゼミの記録を再現するアプリケーションである.Voice-Text Association Toolは,誰がい つ喋っているかを示すための音声トラック(図4.9の⃝3)を備えている.音声トラックは,

1行が1人の発話状態を表している.発話状態は単純発話リージョンを元にして算出さ れ,発話リージョンが存在する領域は黒く,発話リージョンが存在しない領域は白く表示 される.また,発話リージョンが存在しない領域をクリックしても関連付け対象として選 択できないようになっている.

Voice-Text Association Toolの関連付け作業は,すべてマウスで行う.主な手順と注意

事項は,以下の通りである.

1. 再生開始ボタン(図4.9の⃝1)をクリックし,再生を開始する.

2. 関係を認められるチャット発言と口頭発言を見つけたら,該当するチャット発言を クリックし(図4.9 の⃝2),該当する音声領域をクリックする(図4.9 の⃝3).該当 する音声領域は,発言者については必ず正確に入力してもらい,誰が喋っているの か分からない場合は,実験者に質問して解決するように依頼した.

3. スピードが速すぎて関連付けができない場合は停止ボタン(■)をクリックするこ

4.9 Voice-Text Association Tool

とによって,音声を自由に停止することができる.

4. 音声を停止した後は,音声トラックのスクロール・バーを使って自由な位置から再 生を行うことができる.チャット発言のスクロール・バーを操作しても,再生位置 を変えることはできない.また,早送りして音声を聞きとばすことは禁止した.

5. 関連付けが認められるチャット発言と口頭発言が選択できたら関連付けボタンをク リックして,リスト(図4.9の⃝4)に追加する.

以上の動作を繰り返し,音声をすべて再生し終わったら関連付け作業が終了する.

Voice-Text Association Toolには,誤って関連付けを消してしまわないように,一度関連

付けリストに登録した関連付けを削除する機能は搭載されていない.もし,誤って間違っ た関連付けを登録してしまった場合は,実験者にどこが間違ったデータであるかを報告し てもらった.

以上のデータ関連付け作業を評価者8人に依頼した.評価者は,いずれも知識科学研究 科の学生であり,関連付け対象である西本研究室のゼミには参加していない.これは,ゼ

ミに参加した人が関連付けの評価を行うと,チャット発言と口頭発言以外の情報や,発言 意図に基づいた関連付けが行われてしまうためであり,あくまでもチャット発言の発言発 信者としての立場ではなく,チャット発言の受け手として関連付けを行ってもらいたかっ たからである.1人あたりの作業時間は,およそ1時間から1時間30分で終了した.

関連付けの結果,以下の表4.3の通りの関連付けデータが得られた.この時点では関連 付け,特定のチャット発言と,特定の口頭発言者の特定口頭発言時刻に対して行われてお り,発話リージョンに基づく範囲の認識をしていない.

4.3 データ関連付けの結果詳細(発言リージョン化前)

テストケース 評価者数 関連付け数(重複含む)

ケース1 3人 42関連 ケース2 3人 61関連 ケース3 3人 59関連 ケース4 4人 72関連 ケース5 3人 25関連

ドキュメント内 JAIST Repository https://dspace.jaist.ac.jp/ (ページ 65-69)