議論 - 章第4章 - JAIST Repository https://dspace.jaist.ac.jp/

第 5 章第4章

5.6 議論

Chatplexerシステムから得られたデータを見ると，チャット発言が重要かどうかの判定

には発表者がどのような知識を持っているのかという情報が必要であり，人間の読解力をもってしても，容易には重要発言を予想できないであろう．つまり，文章の意味を理解することによって重要発言を推定しようとすると，発表者本人と思考を一体化することが必要になるだろうと考えられ，これは，人間にとっても，自然言語処理の技術的課題としても，非常に難度の高い課題であると言える．しかし，プレゼン発表型チャット併用会議において，クロスチャンネル返信と返信木の構造を利用することで，人間による選択情報を教師データとして機械学習させることで重要発言を推定することができた．文章から意味を計算しそれを元に重要度を推定する手法をミクロ的アプローチと呼ぶなら，本手法は，

文同士の返信関係と重要度を直接紐付けて学習させそれを元に重要度を推定する，マクロ的なアプローチであると言える．

J4.8ではクロスチャンネル返信木であるかどうかという，たった1つのパラメータを取り除いただけで，適合率が61.5%から28.6% へと半分以下になってしまった．さらに，

対スライド発言だけをクロスチャンネル返信と見なす場合では性能は向上しなかった．ここからクロスチャンネル返信木であるかどうか，とりわけ対口頭対話返信を扱うことが，

推定性能に大きな影響を与えることが分かる．データとしてクロスチャンネル返信という情報が非常に重要なのである．

本研究では再現率と適合率のバランスについて，適合率が高くなるように学習パラメーターの設定を行った．意見・質疑時間では時間的制約が重要な要素であり，限られた時間で優れた意見を得られるべきである．従って，システムが重要でない発言を重要であると

判定する（false-positive）状態を可能な限り排除すべきであり，再現率が低くても適合率が高い状態が望ましいと考えられるからである．

そのため再現率はクロスチャンネル返信木かどうかの情報を用いた場合でもかなり低い結果となった．使用しているデータでは，発表1件あたり平均して124.8発言のチャット発言があり重要発言占有率が9.9%であることから，チャット・ログには平均して12.4発言の真の重要発言が含まれていると推測される．クロスチャンネル返信木であるかどうかのパラメータを用いた場合は，再現率が12.9%，適合率が61.5%であるので，2.6発言の重要発言を推定し，うち1.6発言が真の重要発言である．

しかし，あまりに再現率が低ければそもそもチャットから1 つも発言が推薦されないということであり，システムの存在意義がない．本来であれば，具体的に「何個」という形で発言の数を仮定する，例えば「10分の意見質疑で5個の発言があればよい」と設定することは適切ではない．妥当性を検討する参考としてあえて筆者らの経験を述べるとすれば，学会発表における質疑応答時間は5分から10分程度であり，質疑の数も5・6個程度である．チャット併用会議では質疑応答は口頭とチャットの両方から行われるため，

チャットから2.6発言重要発言を推定しうち1.6発言が重要発言であったとしても実用に耐えると考えられ，実用的な精度に達していると言える．

また，重要な発言を推定する事自体は，質疑応答の際だけではなく別のタイミングで使うことも考えられる．例えば，発表後に自身の研究に対して得られた意見を反映する場合などである．こうした場合では時間的制約がないため，false-positiveをある程度許容し，

見過ごしなどにより重要発言を取りこぼしてしまうことを回避する方が適切であると考えられる．こうした応用にも対応するため，再現率を高める手法について検討する必要もあるだろう．

第 6 章

議論

本章では，これまで行った研究から得られた知見を元に，チャット併用会議への応用と評価を議論する．

第3章ではチャットとプレゼンテーションとの関連性を調査した．暦本らの研究で述べられているとおり，通常チャット併用会議はより広い視点からの意見を得るために行われているが，進捗報告におけるプレゼンテーションとの関連性を見る限りは，むしろ名詞が減る傾向が見られている．ここから，チャット併用会議におけるチャット・メディアは，

議論の成果物である進捗報告に影響を及ぼしていることが言える．また，進捗報告において減少傾向の傾きがある程度共通であれば，プロジェクトが発散傾向にあるのか収束に向かっているのかを客観的に把握するなどの応用が可能ではないかという予備的な知見も得られた．

第4章では，チャット発言と口頭発言の関連性を時間的パラメーターから求めることに挑戦した．これはMcCarthyらの予測するバックチャンネルとしての性質の一部であり，

機械学習においてもある程度推測できることが分かった．しかし，結果は十分ではなかった．これは，チャットのマルチスレッド化で説明できる可能性がある．

チャット上では複数の話題が同時に進行することがあり，これは話題のマルチスレッド進行と呼ばれている．チャット上では，まず口頭発言に対する返信としてチャット発言が

投稿され，更にそのチャット発言に対する返信として別のチャット発言が投稿されるなどの複雑な返信構造が，マルチスレッドで進んでいることになる．マルチスレッド状態のチャットでは，時間という観点だけではなく，スレッドという観点も含めなければならない．しかし，チャット併用会議では常に口頭発言が1つのスレッドを構成しており，

チャット・メディア側ではクロスチャンネル返信を起点としたスレッドが多数生成されることが第5章のクロスチャンネル返信の比率からわかっている．第4章では，どの発言がクロスチャンネル返信であるかわからずスレッドの自動判定ができなかったことから，精度が下がってしまったと考えられる．

第5章では，クロスチャンネル返信という概念を提案し，返信関係を直接入力させた．

基本的にチャット発言では返信関係が明示されていなければ，「場の雰囲気」のような不明確な情報に依存して返信関係を推定せざるを得ない．クロスチャンネル返信は，そのような不確定な情報を排除し，正確な分析を可能とさせる．

正確な分析ができることによる応用技術として，発表者にとって重要な発言を推定させる実験を行った．その結果，クロスチャンネル返信という情報の有無によって大きく精度が変わることが分かった．また，クロスチャンネル返信の使われ方や重要発言の例を観察すると，重要発言の判定は非常に難度の高い作業であり，人間でも容易に判断することはできないことが分かった．これは，第4章で第三者による関連性の推定がうまくいかなかったことと合致する．

クロスチャンネル返信の情報を用いることで適合率の高い推定を行うことができたことから，多数の発言の中から確度の高い情報を抽出するという推定については，対口頭対話返信や対スライド返信は非常に正確かつ強力な判断材料となりうることが分かった．既存研究では「質問」「意見」などの発言種別を発言にタグとして設定することができるシステムも提案されているが，発言種別だけではチャット発言に対する質問なのか，口頭発言に対する質問なのかが分からない．こうしたシステムにもクロスチャンネル情報を格納するように改良すれば，さらなる応用が可能になると考えられる．リアルタイムに発表者に

対してフィードバックを行うシステムは，多くの発表者から求められていると考えられ，

将来的にはフィードバックの提示方法も含めて研究する必要があるだろう．

ドキュメント内 JAIST Repository https://dspace.jaist.ac.jp/ (ページ 109-113)