言語モデルに基づく
インタビュー参加者間相互作用の分析
株式会社 インサイト・ファクトリー 小野 滋 日本行動計量学会第47回大会 (2019/09) 特別セッション 「インタビューへの行動科学的アプローチ ~マーケティング・リサーチを中心とした展望~」問題
<インタビューについての実証研究>にたちはだかる難題 インタビューという 社会的行為 インタビュアー要因 • 知識 • コミュニケーション スキル • ... インタビュイー要因 • 知識 • コミュニケーション スキル • ... 状況要因 • モード (対面, 電話, ...) • 人数 • 時間 • ... 知識変容 • インタビュアーの知識変容 • インタビュイーの知識変容 • 一次観察者の知識変容 難題1. 要因が多く複雑 難題2. 客観的記述が困難 難題3. 評価関数が 明確でない 本研究の焦点本研究の目的
インタビューにおける参加者のコミュニケーション方略を、 客観的に記述するための枠組みを提案する {モデレータ・対象者・インタビュー事例}の特性を表す指標を提供する • モデレータAさんは、どのようなモデレータか? • 対象者Pさんは、インタビューにおいてどのように振る舞う人か? • このインタビュー事例において、参加者はどのように振る舞ったか?アプローチ
本研究の特徴
インタビュー中の発話内容にみられる言語的調整に注目し、
1. 言語的調整
インタビューのどの側面に注目するか? A) 誰がいつ話したか B) 誰が誰に対して話したか C) 誰がなにを話したか D) 誰がどのように話したか (パラ言語的情報) • 社会的相互作用研究の主流 ... ターン・テイキング行動に注目する • A ないし A&B に相当 • 本研究 ... 発話内容にみられる 言語的調整 に注目する • C に相当 言語的調整 linguistic accomodation
• ある参加者が、他の参加者が使った語を使って話す傾向をもつこと • i.e. 語の使用における同調的行動
• 幅広いコミュニケーション文脈で観察される (e.g. Doyle, et al. 2016) 言語的調整はなにを反映するか
• 参加者のコミュニケーション方略
• その背後にある権力関係 (Danescu-Niculescu-Mizil, et al. 2012) • 被支配側でより多くの言語的調整が生じる
cf. コミュニケーション調整理論 (Giles & Ogay, 2007; 栗林, 2010)
• 人は他者との相互作用の中でコミュニケーション行動を変化させ、他者との 社会的距離を操作する • 目的:コミュニケーションの効率化, 社会的承認, 自己イメージの獲得... • 主要な方略 • 収束 convergence : 他者の行動に類似させる • 分岐 divergence: 他者の行動からの差異を強調する • 維持 maintenance: 自分の行動スタイルを保つ → 言語的調整は、語の使用における収束方略として捉えられる
2. 言語モデルによる表現
社会的相互作用をどのように表現するか? • 広く用いられている方法 ... ネットワーク・モデルによる表現 • 現象を生成するプロセスのモデル化ではない • 本研究 ... 言語モデルによる表現 言語モデルとは • 発話において語が生成される確率をモデル化する • 近年の自然言語分析における主要なアプローチのひとつ • 例) トピック・モデル 社会的相互作用を伴う言語モデル• Guo, et al. (2015): Bayesian Echo Chamber モデル
• 他者に対する言語的調整を組み込んだ言語モデル • → 本研究で採用
Bayesian Echo Chamber モデル
𝑤𝑙,𝑛(𝑝)~𝐶𝑎𝑡𝑒𝑔𝑜𝑟𝑖𝑐𝑎𝑙 𝝓𝑛𝑝 , 𝜙𝑛(𝑝)~𝐷𝑖𝑟𝑖𝑐ℎ𝑙𝑒𝑡(𝛼 𝑝 𝑩 𝑛𝑝 ) 𝐵𝑣,𝑛(𝑝) ∝ 𝛽𝑣𝑝 + 𝑞≠𝑝 𝜌𝑞𝑝 𝜓 𝑣,𝑛𝑞𝑝 , 𝑣=1 𝑉 𝐵𝑣,𝑛(𝑝)= 1 𝜓𝑣,𝑛(𝑞𝑝) = 𝑚:𝑡𝑚′(𝑞)<𝑡𝑛𝑝 𝑙=1 𝐿(𝑞)𝑚 𝐼(𝑤𝑙,𝑚𝑞 = 𝑣) × exp −𝑡𝑛 (𝑝)− 𝑡 𝑚′(𝑞) 𝜏𝐿(𝑝) 𝑁 𝑃 : 参加者 𝑝 (=1,...,P)の発話数 𝑡𝑛𝑝 : 参加者 𝑝 の発話 𝑛 (= 1, … , 𝑁 𝑃 )の開始時間 𝑡’𝑛𝑝 : 参加者 𝑝 の発話 𝑛の終了時間 𝐿(𝑝)𝑛 : 参加者 𝑝 の発話 𝑛 に含まれている語トークンの数 𝑤𝑙,𝑛(𝑝): 参加者 𝑝 の 𝑛 番目の発話の 𝑙 (= 1, … , 𝐿(𝑝)𝑛 )番目の語トークン 𝑉: すべての参加者のすべての発話を通じて出現する語タイプの数 𝝓𝑛(𝑝): 𝑉次元離散確率ベクトル 𝛼 𝑝 : 正値スカラー。集中度 𝑩𝑛𝑝 : 𝑉次元離散確率ベクトル 𝜷(𝑝): 𝑉次元正値ベクトル。参加者 𝑝 の固有の言語使用を表す 𝜌 𝑞𝑝 : 非負値スカラー。参加者 𝑞 の 𝑝 に対する影響力を表す 𝝍𝑛(𝑞𝑝): 𝑉次元正値ベクトル。参加者 𝑝 の 𝑛番目の発話の前に行われた、参加者 𝑞 のすべての発話からなる履歴を表す 𝜏𝐿(𝑝): 正値スカラー。参加者 𝑝 における時間減衰を表す 語の生成モデル 𝑤𝑙,𝑛(𝑝)~𝐶𝑎𝑡𝑒𝑔𝑜𝑟𝑖𝑐𝑎𝑙(𝝓𝑛(𝑝)) 𝜙𝑛(𝑝)~𝐷𝑖𝑟𝑖𝑐ℎ𝑙𝑒𝑡(𝛼 𝑝 𝑩𝑛𝑝 ) ひらたくいうと... • ある参加者がある発話のある位置で用いる語は、全員に共通の辞書からひとつ 選ばれる • 辞書からある語が選ばれる確率は、次の2つの要因に基づいて確率的に決ま る: • 各語が持つ「ベース確率」。参加者x発話ごとに変わる • ベース確率が高い語を実際に使う傾向。参加者ごとに決まる
ベース確率のモデル 𝐵𝑣,𝑛(𝑝) ∝ 𝛽𝑣𝑝 + 𝑞≠𝑝 𝜌 𝑞𝑝 𝜓𝑣,𝑛(𝑞𝑝) 𝑣=1 𝑉 𝐵𝑣,𝑛(𝑝) = 1 ひらたくいうと... • 各語が持つ「ベース確率」は、次の和で決まる: • その参加者がその語を使う程度。参加者ごとに決まる • [他の参加者 1 の影響力] x [参加者1のその語の擬似使用頻度] • [他の参加者 2 の影響力] x [参加者2のその語の擬似使用頻度] • ...
擬似使用頻度のモデル 𝜓𝑣,𝑛(𝑞𝑝) = 𝑚:𝑡𝑚′(𝑞)<𝑡𝑛𝑝 𝑙=1 𝐿(𝑞)𝑚 𝐼(𝑤𝑙,𝑚𝑞 = 𝑣) × exp −𝑡𝑛 (𝑝) − 𝑡 𝑚′(𝑞) 𝜏𝐿(𝑝) ひらたくいうと... • [参加者Xのその語の擬似使用頻度]は、Xのそれまでの各発話でその語が使われ た回数を、その発話から経過した時間の短さで重み付けして合計した値 参加者𝑞の𝑚番目の発話 で語彙𝑣が使われた回数 参加者𝑞の𝑚番目の発話からの時間経過を表す重み。直後なら1, 時間と共に0に近づく 参加者𝑞のそれまでの全発話について合計する 参加者𝑝の𝑛番目の 発話からみた、参加 者𝑞の語𝑣の擬似使 用頻度
適用例
「12人の怒れる男」 (写真は1957年映画版)
陪審員8番さん。ただ一人被告の無罪を主張し、 粘り強い議論で評決をひっくり返す
「12人の怒れる男」(1952年TVドラマ脚本)から推定した 登場人物の影響力 (Guo, et al., 2015) 他者への影響力(合計) 他者からの影響力(合計) 陪審員8番さんは、 他者への影響力が高い
データ
• Wave Planet インタビュー・コーパス 消費者インタビュー事例の録音・逐語録を蓄積 • フォーカス・グループ・インタビューの事例 4件を抽出 テーマ:家庭内の年中行事 120分。インタビューフローは共通 インタビュアーの経験年数が異なる • 冒頭・末尾(傍聴者からの質問など)を除いた部分を分析 形態素解析により名詞・動詞・形容詞を抽出し、分析対象とする逐語録の例: 事例1の冒頭部分 発話49: 発話者A (インタビュアー) 何となく終わりましたかね。はい、そしたらですね、えっとー、えー、お一人ずつ何やってますって聞いてくと、何か それだけで時間たっちゃいそうなので、ざっくりとでいいかなと思ってるんですけど。んー、あれですね。振り返って みると自分が丸付けしたの、こう、見てみて、えーと、いつからやってるんだっけとか、そういうことを考え直したい なと思っていて。んー、例えばですけど、2~3年前と比べて増えたとか減ったとかそんなことから話してみます? ど うですか、人によっていろいろだと思うんですけど。 発話49: 発話者A (インタビュアー) どうぞ。あっ、自己紹介終わったので、もう、えーと、しゃべれる準備ができた人順ですね。でもどうせみんなしゃべ らされるんで。どうですかね。 発話50: 発話者E はい。増えた行事が、えっとハロウィン、イースターですね。何かこの辺は昔は絶対なかったなっていう気がするんで すけど。最近何でもかんでも便乗してるじゃないですか。いろんなところで。何かとイベントやってません? あの、 ショッピングモールだったりとか。ちらしにもそういうのを載せて相乗効果で買ってくれみたいなのを目にするし、あ とは自分にやっぱり子どもができたっていうのがおっきいんですけど。これは絶対昔やってなかったけど、やるように なったのがここ最近なのかなっていう気がします。 発話51: 発話者A (インタビュアー) ハロウィンとイースター? 発話52: 発話者E うん。 (中略) 発話70: 発話者A (インタビュアー) イースターってどういうやつですかね? 発話71: 発話者C あんまり意味分かってないんですけど、何か100均で可愛い卵買ってきて、それを飾ったりとか、あと何かショッピング モールのイベントで卵に絵を描いたりとか。何かそういうことかなと思って丸付けちゃいました。何か特に何をお祝い するとかよく分かってないです。けど何かのってみました。 語タイプ(語彙)の初回出現 二回目以降の出現
分析
各事例のデータにBayesian Echo Chamberモデルをあてはめた • 使用データ • 使用頻度が高い語タイプ(語彙) 600 個についてモデル化 • 簡便のため、発話開始時間として逐語録上の発話番号を用いた • 末尾10%の発話はホールドアウト標本とし、モデルの評価に使用 • パラメータ推定 • 崩壊型ギブス・サンプリングによるベイズ推定 (Guo, et al., 2015) • 事前分布: 𝜏𝐿(𝑝)~𝐺𝑎𝑚𝑚𝑎 100,1 , 𝜌(𝑞𝑝)~𝐺𝑎𝑚𝑚𝑎 0.1,10 , 𝛼(𝑝)~𝐺𝑎𝑚𝑚𝑎 10,1 , 𝛽𝑣(𝑝)~𝐺𝑎𝑚𝑚𝑎(10,1) • 2500反復, うち500反復をburn-inとする • 以下ではパラメータ推定値として事後分布平均を用いる
結果
インタビュアーから対象者への影響力 対象者か らインタ ビュアー への影響 力結果から、インタビュアーのコミュニケーション方略を推測できる やや支配的? 強く同調的 一部の対象者と集中的に やや同調的 非支配的・非同調的 各対象者と比較的均等に コミュニケーション
インタビュアーの方略は、インタビュアー自身が持つ方法論と対応している 各インタビュアーに対する、グループインタビュー直後の事後インタビューより (大意) インタビュー中にすべての対象者から均等に話を聞こうとしているか? 事例1のインタビュアー:肯定的 それはすごくある。事前に予定していた内容以外のところどころで「もうちょっと聞きたいけど、今み んなに1周聞いているからあとにしよう」とか、「今じゃないけどあとで聞かなくちゃ」というリストは ある 事例2のインタビュアー:肯定的 それは考えた。全般にDさん・Eさんは自分から率先して話さない方だったので、話すタイミングがな かったらアイコンタクトをしようと思っていた。Eさんは前段あまり話に乗って来ていないのかと思った ら、後半になったら割と自分から話してくれていたので、全体の分量としてあまり偏りは感じていない 事例3のインタビュアー:(聴取しなかった) 事例4のインタビュアー:否定的 理想としては、マーケティング施策を計画する際、個々人の生活がわからないと深みは出ない。だから、
考察
言語的調整を組み込んだ言語モデルを用い、グループ・インタビューにおけるコ ミュニケーション方略を客観的に記述する枠組みを提案した
この枠組みは、これからのインタビュー研究 (インタビューについての研究) のた めの有益なアプローチとなると期待される
今後の課題
<実証研究> • より広範なデータへの適用 • インタビュー対象者の言語的調整は、インタビュアーの方略の結果か? • インタビュー参加者のコミュニケーション方略と、インタビュー受益者(e.g. マーケ ター)によるインタビュー評価にはどのような関係があるか? <モデル> • インタビュー進行を通じた、影響力の動的変化のモデル化 • ターン・テイキング行動モデルとの統合• cf. Guo, et al (2015): Bayesian Echo Chamberモデルとターン・テイキング行動モ デルとの統合を試みている
<実務適用>
• インタビュー遂行中の逐次的視覚化
• cf. 藤井 et al .(2016): アイデアソンの音声に基づきアイデア成長過程を視覚化
引用文献
Danescu-Niculescu-Mizil, C., Lee, L., Pang, B., Kleinberg, J. (2012) Echoes of power: Language effects and power differences in social interaction. WWW'12 Proceedings of the 21st International Conference on World Wide Web. 699-708.
Doyle, G., Yurovsky, D., Frank, M.C. (2016) A robust framework for estimating linguistic alignment in Twitter conversations. WWW'16 Proceedings of the 25th International Conference on World Wide Web. 637-648.
Giles, H., Ogay, T. (2007) Communication Accommodation Theory. In Whaley, B.B. & Samter, W. (Eds) Explaining
Communication: Contemporary Theories and Exemplars. 293-310.
Guo, F., Blundell, C., Wallach, H., Heller, K. (2015) The Bayesian Echo Chamber: Modeling social influence via linguistic accommodation. AISTATS 2015, JMLR: W&CP 38.
栗林克匡(2010) 社会心理学におけるコミュニケーション・アコモデーション理論の応用. 北星学園大学社 会福祉学部北星論集 (47), 11-21.
藤井信忠, 貝原俊也, 国領大輔, 藤沢卓馬 (2016) アイデアソンにおける集合知創出支援に関する研究 : 対応 分析によるアイデア創出過程の分析. 信学技報 116(287), 29-32.