• 検索結果がありません。

対話によって曖昧性解消を行う 質問応答

N/A
N/A
Protected

Academic year: 2021

シェア "対話によって曖昧性解消を行う 質問応答"

Copied!
35
0
0

読み込み中.... (全文を見る)

全文

(1)

対話によって曖昧性解消を行う 質問応答

○中野 佑哉

1, 2

,河野 誠也

1

,吉野 幸一郎

1, 2

,中村 哲

1, 2

1 奈良先端科学技術大学院大学

2 理化学研究所 革新知能統合研究センター AIP

(2)

| 研究背景・目的

| 関連研究

| 提案手法

| 実験

| まとめ

| 研究背景・目的

(3)

基本的な質問応答タスク

質問に対し適切な答えを見つけて提示するタスク

➢パッセージ中から答えとして適切な箇所を抜き出す

パッセージ 質問文

Q.

答え

(4)

既存の質問応答データセット

➢ Wikipediaなど大規模データベースを基に構築

➢ 昨今、様々なベンチマークが公開されている

e.g.) SQuAD, HotpotQA, etc

(5)

質問応答システムの課題

ユーザ発話の曖昧性

ユーザ A

ユーザ B

(6)

本研究の目的

対話によって質問文の曖昧性を解消する手法・システムの 構築を目指す

ユーザA システム

(7)

本論文の目標

曖昧な質問文とその回答ペアを含むデータセットの作成 問い返しによる追加情報が必要な質問文

ユーザA システム

(8)

| 研究背景・目的

| 関連研究

| 提案手法

| 実験

| まとめ

(9)

改定質問

問い返し可能な質問応答:読解と質問生成の同時学習 モデル [大塚, et al., 2020]

質問内容を一意に定めるような改定質問をユーザに提示

→追加情報を得るための質問は行えない

パッセージ

入力質問

改定質問1

改定質問2

(10)

Ambig QA

[Sewon, et al., 2020]

Multiple Answer Prediction

曖昧な質問文から考えられうる解答を全て出力

Question Disambiguation

曖昧な質問文と複数の解答から各解答が一意に定まるような質問文 を生成

クラウドワーカーにより大規模データセット作成

→データセット作成とその品質保証にコストがかかる

曖昧な入力質問 パッセージ

(11)

格フレームを用いた問い返し

格フレームを用いた質問生成によって深掘りを行う対話シス テム [古川, et al., 2018]

➢ 格フレームを用いて質問を生成する対話システムを提案

➢ 幅広いドメインに対して質問生成が可能

→質問応答を対象としていない

入力文 出力質問文

(12)

関連研究における課題

データセット作成

➢ 既存の大規模データセットから変換 タスク設定

➢ 幅広いユーザ発話を想定

➢ 質問文に対して格フレームや構文解析に基づく問い返し

➢ 既存のデータセットを用いた際の解答精度達成を目指す

(13)

| 研究背景・目的

| 関連研究

| 提案手法

| 実験

| まとめ

(14)

質問文の曖昧性解消に向けて

曖昧な質問文を含むデータセットの作成

• 既存の質問応答データセットを変換

• 低コストで大規模なデータセットを構築

問い返しによって曖昧性解消を試みるタスク設定

(15)

目標とする曖昧な質問文

• 質問応答システムによる回答が困難

• 問い返しの鍵となる情報を最低限含む e.g.)

Q.

What is the place where Mike has ever been?

OK NG

Q.

What?

(16)

既存の質問応答データセット変換

質問文から解答に必要となる重要な部分を欠落させる

1. 質問文中の欠落させたい部分 (クエリ)を生成

2. クエリを基に質問文を変換

(17)

処理の流れ

パッセージ 質問文

クエリ候補

曖昧な質問文

(18)

文書検索を必要とする質問応答

回答に必要となるパッセージを見つけるタスクを含む

Wikipedia

--- --- ---

質問文 クエリによる検索

パッセージ

(19)

1. クエリ生成

➢質問文とパッセージとの部分最長一致などからパッセージ検索用 クエリを作成する手法

e.g.)

パッセージ 質問文

クエリ

(20)

クエリ生成手法の利点

質問の解答に必要な情報となり得る箇所に相当

欠落させることで質問文に曖昧性を付与可能

e.g.)

How many albums did Mike release in 1995?

↓欠落

(21)

クエリ欠落の問題点

質問文中に占める割合が高いクエリを削除した場合

➢問い返しが困難になることが予想される

➢文として成り立たない可能性

e.g.) What language does Mike speak?

↓ What?

→解決案:質問文変換

• クエリの一部を欠落させる

(22)

2. クエリを基にした質問文変換

固有表現抽出を用いた変換処理

(23)

各エンティティに対する処理

“PERSON”

“LOCATION”

“CITY”

“COUNTRY”

“NATIONALITY”

“ORDINAL”

特定単語へ置き換え

{the person, the place…}

質問文中から欠落

(24)

エンティティが含まれない場合

構文解析結果に対するルールによる処理を適用

➢質問文中のクエリを含む節を削除

e.g.)

Q.

欠落

Q.

(25)

| 研究背景・目的

| 関連研究

| 提案手法

| 実験

| まとめ

(26)

データセット

➢ 多段推論を要する質問応答タスク

➢ 回答には複数パッセージを参照する必要がある

➢ 回答に必要な文書検索タスクも含まれる

(27)

質問応答モデル

➢ をベースと

した汎用的な言語モデル

➢ 追加データを用いたファインチューニングによって様々なタスク へ応用可能

➢ 質問応答を含む様々なタスクにおいて最高性能を達成

(28)

実験設定

既存のデータセットを用いて質問応答モデルを学習

変換前・後それぞれのデータセットに対して回答精度を評価

(29)

実験結果

:オリジナル質問文と回答、約7400ペア

:曖昧な質問文へ変換したもの

質問文の変換によりモデルの回答性能が低下 (F1 70.15 -> 61.64)

:正解一致率 :予測解答に対する調和平均

(30)

各エンティティに対する分析

300400 500600

Answered -> Failed

1000 1500 2000

Failed -> Failed

1000 1500 2000

Answered -> Answered

Answered -> Failed

NATIONALITY 15

PERSON 182

LOCATION 26

CITY 19

COUNTRY 10

ORDINAL 16

OTHERS 479

Failed -> Failed

NATIONALITY 191

PERSON 1785

LOCATION 195

CITY 161

COUNTRY 161

ORDINAL 125

OTHERS 1266

Answered -> Answered NATIONALITY 279

PERSON 1728

LOCATION 224

CITY 163

COUNTRY 118

ORDINAL 181

OTHERS 901

曖昧性が付与できた例 変換前から回答が困難な例 曖昧性が付与できなかった例

(31)

曖昧性が付与できた質問文の考察

エンティティが含まれなかった場合の例

エンティティ置き換えの影響はごく一部

0

100 200 300 400 500 600

Answered -> Failed

NATIONALITY 15

PERSON 182

LOCATION 26

CITY 19

COUNTRY 10

ORDINAL 16

OTHERS 479

• What is the inhabitant of the city where?

• What was recorded by Modular Recordings?

• How long is?

• What was?

• With whom did?

(32)

曖昧性付与の問題点

質問文の長さ・難易度制御

➢情報の過剰な欠落

e.g.) “What is he …?” → “?”

➢スパンの長いクエリの処理

曖昧性が付与できた割合:約18% (700/3904)

➢HotpotQA の問題がそもそも難しい

➢エンティティの単純な置き換えによる影響はごく一部

Original Ambiguous

(33)

| 研究背景・目的

| 関連研究

| 提案手法

| 実験設定

| まとめ

(34)

まとめ

• 対話を用いた曖昧な質問応答の実現を目指す

• 格フレームや構文解析を用いた問い返しを行うタスク設定

• 既存の質問応答データセットから曖昧な質問文を含むデー タセットを構築

• 構築したデータセットを用いた際、既存の質問応答モデル

(35)

今後の課題

各エンティティごとのさらなる分析

➢ 曖昧性付与に関わるパターンの追求 質問文の難易度調整

➢ 長いスパンのクエリの取り扱い

➢ エンティティの置き換え見直し

問い返し可能なシステムの実装・評価

参照

関連したドキュメント

(質問者 1) 同じく視覚の問題ですけど我々は脳の約 3 分の 1

災害に対する自宅での備えでは、4割弱の方が特に備えをしていないと回答していま

名の下に、アプリオリとアポステリオリの対を分析性と綜合性の対に解消しようとする論理実証主義の  

(4) 現地参加者からの質問は、従来通り講演会場内設置のマイクを使用した音声による質問となり ます。WEB 参加者からの質問は、Zoom

手話の世界 手話のイメージ、必要性などを始めに学生に質問した。

分類 質問 回答 全般..

では,訪問看護認定看護師が在宅ケアの推進・質の高い看護の実践に対して,どのような活動

質問内容 回答内容.