Open-Domain Question Answering

2011 年 QA Challenge ! (2) IBM Watson

・ IBM Deep Question Answering

Project( ジョパディで，ワトソンが

チャンピオンに挑戦して勝利）

IBM Watson システム構成

★大規模知識の獲得（100万冊，2億ページ）

百科事典、辞書、シソーラス、ニュース記事、著作物などを情報源。自動的にコーパスを拡大。

★徹底した質問文解析：LAT(Lexical Answer Type) と重要語抽出

★突出した一つのAI技術ではなく，言語理解，情報検索，不確実性推論，仮説生成，仮説統合とランキング、機械学習，知識表現(オントロジー），

構造化データなど，100以上の従来AI技術（20年前の技術もある）の集大成

★精度、確信度、速度を考慮したAIインテグレーション

★計算力：並列計算による計算パワー

★展開性：医療、金融、行政、マーケティングにも適用可能

IBM Watson 進展

Watson の質問応答

ワトソン×ペッパー

NII 東大ロボットプロジェクト 2021 年東大入試合格を目指して

http://21robot.org/

東ロボくんの各教科アプローチ

• 国語：含意関係認識。評論の問題で、設問に合致する選択肢を選ぶ問題がよく出題されるが、設問文で指定された本文から、選択肢を選ぶ根拠となる部分を抽出し、その根拠部分と選択肢を比較照合し、最もよく「含意する」選択肢を選ぶ手法を開発したところ、50％程度の精度を達成できた。（名古屋大学佐藤研究室）

• 世界史・日本史：情報検索と新しい含意関係認識の統合。Wikipediaや教科書にあるテキストt1を事実と仮定し、問題文にあるテキストt2が事実であるか否かを判断する含意関係認識問題について、文の意味を集合間関係の代数式で表現し、

その集合間関係を論理演算や機械学習で認識する手法を開発中。

• 英語：発音や文法などの短文問題は70%程度、読解や会話文の長文問題は30%

程度の正答率。長文問題に対して、粒度の異なる語句の類似度判定、事実性の判定、述語項構造解析と照応解析（主語特定とイベント参照）、映画スクリプトから対話自然性判定解析、ConceptNet5を利用した常識推論などの課題に取り組んでいる（NTT-CS研等との共同研究）。

• 数学：自然言語解析と論理と数式処理の統合を目指しており、日本語で記述された問題文と同等のZF （Zermelo-Fraenkel）表現を一階述語論理式に変換し、限量子消去 (quantifier elimination: QE)などを含む数式処理を適用して問題を解く。

QE は、二次関数、不等式・領域の問題、平面図形の問題など、多くの入試問題を解くことができる．ただ数学でも、問題文を読んで式を立てる過程が課題である

200 86.0 80.0 48.4

50 24.6 16.0 40.5

200 105.4 90.0 45.1

100 45.5 75.0（40） 64.0（46.9）

100 42.8 77.0（55） 65.8（51.9）

100 45.9 76.0（52） 66.5（56.1）

100 46.6 55.0（44） 54.8（48.2）

物理 100 49.4 42.0（31） 46.5（49.0）

950 416.4 511.0 57.8

受験番号氏名

科目満点 ^全国_平均点 ^本人得点_（昨年） ^{本人偏差値}_（昨年）

英語（筆記）

英語（リスニング）

国語数学ＩＡ

数学ⅡＢ世界史Ｂ日本史Ｂ

５教科合計

東ロボくん進研模試総合学力マーク模試成績 (2015.11)

大学・学部・学科合格可能性80％以上の大学・学部・学科国公立大 170大学 570学部 2,139学科 33大学 39学部 64学科

私立大 580大学 1,723学部 4,305学科 441大学 1,055学部 2,406学科

合計 750大学 2,293学部 6,444学科 474大学 1,094学部 2,470学科 61

2016 年度マーク模試

「関関同立」「 MARCH 」は合格レベル

ドキュメント内平成１７年度大学院知識システム特論 (ページ 54-63)