• 検索結果がありません。

Open-Domain Question Answering

ドキュメント内 平成17年度大学院 知識システム特論 (ページ 54-63)

2011 年 QA Challenge ! (2) IBM Watson

・ IBM Deep Question Answering

Project( ジョパディで,ワトソンが

チャンピオンに挑戦して勝利)

IBM Watson システム構成

★大規模知識の獲得(100万冊,2億ページ)

百科事典、辞書、シソーラス、ニュース記事、著 作物などを情報源。自動的にコーパスを拡大。

★徹底した質問文解析:LAT(Lexical Answer Type) と重要語抽出

★突出した一つのAI技術ではなく,言語理解,情 報検索,不確実性推論,仮説生成,仮説統合と ランキング、機械学習,知識表現(オントロジー),

構造化データなど,100以上の従来AI技術(20年 前の技術もある)の集大成

★精度、確信度、速度を考慮したAIインテグレー ション

★計算力:並列計算による計算パワー

★展開性: 医療、金融、行政、マーケティングに も適用可能

55

IBM Watson 進展

Watson の質問応答

57

ワトソン×ペッパー

NII 東大ロボットプロジェクト 2021 年東大入試合格を目指して

http://21robot.org/

59

東ロボくんの各教科アプローチ

国語:含意関係認識。評論の問題で、設問に合致する選択肢を選ぶ問題がよく 出題されるが、設問文で指定された本文から、選択肢を選ぶ根拠となる部分を抽 出し、その根拠部分と選択肢を比較照合し、最もよく「含意する」選択肢を選ぶ手 法を開発したところ、50%程度の精度を達成できた。(名古屋大学佐藤研究室)

世界史・日本史:情報検索と新しい含意関係認識の統合。Wikipediaや教科書に あるテキストt1を事実と仮定し、問題文にあるテキストt2が事実であるか否かを判 断する含意関係認識問題について、文の意味を集合間関係の代数式で表現し、

その集合間関係を論理演算や機械学習で認識する手法を開発中。

英語:発音や文法などの短文問題は70%程度、読解や会話文の長文問題は30%

程度の正答率。長文問題に対して、粒度の異なる語句の類似度判定、事実性の 判定、述語項構造解析と照応解析(主語特定とイベント参照)、映画スクリプトか ら対話自然性判定解析、ConceptNet5を利用した常識推論などの課題に取り組 んでいる(NTT-CS研等との共同研究)。

数学:自然言語解析と論理と数式処理の統合を目指しており、日本語で記述され た問題文と同等のZF Zermelo-Fraenkel)表現を一階述語論理式に変換し、限量 子消去 (quantifier elimination: QE)などを含む数式処理を適用して問題を解く。

QE は、二次関数、不等式・領域の問題、平面図形の問題など、多くの入試問題 を解くことができる.ただ数学でも、問題文を読んで式を立てる過程が課題である

200 86.0 80.0 48.4

50 24.6 16.0 40.5

200 105.4 90.0 45.1

100 45.5 75.04064.046.9

100 42.8 77.05565.851.9

100 45.9 76.05266.556.1

100 46.6 55.04454.848.2

物理 100 49.4 42.03146.549.0

950 416.4 511.0 57.8

受験番号 氏名

科目 満点 全国平均点 本人得点(昨年) 本人偏差値(昨年)

英語(筆記)

英語(リスニング)

国語 数学IA

数学ⅡB 世界史B 日本史B

5教科合計

東ロボくん 進研模試 総合学力マーク模試成績 (2015.11)

大学・学部・学科 合格可能性80%以上の大学・学部・学科 国公立大 170大学 570学部 2,139学科 33大学 39学部 64学科

私立大 580大学 1,723学部 4,305学科 441大学 1,055学部 2,406学科

合計 750大学 2,293学部 6,444学科 474大学 1,094学部 2,470学科 61

2016 年度マーク模試

「関関同立」「 MARCH 」は合格レベル

63

ドキュメント内 平成17年度大学院 知識システム特論 (ページ 54-63)

関連したドキュメント