• 検索結果がありません。

Open-Domain Question Answering

ドキュメント内 平成17年度大学院 知識システム特論 (ページ 41-67)

2011 年 QA Challenge ! (2) IBM Watson

・ IBM Deep Question Answering

Project( ジョパディで,ワトソンが

チャンピオンに挑戦して勝利)

IBM Watson システム構成

★大規模知識の獲得(100万冊,2億ページ)

百科事典、辞書、シソーラス、ニュース記事、著 作物などを情報源。自動的にコーパスを拡大。

★徹底した質問文解析:LAT(Lexical Answer Type) と重要語抽出

★突出した一つのAI技術ではなく,言語理解,情 報検索,不確実性推論,仮説生成,仮説統合と ランキング、機械学習,知識表現(オントロジー),

構造化データなど,100以上の従来AI技術(20年 前の技術もある)の集大成

★精度、確信度、速度を考慮したAIインテグレー ション

★計算力:並列計算による計算パワー

★展開性: 医療、金融、行政、マーケティングに も適用可能

42

NII 東大ロボットプロジェクト 2021 年東大入試合格を目指して

http://21robot.org/

43

東ロボくんの各教科アプローチ

• 国語:含意関係認識。評論の問題で、設問に合致する選択肢を選ぶ問題がよく 出題されるが、設問文で指定された本文から、選択肢を選ぶ根拠となる部分を抽 出し、その根拠部分と選択肢を比較照合し、最もよく「含意する」選択肢を選ぶ手 法を開発したところ、50%程度の精度を達成できた。(名古屋大学佐藤研究室)

• 世界史・日本史:情報検索と新しい含意関係認識の統合。Wikipediaや教科書に あるテキストt1を事実と仮定し、問題文にあるテキストt2が事実であるか否かを判 断する含意関係認識問題について、文の意味を集合間関係の代数式で表現し、

その集合間関係を論理演算や機械学習で認識する手法を開発中。

• 英語:発音や文法などの短文問題は70%程度、読解や会話文の長文問題は30%

程度の正答率。長文問題に対して、粒度の異なる語句の類似度判定、事実性の 判定、述語項構造解析と照応解析(主語特定とイベント参照)、映画スクリプトか ら対話自然性判定解析、ConceptNet5を利用した常識推論などの課題に取り組 んでいる(NTT-CS研等との共同研究)。

• 数学:自然言語解析と論理と数式処理の統合を目指しており、日本語で記述され た問題文と同等のZF (Zermelo-Fraenkel)表現を一階述語論理式に変換し、限量 子消去 (quantifier elimination: QE)などを含む数式処理を適用して問題を解く。

QE は、二次関数、不等式・領域の問題、平面図形の問題など、多くの入試問題 を解くことができる.ただ数学でも、問題文を読んで式を立てる過程が課題である

(富士通研究所との共同研究)。

44

200 93.1 95(52) 50.5(41.0)

150 60.2 69(62) 54.2(45.9)

100 45.9 49(42) 51.9(44.7)

100 47.1 40(57) 46.9(51.9)

100 50.4 55(41) 51.9(47.2)

100 40.8 52(58) 56.1(55.2)

100 47.2 44(56) 48.2(56.1)

100 38.1 17(33) 34.3(42.2)

100 32.7 31(39) 49.0(48.3)

900 422.0 386(365) 47.3(45.1)

53.6(47.7) 49.7(46.2)

受験番号 116-5004E 氏名 東ロボクン イチゴウ

科目 満点 全国平均点 本人得点(昨年) 本人偏差値(昨年)

英語

国語(現文+古文)

国語(現代文)

数学I・数学A

数学Ⅱ・数学B 世界史B

日本史B

政治・経済 物理

文系7科目コース 文系3教科偏差値 理系3教科偏差値

東ロボくん 代ゼミ全国センター模試成績 (2014.11)

45

200 86.0 80.0 48.4

50 24.6 16.0 40.5

200 105.4 90.0 45.1

100 45.5 75.0(40) 64.0(46.9)

100 42.8 77.0(55) 65.8(51.9)

100 45.9 76.0(52) 66.5(56.1)

100 46.6 55.0(44) 54.8(48.2)

物理 100 49.4 42.0(31) 46.5(49.0)

950 416.4 511.0 57.8

受験番号 氏名

科目 満点 全国平均点 本人得点(昨年) 本人偏差値(昨年)

英語(筆記)

英語(リスニング)

国語 数学IA

数学ⅡB 世界史B 日本史B

5教科合計

東ロボくん 進研模試 総合学力マーク模試成績 (2015.11)

46

大学・学部・学科 合格可能性80%以上の大学・学部・学科 国公立大 170大学 570学部 2,139学科 33大学 39学部 64学科

私立大 580大学 1,723学部 4,305学科 441大学 1,055学部 2,406学科 合計 750大学 2,293学部 6,444学科 474大学 1,094学部 2,470学科

Web 上で公開され,相互に連結し合っている RDF データ

これまで多く研究されてきた抽象的な概念構造が 現実的な有用性を生むには依然高いハードルがある

具体物であるインスタンスの記述をしたRDF(Linked Open Data)の データベースを公開・共有し合うべきという風潮が高まっている

2007年5月

2008年5月

2011年9月

LOD の普及

RDF モデルによる Linked Open Data ( LOD )

• LOD 規模: 5 億トリプル( 2007 )

⇒ 2011 年 9 月時点で 310 億トリプルに増加

48

メディア

行政

地理

生命科学

出版 DBpedia

Wikipediaから構造化されたデー タを抽出、RDF形式で提供

・データ自体がリンクしている

・情報の公開、共有が容易になる

・第三者によるサービス開発の促進に繋がる 情報流通基盤として期待が集まる

Linked Open Data Initiative

2012年8月に発足

LODを普及促進する活動

日本語LOD Cloudの作成

日本語LOD Cloud

2008年の欧米と同程度の規模

DBpedia Japaneseと相互リンクと なっているのは以下の3つのみ

本家DBpedia

日本語WordNet

日本語Wikipediaオントロジー DBpedia Japaneseが持って いない概念階層関係の補完 として,日本語LODハブの一 つとして期待されている

49

DBpedia Japanese DBpedia

日本語WordNet

日本語Wikipediaオントロジー

①言葉(概念)

分類階層木

②言葉(=固有表現、

具体物)ネットワーク

50

織田 信長

本能 墓所

濃姫

法華 宗本 門流 日本

寺院 建築

日本 農民 武士 の神

宗派

1415 創建年 歴史

上の 身分

天文3512 生誕

豊臣 秀吉

主君

本蓮

宗派 日本

の城

岐阜 建立

1347 創建年

人・もの・

こと分析

分け方

オントロジー

2016/4/8

Wikipediaからオントロジー(言葉階層木,言葉の ネットワーク)に自動変換して,

人工物に言葉の意味(Sense)を理解させる

日本語Wikipediaオントロジー

人間には,ウィキペディアの内容(意味)

が判るけど人工物(コンピュータ,スマ フォ,ロボット...)には判らない

日本語 Wikipedia オントロジー

2016/4/8 51

日本語 Wikipedia オントロジー(文学)

2016/4/8 52

53

さらにズームアップ(模式図)

日本の 小説家 小説家

作家 人物

文学 文化

芥川龍之介

文化活動 家族 日本史

の人物

代表作

職業

職業

プロパティ定義域 クラス-インスタンス関係

Is-a関係・プロパティ上位下位関係 トリプル

プロパティ値域

日本の 大学

日本の 小説 日本

存命人物 蜘蛛の糸 羅生門

小説家

塚本文

芥川也寸志

芥川貴之志

短編小説

日本

東京帝国 大学英文科

日本の映 画作品

作曲家

日本のクラ シック音楽 の作曲家 オペラ

作曲家

夏目漱石 明治の

人物 明治大学

の人物 門下生

津田青楓

坊っちゃん

こゝろ

小説

時代小説・

歴史小説 作家

誕生 最終学歴

配偶者 子供

著作 国籍

親族

ジャンル

死没 東京都出

身の人物 日本出身

の人物

文庫本

クラス

プロパティ

インスタンス

俳人

2016/4/8

日本語 Wikipedia オントロジー

統合人工知能

55

PRINTEPS.org

56

57

日本語ウィキペディアオントロジー+ Pepper

日本語ウィキペディアオントロジー

+画像センシング+ NAO

58

QA 体操教示

マルチロボット連携による授業連携

59

60

ロボットカフェ

⑤ ⑥

③ ④

人と機械( AI )の協働

61

Race Against the Machine

米国では,ここ数年,

会計士,税理士の需要が 8 万人減少

高度コンピュータ

による大量失業時代?

アンドリュー・マカフィー MIT スローン・スクール、

デジタル・ビジネス・センター 主任リサーチサイエンティスト

62

The Future of Employment (1)

Carl Benedikt Frey and Michael A. Osbome, Oxford Univ.

• コンピュータに代行困難な重要要素

① Creativity (創造性、創意工夫)

② Dexterity (手先の器用さ)

③ Social Intelligence (社交性)

ルーチンワーク的な仕事は、 AI に置き換えられ ていく可能性が大きい

63

The Future of Employment (2)

Carl Benedikt Frey and Michael A. Osbome, Oxford Univ.

64

 ■コンピューターに奪われる職種

確率 職種

99% ローン貸し付け

96% 受付係

94% 法律事務員 92% 小売販売員 89% タクシー運転手

84% 警備員

81% コック(ファーストフード)

77% バーテンダー

58% 個人向けアドバイザー 11% 記者

7.4% 音楽家

0.4% 小学校教師  出所:オックスフォード大学

     「The Future of Employment」

人工知能やロボット等による代替可能性が高い100種の職業 http://www.nri.com/Home/jp/news/2015/151202_1.aspx

【事務員・作業員】

一般事務員 医療事務員 駅務員 会計監査係員 貸付係事務員 学校事務員 教育・研修事務員 行政事務員(国)

行政事務員(県市町村)

クリーニング取次店員 警備員

経理事務員 検収・検品係員 検針員

建設作業員

産業廃棄物収集運搬作業員 出荷・発送係員

じんかい収集作業員 人事係事務員 新聞配達員 スーパー店員 生産現場事務員 製本作業員

清涼飲料ルートセールス員 倉庫作業員

宅配便配達員 通信販売受付事務員 積卸作業員

電子計算機保守員(IT保守 員)

道路パトロール隊員 日用品修理ショップ店員 バイク便配達員

発電員 非破壊検査員 ビル清掃員 物品購買事務員 貿易事務員 包装作業員 保管・管理係員 保険事務員 郵便外務員 郵便事務員

有料道路料金収受員 列車清掃員

レンタカー営業所員

【工員】

鋳物工

AV・通信機器組立・修理工 NC研削盤工

NC旋盤工 加工紙製造工 カメラ組立工 機械木工

金属加工・金属製品検査工 金属研磨工

金属材料製造検査工 金属熱処理工 金属プレス工 計器組立工

ゴム製品成形工(タイヤ成形を 除く)

こん包工 サッシ工 紙器製造工 自動車組立工 自動車塗装工 水産ねり製品製造工 製パン工

製粉工

繊維製品検査工 惣菜製造工 鍛造工

電子部品製造工 プラスチック製品成形工 ミシン縫製工

めっき工 めん類製造工

【オペレーター】

IC生産オペレーター CADオペレーター 石油精製オペレーター セメント生産オペレーター 電算写植オペレーター プロセス製版オペレーター ボイラーオペレーター

マシニングセンター・オペレーター

【担当係】

受付係 銀行窓口係 データ入力係 ホテル客室係 レジ係

寄宿舎・寮・マンション管理人 給食調理人

宝くじ販売人 駐車場管理人

【その他】

診療情報管理士 測量士

タクシー運転者 通関士

電気通信技術者 電車運転士

ビル施設管理技術者 路線バス運転者

2016/4/7 65

ドキュメント内 平成17年度大学院 知識システム特論 (ページ 41-67)

関連したドキュメント