「ロボットは東大に入れるか」という企て:5.深い言語処理と高速な数式処理の接合による数学問題の自動解答
2
0
0
全文
(2) くわだ. 小特集 「ロボットは東大に入れるか」という企て. 言語処理 字句処理. /NP のグラフ /S とする. のグラフ à とする à. 問題. 円 O の周の長さ à 円/NN O/NP の/PP 周/NN の/PP 長さ/NN. 数式解析. (. 品詞解析. 直線 ℓ が円 C と接している. と の) 接点の座標を(1, 1) とする. の. 文処理. 対角線. である. ゼロ照応検出 は. 構文解析. 数学I+A. 共参照解析 文間関係解析. 意味表示. (. 直線 ℓ が円 C と接している.. と. の) 接点の座標を(1, 1) とする.. を自然数とする. = と仮定する. = は偶数である. このとき, à. 修正 あり. 問題・分野. 配 点. 完全 自動. 修正 あり 2. 10. 0. 10. [1]-1 三角関数. 15. 0. [1]-2 集合. 10. 6. 3. [1]-2 指数・対数. 15. 5. 5. [1]-3 2次関数. 10. 2. 6. [2] 微分・積分. 30. 15. 19. [2]-1 図形と計量. 15. 11. 15. [2]-2 データ分析. 15. 6. 6. [4] 整数の性質. 20. 10. 10. [5] 図形の性質. 20 合計. 8 43 点. 10 70 点. [3] 数列 [4] ベクトル. =. だが,言語処理により生成される論理式は非常に冗 長で,従来の手法では解けないことが多かった.そ のため,東ロボ数学ソルバーでは改良した限量子消 去手法 3 に加え,論理関数処理,幾何的不変性など ). 4). が用いられている.. 11 12 43 点. 13 20 59 点. *修正あり:不足の辞書エントリを追加し,言語処理における曖昧性解消を人手で行った場合. 問題・分野. 配 点. [1] 図形と方程式. 20. [2] 確率. 20. [3] 微積分. 20. [4] 整数. された入力を期待することが多い.数式処理も同様. 20 20 合計. 図 -3 進研マーク模試 2016 の結果 文系. 図 -2 言語処理部の構成. を利用した論理式の簡単化手法. 数学II+B 完全 自動. [1]-1 数と式. 意味合成 談話構造処理. 配 点. 問題・分野. 20 合計 偏差値. 理系 完全 自動 0 白紙. 修正 あり 20 白紙. 0. 6. 20 20 点. 20 46 点. 50.1. 68.1. 配 点. 問題・分野 [1] 整数. 20. [2] 確率. 20. 完全 自動 20 白紙. [3] 図形と方程式 20. 20. [4] 立体の体積. 20. [5] 積分の極限. 20. 20 白紙. 20 合計. 20 80 点. [6] 複素平面. *修正あり: 文系[1] à不足の辞書エントリを追加 文系[2] à 共参照解析の結果を修正. 偏差値. 76.2. 図 -4 代ゼミ東大模試 2016 の結果. においては完全に自動的な処理で 4 問に完答し偏差 値 76.2 を達成した.. 上記の改良により,旧帝大の 2 次試験問題を人手で 形式化し,生成した入力に対し,既存の限量子消去 ツールでは正答率約 88% に対して,現在開発中の ツールでは約 95% が解けた.. 言語処理部の性能向上および演繹部が対応する問. そのほかに,適用範囲拡大のため,多項式の問題. 題タイプの拡大に加え,演繹を通じた曖昧性解消な. に変換可能な三角関数問題への拡張や代数曲線で囲. ど分野横断的な技術開発がさらに必要である.. まれた図形の面積を求める手法が用いられている.. 2016 模試の結果 2016 年度のセンター形式および東大形式模試に 対する評 価 結果を図 -3,4 に示す.2015 年度まで の模試による数学解答システムの評価では,言語処 理部のうち未完成の部分を,人手で付与した言語処 理結果で代替していた.この,人が介在する設定で の評価結果は,意味辞書の被覆率および曖昧性解 消処理について理想化した場合の性能の上限となる.. 2016 年度は,人が介在する設定(図の「修正あり」) に加え,システム全体を自動的に動かした場合( 「完 全自動」 )の結果を評価した.両設定の下での得点に はまだ開きがある.また,センター形式模試に対す る得点は,理想化した設定の下でも東大受験者レベ ルには達していない.一方で,東大形式模試(理系) 608. 今後の展望. 情報処理 Vol.58 No.7 July 2017. 参考文献 1) Matsuzaki, T., Iwane, H., Anai, H. and Arai, N. H. : The Most. Uncreative Examinee: A First Step toward Wide Coverage Natural Language Math Problem Solving, In Proceedings of the Twenty-Eighth AAAI Conference on Artificial Intelligence, pp.1098-1104 (2014). 2) Matsuzaki, T., Ito, T., Iwane, H., Anai, H. and Arai, N. H. : Semantic Parsing of Pre-university Math Problems, In Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (ACL-2017), 2017. to appear. 3) Iwane, H., Matsuzaki, T., Arai, N. H. and Anai, H. : Automated Natural Language Geometry Math Problem Solving by Real Quantifier Elimination, In Proceedings of the 10th International Workshop on Automated Deduction (ADG2014), pp.75-84 (2014). 4) Iwane, H. and Anai, H.: Formula Simplification for Real Quantifier Elimination using Geometric Invariance, In Proceedings of the 42nd International Symposium on Symbolic and Algebraic Computation (ISSAC-2017), 2017. to appear. (2017 年 3 月 31 日受付) ■松崎拓也(正会員) [email protected] 専門は言語処理.東大助教,国立情報学研究所特任准教授を経て 現在,名古屋大学准教授. ■岩根秀直 [email protected] 専門は数式処理. (株)富士通研究所人工知能研究所所属.博士(数 理学)..
(3)
関連したドキュメント
そのような発話を整合的に理解し、受け入れようとするなら、そこに何ら
の点を 明 らか にす るに は処 理 後の 細菌 内DNA合... に存 在す る
非自明な和として分解できない結び目を 素な結び目 と いう... 定理 (
これらの定義でも分かるように, Impairment に関しては解剖学的または生理学的な異常 としてほぼ続一されているが, disability と
(問5-3)検体検査管理加算に係る機能評価係数Ⅰは検体検査を実施していない月も医療機関別係数に合算することができる か。
東京都は他の道府県とは値が離れているように見える。相関係数はこう
これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,
わかりやすい解説により、今言われているデジタル化の変革と