• 検索結果がありません。

大学入試の物理試験における問題の解釈

N/A
N/A
Protected

Academic year: 2021

シェア "大学入試の物理試験における問題の解釈"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

1.は じ め に

国立情報学研究所において 2011 年度から取り組まれ ている「ロボットは東大に入れるか」プロジェクトは, これまで培われてきた人工知能に関する技術の人間の知 的活動に対する到達点を,大学入学試験解答というベン チマークタスクによって明らかにするものである. 大学入学試験には一般的に多肢選択式の大学入試セン ター試験と,主に記述式である大学個別の二次試験があ り,また,科目ごとに異なる性質の問題が出題される. そのため,本プロジェクトでは各科目ごとに特化して解 答システムの構築を行ってきた.数学や物理は他の科目 と異なり,計算という要素があり,問題を解析してそれ をもとに計算を行うという流れは共通しているが,問 題の性質や焦点が当たる要素は当然ながら異なるため, 個々の処理においても異なるところが多い. 本稿では物理問題解答について,解答システムの概略 と問題文の解釈に焦点を当てた問題解答の難しさについ て解説する.

2.物理問題の特徴

物理問題には,“円と x 軸が接する”といったような 数学的な記述で出題される数学の問題とは異なり,日常 的な場面設定で出題されるものがある.物理問題の例を 図 1 に示す. 大学入学試験の物理問題には,この例のように,与え られた状況において発生する物理現象に関する問題や, 物理に関する知識を問う問題などがある.試験問題では 特に前者のタイプが多くを占めており,このような問題 を解くためには書かれている状況を正しく理解し,定式 化することが必要となる.物理問題解答における状況の 理解には,単に状況においてどのような物体がどのよう な位置関係で存在するかや,それらに対してどのような 操作が行われるか,ということだけでなく,その状況に おいてどのような物理法則が関係しているか,というこ とが含まれる. 立式し,それらを計算することで解くという点では物 理の問題は数学の問題と類似している.しかし,数学の 問題の多くはいわゆる“点”や“線”などの数学的な要 素によって記述されるのに対し,物理問題では日常的な 状況が出題されることがある.そのような問題では“小 鳥”や“ゴムひも”などが要素として出現することがあり, それらを“質点”や“ばね”であるというように,日常 的な状況中の要素を物理問題における要素として解釈す ることが必要となる. 問題文は基本的には受験者が読み間違いをしないよう に記述に注意が払われている.そのため,新聞記事など のような一般的な文章に比べて容易に理解することがで きるように書かれている.しかし,それは必ずしも計算 機にとっても容易であるということを意味しない.問題

大学入試の物理試験における問題の解釈

Interpretation of Physics Problems in University Entrance Examination

横野  光

株式会社富士通研究所

Hikaru Yokono Fujitsu Laboratories, Ltd.

[email protected]

Keywords:

physics problem solver, natural language understanding, situation modelization. 「物理学と AI」

(2)

文では曖昧性が生じない程度に省略などが使用されるこ とがあるため,それらを解析することが必要である.例 えば,以下の文章を考える. (1)ばねの一端を天井に取り付け,他端におもりを取 り付ける.そして,おもりをばねの長さが d になる まで引っ張った後で離した. ここで“離した”には二つの解釈が考えられる. (2)おもりを手から離した (2)おもりをばねから離した 我々は(2)の解釈が正しいと判断できるが,このよ うな省略された要素の解析は計算機にとって困難なタス クの一つである. 問題文の解析では状況に関する記述の解析が中心とな る.この解析によって得る情報は出現する物体やそれら の間の関係などである.新聞などの一般的なテキストに 比べて物理問題の状況記述は事実が時系列順に書かれて いることが多く,“かもしれない”といった,文の内容 に対する話し手の判断や聞き手に対する伝え方などを表 すモダリティー表現はほとんど現れず,文の構造も比較 的平易であるが,ゼロ代名詞解析のように計算機にとっ ては困難なタスクも含まれている.現状のシステムでは, 任意の文を想定とした解析システムではなく,物理問題 に頻出する表現パターンを知識として用意し,それを用 いたドメイン特化の解析システムを構築している. 問題には自然言語表現だけでなく,その状況を表現し た図が添付されていることが多く,そのような場合,状 況の記述がすべて自然言語によって表現されていないこ ともある.例えば,図 1 の問題では物体とばねと壁がど のような位置関係で配置されているかは図からしか読み 取ることができない.本来ならば,物体認識などの画像 解析を添付の図に対して行うことが必要であるが,現時 点では図からしか得られない情報は物体の位置関係が主 であり,これは独立したタスクとして設定できると考え, 自動的な抽出は今後の課題として,現時点では物体の位 置関係の情報は人手で付与している. 物理問題で用いられる図は抽象的に記述された線図 のようなものやイラストなどである.写真を対象とした 画像中の物体認識は近年非常にその性能が向上している が,それらが対象とする画像と比べて,物理問題で用い られる図には距離や角度と変数の対応,移動前,移動後 の配置,移動の軌跡(図 6 中の図参照)などが記述され ていることがあり,図の解釈では,単なる物体認識だけ ではなく,問題文に書かれてある状況と対応するものは 何かなどを合わせて考える必要がある.

3.物理シミュレーションを用いた

問題解答システム

高校物理は,力学,エネルギー,波,電磁気,原子・ 分子,という分野に大きく分けられ,それぞれの分野の 問題には異なる特徴があり,すべての問題を対象とした 解答システムを構築することは困難である.我々のグ ループでは,まず力学の問題に焦点を当て,後段の計算 系として物理シミュレータを利用した解答システムを中 心に構築しており [岩根 17],本稿ではこのシステムに ついて概要を述べる.このほかにも,形式表現から連立 不等式を立式し数式処理システムを用いて解答するシス 図 2 解答システムのフロー 図 3 図 1 の問題の形式表現

(3)

テムや,問題中の図を専用エディタを使って同じ図を作 成し,それらの接続情報から立式,解答するシステム [五十嵐 16] などを構築している. 力学の問題では,受験者は与えられた状況やそこで行 われる操作を理解して,その結果起きる物理現象などに ついての問題を解く.比較的頻出するような状況であれ ば,物理シミュレーションによって再現することができ る.実際,初期条件を人手で作成すれば多くの力学問題 を解けることは確認できている. 解答システムは,前段で問題文を解析し,後段でそ の解析結果を用いて物理シミュレータによるシミュレー ションを行い,その結果をもとに問題に解答する.開発 中のシステムのフローを図 2 に示す. 前段の問題文の解析によってその問題を表す一階述語 論理の論理式による形式表現を得る.形式表現で用いる 述語は,センター試験の過去問や教科書,参考書などを 参考にして,表 1 に示す 5 種類を定義した.(e)のその 他には変数と値の対応や解答形式の指定などがある.そ れぞれの述語の例を表 2 に示す. 述語の項の e は時刻を表し,添字の数字の大小関係が 時刻の前後関係を表す.e1 は初期状態を意味する. システムは,最初に自然言語や図で記述される問題を 入力として受け取り,その意味内容を表す形式表現を得 る.ここで得られる形式表現は基本的に後段の計算に用 いるシステムに特化したものではなく,一般的に計算に 必要となるであろう,問題に記述されてある情報を含む ものである.形式表現には,問題から示されている状況 に出現している物体とその属性(物理量),物体に対し て行われる操作,物理現象,解答すべき物理量とその解 答形式(式,数値,言語表現など)に関する情報が含ま れる.この形式表現は基本的に問題文に表層的に記述さ れている情報から言語処理によって獲得できる範囲で設 計している. 次に,得られた形式表現を元に,問題の状況を理解し, シミュレーションの実行に必要な条件を含めた中間言語 を生成する.中間言語は物理シミュレータが利用するモ デリング言語のうち,入試問題について設定が必要とな るものを取り出したもので,モデリング言語への変換を 容易にするために用意している.最後に,このモデリン グ言語を入力としたシミュレーションを実行し,その結 果として,各時刻における位置や速度,加速度などの物 体の属性値の情報が獲得される. 実際の問題では,“物体が止まった時の時刻を答えよ” のように,ある物理現象が起きたときの時刻における 特定の属性を解答として求めているものが多い.シミュ レーション結果から解答として注目されている時刻を特 定し,その時刻における属性値を求められた解答形式に 合わせて出力し,多肢選択式の問題の場合は最も妥当な 選択肢を解として選ぶ. このシステムではあらかじめ物理問題によく表れる, 質点,ばね,意図などの要素をシミュレータ上でコンポー ネントとして準備し,それらを組み合わせることでシ ミュレーションを行うことを想定している.既存の物理 シミュレータは,基本的に現実世界で起こり得ることを 再現することが求められる.しかし,大学入試における 物理問題では状況が複雑になることを避けるため,大き さを無視することのできる質点や重さを無視できるばね などのように,現実には存在しない理想的な環境が想定 されている.そのため,物理問題に特化したコンポーネ ントをつくる必要があった. シミュレーションの実行には,状況に出現するコン ポーネントは何かだけでなく,コンポーネント位置,角 度,速度などが初期状態として必要となる.シミュレー ションに必要な情報と問題解答に必要な情報は必ずしも 一致するとは限らない.例えば,物体の位置はすべての コンポーネントが要求し,三次元空間上の座標として与 える必要があるが,物理問題では位置に関する情報は物 体間の相対的な位置関係などでは与えられることがある ものの,座標という直接的な形で与えられることはない. すなわち,シミュレーションの実行においては,与えら れた問題に対して,必要なコンポーネントを選択し,そ れらの条件を求める必要がある.これは問題から得られ る形式表現には含まれない情報であり,シミュレータの 入力との間のギャップの一つであり,現状ではある程度 規則的に初期条件を設定している. 表 1 述語の種類と数 種 類 数 (a) 物体を表す述語 24 (b) 物理量を表す述語 36 (c) 物体に対する操作を表す述語 13 (d) 物理現象を表す述語 46 (e) その他 5 表 2 定義した述語(一部) 種 類 述 語 説 明 (a) mass(x) floor(x) xは質点である xは床である (b) weight(x, y) position(x, y) yは x の質量を表す yは x の位置を表す (c) connect(x, y, e) puton(x, y, e) xと y を時刻 e で接続する xを時刻 e で y に置く (d) stop(x, e) hanareru(x, y, e) xが時刻 e で止まる xと y が時刻 e で離れる (e) assign(x, y, e)

value(x)

時刻 e における y の値を x とする

(4)

4.センター模擬試験タスク結果

本プロジェクトでは 2016 年まで予備校で実際に使用 されたセンター試験の模擬試験*1を対象にして解答器 の性能評価を行ってきた.このセンター模擬試験タスク では,問題文や選択肢の範囲などの構造情報がアノテー ションされた XML 形式の試験問題ファイルが入力とし て与えられる. 本来は入力から解答まで end-to-end なシステムで評 価を行うべきであるが,これまでのタスクでは我々のグ ループは入力を問題から得られる形式表現とし,得られ たシミュレーション結果の出力を人手で解釈し,解答す る選択肢を決定している.これは図 2 における“自然言 語処理部”と“結果の解釈部”の精度が実用の域に達し ていないためである.したがって,物理問題解答に関し ては自然言語処理部が誤りなく解析できたという前提で の評価となっていることに留意されたい. タスクの結果を表 3 に示す.2015 年度ではシミュレー タを用いた解答器のみであったが,2016 年度では前述の ように複数の解答器を用いている.いずれも力学の問題 が対象であるため,それ以外の分野の問題に関しては解 答の選択肢をランダムに決定する解答器を用いている.

5.モデル化が困難な問題

我々のシステムは力学のみを対象としているが,すべ ての力学の問題に対して対応できているというわけでは ない.例えば,後段のシミュレーション部分に関しても, 登場し得る要素に対応するコンポーネントがすべて存在 しているわけではないという状況などがあるが,本稿で は前段の問題の解釈における問題について述べる. 2章で述べたように,解答システムは物理問題を解く ために問題に書かれてある状況を解釈し,形式表現に変 換する.基本的に“書かれてあることを読み取る”とい う方針で解析を行っているが,問題によっては書かれて あることだけでは解けないようなものも存在する.どの ような点で解釈が困難となるかについて事例をあげて説 明する. 5・1 全体のモデル化が必要となる問題 実際に受験者が問題を解くときには,与えられた状況 から,例えば,鉛直投げ上げの問題やエネルギー保存則 を使った問題,というように問題の“型”を推測し,そ こから必要な公式を決定する.我々のシステムでは,そ のような問題の型を定義し当てはめて解くという手法で はなく,状況において出現している要素がどのような機 能をもつかを推定し,それらの要素を組み合わせて解答 している. しかし,問題の中には個々の要素がもつ機能の組合せ ではなく,全体を考慮してどのようなモデルとして解釈 すべきかを考えなければいけないようなものもある.そ のような例を図 4 に示す. この図で出現している要素は物体とばねである.要素 だけを見れば力学の問題と考えられるが,これは波のモ デルとして出題されることがほとんどであり,そのよう な問題においてばねがどういう動きをするかなどは解答 には関係ない. このような問題では,問題文に“これは波のモデルで ある”といったような手掛かりとなる情報が与えられる ことがある.しかし,もし解答システムが読み取れたと ころで,図中の要素をどのように波として解釈すればよ いかは与えられていないため,その対応は推測する必要 がある. 5・2 解答に必要な情報の取捨選択が求められる問題 物理の問題では日常的な道具立てで状況を表現してい ることがあり,そのような問題には,状況の構築過程も 表 3 センター模試タスク結果 年 度 得 点 偏差値 (全国平均) 2015 42 46.5 49.4 2016 62 59.0 45.8 図 4 ばねによる波のモデル *1 2015 年度,2016 年度はベネッセの「進研マーク模試」を利 用している. 図 5 問題(2007 年度センター試験本試験より引用)

(5)

言語表現として記述されているものもある.その例を図5 に示す. この問題では“板を用いて斜面をつくる”とあり,我々 はいわゆる“斜面上を運動する物体の問題”だと解釈す る.この解釈の過程においては,どのようにその状況が 構築されたか(この例では斜面のつくられ方)は考慮さ れることはない.このように問題の解釈においては,書 かれてあることをすべて解釈しようとするのではなく, 取捨選択を行っていると考えられる. 当然のことながら,試験問題の出題の意図は物理的な 状況認識とそれに関する問題が解けるかを測ることであ り,書かれてあることを字義どおりに正しく解釈できる かではない.そのため記述が省略されていることもある. この例の場合,例えば,どのように板が支えられてい るかについては文中でも図中でも言及されていないが, 我々はそれを考慮することなく“斜面が存在しているこ と”を理解することができる. 逐次的に解釈を行う我々のシステムでは,手続き的に 構築が記述されているという仮定に沿って解釈を進めて 状況を構築する.したがって,過程が省略されている場 合,どのようにして最終的な状況を構築すればよいかを 考えなければならない. また,問題文を字義どおりに解釈していったときに起 こり得る状況と実際に問題に記述されている状況が異な る場合もある.例を図 6 に示す. この問題では“支点の鉛直上方でおもりを静かに離 す”という操作が行われている.この操作を字義どおり に解釈すると,おもりに力は加えられていないというこ とになる.理想的な環境においては,このような場合お もりは鉛直上方にとどまったまま静止しているはずであ る.一方で,続く問題文では“反時計回りに回転し始め た”とある.この矛盾を解消するためには,“静かに離す” という操作は,わずかに鉛直方向以外の向きに力を与え るという動作を含む,とすることも考えられるが,自由 落下の問題における“静かに離す”においては字義どお りの操作である必要があるため,操作の定義として考慮 することはできない. これらは,物理問題解答では,いわゆる物理問題特有 の抽象化されたモデルでの理解が必要であるが,問題の 表現としては日常的な場面として記述されている,とい うずれが原因となっている現象と考えられる.そして, 日常的な状況として記述する場合,その背後にある抽象 的なモデルを推測するのに最低限必要な情報さえあれば よく,高校の物理で取り上げられるモデルは数が限られ ているため,常識的な推論で導出できるのであれば,状 況構築に必要な情報をすべて記述する必要はない. また,逆に問題文として記述されていても,それはあ くまでも日常的な状況を表すための“演出”のようなも のもあり,それらは無視する必要がある.例えば,“棒 を L 字型に折り曲げる”といったような記述が問題で出 されることがある.これらの操作を実直に解釈しようと すると“折り曲げる”とはどういうことかなどを定義す る必要がある.しかし,実際に問題解答に必要なのはそ の結果である“L 字型の棒”であり,折り曲げる操作が どのように行われているかは関係ない. このように,問題文の記述からモデルの推定に必要な 情報を取捨選択し,必要な部分だけを解釈する,という ような処理が必要となる.

6.物理問題のモデルの設計について

現状のシステムは,物理問題によく表れる要素をコン ポーネントとして用意しておき,それらを組み合わせて 解答する.問題に出現する要素をすべて実装しているわ けではないため,対応するコンポーネントが存在しない ような状況の問題は解答することができない.また,物 体の位置などのようなシミュレーションの実行に必要な 情報が必ずしも問題に含まれているわけではなく,実行 に必要な初期条件を推定する必要がある.これは物理問 題に書かれてある状況を再現するようなパラメータの探 索問題と捉えることができるが,パラメータの数が多い ため効率的な探索を考える必要がある. そもそも後段の計算処理を行うためには,問題から必 要な情報を獲得しなければならない.5 章で述べたよう に,実際に受験者も解く際には状況に応じて抽象化や焦 点を当てる状況の選択を行い問題をモデル化する.問題 図 6 問題(2011 年度センター試験本試験より引用)

(6)

となるのはここで考慮すべきモデルとはどのようなもの か,それはどのくらい用意すればよいのか,ということ である. 大学の入試問題解答のみに焦点を当てれば,いわゆる よくある問題に対してのモデルを構築すればよいと考え られる.しかし,物理の問題は複数の要素を組み合わせ て構成されることもある.例えば,スキージャンプのよ うに斜面を下ってから飛び出す物体の運動では,飛び出 す直前まではエネルギー保存則の問題として,飛び出し た以降は斜方投射の問題として解釈する必要がある.こ のような問題にも対応することを考えると,全体を一つ のモデルとして解釈するより,複数のモデルがある時点 において切り替わるという解釈を行ったほうが自然であ る. 本プロジェクトでは大学入試解答をタスクとしている ため,解答システムにおいて必要となる知識は基本的に 高校で学習する内容に制限することができる*2.その点 から,問題に表れる要素は有限であろうし,ある程度ま とまった単位でのモデル化も可能だと考えられる. 原理的には,個々の要素に対してのコンポーネント (e.g.“質点”,“ばね”)を定義しておき,それらの組合 せとして問題の解釈を行うことも可能であるが,これま でに述べたように,問題には必要な情報がすべて明示的 に記述されているわけではなく,それらを推測しながら 解釈を行っていく必要がある.また,後段の計算系に関 して,個別のコンポーネントの基本的に可能な任意の組 合せでの動作を保証する必要があり,実装が非常に困難 となるため,現実的ではない. したがって,現実的な解としては,いわゆるテンプレー ト的なモデルを用意したうえで,それらの組合せを定義 するということが考えられるが,どういう粒度のテンプ レートを考えればよいのかという問題は残る.

7.お わ り に

本稿では,「ロボットは東大に入れるか」プロジェク トにおける物理問題解答システムについての概説と,物 理問題解答の難しさを問題の解釈という面から事例をあ げて説明した. 物理問題の特徴には,日常的な設定で記述されてい る状況に対して,その背後にある物理的なモデルを推定 する必要があるということがある.受験者はこの具体的 な状況からある種の抽象的なモデルへのマッピングを行 い,その世界で立式,計算を行う.このモデルがどうい うものであるか,を定義することが問題解答において重 要となる. 現在は大学入試問題解答に焦点を当て,このドメイン 特有の知識を考慮した解答システムの開発を行っている が,具体的な事象を抽象的な事象として捉えるという処 理は,物理問題解答に限らず一般的な推論の一種である. しかし,その抽象的な事象とはどういうものか,特に数 学や物理のように後ろに何らかの計算系が存在するとき に,それらとの接合可能性をどうやって保証すればよい か,が解かなければならない課題である.

◇ 参 考 文 献 ◇

[岩根 17] 岩根秀直,横野 光,岩ヶ谷崇,五十嵐健夫:言語処理で 生成する形式表現とシミュレータの接合による大学入試物理の 力学問題の自動解答,第 31 回人工知能学会全国大会(2017) [五十嵐 16] 五十嵐健夫,横野 光,岩根秀直:図形描画とテキス ト入力を用いた力学に関する質問応答システム,第 24 回イン タラクティブシステムとソフトウェアに関するワークショップ (WISS 2016)(2016) 2018年 5 月 7 日 受理

著 者 紹 介

横野  光(正会員) 東京工業大学研究員,国立情報学研究所特任助教を 経て 2016 年より株式会社富士通研究所所属.博士 (工学).専門は計算言語学,自然言語処理. *2 もちろん,いわゆる常識と呼ばれる範囲を限定することが困 難な知識が必要になる問題(e.g. 国語,英語の読解問題)もある.

図 1 物理問題の例(2009 年度センター試験追試験より引用)

参照

関連したドキュメント

腐植含量と土壌図や地形図を組み合わせた大縮尺土壌 図の作成 8) も試みられている。また,作土の情報に限 らず,ランドサット TM

絡み目を平面に射影し,線が交差しているところに上下 の情報をつけたものを絡み目の 図式 という..

 複雑性・多様性を有する健康問題の解決を図り、保健師の使命を全うするに は、地域の人々や関係者・関係機関との

基本的金融サービスへのアクセスに問題が生じている状態を、英語では financial exclusion 、その解消を financial

生活のしづらさを抱えている方に対し、 それ らを解決するために活用する各種の 制度・施 設・機関・設備・資金・物質・

(今後の展望 1) 苦情解決の仕組みの活用.

LUNA 上に図、表、数式などを含んだ問題と回答を LUNA の画面上に同一で表示する機能の必要性 などについての意見があった。そのため、 LUNA

 筆記試験は与えられた課題に対して、時間 内に回答 しなければなりません。時間内に答 え を出すことは働 くことと 同様です。 だから分からな い問題は後回しでもいいので