• 検索結果がありません。

理系記述式テストへのIRT適用課題の検討

N/A
N/A
Protected

Academic year: 2021

シェア "理系記述式テストへのIRT適用課題の検討"

Copied!
3
0
0

読み込み中.... (全文を見る)

全文

(1)

理系記述式テストへのIRT適用課題の検討

著者

泉 毅

雑誌名

教育情報学研究

15

ページ

71-72

発行年

2016-12-25

URL

http://hdl.handle.net/10097/00123140

(2)

項目反応理論が適用される場面は,基本的に客 観式テストかつ一問一答型のテストである。し かし,近年,わが国において,にわかに客観式 テスト以外のテストに対する項目反応理論 (Item Response Theory : IRT) による分析への期待が高 まっている。その中には,記述式テストを IRT で分析する等,従来の制約を越えた項目への IRT 適用が含まれている。我が国のテスト文化の中で, 従来の制約を越えた項目への IRT 適用がなされ る試験を実施し,それを軌道に乗せていくとする ならば,検討すべき課題は多いことが考えられる。 我が国のテスト慣行に合わせて数々の実証的研究 を行い,それに基づく議論を積み重ねていく必要 がある。 そのため,本研究では,テスト理論的な観点か ら理系記述式テストの IRT 適用に関する問題点に ついて,実際のテストデータを用いて実証的に検 証することを試みる。理系記述式テストへの IRT 適用を検討し,その事例を提示することは,この 課題に対する取り組みとして社会的な意義がある と考える。本研究は,序章,第Ⅰ部,第Ⅱ部,結 章から構成された。主である第Ⅰ部と第Ⅱ部を概 説する。 第Ⅰ部は,第1章~第6章から構成され,理系記 述式テストの実データを用い,記述式テストへの IRTの適用を検討した。第1章は第Ⅰ部の理論的 背景として,第Ⅰ部で用いる理系記述式テストに 関しての概要,IRT 適用に際して予想される技術 的課題を述べた。また,項目の連鎖性に関して, 任意の項目ペアへの被験者の正答誤答パタンに着 目し,項目間の連鎖性を「実質的同一項目」「完

理系記述式テストへの IRT 適用課題の検討

東北大学大学院教育情報学教育部 泉 毅 学位授与年月日:平成28年₃月25日 主査:東北大学大学院教育情報学研究部 教授 倉元 直樹 副査:東北大学大学院教育情報学研究部 教授 北村 勝朗 副査:東北大学大学院教育学研究科  准教授 熊谷 龍一 全連鎖項目」「部分連鎖項目」「連鎖性がない項 目」とする四分類法を提案した。第2章は第Ⅰ部 での方法論を述べた。第3章では,理系記述式テ ストを二値データとして分析を行った。第4章で は,理系記述式テストを多値データとして分析を 行った。その結果,二値データ,多値データ,と もに,局所依存を満たしていないと考えられる項 目に,項目パラメタの推定が不安定になる場合が みられた。 第5章では,第3章,第4章の結果を受け,教科◦ 科目を超えたテスト,すなわち,数学,物理,化 学の三科目を1つのテストバッテリーとした分析 を行った。その結果,項目パラメタの観点からは, 安定したパラメタ推定がなされた。第6章では, 第3章,第4章,第5章の結果を受け,理系記述式 テストへの IRT 適用の課題について述べた。 理系記述式テストの場合,局所独立の仮定を満 たさない項目に対していかに対処できるか,また, いかに項目の確保をするか,という課題が第Ⅰ部 において見出された。第Ⅱ部では,その課題の検 討を行った。 第Ⅱ部,第7章では,第Ⅰ部における理系記述 式テストデータの二値◦多値データにおける分析 結果◦課題を踏まえ,局所独立性を満たさない項 目による推定の問題,特に客観式テストの数学に 焦点を当てた検討を行った。第3章,第4章の理系 記述式テストにおいて,識別力パラメタの過大推 定されたと考えられる項目は全て連鎖性のある項 目であった。また,第7章においても,完全連鎖 項目ペア,また実質的同一項目ペアであると考え られる項目の,識別力パラメタの推定値が過大推 教育情報学研究 第15号(2016)

Educational Informatics Research, 2016, No.15, 71-72

(3)

定された。しかし,第7章において,文脈依存や 弱い部分連鎖項局所依存が考えられる項目であ るが,異常なく項目パラメタの推定が行うことが 可能な項目も存在した。このことから,文脈依存 や弱い部分連鎖項目ペアによる局所依存に対して は,IRT モデルは頑健であるが,完全連鎖項目ペ アや実質的同一項目ペアによる局所依存に対して は項目パラメタの推定が不安定になる可能性が示 唆された。 第Ⅱ部の第8章では,等化◦対応付けを考えた 場合,テストの項目数の減少は,共通項目数の減 少につながることを踏まえ,共通項目数が減った 場合の問題点について,推定の精度に着目した検 討を行った。その結果,最低でも6 ~ 8項目の共 通項目が必要であり,4を下回る共通項目数だと, パラメタ推定が不安定になるという結果となっ た。 第Ⅱ部の第9章では,第5章で扱った,教科◦目 を超えたテストのデータが,対応付けの結果,信 頼性の側面から,どのような性質を保っているか, 信頼性指数に着目した検討を行った。その結果, 第Ⅰ部で用いた理系記述式テストデータの数学分 野,化学分野,物理分野の,2教科間の対応付け を想定し信頼性指数を算出したところ,全体とし て低い信頼性であった。安定したパラメタ推値が みられた第5章における結果に対し,疑問が見え る結果となった。 本研究では,第1章~第9章に渡り,限定的な視 点に絞って検討を行ったが,これらの分析のみで も,理系記述式テストへの IRT 適用の困難は山 積している。さらに,複数回実施した場合の等化, 採点の公平性,明確な採点基準の設定,多数の項 目の確保等,検討していない課題は数多くのぼる。 理系テストデータをはじめとする回答構築式の出 題形式に対しての IRT 適用には,数多くの基礎 的な研究が必要であることが示唆された。 理系記述式テストへのIRT適用課題の検討 - 72 -

参照

関連したドキュメント

「エピステーメー」 ( )にある。これはコンテキストに依存しない「正

この項目の内容と「4環境の把 握」、「6コミュニケーション」等 の区分に示されている項目の

一次製品に関連する第1節において、39.01 項から 39.11 項までの物品は化学合成によって得 られ、また 39.12 項又は

第 98 条の6及び第 98 条の7、第 114 条の 65 から第 114 条の 67 まで又は第 137 条の 63

システムであって、当該管理監督のための資源配分がなされ、適切に運用されるものをいう。ただ し、第 82 条において読み替えて準用する第 2 章から第

 1999年にアルコール依存から立ち直るための施設として中国四国地方

あれば、その逸脱に対しては N400 が惹起され、 ELAN や P600 は惹起しないと 考えられる。もし、シカの認可処理に統語的処理と意味的処理の両方が関わっ

雇用契約としての扱い等の検討が行われている︒しかしながらこれらの尽力によっても︑婚姻制度上の難点や人格的