以上のことから,結果を総括すると,「潜在ランク理論によって小さなテストをそのままア イテムバンクにして,コンピュータ適応型テストにすることができる」ということが確認できたと いえる.
今後の課題は次の通りである.
新しいアルゴリズムで,小規模なアイテムバンクを使ってある程度の性能を実現できるこ とが分かったが,リニアテストをCAT化して実施するときには,シミュレーションが不可欠で あり,シミュレーションの結果が悪ければ,ランク数を変更してシミュレーションをやり直す必 要がある.これらのプロセスを容易にするため,プロセスを自動化することが有効と思われ る.言語教育をはじめとして多くの教育現場で使用されている大問形式のアイテムへ対応 するため,多値モデルのアルゴリズムを開発する必要がある.また,複数のテストの結果を 等化して利用範囲を広げることも必要であろう.これらの課題に今後も地道に取り組んでい きたい.
潜在ランク理論に基づく CAT は,理解度テストや学習モジュールの合否判定などの用 途に有効と考えられる.項目応答理論が適用できない小規模なテストは身近なところで多く 実施されているが,そのテストがCAT化できるということが教育や医療の領域で大きなイン パクトを与える可能性があると著者は考える.
参考文献
秋山實.(2011).潜在ランク理論モデルに基づくCATの開発とシミュレーションによる 特性解析.日本テスト学会第9回大会発表論文抄録集,146-147.
秋山實.(2012).潜在ランク理論のパラメータ推定に必要な問題数と受験者数.日本テ スト学会第10回大会発表論文抄録集,178-179.
秋山實.(2013a). 潜在ランク理論の特性パラメータ推定に必要なサンプルサイズ.未 刊原稿.東北大学大学院,教育情報学教育部,仙台市,宮城県.
秋山實.(2013b).LRT-CAT_sim.Ver 0.3,<http://lrt-cat.info>.
Bishop,C.M.,Svensen,M.and Williams,C.K.I.(1998).GTM:The generative topographic mapping.Neural Computation,10,215-234.
熊谷龍一 (2007). ニューラルテスト理論を離散変数型項目応答理論とみなしたとき項目 特徴を示す指標について. 第1回ニューラルテスト理論ワークショップ.
木村哲夫,永岡慶三.(2012).潜在ランク理論に基づくコンピュータアダプティブテスト
-アルゴリズムの提案と検証-.日本テスト学会誌,8,70-84.
Kohonen, T. (1995).Self-organizing maps. Springer.
松下達彦.(2003).日本語を読むための語彙データベース(総合版).Ver.4.0.
< http://www.geocities.jp/tatsum2003/ >
松下達彦.(2012).「日本語を読むための語彙量テスト」の開発.2012年日本語教育国 際研究大会予稿集,第1分冊,310.
村木英治.(2011).項目反応理論.80-85,朝倉書店.
Shojima,K.(2007a).Neural Test Theory.DNC Research Note,07-02.
<http://www.rd.dnc.ac.jp/~shojima/Shojima2007RN07-02.pdf>, (2012 12 6
日閲覧).
Shojima,K.(2007b).Maximum Likelihood estimation of latent rank under neural test model.DNC Research Note,07-04.
<http://www.rd.dnc.ac.jp/~shojima/ntt/Shojima2007RN07-04.pdf>, (2012年12月 6日閲覧).
Shojima,K.(2008).Bayesian estimation of latent rank in test Neural Test Theory.DNC Research Note,07-04.
<http://www.rd.dnc.ac.jp/~shojima/ntt/Shojima2007RN07-15.pdf>, (2012年12月 6日閲覧).
Shojima,K.(2012).EXAMETRIKA.Ver 5.3,
<http://www.rd.dnc.ac.jp/~shojima/exmk/>.
豊田秀樹編.(2008).共分散構造分析(AMOS編).245,東京図書.
植野真臣・荘島宏二郎.(2010).学習評価の新潮流,83-111,朝倉書店.
von der Linden,W J.(1998).Bayesian item selection criteria for adaptive testing.Psychometrika,63,2,201-216.
Warm,T.(1989).Weighted likelihood estimation of ability in item response theory.Psychometrika,54,3,427-450.