• 検索結果がありません。

評価点の統計的信頼限界について

N/A
N/A
Protected

Academic year: 2021

シェア "評価点の統計的信頼限界について"

Copied!
9
0
0

読み込み中.... (全文を見る)

全文

(1)Title. 評価点の統計的信頼限界について. Author(s). 谷垣, 正道. Citation. 北海道学芸大学紀要. 第二部. A, 数学・物理学・化学・工学編, 11(1・ 2): 9-16. Issue Date. 1960-08. URL. http://s-ir.sap.hokkyodai.ac.jp/dspace/handle/123456789/5660. Rights. Hokkaido University of Education.

(2) . 1巻 第1. 第 1号. A. 北海道学芸大学紀要 (第二部). 昭和35年8月. 評価点の統計的信頼限界について 垣. 谷. 正. 道. 北海道学芸大学釧路分校数学教室. i imi f ts o Se ido Tanigaki: on statist cal con6dence l ion- n 〔 leasure evaluat .. 払. 1 」 閥. 書. き. 教育統計においては, テストの信頼性をあらわすのに, 通常, 再 テスト法, 平行形式の テ ス ト (同価 テ ス ト) に よ る 方 法, 折 半 法, Kuder Richardson の 方 法, footrule の 方 法, 分 散 分 折 に. l iksen よ る 方 法 等 が 用 い ら れ て い る. そ して, テ ス ト の 評 価 点 の 誤 差 に つ い て は, 例 え ば, Gul. がテストによって得られた, ある個人の評価点からその人の真の評価点の合理的限界 (統計的信 頼限界ではない) を推定する公式を与えている. この小論では, 真のテスト評価点の代りに真の. 学力評価点, 合理的限界の代りに 信頼限界を取り上げ, 真の学力評価点とは何か, またこの評価 l iksen 等とは全く別の立場から, 推計学的にいささか考 え 点 を 如 何 に 推 定 す る か に つ い て, Gul て み た い と 思 う,. 学力評価等質空間9における推定 評価にあたっては, その目標に従って充分な 妥当性を有するテスト問題の集合が考 えられる. これを学力評価空間と呼ぶこととする, しかし, この評価空間は等質, または, 等質と考えられ るテスト問題に分解出来る場合と, そうではない場合と がある. 前者を, とくに, 学力評価 等質 空間, 後者を通常 空間と呼び, それぞれ, 9 , 刀 であらわす, こ る, 学力の推定について考える. 分解された, すべ ての等質なテスト問題を,. では, まず, 等質空間におけ. ・ .…. . . (均 (喜一ヱ,2,.…. ,7). とすれ ば, 身 は次の如くあらわされる.. “ 一室の1 ( 2 ,り ,… … … … ,の. さらに, 被験者 A の学力 S , 評価のために用意されたテスト問題 r は,.それぞれ, 9 の部分空間 s -1( , り 冴 … …, リー q g b( ,( 7 7 一{のれ の,“ - … …,の一 , で あ ら わ さ れ る, こ. に, . .… …. (栂 (メーヱ,2 , ,s). は被験者 ゑ によって正解される 身 の要素である, さ て, こ の と き,. P(sng)= r ,. P(snr)一斉カ.

(3) . 谷. 垣. 正. 道. と定め, かつ学力評価函数と して, (Snr)- CP(Snr) 鼠(Sn“)= CP〔Sng) 。 ,互 を導入すれば,. β (Sn材): C 点満点と しての真の学力評価点 1 風,(Sn2 ): C 点満点と しての学力テスト評価点. と 見 な す こ と が 出 来 る. 従 っ て, テ ス ト 問 題 r を, あ ら か じめ, 評 価 空 間 身 か ら, そ の 要 素 のr z. Z (ズ=1 ) を無作意に抽出して構成 しておけば, 学力評価点の標本 値と してのテスト評価 ,2 , … …,. 1 ) の得られる確率分布は, 言うまでもなく, 次によって与えられ る. 点 E(Sn7 1 ) s と γ-s が Z に く ら べ て, あ ま り 大 き く な い と き は, (. (以たりバリ. なる, 超幾何分布.. 2 1 s と γ-s と が Z にく らべて, 充分大きければ, t. ん の p槌 ng源 -p 御 gy- なる二項分布. 圏 Z が充分に大きければ ( ZP(Sng)≧5), 正規分布. ~( ヱーP(sng))) ( 7 るP(sn“} 九F (sn“) よ っ て, テ ス ト 問 題 r を “ から無作意に構成することにより, 以上の分布函数を用いて, 学力. 1 ) から, 真の学力点 E (Sn”) を, 必要な信頼度のとに, 区間推定するこ 点の標本値 E (Sn7 と が出来る.. 学力評価通常空間 互 における推定 学力評価空間を構成するテスト問題が, 必ずしも, 等質と見倣す ことの出来な い 場 合 を 考 え. る. こ の と き, こ れ ら の テ ス ト 問 題 を 冗 γ) で あ ら わ して, を (メキ1 ,… …, 〃 -1汀 , , 燭,… … …,オー と す る.. これらのすべての問題 僑 を被験者 A に (仮定的に) 課 してテストを行い, 得られるすべての. 評価点を,. ・ 2 互(ガ.) (Z‐ ‐ヱ , ,… … …,7). とすれば, これらの評価点は, その平均値,. 風(だ). ! &(馬)/r. . のまわりに正規分布をするものと見倣すことが出来る. -- 逆に言えを , 正規分布するように, &, ) を 決 定 す る. (# さ て, この と き, 上 の 平 均 値 互 (冗) をその被験者 A の真の学力 評価 - 点 E (Sn刀) と定義すれば, これは次のように推定される. す な わ ち, テ ス ト に 問 題 r を, 刀 から無作意に抽出 して構成 し, rー圭ぁも 汀rみ… … … #れ1 ,. 一 10 『.

(4) . 評価点の統計的信頼限界について とする. これを被験者 ゑ に与えて, 方 メーヱ も(ぁぢ ) ,( ,2 ,… … …,云) を求め, その平均値, む 風 (ガデ )蝋 !E (汀r )/ , . と不偏分散, が (ガr )- X i尻(物≠ む-ヱ) )一風 (ガリ ル( . i;1. に, Z 分布を用いて, 真の学力評価点,. &(Sn〃)一風( 冗 )-三 風(ガ )/ r , . を区間推定することが出来る. 〃 における層別化テスト 学力評価通常空間 刀 が, 〃1 ,… … …’〃れ , 〃2 ’… … … 等の層に, 層別化される場合を考える, こ れ は, 例 え ば,. 1 ) 単元別, に 〃 回のテストを行い, その結果を総合して学力を評価する 場合. ( 2 ) テ ス ト 問 題 ガg の難易に従って, 刀 を層化する場合. (. 等に見られる が, 刀 を構成する要素の個数を γ , 蕉 を構成する要素の個数を ” とすれば, , , r淋7 1+7 2+ … … … +r れ. で・, 力)‘. ″-ーオあ ゐ …,… …, , , ,“,1 燭 -ー力 z l ≠- , 燭2 ,… … … …,汀 (三一ヱ, 2, … … … … …,7 る). とあらわされる. そして, この空間 刀 における評価の構造は次の ようになる. すなわち, 1 ) 学力評価空間 ″ における被験者 ゑ の真の学力評価点を, Eり ( (Sn刀), 部分評価空間 互1 における真の学力評価点を, βも(Sn馬) で示せば, E (Sn/ 7)-1 を乱(Sn足)/ r . なる関係 が成立する ) の 分布 の 標 準 偏 差 を の で あ ら わ す も 2 ) こ > に, 刀f に お け る, βも廓“) (ゾ=1 γ ( ・ z .2 , … …, の と す る.. このとき, 層別化無作意抽出によって, 広ご から ご ・ 個の問題を抽出して, r ≠一 応 ル灯り 2… … … …,汀ザー (多‐ヱ, 2 .… … …,九) . , ….. - 11 」.

(5) . 垣. 谷. 正. 道. を構成 し, さらに, 1 ), に よ っ を 形 作 る. こ の よ う に す れ ば, こ の テ ス ト r によって得られる標本 評価点 E (Sn7. て得られる標本評価点 E (Sn ), れ によって得られる標本 評価点 Eり(Sn ro の 間 に は, ≠ )/ &(snr)=〆轟E(snrf . (汐一ね+ら 十 … … … + も). &(snr )た, )- ヱ &(灯りな g ー た泌1. 1 ) が被験者 ゑ の 刀 における真の学力評価点 β (Sn刀) の推定値と が成立 し, この β (sn7 な る. そ して, こ の と き の β.(Sn r) の 分 散 は,. 21 s一(ヱ/r). ′姦) Krr乙 )/@ -ヱ)Kぴ ー. . で与えられる. さらに, 広 において, 1つの問題をテス トする場合の所要経費, あるいは, 所要解答時間, ま たは, 所要採点時間を, 錆 であらわせば, その総所要数 C は, Cニカ c c C ユ l十乙 2 2+ … … … + もむ 7 る で 与 え ら れ, こ の C を一定に して, 分散 S を最小にする, あ ら………,た は, 上式と, . . ユ. / 1 cl. . . α 2 . ,/. 4も. . / ‐ 1 c%. . 物. か ら 求 め ら れ る. と く に, C・=C2= … … … … =C% ならば, 上式は, む 7 1 0I. ら ‐ 7 2 び2. ,.”, ・ ..”,, =,.・,. らも r ク る 0%. ま た, C.=C2… … … =Cれ か つ の=ぴ 2= … … … =のも な ら ば, ら. ら. . . ● .. 一 .”. . . , .. ら . と な る こ と は 言 うま で も な い.. ” における層別化テスト 学力評価等質空間, “ -1( ・…・… …・ り . ,リー , の2 ,. a -1のれ,( ・ ・…,の孝一 ひね ,…・ (メニヱ,2 み) ,… … … …,7 な る “ 個の層に層化されているとき, この各から, それぞれ, あ れ………, た 個の要素を抽出 一 12 一.

(6) . 評価点の統計的信頼限界について して, r .….のりぢd f=1のり, , のり,… …, r-i質 髭 …. ・…・ ・ ・… … 臨ま , , ・. を構成する, これを被験者 A に与えてテストを行い, ÷ * (sn2 )ーねた宅 雀 (宏一ヱ, 2,… … … …,九). が得られたとすれる , P(Snr)- X r .F(Sn鴛)/r .ご1. (r-r ,十 を + … … … … … + 傷). P(sng)- 1 r (sng〆 )/ r 多ニー. 1 の 推 定 値 と な る. そ して, P(Sn7 ) の 分散 は,. 2xra 2む) s=(ヱ/ r) zl(を一むり/@ -ヱ)ま(の/ ご で与 え ら れ る. 但 し, ぴ z は gI における P(のり) の分布の標準偏 差で, 充分大き な 鈴 に対し. て,. α′一P(sng) ”一P(sng)ま/を で与えられる, “ における応用例. 2 位数の加え算を応用例と して取上げる. このとき評価空間 “ は総数81 00題の2位数の加え. 算を要素と して構成される. いま, この評価空間から無 作意に要素をZ個 抽出して, テスト問題 r を作る. --実際には, 抽出するかわりに, 乱数表を使って 云 個の加え算を作ればよい -- . 1 これを被験者に与 えてテストを行い, そのうち た 個を正解したとする ならば, 互 (sn7 ) の信 頼区間とその区間の長さは次によって与えられる. こ に, C=100と す る. 1 ) ゐ / 3 のとき, (&(Snr) =33) ( 9 5 %. 信. 頼. 区. 間. 9 9 %. 区間の長さ. 信. 頼. 区. 10. 7 ハJ 65. 58. 4. 20. 1 2 ~ 講. 42. 8 ハ J 61. 30. 15 トJ 50. 35. 12 ハJ 55. 50. 18 ~ 44. 26. 15 (J 49. 100. 21 ハJ 40. 19. 19 (J 43. 一 13 一. ~ 74. 間. 区間の長さ 7 0 53 僻 緯 終.

(7) . 垣. 谷. 正. 道. 2 のとき, (&(Snr) ;50) 1 々=Z ( 2 / 74. 10. 19 ト J 81. 62. 13 トJ 87. 20. 27 ハJ 73. 46. 31 ( J 92. 61. 30. 31 ハJ 69. 38. 26 ^J 74. 48. 50. 36 ハJ 64. 28. 31 トJ 69. 38. 100. 40 ハJ 60. 20. 37 ^ J 63. 26. J 96. 70. r )= Z 3のとき, ぼり態n2 =67) 陽} た=2 / 10. 35 トJ 93. 58. 26. 20. 41 ^J 85. 44. 34 ハJ 89. 55. 30. 47 トJ 83. 36. 42 ト} 86. 44. ・. 50. 52 トJ 79. 27. 47 トJ 82. 35. 100. 57 トJ 76. 19. 54 (J 79. 25. 64. Z斌 sn の = ;80) ) をコ4% のとき, ( 柊 1 0. 44. J 97. 53. 35 ^J 99. 20. 56 トJ 94. 38. 49 トJ 96. 47. 30. 61. J 92. 31. 56 トJ 94. 38. 66. J 90. 24. 62 ^J 92. 30. 71 ハJ 87. 16. 68 (J 89. 21. 50 100. 刀 における応用例 算数における, ある種の女章題の一群を応用例と して取る. 女章題を等質の要素に分解するこ とは, 極めて困難である. 従って, この場合の一群の文章題は, 学力評価通常空間 刀 を形作る. いま, この刀から無作意抽出して,. r鯖1粥れ m冗 … … …,m 〆 , ,. を得, これを被験者 A に与 えて, ’ ) \ き(m7 50 t 度 \\ 数. 10 20 30. 弄 万 万. 60. 70. 65. 80. 75. 1. 2. イ ー. 2. 1. 4. 2. 4. ( z ”. 4. 2. 6. 3. 6. ^ 3. 6. 3. 1. 2. 2 3. 3通りの評価点 が得られたとする. これから, 次の平均, 不偏分散が 得られる, rの (snT) ;Eヱ ,(n. U2(mT ). 10. 70. 20. 70. 8,77 6.58. 30. 70. t. 90. 4.31. 従って, これに 去 分布を適用 して, 次の信頼区間が得られる. 一 14 一. U (mT ) ぞ ,. 2 ,961 2 ,565 2 ,076.

(8) . 評価点の統計的信頼限界について 9 5 %. 信. 頼. 区. 間. lo. 63 .31 (J 76 .69. 20. 64 .64 ハJ 75 .36. 30. 65 ー 74.26 .74 ハ. 9 9 %. 区間の長さ. 信. 13.38 10.72. 頼. 区. 間. 60.38 ハ J 79 .62 62,66 ハ ・ 77 .34 64 7 7 2 5 ト J .73 .. 8.51. 区間の長さ 19.24 14.68. 11 .46. “ における層別化テスト応用例 8100題 の 2位数の加え算からなる評価空間 9 を取る. いま, これを次の如く層別化する. “ : メニγ1十 “ +γ3+ “ 二8100 g・: 繰 り 上 り の な い 場 合. γ・=1980. ”2: 1 位 に の み 繰 り 上 り の あ る 場 合 93: 10位 に の み 繰 り 上 り の あ る 場 合. γ2=1260 γ3=2475. “4: 1 位, 10位 と も に 繰 り 上 り の あ る 場 合. γ鼻=2385. 00分の1で比例抽出し, これらから, 抽出率1. 云 1一20 , を=25 ’ ん=24 , ね=13 古= ×お デコ82 壱=.. なる個数のテスト問題をとる. これを被験者 ゑ に課 して, た =9 1ニー6 3ニー3, ね= , 』 鯖8 ,比. たー エ た ,=46 . を得たとする. すなわち, P(sn )-な/ムー16/20一○ 80 . P(sn )一あぬ ー 8/13一○ 62 . P(sn7 も)-島 /島一13/25一〇 52 ・ 3. P(sn7 1 )一馬 4た. 一 9/24一0.38. が得られたとすれば, X をP. . nr )/rー0 56 . 愛. が, P(sn厨) の推定値となる. そして, このときの分散は, S;0 000129 . ,. y に0 0114 .. 2 ) の信頼区間は, 従って, P(SnJ 95%. 538, 0 582) (0 , .. 99%. 531, 0 589) (0 . ,. よ っ て, β (Sn“) の信頼区間は, 5「 一1.

(9) . 垣▲. ,谷. 正. 道. 95%. 2) 8, 58 (53 . ,. 99%. 9) 1, 58 (53 . .. と 求 ま る. 献. 女. l iksen I Tes l t 1 ) Gul a s ey l950 (P,48‐58, P.74‐87) , H.; Theory of Ment . New York: john Wi 9 59 2) 谷垣正道 : 学力評価規準決定のための統計的考察, 〔1〕, 〔韮〕 北海道学芸大学紀要,1 ,. 【 16 「.

(10)

参照

関連したドキュメント

(1)自衛官に係る基本的考え方

環境影響評価の項目及び調査等の手法を選定するに当たっては、条例第 47

職員参加の下、提供するサービスについて 自己評価は各自で取り組んだあと 定期的かつ継続的に自己点検(自己評価)

項目 評価条件 最確条件 評価設定の考え方 運転員等操作時間に与える影響 評価項目パラメータに与える影響. 原子炉初期温度

検討対象は、 RCCV とする。比較する応答結果については、応力に与える影響を概略的 に評価するために適していると考えられる変位とする。

妥当性・信頼性のある実強度を設定するにあたって,①

通関業者全体の「窓口相談」に対する評価については、 「①相談までの待ち時間」を除く