臨地実習生の質の確保のための看護系大学共用試験(CBT)の開発的研究 ― CBT 試験問題の作成とそのモニター試験結果の統計的分析を中心にして―
9
0
0
全文
(2) 聖路加看護大学紀要 No.38 2012.3.. 〔要 旨〕 近年,看護系大学の急増と医療の高度化に伴い,卒業までに取得すべき看護実践能力の評価の重要性が増加し ている。その一環として,臨地実習に入る直前の段階までに看護学生が取得すべき知識・能力を正しく評価して おくことは看護実習の適正化のための急務の課題である。このような状況に鑑み,臨地実習以前に必要とされる 知識・能力の到達度を検証することを目的として,看護学領域から 1,260 の多肢選択式形式の設問を作成し,全 23 大学 730 名の学生に紙筆形式のモニター試験,および 8 大学 220 名の学生に対するコンピュータ試験(CBT: Computer Based Testing)を実施し,そのテスト結果を分析したところ,基礎医学,看護専門科目Ⅰ,Ⅱの合 計点のα信頼性係数は 0.9 以上の高い値となった。さらに CBT 試験と紙筆試験の比較によって,CBT 試験の全 国看護系大学共用試験としての有用性を確認した。. 〔キーワーズ〕 臨地実習,コンピュータ試験,信頼性係数(D 係数),級内相関係数. Ⅰ.はじめに 1992 年の「看護師等の人材確保の促進」に関する法律. 試験が医・歯学部における「共用試験」と呼ばれるも のである。そして修業年限が 6 年間となった薬学部も, 2009 年から薬学部における「共用試験」を開始した。. の制定以降,全国の看護系大学の量的拡大は目覚しく, 2011 年 4 月の時点で 194 校を数え,全看護師養成課程に 占める大学における看護師養成率は 20%に達している。. Ⅱ.研究方法. 一方,少子高齢社会の進展など今日の社会変化は著しく,. 1.研究目的. より安全で質の高い医療・看護が求められており,今日,. 全国の看護系大学で臨地実習生の質の確保のために利. 各大学がとり組んでいる看護教育の改革,充実の不断の. 用可能な共用試験(CBT)の開発を行い,将来における. 努力が全大学的規模で行われていく必要がある。. 本格的な導入を見据えた試験の実施のための諸課題を明. 2002 年にまとめられた「看護学教育のあり方に関する. らかにする。. 検討会報告(文部科学省)」においては, 「看護実践能力」 を向上させる最も有効な手段として「臨地実習」はきわ. 2.問題作成の手順. めて重要で,各大学は, 「臨地実習」に臨む学生について,. 現行の医・歯学部の「共用試験(CBT)」を参考に,. 当該実習の到達目標に沿った実習開始前の習得レベルの. 主に知識・能力(認知能力を含む)等を問う「共用試験. 確認,および実習終了後の到達レベルを評価するなど,. (CBT)」のための問題作成にあたり,看護学,および看. 大学としての評価システムを構築すべきであるというこ. 護学関連領域を大きく,①基礎医学領域 6 科目(生理学,. とが述べられている。しかし,現状では臨地実習前の学. 生化学,解剖学,病理学,微生物学,薬理学),②看護. 生のレディネスが必ずしも十分でないことも指摘されて. 専門科目Ⅰ 7 科目(公衆衛生学,基礎看護学,地域看護. おり,加えて,病院などの施設における学生の受け入れ. 学,在宅看護学,看護教育学,看護管理学,生命倫理学) ,. 体制の不十分さ,実習指導者の不足など,臨地実習にお. ③看護専門科目Ⅱ 5 科目(成人看護学,老年看護学,小. ける環境条件の整備を推進することが求められている。. 児看護学,母性看護学,精神看護学)の 3 領域 18 科目. ところで,2000 年 3 月に文部科学省高等教育局の諮問. に分類し,本研究の分担者,研究協力者にテスト項目は. 機関として設置された「医学・歯学のあり方に関する調. 4 肢,または 5 肢の多肢選択方式で,臨地実習を受ける. 査研究者協力会議」は,2001 年 3 月に「21 世紀におけ. 3 年生のうちほぼ 70%の正答を得るような問題の作題を. る医学・歯学教育の改善方策について−学部教育の再構. 依頼した。そして,当該領域の専門家によって作成され. 築のために−」をまとめ,医学・歯学教育のモデル・コ. た問題は他領域の専門家によって問題の適切性,正答が. ア・カリキュラムを提示した。そしてそれに基づいて,. 一通りに定まるかについて入念にチェックされた。なお,. 臨床実習以前の学生の適切な評価システムの構築のため. 上記 18 科目のうち,老年看護学,看護管理学,生命倫理学,. の大学間「共用試験」システムへの参加の意向確認と試. 小児看護学,母性看護学,および基礎看護学に関する出. 験内容,実施方法について検討され,その結果,臨床. 題経緯とその結果については,文献 1)∼ 5)に述べてある。. 実習に必要な知識・能力を測る CBT(Computer Based Testing)と客観的構造化臨床試験(OSCE)が 2005 年. 3.データ収集の方法. 12 月から行われることとなった。なお,この CBT と. 作成された問題はなるべく多数の項目についての情報. OSCE を含めた臨床実習のためのレディネスを測定する. が必要であるが,同一被験者に解答させることは時間的.
(3) 柳井他:臨地実習生の質の確保のための看護系大学共用試験(CBT)の開発的研究 . に無理が生じるため,看護専門科目Ⅰ,看護専門科目Ⅱ. (3)問題を解くのに必要とされる能力(θ、平均 0,分. のそれぞれについては,160 問からなる 3 つのセット(計. 散 1 を仮定)を想定し,θの関数として,それぞれの. 3 × 160 × 2 = 960 問)を精選し,研究分担者が所属す. 設問 xj に正答する条件付確率を,Pj(xj/ θ ) と表現する。. る大学のうち,実施に関して承諾の得られた 23 大学 730. この関数を規定する項目の母数と被験者の能力θを推定. 名の大学生を対象として,モニター試験を実施した。さ. する。Pj(xj/ θ ) としては,j 番目の項目母数を,αj(識. らにこの 23 大学を設置形態(国立,公立,私立),規模,. 別力),bj(困難度)によって定義すれば,被験者 i が項. 地域性を考慮して 3 グル―プに分類した。分類結果は,. 目 xj に正答する確率(Pij= 1)は,. グループ 1(9 大学,266 名),グループ 2(7 大学,220. 3L M D M E M T L
(4) H[S D M T L E M
(5)
(6) 㸦 㸧 (3). 名) ,グループ 3(7 大学,244 名)であり,それぞれの. によって表される。上記関数によって,各設問の識別力. グループ別に一つずつのセットの問題を解答させた。た. (Item αj と困難度 bj を推定する方法が項目反応理論 9). だし,これらのグループの問題の難易度,および測定内. Response Theory,IRT と 略 記 ) と 呼 ば れ る も の で,. 容はほぼ等しくなるように配慮し,これらのグループ間. 1960 年代に Lord & Novick8) によって提唱され,1980. の学力差の有無を検証するために,基礎医学問題は 3 グ. 年代以降に実用化されるようになったものである。. ループ共通とした。. 項目反応理論の標準的ソフトウエア BILOG の適用に. この結果に基づき,作成された設問の識別力・困難度. より,紙筆試験によるモニター調査データの結果を 3 グ. を推定し,コンピュータによる「看護系大学共用試験. ループ別に解析し,上記未知母数であるαj(識別力),bj. (CBT) 」を開発し,前述の 23 大学のうち,実施するた. (困難度)を推定する(ただし、BILOG の場合は,αj は. めの機器,施設が整っている大学で実施に関する承諾が 得られた 8 校の看護系大学の 220 名の学生に対してパソ. 非負と仮定される)。 (4)全部で 3 領域 240 項目からなるパソコンによる CBT. コンを用いた「共用試験(CBT)」を実施した。試験問. 試験を 8 大学 220 名の学生に実施し,その結果を分析し,. 題については,聖路加看護大学に設置したサーバーを通. 紙筆試験結果と比較した。さらに,紙筆試験と CBT 試. して,各大学に送信された。なお,今回の研究における. 験の結果を科目別に分析した。. 「共用試験(CBT) 」はコンピュータによる多肢選択形式 のテストを中心とした知識試験(CBT)の部分開発に限 定し,実技試験(OSCE)については今後の課題とする。. Ⅲ.結 果. 倫理的配慮として,モニター試験,CBT 試験への参. 1.基本属性. 加は 23 大学の学生の自由意思に基づき行った。なお,. 3 グループ間の受験者数を設置形態別に表 1 に示した。. 本研究は研究倫理審査委員会において承認後(承認番. グループ 3 に公立大学,グループ 1 に私立大学が多. 号 :10-008)に実施した。. い傾向がみられた(自由度 4,カイ二乗値= 69.05,p = 0.001)。. 4.分析方法 (1)紙筆試験の調査結果は,グループ 1,2,3 別に,基. 表1 モニター試験(紙筆検査)における受験者構成. 礎医学,看護専門科目Ⅰ,看護専門科目Ⅱの記述統計(平. 大学設置形態 合 計. 均値, 標準偏差, 相関係数)及び D 信頼性係数をもとめる。 (2)設問 1 つあたりの信頼性係数である級内相関係数 6,7). 国立大学. 公立大学. 私立大学. グループ1 2 校(43 名)2 校(26 名)5 校(197 名)9 校(266 名). をもとめる。さら. グループ2 2 校(45 名)2 校(58 名)3 校(117 名)7 校(220 名). に看護専門科目Ⅰ,Ⅱに含まれる科目に,平行とみられ. グループ3 1 校(33 名)3 校(98 名)3 校(113 名)7 校(244 名). (intraclass correlation coefficient). る 100 の設問が含まれているとみなし,そのテストの合. 合 計. 5 校(121 名)7 校(182 名)11 校(427 名)23 校(730 名). 計点の信頼性係数を求める。級内相関係数(U,)は 1 項目,. D 係数はテスト全体の信頼性係数ということになり,テ. 2.領域別試験成績. スト全体の項目数が S のとき,D と r I の間には次の(1). 表 2 に,3 領域(基礎医学,看護専門科目I,看護. 式および(2)式が成立する。. 専門科目Ⅱの)別の試験成績の平均値を示した。基礎. U,. D S S
(7) D
(8) 㸦 㸧 , !D (1). SU, S
(9) U,
(10) 㸦 㸧 (2). 医学は,3 グループ別に 74.6,72.4,72.7(全体平均は. (2)式はp個の平行となる項目の項目間相関係数が一定. 73.29),平均正答率は 46.6%,45.3%,45.5%,看護専門. 値 U = U, に等しいときの合計点の信頼性係数を示すもの. 科 目 Ⅰ は,3 グ ル ー プ 別 に 104.7,97.3,101.2, 平 均 正. でスピアマンブラウン(Spearman Brown)の公式と呼. 答 率 は 65.4%,60.8%,63.2% で あ っ た。 一 方, 看 護 専. ばれる。 (2)式において,U, = 0.1 のとき,D = S ST
(11). 門科目Ⅱの平均値は 90.5,88.9,91.6,正答率は 56.5%,. となり,D は S の単調増加関数となる。. 56.2%,57.2% であった。したがって,基礎医学の困難度.
(12) 聖路加看護大学紀要 No.38 2012.3. 表2 3 領域試験科目成績のグループ別基本統計量 大 学 グループ. グループ1. グループ2. グループ3. 科目名. 人数. 平均値(点). 標準偏差. 最高点. 最低点. 基礎医学. 266. 74.56. 11.60. 111. 31. 看護専門科目Ⅰ. 266. 104.65. 14.07. 130. 28. 看護専門科目Ⅱ. 266. 90.54. 12.67. 120. 28. (I+Ⅱ)合計点. 266. 195.19. 24.32. 245. 56. 基礎医学. 220. 72.40. 12.41. 114. 40. 看護専門科目Ⅰ. 220. 97.32(103.20). 12.16(14.35). 122. 41. 看護専門科目Ⅱ. 220. 88.92(89.04). 13.41(13.01). 116. 41. (I+Ⅱ)合計点. 220. 186.25(192.24). 23.78. 238. 82. 10.85. 基礎医学. 244. 72.70. 看護専門科目Ⅰ. 244. 101.16(103.42) 12.80(13.78). 107. 44. 125. 48. 看護専門科目Ⅱ. 244. 91.62(89.22). 11.57(12.31). 117. 39. ( I+Ⅱ ) 合計点. 244. 192.77(192.64). 22.08. 235. 97. 表3 3 領域試験科目間相関係数と偏相関係数 グループ 1 基礎医学. 看護専門科目Ⅰ. 看護専門科目Ⅱ. (I+Ⅱ)合計点. 全体合計点. 0.522(0.160). 0.659(0.472). 0.645. 0.827. 看護専門科目Ⅰ. 0.654(0.483). 看護専門科目Ⅱ. 0.919. 0.860. 0.899. 0.894. 総合点(Ⅰ+Ⅱ) グループ 2 基礎医学. 0.963 看護専門科目Ⅰ. 看護専門科目Ⅱ. (I+Ⅱ)合計点. 全体合計点. 0.606(0.261). 0.644(0.372). 0.673. 0.851. 0.729(0.556). 0.922. 0.881. 0.937. 0.906. 看護専門科目Ⅰ 看護専門科目Ⅱ 総合点(Ⅰ+Ⅱ) グループ 3 基礎医学. 0.962 看護専門科目Ⅰ. 看護専門科目Ⅱ. (I+Ⅱ)合計点. 全体合計点. 0.539(0.242). 0.613(0.414). 0.643. 0.824. 0.640(0.466). 0.915. 0.864. 0.895. 0.876. 看護専門科目Ⅰ 看護専門科学Ⅱ 総合点(Ⅰ+Ⅱ). 0.960. 表4 グループ別 3 領域 18 科目の主成分分析の結果 グループ. 第 1 主成分固 有 値. 第 1 主成分寄 与 率. 第 2 主成分固 有 値. 第 1,2 主成分累積寄与率. 第 1 主成分負荷量最大値. グループ1. 5.981. 33.27%. 1.863. 44.62%. 0.723. 第 1 主成分負荷量最小値 0.291. グループ2. 6.314. 35.08%. 1.499. 43.40%. 0.734. 0.428. グループ3. 5.565. 30.92%. 1.691. 40.31%. 0.646. 0.348. が最も高く,看護専門科目Iが最も低く,看護専門科目. 合計点間の相関係数を示した。全体合計点との相関係数. Ⅱの困難度は,その中間にあることが示された。. が最も高かったのは,すべてのグループにおいて看護専. 看護専門科目Ⅰ,およびⅡについて,グループ 2,3. 門科目Ⅱであり,続いて看護専門科目I,基礎医学の順. の値をグループ 1 に等化(equating)して得られた平均. であった。また,看護専門科目Iと看護専門科目Ⅱの合. 値 ( 修正平均値 ) を表2の括弧( )内に示した(等化. 計点(Ⅰ+Ⅱ)と基礎医学の合計点の間にはグループ別. の方法は Tucker の回帰法 10) による)。等化によって,. にみると,0.5 ∼ 0.6 の相関がみられ,看護専門科目Iと. 基礎医学の共通問題では,グループ 1 の平均値がグルー. 看護専門科目Ⅱのうちでは,看護専門科目Ⅱのほうが看. プ 2,3 に比べ高かったため,看護専門科目Ⅰ,Ⅱの修. 護専門科目Iより,基礎医学と強い相関がみられた。グ. 正平均値は,グループ 1 の平均値に近い値となった。. ループ別に,基礎医学,看護専門科目Ⅰ,看護専門科目 Ⅱの任意の 2 つの科目から他の 1 つの科目の影響を取り. 3.領域別試験成績の相関係数,偏相関係数. 除いた偏相関係数 (partial correlation coefficient) を求め,. 表 3 に 3 グループ別に,基礎医学,看護専門科目Ⅰ,. その結果をグループごとに表 3 の括弧( )内に示した。. 看護専門科目Ⅱ,看護専門科目(Ⅰ+Ⅱ)合計点,全体. グループ 1 においては,看護専門科目Ⅰと看護専門科.
(13) 柳井他:臨地実習生の質の確保のための看護系大学共用試験(CBT)の開発的研究 . 目Ⅱから基礎医学の影響を除去した偏相関係数は 0.160,. 専門科目Ⅱに比べやや低めとなった。看護専門科目Ⅰと. グループ 2,3 においては 0.261,0.242 とやや小さめの. Ⅱの合計点の信頼性係数は,グループ別に,0.908,0.900,. 値が得られた。このことは,基礎医学の成績は,看護専. 0.890 となった。さらに、3 教科 18 目全体(480 問)の. 門科目Ⅰおよび看護専門科目Ⅱの相関に与える影響が強. 合計点の信頼性係数は 0.921,0.922,0.907 ときわめて高. いことを示すものである。. い値になった。次に各科目別に信頼性係数の値を求めそ の結果を表 6 に示した。. 4.18 の教科科目間の主成分分析 18 の科目成績についてグループごとに主成分分析を. 表6 基礎医学科目別 信頼性係数(α係数),級内相関係数, 項目数を 100 にしたときの信頼性係数. 行ったところ,表 4 の結果が得られた。3 グループとも. 信頼性係数 1*. 級内相関係数. 信頼性係数 2**. 第 1 主成分の固有値および寄与率もともに大きくすべて. 生理学. 0.324. 0.016. 0.619. の科目の主成分負荷量がプラス 0.3 を超えていた。なお,. 生化学. 0.347. 0.021. 0.682. グループ 1 の場合,主成分負荷量の最も大きかった科目. 解剖学. 0.449. 0.032. 0.767. は,小児看護,つづいて基礎看護学,看護教育学,老年. 病理学. 0.382. 0.020. 0.671. 看護学で,第 2 成分で負荷量の高かった科目は生命倫理. 微生物学. 0.361. 0.022. 0.692. 薬理学. 0.577. 0.052. 0.845. 学,看護管理学であった。. 信頼性係数 1*:α信頼性係数 信頼性係数 2**:項目数 100 にしたときのα信頼性係数. 5.信頼性係数と級内相関係数による分析 3 つのグループ別に計算された看護専門科目I(計. 最も高い信頼性係数を示した科目は,基礎医学 6 科目. 160 問)の信頼性係数を表 5 に示した。それぞれ,0.871,. の中では薬理学 0.577,続いて解剖学が 0.449 であった。. 0.822,0.843 であった。同様に,表 5 から看護専門科目. 看護専門科目I・Ⅱの中で,生命倫理学の信頼性係数は. Ⅱ (160 問)の信頼性係数は,それぞれ,0.820,0.834,0.792. 突出して高く,その値はグループ別に,0.944,0.812,0.900. であった。一方,基礎医学(計 160 問 ) は 3 グループ共. であった。看護専門科目Ⅰの中で,生命倫理学に次い. 通の問題であるが,3 グループ別に信頼性係数を求める. で信頼性の高かった科目は看護管理学でその値は 0.784,. と,0.769,0.799,0.736 と看護専門科目Ⅰ,および看護. 0.753,0.641,続いて,看護専門科目Ⅱのうちで信頼性 の高かった科目は母性看護学(0.645,0.660,0.565) ,精 神看護学(0.637,0.545,0.589),信頼性の低い科目は成. 表5 試験成績の信頼性係数(α係数). 基礎医学. グループ 1. グループ 2. グループ 3. 人看護学(0.414,0.416,0.407)であった。表 7 に示し. 0.769. 0.799. 0.736. たように,級内相関係数は,生命倫理学,看護管理学を. 看護専門科目Ⅰ. 0.871. 0.822. 0.843. 除く 10 科目のすべてにおいて,0.1 未満と小さめの値と. 看護専門科目Ⅱ. 0.820. 0.834. 0.792. なった。特に,看護専門科目Ⅰの公衆衛生学,基礎看護学、. ( I+Ⅱ ) 合計点. 0.908. 0.900. 0.890. 全体合計点. 0.921. 0.922. 0.907. 地域看護学の級内相関係数は低かった。一方,看護専門 科目Ⅱにおいては,成人看護学の級内相関係数が最も低. 表7 科目別信頼性係数(α係数)級内相関係数、項目数を 100 にしたときの信頼性係数 グループ1 科目名. 公衆衛生学. グループ2. グループ3. 設問数. 信頼性 係数 1*. 級内相 関係数. 信頼性 係数 2**. 信頼性 係数 1*. 級内相関 係数. 信頼性 係数 2**. 信頼性 係数 1*. 級内相関 係数. 信頼性 係数 2**. 20. 0.204. 0.013. 0.569. 0.350. 0.026. 0.727. 0.202. 0.013. 0.568. 基礎看護学. 35. 0.513. 0.029. 0.749. 0.475. 0.025. 0.719. 0.396. 0.018. 0.647. 地域看護学. 30. 0.510. 0.034. 0.778. 0.298. 0.014. 0.587. 0.367. 0.019. 0.659. 在宅看護学. 25. 0.567. 0.050. 0.840. 0.479. 0.035. 0.784. 0.581. 0.053. 0.848. 看護教育学. 10. 0.480. 0.085. 0.902. 0.449. 0.075. 0.890. 0.432. 0.071. 0.884. 看護管理学. 20. 0.784. 0.154. 0.948. 0.753. 0.132. 0.938. 0.641. 0.082. 0.893. 生命倫理学. 20. 0.944. 0.450. 0.988. 0.812. 0.178. 0.956. 0.900. 0.311. 0.978. 成人看護学. 35. 0.414. 0.020. 0.677. 0.416. 0.020. 0.677. 0.407. 0.019. 0.659. 老年看護学. 30. 0.547. 0.039. 0.802. 0.589. 0.046. 0.826. 0.537. 0.037. 0.793. 小児看護学. 30. 0.544. 0.038. 0.797. 0.578. 0.044. 0.821. 0.458. 0.028. 0.742. 母性看護学. 30. 0.645. 0.057. 0.821. 0.660. 0.061. 0.866. 0.565. 0.041. 0.810. 精神看護学. 35. 0.637. 0.040. 0.834. 0.545. 0.033. 0.733. 0.589. 0.099. 0.916. * 信頼性係数1:α信頼性係数,** 信頼性係数2:項目数 100 にしたときのα信頼性係数.
(14) 聖路加看護大学紀要 No.38 2012.3. く,続いて老年看護学,小児看護学の値も低めであった。 次に,各科目の誤差成分のみが異なる複数個の平行テ ストの項目数を 100 とした場合に到達可能な信頼性係数 の値を(2)式で示したスピアマンブラウンの公式を用 いて計算し,表7に信頼性係数 2 として示した。 級内相関係数の高い生命倫理学は 100 個の平行テスト を加算することによって D 信頼性係数は 0.90 台に到達し た。一方,看護専門科目Ⅱのなかで,級内相関係数で 0.5 ∼ 0.6 台の D 信頼性係数であった老年看護学,小児看護 学,母性看護学,精神看護学は 100 の平行テストを加算 することにより,D 係数は 0.75 台から 0.8 台に増加した。 以上,本研究において作成され,モニター調査として 実施された,基礎医学 160 問,看護専門科目Ⅰ(3 グルー プ別)160 問,看護専門科目Ⅱ 160 問(3 グループ別 160. . 図1− 1 看護専門科目Ⅰ (B1,B2,B3) とⅡ (C1,C2,C3) の 識別度(グループ別). 問),計 480 の設問の合計点の信頼性係数は 0.9 を超えた。 しかし,科目別の合計点の信頼性係数は,概して低くなっ た。 6. 項目反応理論による看護専門科目Ⅰ,Ⅱの分析結果 項 目 反 応 理 論 9) に お け る 標 準 的 プ ロ グ ラ ム で あ る BILOG によって,上記未知母数であるαj ( 識別力 ),bj(困 難度)を推定した(ただし、BILOG の場合は,αj は非 負と仮定される)。 図 1-1 に,看護専門科目ⅠとⅡに関するそれぞれ 160 項目についてのグループ別正答率の箱ひげ図を示した。 看護専門科目Ⅰの正答率の中央値は 70%強,看護専門科 目Ⅱの正答率の中央値は 60% 弱となっている。つづいて 図 1-2 に項目反応理論によって計算された困難度(難易 度)の箱ひげ図を示した。中央値はいずれのグループに おいても困難度の低い方向に偏っているが,正答率に比 べ,看護専門科目ⅠとⅡの中央値の差が小さくなってい. . 図1− 2 看護専門科目Ⅰ (B1,B2,B3) とⅡ (C1,C2,C3) の 困難度(グループ別). る。図 1-3 には,識別力の値を箱ひげ図で示した。看護 専門科目Ⅰの識別力の平均値は 0.792,0.582,0.662,看 護専門科目Ⅱの識別力の平均値は 0.505,0.523,0.507 と 看護専門科目Ⅰの平均値がⅡに比べ高くなっているが, 看護専門科目Ⅰにおいては,特にグループ 1 と 3 におい て,識別力の値が 2 を超える項目が多く,そのため,中 央値は看護専門科目ⅠとⅡでほぼ同一となった。 このようにして計算された識別力と困難度を用い,式 (3)により項目特性曲線を描いた(ページ数の制約によ り,グループ 1 の結果のみ図示した)。図 2-1,図 2-2 は看護専門科目Ⅰの 160 問の項目特性曲線,図 3-1,図 3-2 はグループ1の看護専門科目Ⅱの 160 問の項目特性 曲線を描いたものである。 いずれのグループにおいても,看護専門科目の 140 番 ∼ 160 番の項目特性曲線は識別力が高く,困難度が低い という傾向がみられた。. 図1− 3 看護専門科目Ⅰ (B1,B2,B3) とⅡ (C1,C2,C3) の 正答率(グループ別).
(15) 柳井他:臨地実習生の質の確保のための看護系大学共用試験(CBT)の開発的研究 0DWUL[3ORWRI,WHP&KDUDFWHULVWLF&XUYHV. 0DWUL[3ORWRI,WHP&KDUDFWHULVWLF&XUYHV . . . . . . . . . . . . . . . . . . . . 図2ー1 項目特性曲線(看護専門科目Ⅰ,問 1 ∼問 100). 図3ー1 項目特性曲線(看護専門科目Ⅱ,問1∼問 100). 0DWUL[3ORWRI,WHP&KDUDFWHULVWLF&XUYHV 0DWUL[3ORWRI,WHP&KDUDFWHULVWLF&XUYHV . . . . . . . . 図2ー2 項目特性曲線(看護専門科目Ⅰ,問 101 ∼問 160). 図3ー2 項目特性曲線(看護専門科目Ⅱ,問 101 ∼問 160). 7. パソコンを使用した CBT 試験の分析結果 紙筆形式モニター試験に比べ,コンピュータによる. IV. 考察. CBT 試験問題の困難度は低くなっている傾向がみられ た。実際に, 試験問題数を 80 とした CBT 試験の基礎医学,. 1.合計点の信頼性係数. 看護専門科目Ⅰ,Ⅱの平均値はそれぞれ 43.03,58.90,. 信頼性係数とは,合計点の全分散に対する真の得点の. 50.91 となり,この値を 2 倍した 86.0,117.8,102.8 は,. 分散の割合を示すものである。一方, (1 −信頼性)によっ. 表 2 で示したモニター試験(グループ 1)の平均値(74.6,. て定義される非信頼性係数(unreliability)11) は全分散. 104.6, 90.5)を上回っていた。. に対する誤差分散の割合に相当する。したがって,信頼. 上記の結果から,個人ごとに選択される問題が異なる. 性係数が 0.9 であれば,非信頼性係数は 0.1 となり,誤. パソコンによる CBT モニター試験(2010 年 10 月実施). 差分散の全分散に対する割合は 10%と低めの値となる。. の結果と,紙筆試験によるモニター試験(2009 年 9 ∼. しかし,非信頼性係数が 0.4,0.5,0.6 と増加するにつれ,. 10 月実施)の結果(項目別解答率,項目別年度間相関係. 誤差分散の全分散に対する割合が 40%,50%,60%と増. 数)の間に著しい差はみられなかった。しかし,科目別. 加するので,得られたテスト得点の推定値の信頼区間は. にみると,紙筆試験に比べ,CBT 試験の方が正答率が. 広くなる。. やや高くなる傾向がみられた。例えば,CBT になると. 看護専門科目ⅠとⅡの合計点 ( Ⅰ+Ⅱ ) の信頼性係数. 正解率が高まる科目には,生命倫理学,公衆衛生学,看. は,グループ別に,0.908,0.900,0.890 となった。さら. 護管理学,薬理学,成人看護学,老年看護学,小児看護. に,3 教科 18 科目全体(480 問)の合計点の信頼性係数. 学があり,正答率に差がみられない科目は生化学,解剖. は 0.921,0.922,0.907 ときわめて高く,十分に実用に耐. 学,生理学,母性看護学,基礎看護学であった。. えうるものであることが判明した。.
(16) 聖路加看護大学紀要 No.38 2012.3. 2. テストの信頼性と内容妥当性をめぐって. 験 TOEFEL で実施されているようなパソコンによる適. 基礎医学 160 問の合計点の信頼性係数は 0.70 台,看護. 応型(Adaptive)試験が開発可能となる。2005 年にわ. 専門科目Ⅰ,Ⅱ 160 問合計点の信頼性係数は 0.80 台であっ. が国で開発された医学系共用試験には項目反応理論が適. たので,これらの 3 領域のうち,1 領域のみのテストを. 用されている 13)が,わが国の看護学の分野においては,. 用いることは信頼性の観点から推奨されない。実際,各. これまで項目反応理論を用いた分析結果は報告されてな. 領域の科目別の信頼性係数は,看護管理学,生命倫理学. い。今後,看護系共用試験の開発に際し,必要となる項. を除くと 0.4 ∼ 0.6 というやや低めの値が得られた。各. 目バンクの設計には項目反応理論の利用が必要不可欠と. 科目の信頼性を高めるには,各項目の主成分分析により,. なることを強調しておく。. 一次元性を確認する必要がある。本研究において,主成 分分析を行うと,多くの科目の主成分寄与率は 10%以 下となった。また,主成分分析によって得られた第 1 主. Ⅴ.結語. 成分負荷量はいくつかの項目でマイナスの負荷量が得ら. 本研究によって 3 領域[基礎医学(160 問),看護専. れ,信頼性係数を低める働きをしていることになる。. 門科目Ⅰ(480 問,160 問×3セット),看護専門科目Ⅱ. しかし,テストの測定理論の立場からは,信頼性をあ. (480 問,160 問× 3 セット)]計 1,120 の設問を作成し,. げることにより,テスト内容の幅を狭めいわゆる内容妥. それらを 3 つのグループに分け 23 大学 730 名の学生に. 当性を低めるという通信理論の言葉で帯域幅と忠実度の. 紙質検査によるモニター調査を実施した。さらにそのう. ジレンマ. 12). に陥る危険性がある。モニター調査のグルー. ち 240 問を選んで 8 大学 220 名にパソコンによる CBT. プ 1 のデータに含まれる成人看護の 35 項目について主. 試験を実施した。その主要結果は次の通りであった。. 成分分析すると,第 1,2,3 の固有値は 2.153,1.743,. ①基礎医学,看護専門科目Ⅰ,Ⅱの計 480 問を合計得点. 1.654 となり,3 因子が推定された。この結果をプロマッ. の D 信頼性係数は,3 つのグループのそれぞれにおい. クス回転したところ,第 1 因子:肝炎関連,第 2 因子:. て 0.921,0.922,0.907 と高い値が得られた。なお,こ. SLE,メニエール病患者および糖尿病入院患者の生活指. れらの合計点には,看護専門科目Ⅰの方が看護専門科. 導など,第 3 因子:透析患者の合併症,血糖値・インシュ. 目Ⅱに比べ強い影響を与えていた。. リン,検査全般に関する記述,と 3 つの異なる因子が抽. ②基礎医学,看護専門科目Ⅰ,看護専門科目Ⅱの各科目. 出された。成人看護学は,7 ∼ 8 冊のテキストからなる. の合計点の信頼性係数は 0.7 ∼ 0.8 と全体の合計点に. 広範囲な分野であるため,多因子化したものと推測され. 比べるとやや低めになる。さらに,科目別に信頼性係. る。このように,内容的に 3 つの異なる因子に包含され. 数を求めると,生命倫理学が 0.8 ∼ 0.9 で高めの信頼. る成人看護の設問を 1 つの科目にまとめることの適切性. 性係数が示されたが,他の科目の信頼性係数は 0.2 ∼ 0.7. については,今後検討の余地があろう。同様の傾向は,. と低い値を示した。. 看護専門科目Ⅱにおいて信頼性の低い小児看護学や老年. ③ D 信頼性係数は科目に含まれる設問数の増加に伴い増. 看護学についてもあてはまる。しかし,看護専門科目Ⅰ. 加する傾向がみられるので,1 問あたりの信頼性とみ. に含まれる生命倫理学,看護管理学については,D 信頼. なされる級内相関係数をもとめ,テスト全体が,十分. 性係数,および主成分分析によって得られる第1主成分. に大きな信頼性係数を得るために必要となる項目数を. の寄与率が高く,1 次元性が強い科目といえる。. スピアマンブラウンの式を用いて検討した。 ④基礎医学,看護専門科目Ⅰ,Ⅱの各項目について,項. 3. 項目反応理論による項目選択の有効性. 目反応理論による分析を BILOG を用いて行った。そ. II. 研究方法の 4. 分析方法で示した(2)式によって描. の結果,看護専門科目ⅠおよびⅡに含まれる各項目の. かれる項目特性曲線(図 2,3)が右よりの設問ほど困. 識別力の中央値は 0.5 程度であったが,看護専門科目. 難度が高く,また,曲線の勾配が大きな項目ほど,識別. ⅠにはⅡに比べ識別力が高い項目が含まれることがわ. 力が高い項目といわれる。さらに,設問全体の情報量曲. かった。さらに,項目特性曲線の図から,看護専門科. 線を求めることにより,与えられた項目がどの程度の能. 目Ⅰの問題番号 141 から 160(主に,生命倫理学,看. 力群の被験者をより識別するかについての情報を得るこ. 護管理学の設問)の項目は,識別力が高く困難度が低. とができる。頁数の制約により本稿で情報量曲線の記述. いことが読み取れる。. は省いたが,看護専門科目Ⅰ,Ⅱの各項目は,比較的低. ⑤各科目から困難度がほぼ等しくなるようなセットを作. い能力群の被験者を識別し,基礎医学は,能力の低い群. 成しパソコンによる CBT 試験を実施したところ,一. から高い群にわたって広い能力層を識別する問題が含ま. 見不公平にみえる CBT 試験と紙筆試験の成績に関し. れていた。. ては,著しい差がみられないことが確認されたが,そ. こういう結果を用いることによって,米国の語学試. の詳細についての検討は今後の課題としたい。.
(17) 柳井他:臨地実習生の質の確保のための看護系大学共用試験(CBT)の開発的研究 . ⑥本研究で開発した CBT 試験が全国の看護系大学で. 験問題の開発,柳井晴夫編:平成 20 ∼ 22 年度「臨. a CBT 試験問題の作成 利用されるようになるには,○. 地実習生の質の確保のための看護系大学共用試験. b CBT 試験の妥当性および信頼性に関するさら 法,○. (CBT)の開発的研究」科学研究費基盤研究 A 総合. c CBT 試験の各大学のカ なる情報の蓄積,および,○. リキュラムにおける導入法,についての検討が急務の 課題である。. 報告書.107―109. 4)片岡弥恵子,森明子. (2011).臨地実習前看護共用 試験問題−母性看護−に関する出題の経緯とその結 果,110―111. 柳 井 晴 夫 編: 平 成 20 ∼ 22 年 度「 臨. 本稿は平成 20 年 4 月−平成 22 年度科学研究費補助金. 地実習生の質の確保のための看護系大学共用試験. の援助をうけた基盤研究 A「臨地実習生の質の確保のた. (CBT)の開発的研究」科学研究費基盤研究 A 総合. めの看護系大学共用試験(CBT)開発研究」の研究成果. 報告書.91―94.. の一部である。ここに,研究分担者と連携研究者を加え. 5)安ケ平伸江,大久保暢子,小山眞理子,志自岐康. て 32 名(平成 20 年度),57 名(平成 21 年度),56 名(平. 子. (2011).臨地実習前看護系共用試験問題―基礎. 成 22 年度)の共同研究者の先生方に,限りない感謝の. 看護領域―の開発,柳井晴夫編:平成 20 ∼ 22 年度. 意を表する。. 「臨地実習生の質の確保のための看護系大学共用試験. なお,本稿の執筆者の役割は以下の通りである。. (CBT)の開発的研究」科学研究費基盤研究 A 総合. (1)執筆(柳井晴夫),(2)モニター試験問題の作成,. 報告書.91―94.. 老年看護学(亀井智子),在宅看護学(亀井智子),看護 教育学(松谷美和子),看護管理学(奥裕美,井部俊子, 菅田勝也) ,地域看護学(麻原きよみ),小児看護学(及 川郁子) ,基礎看護学(大久保暢子) ,母性看護学(片岡 弥恵子,森明子) ,精神保健看護学(萱間真美,島津明人), 生命倫理学(鶴若麻里,吉田千文),成人看護学(林直子), 公衆衛生学(西川浩昭,佐伯圭一郎),薬理学(小口江. 6)Shrout P.E.,Fleiss,JL.(1979).Intraclass Correlations. Uses in assessing rater reliability. Psychological Bulletin, 86, 420―428. 7)繫桝算男,柳井晴夫,森敏昭. (2008). Q110:信頼 性係数と級内相関係数.Q & A で知る統計データ解析 (第 2 版). 東京 : サイエンス社 , 2008, 222―224. 8)Lord, M. & Novick, M.(1968).Statistical Theories. 美子) , (3)データ分析(伊藤圭,佐伯圭一郎,西川浩昭,. of Mental Test, Reading MA: Addison & Wesley: 1―. 柳井晴夫). 576. 9)村木英治. (2011).シリーズ行動計量の科学 8 項目. 引用文献. 反応理論.日本行動計量学会.東京 : 朝倉書店 , 1―. 1)亀井智子.(2011).老年看護に関する出題の経緯と. 142.. その結果,柳井晴夫編:平成 20 ∼ 22 年度「臨地実習. 10)前川眞一.(1999).第Ⅱ部 3.得点調整の方法.. 生の質の確保のための看護系大学共用試験(CBT)の. 柳井晴夫,前川眞一.大学入試データの解析―理論と. 開発的研究」科学研究費基盤研究 A 総合報告書.91―. 応用(初版).京都 : 現代数学社 , 1999, 88―109.. 94. 2)奥裕美,井部俊子,鶴若麻里,吉田知文 .(2011). 臨床実習場面の行動に関する問題―(看護管理学,倫. 11)水野欽司,野嶋栄一郎.(1979).人間科学の統計学 7 テストの信頼性と妥当性. E.G.カーマイン,R.A. ツエラー著.東京 : 朝倉書店 , 1―102.. 理学問題)の検討.柳井晴夫編:平成 20 ∼ 22 年度. 12)Cronbach, L.J.(1984).Essentials of Psychological. 「臨地実習生の質の確保のための看護系大学共用試験. Testing, 4th ED. New York: Harper and Row. 1―726.. (CBT)の開発的研究」科学研究費基盤研究 A 総合. 13)仁田善雄,前川眞一他.(2008).項目反応理論を用. 報告書.103―106. 3)小泉麗,及川郁子. (2011).臨地実習前看護共用試. いた第 1 回共用試験医学系 CBT の統計解析. 医学教育. 36(1).3―16..
(18)
関連したドキュメント
生活習慣病の予防,早期発見,早期治療など,地域の重要
筋障害が問題となる.常温下での冠状動脈遮断に
健学科の基礎を築いた。医療短大部の4年制 大学への昇格は文部省の方針により,医学部
北陸 3 県の実験動物研究者,技術者,実験動物取り扱い企業の情報交換の場として年 2〜3 回開
金沢大学学際科学実験センター アイソトープ総合研究施設 千葉大学大学院医学研究院
(b) 肯定的な製品試験結果で認証が見込まれる場合、TRNA は試験試 料を標準試料として顧客のために TRNA
開発途上国の保健人材を対象に、日本の経験を活用し、専門家やジョイセフのプロジェクト経 験者等を講師として、母子保健を含む
では,訪問看護認定看護師が在宅ケアの推進・質の高い看護の実践に対して,どのような活動