臨地実習生の質の確保のための看護系大学共用試験（CBT）の開発的研究　― CBT 試験問題の作成とそのモニター試験結果の統計的分析を中心にして―

全文

(1)柳井他：臨地実習生の質の確保のための看護系大学共用試験（CBT）の開発的研究 . 原著. 臨地実習生の質の確保のための看護系大学共用試験（CBT）の開発的研究 ― CBT 試験問題の作成とそのモニター試験結果の統計的分析を中心にして ― 柳井晴夫 1）亀井智子 1）松谷美和子 1）奥裕美 2）麻原きよみ 1）井部俊子 1）及川郁子 1）大久保暢子 1）片岡弥恵子 1）萱間真美 1）鶴若麻理 1）林直子 1）森明子 1）吉田千文 3）伊藤圭 4）小口江美子 5）菅田勝也 6）島津明人 6）佐伯圭一郎 7）西川浩昭 8）. A Study on the Development of Computer Based Testing(CBT) for a Common Achievement Test for Nursing Colleges in Order to Maintain Students’Competency for Practical Nursing − With Emphasis on Item Creation and Statistical Analysis of Pilot Testing − Haruo YANAI, PhD1） Tomoko KAMEI, RN, PHN, PhD1） Miwako MATSUTANI, RN, PhD1） Hiromi OKU, RN, MN2） Kiyomi ASAHARA, RN, PHN, PhD1） Toshiko IBE, RN, PhD1） Ikuko OIKAWA, RN, MNSc1） Nobuko OKUBO, RN, PhD1） Yaeko KATAOKA, CNM, PhD1） Mami KAYAMA, RN, PhD1） Mari TSURUWAKA, PhD1） Naoko HAYASHI, RN, PhD1） Akiko MORI, CNM, PhD1） Chifumi YOSHIDA, RN, PhD3） Kei ITO, PhD4） Emiko OGUCHI, PhD5） Katsuya KANDA, RN, PhD6） Akito SHIMAZU, MLi6） Keiichiro SAIKI, PhD7） Hiroaki NISHIKAWA, PhD8）. 〔Abstract〕 With the rapid increase of the number of nursing universities in Japan, the importance of evaluating the level of practical nursing ability required by graduation is increasing. Therefore, it is of urgent importance to develop a common achievement test available to nursing universities throughout Japan to evaluate the level of competency and knowledge required for a nursing student to begin clinical practice in hospitals or health facilities. For the purpose of developing such a test, 1,120 multiple choice items were made from the 18 nursing domains, which are divided into the three areas: basic medicine, basic nursing and clinical nursing. Then pilot testing was conducted in both paper-based and computer-based forms with the 730 students and 220 students respectively. The total of the alpha reliability of the three areas turned out to be high. Therefore the usefulness of the computer-based examination was confirmed in comparison with the paperbased test.. 〔Key words〕. practical nursing, computer based testing (CBT), alpha reliability coefficient, intraclass correlation coefficent. 1）聖路加看護大学 St. Luke’ s College of Nursing 2）聖路加看護大学大学院博士課程 St. Luke’ s College of Nursing, Graduate School, Doctoral Course 3）千葉県立保健医療大学 Chiba Prefectural University of Health Sciences 4）大学入試センター研究開発部 National Center for University Entrance Examinations 5）昭和大学保健医療学部 Showa University School of Nursing and Rehabilitation Sciences 6）東京大学大学院医学系研究科 The University of Tokyo Graduate School of Medicine 7）大分県立看護科学大学 Oita University of Nursing and Sciences 8）静岡県立大学看護学部 University of Shizuoka School of Nursing 2011年10月24日受理.

(2) 聖路加看護大学紀要 No.38 2012.3.. 〔要旨〕近年，看護系大学の急増と医療の高度化に伴い，卒業までに取得すべき看護実践能力の評価の重要性が増加している。その一環として，臨地実習に入る直前の段階までに看護学生が取得すべき知識・能力を正しく評価しておくことは看護実習の適正化のための急務の課題である。このような状況に鑑み，臨地実習以前に必要とされる知識・能力の到達度を検証することを目的として，看護学領域から 1,260 の多肢選択式形式の設問を作成し，全 23 大学 730 名の学生に紙筆形式のモニター試験，および 8 大学 220 名の学生に対するコンピュータ試験（CBT： Computer Based Testing）を実施し，そのテスト結果を分析したところ，基礎医学，看護専門科目Ⅰ，Ⅱの合計点のα信頼性係数は 0.9 以上の高い値となった。さらに CBT 試験と紙筆試験の比較によって，CBT 試験の全国看護系大学共用試験としての有用性を確認した。. 〔キーワーズ〕臨地実習，コンピュータ試験，信頼性係数（D 係数），級内相関係数. Ⅰ．はじめに 1992 年の「看護師等の人材確保の促進」に関する法律. 試験が医・歯学部における「共用試験」と呼ばれるものである。そして修業年限が 6 年間となった薬学部も， 2009 年から薬学部における「共用試験」を開始した。. の制定以降，全国の看護系大学の量的拡大は目覚しく， 2011 年 4 月の時点で 194 校を数え，全看護師養成課程に占める大学における看護師養成率は 20％に達している。. Ⅱ．研究方法. 一方，少子高齢社会の進展など今日の社会変化は著しく，. １．研究目的. より安全で質の高い医療・看護が求められており，今日，. 全国の看護系大学で臨地実習生の質の確保のために利. 各大学がとり組んでいる看護教育の改革，充実の不断の. 用可能な共用試験（CBT）の開発を行い，将来における. 努力が全大学的規模で行われていく必要がある。. 本格的な導入を見据えた試験の実施のための諸課題を明. 2002 年にまとめられた「看護学教育のあり方に関する. らかにする。. 検討会報告（文部科学省）」においては，「看護実践能力」を向上させる最も有効な手段として「臨地実習」はきわ. ２．問題作成の手順. めて重要で，各大学は，「臨地実習」に臨む学生について，. 現行の医・歯学部の「共用試験（CBT）」を参考に，. 当該実習の到達目標に沿った実習開始前の習得レベルの. 主に知識・能力（認知能力を含む）等を問う「共用試験. 確認，および実習終了後の到達レベルを評価するなど，. （CBT）」のための問題作成にあたり，看護学，および看. 大学としての評価システムを構築すべきであるというこ. 護学関連領域を大きく，①基礎医学領域 6 科目（生理学，. とが述べられている。しかし，現状では臨地実習前の学. 生化学，解剖学，病理学，微生物学，薬理学），②看護. 生のレディネスが必ずしも十分でないことも指摘されて. 専門科目Ⅰ 7 科目（公衆衛生学，基礎看護学，地域看護. おり，加えて，病院などの施設における学生の受け入れ. 学，在宅看護学，看護教育学，看護管理学，生命倫理学），. 体制の不十分さ，実習指導者の不足など，臨地実習にお. ③看護専門科目Ⅱ 5 科目（成人看護学，老年看護学，小. ける環境条件の整備を推進することが求められている。. 児看護学，母性看護学，精神看護学）の 3 領域 18 科目. ところで，2000 年 3 月に文部科学省高等教育局の諮問. に分類し，本研究の分担者，研究協力者にテスト項目は. 機関として設置された「医学・歯学のあり方に関する調. 4 肢，または 5 肢の多肢選択方式で，臨地実習を受ける. 査研究者協力会議」は，2001 年 3 月に「21 世紀におけ. 3 年生のうちほぼ 70％の正答を得るような問題の作題を. る医学・歯学教育の改善方策について−学部教育の再構. 依頼した。そして，当該領域の専門家によって作成され. 築のために−」をまとめ，医学・歯学教育のモデル・コ. た問題は他領域の専門家によって問題の適切性，正答が. ア・カリキュラムを提示した。そしてそれに基づいて，. 一通りに定まるかについて入念にチェックされた。なお，. 臨床実習以前の学生の適切な評価システムの構築のため. 上記 18 科目のうち，老年看護学，看護管理学，生命倫理学，. の大学間「共用試験」システムへの参加の意向確認と試. 小児看護学，母性看護学，および基礎看護学に関する出. 験内容，実施方法について検討され，その結果，臨床. 題経緯とその結果については，文献 1）∼ 5）に述べてある。. 実習に必要な知識・能力を測る CBT（Computer Based Testing）と客観的構造化臨床試験（OSCE）が 2005 年. ３．データ収集の方法. 12 月から行われることとなった。なお，この CBT と. 作成された問題はなるべく多数の項目についての情報. OSCE を含めた臨床実習のためのレディネスを測定する. が必要であるが，同一被験者に解答させることは時間的.

(3) 柳井他：臨地実習生の質の確保のための看護系大学共用試験（CBT）の開発的研究 . に無理が生じるため，看護専門科目Ⅰ，看護専門科目Ⅱ. （3）問題を解くのに必要とされる能力（θ、平均 0，分. のそれぞれについては，160 問からなる 3 つのセット（計. 散 1 を仮定）を想定し，θの関数として，それぞれの. 3 × 160 × 2 ＝ 960 問）を精選し，研究分担者が所属す. 設問 xj に正答する条件付確率を，Pj(xj/ θ ) と表現する。. る大学のうち，実施に関して承諾の得られた 23 大学 730. この関数を規定する項目の母数と被験者の能力θを推定. 名の大学生を対象として，モニター試験を実施した。さ. する。Pj(xj/ θ ) としては，j 番目の項目母数を，αj（識. らにこの 23 大学を設置形態（国立，公立，私立），規模，. 別力），bj（困難度）によって定義すれば，被験者 i が項. 地域性を考慮して 3 グル―プに分類した。分類結果は，. 目 xj に正答する確率（Pij= 1）は，. グループ 1（9 大学，266 名），グループ 2（7 大学，220. 3L M D M E M T L

(4) H[S D M T L E M

(5)

(6) 㸦㸧（3）. 名），グループ 3（7 大学，244 名）であり，それぞれの. によって表される。上記関数によって，各設問の識別力. グループ別に一つずつのセットの問題を解答させた。た. （Item αj と困難度 bj を推定する方法が項目反応理論 9）. だし，これらのグループの問題の難易度，および測定内. Response Theory，IRT と略記）と呼ばれるもので，. 容はほぼ等しくなるように配慮し，これらのグループ間. 1960 年代に Lord & Novick8）によって提唱され，1980. の学力差の有無を検証するために，基礎医学問題は 3 グ. 年代以降に実用化されるようになったものである。. ループ共通とした。. 項目反応理論の標準的ソフトウエア BILOG の適用に. この結果に基づき，作成された設問の識別力・困難度. より，紙筆試験によるモニター調査データの結果を 3 グ. を推定し，コンピュータによる「看護系大学共用試験. ループ別に解析し，上記未知母数であるαj（識別力），bj. （CBT）」を開発し，前述の 23 大学のうち，実施するた. （困難度）を推定する（ただし、BILOG の場合は，αj は. めの機器，施設が整っている大学で実施に関する承諾が得られた 8 校の看護系大学の 220 名の学生に対してパソ. 非負と仮定される）。（4）全部で 3 領域 240 項目からなるパソコンによる CBT. コンを用いた「共用試験（CBT）」を実施した。試験問. 試験を 8 大学 220 名の学生に実施し，その結果を分析し，. 題については，聖路加看護大学に設置したサーバーを通. 紙筆試験結果と比較した。さらに，紙筆試験と CBT 試. して，各大学に送信された。なお，今回の研究における. 験の結果を科目別に分析した。. 「共用試験（CBT）」はコンピュータによる多肢選択形式のテストを中心とした知識試験（CBT）の部分開発に限定し，実技試験（OSCE）については今後の課題とする。. Ⅲ．結果. 倫理的配慮として，モニター試験，CBT 試験への参. １．基本属性. 加は 23 大学の学生の自由意思に基づき行った。なお，. 3 グループ間の受験者数を設置形態別に表 1 に示した。. 本研究は研究倫理審査委員会において承認後（承認番. グループ 3 に公立大学，グループ 1 に私立大学が多. 号 :10-008）に実施した。. い傾向がみられた（自由度 4，カイ二乗値＝ 69.05，p ＝ 0.001）。. ４．分析方法（1）紙筆試験の調査結果は，グループ 1，2，3 別に，基. 表１モニター試験（紙筆検査）における受験者構成. 礎医学，看護専門科目Ⅰ，看護専門科目Ⅱの記述統計（平. 大学設置形態合計. 均値，標準偏差，相関係数）及び D 信頼性係数をもとめる。（2）設問 1 つあたりの信頼性係数である級内相関係数 6,7）. 国立大学. 公立大学. 私立大学. グループ１ 2 校（43 名）2 校（26 名）5 校（197 名）9 校（266 名）. をもとめる。さら. グループ２ 2 校（45 名）2 校（58 名）3 校（117 名）7 校（220 名）. に看護専門科目Ⅰ，Ⅱに含まれる科目に，平行とみられ. グループ３ 1 校（33 名）3 校（98 名）3 校（113 名）7 校（244 名）. （intraclass correlation coefficient）. る 100 の設問が含まれているとみなし，そのテストの合. 合計. 5 校（121 名）7 校（182 名）11 校（427 名）23 校（730 名）. 計点の信頼性係数を求める。級内相関係数（U,）は 1 項目，. D 係数はテスト全体の信頼性係数ということになり，テ. ２．領域別試験成績. スト全体の項目数が S のとき，D と r I の間には次の（1）. 表 2 に，3 領域（基礎医学，看護専門科目Ｉ，看護. 式および（2）式が成立する。. 専門科目Ⅱの）別の試験成績の平均値を示した。基礎. U,. D S S

(7) D

(8) 㸦㸧， !D （1）. SU, S

(9) U,

(10) 㸦㸧（2）. 医学は，3 グループ別に 74.6，72.4，72.7（全体平均は. （2）式はｐ個の平行となる項目の項目間相関係数が一定. 73.29），平均正答率は 46.6%，45.3%，45.5%，看護専門. 値 U ＝ U, に等しいときの合計点の信頼性係数を示すもの. 科目 Ⅰ は，3 グループ別に 104.7，97.3，101.2，平均正. でスピアマンブラウン（Spearman Brown）の公式と呼. 答率は 65.4%，60.8%，63.2% であった。一方，看護専. ばれる。（2）式において，U, ＝ 0.1 のとき，D ＝ S ST

(11). 門科目Ⅱの平均値は 90.5，88.9，91.6，正答率は 56.5%，. となり，D は S の単調増加関数となる。. 56.2%，57.2% であった。したがって，基礎医学の困難度.

(12) 聖路加看護大学紀要 No.38 2012.3. 表２ 3 領域試験科目成績のグループ別基本統計量大学グループ. グループ１. グループ２. グループ３. 科目名. 人数. 平均値（点）. 標準偏差. 最高点. 最低点. 基礎医学. 266. 74.56. 11.60. 111. 31. 看護専門科目Ⅰ. 266. 104.65. 14.07. 130. 28. 看護専門科目Ⅱ. 266. 90.54. 12.67. 120. 28. （Ｉ＋Ⅱ）合計点. 266. 195.19. 24.32. 245. 56. 基礎医学. 220. 72.40. 12.41. 114. 40. 看護専門科目Ⅰ. 220. 97.32(103.20）. 12.16(14.35). 122. 41. 看護専門科目Ⅱ. 220. 88.92(89.04）. 13.41(13.01). 116. 41. （Ｉ＋Ⅱ）合計点. 220. 186.25(192.24). 23.78. 238. 82. 10.85. 基礎医学. 244. 72.70. 看護専門科目Ⅰ. 244. 101.16（103.42） 12.80(13.78). 107. 44. 125. 48. 看護専門科目Ⅱ. 244. 91.62（89.22）. 11.57(12.31). 117. 39. ( Ｉ＋Ⅱ ) 合計点. 244. 192.77(192.64). 22.08. 235. 97. 表３ 3 領域試験科目間相関係数と偏相関係数グループ 1 基礎医学. 看護専門科目Ⅰ. 看護専門科目Ⅱ. （Ｉ＋Ⅱ）合計点. 全体合計点. 0.522(0.160）. 0.659(0.472). 0.645. 0.827. 看護専門科目Ⅰ. 0.654(0.483). 看護専門科目Ⅱ. 0.919. 0.860. 0.899. 0.894. 総合点（Ⅰ＋Ⅱ）グループ 2 基礎医学. 0.963 看護専門科目Ⅰ. 看護専門科目Ⅱ. （Ｉ＋Ⅱ）合計点. 全体合計点. 0.606(0.261). 0.644(0.372). 0.673. 0.851. 0.729(0.556). 0.922. 0.881. 0.937. 0.906. 看護専門科目Ⅰ 看護専門科目Ⅱ 総合点（Ⅰ＋Ⅱ）グループ 3 基礎医学. 0.962 看護専門科目Ⅰ. 看護専門科目Ⅱ. （Ｉ＋Ⅱ）合計点. 全体合計点. 0.539(0.242). 0.613(0.414). 0.643. 0.824. 0.640(0.466). 0.915. 0.864. 0.895. 0.876. 看護専門科目Ⅰ 看護専門科学Ⅱ 総合点（Ⅰ＋Ⅱ）. 0.960. 表４グループ別 3 領域 18 科目の主成分分析の結果グループ. 第 1 主成分固有値. 第 1 主成分寄与率. 第 2 主成分固有値. 第 1,2 主成分累積寄与率. 第 1 主成分負荷量最大値. グループ１. 5.981. 33.27%. 1.863. 44.62%. 0.723. 第 1 主成分負荷量最小値 0.291. グループ２. 6.314. 35.08%. 1.499. 43.40%. 0.734. 0.428. グループ３. 5.565. 30.92%. 1.691. 40.31%. 0.646. 0.348. が最も高く，看護専門科目Ｉが最も低く，看護専門科目. 合計点間の相関係数を示した。全体合計点との相関係数. Ⅱの困難度は，その中間にあることが示された。. が最も高かったのは，すべてのグループにおいて看護専. 看護専門科目Ⅰ，およびⅡについて，グループ 2，3. 門科目Ⅱであり，続いて看護専門科目Ｉ，基礎医学の順. の値をグループ 1 に等化（equating）して得られた平均. であった。また，看護専門科目Ｉと看護専門科目Ⅱの合. 値 ( 修正平均値 ) を表２の括弧（）内に示した（等化. 計点（Ⅰ＋Ⅱ）と基礎医学の合計点の間にはグループ別. の方法は Tucker の回帰法 10）による）。等化によって，. にみると，0.5 ∼ 0.6 の相関がみられ，看護専門科目Ｉと. 基礎医学の共通問題では，グループ 1 の平均値がグルー. 看護専門科目Ⅱのうちでは，看護専門科目Ⅱのほうが看. プ 2，3 に比べ高かったため，看護専門科目Ⅰ，Ⅱの修. 護専門科目Ｉより，基礎医学と強い相関がみられた。グ. 正平均値は，グループ 1 の平均値に近い値となった。. ループ別に，基礎医学，看護専門科目Ⅰ，看護専門科目 Ⅱの任意の 2 つの科目から他の 1 つの科目の影響を取り. ３．領域別試験成績の相関係数，偏相関係数. 除いた偏相関係数（partial correlation coefficient）を求め，. 表 3 に 3 グループ別に，基礎医学，看護専門科目Ⅰ，. その結果をグループごとに表 3 の括弧（）内に示した。. 看護専門科目Ⅱ，看護専門科目（Ⅰ＋Ⅱ）合計点，全体. グループ 1 においては，看護専門科目Ⅰと看護専門科.

(13) 柳井他：臨地実習生の質の確保のための看護系大学共用試験（CBT）の開発的研究 . 目Ⅱから基礎医学の影響を除去した偏相関係数は 0.160，. 専門科目Ⅱに比べやや低めとなった。看護専門科目Ⅰと. グループ 2，3 においては 0.261，0.242 とやや小さめの. Ⅱの合計点の信頼性係数は，グループ別に，0.908，0.900，. 値が得られた。このことは，基礎医学の成績は，看護専. 0.890 となった。さらに、3 教科 18 目全体（480 問）の. 門科目Ⅰおよび看護専門科目Ⅱの相関に与える影響が強. 合計点の信頼性係数は 0.921，0.922，0.907 ときわめて高. いことを示すものである。. い値になった。次に各科目別に信頼性係数の値を求めその結果を表 6 に示した。. ４．18 の教科科目間の主成分分析 18 の科目成績についてグループごとに主成分分析を. 表６基礎医学科目別信頼性係数（α係数），級内相関係数，項目数を 100 にしたときの信頼性係数. 行ったところ，表 4 の結果が得られた。3 グループとも. 信頼性係数 1*. 級内相関係数. 信頼性係数 2**. 第 1 主成分の固有値および寄与率もともに大きくすべて. 生理学. 0.324. 0.016. 0.619. の科目の主成分負荷量がプラス 0.3 を超えていた。なお，. 生化学. 0.347. 0.021. 0.682. グループ 1 の場合，主成分負荷量の最も大きかった科目. 解剖学. 0.449. 0.032. 0.767. は，小児看護，つづいて基礎看護学，看護教育学，老年. 病理学. 0.382. 0.020. 0.671. 看護学で，第 2 成分で負荷量の高かった科目は生命倫理. 微生物学. 0.361. 0.022. 0.692. 薬理学. 0.577. 0.052. 0.845. 学，看護管理学であった。. 信頼性係数 1*：α信頼性係数信頼性係数 2**：項目数 100 にしたときのα信頼性係数. ５．信頼性係数と級内相関係数による分析 3 つのグループ別に計算された看護専門科目Ｉ（計. 最も高い信頼性係数を示した科目は，基礎医学 6 科目. 160 問）の信頼性係数を表 5 に示した。それぞれ，0.871，. の中では薬理学 0.577，続いて解剖学が 0.449 であった。. 0.822，0.843 であった。同様に，表 5 から看護専門科目. 看護専門科目Ｉ・Ⅱの中で，生命倫理学の信頼性係数は. Ⅱ (160 問）の信頼性係数は，それぞれ，0.820，0.834，0.792. 突出して高く，その値はグループ別に，0.944，0.812，0.900. であった。一方，基礎医学（計 160 問 ) は 3 グループ共. であった。看護専門科目Ⅰの中で，生命倫理学に次い. 通の問題であるが，3 グループ別に信頼性係数を求める. で信頼性の高かった科目は看護管理学でその値は 0.784，. と，0.769，0.799，0.736 と看護専門科目Ⅰ，および看護. 0.753，0.641，続いて，看護専門科目Ⅱのうちで信頼性の高かった科目は母性看護学（0.645，0.660，0.565），精神看護学（0.637，0.545，0.589），信頼性の低い科目は成. 表５試験成績の信頼性係数（α係数）. 基礎医学. グループ 1. グループ 2. グループ 3. 人看護学（0.414，0.416，0.407）であった。表 7 に示し. 0.769. 0.799. 0.736. たように，級内相関係数は，生命倫理学，看護管理学を. 看護専門科目Ⅰ. 0.871. 0.822. 0.843. 除く 10 科目のすべてにおいて，0.1 未満と小さめの値と. 看護専門科目Ⅱ. 0.820. 0.834. 0.792. なった。特に，看護専門科目Ⅰの公衆衛生学，基礎看護学、. ( Ｉ＋Ⅱ ) 合計点. 0.908. 0.900. 0.890. 全体合計点. 0.921. 0.922. 0.907. 地域看護学の級内相関係数は低かった。一方，看護専門科目Ⅱにおいては，成人看護学の級内相関係数が最も低. 表７科目別信頼性係数（α係数）級内相関係数、項目数を 100 にしたときの信頼性係数グループ１科目名. 公衆衛生学. グループ２. グループ３. 設問数. 信頼性係数 1*. 級内相関係数. 信頼性係数 2**. 信頼性係数 1*. 級内相関係数. 信頼性係数 2**. 信頼性係数 1*. 級内相関係数. 信頼性係数 2**. 20. 0.204. 0.013. 0.569. 0.350. 0.026. 0.727. 0.202. 0.013. 0.568. 基礎看護学. 35. 0.513. 0.029. 0.749. 0.475. 0.025. 0.719. 0.396. 0.018. 0.647. 地域看護学. 30. 0.510. 0.034. 0.778. 0.298. 0.014. 0.587. 0.367. 0.019. 0.659. 在宅看護学. 25. 0.567. 0.050. 0.840. 0.479. 0.035. 0.784. 0.581. 0.053. 0.848. 看護教育学. 10. 0.480. 0.085. 0.902. 0.449. 0.075. 0.890. 0.432. 0.071. 0.884. 看護管理学. 20. 0.784. 0.154. 0.948. 0.753. 0.132. 0.938. 0.641. 0.082. 0.893. 生命倫理学. 20. 0.944. 0.450. 0.988. 0.812. 0.178. 0.956. 0.900. 0.311. 0.978. 成人看護学. 35. 0.414. 0.020. 0.677. 0.416. 0.020. 0.677. 0.407. 0.019. 0.659. 老年看護学. 30. 0.547. 0.039. 0.802. 0.589. 0.046. 0.826. 0.537. 0.037. 0.793. 小児看護学. 30. 0.544. 0.038. 0.797. 0.578. 0.044. 0.821. 0.458. 0.028. 0.742. 母性看護学. 30. 0.645. 0.057. 0.821. 0.660. 0.061. 0.866. 0.565. 0.041. 0.810. 精神看護学. 35. 0.637. 0.040. 0.834. 0.545. 0.033. 0.733. 0.589. 0.099. 0.916. * 信頼性係数１：α信頼性係数，** 信頼性係数２：項目数 100 にしたときのα信頼性係数.

(14) 聖路加看護大学紀要 No.38 2012.3. く，続いて老年看護学，小児看護学の値も低めであった。次に，各科目の誤差成分のみが異なる複数個の平行テストの項目数を 100 とした場合に到達可能な信頼性係数の値を（2）式で示したスピアマンブラウンの公式を用いて計算し，表７に信頼性係数 2 として示した。級内相関係数の高い生命倫理学は 100 個の平行テストを加算することによって D 信頼性係数は 0.90 台に到達した。一方，看護専門科目Ⅱのなかで，級内相関係数で 0.5 ∼ 0.6 台の D 信頼性係数であった老年看護学，小児看護学，母性看護学，精神看護学は 100 の平行テストを加算することにより，D 係数は 0.75 台から 0.8 台に増加した。以上，本研究において作成され，モニター調査として実施された，基礎医学 160 問，看護専門科目Ⅰ（3 グループ別）160 問，看護専門科目Ⅱ 160 問（3 グループ別 160. . 図１− 1 看護専門科目Ⅰ (B1,B2,B3) とⅡ (C1,C2,C3) の識別度（グループ別）. 問），計 480 の設問の合計点の信頼性係数は 0.9 を超えた。しかし，科目別の合計点の信頼性係数は，概して低くなった。６. 項目反応理論による看護専門科目Ⅰ，Ⅱの分析結果項目反応理論 9）における標準的プログラムである BILOG によって，上記未知母数であるαj ( 識別力 )，bj（困難度）を推定した（ただし、BILOG の場合は，αj は非負と仮定される）。図 1-1 に，看護専門科目ⅠとⅡに関するそれぞれ 160 項目についてのグループ別正答率の箱ひげ図を示した。看護専門科目Ⅰの正答率の中央値は 70％強，看護専門科目Ⅱの正答率の中央値は 60% 弱となっている。つづいて図 1-2 に項目反応理論によって計算された困難度（難易度）の箱ひげ図を示した。中央値はいずれのグループにおいても困難度の低い方向に偏っているが，正答率に比べ，看護専門科目ⅠとⅡの中央値の差が小さくなってい. . 図１− 2 看護専門科目Ⅰ (B1,B2,B3) とⅡ (C1,C2,C3) の困難度（グループ別）. る。図 1-3 には，識別力の値を箱ひげ図で示した。看護専門科目Ⅰの識別力の平均値は 0.792，0.582，0.662，看護専門科目Ⅱの識別力の平均値は 0.505，0.523，0.507 と看護専門科目Ⅰの平均値がⅡに比べ高くなっているが，看護専門科目Ⅰにおいては，特にグループ 1 と 3 において，識別力の値が 2 を超える項目が多く，そのため，中央値は看護専門科目ⅠとⅡでほぼ同一となった。このようにして計算された識別力と困難度を用い，式（3）により項目特性曲線を描いた（ページ数の制約により，グループ 1 の結果のみ図示した）。図 2-1，図 2-2 は看護専門科目Ⅰの 160 問の項目特性曲線，図 3-1，図 3-2 はグループ１の看護専門科目Ⅱの 160 問の項目特性曲線を描いたものである。いずれのグループにおいても，看護専門科目の 140 番 ∼ 160 番の項目特性曲線は識別力が高く，困難度が低いという傾向がみられた。. 図１− 3 看護専門科目Ⅰ (B1,B2,B3) とⅡ (C1,C2,C3) の正答率（グループ別）.

(15) 柳井他：臨地実習生の質の確保のための看護系大学共用試験（CBT）の開発的研究 0DWUL[3ORWRI,WHP&KDUDFWHULVWLF&XUYHV. 0DWUL[3ORWRI,WHP&KDUDFWHULVWLF&XUYHV . . . . . . . . . . . . . . . . . . . . 図２ー１項目特性曲線（看護専門科目Ⅰ，問 1 ∼問 100）. 図３ー１項目特性曲線（看護専門科目Ⅱ，問１∼問 100）. 0DWUL[3ORWRI,WHP&KDUDFWHULVWLF&XUYHV 0DWUL[3ORWRI,WHP&KDUDFWHULVWLF&XUYHV . . . . . . . . 図２ー２項目特性曲線（看護専門科目Ⅰ，問 101 ∼問 160）. 図３ー２項目特性曲線（看護専門科目Ⅱ，問 101 ∼問 160）. ７. パソコンを使用した CBT 試験の分析結果紙筆形式モニター試験に比べ，コンピュータによる. IV．考察. CBT 試験問題の困難度は低くなっている傾向がみられた。実際に，試験問題数を 80 とした CBT 試験の基礎医学，. １．合計点の信頼性係数. 看護専門科目Ⅰ，Ⅱの平均値はそれぞれ 43.03，58.90，. 信頼性係数とは，合計点の全分散に対する真の得点の. 50.91 となり，この値を 2 倍した 86.0，117.8，102.8 は，. 分散の割合を示すものである。一方，（1 −信頼性）によっ. 表 2 で示したモニター試験（グループ 1）の平均値（74.6,. て定義される非信頼性係数（unreliability）11）は全分散. 104.6, 90.5）を上回っていた。. に対する誤差分散の割合に相当する。したがって，信頼. 上記の結果から，個人ごとに選択される問題が異なる. 性係数が 0.9 であれば，非信頼性係数は 0.1 となり，誤. パソコンによる CBT モニター試験（2010 年 10 月実施）. 差分散の全分散に対する割合は 10％と低めの値となる。. の結果と，紙筆試験によるモニター試験（2009 年 9 ∼. しかし，非信頼性係数が 0.4，0.5，0.6 と増加するにつれ，. 10 月実施）の結果（項目別解答率，項目別年度間相関係. 誤差分散の全分散に対する割合が 40％，50％，60％と増. 数）の間に著しい差はみられなかった。しかし，科目別. 加するので，得られたテスト得点の推定値の信頼区間は. にみると，紙筆試験に比べ，CBT 試験の方が正答率が. 広くなる。. やや高くなる傾向がみられた。例えば，CBT になると. 看護専門科目ⅠとⅡの合計点 ( Ⅰ＋Ⅱ ) の信頼性係数. 正解率が高まる科目には，生命倫理学，公衆衛生学，看. は，グループ別に，0.908，0.900，0.890 となった。さら. 護管理学，薬理学，成人看護学，老年看護学，小児看護. に，3 教科 18 科目全体（480 問）の合計点の信頼性係数. 学があり，正答率に差がみられない科目は生化学，解剖. は 0.921，0.922，0.907 ときわめて高く，十分に実用に耐. 学，生理学，母性看護学，基礎看護学であった。. えうるものであることが判明した。.

(16) 聖路加看護大学紀要 No.38 2012.3. ２. テストの信頼性と内容妥当性をめぐって. 験 TOEFEL で実施されているようなパソコンによる適. 基礎医学 160 問の合計点の信頼性係数は 0.70 台，看護. 応型（Adaptive）試験が開発可能となる。2005 年にわ. 専門科目Ⅰ，Ⅱ 160 問合計点の信頼性係数は 0.80 台であっ. が国で開発された医学系共用試験には項目反応理論が適. たので，これらの 3 領域のうち，1 領域のみのテストを. 用されている 13）が，わが国の看護学の分野においては，. 用いることは信頼性の観点から推奨されない。実際，各. これまで項目反応理論を用いた分析結果は報告されてな. 領域の科目別の信頼性係数は，看護管理学，生命倫理学. い。今後，看護系共用試験の開発に際し，必要となる項. を除くと 0.4 ∼ 0.6 というやや低めの値が得られた。各. 目バンクの設計には項目反応理論の利用が必要不可欠と. 科目の信頼性を高めるには，各項目の主成分分析により，. なることを強調しておく。. 一次元性を確認する必要がある。本研究において，主成分分析を行うと，多くの科目の主成分寄与率は 10％以下となった。また，主成分分析によって得られた第 1 主. Ⅴ．結語. 成分負荷量はいくつかの項目でマイナスの負荷量が得ら. 本研究によって 3 領域［基礎医学（160 問），看護専. れ，信頼性係数を低める働きをしていることになる。. 門科目Ⅰ（480 問，160 問×３セット），看護専門科目Ⅱ. しかし，テストの測定理論の立場からは，信頼性をあ. （480 問，160 問× 3 セット）］計 1,120 の設問を作成し，. げることにより，テスト内容の幅を狭めいわゆる内容妥. それらを 3 つのグループに分け 23 大学 730 名の学生に. 当性を低めるという通信理論の言葉で帯域幅と忠実度の. 紙質検査によるモニター調査を実施した。さらにそのう. ジレンマ. 12）. に陥る危険性がある。モニター調査のグルー. ち 240 問を選んで 8 大学 220 名にパソコンによる CBT. プ 1 のデータに含まれる成人看護の 35 項目について主. 試験を実施した。その主要結果は次の通りであった。. 成分分析すると，第 1，2，3 の固有値は 2.153，1.743，. ①基礎医学，看護専門科目Ⅰ，Ⅱの計 480 問を合計得点. 1.654 となり，3 因子が推定された。この結果をプロマッ. の D 信頼性係数は，3 つのグループのそれぞれにおい. クス回転したところ，第 1 因子：肝炎関連，第 2 因子：. て 0.921，0.922，0.907 と高い値が得られた。なお，こ. SLE，メニエール病患者および糖尿病入院患者の生活指. れらの合計点には，看護専門科目Ⅰの方が看護専門科. 導など，第 3 因子：透析患者の合併症，血糖値・インシュ. 目Ⅱに比べ強い影響を与えていた。. リン，検査全般に関する記述，と 3 つの異なる因子が抽. ②基礎医学，看護専門科目Ⅰ，看護専門科目Ⅱの各科目. 出された。成人看護学は，7 ∼ 8 冊のテキストからなる. の合計点の信頼性係数は 0.7 ∼ 0.8 と全体の合計点に. 広範囲な分野であるため，多因子化したものと推測され. 比べるとやや低めになる。さらに，科目別に信頼性係. る。このように，内容的に 3 つの異なる因子に包含され. 数を求めると，生命倫理学が 0.8 ∼ 0.9 で高めの信頼. る成人看護の設問を 1 つの科目にまとめることの適切性. 性係数が示されたが，他の科目の信頼性係数は 0.2 ∼ 0.7. については，今後検討の余地があろう。同様の傾向は，. と低い値を示した。. 看護専門科目Ⅱにおいて信頼性の低い小児看護学や老年. ③ D 信頼性係数は科目に含まれる設問数の増加に伴い増. 看護学についてもあてはまる。しかし，看護専門科目Ⅰ. 加する傾向がみられるので，1 問あたりの信頼性とみ. に含まれる生命倫理学，看護管理学については，D 信頼. なされる級内相関係数をもとめ，テスト全体が，十分. 性係数，および主成分分析によって得られる第１主成分. に大きな信頼性係数を得るために必要となる項目数を. の寄与率が高く，1 次元性が強い科目といえる。. スピアマンブラウンの式を用いて検討した。 ④基礎医学，看護専門科目Ⅰ，Ⅱの各項目について，項. 3. 項目反応理論による項目選択の有効性. 目反応理論による分析を BILOG を用いて行った。そ. II. 研究方法の 4. 分析方法で示した（2）式によって描. の結果，看護専門科目ⅠおよびⅡに含まれる各項目の. かれる項目特性曲線（図 2，3）が右よりの設問ほど困. 識別力の中央値は 0.5 程度であったが，看護専門科目. 難度が高く，また，曲線の勾配が大きな項目ほど，識別. ⅠにはⅡに比べ識別力が高い項目が含まれることがわ. 力が高い項目といわれる。さらに，設問全体の情報量曲. かった。さらに，項目特性曲線の図から，看護専門科. 線を求めることにより，与えられた項目がどの程度の能. 目Ⅰの問題番号 141 から 160（主に，生命倫理学，看. 力群の被験者をより識別するかについての情報を得るこ. 護管理学の設問）の項目は，識別力が高く困難度が低. とができる。頁数の制約により本稿で情報量曲線の記述. いことが読み取れる。. は省いたが，看護専門科目Ⅰ，Ⅱの各項目は，比較的低. ⑤各科目から困難度がほぼ等しくなるようなセットを作. い能力群の被験者を識別し，基礎医学は，能力の低い群. 成しパソコンによる CBT 試験を実施したところ，一. から高い群にわたって広い能力層を識別する問題が含ま. 見不公平にみえる CBT 試験と紙筆試験の成績に関し. れていた。. ては，著しい差がみられないことが確認されたが，そ. こういう結果を用いることによって，米国の語学試. の詳細についての検討は今後の課題としたい。.

(17) 柳井他：臨地実習生の質の確保のための看護系大学共用試験（CBT）の開発的研究 . ⑥本研究で開発した CBT 試験が全国の看護系大学で. 験問題の開発，柳井晴夫編：平成 20 ∼ 22 年度「臨. a CBT 試験問題の作成利用されるようになるには，○. 地実習生の質の確保のための看護系大学共用試験. b CBT 試験の妥当性および信頼性に関するさら法，○. （CBT）の開発的研究」科学研究費基盤研究 A 総合. c CBT 試験の各大学のカなる情報の蓄積，および，○. リキュラムにおける導入法，についての検討が急務の課題である。. 報告書．107―109． 4）片岡弥恵子，森明子．（2011）．臨地実習前看護共用試験問題−母性看護−に関する出題の経緯とその結果，110―111．柳井晴夫編：平成 20 ∼ 22 年度「臨. 本稿は平成 20 年 4 月−平成 22 年度科学研究費補助金. 地実習生の質の確保のための看護系大学共用試験. の援助をうけた基盤研究 A「臨地実習生の質の確保のた. （CBT）の開発的研究」科学研究費基盤研究 A 総合. めの看護系大学共用試験（CBT）開発研究」の研究成果. 報告書．91―94．. の一部である。ここに，研究分担者と連携研究者を加え. 5）安ケ平伸江，大久保暢子，小山眞理子，志自岐康. て 32 名（平成 20 年度），57 名（平成 21 年度），56 名（平. 子．（2011）．臨地実習前看護系共用試験問題―基礎. 成 22 年度）の共同研究者の先生方に，限りない感謝の. 看護領域―の開発，柳井晴夫編：平成 20 ∼ 22 年度. 意を表する。. 「臨地実習生の質の確保のための看護系大学共用試験. なお，本稿の執筆者の役割は以下の通りである。. （CBT）の開発的研究」科学研究費基盤研究 A 総合. （1）執筆（柳井晴夫），（2）モニター試験問題の作成，. 報告書．91―94．. 老年看護学（亀井智子），在宅看護学（亀井智子），看護教育学（松谷美和子），看護管理学（奥裕美，井部俊子，菅田勝也），地域看護学（麻原きよみ），小児看護学（及川郁子），基礎看護学（大久保暢子），母性看護学（片岡弥恵子，森明子），精神保健看護学（萱間真美，島津明人），生命倫理学（鶴若麻里，吉田千文），成人看護学（林直子），公衆衛生学（西川浩昭，佐伯圭一郎），薬理学（小口江. 6）Shrout P.E.，Fleiss,JL．（1979）．Intraclass Correlations． Uses in assessing rater reliability. Psychological Bulletin, 86, 420―428. 7）繫桝算男，柳井晴夫，森敏昭．（2008）． Q110：信頼性係数と級内相関係数．Q ＆ A で知る統計データ解析（第 2 版）. 東京 : サイエンス社 , 2008, 222―224. 8）Lord, M. & Novick, M．（1968）．Statistical Theories. 美子），（3）データ分析（伊藤圭，佐伯圭一郎，西川浩昭，. of Mental Test, Reading MA: Addison & Wesley: 1―. 柳井晴夫）. 576． 9）村木英治．（2011）．シリーズ行動計量の科学 8 項目. 引用文献. 反応理論．日本行動計量学会．東京 : 朝倉書店 , 1―. 1）亀井智子．（2011）．老年看護に関する出題の経緯と. 142.. その結果，柳井晴夫編：平成 20 ∼ 22 年度「臨地実習. 10）前川眞一．（1999）．第Ⅱ部 3．得点調整の方法．. 生の質の確保のための看護系大学共用試験（CBT）の. 柳井晴夫，前川眞一．大学入試データの解析―理論と. 開発的研究」科学研究費基盤研究 A 総合報告書．91―. 応用（初版）．京都 : 現代数学社 , 1999, 88―109．. 94. 2）奥裕美，井部俊子，鶴若麻里，吉田知文 .（2011）. 臨床実習場面の行動に関する問題―（看護管理学，倫. 11）水野欽司，野嶋栄一郎．（1979）．人間科学の統計学７テストの信頼性と妥当性． E.G．カーマイン，R．A．ツエラー著．東京 : 朝倉書店 , 1―102.. 理学問題）の検討．柳井晴夫編：平成 20 ∼ 22 年度. 12）Cronbach, L.J．（1984）．Essentials of Psychological. 「臨地実習生の質の確保のための看護系大学共用試験. Testing, 4th ED. New York: Harper and Row. 1―726.. （CBT）の開発的研究」科学研究費基盤研究 A 総合. 13）仁田善雄，前川眞一他．（2008）．項目反応理論を用. 報告書．103―106． 3）小泉麗，及川郁子．（2011）．臨地実習前看護共用試. いた第 1 回共用試験医学系 CBT の統計解析．医学教育． 36（1）．3―16..

(18)

臨地実習生の質の確保のための看護系大学共用試験（CBT）の開発的研究 ― CBT 試験問題の作成とそのモニター試験結果の統計的分析を中心にして―

臨地実習生の質の確保のための看護系大学共用試験（CBT）の開発的研究　― CBT 試験問題の作成とそのモニター試験結果の統計的分析を中心にして―