信頼性・妥当性の検討

第 2 章研究方法

3.5 信頼性・妥当性の検討

3.5.1妥当性

3.5.1.1 内容妥当性

内容妥当性 content validityとは，測定される構成概念に関連があるすべての主要な要素をその測定方法が含んでいる程度を検討することである．内容関連妥当性のエビデンスは，文献，関係する母集団の代表者，内容に対する専門家の 3つの情報源から得られる(Grove,2015)．本研究における『看護師が転倒リスクをアセスメントし，ケアを決定するまでの臨床判断能力のルーブリック』作成においては，これに対応して内容妥当性の確保を行った．①文献として「看護師の転倒リスクマネジメント力の構成概念とその構造(寺井,2009)」および「看護師のように考える：臨床判断モデル(Tanner,2006)」や文献検討「2.5転倒・転落の要因」に基づいて作成している．②関係する母集団の代表者として，対象者のパフォーマンスからルーブリックを作成しているため，これに該当すると判断した．また，③内容に対する専門家の情報源については，ルーブリックの作成過程において専門家による評価を行いながら作成しているため，これに該当すると判断した．

3.5.1.2 弁別妥当性

弁別妥当性は，ルーブリックのスコアを，看護学生群と看護師群で比較し，

Mann-Whitney U検定を用いて評価した．

3.5.2モデレーションおよび信頼性

3.5.2.1 モデレーション(調整)

イギリスでは，パフォーマンス課題についても信頼性を確保する手法がさまざまに開発されている．そのような手法をモデレーション(調整)という(西岡,2008)．モデレーションの具体的な進め方には，次のようなものがある(Gipps CV,2001)．

1) グループ・モデレーション：ここでは教師や指導者が生徒の課題の事例を使って討議することになる．その目的は，用いる評価基準について共通の理解に達するためである．そのため，評価の過程と評価結果の両方を検討することになる．

2) 採点の信頼性を調べる通常の方法は，採点-再採点法による．これには異なった採点者が同じ解答を採点する場合(評定者間信頼性)と，同じ採点者が同じ課題を異なった時に採点する場合(評定者内信頼性)とがある．

以上より，本研究においてはグループ・モデレーションを行ったのちに，内容妥当性を確認した『看護師が転倒リスクをアセスメントし，ケアを決定するまでの臨床判断能力のルーブリック』を用いて，1点～4点の尺度により評定者3名がそれぞれ 20 名分の評価を行い，次の項の分析を行った．

3.5.2.2 評定者間信頼性

評定者3名が評価した20名分の評価評定の一致度を確認するため，SPSSを用いて級内相関係数(ICC)を算出した．評価は，無作為抽出が困難であることから，特定の評定者が評価を行うため，母数モデルを選択した．そのため，評定者間信頼性 ICC(3,1)では「二元配置混合」「一致性」を選択して信頼係数(r)を算出した．一致度の検討は，順序尺度であること，3名の評定の一致度をみるため，ケンドールの一致係数 w を算出した．評定者には，対象者に提示した映像を保存した USBメモリおよび対象者の逐語録およびルーブリックを渡して，評価を行って返送するように求めた．別の対象の評価を行った後で、前の対象の評価を変えても構わないことを説明した．

なお，調査期間を通じて，評定者同士で本研究に関する情報交換は行わないよう厳重に注意した．

3.5.2.3 項目分析

項目分析として，同様の能力を評定できているかを確認するために，各場面間の観点同士で相関係数を，全体スコアが高い対象の個々の項目得点の相関をみるために I-T相関分析を求めた．

3.5.3.4 一般化可能性理論(一般化可能性研究，決定研究)

一般化可能性理論は，一般化可能性研究(Generalizability study : G 研究)と決定研究

(Decision study : D研究)から構成される．G研究では，評価において生じる測定誤差に着

目し，その測定誤差の原因となる測定に伴う変動要因の成分とその分散を推定することによって，それぞれの変動要因やそれらの交互作用がパフォーマンス評価に与える影響を検討し，一般化可能性係数(generalizability coefficient ; 以下 G係数)(通常の信頼性係数

α係数に相当する)を算出する．さらに，D研究では，G研究で得られた各分散成分の推定値を用いて，評定間点数や評定者数をどの程度用意すると，どの程度の G係数が得られるのかという点についてシミュレーションを行い，効果的な評価計画を立てるために必要な情報を得る．分散成分モデルによる推定にあたっては，従属変数はルーブリックの各観点スコアを，変量因子は対象(p)，評定者(r)，評価項目(t)を用いた．また，どの項目がスコアに強く影響するかを確認するために，それぞれの分散成分の推定値が，分散成分全体に占める分散割合(%)を算出した．なお，G係数は下記の計算式(池田,1994：

Linn,1992)で求めた(Nr ; 評定者数3名，Nt 評定項目数11項目)．

G係数=

p ＋ pr

＋ Pt

＋ Prt

Nr Ni NrNi

引用文献

Dannelle D.S, Antonia L.L：佐藤浩章監訳大学教員のためのルーブリック評価入門，玉川大

学出版部，81-93，2014.

G.wiggins and Jay Mc Tighe ,西岡加名恵訳：理解をもたらすカリキュラム設計―「逆向き設計」の理論と方法，日本標準，2012.

Gipps CV,鈴木秀幸訳：新しい評価を求めて-テスト教育の終焉,論創社,81-108,2001.

Grove SK, Burins N, Gray JR : 黒田裕子監訳：看護研究入門原著第 7版評価・統合・エ

ビデンスの生成,ELSEVIER,356-357,2015.

J .Kevin O’ Regan: Eye movements and their role in visual and cognitive processes, Reviews of

oculomotor research, 4,395-453, Elsevier, 1990.

John W.Creswell, Vicki L. Plano Clark, 大谷順子訳：人間科学のための混合研究法質的・

量的アプローチをつなぐ研究デザイン，北大路書房，69-74，2010.

Robert L.Linn : 教育測定学原著第3版上巻，みくに出版，182-196，1992．

Tanner, CA. : Thinking like a nurse: A research-based model of clinical judgment. Journal of Nursing Education, 45(6), 204-211,2006.

Wiggins, G.：Educative Assessment, JosseyBass, 177, 1998.

池田央：現代テスト理論，朝倉書店，1994．

糸賀暢子，元田貴子，西岡加名恵：看護教育のためのパフォーマンス評価，医学書院，

24-25，2017.

香川大学教育学部附属高松小学校著, 田中耕治序,藤田篤志：パフォーマンス評価で授業改革～子どもが自ら学ぶ授業づくり7つの秘訣～,学事出版,23-26,2013.

寺井梨恵子，丸岡直子，宮西佳代子：看護師の転倒リスクマネジメント力の構成概念とその構造，石川看護雑誌，99-106, 2009.

冨田優也：装着式眼球運動測定装置 Talk Eye Liteを用いたミダゾラム使用静脈内鎮静法の覚醒判定に関する研究，日本歯科大学博士論文，2016.

成田智拓,池田淑夫,古川修他：加齢による眼球運動の変化,臨床精神医学,25(6),705-712,1996.

西岡加名恵編：「逆向き設計」で確かな学力を保障する，明治図書，24-25，2008.

西岡加名恵：教科と総合学習のカリキュラム設計パフォーマンス評価をどう活かすか，

図書文化，90-95，2016.

福田忠彦,福田亮子：人間工学ガイド,サイエンティスト社,219,2009.

福田亮子，佐久間美能留，中村悦夫，福田忠彦：注視点の定義に関する実験的検討，人間工学，32(4)，197-204，1996.

細田泰子，根岸まゆみ，Kathie Lasater：ラサター臨床判断ルーブリック日本語版の作成，

看護教育，59(1)，40-47，2018.

三橋哲雄，畑田豊彦，矢野澄男：画像と資格情報科学，コロナ社，211-212，2009．山田和政，千原壮智，木村大介ほか：単一課題歩行時と二重課題歩行時における眼球運

動の比較，理学療法科学，33(1)，141-144，2018.

山本直樹，八木明宏：周辺視野における高次視覚，人文論究，58(2)，21-33，2008.

ドキュメント内転倒リスク場面における看護師の臨床判断能力と眼球運動との関連 (ページ 69-73)

第 2 章 研究方法

3.5 信頼性・妥当性の検討

第 2 章研究方法