• 検索結果がありません。

OGASAWARA Laboratory 資料 2006/2/19 尺度 検査における信頼性と妥当性について 1 1. 信頼性 (reliability) 1) 信頼性の意義信頼性 尺度 検査による測定誤差の程度を示す指標 ; すなわち, 測定結果の安定性を示す指標 尺度そのものの性質であり, 尺度

N/A
N/A
Protected

Academic year: 2021

シェア "OGASAWARA Laboratory 資料 2006/2/19 尺度 検査における信頼性と妥当性について 1 1. 信頼性 (reliability) 1) 信頼性の意義信頼性 尺度 検査による測定誤差の程度を示す指標 ; すなわち, 測定結果の安定性を示す指標 尺度そのものの性質であり, 尺度"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

尺度・検査における信頼性と妥当性について

1 1.信頼性(reliability) 1)信頼性の意義 信頼性……尺度・検査による測定誤差の程度を示す指標;すなわち,測定結果の安定性 を示す指標→尺度そのものの性質であり,尺度内部だけで決まる 信頼性を確認する必要性 心理尺度や心理検査テストが測定するもの……知能や性格特性といった心理特性 心理特性は構成概念(construct)であるために,また,これらの心理特性は,行動の 標本を測定して推測されるので,常に測定誤差がともなうが,その誤差はなるべく小さ いことが望ましい 信頼性……程度の問題,その測度の1つに信頼性係数がある 標準化された尺度や検査では,いずれも信頼性係数が示される 2)信頼性係数の算出法(大村,1998;山本・杉若,1993) (1)再検査法(retest method) 同一対象者に,時間間隔をおいて同一の尺度・検査を 2 回実施し,それによってえられ た結果の相関係数を求める方法で……得点の安定度 この場合,2 回の尺度・検査の実施間隔が問題となり,接近しすぎると練習効果や記憶の 影響があり,離れすぎると,発達や経験の影響により心理特性そのものが変化してしまう 可能性がある

(2)平行検査法(parallel test method)または等価検査法(代替検査法,equivalent form method) 同一対象者に 2 つの等価の尺度・検査を同時に実施し,両者の結果の相関係数を求める 方法 等価検査法においても,問題が練習効果の現れやすいものであると,再検査法のように, はじめのテストが次のテストに影響する(キャリー・オーバー効果,carry-over effect) 尺度や検査によっては,反復することで,それらの性質そのものが変わることも指摘さ れている(大村,1998) 例:思考力テストを1 回受験することで,2 回目は心理学的には異なる性質のテストと なる可能性がある

(2)

(3)折半法(split-half method) 1 つの尺度・検査の質問項目・問題を折半して実施し,これらを別々に採点して,両者の 相関係数を求める方法 折半する方法 二分法……前半部と後半部に分ける方法 奇遇法(odd-even method)……奇数番号と偶数番号とに分ける方法(一般に用いられ る方法)。 留意点……尺度・検査の進行が時間に限定される純粋の速度検査には適用できない 折半法によって信頼性係数を求める場合,問題数が実際の半分になっているので,スピ アマン・ブラウン(Spearman-Brown)の公式によって相関値を修正する必要がある. ただし,rnは問題数をn 倍した場合の r,rnは折半法によって算出された相関係数(信頼性係 数)

(4)内的整合法(または内部一貫性による方法,method of internal consistency) 尺度・検査の各項目が同一の心理特性を測定しているときに内的整合性が高いという こ れ は , 各 項 目 間 の 反 応 の 一 貫 性 の 程 度 で あ り , キ ュ ー ダ ー ・ リ チ ャ ー ド ソ ン (Kuder-Richardson)の公式で表される.折半法と同じく,1 回のテスト結果を使用して 信頼性係数が得られる。下記にはキューダー・リチャードソンの公式 20(KR-20)を示し た。 ただし,rttはテストの信頼性係数,n は問題数,SDtは全テスト得点の標準偏差,p は各問題 の正答率,q は 1-p,Σpq は各問題についての(p×q)の総和 また,クロンバック(Cronbach, L.J.)のα係数も,内的整合性の観点から,信頼性係 数を求めるものである. I I n

r

n

nr

r

1 1

)

1

(

1

+

-=

÷

÷

ø

ö

ç

ç

è

æ

-=

å

2 2

1

t t tt

SD

pq

SD

n

n

r

(3)

ただし,n は項目数,S2(xi)は項目 j の分散,S2(x)はテスト得点の分散である (5)分散分析法 これまでにあげた信頼性係数は,テスト得点X を真の得点 T と誤差 E との和で表現する 古典的テスト理論に基づいている.分散分析のモデルでは,テスト得点の変動要因をいく つかの成分に分けて考える.その分け方は,用いた実験計画によって異なる.しかし,こ の考え方に立つと,どの分散成分をもって信頼性係数を定義するかが明確ではなくなる. (6)それぞれの方法の比較 信頼性係数の比較 以上の信頼性係数の算出方法は,それぞれ異なった仮定や前提に基づくものであるの で,求められた数値の意味が異なり,単純に比較することはできない 信頼性係数への影響要因 テストの長さや集団の異質性などによっても信頼性係数は影響を受ける.信頼性が一 般に高くなる条件は,次のようになる: テストの長さ,すなわち,項目数が多い 集団の異質性が高いほど,すなわち,集団におけるテスト得点の分散が大きい 信頼性係数の判定基準 どのくらいの信頼性係数があれば,そのテストは信頼できるかという判断は難しい 2.妥当性(validity) 1)妥当性の意義 妥当性……尺度・検査が測定使用とした目標である心理特性をどのくらい測定し得てい るかを示す指標;すなわち,測定の確実性の程度を示す指標→尺度外部の何 かとの関係で定義される 妥当性を確認する必要性 尺度・検査が測定する心理特性は,構成概念であり,直接測定することはできない(信 頼性における説明の再掲)

ï

ï

þ

ïï

ý

ü

ï

ï

î

ïï

í

ì

-=

å

-)

(

)

(

1

1

-n

n

2 1 2

x

S

x

S

n j i

α

(4)

性が高い 2)妥当性の種類と算出法(大村,1998;山本・杉若,1993) (1)表面的妥当性(face validity) 尺度・検査の対象者に対して,そのテストが外見上妥当であるように見えること(見か けの妥当性) 以下に述べる真の妥当性とは関連性はないものの,テストが適切に見えることは動機づ けを高めるためにも必要 (2)内容的妥当性(content validity) テストの内容や質問項目が,測定しようとしている内容を十分反映しているかどうかに 関わる妥当性……すなわち,テストを構成している問題(項目)が,対象となっているも のを偏りなくとらえていることに関する妥当性 内容的妥当性は,論理的に構成されるので,論理的妥当性ともいう (3)基準関連妥当性(criterion-related validity) これは,主題となっている心理特性についての適切な外部基準との関連性で示される妥 当性 その程度は,基準値と測定値との相関係数や判別の正確さによって示される 基準関連妥当性には,次の2 種類がある: 予測的妥当性(predictive validity)……将来の行動が基準(criterion)となる場合 例:大学の入学試験の成績と入学後の成績との関連 併存的妥当性(concurrent validity)……現在の何かが基準となる場合 例:新しく作成した知能テストの得点と既存の知能テストの得点との関連 基準関連妥当性の強さは,相関係数などの数量で表すことができるので,経験的妥当性 (empirical validity),統計的妥当性(statistical validity)ともいわれる

(4)構成概念妥当性(construct validity) その尺度・検査が,測定することを目的としている心理特性(構成概念)をどの程度正 確に測っているかどうかに関わる妥当性 尺度・検査が測定しようとしている心理特性は,構成概念であるために必要とされる 構成概念妥当性……理論だけではなく,実証的な研究が必要 例:不安テストで高い得点を取った者の行動を観察して,実際に不安が高いことを示 す行動の特徴が認められるかどうかなどを確認する

(5)

因子分析法などにより,この構成概念妥当性が確認される 3.信頼性と妥当性の関連 信頼性と妥当性は,別個の概念である しかし,信頼性が高くとも妥当性が低い場合はあるが,妥当性が高い場合には必ず信頼 性も高くなければならない(塗師,1981) その意味では,妥当性は,尺度・検査が備えるべき条件のうちで,もっとも重要 その理由 妥当性が低い=その変数が反映すべき構成概念以外の要因(攪乱要因)によって変数 の値が大きく左右する 例:2 つの変数が同じ攪乱要因を共有する(たとえば,両変数とも,社会的望ま しさ傾向を強く反映する)→社会的望ましさ傾向が強いと両変数とも値が 高くなり,低いと両変数とも値は低くなる→相関係数は高くなる 妥当性が低いことで,相関が高まるにしろ,低まるにしろ,いずれも測定値間の 相関係数が,構成概念間の関係を歪曲して伝えることになり,好ましくな い;測定値間の相関係数が,構成概念間の関係を正しく反映するには,そ れぞれの測定値が高い妥当性を持つことが必要 測定値間の相関係数……測定値の信頼性の幾何平均(geometric mean)2を越えない i.e.真の値間に高い相関があっても,信頼性の低い測定値からは高い相関がえられな い 4.実用性(utility) 尺度・検査を実施する際には,実用性も問題となる

信頼性は高いが妥当性が低い

妥当性は高いが信頼性が低い

(6)

5.文献 1)南風原朝和(2002):心理統計学の基礎―統合的理解のために―.有斐閣(有斐閣アルマ). 2)鎌原雅彦・宮下一博・大野木裕明・中澤潤(編著)(1998):心理学マニュアル 質問紙 法.北大路書房. 3)塗師斌(1981):妥当性.東洋・柏木繁男他(編)新版心理学事典,平凡社,pp.561-562. 4)小笠原昭彦・松本真理子(2003):心理テスト査定論.岡堂哲雄(編)臨床心理査定学 (臨床心理学全書 第2 巻).誠信書房,pp.203-290. 5)大村政男(1998):心理検査の使用と作成の問題,心理検査の信頼性と妥当性.花沢成 一・佐藤誠・大村政男(共著)心理検査の理論と実際 第Ⅳ版,駿河台出版社,pp.45-59, 69-84. 6)山本麻子・杉若弘子(1993):上里一郎(監)心理アセスメントハンドブック,西村書 店,pp.3-8.

参照

関連したドキュメント

週に 1 回、1 時間程度の使用頻度の場合、2 年に一度を目安に点検をお勧め

1外観検査は、全 〔外観検査〕 1「品質管理報告 1推進管10本を1 数について行う。 1日本下水道協会「認定標章」の表示が

国内の検査検体を用いた RT-PCR 法との比較に基づく試験成績(n=124 例)は、陰性一致率 100%(100/100 例) 、陽性一致率 66.7%(16/24 例).. 2

Development of an Ethical Dilemma Scale in Nursing Practice for End-of-Life Cancer Patients and an Examination of its Reliability and Validity.. 江 口   瞳 Hitomi

このような状況の下で、当業界は、高信頼性及び省エネ・環境対応の高い製品を内外のユーザーに

(3)各医療機関においては、検査結果を踏まえて診療を行う際、ALP 又は LD の測定 結果が JSCC 法と

・如何なる事情が有ったにせよ、発電部長またはその 上位職が、安全協定や法令を軽視し、原子炉スクラ

結果は表 2