• 検索結果がありません。

検査の信頼性

ドキュメント内 資料 富山消化管撮影研究会 2011text web0810 (ページ 102-109)

第 8 章 胃癌取扱い規約に関して 76

11.6 検査の信頼性

疾患の有無と個別の検査結果との関係を表す場合,真陽性,偽陽性,偽陰性,真陰性の 4つに区分され,表11.4のように2×2分割表にまとめられる.

表11.4 疾患の有無と検査結果の考え方 疾  患

有 無

検  陽 性  真陽性 True Positive 偽陽性 False Positive 査  陰 性  偽陰性 False Negative 真陰性 True Negative

真陽性とは疾患が有る場合に検査で正しく陽性と判定されるもの,偽陽性とは疾患が無 いにも関わらず検査で陽性と判定されるものである.なお 偽陽性 と 過剰診断 の使 い分けが混同されることがあるが,用語の定義上,過剰診断とは例えばがんが進行して症 状が発現する前に,他の原因で死亡してしまうようながんを早期に発見する場合をいう.

発育速度が緩やかであったり,早期にがんを発見した場合,高齢者や重篤な合併症を有す る場合に生じやすいとされ,このようながんを診断し治療することは,時に受診者にとっ ての不利益につながることがあるために過剰診断と呼ばれている.

真陰性とは,疾患が無い場合に検査で正しく陰性と判定されるもの,偽陰性とは疾患が あるにも関わらず検査で陰性と判定されるものである.偽陰性の類義語として,一般的に 見逃し,見落とし,誤診などが用いられている.表11.4を実際のデータの関係に置き換え ると表11.5のようになる.

第11 研究・調査方法 102

表11.5 疾患の有無と検査結果データ 疾  患

有(D) ( ¯D)

検  陽 性(T+) a b a + b

査  陰 性(T) c d c + d

計 a + c b + d a+b+c+d

検査の性格や診断精度を表す指標として,感度sensitivityと特異度specificityがある.

感度S+は,

S+= a

a+c (11.9)

で与えられる.感度の高い検査は,疾患のある人をほとんど見逃すことがないといえ る.これに対して,特異度S

S= d

b+d (11.10)

で与えられる.特異度の高い検査は,疾患の無い人を陽性と判定することがほとんどな いといえる.理想的な検査とは,感度S+と特異度Sがともに高い検査であるが,その 究極であるS+= 1かつS = 1となる臨床検査はまずないといってよい.感度と特異度 の間には,損益(トレードオフ) trade-offの関係が存在しており,一方が高くなればなる ほど,他方が低くなる関係(11.1)にあるからである.

図11.1 検査の感度と特異度との関係

ま た ,表11.4,表11.4よ り ,偽 陽 性 率 False Positive Ratio:FPRと 偽 陰 性 率 False

Negative Ratio:FNRは以下の式となる.

F P R= 1−S(特異度) (11.11) F N R= 1−S+(感度) (11.12)

感度,特異度,偽陽性率,偽陰性率は疾患(の有無)側から見た検査結果(陽性,陰性) 側の割合を算出する指標であることから,検査の性格や信頼度の評価指標として用いら れる.また,検査法の有効性の評価や陽性/陰性判定の境界値を検討するために,感度と 偽陽性率の2つの指標を用いて,Receiver Operating Characteristic ROC分析が行われ る.これは,判定の境界値を最小値から最大値まで変動させた場合,0から1の範囲で感 度と偽陽性率が変化する様子を曲線や階段状の連続的な線として分析する方法である.

一 方 ,検 査 結 果 側 か ら 疾 患 側 の 割 合 を 算 出 す る 指 標 と し て ,陽 性 反 応 的 中 率 Predic-tive Value of a PosiPredic-tive Test:PPVや 陰 性 反 応 適 中 率 Predictive Value of a Negative Test:PPVがある.

P P V = a

a+b (11.13)

N P V = d

c+d (11.14)

検査で陽性(陰性)と判定された時に,真に疾患である(ない)確率の指標といえる.診 断現場では重要な指標であり,日常臨床においてはこの種の判断と思考が繰り返し行われ ている.ただし,これら2つの指標は,その疾患の有病率Prevalence:Prによって影響を 受けることに留意が必要である.有病率Prevalence:Prは以下の式で与えられる.

P r= a+c

a+b+c+d (11.15)

一般に,有病率が高い疾患であれば陽性反応適中率は高くなり,有病率が低い疾患であれ ば陽性反応適中率は低くなる.

104

参考文献

1) Lee KJ, Inoue M, Otani T,et al. Gastric cancer screening and subsequent risk of gastric cancer: a large-scale population-based cohort study, with a 13-year follow-up in Japan. Int J Cancer. 2006; 118: 2315-21.

2) Miyamoto A, Kuriyama S, Nishino Y, et al. Lower risk of death from gastric cancer among participants of gastric cancer screening in Japan:

a population-based cohort study. Prev Med. 2007; 44: 12-9.

第 12

データと記述統計

対象集団における個々の要素を調べ,その集団の傾向や性質などを数量的に統一的に明 らかにすることを統計という.データや統計量など,ある現象を記述した数量を総称して 統計ということもあり、それに関する学問が統計学である.また,それらを用いたデータ 分析の方法を統計的方法という.今日では統計的記述と統計的推測と呼ばれている方法に 大別され,前者は集計や統計の材料となるデータを要約して記述する方法である.その方 法論や理論については多くの教書がある.しかし,その解説や例題は胃X線検査に従事 する者にとって決してなじみやすいものとは言えない.

そこで,本章ではまずデータの種類やそのデータが持つ情報を客観的に表すための方法 について,胃がんX線検診や胃X線検査に関する例題を取り上げながら述べることにし たい.ただし,本稿は統計学を専門的に学ぶ人向けではなく,胃がん検診やX線所見の分 析に統計学を利用する人を対象としたものである.より詳しい内容については専門書を参 考にしていただきたいと考えている.

12.1 データと統計学

12.1.1 現象とデータ

ある対象や集団の特徴を知りたいと思うとき,対象が示す現象のひとつひとつについて 調査や実験により観察する必要がある.例えば,胃癌のX線像やその患者の年齢や性別 に関心があるとする.集団を構成しているそれぞれの要素を個体と呼ぶ.この場合,胃癌 のX線像一例一例ないしは患者一人一人が個体であるが,我々の関心はその個体が持って いるあることがらである.ここでの関心は個体がもつことがらであり,それらを属性と呼 ぶ.属性を数値や文字で表したものがデータである.観測値と呼ばれることもある.デー タそのものは数値や文字の羅列なので,集団の特性を明らかにするには,データを加工 したり,1つの値に集約したりする必要がある.その様にして得られた数量のことを統計

第12 データと記述統計 106 量という.

12.1.2 データの型

データの種類は,量的データと質的データの2つの型に区別できる.属性が胃癌の腫瘍 径などのように,22mm30mm15mm・・・などと数値で表されていて,その値の大 きさそのものに意味があるものを量的データという.量的データは数量データとも呼ばれ 実数連続値をとるタイプと,整数のようにとびとびの値をとるタイプがある.前者は連続 データあるいは計量データ,後者は離散データあるいは計数データとも呼ばれる.

また,胃癌の肉眼型などのように,IIaIIbIIcなどと数値ではなく,その属性が文字 や記号により類別(カテゴリー)され表されるものを質的データという.したがって,カ テゴリーデータとも呼ばれることもある.

12.1.3 数値データの型・データの尺度水準

データ分析を行う上では,質的データも数値化ないしはコード化しておいた方が便利で ある.どのようなデータであれ,数値で表現されたデータはそのことを強調して数値デー タと呼ばれる.その数値がどのような意味合いを持っているかによって4つの型・尺度水 準に分類される.

12.1.3.1 名義データ・名義尺度

数値が区別の意味しか持たないものを名義データという.カテゴリーに対応する異なる 数値が与えられているだけで,数値の大きさは意味をもたず,単にカテゴリーの名称の役 割を果たすだけの数値データである.例えば,占拠部位(UML)のように,U領域を1 M領域を2L領域を3に対応させても,U領域を3M領域を2L領域を1に対応さ せても,それぞれを区別することができるデータのことである.この他に,壁側(前壁,

後壁,小彎,大彎)や肉眼型(0型,1型,2型,3型,4型,5),検診種別(対策型地域 検診,対策型職域検診,任意型検診),撮影機器(CFSSI.I.-DRFPD-DR)などがある.

名義データの平均値や中央値を求めても意味がないが,最頻値を求めることは出来る.

12.1.3.2 順序データ・順序尺度

数値の大小関係に意味があるものを順序データという.数値の差の大きさが問題となる 場合と問題とされない場合がある.例えば,胃癌壁深達度のように,M1SM2 MP3SS4SE5のように深達度の規模と数値が対応したデータのことである.

この他に,X線画質(高画質,中画質,低画質)や生検組織診断分類(Group1Group2 Group3Group4Group5),リンパ管侵襲(ly0ly1ly2ly3)などがある.順序デー

タの平均値を求めることは出来ないが,中央値を求めることはできる.

また,「尺度水準が順序尺度以上」という場合は,順序データのほかに順序尺度の性質 を備えている間隔データ,比例データが含まれる.

12.1.3.3 間隔データ・間隔尺度

数値が単に大小関係を示しているだけでなく,その数値の大きさがある基準値からの 差の大きさを示している量的データを間隔データという.距離尺度とも呼ばれる.間隔 データは一般的に測定単位を持っている.胃癌腫瘍径は測定単位がmmcmとなる間 隔データである.他に,撮影管電圧(kv)や撮影管電流(mA,撮影時間(sec)などが ある.間隔データは,平均値も中央値ともに求めることができる.

また,「尺度水準が間隔尺度以上」という場合は,間隔データの他に比例データが含ま れる.

12.1.3.4 比例データ・比例尺度

数値の大きさが,ある基準値からの比の大きさを示している量的データを比例データと いう.間隔データは数値の差に意味があるが,比例データは数値の差とともに数値の比 にも意味がある.比が定義できるということは,絶対零点をもつことと同じことをあら わす.例えば,身長や体重などはゼロや負の値をとらないので,比例データである.間隔 データに対して使用できる分析手法は,比例尺度データに対しても使用できる.

12.1.4 データの次元

1つの固体から1種類の属性のみを観察するのではなく,陥凹型胃癌の腫瘍径と深達度 という2種類の属性を同時に観察してそれらの関係を分析したい場合がある.

一般的に,観察の対象となる固体の数nはデータの大きさと呼ばれ,その固体から同時 にp種類の属性を観察するとき,p種類のデータが得られるが,このpをデータの次元と いう.それらが同時に分析の対象となるとき,その データセット(n×p)p次元デー タと呼ばれる.

12.1.5 変数

データの取り得る値を数学的に処理するため,抽象的に表現したものを変数といい,一 般的にはxで表す.データの大きさがnの場合の変数は,

x1,x2,· · ·,xn

ドキュメント内 資料 富山消化管撮影研究会 2011text web0810 (ページ 102-109)