• 検索結果がありません。

食糧 その科学と技術 No.46( )

N/A
N/A
Protected

Academic year: 2021

シェア "食糧 その科学と技術 No.46( )"

Copied!
36
0
0

読み込み中.... (全文を見る)

全文

(1)

Ⅲ データの統計的取り扱い

1. はじめに  分析法の妥当性確認についてはいくつかの国際的なガイドラインが存在し,そ のなかにはデータ解析方法などの統計的な記述も含まれている。実験計画を立て たり,報告書をまとめるにはガイドラインを参照するのが一番であるが,要点に ついては食品総合研究所ホームページ1)及び参考文献2)でこれまでに紹介してき た。したがって,ここでは,ガイドラインにそって報告書をまとめる際に必要に なるデータ解析のなかの,1)ランダム性確保のための乱数の使い方,2)化学 分析法の精度の妥当性判断基準に用いられているHorwitzの式,3)室間共同試 験又は技能試験などの配付試料の均質性確認試験,4)化学分析の定量法の室間 共同試験,5)定性分析法の室間共同試験,について例題を用いて説明する。  なお,本稿ではIUPAC/ISO/AOAC Internationalのハーモナイズドプロトコルは ハーモナイズドプロトコル,AOAC InternationalはAOACと記する。  また,本稿では実験データから計算した不偏標準偏差(母集団の標準偏差σの 推定値)の頭文字には S を用いることにする。 2. データの表示方法と桁数  室間共同試験のハーモナイズドプロトコル3)には,報告のための最終的な平均 値および標準偏差を計算するときは,計算途中で四捨五入,切り上げ切り下げの ような丸めを行わず,計算機またはコンピュータで直接計算するように記載され ている。そして,最終的に報告する標準偏差及び相対標準偏差の有効数字は 2 桁 にし,平均値の有効数字は標準偏差の表示に合わせる。  例えば,室間再現標準偏差 SR= 0.012ならば平均濃度は0.147,室間再現相対標 準偏差 RSDR,%=0.012/0.147×100=8.2%と報告する。なお,平均濃度を0.1473 あるいは 0.15としてはならないと,室間共同試験のハーモナイズドプロトコル3) に例示されている。  ただし,他の計算に使用する平均値や標準偏差は,桁数が多くなっても元デー タから直接計算した値をそのまま報告書に記載しておいた方が,他の計算で求め る値の丸め誤差が大きくならない。平均値や標準偏差の桁数を多く記載する場合 は,計算に使用した測定値の有効数字や定量下限を併記しておけば,必要に応じ て丸めることもできる。 3. ランダム性の確保  分析法の妥当性確認のデータ解析では,一元分散分析や枝分かれ実験のような 実験計画法に含まれる分散分析というデータ解析法をよく利用する。例えば,一 元分散分析は配付試料の均質性確認試験データの解析や定量分析法の室間共同試

(2)

験データの解析に,枝分かれ実験は単一試験室における中間精度のデータ解析に 用いる。中間精度は,併行精度(repeatability)と室間再現精度(reproducibility) の中間の大きさをもつ精度のため,このように呼ばれる4)。一つの試験所内で時 間,オペレータ,校正,機器などの変動要因を一つ又は複数変更して各変動要因 の標準偏差及び総合的な室内精度を推定することを中間精度の評価という4)  ランダム性の確保は,代表性のあるサンプリング,並びに誤差の評価及び制御 に用いる実験計画法に必須の基本原則であり,実験計画法におけるFisherの3原 則(反復,無作為化,局所管理)の一つである。  配付試料の均質性確認試験では,分析する試料を抜き取るとき,及び抜き取っ た試料を分析する順番を決めるときに,抜き取り方法及び順番が「ランダム」で ある必要がある。適当に無計画に抜き取っただけではランダムさは十分に確保で きていない5)ため,ランダムであることを保証するには乱数を用いる必要がある。  乱数を得るために乱数表を使う場合には,JIS Z9031:2001に乱数表が記載され ており,その使い方として,  1)乱数表の使用開始ページ,開始点をランダムに決める。  2)10 進数の1桁又は2桁の乱数が必要な場合には乱数表の右方向に進み, 右端になったら次の行の左端に移動する。  3)10 進数の3桁以上の乱数が必要な場合には乱数表の下方向に進み,下端 になったら次の列(同じページなら右方向)の上端に移動する。 のような注意点が記載されている。  電卓やパソコンソフトでも乱数が得られるが,本当に乱数として問題ないか確 認した方が良い。例えば,Excel2003で乱数を発生させる関数RAND( )は修正プ ログラムを適用する必要がある6)  Excelで2桁の乱数が欲しい場合には,任意のセルに「=INT(RAND()×100)」 と式を入力すると0∼99 の乱数(1桁の乱数は十の位が0の2桁とみなす)が 得られ,この式の 100 の部分を 1000 に変更すれば0∼999 の3桁の乱数が得られ る。n 個のセルにこの式を入力すれば n 個の乱数が得られる。 例題 1 乱数の使用例 1)300 個の試料の中から 10 個をランダムに抜き取る。  a)300 個の試料に任意に1∼300 の通し番号を付ける。  b)3桁の乱数 000∼999 を乱数表,電卓,パソコンなどから得る。  c)001∼300 の乱数が出たら,その乱数と同じ通し番号をもつ試料を抜き取 る。  d)次の乱数に進む。それまでに出た乱数と同じ3桁の乱数のときは,その乱 数は捨てて次の乱数に進む。  e)10 個の試料を抜き取るまで,c)とd)を繰り返す。

(3)

 c)の方法では3桁の乱数 1000 個のうち 300 個しか使わないので効率が悪い。 そこで,3桁の乱数を 300 で割った余りに1を足した数を試料番号として抜き 取ると,000∼899 の 900 個の乱数が使えるようになり効率が良くなる。このと き,900∼999 の乱数が出たら捨てて次の乱数に進む。こうしないと1∼100 番 の試料が 111∼300 番の試料よりも選ばれやすくなり,300 個の試料がどれも等 しい確率で抜き取られることにならないためである。乱数の種類数(例えば2 桁の乱数なら 100 種類,3桁の乱数なら 1000 種類)が,通し番号を付ける全試 料数の整数倍でない場合は,捨てる乱数があることに注意する。 2)18 個の試料を分析する順番をランダムにする。  a)18 個の試料に任意に1∼18 の通し番号を付ける。  b)2桁の乱数 00∼99 を乱数表,電卓,パソコンなどから得る。  c)2桁の乱数を 18 で割った余りに1を足した数を試料番号とする。このと き,90∼99 の乱数が出たら捨てる。  d)次の乱数に進む。それまでに出た乱数と同じ2桁の乱数のときは,その乱 数は捨てて次の乱数に進む。  e)1∼18 のうちの 17 個の乱数が決まるまで,c)とd)を繰り返す。乱数 が決まった順に試料を分析する。 4. Horwitz の式  妥当性を判断するには何かしらの判断基準が必要である。食品分析の分野にお いて,化学分析法によって得られた測定値のばらつきの判断基準として広く利用 されているHorwitzの式7)について説明する。Horwitzの式は,例えば,配付試料 の均質性の判定及び均質性の確認に用いた分析法の併行精度の妥当性の判定8) 定量分析法の併行精度及び室間再現精度の妥当性の判定9, 10),保管期間中の試料 の安定性の判定11)などに用いられている。  Horwitzは1980年に,化学分析法の室間共同試験から得られる室間再現相対標 準偏差 RSDR,%は,分析法・マトリックス・分析対象成分にかかわらず濃度Cが 1%(C=0.01)のときおおよそ4%であり,濃度が1/100になるごとに2倍にな ることを報告し7),その関係式 PRSDR,%=2(1−0.5log10C)Thompson12)が以下の使い やすい形の式に変形した13) PRSDR,% =2C−0.5log 102 = 2C−0.1505

… ⑴

PRSDR,%は 室 間 再 現 相 対 標 準 偏 差 の 予 測 値(predicted reproducibility relative standard deviation)である。PRSDR,%= R

C×100 なので,濃度 C における室間再現

(4)

,% R C RSD C C C C = × = × = = 100 2 100 −0.1505 1−0.1505 0.8495 R 0.02 0.02  … ⑵ になる。ここで,Rはギリシャ文字σが母集団パラメータ(母数)であることを, ^が推定値であることを示す。  ⑴ 式又は ⑵ 式のHorwitzの式を妥当性確認に利用するときの注意点として,1) 食品分析の分野では,おおよそ 10ppbから10%の濃度範囲(Horwitz region)にお ける室間再現標準偏差の予測値として利用可能なこと,2)Horwitzの式は室間共 同試験データを回帰分析して求めた式ではないこと,3)分析法固有のバイアス が含まれていないため不確かさの目安として利用するには過小評価した値になっ ていることなどをThompsonは挙げている14)  また,Horwitzは上記の式とともに,室間再現標準偏差SR(異なる試験所で分 析したときの測定値のばらつきを考慮した標準偏差で,多数ある試験所のなかの ある一カ所で1回分析したときの測定値の不確かさを示す推定値)は,併行標準 偏差 Sr(同一の試験所において,同一のオペレータが同一の機器を用いて,分析 用試料から均質な条件下で分析試料を取り出して行う併行分析を可能なかぎり短 い時間内で複数回行ったときの測定値のばらつきを示す標準偏差で,併行分析の 条件下で1回測定した測定値の不確かさを示す推定値)の通常 1.5∼2倍である ことも報告している7)  化学分析の定量法の性能指標として,室間共同試験で得られた室間再現相対標 準偏差 RSDR ,%と,Horwitzの式で予測される室間再現相対標準偏差PRSDR ,%の 比であるHorRat(Horwitz Ratioの略語で,HORRAT又はHorratと表記されてきた が,2004 年に造語の語源を示唆するHorRatという表記が提案されている13))が, 妥当性の判断に利用されている。HorRatによる判断基準を以下に示す。 HorRatによる室間再現標準偏差 SRの妥当性の判断基準 ・AOACの室間共同試験のガイドライン9)では 0.5 < HorRat ≤ 2なら妥当 ・EU15)ではHorRat < 2なら妥当

 CodexのCCMAS(Codex Committee on Methods of Analysis and Sampling)では 「Analytical Terminology for Codex Use」(step3)のなかでHorRatについても検討

されている16)  Horwitzの式は,化学分析法については,分析法・マトリックス・分析対象成 分に依存せず,濃度だけで測定値のばらつき(標準偏差)を予測できることを 示している。マトリックス・分析対象成分に依存しないことから,広い範囲の 試料に適用可能な点が,妥当性の判断基準が必要という理由とともにHorwitzの 式が広く利用されている理由である。ただし,低濃度側と高濃度側については Horwitzの式の実データへの当てはまりが良くないため,Thompsonが2000年に

(5)

以下の修正式を提案している17) ( 1.2 ) ( C C C C C C = < × ≤ ≤ −7 −7 10 1.2 10 0.138 (0.138 ) 0.5 ) R 0.8495 × 0.22 0.02 0.01 … ⑶  ⑶ 式から室間再現相対標準偏差 PRSDR,%の式を導出すると以下になる。 PRSDR,% C C C ( ) = × × ≤ ≤ −7 22 1.2 10 2 −0.1505 10−7 0.138 ( ) C−0.5 ( 1.20.138 C ) < < … ⑷  ⑶ 式と ⑷ 式の修正式は,FAPASの技能試験プロトコル18)に採用されており, 技能試験のハーモナイズドプロトコル8)でも言及されているが,HorRatについ て記載しているAOACの室間共同試験のガイドライン9)には今のところ記載され ていない。  SR=1.5Sr∼2Srの関係から,⑴∼⑷ 式は Srの妥当性の判断にも利用可能である。 つまり,内部精度管理における測定値のばらつきの妥当性確認にもHorwitzの式 は利用できる10, 19)  多くの化学分析法がHorRatの対象になるが,1)粘度,屈折率,密度,pH, 吸光度等の物理特性値,2)食物繊維,酵素,水分,又はポリマーのように分 子量不定なものの分析法等の経験的分析法 (empirical methods),3)固形物重量 (drained weight)のような品質測定 (”Quality” measurement,品質の善し悪しを判

定する測定法)は, HorRatの対象外である9) 例題2 Horwitz の式の計算例  化学分析法を用いて以下の濃度を測定したときの室間再現標準偏差及び室間再 現相対標準偏差の予測値をHorwitzの修正式を用いて求める。 1)20mg/kg  2)100ppb  3)20%  4)100g/kg 5)0.05ppm  ⑶ 式を用いて室間再現標準偏差 Rを計算し,⑷ 式を用いて室間再現相対標準 偏差 PRSDR,%を計算する。濃度によってHorwitzの修正式は3通りあるので,ど の式を選択するか注意する。また,濃度 C には 1 ppbなら1 ×10‒ 9,1 ppm又は1 mg/kgなら1×10‒ 6,1g/kgなら1×10‒ 3,1 %なら1×10‒ 2を代入する点にも注 意する。  例えば,C = 1 ppmのとき,    R= 0.02(1×10−6)0.8495= 1.6×10−7= 0.16×10−6= 0.16 (ppm)   PRSDR,%=2(1×10−6−0.1505= 16 (%) になる。表1に例題2の解答を示す。

(6)

5. 均質性確認試験  室間共同試験や技能試験では,均質性を確認した試料を配付する。この均質性 の確認方法について,具体的な方法を記載したガイドラインがいくつか存在する 8, 20, 21)。どのガイドラインでも,予備も含めて必要数を調製した配付試料のなか から,乱数を用いてランダムに複数個(AOACでは8個以上21),技能試験のハー モナイズドプロトコルでは 10 個以上8, 20))の分析用試料(test sample)を抜き取り, 抜き取った各分析用試料から併行分析用に複数個(AOACでは3個以上21),技 能試験のハーモナイズドプロトコルでは2個以上8, 20))の分析試料(test portion) を取り出す。均質性確認に用いる分析用試料は,配付試料の一部であり,その測 定値から残りの未測定の配付試料の均質性を判定するためには,配付試料を代表 するように分析用試料を乱数を用いてランダムサンプリングすることが必須であ る。  均質性確認のために分析する試料の総数は 20 個以上になるが,これらの試料 を分析する順番も乱数を用いてランダムにする。測定値が時間とともにシフト(ド リフト)すると試料間の濃度差にドリフト分が加算され,均質性の判定結果に影 響を及ぼす危険性があるため,分析する順番をランダムにすることも重要である。  次に,試料量について注意しておく。分析法のプロトコルの妥当性確認が目的 で行う室間共同試験では,試験所に配付する試料量は,基本的には試験所が2回 併行分析できない必要最小限の量である。したがって,均質性の確認試験は,分 析プロトコルで定めた試料量より少ない量(約 1/2になる場合あり)で分析を行 うことになる。そこで,試料量が少ないと分析精度の低下が懸念される場合(例 えば,検出器の感度不足など)は事前に分析精度を確認する。  以上のようにして得られた 20 個以上の測定値を用いて配付試料の均質性を確 認するが,判定方法がガイドラインによって異なる。また,得られた測定値の外 れ値検定を行うかどうかや外れ値検定の危険率もガイドラインよって異なる。よ って,均質性確認試験の方法を報告するときは,参照したガイドラインを明記す る。ここでは,均質性確認試験の代表的な判定方法について,図1のフローに従 って例題を用いて説明する。  均質性確認試験では,変量モデルを用いた一元分散分析を行い,分析用試料間 表 1 例題2の解答 濃度 R PRSDR, % 1) 20 mg/kg 2) 100 ppb 3) 20 % 4) 100 g/kg 5) 0.05 ppm 2.0 22 0.45 2.8 0.011 mg/kg ppb %  g/kg ppm 10 22 2.2 2.8 22 % % % % %

(7)

の測定値のばらつき(サンプリング誤差)と併行分析による測定値のばらつき(併 行精度)のそれぞれの大きさ(分散)を推定する。均質性確認試験によって得ら れる測定値の変量モデルとして, xij=μ+αi+εij … ⑸ を考える。ここで,xijは分析用試料 i から取り出した分析試料 j を分析して得られ た測定値,μは測定値の真値,αiは分析用試料が異なることによって測定値が変 動する主変動因子のサンプリング誤差を表し,併行分析による測定値のばらつき εijとは独立な平均0,分散σ2samの正規分布 N

0,σ2sam

に従って変動すると仮定す る。εijは誤差因子で,各分析用試料は共通の分散をもち,互いに独立な平均0, (IUPAC, 2006) 均質性確認試験のデータ取得 Cochranの外れ値検定(等分散の検定) 分散分析 分析精度(併行精度)の確認 均質性の判定 実験デザイン、ガイドラインの選択 0.5 p an< 1)一元分散分析のF検定 2)“十分に均質”の条件(IUPAC, 1993: ISO 13528) 3) 2)を緩和した条件(IUPAC,2006:FAPAS) + =

sam all all

2 2 m−1,1− S m−1 San2 F1 + S F 上側危険率1%(IUPAC, 2006)又は 5%(AOAC, FAPAS)。IUPAC, 1993は 外れ値検定行わない。 m=1 0 以 上 , r=2 が 目 安 ( IUPAC, 1993又は2006)。分析する順番はラン ダムにする。 m−1,m(r−1),1−  r < 0.3 sam S p 2 2 an 2 F 2 −1 図1 均質性確認試験の実施手順  図中のIUPACは技能試験のハーモナイズドプロトコルの1993年版20),2006 年版8),AOACは 均質性確認のガイドライン21),FAPASはFAPASの技能試験プロトコル18)を示す。m は分析用 試料の数,r は各分析用試料の併行測定回数である。σpは,妥当性確認を行う目的に適合した

標準偏差を表しており,添え字のpはfi tness for purposeのpurposeの頭文字である。化学分析法 ではσpにHorwitzの式から計算した室間再現標準偏差を用い,3)の均質性判定式中のσall= 0.3

σpである。各分析用試料の併行測定回数が不揃いで,回数を揃えたい場合は,余分な測定値を

乱数を用いてランダムに選択して取り除く22, 23)。複数の材料の均質性を判定する場合は,均質

(8)

分散σ2

anの正規分布 N

0,σ2an

に従って変動すると仮定する。⑸ 式の未知パラメー タμはデータの総平均値で推定し,σsamとσanは一元分散分析によって推定する。 均質性確認データから求めたσsam,σanの推定値をそれぞれ Ssam ,Sanとする。  均質性確認試験で得られた m × r 個の測定値(図2)から,⑹ 式と ⑺ 式の左 辺を計算する。これらの式の左辺は,一元分散分析のグループ内分散(6式)と グループ間分散(7式)の計算式であり,右辺は,⑸ 式の変量モデルを用いて 求めた左辺の期待値である。 x x m r S ij i j r i m an

(

)

(

)

2 1 1 2 1 ・ − − = … ⑹ r x x m S rS i m an sam − −

2 1 2 2 1

(

i・ ・・

)

… ⑺

 併行標準偏差 Sanは,i 番目の分析用試料の測定値 xi・とそこから取り出した分析 試料の測定値 xijの差の2乗を r 個(j = 1,…, r)足し,それをm個(i=1,…, m)の 分析用試料分足したものを自由度 m(r–1)で割った不偏分散の平方根になる。こ こで,分析用試料の測定値xi・は r 個の分析試料の測定値 xijの平均値である。  m × r 個の全測定値の総平均値x・・と i 番目の分析用試料の測定値xi・の差の2乗 を m 個(i = 1,…, m)足したものをr倍し自由度m–1で割った不偏分散は,併行精 度の分散 S2 anとサンプリング誤差の分散 S2samの r 倍の和に等しい。  よって,⑺ 式の左辺の値から ⑹ 式の左辺の値を引き,r で割ると S2 samが得られ, 図2 均質性確認試験のデータ構造  1個の分析用試料から取り出した1個の分析試料を1回分析したときの測定値 x の不確かさ を表す分散σ2 x=σ2an+σ2sam 平均値 (総平均値) の推定 an samの推定 1 r 11 x 1r x 1 m x mr x 併行測定回数 分析用試料1 ・・・・・・・・ 分析用試料m 1・ x xm x・・ ・・・・・・・・ ・・・・・・・・ ・・・・・・・・ ・ ・ ・ ・ ・ ・ ・ ・ ・

(9)

その平方根が Ssamになる。  Excelでは,「分析ツール」内の「一元分散分析」を行うと出力される分散分析 表の「グループ内の分散」= S2an,「グループ間の分散」= S2 an+ rS2samになる。し たがって,Excelを用いると San= グループ内の分散 … ⑻ S r sam= グループ間の分散−グループ内の分散 … ⑼ で Sanと Ssamを求めることができる。「グループ間の分散 < グループ内の分散」の 場合については,例題3の4)の解答で説明する。 例題3 均質性の確認試験データの解析例  図1のフローに従って表2のデータを用いて均質性の確認を行う。  1)Cochran検定(危険率は上側1%)を行い,外れ値があれば除外して再検 定し,なければ次に進む。  2)併行精度(併行標準偏差)は,技能試験のハーモナイズドプロトコル(2006)8) の基準を満たしているか確認し,基準を満たしていれば次に進む。  3)一元分散分析の F 検定で,試料は均質といえるか確認する。  4)技能試験のハーモナイズドプロトコル(1993) 20)の判定によって,試料は 「十分に均質」といえるか確認する。  5)技能試験のハーモナイズドプロトコル(2006)の判定によって,試料は均 質といえるか確認する。 表2 均質性確認試験のデータ 単位(mg/kg) 試料1 試料2 試料3 試料4 試料5 試料6 試料7 試料8 試料9 試料 10 測定値 5.64 5.46 5.52 5.55 5.48 5.35 6.15 5.45 5.48 5.43 5.57 5.44 5.43 5.60 5.40 5.38 5.69 5.59 5.48 5.53 注)「試料」は分析試料の略 1)Cochran 検定  配付試料の均質性の判定をするために,表2のデータを用いて一元分散分析を 行うが,「各分析用試料の分散が等しい」という分散分析の前提条件を満たして いるかはじめに確認する。均質性確認試験における外れ値検定について記載して いるガイドライン8, 21)では,この等分散の検定にCochran検定を採用している。 Cochran検定は,分析用試料の測定値のばらつきは正規分布に従うと仮定して,

(10)

「分析用試料の分散はすべて等しい」という帰無仮説を検定する。Cochran検定の 結果が有意な場合は,当該の分析用試料のデータを除き,残りの分析用試料のデ ータでCochran検定を繰り返す。ただし,技能試験のハーモナイズドプロトコル (2006)8)には外れ値になる分析用試料が2個以上含まれる均質性確認データは疑 わしいので破棄すべきと記載されている。  Cochranの検定統計量を求めるために,分析用試料毎に測定値の分散Si2を計算 する。測定値が2個の場合は2個の測定値の偏差の2乗 Di2を計算しても同じ検 定統計量が得られる。各分析用試料の測定値が3個以上ある場合は,そこから測 定値2個を取り出す全ての組み合わせについて偏差の2乗を計算し,それらの和 が Di2になる。つまり,併行測定回数 r = 2 のときは D i 2

x i1–xi2

2であり,r = 3 のときは Di2

x

i1–xi2

2+

xi1–xi3

2+

xi2–xi3

2である。

 Cochranの検定統計量は,最大のSi2又は Di2が,全分析用試料の Si2又は Di2の和 に占める比率なので以下の式で計算する。 Cochranの検定統計量 C Si i m = = max 2 2 1 S … ⑽ C Di i m 1 =Dmax2 2 = … ⑾  表2の分析用試料では,分析用試料4のばらつき(Si2又は Di2)が最大(表3) なので, Cochranの検定統計量 C Si i m 1 0.245 0.3007 =Smax2 2= = = 0.815 C Di i m 1 0.49 0.6014 0.815 max 2 2 =D = = = となる。  Cochran検定統計量は,0より大きく1より小さい値をとる。等分散の仮定の 表 3 Cochran 検定の1回目 試料1 試料 2 試料 3 試料 4 試料 5 試料 6 試料 7 試料 8 試料 9 試料 10 計 Cochran の 検定統計量 測定値 5.64 5.46 5.52 5.55 5.48 5.35 6.15 5.45 5.48 5.43 5.57 5.44 5.43 5.60 5.40 5.38 5.69 5.59 5.48 5.53 標準偏差 Si S2i 0.127 0.01620 0.021 0.00045 0.092 0.00845 0.495 0.24500 0.035 0.00125 0.092 0.00845 0.120 0.01445 0.014 0.00020 0.071 0.00500 0.035 0.00125 0.30070 0.815 偏差 Di Di2 0.18 0.0324 -0.03 0.0009 0.13 0.0169 0.70 0.4900 0.05 0.0025 0.13 0.0169 -0.17 0.0289 0.02 0.0004 0.10 0.0100 -0.05 0.0025 0.6014 0.815

(11)

もとで,Cochran検定統計量の分布は,右に裾を引いた分布になるが,分析用試 料数及び各分析用試料の併行測定回数によって分布の形が変化する。したがって, Cochran検定統計量の棄却限界値は,上側危険率,分析用試料数,及び各分析用 試料の併行測定回数によって定まる値である。  Cochran検定統計量の上側危険率5%又は1%の棄却限界値は,JIS Z 8402 2: 1999 又は技能試験のハーモナイズドプロトコル(2006)8)に記載された数表で確 認する。ただし,ハーモナイズドプロトコルの数表は各分析用試料の併行測定回 数が2回の場合だけ記載してあり,JIS Z 8402 2の数表には併行測定回数が2∼ 6回の場合が記載されている。  上側危険率1%,抜き取った分析用試料数 m = 10,各分析用試料の併行測定 回数 r =2のCochran検定統計量の棄却限界値は0.718であり,上記のCochran検 定統計量 0.815が棄却限界値0.718を超えているため,分析用試料4の2個の測定 値のばらつきは上側危険率1%で外れ値である。この検定では,分散が小さいこ とは外れ値と考えず,最大分散だけを外れ値候補として検定するので上側危険率 を設定した片側検定である。 表4 Cochran 検定の2回目 試料1 試料 2 試料 3 試料 5 試料 6 試料 7 試料 8 試料 9 試料 10 計 検定統計量Cochran の 測定値 5.64 5.46 5.52 5.55 5.48 5.35 5.48 5.43 5.57 5.44 5.43 5.60 5.40 5.38 5.69 5.59 5.48 5.53 標準偏差 Si Si2 0.127 0.01620 0.021 0.00045 0.092 0.00845 0.035 0.00125 0.092 0.00845 0.120 0.01445 0.014 0.00020 0.071 0.00500 0.035 0.00125 0.05570 0.291 偏差 Di Di2 0.18 0.0324 -0.03 0.0009 0.13 0.0169 0.05 0.0025 0.13 0.0169 -0.17 0.0289 0.02 0.0004 0.10 0.0100 -0.05 0.0025 0.1114 0.291  分析用試料4のデータを除外して,再度Cochran検定を行う。残り9個の分析 用試料のなかでは分析用試料1のばらつきが最大である(表4)。 Cochranの検定統計量 C Si i m =1 0.0162 0.0557 0.291 = 2= = max 2 S C Di i m =1 0.0324 0.1114 0.291 2 max 2 D = = =  上側危険率1%,m = 9,r = 2 のCochran検定統計量の棄却限界値は0.754であ り,Cochran検定統計量0.291は棄却限界値0.754以下なので,外れ値は存在しな い。

(12)

2) 併行精度(併行標準偏差)のチェック  分析用試料4を除外した9個の分析用試料の2回併行測定データを用いて一元 分散分析を行う。Excelで計算した分散分析表を表5に示す。分散分析表の「グ ループ間の分散」の自由度は分析用試料数−1,「グループ内の分散」の自由度は 分析用試料数×(併行測定回数− 1)になっていることを確認する。  ⑻ 式より一元分散分析のグループ内の分散の平方根が,併行標準偏差 Sanなの で, San= 0.006189=0.0787(mg/kg)  18 個の測定値の総平均値 5.50(mg/kg)を⑵式のHorwitzの式に代入して,   R= 0.02×

5.50×10−6

0.8495= 0.6807(mg/kg)  San= 0.0787<0.5 R= 0.34なので,均質性確認試験に用いた分析法の併行精 度に問題はない。 3)一元分散分析の F 検定による均質性確認  表5より一元分散分析の観測された分散比 Fcal= 1.8は,上側危険率5%のF境 界値 3.2よりも小さく,P 値=0.196>0.05で5%有意ではないため,試料は均 質といえる。  F 検定によって二つの分散の大小を検定する場合は,「分散 1 =分散 2」という 帰無仮説に対する対立仮説が「分散 1 ≠分散 2」ならば,F 分布の上側と下側の両 方に危険率を設定した両側検定になり,「分散 1 <分散 2」又は「分散 1 >分散 2」な らば下側危険率又は上側危険率のどちらかを設定した片側検定になる。均質性確 認試験の場合は,変量モデルを用いた一元分散分析を行っており,この F 検定の 帰無仮説は「⑸ 式の変量モデルのσ2 sam= 0」であり,対立仮説は「σ2sam> 0」で ある。したがって,この F 検定は,上側危険率を設定した片側検定である。 表5 表4の 18 個の測定値の一元分散分析表 変動要因 変動 自由度 分散 観測された分散比 P 値 F境界値 グループ間 グループ内 0.089878 0.0557  8 9 0.011235 0.006189 1.815305206 0.196257 3.229587 合計 0.145578 17

(13)

4)「十分に均質」の判定  技能試験のハーモナイズドプロトコル(1993)20)で採用された「十分に均質」 の判定式  Ssam< 0.3σp … ⑿ が成り立つか計算する。化学分析法ではσpにHorwitzの式から計算した室間再現 標準偏差 Rを用いる。この判定式の右辺の 0.3は次のような意味をもつ。サンプ リング誤差σsamがσRの 0.3倍の場合,このサンプリング誤差は各試験所に配付し た試料濃度の違いに反映されるため, σ2R+σsam2 = σR2+

0.3σR

= 1.09σR2=1.04σR 2 … ⒀ のように室間再現標準偏差σRが約5%大きくなる。5%程度の誤差は許容でき る24)ので,σ samが 0.3σRより小さければ,σRの推定にσsamは影響しないと考える。  表5の分散分析表の「グループ間の分散」と「グループ内の分散」から ⑼ 式 を用いて Ssamを求めると, Ssam= (0.011235−0.006189)/2=0.0502(mg/kg)  上記の2)で求めた R= 0.6807を用いると,  Ssam= 0.0502<0.3 R= 0.3×0.6807=0.204 なので「十分に均質」といえる。  技能試験のハーモナイズドプロトコル(1993)20)では,外れ値検定を行わずに ⑿式の判定を行うので,1993 年のプロトコル通りに判定するには表1のデータ の一元分散分析を行う。表6に表1のデータの分散分析表を示す。表6では「グ ループ間の分散<グループ内の分散」なので,⑼ 式の平方根の中が負の値にな りサンプリング誤差 Ssamを求めることができない。AOACの均質性確認のガイド ライン21)では,一元分散分析の分散比は理論的には1以上が期待されるのに1 未満の値が得られる原因として,測定順をランダム化していないか,一元分散分 析モデルの仮定が成り立っていないことを挙げている。実際には測定順をランダ 表6 表1の 20 個の測定値の一元分散分析表 変動要因 変動 自由度 分散 観測された分散比 P 値 F境界値 グループ間 グループ内 0.25068 0.3007 9 10 0.027853 0.03007 0.926283117 0.541075 3.020382 合計 0.55138 19

(14)

ム化しても「観測された分散比」が1未満になることは起きており,そのときは Ssam=0とみなすが,外れ値検定を行っていない場合は,外れ値検定を利用した 場合の結果を検討してから均質性の最終的な判断をした方がよい。 5) 「十分に均質」の判定条件を緩和した判定  技能試験のハーモナイズドプロトコル (1993) 20)の Ssam< 0.3σ pによる「十分に 均質」の判定は,併行標準偏差が小さい分析法を用いた場合などに判定条件が 厳しすぎることがあるため,FAPASの技能試験プロトコル(2002) 18)では,この 判定条件を緩和した条件24)を採用した。技能試験のハーモナイズドプロトコル (2006) 8)でもFAPASと同じ判定条件を採用している。  配付試料の均質性を判定するために,データから一元分散分析を用いて計算し たサンプリング誤差 Ssamは,真のサンプリング誤差σsamの推定値である。計算さ れた Ssamはデータから考えて最も確からしい真のσsamの推定値であるが,推定誤 差があるため真のσsamがもっと小さい値になる可能性は存在する。そこで,σsam の 95%信頼区間(ただし,片側危険率5%を使用)の下限値を真のσsamの推定値 とみなせば,一元分散分析で計算した Ssamよりも小さな値になり,Ssam< 0.3σpの 判定式の左辺が小さくなって均質と判定される可能性が高くなる。この考え方に 基づいた均質性の判定式が以下の式である。 S m F r S F F S

sam2 m all m m r an all

1 1 2 2 1 1 1 2 1 2 2 1 −1 ≤ − + = + −,− −,(−),− aan2 … ⒁  ここで,m は分析用試料数,r は分析用試料の併行測定回数,αは上側危険率5 %なので 0.05を用いる。σallは許容可能なサンプリング誤差の上限で,十分に均 質の判定式の⑿式と同じ 0.3σpを用いる。  m =7∼20,r =2のときの F1と F2の値は技能試験のハーモナイズドプロトコ ル(2006)8)の数表に掲載されている。この数表にない m と r については,χ2 m−1,1−αExcelのCHIINV(α, m–1)関数で計算し,Fm−1, m( r−1),1−αExcelのFINV(α, m–1, m(r–1))で計算すると,F1と F2を求めることができる。例えば,m = 10,r = 2 のとき,  CHIINV(0.05, 10–1)=16.91896よりF1= 16.91896/9=1.88  FINV(0.05, 10–1, 10(2–1))=3.020382よりF2=

3.020382–1

/2=1.01 となる。  m =9,r =2のとき,技能試験のハーモナイズドプロトコル(2006)8)に記載 された数表より⒁式の F1=1.94,F2=1.11である。この例題3の2)及び4)より, 外れ値除去後の 18 個のデータの分散分析表(表5)から計算した San= 0.0787 (mg/kg),Ssam=0.0502(mg/kg)である。例題3の2)より R=0.6807(mg/kg)

(15)

なので,⒁式中のσall = 0.3σp=0.3 R=0.3×0.6807になる。しがって,  ⒁式の不等式の左辺=(0.0502)2= 0.0025  ⒁式の不等式の右辺= 1.94(0.3×0.6807)2+ 1.11(0.0787)2= 0.088 なので⒁式の不等式が成立し,試料は均質といえる。  ⒁式の右辺第1項がないと一元分散分析の F 検定と同じ不等式になるため,一 元分散分析の F 検定で均質な材料は⒁式では必ず均質になる。  この例題では3種類の均質性判定式を全て計算したが,実際の均質性確認では, 用いる判定式を先に決めて,その判定式の計算だけ行えばよい。 6. 化学分析の定量法の室間共同試験のデータ解析  化学分析の定量分析法については,室間共同試験のハーモナイズドプロトコ ル3)及びAOACの室間共同試験ガイドライン9)を参考にデータ解析を行う。ISO 5725–2 25)JIS Z 8402–2はこれの一致規格)も室間共同試験のガイドラインであ るが,以下に示す実施上の最低条件は記載されていない。一元分散分析を用いて 室間共同試験のデータから室間再現標準偏差σRと併行標準偏差σrを推定すると いう基本的部分はIUPAC,ISO,AOACの三者共通であるが,外れ値検定の方法 などに多少の違いがあるので,報告する場合には参考にしたガイドラインを明記 する。  AOACの室間共同試験ガイドライン9)に記載された試験実施上の最低条件を以 下に示す。 AOAC の定量分析法の室間共同試験実施上の最低条件 ・外れ値検定後の有効試験所数が8以上(必要な設備・機器を所有している 試験所が限定される場合は5以上)。 ・分析法の適用範囲と考えているマトリックを代表する材料数が5以上(1 マトリックスに1濃度のときは3材料に減らしてもよい)。 ・各試験所の併行測定回数は,室間共同試験で Srを求めないときは1回,Srを 求めるときは2回。併行測定は非明示の2反復(blind duplicate)又はsplit  levels(Youdenペア)で通常は行うべきである。  材料数の注意点として,規制値との比較が目的の分析法では,少なくとも規制 値未満と規制値超の2材料で妥当性を確認する必要があり,1マトリックス2濃 度以上で試験する必要がある。  試験所間の測定値のばらつき(分散)と試験所内の測定値のばらつきを推定す るために,室間共同試験によって得られる測定値の変量モデルとして,

(16)

を考える(図3)。ここで,xijは試験所 i が j 番目に分析して得られた測定値,μ は測定値の真値,αiは試験所が異なることによって測定値が変動する主変動因子 を表し,併行分析による測定値のばらつきεijとは独立な平均0,分散σ2Lの正規 分布 N

0,σ2 L

に従って変動すると仮定する。εijは誤差因子で,各試験所は共通 の分散をもち,互いに独立な平均0,分散σ2 rの正規分布 N

0,σ2r

に従って変動 すると仮定する。⒂式の未知パラメータμはデータの総平均値で推定し,σLとσr は一元分散分析によって推定する。室間共同試験データから求めたσL ,σrの推 定値をそれぞれ SL ,Sr とする。⒂式は均質性確認試験の変量モデル ⑸ 式と同じ 形なので,図2の分析用試料を試験所と読み替えることができ,⑹ 式の S2 anを S2r , ⑺ 式の S2 samを S2Lとして計算に利用できる。室間再現標準偏差σRの推定値 SRは SRSr2+SL2 … ⒃ 測 定 値 = 真 値 + 室 間 変 動 + 室 内 変 動 総平均 が推定値

(

0,

2

)

L

N

(

0,

2

)

r

N

(

,

2

)

R

N

L SSr 推定値 が 推定値

m

m

0

0

m

図3 定量分析法の室間共同試験によって得られる測定値の変量モデル 表7 化学分析法の室間共同試験の模擬データ 濃度(%)     試験所 測定値1 測定値2 測定値3 1 2 3 4 5 6 7 8 9 10 11 12 7.25 7.32 7.67 7.00 5.80 7.42 7.24 7.32 7.09 6.79 6.87 7.16 7.21 7.42 7.57 7.08 5.70 7.62 6.94 7.48 6.69 7.69 6.67 6.76 7.17 7.42 7.00 総平均    7.09(n=27)

(17)

で求める。SRは,SRを求めた分析法を用いて,多数ある試験所のなかのある一カ 所で1回分析したときに得られる測定値の不確かさの推定値である。  定量分析法の室間共同試験で各試験所から集まるデータを,行方向に試験所, 列方向に併行分析の測定値で配置すると,表7のようなデータになる。室間共同 試験は通常2回併行分析を行うので,測定値は通常2列になる。  表7の行方向の測定値の変動から⒂式のモデルパラメータσLの推定値 SLを, 列方向の測定値の変動から⒂式のモデルパラメータσrの推定値 Srを求め,室間 再現標準偏差σRの推定値 SRは⒃式を用いて求める。  Excelで計算する場合は,「分析ツール」内の「一元分散分析」を行うと出力さ れる分散分析表の「グループ内の分散」が S2 r「グループ間の分散」が S2r+ rS2L等しいので,Sr及び SRを簡単に求めることができる。出力された分散分析表の「グ ループ間の分散」の自由度は試験所数–1,「グループ内の分散」の自由度は試験 所数×(併行測定回数–1)になっていることを確認する。  各試験所が r 回併行分析した場合の Srと SRは, Sr= グループ内の分散 … ⒄ S +グループ間の分散 r R= グループ間の分散−グループ内の分散 … ⒅ で求めることができる。 例題4 化学分析の定量法の室間共同試験データの解析例  表7の室間共同試験データを,室間共同試験のハーモナイズドプロトコル3) びAOACの室間共同試験ガイドライン9)の手順に従って解析する。両者はほぼ 同じ手順であるが,異なる点については後述する。  試験所によってデータ数が異なる場合に,データ数をそろえたいときは余計な データを乱数を用いてランダムに選択して取り除く22, 23)。3個のデータを報告し た試験所1,7,9については,そのうちの1個をランダムに取り除く。また,プ ロトコルに従わなかったなど有効なデータではない理由が明確な試験所のデータ (異常値)は外れ値検定の前に除外し,数値の記載ミスなど試験所に確認して修 正が可能なデータ(異常値)は修正してから外れ値検定を行う。外れ値検定の手 順を図4に示す。 1) Cochran 検定  室間共同試験の精度指標の計算の中心は分散分析である。分散分析では,各群 の分散の大きさは等しいと仮定して解析するため,はじめに各試験所の分散がす

(18)

べて等しいといえるか検定する。室間共同試験のハーモナイズドプロトコル3) びAOACの室間共同試験ガイドライン9)では,この等分散の検定にCochran 検定 を採用している。例題3の 1)で説明したように,Cochran検定の検定統計量は⑽ 式又は⑾式で計算する。Cochran検定統計量の棄却限界値は,上側危険率,試験 所数,及び各試験所の併行測定回数によって定まる値である。室間共同試験のハ ーモナイズドプロトコル3)及びAOACの室間共同試験ガイドライン9)のCochran 検定の数表には,上側危険率 2.5%の棄却限界値がパーセント表示されている。 これらの数表で試験所数 L=12 の行と,各試験所の併行測定回数 r=2 の列が交差 Cochranの 検定有意 Y 精度指標の計算ループ開始 除外する試験所数が 検定開始時の試験所数 の2/9以内なら削除 外れ値 1個のGrubbs 検定有意 Y N N 外れ値 2個のGrubbs 検定有意 このループで除外 した試験室有り Y N N Y 有効(Valid)でない データのスクリーニング 除外する試験所数が 検定開始時の試験所数 の2/9以内なら削除 除外する試験所数が 検定開始時の試験所数 の2/9以内なら削除 終了 最初及び最終の 精度指標報告 図4 室間共同試験データの外れ値検定のフロー

(19)

する箇所の棄却限界値は 59.2%である。⑽式を用いて計算した表8のCochran検 定統計量 59.40%は棄却限界値の59.2%を超えているので上側危険率2.5%で有意 である。したがって,最大分散を与えた試験所 10 の2個の測定値は外れ値とし て以後のデータ解析からは除外する。残りの 11 試験所のデータについてCochran 検定を行った結果,検定統計量は 28.90%になった。試験所数L=11,併行測定 回数 r = 2 のときの上側危険率 2.5%の棄却限界値は62.2%なので,11試験所の分 散に上側危険率 2.5%で有意差は認められない。 2) single Grubbs 検定  次に,各試験所の平均値のなかに外れ値がないかsingle Grubbs検定を行う。ま ず,11 個の平均値の標準偏差 SD を計算する。次に,11 個の平均値のなかの最大 値を除いた残り 10 個の平均値の標準偏差 SDH及び 11 個の平均値のなかの最小値 を除いた残り 10 個の平均値の標準偏差 SDLを計算する。外れ値1個を除けば標準 偏差は小さくなるはずなので,SDH又は SDLの SD に対する減少率(%),100(1SDH /SD),100(1–SDL /SD)をそれぞれ計算し,減少率の大きい方をsingle Grubbs 検定の検定統計量にする3, 9)  Single Grubbs検定の検定統計量   100(1–SDH /SD)と100(1–SDL /SD)の大きい方の値 … ⒆  100(1–SDH /SD)と100(1–SDL /SD)は,「すべての試験所の平均値は同じ正規分 表8 Cochran 検定の結果 試験所 測定値1 測定値2 分 散 1 2 3 4 5 6 7 8 9 7.21 7.32 7.67 7.00 5.80 7.42 7.24 7.32 6.69 7.17 7.42 7.57 7.08 5.70 7.62 6.94 7.48 7.09 0.0008 0.005 0.005 0.0032 0.005 0.02 0.045 0.0128 0.08 10 6.79 7.69 0.405 11 12 6.87 7.16 6.67 6.76 0.02 0.08 Cochran検定統計量 59.40 (%) 注)この表は,表7で測定値が3個ある試験所は1個をランダムに削除したデータ   を示す。

(20)

布の母集団からランダムサンプリングによって得られた値である」という帰無仮 説のもとで同じ分布をする。そして,100(1–SDH /SD)と100(1–SDL /SD)のどち らも0∼100%の間の値をとり,外れ値がなければ小さな値になり,外れ値があ れば大きな値になるから,多くの場合は小さな値になって右に裾を引いた分布に なる。したがって,この検定は上側危険率を設定した検定になる。ただし,各試 験所の平均値のなかの最小値又は最大値のどちらが外れ値になるか事前に決まっ ていないならば,最小値が外れ値候補になる場合と最大値が外れ値候補になる場 合の両方を検定するので両側検定になる。室間共同試験のハーモナイズドプロト コル3)及びAOACの室間共同試験のガイドライン9)には両側危険率 2.5%(片側 危険率 1.25%)の数表が記載されている。  表 9 よりsingle Grubbs検定の検定統計量は100(1–SDL /SD)=44.39%になる。 Grubbs検定の数表3, 9)で,試験所数 L = 11 の行とOne highest or lowestの列の交差 する箇所の棄却限界値は 39.3%である。よって,検定統計量44.39%は,上側危 険率 1.25%の棄却限界値39.3%よりも大きいため,11個の平均値のなかの最小値 5.75(%)は両側危険率2.5%で外れ値である。そこで,試験所5の報告した2個 の測定値を解析から除外する。残りの 10 試験所のデータについて,Cochran検定, 表9 single Grubbs 検定 試験所 測定値1 測定値2 平 均 分 散 1 2 3 4 7.21 7.32 7.67 7.00 7.17 7.42 7.57 7.08 7.19 7.37 7.62 7.04 0.0008 0.005 0.005 0.0032 5 5.80 5.70 5.75 0.005 6 7 8 9 11 12 7.42 7.24 7.32 6.69 6.87 7.16 7.62 6.94 7.48 7.09 6.67 6.76 7.52 7.09 7.40 6.89 6.77 6.96 0.02 0.045 0.0128 0.08 0.02 0.08 Cochran検定 検定統計量 28.90 (%) single Grubbs検定 SD(L=11) SDH(L=10) SD(L=10)L       100(1-SDH/SD) 検定統計量: 100(1-SDL/SD) 0.5093 0.4991 0.2832 2.00 % 44.39 %

(21)

single Grubbs検定を行う(表10)。Cochran検定の検定統計量29.43%は上側危険 率 2.5%の棄却限界値65.5%(L=10,r=2)より小さいので上側危険率2.5%で 有意差は認められない。Single Grubbs検定の検定統計量100(1−SDH /SD)=10.71 %は,上側危険率 1.25%の棄却限界値42.8%(L=10)よりも小さいので両側危 険率 2.5%で有意差は認められない。 3) paired Grubbs 検定  次に,2個の外れ値が互いに外れ値であることをマスキングしてsingle Grubbs検 定では外れ値を検出できない場合があるため,各試験所の平均値のなかの最小値 と2番目に小さい平均値の2個,最大値と2番目に大きい平均値の2個,又は最小 値と最大値の2個の3通りについて,これら2個の平均値を除いたときの標準偏差 (SD2 L,SD2 H,SDHL)の減少率から外れ値を検出するpaired Grubbs検定を行う3, 9)。 表 10 paired Grubbs 検定 試験所 測定値1 測定値2 平 均 分 散 1 2 3 4 6 7 8 9 11 12 7.21 7.32 7.67 7.00 7.42 7.24 7.32 6.69 6.87 7.16 7.17 7.42 7.57 7.08 7.62 6.94 7.48 7.09 6.67 6.76 7.19 7.37 7.62 7.04 7.52 7.09 7.40 6.89 6.77 6.96 0.0008 0.005 0.005 0.0032 0.02 0.045 0.0128 0.08 0.02 0.08 Cochran検定 検定統計量 29.43 (%) single Grubbs検定 SD(L=10) SD(L=9)H SD(L=9)L 検定統計量:100(1-SDH/SD)       100(1-SDL/SD) 0.28321 0.25288 0.25751 10.71 % 9.07 % paired Grubbs検定 SD2 L(L=8) SD2 H(L=8) SDH L(L=8)       100(1-SD2 L/SD) 検定統計量: 100(1-SD2 H/SD) 検定統計量: 100(1-SDH L/SD) 0.23892 0.22242 0.22689 15.64 % 21.46 % 19.89 %

(22)

 AOACの室間共同試験ガイドライン9)では,3種類の減少率(%),100(1– SD2 L /SD),100(1–SD2 H /SD),100(1–SDHL /SD)のなかで最も大きな減少率が検定 統計量になる。  AOACの室間共同試験ガイドラインのPaired Grubbs検定の検定統計量   100(1–SD2 L /SD),100(1–SD2 H /SD),100(1–SDHL /SD)のなかで最も大きな値        … ⒇  室間共同試験のハーモナイズドプロトコル3)では,paired Grubbs検定について, AOACの室間共同試験ガイドライン9)とは異なる2段階の検定手順を採用してい る。はじめに 100(1–SD2 L /SD)と100(1–SD2 H /SD)のなかで大きな減少率を検定統 計量にして検定し,この検定で外れ値が検出されたらCochran検定に戻り,外れ 値が検出されなかったら 100(1–SDHL /SD)を検定統計量にして次の検定を行う。  paired Grubbs検定の3種類の検定統計量は,「すべての試験所の平均値は同じ 正規分布の母集団からランダムサンプリングによって得られた値である」という 帰無仮説のもとで,どれも0∼100%の間の値をとり,外れ値がなければ小さな 値になり,外れ値があれば大きな値になるから,多くの場合は小さな値になって 右に裾を引いた分布になる。したがって,この検定も上側危険率を設定した検定 になる。ただし,最小値側の2個又は最大値側の2個が外れ値候補になる場合は, 検定統計量の分布の形は同じであり,どちらが外れ値になるか事前に決まってい ないならば,最小値側が外れ値候補になる場合と最大値側が外れ値候補になる場 合の両方を検定するので両側検定になる。最小値と最大値の2個が外れ値候補の 場合は,最小値側の2個又は最大値側の2個が外れ値候補になる場合と形が少し 異なる検定統計量の分布に上側危険率を設定した検定になるが,この検定の対立 仮説は「最小値と最大値はともに,他の値と同じ正規分布の母集団からランダム サンプリングして得られる値とはいえない」であり,この仮説に方向性はないの で,両側検定か片側検定かの区分は当てはまらない。したがって,paired Grubbs 検定の結果を説明するときに,危険率や検定の方向性を示すには,室間共同試験 のハーモナイズドプロトコル3)のように,最小値側の2個又は最大値側の 2 個が 外れ値候補になる場合と,最小値と最大値の2個が外れ値候補の場合に分けた方 が説明しやすい。paired Grubbs検定による外れ値の有無を報告するだけならば, AOACの室間共同試験ガイドライン9)の手順の方が簡便である。  室間共同試験のハーモナイズドプロトコル3)及びAOACの室間共同試験ガイ ドライン9)には両側危険率 2.5%(片側危険率1.25%)の数表が記載されている。  室間共同試験のハーモナイズドプロトコル3)の検定手順では,表 10 よりPaired Grubbs検定のはじめの検定統計量は100(1−SD2 H /SD)=21.46%になり,上側危 険率 1.25%の棄却限界値56.4%(L=10の行とTwo highest or two lowestの列の交 差する箇所の値)より小さいので両側危険率 2.5%で有意差は認められなかった。

(23)

Paired Grubbs検定の次の検定統計量100(1−SDHL /SD)=19.89%は,上側危険率 1.25%の棄却限界値59.5%(L=10の行とOne highest and one lowestの列の交差す る箇所の値)より小さいので,上側危険率 1.25%で有意差は認められなかった。 4) 一元分散分析  外れ値を除外した表 10 の 10 試験所それぞれが2回併行分析したデータを一元 分散分析で解析し,精度指標を計算する。分散の大きさを推定することが目的で ある変量モデルを用いた一元分散分散の F 検定では,例題3の3)で説明したよ うに,F 分布の上側危険率を設定した片側検定を行う。  表 11 にExcelの「分析ツール」内にある「一元分散分析」の出力(分散分析表) を示す。表 11 の「観測された分散比」は「グループ間の分散」0.160411を「グル 表 11 表 10 の 20 個の測定値の一元分散分析表 変動要因 変動 自由度 分散 観測された分散比 P‒値 F境界値 グループ間 グループ内 1.4437 0.2718 9 10 0.160411 0.02718 5.901806884 0.005213 3.020382 合計 1.7155 19 表 12 報告書に記載する項目例 項目名 材料名(平均値の低い順に記載) 参加試験所数 データ解析に有効な試験所数 外れ値になった試験所数 各試験所の併行測定回数 平均値(%) 併行標準偏差 Sr(%) 併行許容差 2.8Sr(%) 併行相対標準偏差 RSDr(%) 室間再現標準偏差 SR(%) 室間再現許容差 2.8SR(%) 室間再現相対標準偏差 RSDR(%) HorRat − 12 10 2 2 7.19 0.16 0.46 2.3 0.31 0.86 4.3 1.4 注1)表中の値は表8のデータを解析した結果を示す。 注2)回収率を報告できるときは回収率の定義と値を報告する。 注3)参照したガイドラインを明記する。 注4)計算に使用したソフトウエア名,メーカ名,バージョンを明記する。 注5)データ解析から除外した試験所データも生データの表には記載し,    解析から除外した理由を注記する。    異常値として除外した試験所も把握できるように記載する。

(24)

ープ内の分散」0.02718で割った値で,F値という。「グループ内の分散」は,一 つの試験所内で併行分析を行ったときの平均的なばらつきの指標になり,「グル ープ間の分散」は「グループ内の分散」以上の大きさが期待されるので,F 値は 1以上が期待される。実際のデータ解析では,一元分散分析の F 値が1未満にな ることがあるが,その原因としては,実験の割付けをランダムに行わなかったか, 解析に用いた一元分散モデルの仮定が,そのデータでは成り立っていないかが考 えられる21)。よって,配付試料の番号には乱数を用いて,分析の順番が一定にな らないように気をつける必要がある。このような実験上の注意をして得られたデ ータでも F 値が1未満になった場合は,F 値=1,つまり SL=0 で Sr=SRとして3) 精度指標を計算する。  併行標準偏差 Srは,⒄式より Sr= 0.16(%)である。室間再現標準偏差SRは, ⒅式より SR= 0.31(%)である。定量分析法の室間共同試験の報告書に記載する 項目例3, 9)を表 12 に示す。 7. 定性分析法の室間共同試験のデータ解析   定 性 分 析 法 の 室 間 共 同 試 験 に つ い て, 定 量 的 な 化 学 分 析 法 に 関 す る IUPAC/ISO/AOACのハーモナイズドプロトコル3)のような国際的ガイドラインは 2008 年3月現在制定されていない。IUPACでは,2006年2月から定性的な分析 法及びスクリーニング法(例えば,ELISA法によるアレルギー物質の検知,PCR 法によるGMO検知,Lateral fl owデバイスによる迅速検査)の室間共同試験に関 するドラフトの作成を開始した26)が,ドラフトはまだ公開されていない。  AOAC の室間共同試験のガイドライン9)は定量分析法についてのガイドライン であるが,定性分析法の室間共同試験についてもハーモナイズドプロトコル以外 と明記した上で,実施上の最低条件が記載されている。 AOAC の定性分析法の室間共同試験実施上の最低条件 ・10 試験所が,陽性試料については1マトリック当たり2濃度,各濃度で6 試料の結果を報告する。 ・陰性試料については,マトリック当たり6試料の結果を報告する  2000 年版までのAOACの室間共同試験ガイドラインには,McClureの提案27) を受けて定性分析法の室間共同試験の最低実施条件として 15 試験所,5試料と 記載されていたが,2002 年のガイドラインから上記に変更された。  また,AOACには,食品微生物の定量及び定性の公式分析法の妥当性確認に関 するメソッドコミッティーのガイドライン28)がある。これには,食品微生物の 定性分析法について,単一試験室で行うメソッド比較試験(代替法と対照法の性 能比較)及び室間共同試験の設計ガイドラインが含まれている。室間共同試験の 試験所数などの条件は,上記の最低条件と同じである。

(25)

 上記の試験所数及び併行測定回数の最低条件は,感度(陽性試料の正解率) 又は特異性(陰性試料の正解率)の真値が 80%と仮定したときに,その± 10% の範囲内(72∼88%)に,正規分布近似を用いて計算した比率(正解率)の 90 %信頼区間が入るのに必要な試験所数 L と併行測定回数 m の条件を与える式, 362≤Lm2をほぼ満たすように決められている27)  ISO 16140:2003 食品及び動物用飼料の微生物に関する代替法の妥当性確認プ ロトコル29)では,以下の定性分析法の室間共同試験プロトコルを定めている。 ISO 16140:2003 の定性分析法の室間共同試験実施上の最低条件 ・外れ値のない最低 10 試験所の結果を報告する。 ・陰性試料,代替法の検出限界よりも少し高い濃度の試料,及び検出限界の 約 10 倍の濃度の試料の最低3濃度の試料を用いる。 ・ 各 試 験 所 は, 代 替 法 及 び 対 照 法 を 用 い て, 各 濃 度 の 非 明 示 試 料(blind sample)を最低8回併行測定する。 ・以上より,1試料について最低 480 個(2メソッド× 10 試験所×3濃度× 8回併行)の測定結果を報告する。 ・代替法については,微生物毎に試験が必要な試料タイプがまとめられてい るAnnex Bのリストから選択した各食品カテゴリーについて,少なくとも1 種類の製品を用いて試験する。 7.1 DNA マーカの妥当性確認  DNAマーカを用いた品種30),魚種31)などの判別技術の開発が活発に行われ ているが,DNAマーカを用いた判別法の室間共同試験による妥当性確認に関 するガイドラインは今のところ存在しない。法医学分野では,アメリカ国立標 準技術研究所(NIST)がDNA分析に関する妥当性確認の情報提供32)を行って おり,アメリカ連邦捜査局(FBI)はDNA分析を行う試験所の品質保証基準33) を公表している。さらに,法医学分野のDNA分析について,Forensic Science Communicationsに妥当性確認のガイドラインの改訂版34)が 2004 年に発表されて いる。このガイドラインには,法医学に新たに用いるDNA分析法の妥当性確認 (Developmental Validation)と,各試験所がDNA分析法を法医学に適用する前に 行うべき試験所内部の妥当性確認(Internal Validation)について記載されている。 Internal Validationといっても,分析法の性能指標については,メインラボとサテ ライトラボが独立にそれぞれ試験することを要求しているので,同じDNA分析 法を導入したい試験所が集まって行う室間共同試験の一種である。  Internal Validationは複数の試験所で行うことを想定しているため,妥当性確 認された分析法を利用したい試験所ごとに,妥当性確認試験で示された性能の 範囲内で,その分析法を利用可能か,利用開始前に確認する検証作業(method

(26)

verifi cation)と全く同一とはいえないが,両者の目的には共通性がある。  室間再現性(reproducibility)は,Method ValidationとInternal Validationの両方 の試験項目であるが,試験所数及び各試験所の併行測定回数などの室間共同試験 の具体的な条件は示されていない。

7.2 定性分析法の精度指標

 互いに関連のある感度(sensitivity rate),特異性(specifi city rate),偽陽性率(false positive rate),偽陰性率(false negative rate)の4種類の精度指標を報告する28)(表 13)。感度は,陽性(positive)であると既知の試料を陽性と判定した比率と定義 され,表 13 の各セルの頻度を用いると  感度 (%)=Npp

/(

Npp+ Npn

× 100 … である28, 35)。特異性は,陰性(negative)であると既知の試料を陰性と判定した 比率と定義され,  特異性(%)= Nnn

/(

Nnp+ Nnn

× 100 … である28, 35)。偽陽性率は,陰性であると既知の試料を陽性と判定した比率と定義 され,  偽陽性率(%)= Nnp

/(

Nnp+ Nnn

× 100 = 1– 特異性(%) … である28, 35)。偽陰性率は,陽性であると既知の試料を陰性と判定した比率と定義 され,  偽陰性率(%)= Npn

/(

Npp+ Npn

× 100 = 1– 感度(%) … である28, 35)  定性分析法の室間共同試験の最低実施条件に関するMcClureの提案27)のなか で用いられている偽陽性率と偽陰性率の定義は, 式, 式とは異なる36)が, 式, 式を用いる方がよい。   ∼ 式の4指標以外では,定量分析法の併行精度(repeatability)と室間再 表 13 定性分析結果の2×2分割表 試 料 判定結果 合 計 陽性 陰性 陽性(既知) Npp(正解) Npn(不正解) Np p+ Np n 陰性(既知) Nnp(不正解) Nnn(正解) Nn p+ Nn n 合 計 Npp+ Nnp Npn+ Nnn N=Np p+ Np n+ Nn p+ Nn n 注)Np p,Np n,Nn p,Nn nは各セル頻度,N は頻度の総計。

(27)

現精度(reproducibility)に対応する定性分析法の精度指標として,accordanceと concordance,さらにCOR(Concordance Odds Ratio)という3指標が2002年に提 案 さ れ37),ISO 16140:2003のAppendix Lにも記載されている29)。accordanceと concordanceの計算では,陽性試料と陰性試料は別々に計算する。  accordanceは, accordance (%)=同一試験所内で同じ結果(++又は--)を示したペアの数の全試験所の合計 全ペア数 ×100 … と定義されている。同一試験所内で6回併行測定したならば1試験所内のペア数 は6 2 6 6 2 2 6 5 2 15 C = = = −

(

)

× × ! ! ! ペアになる。全ペア数は1試験所のペア数×試験 所数である。  concordanceは, (%)=試験所間で同じ結果(++又は--)を示したペアの数の全試験所の合計 全ペア数 ×100 concordance … と定義されている。この場合には,同一試験所内のペアは数える対象外にする。 1材料について 10 試験所が6個ずつ結果を報告した場合,ある試験所の1個の 結果は,他の9試験所の6個ずつの結果と比較するので 6 × 9 = 54 通りある。1 試験所には6個の結果があるので,6 ×(6 × 9)= 324 通り,他の試験所の結果 と比較するペアがある。これが 10 試験所なので全ペア数は {6 ×(6 × 9)} × 10 = 3240 通りになる。全ペア数 3240 通りは,同じペアを2重に数えているので重複 なしの全ペア数 1620 通りの2倍になっているが, 式の分子,分母ともに2重 に数えればconcordanceの値は変わらず,計算は簡単である。  CORは,

COR accordance concordance

concordance accordance

( )

( )

( )

( )

× − × −

(

)

% % % % 100 100

(

)

… と定義されている。ここで,accordance,concordanceはパーセント表示の値である。 CORはaccordance,concordance及びこれら二つの比よりも感度に依存しない指標 である。COR=1.2ならば,同じ試験所で分析した方が異なる試験所で分析する よりも同じ結果が 1.2倍出やすいことを示す。CORが大きい程,試験所間の結果 の違いが大きいことを意味する。accordance=100%のとき,CORは無限大にな るが,accordanceとconcordanceが両方とも100%のときは試験所内も試験所間も 同じ結果が得られる確率は等しいのでCOR=1とする。  ISOの食品及び動物用飼料の微生物に関する代替法の妥当性確認プロトコル29) では,相対精確さ(relative accuracy),相対感度(relative sensitivity),相対特異

表 14 定性分析の室間共同試験における,ある濃度の陽性試料の報告例 陽性試料の判定結果 試験所 併行測定回数 1 2 3 4 5 6 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 111111111111110 101111111111111 111101111110111 111111111110111 111111101111101 111101111111111 注)1:陽性,0:陰性 表 15 定性分析法の室内精度の指標 accordance の計算 試験所 結果が 陽性
表 17 対応のある試料を用いた定性分析法の比較結果の例 対照表 陽性 陰性 代替法 陽性 50(a)   5(b) 陰性 10( c ) 55(d) 注)各セルは頻度を示す。 ば両側検定になり, 「b < c」又は「b > c」の方向性を問題にするならば片側検定に なる。両側検定を行う場合, 式のχ 2 c a l がカイ2乗分布の棄却限界値(自由度1, 上側危険率 100α%)より大きければ危険率100α%で有意になり 38) ,代替法と対 照法の結果は両側危険率 100α%で等しいとはいえない。カイ2

参照

関連したドキュメント

This review is devoted to the optimal with respect to accuracy algorithms of the calculation of singular integrals with fixed singu- larity, Cauchy and Hilbert kernels, polysingular

This review is devoted to the optimal with respect to accuracy algorithms of the calculation of singular integrals with fixed singu- larity, Cauchy and Hilbert kernels, polysingular

This review is devoted to the optimal with respect to accuracy algorithms of the calculation of singular integrals with fixed singu- larity, Cauchy and Hilbert kernels, polysingular

We simultaneously generalize the theory of Tannaka duality in two ways: first, we replace Hopf algebras with weak Hopf algebras and strong monoidal functors with separable

 Although the vacuous proof example on slide Although the vacuous proof example on slide 40 is a contradiction.. 40 is

In this study, we focused on the structural difference, and selected two analysis methods: (1) quantitative determination of reducing sugar obtained by enzymatic hydrolysis, and

Where a rate range is specified, the higher rates should be used (a) in fields with a history of severe weed pressure, (b) when the time between early preplant tank mix and

TriCor 4F herbicide tank mix combinations are recommended for preplant incorporated applications, pre-emergence surface applications, Split-Shot application and Extended