食糧　その科学と技術　No.46( )

(1)

Ⅲ データの統計的取り扱い

1. はじめに 分析法の妥当性確認についてはいくつかの国際的なガイドラインが存在し，そのなかにはデータ解析方法などの統計的な記述も含まれている。実験計画を立てたり，報告書をまとめるにはガイドラインを参照するのが一番であるが，要点については食品総合研究所ホームページ1）_{及び参考文献}2）_{でこれまでに紹介してき} た。したがって，ここでは，ガイドラインにそって報告書をまとめる際に必要になるデータ解析のなかの，１）ランダム性確保のための乱数の使い方，２）化学分析法の精度の妥当性判断基準に用いられているHorwitzの式，３）室間共同試験又は技能試験などの配付試料の均質性確認試験，４）化学分析の定量法の室間共同試験，５）定性分析法の室間共同試験，について例題を用いて説明する。なお，本稿ではIUPAC/ISO/AOAC Internationalのハーモナイズドプロトコルはハーモナイズドプロトコル，AOAC InternationalはAOACと記する。また，本稿では実験データから計算した不偏標準偏差（母集団の標準偏差σの 推定値）の頭文字には S を用いることにする。 2. データの表示方法と桁数 室間共同試験のハーモナイズドプロトコル3）_{には，報告のための最終的な平均} 値および標準偏差を計算するときは，計算途中で四捨五入，切り上げ切り下げのような丸めを行わず，計算機またはコンピュータで直接計算するように記載されている。そして，最終的に報告する標準偏差及び相対標準偏差の有効数字は 2 桁にし，平均値の有効数字は標準偏差の表示に合わせる。 例えば，室間再現標準偏差 SR＝ 0.012ならば平均濃度は0.147，室間再現相対標 準偏差 RSDR,%＝0.012/0.147×100＝8.2％と報告する。なお，平均濃度を0.1473 あるいは 0.15としてはならないと，室間共同試験のハーモナイズドプロトコル3）に例示されている。ただし，他の計算に使用する平均値や標準偏差は，桁数が多くなっても元データから直接計算した値をそのまま報告書に記載しておいた方が，他の計算で求める値の丸め誤差が大きくならない。平均値や標準偏差の桁数を多く記載する場合は，計算に使用した測定値の有効数字や定量下限を併記しておけば，必要に応じて丸めることもできる。 3. ランダム性の確保 分析法の妥当性確認のデータ解析では，一元分散分析や枝分かれ実験のような実験計画法に含まれる分散分析というデータ解析法をよく利用する。例えば，一元分散分析は配付試料の均質性確認試験データの解析や定量分析法の室間共同試

(2)

験データの解析に，枝分かれ実験は単一試験室における中間精度のデータ解析に用いる。中間精度は，併行精度（repeatability）と室間再現精度（reproducibility）の中間の大きさをもつ精度のため，このように呼ばれる4）_{。一つの試験所内で時} 間，オペレータ，校正，機器などの変動要因を一つ又は複数変更して各変動要因の標準偏差及び総合的な室内精度を推定することを中間精度の評価という4）_。ランダム性の確保は，代表性のあるサンプリング，並びに誤差の評価及び制御に用いる実験計画法に必須の基本原則であり，実験計画法におけるFisherの３原則（反復，無作為化，局所管理）の一つである。配付試料の均質性確認試験では，分析する試料を抜き取るとき，及び抜き取った試料を分析する順番を決めるときに，抜き取り方法及び順番が「ランダム」である必要がある。適当に無計画に抜き取っただけではランダムさは十分に確保できていない5）_{ため，ランダムであることを保証するには乱数を用いる必要がある。} 乱数を得るために乱数表を使う場合には，JIS Z9031：2001に乱数表が記載されており，その使い方として，１）乱数表の使用開始ページ，開始点をランダムに決める。２）10 進数の１桁又は２桁の乱数が必要な場合には乱数表の右方向に進み，右端になったら次の行の左端に移動する。３）10 進数の３桁以上の乱数が必要な場合には乱数表の下方向に進み，下端になったら次の列（同じページなら右方向）の上端に移動する。のような注意点が記載されている。電卓やパソコンソフトでも乱数が得られるが，本当に乱数として問題ないか確認した方が良い。例えば，Excel2003で乱数を発生させる関数RAND（）は修正プログラムを適用する必要がある6）_。 Excelで２桁の乱数が欲しい場合には，任意のセルに「＝INT（RAND（）×100）」と式を入力すると０∼99 の乱数（１桁の乱数は十の位が０の２桁とみなす）が得られ，この式の 100 の部分を 1000 に変更すれば０∼999 の３桁の乱数が得られ る。n 個のセルにこの式を入力すれば n 個の乱数が得られる。 例題 1 乱数の使用例 １）300 個の試料の中から 10 個をランダムに抜き取る。ａ）300 個の試料に任意に１∼300 の通し番号を付ける。ｂ）３桁の乱数 000∼999 を乱数表，電卓，パソコンなどから得る。ｃ）001∼300 の乱数が出たら，その乱数と同じ通し番号をもつ試料を抜き取る。ｄ）次の乱数に進む。それまでに出た乱数と同じ３桁の乱数のときは，その乱数は捨てて次の乱数に進む。ｅ）10 個の試料を抜き取るまで，ｃ）とｄ）を繰り返す。

(3)

ｃ）の方法では３桁の乱数 1000 個のうち 300 個しか使わないので効率が悪い。そこで，３桁の乱数を 300 で割った余りに１を足した数を試料番号として抜き取ると，000∼899 の 900 個の乱数が使えるようになり効率が良くなる。このとき，900∼999 の乱数が出たら捨てて次の乱数に進む。こうしないと１∼100 番の試料が 111∼300 番の試料よりも選ばれやすくなり，300 個の試料がどれも等しい確率で抜き取られることにならないためである。乱数の種類数（例えば２桁の乱数なら 100 種類，３桁の乱数なら 1000 種類）が，通し番号を付ける全試料数の整数倍でない場合は，捨てる乱数があることに注意する。 ２）18 個の試料を分析する順番をランダムにする。 ａ）18 個の試料に任意に１∼18 の通し番号を付ける。ｂ）２桁の乱数 00∼99 を乱数表，電卓，パソコンなどから得る。ｃ）２桁の乱数を 18 で割った余りに１を足した数を試料番号とする。このとき，90∼99 の乱数が出たら捨てる。ｄ）次の乱数に進む。それまでに出た乱数と同じ２桁の乱数のときは，その乱数は捨てて次の乱数に進む。ｅ）１∼18 のうちの 17 個の乱数が決まるまで，ｃ）とｄ）を繰り返す。乱数が決まった順に試料を分析する。 4. Horwitz の式 妥当性を判断するには何かしらの判断基準が必要である。食品分析の分野において，化学分析法によって得られた測定値のばらつきの判断基準として広く利用されているHorwitzの式7）について説明する。Horwitzの式は，例えば，配付試料の均質性の判定及び均質性の確認に用いた分析法の併行精度の妥当性の判定8）_，定量分析法の併行精度及び室間再現精度の妥当性の判定9, 10）_{，保管期間中の試料} の安定性の判定11）_{などに用いられている。} Horwitzは1980年に，化学分析法の室間共同試験から得られる室間再現相対標 準偏差 RSDR,%は，分析法・マトリックス・分析対象成分にかかわらず濃度Cが １％（C＝0.01）のときおおよそ４％であり，濃度が1/100になるごとに２倍にな ることを報告し7）_{，その関係式 PRSDR,%＝2}（1−0.5log₁₀C）_を_Thompson12）_{が以下の使い} やすい形の式に変形した13）_。 PRSD_R,% ＝2C−0.5log 102 ＝ 2C−0.1505

… ⑴

PRSD_R,%は室間再現相対標準偏差の予測値（predicted reproducibility relative standard deviation）である。PRSDR,%＝ R

C×100 なので，濃度 C における室間再現

(4)

,% R C RSD C C _C _C = × = × = = 100 2 100 −0.1505 1−0.1505 0.8495 R 0.02 0.02 … ⑵ になる。ここで，Rはギリシャ文字σが母集団パラメータ（母数）であることを， ^が推定値であることを示す。 ⑴ 式又は ⑵ 式のHorwitzの式を妥当性確認に利用するときの注意点として，１）食品分析の分野では，おおよそ 10ppbから10％の濃度範囲（Horwitz region）における室間再現標準偏差の予測値として利用可能なこと，２）Horwitzの式は室間共同試験データを回帰分析して求めた式ではないこと，３）分析法固有のバイアスが含まれていないため不確かさの目安として利用するには過小評価した値になっていることなどをThompsonは挙げている14）_。また，Horwitzは上記の式とともに，室間再現標準偏差SR（異なる試験所で分析したときの測定値のばらつきを考慮した標準偏差で，多数ある試験所のなかのある一カ所で１回分析したときの測定値の不確かさを示す推定値）は，併行標準 偏差 Sr（同一の試験所において，同一のオペレータが同一の機器を用いて，分析 用試料から均質な条件下で分析試料を取り出して行う併行分析を可能なかぎり短い時間内で複数回行ったときの測定値のばらつきを示す標準偏差で，併行分析の条件下で１回測定した測定値の不確かさを示す推定値）の通常 1.5∼２倍であることも報告している7）_。化学分析の定量法の性能指標として，室間共同試験で得られた室間再現相対標 準偏差 RSDR ,%と，Horwitzの式で予測される室間再現相対標準偏差PRSDR ,%の 比であるHorRat（Horwitz Ratioの略語で，HORRAT又はHorratと表記されてきたが，2004 年に造語の語源を示唆するHorRatという表記が提案されている13）_）が，妥当性の判断に利用されている。HorRatによる判断基準を以下に示す。 HorRatによる室間再現標準偏差 SRの妥当性の判断基準・AOACの室間共同試験のガイドライン9）_{では 0}_{.5 < HorRat ≤ 2なら妥当} ・EU15）_{ではHorRat < 2なら妥当}

CodexのCCMAS（Codex Committee on Methods of Analysis and Sampling）では「Analytical Terminology for Codex Use」（step３）のなかでHorRatについても検討

されている16）_。 Horwitzの式は，化学分析法については，分析法・マトリックス・分析対象成分に依存せず，濃度だけで測定値のばらつき（標準偏差）を予測できることを示している。マトリックス・分析対象成分に依存しないことから，広い範囲の試料に適用可能な点が，妥当性の判断基準が必要という理由とともにHorwitzの式が広く利用されている理由である。ただし，低濃度側と高濃度側については Horwitzの式の実データへの当てはまりが良くないため，Thompsonが2000年に

(5)

以下の修正式を提案している17）_。 ( 1.2 ) ( C C C C C C ＝＜ × ≤ ≤ −7 −7 10 1.2 10 0.138 (0.138 ) 0.5 _＜ ) R 0.8495 × 0.22 0.02 0.01 … ⑶ ⑶ 式から室間再現相対標準偏差 PRSDR,%の式を導出すると以下になる。 PRSDR,% C C C ( ) ＝ × × ≤ ≤ −7 22 1.2 10 2 −0.1505 10−7 0.138 ( ) C−0.5 ( 1.2_0.138 C ) ＜＜ … ⑷ ⑶ 式と ⑷ 式の修正式は，FAPASの技能試験プロトコル18）_{に採用されており，} 技能試験のハーモナイズドプロトコル8）でも言及されているが，HorRatについて記載しているAOACの室間共同試験のガイドライン9）_{には今のところ記載され} ていない。 SR＝1.5Sr∼2Srの関係から，⑴∼⑷ 式は Srの妥当性の判断にも利用可能である。つまり，内部精度管理における測定値のばらつきの妥当性確認にもHorwitzの式は利用できる10, 19）_。多くの化学分析法がHorRatの対象になるが，１）粘度，屈折率，密度，pH，吸光度等の物理特性値，２）食物繊維，酵素，水分，又はポリマーのように分子量不定なものの分析法等の経験的分析法（empirical methods），３）固形物重量（drained weight）のような品質測定（”Quality” measurement，品質の善し悪しを判

定する測定法）は， HorRatの対象外である9）_。例題２ Horwitz の式の計算例化学分析法を用いて以下の濃度を測定したときの室間再現標準偏差及び室間再現相対標準偏差の予測値をHorwitzの修正式を用いて求める。１）20mg/kg ２）100ppb ３）20％４）100g/kg ５）0.05ppm ⑶ 式を用いて室間再現標準偏差 _Rを計算し，⑷ 式を用いて室間再現相対標準 偏差 PRSD_R,%を計算する。濃度によってHorwitzの修正式は３通りあるので，ど の式を選択するか注意する。また，濃度 C には 1 ppbなら1 ×10‒ 9_，1_ppm又は1 mg/kgなら1×10‒ 6_，１_{g/kgなら1×10}‒ 3_{，1 ％なら1×10}‒ 2_{を代入する点にも注} 意する。 例えば，C ＝ 1 ppmのとき， R＝ 0.02（1×10−6）0.8495＝ 1.6×10−7＝ 0.16×10−6＝ 0.16 （ppm） PRSDR,%＝2（1×10−6_）−0.1505_{＝ 16 （％）} になる。表１に例題２の解答を示す。

(6)

5. 均質性確認試験 室間共同試験や技能試験では，均質性を確認した試料を配付する。この均質性の確認方法について，具体的な方法を記載したガイドラインがいくつか存在する 8, 20, 21）_{。どのガイドラインでも，予備も含めて必要数を調製した配付試料のなか} から，乱数を用いてランダムに複数個（AOACでは８個以上21）_{，技能試験のハー} モナイズドプロトコルでは 10 個以上8, 20）_{）の分析用試料（}_{test sample）を抜き取り，} 抜き取った各分析用試料から併行分析用に複数個（AOACでは３個以上21）_，技能試験のハーモナイズドプロトコルでは２個以上8, 20）_{）の分析試料（test portion）} を取り出す。均質性確認に用いる分析用試料は，配付試料の一部であり，その測定値から残りの未測定の配付試料の均質性を判定するためには，配付試料を代表するように分析用試料を乱数を用いてランダムサンプリングすることが必須である。均質性確認のために分析する試料の総数は 20 個以上になるが，これらの試料を分析する順番も乱数を用いてランダムにする。測定値が時間とともにシフト（ドリフト）すると試料間の濃度差にドリフト分が加算され，均質性の判定結果に影響を及ぼす危険性があるため，分析する順番をランダムにすることも重要である。次に，試料量について注意しておく。分析法のプロトコルの妥当性確認が目的で行う室間共同試験では，試験所に配付する試料量は，基本的には試験所が２回併行分析できない必要最小限の量である。したがって，均質性の確認試験は，分析プロトコルで定めた試料量より少ない量（約 1/2になる場合あり）で分析を行うことになる。そこで，試料量が少ないと分析精度の低下が懸念される場合（例えば，検出器の感度不足など）は事前に分析精度を確認する。以上のようにして得られた 20 個以上の測定値を用いて配付試料の均質性を確認するが，判定方法がガイドラインによって異なる。また，得られた測定値の外れ値検定を行うかどうかや外れ値検定の危険率もガイドラインよって異なる。よって，均質性確認試験の方法を報告するときは，参照したガイドラインを明記する。ここでは，均質性確認試験の代表的な判定方法について，図１のフローに従って例題を用いて説明する。均質性確認試験では，変量モデルを用いた一元分散分析を行い，分析用試料間 表 1 例題２の解答 濃度 R PRSDR, ％１） 20 mg/kg ２） 100 ppb ３） 20 % ４） 100 g/kg ５） 0.05 ppm 2.0 22 0.45 2.8 0.011 mg/kg ppb % g/kg ppm 10 22 2.2 2.8 22 % % % % %

(7)

の測定値のばらつき（サンプリング誤差）と併行分析による測定値のばらつき（併行精度）のそれぞれの大きさ（分散）を推定する。均質性確認試験によって得られる測定値の変量モデルとして， x_ij＝μ＋α_i＋εij … ⑸ を考える。ここで，xijは分析用試料 i から取り出した分析試料 j を分析して得られ た測定値，μは測定値の真値，αiは分析用試料が異なることによって測定値が変動する主変動因子のサンプリング誤差を表し，併行分析による測定値のばらつき εijとは独立な平均０，分散σ2samの正規分布 N

（

0,σ2sam

）

に従って変動すると仮定する。εijは誤差因子で，各分析用試料は共通の分散をもち，互いに独立な平均０，（IUPAC, 2006） 均質性確認試験のデータ取得 Cochranの外れ値検定（等分散の検定） 分散分析 分析精度（併行精度）の確認 均質性の判定 実験デザイン、ガイドラインの選択 0.5 p an＜１）一元分散分析のF検定 ２）“十分に均質”の条件（IUPAC, 1993: ISO 13528）３) ２)を緩和した条件（IUPAC，2006：FAPAS) ＋＝

sam all all

2 2 m−1,1− S _m−1 San2 F1 ＋ S F 上側危険率１％（IUPAC, 2006）又は 5％（AOAC, FAPAS）。IUPAC, 1993は外れ値検定行わない。 m＝1 0 以上， r＝2 が目安 ( IUPAC, 1993又は2006）。分析する順番はランダムにする。 m−1,m(r−1),1− r ＜ 0.3 sam S p 2 2 an 2 F 2 −1 図１均質性確認試験の実施手順 図中のIUPACは技能試験のハーモナイズドプロトコルの1993年版20）_{，2006 年版}8）_，AOACは均質性確認のガイドライン21）_{，FAPASはFAPASの技能試験プロトコル}18）_{を示す。m は分析用} 試料の数，r は各分析用試料の併行測定回数である。σpは，妥当性確認を行う目的に適合した

標準偏差を表しており，添え字のpはfi tness for purposeのpurposeの頭文字である。化学分析法ではσpにHorwitzの式から計算した室間再現標準偏差を用い，３）の均質性判定式中のσall＝ 0.3

σpである。各分析用試料の併行測定回数が不揃いで，回数を揃えたい場合は，余分な測定値を

乱数を用いてランダムに選択して取り除く22, 23）_{。複数の材料の均質性を判定する場合は，均質}

(8)

分散σ2

anの正規分布 N

（

0,σ2an

）

に従って変動すると仮定する。⑸ 式の未知パラメータμはデータの総平均値で推定し，σsamとσanは一元分散分析によって推定する。均質性確認データから求めたσsam，σanの推定値をそれぞれ Ssam ，Sanとする。 均質性確認試験で得られた m × r 個の測定値（図２）から，⑹ 式と ⑺ 式の左 辺を計算する。これらの式の左辺は，一元分散分析のグループ内分散（6式）とグループ間分散（7式）の計算式であり，右辺は，⑸ 式の変量モデルを用いて求めた左辺の期待値である。 x x m r S ij i j r i m an

(

)

(

)

＝

∑

＝

∑

2 1 1 2 1 ･ − − ＝ … ⑹ r x x m S rS i m an sam − −

∑

2 1 2 2 1

(

i･･･

)

＝ _＝ _＋ … ⑺

併行標準偏差 Sanは，i 番目の分析用試料の測定値 xi･とそこから取り出した分析 試料の測定値 xijの差の２乗を r 個（j ＝ 1,…, r）足し，それをm個（i＝1,…, m）の 分析用試料分足したものを自由度 m（r–1）で割った不偏分散の平方根になる。ここで，分析用試料の測定値x_i･は r 個の分析試料の測定値 xijの平均値である。 m × r 個の全測定値の総平均値x･･と i 番目の分析用試料の測定値xi･の差の２乗 を m 個（i ＝ 1,…, m）足したものをr倍し自由度m–1で割った不偏分散は，併行精 度の分散 S2 anとサンプリング誤差の分散 S2samの r 倍の和に等しい。 よって，⑺ 式の左辺の値から ⑹ 式の左辺の値を引き，r で割ると S2 samが得られ， 図２均質性確認試験のデータ構造 １個の分析用試料から取り出した１個の分析試料を１回分析したときの測定値 x の不確かさ を表す分散σ2 x＝σ2an+σ2sam 平均値（総平均値）の推定 an samの推定 1 r 11 x 1r x 1 m x mr x 併行測定回数分析用試料1 ・・・・・・・・分析用試料m 1･ x xm_･ x･･・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

(9)

その平方根が Ssamになる。 Excelでは，「分析ツール」内の「一元分散分析」を行うと出力される分散分析 表の「グループ内の分散」＝ S2_{an，「グループ間の分散」＝ S}2 an＋ rS2samになる。したがって，Excelを用いると San＝グループ内の分散 … ⑻ S r sam＝グループ間の分散−グループ内の分散 … ⑼ で Sanと Ssamを求めることができる。「グループ間の分散＜グループ内の分散」の場合については，例題３の４）の解答で説明する。例題３均質性の確認試験データの解析例図１のフローに従って表２のデータを用いて均質性の確認を行う。１）Cochran検定（危険率は上側１％）を行い，外れ値があれば除外して再検定し，なければ次に進む。２）併行精度（併行標準偏差）は，技能試験のハーモナイズドプロトコル（2006）8）の基準を満たしているか確認し，基準を満たしていれば次に進む。 ３）一元分散分析の F 検定で，試料は均質といえるか確認する。 ４）技能試験のハーモナイズドプロトコル（1993） 20）_{の判定によって，試料は} 「十分に均質」といえるか確認する。５）技能試験のハーモナイズドプロトコル（2006）の判定によって，試料は均質といえるか確認する。 表２均質性確認試験のデータ 単位（mg/kg）試料１試料２試料３試料４試料５試料６試料７試料８試料９試料 10 測定値 5.64 5.46 5.52 5.55 5.48 5.35 6.15 5.45 5.48 5.43 5.57 5.44 5.43 5.60 5.40 5.38 5.69 5.59 5.48 5.53 注）「試料」は分析試料の略１）Cochran 検定配付試料の均質性の判定をするために，表２のデータを用いて一元分散分析を行うが，「各分析用試料の分散が等しい」という分散分析の前提条件を満たしているかはじめに確認する。均質性確認試験における外れ値検定について記載しているガイドライン8, 21）_{では，この等分散の検定に}_{Cochran検定を採用している。} Cochran検定は，分析用試料の測定値のばらつきは正規分布に従うと仮定して，

(10)

「分析用試料の分散はすべて等しい」という帰無仮説を検定する。Cochran検定の結果が有意な場合は，当該の分析用試料のデータを除き，残りの分析用試料のデータでCochran検定を繰り返す。ただし，技能試験のハーモナイズドプロトコル（2006）8）_{には外れ値になる分析用試料が２個以上含まれる均質性確認データは疑} わしいので破棄すべきと記載されている。 Cochranの検定統計量を求めるために，分析用試料毎に測定値の分散Si2を計算 する。測定値が２個の場合は２個の測定値の偏差の２乗 Di2_{を計算しても同じ検} 定統計量が得られる。各分析用試料の測定値が３個以上ある場合は，そこから測定値２個を取り出す全ての組み合わせについて偏差の２乗を計算し，それらの和 が Di2_{になる。つまり，併行測定回数 r ＝ 2 のときは D} i 2_＝

_（

_x i1–xi2

）

2であり，r ＝ 3 のときは Di2_＝

_（

_x

i1–xi2

）

2＋

（

xi1–xi3

）

2＋

（

xi2–xi3

）

2である。

Cochranの検定統計量は，最大のSi2又は Di2が，全分析用試料の Si2又は Di2の和に占める比率なので以下の式で計算する。 Cochranの検定統計量 C Si i m ＝＝ max 2 2 1 S … ⑽ C Di i m 1 ＝Dmax2 2 ＝ … ⑾ 表２の分析用試料では，分析用試料４のばらつき（Si2_{又は Di}2_{）が最大（表３）} なので， Cochranの検定統計量 C Si i m 1 0.245 0.3007 ＝Smax2 2＝＝＝ 0.815 C Di i m 1 0.49 0.6014 0.815 max 2 2 ＝D ＝＝＝となる。 Cochran検定統計量は，０より大きく１より小さい値をとる。等分散の仮定の 表 3 Cochran 検定の１回目 試料１試料 2 試料 3 試料 4 試料 5 試料 6 試料 7 試料 8 試料 9 試料 10 計 Cochran の検定統計量測定値 5.64 5.46 5.52 5.55 5.48 5.35 6.15 5.45 5.48 5.43 5.57 5.44 5.43 5.60 5.40 5.38 5.69 5.59 5.48 5.53 標準偏差 Si S2i 0.127 0.01620 0.021 0.00045 0.092 0.00845 0.495 0.24500 0.035 0.00125 0.092 0.00845 0.120 0.01445 0.014 0.00020 0.071 0.00500 0.035 0.00125 0.30070 0.815 偏差 Di Di2 0.18 0.0324 -0.03 0.0009 0.13 0.0169 0.70 0.4900 0.05 0.0025 0.13 0.0169 -0.17 0.0289 0.02 0.0004 0.10 0.0100 -0.05 0.0025 0.6014 0.815

(11)

もとで，Cochran検定統計量の分布は，右に裾を引いた分布になるが，分析用試料数及び各分析用試料の併行測定回数によって分布の形が変化する。したがって， Cochran検定統計量の棄却限界値は，上側危険率，分析用試料数，及び各分析用試料の併行測定回数によって定まる値である。 Cochran検定統計量の上側危険率５％又は１％の棄却限界値は，JIS Z 8402 2： 1999 又は技能試験のハーモナイズドプロトコル（2006）8）_{に記載された数表で確} 認する。ただし，ハーモナイズドプロトコルの数表は各分析用試料の併行測定回数が２回の場合だけ記載してあり，JIS Z 8402 2の数表には併行測定回数が２∼ ６回の場合が記載されている。 上側危険率１％，抜き取った分析用試料数 m ＝ 10，各分析用試料の併行測定 回数 r ＝２のCochran検定統計量の棄却限界値は0.718であり，上記のCochran検定統計量 0.815が棄却限界値0.718を超えているため，分析用試料４の２個の測定値のばらつきは上側危険率１％で外れ値である。この検定では，分散が小さいことは外れ値と考えず，最大分散だけを外れ値候補として検定するので上側危険率を設定した片側検定である。 表４ Cochran 検定の２回目 試料１試料 2 試料 3 試料 5 試料 6 試料 7 試料 8 試料 9 試料 10 計 _{検定統計量}Cochran の測定値 5.64 5.46 5.52 5.55 5.48 5.35 5.48 5.43 5.57 5.44 5.43 5.60 5.40 5.38 5.69 5.59 5.48 5.53 標準偏差 Si Si2 0.127 0.01620 0.021 0.00045 0.092 0.00845 0.035 0.00125 0.092 0.00845 0.120 0.01445 0.014 0.00020 0.071 0.00500 0.035 0.00125 0.05570 0.291 偏差 Di Di2 0.18 0.0324 -0.03 0.0009 0.13 0.0169 0.05 0.0025 0.13 0.0169 -0.17 0.0289 0.02 0.0004 0.10 0.0100 -0.05 0.0025 0.1114 0.291 分析用試料４のデータを除外して，再度Cochran検定を行う。残り９個の分析用試料のなかでは分析用試料１のばらつきが最大である（表４）。 Cochranの検定統計量 C Si i m =1 0.0162 0.0557 0.291 ＝ 2＝＝ max 2 S C Di i m =1 0.0324 0.1114 0.291 2 max 2 D ＝＝＝ 上側危険率１％，m ＝ 9，r ＝ 2 のCochran検定統計量の棄却限界値は0.754であり，Cochran検定統計量0.291は棄却限界値0.754以下なので，外れ値は存在しない。

(12)

２）併行精度（併行標準偏差）のチェック分析用試料４を除外した９個の分析用試料の２回併行測定データを用いて一元分散分析を行う。Excelで計算した分散分析表を表５に示す。分散分析表の「グループ間の分散」の自由度は分析用試料数−1，「グループ内の分散」の自由度は分析用試料数×（併行測定回数− 1）になっていることを確認する。 ⑻ 式より一元分散分析のグループ内の分散の平方根が，併行標準偏差 Sanなので， San＝ 0.006189＝0.0787（mg/kg） 18 個の測定値の総平均値 5.50（mg/kg）を⑵式のHorwitzの式に代入して， R＝ 0.02×

（

5.50×10−6

）

0.8495＝ 0.6807（mg/kg） San＝ 0.0787＜0.5 R＝ 0.34なので，均質性確認試験に用いた分析法の併行精 度に問題はない。 ３）一元分散分析の F 検定による均質性確認 表５より一元分散分析の観測された分散比 Fcal＝ 1.8は，上側危険率５％のF境 界値 3.2よりも小さく，Ｐ値＝0.196＞0.05で５％有意ではないため，試料は均質といえる。 F 検定によって二つの分散の大小を検定する場合は，「分散 1 ＝分散 2」という 帰無仮説に対する対立仮説が「分散 1 ≠分散 2」ならば，F 分布の上側と下側の両 方に危険率を設定した両側検定になり，「分散 1 ＜分散 2」又は「分散 1 ＞分散 2」ならば下側危険率又は上側危険率のどちらかを設定した片側検定になる。均質性確 認試験の場合は，変量モデルを用いた一元分散分析を行っており，この F 検定の 帰無仮説は「⑸ 式の変量モデルのσ2 sam＝ 0」であり，対立仮説は「σ2sam＞ 0」で ある。したがって，この F 検定は，上側危険率を設定した片側検定である。 表５表４の 18 個の測定値の一元分散分析表 変動要因変動自由度分散観測された分散比Ｐ値Ｆ境界値グループ間グループ内 0.089878 0.0557 8 9 0.011235 0.006189 1.815305206 0.196257 3.229587 合計 0.145578 17

(13)

４）「十分に均質」の判定技能試験のハーモナイズドプロトコル（1993）20）_{で採用された「十分に均質」} の判定式 Ssam＜ 0.3σp … ⑿ が成り立つか計算する。化学分析法ではσpにHorwitzの式から計算した室間再現標準偏差 _Rを用いる。この判定式の右辺の 0.3は次のような意味をもつ。サンプリング誤差σsamがσRの 0.3倍の場合，このサンプリング誤差は各試験所に配付した試料濃度の違いに反映されるため， σ2R＋σsam2 ＝ σR2＋

（

0.3σR

）

＝ 1.09σR2＝1.04σR 2 _{… ⒀} のように室間再現標準偏差σRが約５％大きくなる。５％程度の誤差は許容できる24）_ので，σ samが 0.3σRより小さければ，σRの推定にσsamは影響しないと考える。表５の分散分析表の「グループ間の分散」と「グループ内の分散」から ⑼ 式 を用いて Ssamを求めると， Ssam＝（0.011235−0.006189）/2＝0.0502（mg/kg）上記の２）で求めた R＝ 0.6807を用いると， Ssam＝ 0.0502＜0.3 R＝ 0.3×0.6807＝0.204 なので「十分に均質」といえる。技能試験のハーモナイズドプロトコル（1993）20）_{では，外れ値検定を行わずに} ⑿式の判定を行うので，1993 年のプロトコル通りに判定するには表１のデータの一元分散分析を行う。表６に表１のデータの分散分析表を示す。表６では「グループ間の分散＜グループ内の分散」なので，⑼ 式の平方根の中が負の値にな りサンプリング誤差 Ssamを求めることができない。AOACの均質性確認のガイドライン21）_{では，一元分散分析の分散比は理論的には１以上が期待されるのに１} 未満の値が得られる原因として，測定順をランダム化していないか，一元分散分析モデルの仮定が成り立っていないことを挙げている。実際には測定順をランダ 表６表１の 20 個の測定値の一元分散分析表 変動要因変動自由度分散観測された分散比Ｐ値Ｆ境界値グループ間グループ内 0.25068 0.3007 9 10 0.027853 0.03007 0.926283117 0.541075 3.020382 合計 0.55138 19

(14)

ム化しても「観測された分散比」が１未満になることは起きており，そのときは Ssam＝０とみなすが，外れ値検定を行っていない場合は，外れ値検定を利用した場合の結果を検討してから均質性の最終的な判断をした方がよい。５）「十分に均質」の判定条件を緩和した判定技能試験のハーモナイズドプロトコル（1993） 20）_{の Ssam}_{＜ 0.3σ} pによる「十分に均質」の判定は，併行標準偏差が小さい分析法を用いた場合などに判定条件が厳しすぎることがあるため，FAPASの技能試験プロトコル（2002） 18）_{では，この} 判定条件を緩和した条件24）_{を採用した。技能試験のハーモナイズドプロトコル} （2006） 8）_{でもFAPASと同じ判定条件を採用している。} 配付試料の均質性を判定するために，データから一元分散分析を用いて計算し たサンプリング誤差 Ssamは，真のサンプリング誤差σsamの推定値である。計算さ れた Ssamはデータから考えて最も確からしい真のσsamの推定値であるが，推定誤差があるため真のσsamがもっと小さい値になる可能性は存在する。そこで，σsam の 95％信頼区間（ただし，片側危険率５％を使用）の下限値を真のσsamの推定値 とみなせば，一元分散分析で計算した Ssamよりも小さな値になり，Ssam＜ 0.3σpの判定式の左辺が小さくなって均質と判定される可能性が高くなる。この考え方に基づいた均質性の判定式が以下の式である。 S m F r S F F S

sam2 m all m m r an all

1 1 2 2 1 1 1 2 1 2 2 1 −1 ≤ − ＋＝＋ −,− −,(−),− aan2 … ⒁ ここで，m は分析用試料数，r は分析用試料の併行測定回数，αは上側危険率5 ％なので 0.05を用いる。σallは許容可能なサンプリング誤差の上限で，十分に均 質の判定式の⑿式と同じ 0.3σpを用いる。 m ＝７∼20，r ＝２のときの F1と F2の値は技能試験のハーモナイズドプロトコル（2006）8）_{の数表に掲載されている。この数表にない m と r については，χ}2 m−1,1−α はExcelのCHIINV（α, m–1）関数で計算し，Fm−1, m（ r−1）,1−αはExcelのFINV（α, m–1, m（r–1））で計算すると，F1と F2を求めることができる。例えば，m ＝ 10，r ＝ 2 のとき， CHIINV（0.05, 10–1）＝16.91896よりF1＝ 16.91896/9＝1.88 FINV（0.05, 10–1, 10（2–1））＝3.020382よりF2＝

（

3.020382–1

）

/2＝1.01 となる。 m ＝９，r ＝２のとき，技能試験のハーモナイズドプロトコル（2006）8）_に記載 された数表より⒁式の F1＝1.94，F2＝1.11である。この例題３の２）及び４）より， 外れ値除去後の 18 個のデータの分散分析表（表５）から計算した San＝ 0.0787 （mg/kg），Ssam＝0.0502（mg/kg）である。例題３の２）より R＝0.6807（mg/kg）

(15)

なので，⒁式中のσall ＝ 0.3σp＝0.3 R＝0.3×0.6807になる。しがって， ⒁式の不等式の左辺＝（0.0502）2＝ 0.0025 ⒁式の不等式の右辺＝ 1.94（0.3×0.6807）2_{＋ 1}_{.11（0.0787）}2_{＝ 0}_.088 なので⒁式の不等式が成立し，試料は均質といえる。 ⒁式の右辺第１項がないと一元分散分析の F 検定と同じ不等式になるため，一 元分散分析の F 検定で均質な材料は⒁式では必ず均質になる。 この例題では３種類の均質性判定式を全て計算したが，実際の均質性確認では，用いる判定式を先に決めて，その判定式の計算だけ行えばよい。 6. 化学分析の定量法の室間共同試験のデータ解析 化学分析の定量分析法については，室間共同試験のハーモナイズドプロトコル3）及びAOACの室間共同試験ガイドライン9）を参考にデータ解析を行う。ISO 5725–2 25）_（_{JIS Z 8402–2はこれの一致規格）も室間共同試験のガイドラインであ} るが，以下に示す実施上の最低条件は記載されていない。一元分散分析を用いて室間共同試験のデータから室間再現標準偏差σRと併行標準偏差σrを推定するという基本的部分はIUPAC，ISO，AOACの三者共通であるが，外れ値検定の方法などに多少の違いがあるので，報告する場合には参考にしたガイドラインを明記する。 AOACの室間共同試験ガイドライン9）_{に記載された試験実施上の最低条件を以} 下に示す。 AOAC の定量分析法の室間共同試験実施上の最低条件・外れ値検定後の有効試験所数が８以上（必要な設備・機器を所有している試験所が限定される場合は５以上）。・分析法の適用範囲と考えているマトリックを代表する材料数が５以上（１マトリックスに１濃度のときは３材料に減らしてもよい）。 ・各試験所の併行測定回数は，室間共同試験で Srを求めないときは１回，Srを 求めるときは２回。併行測定は非明示の２反復（blind duplicate）又はsplit levels（Youdenペア）で通常は行うべきである。材料数の注意点として，規制値との比較が目的の分析法では，少なくとも規制値未満と規制値超の２材料で妥当性を確認する必要があり，１マトリックス２濃度以上で試験する必要がある。試験所間の測定値のばらつき（分散）と試験所内の測定値のばらつきを推定するために，室間共同試験によって得られる測定値の変量モデルとして，

(16)

を考える（図３）。ここで，xijは試験所 i が j 番目に分析して得られた測定値，μ は測定値の真値，αiは試験所が異なることによって測定値が変動する主変動因子を表し，併行分析による測定値のばらつきεijとは独立な平均０，分散σ2Lの正規分布 N

（

0,σ2 L

）

に従って変動すると仮定する。εijは誤差因子で，各試験所は共通の分散をもち，互いに独立な平均０，分散σ2 rの正規分布 N

（

0,σ2r

）

に従って変動すると仮定する。⒂式の未知パラメータμはデータの総平均値で推定し，σLとσr は一元分散分析によって推定する。室間共同試験データから求めたσL ，σrの推 定値をそれぞれ SL ，Sr とする。⒂式は均質性確認試験の変量モデル ⑸ 式と同じ 形なので，図２の分析用試料を試験所と読み替えることができ，⑹ 式の S2 anを S2r ， ⑺ 式の S2 samを S2Lとして計算に利用できる。室間再現標準偏差σRの推定値 SRは SR＝ Sr2＋SL2 … ⒃ 測定値＝真値＋室間変動＋室内変動総平均が推定値

(

_0,

2

)

L

N

₍

_0,

2

₎

r

N

(

_,

2

)

R

N

L S が Sr 推定値が推定値

m

0

0 m

図３定量分析法の室間共同試験によって得られる測定値の変量モデル 表７化学分析法の室間共同試験の模擬データ 濃度（％）試験所測定値１測定値２測定値３ 1 2 3 4 5 6 7 8 9 10 11 12 7.25 7.32 7.67 7.00 5.80 7.42 7.24 7.32 7.09 6.79 6.87 7.16 7.21 7.42 7.57 7.08 5.70 7.62 6.94 7.48 6.69 7.69 6.67 6.76 7.17 7.42 7.00 総平均 7.09（n＝27）

(17)

で求める。SRは，SRを求めた分析法を用いて，多数ある試験所のなかのある一カ所で１回分析したときに得られる測定値の不確かさの推定値である。定量分析法の室間共同試験で各試験所から集まるデータを，行方向に試験所，列方向に併行分析の測定値で配置すると，表７のようなデータになる。室間共同試験は通常２回併行分析を行うので，測定値は通常２列になる。表７の行方向の測定値の変動から⒂式のモデルパラメータσLの推定値 SLを，列方向の測定値の変動から⒂式のモデルパラメータσrの推定値 Srを求め，室間再現標準偏差σRの推定値 SRは⒃式を用いて求める。 Excelで計算する場合は，「分析ツール」内の「一元分散分析」を行うと出力さ れる分散分析表の「グループ内の分散」が S2 r，「グループ間の分散」が S2r＋ rS2Lに 等しいので，Sr及び SRを簡単に求めることができる。出力された分散分析表の「グ ループ間の分散」の自由度は試験所数–1，「グループ内の分散」の自由度は試験所数×（併行測定回数–1）になっていることを確認する。 各試験所が r 回併行分析した場合の Srと SRは， Sr＝グループ内の分散 … ⒄ S _{＋グループ間の分散} r R＝グループ間の分散−グループ内の分散 … ⒅ で求めることができる。例題４化学分析の定量法の室間共同試験データの解析例表７の室間共同試験データを，室間共同試験のハーモナイズドプロトコル3）_及びAOACの室間共同試験ガイドライン9）_{の手順に従って解析する。両者はほぼ} 同じ手順であるが，異なる点については後述する。試験所によってデータ数が異なる場合に，データ数をそろえたいときは余計なデータを乱数を用いてランダムに選択して取り除く22, 23）_{。３個のデータを報告し} た試験所１，７，９については，そのうちの１個をランダムに取り除く。また，プロトコルに従わなかったなど有効なデータではない理由が明確な試験所のデータ（異常値）は外れ値検定の前に除外し，数値の記載ミスなど試験所に確認して修正が可能なデータ（異常値）は修正してから外れ値検定を行う。外れ値検定の手順を図４に示す。１） Cochran 検定室間共同試験の精度指標の計算の中心は分散分析である。分散分析では，各群の分散の大きさは等しいと仮定して解析するため，はじめに各試験所の分散がす

(18)

べて等しいといえるか検定する。室間共同試験のハーモナイズドプロトコル3）_及びAOACの室間共同試験ガイドライン9）_{では，この等分散の検定に}_{Cochran 検定} を採用している。例題３の 1）で説明したように，Cochran検定の検定統計量は⑽ 式又は⑾式で計算する。Cochran検定統計量の棄却限界値は，上側危険率，試験所数，及び各試験所の併行測定回数によって定まる値である。室間共同試験のハーモナイズドプロトコル3）及びAOACの室間共同試験ガイドライン9）のCochran 検定の数表には，上側危険率 2.5％の棄却限界値がパーセント表示されている。 これらの数表で試験所数 L＝12 の行と，各試験所の併行測定回数 r＝2 の列が交差 Cochranの検定有意 Y 精度指標の計算ﾙｰﾌﾟ開始除外する試験所数が検定開始時の試験所数の2/9以内なら削除外れ値 1個のGrubbs 検定有意 Y N N 外れ値 2個のGrubbs 検定有意このループで除外した試験室有り Y N N Y 有効（Valid）でないデータのスクリーニング除外する試験所数が検定開始時の試験所数の2/9以内なら削除除外する試験所数が検定開始時の試験所数の2/9以内なら削除終了最初及び最終の精度指標報告 図４室間共同試験データの外れ値検定のフロー

(19)

する箇所の棄却限界値は 59.2％である。⑽式を用いて計算した表８のCochran検定統計量 59.40％は棄却限界値の59.2％を超えているので上側危険率2.5％で有意である。したがって，最大分散を与えた試験所 10 の２個の測定値は外れ値として以後のデータ解析からは除外する。残りの 11 試験所のデータについてCochran 検定を行った結果，検定統計量は 28.90％になった。試験所数L＝11，併行測定 回数 r ＝ 2 のときの上側危険率 2.5％の棄却限界値は62.2％なので，11試験所の分 散に上側危険率 2.5％で有意差は認められない。２） single Grubbs 検定次に，各試験所の平均値のなかに外れ値がないかsingle Grubbs検定を行う。ま ず，11 個の平均値の標準偏差 SD を計算する。次に，11 個の平均値のなかの最大 値を除いた残り 10 個の平均値の標準偏差 SDH及び 11 個の平均値のなかの最小値 を除いた残り 10 個の平均値の標準偏差 SDLを計算する。外れ値１個を除けば標準 偏差は小さくなるはずなので，SDH又は SDLの SD に対する減少率（％），100（1– SDH /SD），100（1–SDL /SD）をそれぞれ計算し，減少率の大きい方をsingle Grubbs 検定の検定統計量にする3, 9）_。 Single Grubbs検定の検定統計量 100（1–SDH /SD）と100（1–SDL /SD）の大きい方の値 … ⒆ 100（1–SDH /SD）と100（1–SDL /SD）は，「すべての試験所の平均値は同じ正規分 表８ Cochran 検定の結果 試験所測定値１測定値２分散 1 2 3 4 5 6 7 8 9 7.21 7.32 7.67 7.00 5.80 7.42 7.24 7.32 6.69 7.17 7.42 7.57 7.08 5.70 7.62 6.94 7.48 7.09 0.0008 0.005 0.005 0.0032 0.005 0.02 0.045 0.0128 0.08 10 6.79 7.69 0.405 11 12 6.87 7.16 6.67 6.76 0.02 0.08 Cochran検定統計量 59.40 （％）注）この表は，表７で測定値が３個ある試験所は１個をランダムに削除したデータを示す。

(20)

布の母集団からランダムサンプリングによって得られた値である」という帰無仮説のもとで同じ分布をする。そして，100（1–SDH /SD）と100（1–SDL /SD）のどちらも０∼100％の間の値をとり，外れ値がなければ小さな値になり，外れ値があれば大きな値になるから，多くの場合は小さな値になって右に裾を引いた分布になる。したがって，この検定は上側危険率を設定した検定になる。ただし，各試験所の平均値のなかの最小値又は最大値のどちらが外れ値になるか事前に決まっていないならば，最小値が外れ値候補になる場合と最大値が外れ値候補になる場合の両方を検定するので両側検定になる。室間共同試験のハーモナイズドプロトコル3）_及び_{AOACの室間共同試験のガイドライン}9）_{には両側危険率 2}_{.5％（片側} 危険率 1.25％）の数表が記載されている。表 9 よりsingle Grubbs検定の検定統計量は100（1–SDL /SD）＝44.39％になる。 Grubbs検定の数表3, 9）_{で，試験所数 L ＝ 11 の行とOne highest or lowestの列の交差} する箇所の棄却限界値は 39.3％である。よって，検定統計量44.39％は，上側危険率 1.25％の棄却限界値39.3％よりも大きいため，11個の平均値のなかの最小値 5.75（％）は両側危険率2.5％で外れ値である。そこで，試験所５の報告した２個の測定値を解析から除外する。残りの 10 試験所のデータについて，Cochran検定， 表９ single Grubbs 検定 試験所測定値１測定値２平均分散 1 2 3 4 7.21 7.32 7.67 7.00 7.17 7.42 7.57 7.08 7.19 7.37 7.62 7.04 0.0008 0.005 0.005 0.0032 5 5.80 5.70 5.75 0.005 6 7 8 9 11 12 7.42 7.24 7.32 6.69 6.87 7.16 7.62 6.94 7.48 7.09 6.67 6.76 7.52 7.09 7.40 6.89 6.77 6.96 0.02 0.045 0.0128 0.08 0.02 0.08 Cochran検定検定統計量 28.90 （％） single Grubbs検定 SD（L＝11） SDH（L＝10） SD（L＝10）L 100（1-SDH/SD）検定統計量： 100（1-SDL/SD） 0.5093 0.4991 0.2832 2.00 ％ 44.39 ％

(21)

single Grubbs検定を行う（表10）。Cochran検定の検定統計量29.43％は上側危険率 2.5％の棄却限界値65.5％（L＝10，r＝2）より小さいので上側危険率2.5％で有意差は認められない。Single Grubbs検定の検定統計量100（1−SDH /SD）＝10.71 ％は，上側危険率 1.25％の棄却限界値42.8％（L＝10）よりも小さいので両側危険率 2.5％で有意差は認められない。 3） paired Grubbs 検定次に，２個の外れ値が互いに外れ値であることをマスキングしてsingle Grubbs検定では外れ値を検出できない場合があるため，各試験所の平均値のなかの最小値と２番目に小さい平均値の２個，最大値と２番目に大きい平均値の２個，又は最小値と最大値の２個の３通りについて，これら２個の平均値を除いたときの標準偏差 （SD2 L，SD2 H，SDHL）の減少率から外れ値を検出するpaired Grubbs検定を行う3, 9）。 表 10 paired Grubbs 検定 試験所測定値１測定値２平均分散 1 2 3 4 6 7 8 9 11 12 7.21 7.32 7.67 7.00 7.42 7.24 7.32 6.69 6.87 7.16 7.17 7.42 7.57 7.08 7.62 6.94 7.48 7.09 6.67 6.76 7.19 7.37 7.62 7.04 7.52 7.09 7.40 6.89 6.77 6.96 0.0008 0.005 0.005 0.0032 0.02 0.045 0.0128 0.08 0.02 0.08 Cochran検定検定統計量 29.43 （％） single Grubbs検定 SD（L＝10） SD（L＝9）H SD（L＝9）L 検定統計量：100（1-SDH/SD） 100（1-SDL/SD） 0.28321 0.25288 0.25751 10.71 ％ 9.07 ％ paired Grubbs検定 SD2 L（L＝8） SD2 H（L＝8） SDH L（L＝8） 100（1-SD2 L/SD）検定統計量： 100（1-SD2 H/SD） 検定統計量： 100（1-SDH L/SD） 0.23892 0.22242 0.22689 15.64 ％ 21.46 ％ 19.89 ％

(22)

AOACの室間共同試験ガイドライン9）では，３種類の減少率（％），100（1– SD2 L /SD），100（1–SD2 H /SD），100（1–SDHL /SD）のなかで最も大きな減少率が検定 統計量になる。 AOACの室間共同試験ガイドラインのPaired Grubbs検定の検定統計量 100（1–SD2 L /SD），100（1–SD2 H /SD），100（1–SDHL /SD）のなかで最も大きな値 … ⒇ 室間共同試験のハーモナイズドプロトコル3）_では，_{paired Grubbs検定について，} AOACの室間共同試験ガイドライン9）_{とは異なる２段階の検定手順を採用してい} る。はじめに 100（1–SD2 L /SD）と100（1–SD2 H /SD）のなかで大きな減少率を検定統計量にして検定し，この検定で外れ値が検出されたらCochran検定に戻り，外れ値が検出されなかったら 100（1–SDHL /SD）を検定統計量にして次の検定を行う。 paired Grubbs検定の３種類の検定統計量は，「すべての試験所の平均値は同じ正規分布の母集団からランダムサンプリングによって得られた値である」という帰無仮説のもとで，どれも０∼100％の間の値をとり，外れ値がなければ小さな値になり，外れ値があれば大きな値になるから，多くの場合は小さな値になって右に裾を引いた分布になる。したがって，この検定も上側危険率を設定した検定になる。ただし，最小値側の２個又は最大値側の２個が外れ値候補になる場合は，検定統計量の分布の形は同じであり，どちらが外れ値になるか事前に決まっていないならば，最小値側が外れ値候補になる場合と最大値側が外れ値候補になる場合の両方を検定するので両側検定になる。最小値と最大値の２個が外れ値候補の場合は，最小値側の２個又は最大値側の２個が外れ値候補になる場合と形が少し異なる検定統計量の分布に上側危険率を設定した検定になるが，この検定の対立仮説は「最小値と最大値はともに，他の値と同じ正規分布の母集団からランダムサンプリングして得られる値とはいえない」であり，この仮説に方向性はないので，両側検定か片側検定かの区分は当てはまらない。したがって，paired Grubbs 検定の結果を説明するときに，危険率や検定の方向性を示すには，室間共同試験のハーモナイズドプロトコル3）_{のように，最小値側の２個又は最大値側の 2 個が} 外れ値候補になる場合と，最小値と最大値の２個が外れ値候補の場合に分けた方が説明しやすい。paired Grubbs検定による外れ値の有無を報告するだけならば， AOACの室間共同試験ガイドライン9）_{の手順の方が簡便である。} 室間共同試験のハーモナイズドプロトコル3）_及びAOACの室間共同試験ガイドライン9）には両側危険率 2.5％（片側危険率1.25％）の数表が記載されている。室間共同試験のハーモナイズドプロトコル3）_{の検定手順では，表 10 より}_Paired Grubbs検定のはじめの検定統計量は100（1−SD2 H /SD）＝21.46％になり，上側危 険率 1.25％の棄却限界値56.4％（L＝10の行とTwo highest or two lowestの列の交差する箇所の値）より小さいので両側危険率 2.5％で有意差は認められなかった。

(23)

Paired Grubbs検定の次の検定統計量100（1−SDHL /SD）＝19.89％は，上側危険率 1.25％の棄却限界値59.5％（L＝10の行とOne highest and one lowestの列の交差する箇所の値）より小さいので，上側危険率 1.25％で有意差は認められなかった。４）一元分散分析外れ値を除外した表 10 の 10 試験所それぞれが２回併行分析したデータを一元分散分析で解析し，精度指標を計算する。分散の大きさを推定することが目的で ある変量モデルを用いた一元分散分散の F 検定では，例題３の３）で説明したよ うに，F 分布の上側危険率を設定した片側検定を行う。 表 11 にExcelの「分析ツール」内にある「一元分散分析」の出力（分散分析表）を示す。表 11 の「観測された分散比」は「グループ間の分散」0.160411を「グル 表 11 表 10 の 20 個の測定値の一元分散分析表 変動要因変動自由度分散観測された分散比Ｐ‒値Ｆ境界値グループ間グループ内 1.4437 0.2718 9 10 0.160411 0.02718 5.901806884 0.005213 3.020382 合計 1.7155 19 表 12 報告書に記載する項目例 項目名材料名（平均値の低い順に記載）参加試験所数ﾃﾞｰﾀ解析に有効な試験所数外れ値になった試験所数各試験所の併行測定回数平均値（%）併行標準偏差 Sr（%）併行許容差 2.8Sr（%）併行相対標準偏差 RSDr（%）室間再現標準偏差 SR（%）室間再現許容差 2.8SR（%）室間再現相対標準偏差 RSDR（%） HorRat − 12 10 2 2 7.19 0.16 0.46 2.3 0.31 0.86 4.3 1.4 注１）表中の値は表８のデータを解析した結果を示す。注２）回収率を報告できるときは回収率の定義と値を報告する。注３）参照したガイドラインを明記する。注４）計算に使用したソフトウエア名，メーカ名，バージョンを明記する。注５）データ解析から除外した試験所データも生データの表には記載し，解析から除外した理由を注記する。異常値として除外した試験所も把握できるように記載する。

(24)

ープ内の分散」0.02718で割った値で，F値という。「グループ内の分散」は，一つの試験所内で併行分析を行ったときの平均的なばらつきの指標になり，「グル ープ間の分散」は「グループ内の分散」以上の大きさが期待されるので，F 値は １以上が期待される。実際のデータ解析では，一元分散分析の F 値が１未満にな ることがあるが，その原因としては，実験の割付けをランダムに行わなかったか，解析に用いた一元分散モデルの仮定が，そのデータでは成り立っていないかが考えられる21）_{。よって，配付試料の番号には乱数を用いて，分析の順番が一定にな} らないように気をつける必要がある。このような実験上の注意をして得られたデ ータでも F 値が１未満になった場合は，F 値＝１，つまり SL＝0 で Sr＝SRとして3）_，精度指標を計算する。 併行標準偏差 Srは，⒄式より Sr＝ 0.16（％）である。室間再現標準偏差SRは， ⒅式より SR＝ 0.31（％）である。定量分析法の室間共同試験の報告書に記載する項目例3, 9）_{を表 12 に示す。} 7. 定性分析法の室間共同試験のデータ解析 定性分析法の室間共同試験について，定量的な化学分析法に関する IUPAC/ISO/AOACのハーモナイズドプロトコル3）_{のような国際的ガイドラインは} 2008 年３月現在制定されていない。IUPACでは，2006年２月から定性的な分析法及びスクリーニング法（例えば，ELISA法によるアレルギー物質の検知，PCR 法によるGMO検知，Lateral fl owデバイスによる迅速検査）の室間共同試験に関するドラフトの作成を開始した26）_{が，ドラフトはまだ公開されていない。} AOAC の室間共同試験のガイドライン9）_{は定量分析法についてのガイドライン} であるが，定性分析法の室間共同試験についてもハーモナイズドプロトコル以外と明記した上で，実施上の最低条件が記載されている。 AOAC の定性分析法の室間共同試験実施上の最低条件・10 試験所が，陽性試料については１マトリック当たり２濃度，各濃度で６試料の結果を報告する。・陰性試料については，マトリック当たり６試料の結果を報告する 2000 年版までのAOACの室間共同試験ガイドラインには，McClureの提案27）を受けて定性分析法の室間共同試験の最低実施条件として 15 試験所，５試料と記載されていたが，2002 年のガイドラインから上記に変更された。また，AOACには，食品微生物の定量及び定性の公式分析法の妥当性確認に関するメソッドコミッティーのガイドライン28）_{がある。これには，食品微生物の} 定性分析法について，単一試験室で行うメソッド比較試験（代替法と対照法の性能比較）及び室間共同試験の設計ガイドラインが含まれている。室間共同試験の試験所数などの条件は，上記の最低条件と同じである。

(25)

上記の試験所数及び併行測定回数の最低条件は，感度（陽性試料の正解率）又は特異性（陰性試料の正解率）の真値が 80％と仮定したときに，その± 10％の範囲内（72∼88％）に，正規分布近似を用いて計算した比率（正解率）の 90 ％信頼区間が入るのに必要な試験所数 L と併行測定回数 m の条件を与える式， 362≤Lm2_{をほぼ満たすように決められている}27）_。 ISO 16140：2003 食品及び動物用飼料の微生物に関する代替法の妥当性確認プロトコル29）_{では，以下の定性分析法の室間共同試験プロトコルを定めている。} ISO 16140：2003 の定性分析法の室間共同試験実施上の最低条件・外れ値のない最低 10 試験所の結果を報告する。・陰性試料，代替法の検出限界よりも少し高い濃度の試料，及び検出限界の約 10 倍の濃度の試料の最低３濃度の試料を用いる。・各試験所は，代替法及び対照法を用いて，各濃度の非明示試料（blind sample）を最低８回併行測定する。・以上より，１試料について最低 480 個（２メソッド× 10 試験所×３濃度× ８回併行）の測定結果を報告する。・代替法については，微生物毎に試験が必要な試料タイプがまとめられているAnnex Bのリストから選択した各食品カテゴリーについて，少なくとも１種類の製品を用いて試験する。 7.1 DNA マーカの妥当性確認 DNAマーカを用いた品種30）_，魚種31）_{などの判別技術の開発が活発に行われ} ているが，DNAマーカを用いた判別法の室間共同試験による妥当性確認に関するガイドラインは今のところ存在しない。法医学分野では，アメリカ国立標準技術研究所（NIST）がDNA分析に関する妥当性確認の情報提供32）_を行っており，アメリカ連邦捜査局（FBI）はDNA分析を行う試験所の品質保証基準33）を公表している。さらに，法医学分野のDNA分析について，Forensic Science Communicationsに妥当性確認のガイドラインの改訂版34）_{が 2004 年に発表されて} いる。このガイドラインには，法医学に新たに用いるDNA分析法の妥当性確認（Developmental Validation）と，各試験所がDNA分析法を法医学に適用する前に行うべき試験所内部の妥当性確認（Internal Validation）について記載されている。 Internal Validationといっても，分析法の性能指標については，メインラボとサテライトラボが独立にそれぞれ試験することを要求しているので，同じDNA分析法を導入したい試験所が集まって行う室間共同試験の一種である。 Internal Validationは複数の試験所で行うことを想定しているため，妥当性確認された分析法を利用したい試験所ごとに，妥当性確認試験で示された性能の範囲内で，その分析法を利用可能か，利用開始前に確認する検証作業（method

(26)

verifi cation）と全く同一とはいえないが，両者の目的には共通性がある。室間再現性（reproducibility）は，Method ValidationとInternal Validationの両方の試験項目であるが，試験所数及び各試験所の併行測定回数などの室間共同試験の具体的な条件は示されていない。

7.2 定性分析法の精度指標

互いに関連のある感度（sensitivity rate），特異性（specifi city rate），偽陽性率（false positive rate），偽陰性率（false negative rate）の４種類の精度指標を報告する28）_（表 13）。感度は，陽性（positive）であると既知の試料を陽性と判定した比率と定義され，表 13 の各セルの頻度を用いると感度（％）＝Npp

/（

Npp＋ Npn

）

× 100 … である28, 35）_{。特異性は，陰性（negative）であると既知の試料を陰性と判定した} 比率と定義され， 特異性（％）＝ Nnn

/（

Nnp＋ Nnn

）

× 100 … である28, 35）_{。偽陽性率は，陰性であると既知の試料を陽性と判定した比率と定義} され， 偽陽性率（％）＝ Nnp

/（

Nnp＋ Nnn

）

× 100 ＝ 1– 特異性（％） … である28, 35）_{。偽陰性率は，陽性であると既知の試料を陰性と判定した比率と定義} され， 偽陰性率（％）＝ Npn

/（

Npp＋ Npn

）

× 100 ＝ 1– 感度（％） … である28, 35）_。定性分析法の室間共同試験の最低実施条件に関するMcClureの提案27）_のなかで用いられている偽陽性率と偽陰性率の定義は，式，式とは異なる36）_が，式，式を用いる方がよい。 ∼ 式の４指標以外では，定量分析法の併行精度（repeatability）と室間再 表 13 定性分析結果の２×２分割表 試料判定結果合計陽性陰性陽性（既知） Npp（正解） Npn（不正解） Np p＋ Np n 陰性（既知） Nnp（不正解） Nnn（正解） Nn p＋ Nn n 合計 Npp＋ Nnp Npn＋ Nnn N＝Np p＋ Np n＋ Nn p＋ Nn n 注）Np p，Np n，Nn p，Nn nは各セル頻度，N は頻度の総計。

(27)

現精度（reproducibility）に対応する定性分析法の精度指標として，accordanceと concordance，さらにCOR（Concordance Odds Ratio）という３指標が2002年に提案され37），ISO 16140：2003のAppendix Lにも記載されている29）。accordanceと concordanceの計算では，陽性試料と陰性試料は別々に計算する。 accordanceは， accordance (%)＝同一試験所内で同じ結果（++又は--）を示したペアの数の全試験所の合計全ペア数 ×100 … と定義されている。同一試験所内で６回併行測定したならば１試験所内のペア数は6 2 6 6 2 2 6 5 2 15 C ＝ ＝＝ −

(

)

× × ! ! ! ペアになる。全ペア数は１試験所のペア数×試験所数である。 concordanceは， (%)＝試験所間で同じ結果（++又は--）を示したペアの数の全試験所の合計全ペア数 ×100 concordance … と定義されている。この場合には，同一試験所内のペアは数える対象外にする。１材料について 10 試験所が６個ずつ結果を報告した場合，ある試験所の１個の結果は，他の９試験所の６個ずつの結果と比較するので 6 × 9 ＝ 54 通りある。１試験所には６個の結果があるので，6 ×（6 × 9）＝ 324 通り，他の試験所の結果と比較するペアがある。これが 10 試験所なので全ペア数は {6 ×（6 × 9）} × 10 ＝ 3240 通りになる。全ペア数 3240 通りは，同じペアを２重に数えているので重複なしの全ペア数 1620 通りの２倍になっているが，式の分子，分母ともに２重に数えればconcordanceの値は変わらず，計算は簡単である。 CORは，

COR accordance concordance

concordance accordance ＝

( )

× − × −

(

)

% % % % 100 100

(

)

… と定義されている。ここで，accordance，concordanceはパーセント表示の値である。 CORはaccordance，concordance及びこれら二つの比よりも感度に依存しない指標である。COR＝1.2ならば，同じ試験所で分析した方が異なる試験所で分析するよりも同じ結果が 1.2倍出やすいことを示す。CORが大きい程，試験所間の結果の違いが大きいことを意味する。accordance＝100％のとき，CORは無限大になるが，accordanceとconcordanceが両方とも100％のときは試験所内も試験所間も同じ結果が得られる確率は等しいのでCOR＝１とする。 ISOの食品及び動物用飼料の微生物に関する代替法の妥当性確認プロトコル29）では，相対精確さ（relative accuracy），相対感度（relative sensitivity），相対特異

食糧 その科学と技術 No.46( )

Ⅲ データの統計的取り扱い

（

）

（

）

(

)

(

)

∑

∑

∑

(

)

（

）

（

）

（

）

（

）

（

）

（

）

（

）

（

）

（

）

(

0,

)

N

(

0,

)

N

(

,

)

N

m

m

0

0

m

/（

）

/（

）

/（

）

/（

）

(

)

( )

( )

( )

( )

(

)

(

)

食糧　その科学と技術　No.46( )

_（

_（

_0,

₍

_0,

₎

_,