仮説検定を伴う方法では検定の仮定が満たされ検定に適切な検出力がありデータの分析に使用される近似で有効な結果が得られることを確認することを推奨しますカイ二乗検定の場合仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

(1)

MINITABアシスタントホワイトペーパー本書は、Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため、Minitabの統計専門家によって行われた調査に関する一連の文書の1つです。

カイ二乗検定

概要

実際には、連続データの収集が不可能な場合や難しい場合、品質の専門家は工程を評価するためのカテゴリデータの収集が必要となることがあります。たとえば、製品は不良/良好などの2つのカテゴリや、最高、良い、普通、不適当などの3つ以上のカテゴリに分類される場合があります。別の例として、ある財務部門では、請求書の延滞日数を追跡して、15日以下、16～30日、31～45日、46日以上のカテゴリに分類します。その結果、各カテゴリ内の項目数が変数の対象となります。カイ二乗検定は汎用性があるため、カテゴリデータを伴う多くの用途で使用されます。アシスタントでは、次の用途にカイ二乗検定を使用します。  多項分布の適合度検定この検定を使用して、データが過去の分布と同じ分布に従うかどうかを判断できます。分布は、各結果カテゴリ内の項目のパーセントを定義する履歴パーセントまたは目標パーセントのグループの多項分布として定義されます。カイ二乗検定は、あるパーセントがそれぞれの履歴パーセントまたはターゲットパーセントと有意な違いがあるかどうかをまとめて検定します。  3グループ以上における不良%の同等性の検定この検定を使用して、異なるグループの不良率間に差があるかどうかを判断できます。各グループは、対象特性に関して、異なる作業者、異なる工場または異なる時間など製造された製品の違いによって異なります。カイ二乗検定は、不良率が他の不良率と有意に異なるかどうかをまとめて検定します。  2つのカテゴリ変数間の関連性検定この検定を使用して、カテゴリ結果変数（Y）が別のカテゴリ予測変数（X）と関連しているかどうかを判断できます。カイ二乗検定は、結果変数と予測変数間に関連性があるかどうかをまとめて検定します。アシスタントでは、2つ以上の個別値（2 つ以上のサンプル）を含む予測変数（X）で関連性のカイ二乗検定を実行できます。カイ二乗検定統計量の詳細は、「付録A」を参照してください。

(2)

仮説検定を伴う方法では、検定の仮定が満たされ、検定に適切な検出力があり、データの分析に使用される近似で有効な結果が得られることを確認することを推奨します。カイ二乗検定の場合、仮定はデータ収集に固有であるためデータチェックでは対応しません。 Minitabは近似法の検出力と妥当性に焦点を絞っています。アシスタントはこれらの近似法を使用して、データで次のチェックを行い、レポートカードに結果を表示します。  サンプルサイズ  検定の妥当性  区間の妥当性本書では、これらのデータチェックが実際にどのようにカイ二乗検定に関連するかを調査し、アシスタントのデータチェックのガイドラインをどのように定めたかについて説明します。

(3)

データチェック

サンプルサイズ

通常、仮説の統計検定を実施する主な目的は、「差がない」という帰無仮説を棄却する証拠を集めることです。サンプルが小さすぎる場合、検定の検出力は実際に存在する不良率間の差を検出するには不十分で、タイプIIの誤りになる可能性があります。そのため、実質的に重要な差を高い確率で検出するのに十分な大きさのサンプルサイズであるかどうかが極めて重要です。サンプルサイズのデータチェックは、検定の検出力に基づきます。この計算では、実際の母数と帰無仮説値間の有意な差をユーザーが指定する必要があります。カイ二乗適合度と関連性のカイ二乗検定でこの実質的な差を判断して表すことは非常に難しいため、アシスタントでは3つ以上のサンプルがあるカイ二乗不良率検定のサンプルサイズのみをチェックします。

目的

データから帰無仮説に対する十分な証拠が得られない場合、サンプルサイズが、対象とする特性の実際の差を、高い確率で検出する上で十分な大きさであるかを判断します。サンプルサイズ計画の目的は、重要な差を、高い確率で検出するのに十分な大きさのサンプルサイズを確保することですが、無意味な差が、高い確率で統計的に有意になってしまう程にはサンプルサイズを大きくしないようにする必要があります。

方法

検出力とサンプルサイズの分析は、「付録B」に示す計算式に基づきます。

結果

データから帰無仮説に対する十分な証拠が得られず、具体的な差が指定されていない場合、アシスタントはサンプルサイズに基づいて80%と90%の確率で検出できる実質的な差を計算します。さらに、対象となる特性の具体的な差をユーザーが指定した場合、アシスタントはその差を検出する確率が80%と90%になるサンプルサイズを計算します。検出力とサンプルサイズをチェックするときに、3つ以上のサンプルでのカイ二乗不良率検定のアシスタントレポートカードに次のステータスインジケータが表示されます。ステータス状態検定で不良%間の差が見つかるため、検出力は問題ではありません。または十分な検出力があります。検定で、不良率間の差は見つかりませんでしたが、サンプルサイズは、目的の差を検出する確率が90%以上あり、十分な大きさです。検出力が十分と思われます。検定で、不良率間の差は見つりませんでしたが、サンプルサイズは目的の差を確率が80%～90%で検出するのに十分な大きさです。90%の検出力を達成するために必要なサンプルサイズが報告されています。

(4)

ステータス状態検出力が不十分と思われます。検定で、不良率間の差が見つかりませんでした。このサンプルサイズでは目的の差を検出する確率が60%～80%です。80%の検出力と90%の検出力を達成するために必要なサンプルサイズが報告されています。検出力が不十分（< 60%）です。検定で、不良率間の差が見つかりませんでした。80%の検出力と 90%の検出力を達成するために必要なサンプルサイズが報告されています。検定で不良率間の差が見つかりませんでした。検出する不良率間の具体的な差が指定されていなかったので、サンプルサイズとαに基づいて計算された80%と90%の確率で検出できる差がレポートに示されます。

検定の妥当性

𝜒2_{検定統計量は、カイ二乗分布に近似的にのみ従います。サンプルサイズが大きくなると} 近似は改善されます。このセクションでは、正確な結果に必要な最小サンプルサイズを判断するために使用される近似を評価します。検定統計量に対するカイ二乗近似は、タイプI過誤率（α）での小さい期待セル度数の影響を調査することで評価されます。検定の妥当性の評価にタイプIの誤りを使用することで、次の条件を満たす規則を定めます。  帰無仮説が正しいのに帰無仮説を棄却する確率は、小さく、目的のタイプI過誤率に近い値です。  帰無分布の裾を適正に近似できます。これは正確なp値を計算する上で重要です。標準の手法を使用して、期待度数が小さいセルを、そのセルの度数が5以下と定義しました。帰無仮説での比率を定義する2つのモデルを作成しました。比率擾乱モデルと等比率モデルです。詳細は、「付録C」を参照してください。この両方のモデルは、本書の後半で参照するシミュレーションで使用されます。これらのモデルは各カイ二乗検定で使用されますが、 1つの例外があります。比率擾乱モデルは、3つ以上のサンプルでのカイ二乗不良%検定には適用されません。検定の妥当性のデータチェックは、アシスタントのすべてのカイ二乗検定に適用されます。各データチェックを次に説明します。

カイ二乗適合度

目的

タイプI過誤率での小さい期待度数の大きさと度数の影響を調査することで、検定統計量に対するカイ二乗近似を評価します。

方法

比率擾乱モデルまたは等比率モデル（「付録C」を参照）による比率を使用して、サイズnのサンプルを多項分布から抽出します。各条件で、0.05の目標有意水準を使用してカイ二乗適

(5)

合度検定を10,000回実行しました。各検定では、実際のタイプI過誤率を不合格になった検定数反復数（10000）で計算しました。許容できるタイプIの過誤率の範囲を[0.03 – 0.07]と定義し、その範囲内のタイプI過誤率を使用して最小サンプルサイズを記録しました。

結果

シミュレーション結果では、小さい目標セル度数のパーセントが50%以下の場合、1.25未満の目標セル度数でp値が不正確になる可能性があることが示されました。また、小さい目標セル度数のパーセントが50%より大きい場合、2.5未満の目標セル度数でp値が不正確になる可能性があります。詳細は、「付録D」を参照してください。カイ二乗適合度検定の妥当性をチェックするときに、アシスタントレポートカードに次のステータスインジケータが表示されます。ステータス状態小さい目標セル度数のパーセントが50%以下の場合、最小目標セル度数が1.25以上です。または小さい目標セル度数のパーセントが50%以上の場合、最小目標セル度数が2.5以上です。十分な目標数を得ることができる大きさのサンプルがあります。検定のp値は正確です。上記の状態ではない場合。

目的

方法

比率擾乱モデルまたは等比率モデル（「付録C」を参照）で定義された比率を使用して、サイズ𝑛_𝑖のサンプルが多項分布から抽出されます。簡単にするため、𝑛_𝑖 = 𝑛 ∀𝑖を選択しました。各条件で、0.05の目標有意水準を使用して関連性のカイ二乗適合度検定を10,000回実行しました。各検定では、実際のタイプI過誤率を不合格になった検定数反復数（10000）で計算しました。許容できるタイプIの過誤率の範囲を[0.03 – 0.07]と定義し、その範囲内のタイプIの過誤率を使用して最小サンプルサイズを記録しました。

結果

最小期待セル度数は、X値の数と小さい期待セル度数の割合によって変わることがわかりました。  比率擾乱モデルでは、小さい期待セル度数のパーセントが50%以下で、X値の数が2または3の場合最小期待セル度数は2以下で、X値の数が4、5または6の場合、最小期待セル度数は1以下です。さらに、小さい期待セル度数のパーセントが50%より大き

(6)

く、X値の数が2または3の場合最小期待セル度数は3以下で、X値の数が4、5または6 の場合、最小期待セル度数は1.5以下です。  等比率モデルでは、X値の数が2または3の場合の最小期待セル度数は2以下で、X値の数が4、5または6の場合の最小期待セル度数は1.5以下です。詳細は、「付録E」を参照してください。関連性のカイ二乗検定の妥当性をチェックするときに、アシスタントレポートカードに次のステータスインジケータが表示されます。ステータス X変数値の数状態 2または3 小さい期待セル度数（5以下）のパーセントが50%以下の場合、最小期待セル度数が2以上です。小さい期待セル度数（5以下）のパーセントが50%より大きい場合、最小期待セル度数が1以上です。 4、5、または6 小さい期待セル度数（5以下）のパーセントが50%以下の場合、最小期待セル度数が1以上です。小さい期待セル度数（5以下）のパーセントが50%より大きい場合、最小期待セル度数が2（便宜上1.5を2に四捨五入）以上です。すべての場合上記の状態ではない場合。

3つ以上のサンプルでのカイ二乗不良率検定

目的

方法

モデルp = 𝑝_𝑖 = 𝑝_𝑗 ∀𝑖, 𝑗を定義しました。ここで、p = 0.001、0.005、0.01、0.025、および 0.25です。上記の𝑝_𝑖の値を使用して、二項分布からサイズ𝑛_𝑖のサンプルが抽出されます。簡単にするため、𝑛𝑖 = 𝑛 ∀𝑖を選択しました。各条件で、0.05の目標有意水準を使用してカイ二乗不良率検定を10,000回実行しました。各検定では、実際のタイプI過誤率を不合格になった検定数反復数（10000）で計算しました。許容できるタイプI過誤率の範囲を[0.03 – 0.07]と定義し、その範囲内のタイプIの過誤率を使用して最小サンプルサイズを記録しました。

結果

X値の数が3～6の場合、区間[0.03, 0.07]の検定で1.5以上の不良品と良品の最小期待数によりタイプI過誤率が得られます。X値の数が7～12の場合、区間[0.03, 0.07]の検定で1以上の不良品と良品の最小期待数によりタイプI過誤率が得られます。詳細は、「付録F」を参照してください。

(7)

3つ以上のサンプルでのカイ二乗不良%検定の妥当性をチェックするときに、アシスタントレポートカードに次のステータスインジケータが表示されます。ステータス X値の数状態 3～6 不良品と良品の最小期待数が1.5以上です。 7～12 不良品と良品の最小期待数が1以上です。すべての場合上記の状態ではない場合。

区間の妥当性

3つ以上のサンプルでのカイ二乗不良率とカイ二乗適合度検定の比較区間は、正規近似に基づきます。さらに、カイ二乗適合度検定の個別信頼区間は、正規近似に基づきます。このセクションでは、正規近似の妥当性を評価します。ほとんどの統計学教科書に記載されている一般的な規則によると、観測度数が5以上の場合に近似信頼区間が正確になります。区間の妥当性のデータチェックは、3つ以上のサンプルでのカイ二乗不良%とカイ二乗適合度検定に適用されます。

3つ以上のサンプルでのカイ二乗不良率

目的

近似信頼区間が正確になるように、各サンプルで観測された不良品と良品の最小数に対する一般的な規則を評価します。

方法

比較管理チャートで使用される区間を最初に定義します。区間のエンドポイントは、ほぼ∝ の全体過誤率で、重ならないすべての区間が異なる母集団の不良%を示すように定義されます。使用する計算式は、「付録G」を参照してください。比較区間は、対応のある比較信頼区間に基づきます。詳細は、『一元配置分散分析（ANOVA）』アシスタントホワイトペーパーの「比較区間」セクションを参照してください。各ペア（pi – pj）に対して正規近似信頼区間を用い、次に、Bonferroniの多重比較手順を使用して、実験全体の過誤率を制御します。そのため、比較区間での正規近似の効果を理解するには、対応のある比較手順でいずれかの区間のみの妥当性を評価する必要があります。

結果

正規近似の妥当性を評価するには、不良率間の差で近似が1つの間隔にどのように影響するかのみを調査する必要があります。そのため、2サンプル不良率用に設定された一般的な規則検定を使用できます。詳細は、『2サンプル不良率検定』アシスタントホワイトペーパー

(8)

の「2サンプル不良率検定方法」を参照してください。2サンプル不良率検定のシミュレーションの結果、不良率間の差での近似信頼区間の精度は、サンプルが十分に大きい（各サンプルで観測される不良品数と良品数が5以上）場合に一般に信頼できることが示されました。 3つ以上のサンプルでのカイ二乗不良%検定の区間をチェックするときに、アシスタントレポートカードに次のステータスインジケータが表示されます。ステータス状態すべてのサンプルに5つ以上の不良品および良品があります。比較区間は正確です。上記の状態ではない場合。

カイ二乗適合度

目的

近似信頼区間が正確になるように、各サンプルで観測された不良品と良品の最小数に対する一般的な規則を評価します。

方法

アシスタントのカイ二乗適合度検定には、比較区間と個別信頼区間が含まれています。比率に標準の正規近似区間を利用し、Bonferroni補正（Goodman、1965）を使用して多重区間を補正します。Bonferroni同時区間は次のように計算されます。 𝑝_𝑖下限 = 𝑝_𝑖− 𝑍_𝛼/2𝑘√pi(1 − pi) N 𝑝_𝑖上限 = 𝑝𝑖+ 𝑍𝛼/2𝑘√ p_i(1 − p_i) N 区間のエンドポイントは、ほぼ∝の全体過誤率で、目標比率値を含まないすべての区間が対応する目標比率とは異なる実際の比率を示すように定義されます。個別区間はBonferroni区間と同じ形式を利用しますが、 𝑍_𝛼/2を使用して多重区間を補正することはありません。

結果

上記の両方の手法は、アシスタントの2サンプル不良%検定で定義された方法と似た方法に従います。そのため、この検定用に設定された正規近似の妥当性規則と同様の規則を使用できます。詳細は、『2サンプル不良%検定』アシスタントホワイトペーパーの「2サンプル不良% 検定方法」を参照してください。そのホワイトペーパーでは、サンプル数が5未満の場合、比較区間と個別信頼区間は正確でない可能性があるという結論に達しています。

(9)

カイ二乗適合度検定の区間の妥当性をチェックするときに、アシスタントレポートカードに次のステータスインジケータが表示されます。

ステータス状態

すべてのサンプル数が5以上です。この区間は正確です。

(10)

参考文献

Agresti, A. (1996). An introduction to categorical data analysis. New York, NY: Wiley.

Read, T. & Cressie, N. (1988). Goodness-of-fit statistics for discrete multivariate data. New York, NY: Springer-Verlag.

Fienberg, S. (1980). The analysis of cross-classified categorical data. Cambridge, MA: MIT Press.

Goodman, L. (1965). On simultaneous confidence intervals for multinomial proportions. Technometrics, 7, 247-254.

(11)

付録A: カイ二乗検定統計量

アシスタントでは、次の形式のカイ二乗検定統計量を使用します。 𝑥2_{= ∑} (𝑂𝑖𝑗−𝐸𝑖𝑗)2 𝐸𝑖𝑗 𝑖𝑗 ここで 𝑂_𝑖𝑗 =次の表で定義されている観測度数。場合 𝑶𝒊𝒋 多項分布の適合度検定 i番目の結果の観測度数は𝑂𝑖1として定義されます。 3つ以上の不良率の同等性検定 i番目のサンプルの不良品および良品の観測度数はそれぞれ𝑂𝑖1および𝑂𝑖2 として定義されます。 2つのカテゴリ変数間の関連性検定 X変数のi番目の値およびY変数のj番目の値の観測度数は 𝑂𝑖𝑗として定義されます。 𝐸_𝑖𝑗 =次の表で定義されている期待度数。場合 𝑬𝒊𝒋 多項分布の適合度検定 𝐸𝑖1 = 𝑛𝑝𝑖 𝑖 = 1, … , 𝑘（k =結果数） 𝑛 =サンプルサイズ 𝑝𝑖 =比率の経験値 ∑ 𝑝𝑖= 1 𝑖 3つ以上の不良率の同等性検定 𝐸𝑖1 = 𝑛𝑖𝑝（不良品の場合） 𝐸𝑖2 = 𝑛𝑖(1 − 𝑝)（良品の場合） 𝑖 = 1, … , 𝑘（k =サンプル数） 𝑛𝑖 = i番目のサンプルサイズ 𝑝 =全体の不良率 2つのカテゴリ変数間の関連性検定 _𝐸_𝑖𝑗₌(𝑛𝑖.𝑛.𝑗) 𝑛.. 𝑖 = 1, … , 𝑚（m =X値の数） 𝑗 = 1, … , 𝑘（k =Y値の数） 𝑛𝑖. =X変数のi番目の値の合計数 𝑛.𝑗 =Y変数のj番目の値の合計数 𝑛.. =全体のサンプルサイズ

(12)

付録B: 3つ以上のサンプルでのカイ

二乗不良率検定の検出力

非心カイ二乗分布を使用して、𝑝𝑖 = 𝑝𝑗= 𝑝 ∀𝑖, 𝑗の検定の検出力を計算します。非心パラメータは、𝑛𝑖と𝑝𝑖∀𝑖によって異なります。ここで 𝑛𝑖 = i番目のサンプルのサンプルサイズ各𝑝_𝑖は、比率の差= 𝛿で計算された対立比率（この付録の次のセクション「対立比率の計算」を参照）を表します。カイ二乗分布の非心パラメータを次のように計算します。 𝜒2_{= ∑} (𝑂𝑖𝑗−𝐸𝑖𝑗)2 𝐸𝑖𝑗 𝑖𝑗 ここで 𝑂_{𝑖1= 𝑛}_𝑖_𝑝_𝑖 𝑂𝑖2=𝑛𝑖(1− 𝑝𝑖) また、検定の検出力を次のように計算します。 Prob(𝑋 ≥ 𝑥_1−𝛼 | 𝜒2₎ ここで 𝑋 =非心パラメータ𝜒2_{を使用した非心カイ二乗分布の確率変数。} 𝑥_1−𝛼 = 非心カイ二乗分布の1 − 𝛼で評価された逆累積分布関数。

対立比率の計算

対立比率を次のように定義しました。 𝑝𝑖 = 𝑝𝑐+ 𝑛_𝑗 𝑛𝑖+ 𝑛𝑗 𝛿 𝑝_𝑗 = 𝑝_𝑐− 𝑛𝑖 𝑛_𝑖+ 𝑛_𝑗 𝛿 𝑝𝑚 = 𝑝𝑐∀𝑚 ≠ 𝑖, 𝑗 0 < 𝛿 < 1 ここで 𝑝_𝑐 = 1 𝑁_𝑇 ∑ 𝑛𝑖𝑝̂𝑖 𝑘 𝑖=1 𝑝̂ = i番目のサンプルのサンプル不良品率。 𝑖 NT =観測値の総数。

(13)

𝑛_𝑖 = i番目のサンプルのサンプルサイズ。一部の差（δ）では、𝑝_𝑖 > 1または𝑝_𝑗< 0であるため、次の規則を定めました。 𝑝_𝑗 < 0の場合 𝑝𝑖 = 𝛿 𝑝𝑗= 0 𝑝𝑚= 𝛿 2 ∀𝑚 ≠ 𝑖, 𝑗 𝑝_𝑖 > 1の場合 𝑝𝑖 = 1 𝑝_𝑗= 1 − 𝛿 𝑝_𝑚= 1 − 𝛿 2 ∀𝑚 ≠ 𝑖, 𝑗 𝑛𝑖の2つの最小値を使用すると検出力は最小になり、𝑛𝑖の2つの最大値を使用すると検出力は最大になります。

(14)

付録C: 比率擾乱モデルと等比率モ

デル

比率擾乱モデル

Read and Cressie（1988）の方法に従い、帰無仮説での比率のグループを次のように定義しました。 k - 1（k =各サンプルの比率数）に近い𝛿 を選択し、小さい𝑝_𝑖のセットを次のように定義します。 𝑝_𝑖 =(1 − 𝛿 𝑘 − 1) 𝑘 (𝑖 = 1, … , 𝑟) 残りの𝑝𝑖を次のように定義します。 𝑝_𝑖 =( 1− ∑𝑟𝑖=1𝑝𝑖) (𝑘−𝑟) （𝑖 = 𝑟 + 1, … , 𝑘）シミュレーションで𝛿に使用した値を表1に示します。表1は結果が小さい𝑝_𝑖になるシミュレーションで使用された𝛿 k 𝜹 𝒑𝒊=𝟏,…,𝒓 3 1.95 0.008 4 2.95 0.004 5 3.90 0.005 6 4.90 0.003 各kでr = 1、…、k – 1と変動させ、小さい𝑝_𝑖′s. セットのサイズを変更しました。たとえば、k = 3の場合、表2に示す2つのモデルが取得されました。表2 比率擾乱モデルを使用したk = 3の𝑝_𝑖の値 r p1 p2 p3 1 0.008 0.496 0.496 2 0.008 0.008 0.984

等比率モデル

期待セル度数の100%が小さいモデルを取得するため、次のように定義された等比率モデルを使用します。

(15)

𝑝_𝑖 =1 𝑘∀ 𝑖

非常に小さいサンプルサイズでこのモデルを使用することで、すべての期待セル度数が小さいと見なされます。等比率モデルで、実際には発生しない可能性が高い小さい期待セル度数を実現するには、非常に小さいサンプルサイズが必要です。

(16)

付録D: カイ二乗適合度検定の妥当

性

比率擾乱モデルでは、図1に示すように、小さい期待セル度数の%値に対する区間[0.03, 0.07]のタイプI過誤率を得るために必要な、最小期待セル度数をプロットしました。図1 小さい期待セル度数のパーセントに対する区間[0.03, 0.07]のタイプI過誤率を得るために必要な最小期待セル度数図1では、小さい期待セル度数のパーセントが50%未満の場合、最小期待セル度数は1.25以下です。すべての最小期待セル度数は2以下です。これらのシミュレーション結果に基づき、アシスタントレポートカードで使用する規則は控え目です。次に、等比率モデルを使用して同じシミュレーションを実行し、帰無分布を定義しました。等比率モデルを使用したシミュレーションの結果を表4に要約します。表4 区間[0.03, 0.07]のタイプI過誤率を得るための最小期待セル度数 k 最小期待セル度数 3 2.5 4 1.25 5 1

(17)

k 最小期待セル度数

6 1.4

上記のように、等比率モデルは期待セル度数の100%が小さくなります。表4にはすべての最小期待セル度数が2.5以下であることが示されており、アシスタントレポートカードで使用するルールに適合します。

(18)

付録E: 関連性のカイ二乗検定の妥

当性

比率擾乱モデルでは、図2に示すように、X値の数ごとに小さい期待セル度数の%に対する区間[0.03, 0.07]のタイプI過誤率を得るために必要な、最小期待セル度数をプロットしました。図2 小さい期待セル度数のパーセントに対する区間[0.03, 0.07]のタイプI過誤率を得るために必要な最小期待セル度数最小期待セル度数は、X値の数と小さい期待セル度数のパーセントによって変わることが図2 に示されています。図2には、小さい期待セル度数のパーセントが50%より小さい範囲では、X値の数が2または3 の場合は最小期待セル度数は2以下、X値の数が4、5、または6の場合は1以下であることが示されています。さらに、小さい期待セル度数のパーセントが50%より大きい範囲では、X値の数が2または3の場合は最小期待セル度数は3以下、X値の数が4、5、または6の場合は最小期待セル度数は1.5以下です。等比率モデルでは、図3に示すように、X値の数（ｍ）とY値の数（k）に対する最小期待セル度数をプロットしました。

(19)

図3 X値の数（m）とY値の数（k）に対する区間[0.03, 0.07]のタイプI過誤率を得るために必要な最小期待セル度数

図3では、X値の数が2または3の場合の最小期待セル度数は2以下で、X値の数が4、5、または 6の場合の最小期待セル度数は1.5以下であることが示されています。これらのシミュレーション結果に基づき、アシスタントレポートカードで使用する規則は控え目です。

(20)

付録F: 3つ以上のサンプルでのカ

イ二乗不良率検定の妥当性

各pと各m = 3、4、5、…、12で、最小期待セル度数をプロットしました。結果は図4と図5に示されています。図4 X値の数（m = 3～6）に対する区間[0.03, 0.07]のタイプI過誤率を得るために必要な最小期待セル度数

(21)

図5 X値の数（m = 7～12）に対する区間[0.03, 0.07]のタイプI過誤率を得るために必要な最小期待セル度数

X値の数が3、4、5、または6の場合、区間[0.03, 0.07]の検定で1.5以上の期待セル度数によりタイプI過誤率が得られます。X値の数が7、8、9、…、12の場合、区間[0.03, 0.07]の検定で1以上の期待セル度数によりタイプI過誤率が得られます。

(22)

付録G: 3つ以上のサンプルでのカ

イ二乗不良%の比較区間

𝑝_𝑖 の下限と上限は次のように定義されます。 𝑝_𝑖下限 = 𝑝_𝑖− 𝑍_𝛼/𝑐𝑋_𝑖 𝑝_𝑖上限 = 𝑝_𝑖+ 𝑍_𝛼/𝑐𝑋_𝑖 ここで c =比較数= k (k - 1) /2 ここで、kはサンプル数です。 𝑍_𝛼/𝑐 =平均が0で標準偏差が1の正規分布の(1 – 𝛼 2𝑐)百分位数 X_i = ((k – 1)∑_j≠i b_ij − ∑∑_{1≤j<𝑙≤𝑘} b_jl) / ((k – 1)(k – 2)) ここで b_ij= √pi(1 − p_n i) i + p_j(1 − p_j) n_j

Minitab®, Quality. Analysis. Results.® and the Minitab® logo are all registered trademarks of Minitab, Inc., in the United States and other countries. See minitab.com/legal/trademarks for more information.