計 数 値 の 検 定 ・ 推 定
第
1
章
P A R T 12第
1
章
第1章 計数値の検定・推定
ここでは不良率や欠点数などの計数値のデータを取り扱います.不良率は「n個の製品をランダムに選 んだとき,そのうち何個が不良品だったか」,欠点数は「1製品中にきずがいくつ見つかったか」などを示 すデータですが,検定や推定にあたってそれぞれ二項分布や,ポアソン分布を想定します. ■機能構成 ここでは 5 種類の検定・推定を用意しており,検定・推定の種類を選択すると仮説の条件設定,区間推 定の信頼率の選択,近似法などを順次指定することで,きめ細かな検定と推定を行うことができます. ■用語説明「帰無仮説」
「母不良率に関する検定・推定」や「母欠点数に関する検定・推定」では,該当する母不良率や母欠 点数を入力します.「対立仮説」
あってほしい狙いを,母不良率P(母欠点数λ)と指定された値P0(λ0)との条件式(≠,>,<)で指定 します.デフォルトでは両側仮説(P≠P0)となっています.「区間推定の信頼率」
区間推定の信頼率(95%,90%)を指定します.「近似方法」
各検定と推定を行う際には,正規近似法の種類を選択します.検定・推定の種類によって選択できる 正規近似法の種類が異なります. 検定と推定の種類 正規近似法 母不良率に関する検定・推定 逆正弦変換 ロジット変換 母不良率の差に関する検定・推定 逆正弦変換 ロジット変換…区間推定は直接近似による 母欠点数に関する検定・推定 平方根変換 対数変換 母欠点数の差に関する検定・推定 対数変換…区間推定は直接近似による m*n 分割表による検定 独立性の検定(カイ二乗統計量) 計数値の 検定・推定 検定と推定の 結果 検定のパラ メータを設定 検定・推定の 種類選択 母不良率 母不良率の差 母欠点数 母欠点数の差 m×n分割表 *1 ・仮説の選択 ・区間推定の信頼率の選択 ・近似方法 注*1)m×n分割表ではまず変数の指定画面が表示するので,ここで分割表の列 (n個の量的変数)を指定する必要があります. 注*1)m×n 分割表ではまず変数の指定画面が表示されるので,分割表のデータ範 囲の n 個の量的変数を指定します.変数 サンプル X1 [量的変数] X2 [量的変数] ・ [量的変数] n [量的変数] 1 2 3 ・ m 34 47 34 ・ ・ 32 45 35 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ただし,サンプル数と変数には制限があります. 2≦n(変数の数)≦20,2≦m(サンプル数)≦20 となっています.
計 数 値 の 検 定 ・ 推 定
第
1
章
P A R T 12第
1
章
1-1.母不良率に関する検定・推定
■目的 入力された試料個数と不良個数により不良率を求め,従来の不良率と違いがあるか否かの検定・推定 を行います. ■活用場面 あるパッケージを好む人の割合が従来は 20%だった.新たにデザインを刷新することになり, 実施後アンケートをとったが,従来と比べて良くなったかどうかを検証する. 等 1.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[母不良率] 1.2 検定・推定条件の指定 まず画面上の「帰無仮説」に母不良率を入力し, 画面中央の「対立仮説」(ありたい姿)と「区間推 定の信頼率」(社内の基準値や客観的な判断ができ るレベルなど)にそれぞれ条件を設定します.画 面の下には,「近似方法」と検定を行う対象となる 試料個数と不良個数をそれぞれ指定します.(最近 は加法性に優れたロジット変換を選ぶことが多い です.)入力位置にマウスを移動し,入力を行いま す. 母不良率,試料個数,不良個数には制限があり ます. 母不良率(P0) :0.0<P0<1.0 不良個数(r) :n-r>0 なお,試料個数(n)と母不良率(P0)の積が5以下と なると,正規近似とならないため,この積が 5 より大き い値とすることを推奨します. 入力を中止したい場合は,[キャンセル]ボタンをクリ ックします. 1.3 検定結果の確認 各項目の入力を終了し,[OK]ボタンをクリックす ると下図のような検定結果が表示されます. 母不良率,試料個数,不良個数,および計算した 不良率(不良個数/試料個数)と不良率の信頼区間 が表示されます. 画面下には,有意水準1%と5%での検定結果が 表示されます.また,統計量u0の確率値を計算し表 示します. ■評価・検討項目 チェック項目 使用する統計量等 1 棄却されたかどう か P 値 ■解釈のポイント 帰無仮説が棄却されたことで,対立仮説が採択 されました.すなわち不良率は変化したと判断さ れます.本例では母不良率 0.900 に対して,点推 定値で 0.057,95%信頼区間で 0.035~0.087 とな ったので,5%有意で不良率は減少しました. 1-1. 母不良率に関する検定・推定1-2.母不良率の差に関する検定・推定
■目的 2つの母集団よりそれぞれ不良率を求め,その差に違いがあるかどうか検定・推定を行います. ■活用場面 右ハンドルと左ハンドルの両方が生産されているラインでクラッチ不良率に差があるかどうかを検証す る. 等 2.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[母不良率の差] 2.2 検定・推定条件の指定 2 つの比較したい母集団がある場合,まず,画面 左中央の「対立仮説」で仮説を設定し、画面左下 の「試料個数」と「不良個数」に比較したい 2 つ の母集団からの試料個数と不良個数を入力します. また,画面の右側には「区間推定の信頼率」や「近 似方法」があり,それぞれについて設定します. 区間推定の信頼率,対立仮説として「ありたい姿」 を指定します. なお,初期設定では近似法は逆正弦変換となって います. 2 組の母集団についてそれぞれ試料個数,不良 個数には制限があります. 試料個数A(nA):nA>5 不良個数A(rA):nA-rA>5 試料個数B(nB):nB>5 不良個数B(rB):nB-rB>5 入力を中止したい場合は,[キャンセル]ボタン をクリックします. 2.3 検定結果の確認 各項目の設定が終了したら,[OK]ボタンをクリッ クすると下図のような検定結果が表示されます. A と B,2 組の母集団について試料個数,不良個 数,そして2組の不良率より求めた不良率の差の信 頼区間を表示します. 画面下には,有意水準1%と5%の検定結果が表 示されます.また,検定統計量u0の確率値を計算し 表示します. ■評価・検討項目 チェック項目 使用する統計量等 1 棄却されたかどう か P 値 ■解釈のポイント 2 つの母集団 A,B の不良率は有意水準 5%で棄却 されなかったので,差があるとはいえないことが わかりました.そのため,原因調査と対策を考え る必要があります. 1-2. 母不良率の差に関する検定・推定計 数 値 の 検 定 ・ 推 定
第
1
章
P A R T 12第
1
章
1-3.母欠点数に関する検定・推定
■目的 入力された単位数と総欠点数より単位あたりの欠点数を求め,それが従来の欠点数と比較して違いがあるか否 か検定・推定を行います. ■活用場面 ある機械の一日の故障停止回数が平均して 10 回であった.停止回数を減らすために調整を行った結果調整 後の停止回数が調整前の回数に対して減ったかどうかを検証する. 等 3.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[母欠点数] 3.2 検定・推定条件の指定 画面上の「帰無仮説」で従来の単位あたりの欠点 数を入力し,「区間推定の信頼率」で信頼率を設定し ます.画面中央の「対立仮説」にありたい姿を条件式 で指定し,「近似方法」を選びます.画面左下には調 査期間内で収集した単位数と総欠点数をそれぞれ 入力します. なお,初期設定では近似法は平方根変換となっ ています. 単位数(n),単位当り母欠点数(λ0)の制限は 以下のようになります. 単位数(n) :n>0.0 単位当り母欠点数(λ0) :λ0>4(平方根変換) :λ0>1(対数変換) 入力を途中で中止したい場合は,[キャンセル]ボ タンをクリックします. 3.3 検定結果の確認 各項目の設定が終了したら,[OK]ボタンをクリッ クすると検定結果が表示されます. 単位当り母欠点数λ0,単位数 n,総欠点数 x と母 欠点数の信頼区間を表示します. 画面下には,有意水準1%と5%の検定結果が表 示されます.また,統計量u0の確率値を計算し表示 します. ■評価・検討項目 チェック項目 使用する統計量等 1 棄却されたかどう か P 値 ■解釈のポイント P 値は 0.022 となり,5%より小さいので帰無仮 説は棄却され,欠点数は減少したと判断します. 1-3. 母欠点数に関する検定・推定1-4.母欠点数の差に関する検定・推定
■目的 入力された2つの母集団よりそれぞれ単位あたりの欠点数を求め,その差に違いがあるか否か検定・推定を行 います. ■活用場面 あるガラス製品に含まれる気泡数が材質によって異なるかどうかを検証する. 等 4.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[母欠点数の差] 4.2 検定・推定条件の指定 2 つの母集団で欠点数に差があるかどうかを検 定します.まず,画面中央の「対立仮説」で仮説を 設定します.画面左下で比較したい母集団の「欠点 数」と「単位」を入力します.画面上部の「区間推定 の信頼率」では信頼率を選びます. 比較したい対象を選び,単位を決めます.例え ば,板ガラスのきずを比較したいということなら 単位は板ガラス 1 枚,欠点数はきずの数,単位数 は観察した板ガラス枚数 nA,nB となります. 母集団 A,B について欠点数と単位の制限は以下 になります. 欠点数A(xA):xA>1 単位 A(nA):nA>0 欠点数B(xB):xB>1 単位 B(nB):nB>0 入力を中止したい場合は,[キャンセル]ボタンを クリックします. 4.3 検定結果の確認 各項目の入力が終了したら,[OK]ボタンをクリッ クすると下図のような検定結果が表示されます. 欠点数,単位,2組の欠点数の差と欠点数の差の 信頼区間を表示します. 画面下には,有意水準1%と5%の検定結果が表 示されます.また,統計量u0の確率値を計算し表示 します. ■評価・検討項目 チェック項目 使用する統計量等 1 棄却されたかどう か P 値 ■解釈のポイント 母集団 A,B の単位あたりの欠点数について P 値が 0.000 と有意水準 1%以下なので,帰無仮説は 棄却され,A,B によって欠点数に差があると判断 されます. 1-4. 母欠点数の差に関する検定・推定計 数 値 の 検 定 ・ 推 定
第
1
章
P A R T 12第
1
章
1-5.m×n分割表による検定・推定
■目的 「機械が4台あり,その製品は検査によって1級品,2級品,3級品に分けられるとする.さて,1級品,2級品,・・ の発生する割合は機械によって異なるだろうか.」このような問題を統計的に判断する場合に用いられるのが分 割表による検定です.m×nの分割表は下記のとおりです.本システムでは,変数の数にnを割当て,サンプル 数にmを割当てデータを入力します. 1 2 3 4 5 6 ・ n 計 1 13 27 29 20 ・ ・ ・ ・ ・ 2 31 15 16 19 ・ ・ ・ ・ ・ 3 13 21 19 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ m ・ ・ ・ ・ ・ ・ ・ ・ ・ 計 ・ ・ ・ ・ ・ ・ ・ ・ ・ ■活用場面 あるプラスチック製品を3台の成型機で製造している.成型機によって成型不良の出方が異なるかどう かを検証する. 等 ■データ入力形式 m×n分割表のデータは,3 台の成型機(1,2,3)を縦に並べ,製造したプラスチック製品の成型不良「し わ」「かけ」「凸」「凹」「歪」の不良数を成型機ごとに収集し入力します. 指定できる変数の数は最大 20,サンプル名(ここでは「成型機」)は1(0可)つです.また,サンプル数は最大 20まで,サンプル数が 20 を越えるデータは無視されます.なお,m×n分割表の検定結果には変数名は表側名, サンプル名は表頭名として反映します. 5.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[m×n分割表] 変数の指定ダイアログで,サンプル名と検定・推 定対象データを選択します. 分割表の列項目を指定します.また,サンプル名 ははじめのサンプル名が初期値で設定されている ので,必要に応じて変更します.指定が終了した ら[次に進む]をクリックします. 5.2 検定・推定条件の指定 ここでは,どの母集団についても各クラスの発生 確率が等しい,すなわち,成型機 A,B, C あるいは しわ,かけ,凸,凹、歪からみても,その発生確率は 等しく,2項目間には関連がなく相互に独立であるこ とを帰無仮説として検定します.なお,欠測セルは 数値 0.0 を代入し,小数点以下は切り捨てて整数値 とします. 指定した変数によるm×n分割表のカイ2 乗検定結果を表示します. 1-5. m×n分割表による検定・推定画面下には,検定結果が表示されます.帰無仮 説H0と求めた統計量χ02,さらにχ02(φ,α)となる 上側確率(P 値)を()内に表示します. 本システムでは,有意水準1%および5%につ いての検定結果を表示します.指定したデータの群 に対して上側確率が有意水準αより大きい場合,つ まり P 値が 0.01 あるいは 0.05 以上で「帰無仮説H0 は有意水準α%で棄却されない」と表示されます (αは1%および5%). 逆に上側確率がαより小さい場合,つまり P 値が 0.01 あるいは 0.05 未満となると「仮説H0は有意水準 α%で棄却される」と表示されます.つまり,成型機 と成型不良項目間の2項目間には関連があり,独立 ではないことが統計的に示されたことになります.す なわち,成型不良の出方は成型機によって異なるこ とが明らかと判断されます. 画面上部のリストボックスで,画面中央に表示され る表を「m×n分割表」と「規準化残差」に切り替える ことができます. 規準化残差の2乗の総和はカイ2乗となるので, 分割表が帰無仮説から大きく外れている部分につい ての情報を得ることができます. ■評価・検討項目 チェック項目 使用する統計量等 1 棄却されたかどう か P 値 ■解釈のポイント 観測度数と期待度数の差(絶対値)が大きなセ ル(成型機と不良の組み合わせ)ほど大きく外れ ている,つまり平均的にみて不良が多いことがわ かります. 1-5. m×n分割表による検定・推定
計 量 値 の 検 定 ・ 推 定 P A R T 12
第
2
章
第2章 計量値の検定・推定
データを用いて統計的に推論を行う形式として,検定,推定,予測(回帰分析)の3つがあります. 検定は,データから計算される検定統計量についてある領域を設け,統計量がこの領域に入れば母集 団に関する仮説(H0)は正しくないとする形式で行われます.この領域を棄却域と呼び,仮説が正しい場 合には,ここに入る確率があらかじめ定められた小さな値になるようにしています. 確率は危険率または有意水準と呼び,αで表します. 推定は,母集団の母数の値を推測する方法で点推定と区間推定の2つの方法があります. ■機能構成 本システムでは,計量値の検定・推定に,以下の7種類を用意しています.各検定・推定の種類を選ぶ と「仮説の設定」ダイアログが表示されます.これによって,よりきめ細かな検定と推定を行うことができま す. ■データ入力形式 計量値の検定・推定を行う場合には,以下の入力形式に応じてワークシート上に前もってデータを入 力します.入力形式1:特性値のみ(X1 のみ)
(母分散に関する検定・推定,母平均に関する検定・推定) 変数 サンプル X1 [量的変数] 1 2 3 4 5 34 47 34 25 15 また,2つの母分散の比に関する検定・推定,2つの母平均の差に関する検定・推定,3つ以上の母分 散の一様性に関する検定・推定について行う場合は,量的変数はシーケンスに並ぶようにデータをカテ ゴリ番号順で入力します. 注1)母不良率に関する検定・推定と母平均に関する検定・推定は除く 注2)3つ以上の母分散の一様性は除く 注3)データに対応がある場合の母平均の差に関する検定・推定のみ 注2) 注3) 注1) 計量値の 検定・推定 ・対立仮説の選択(片側・両側) ・母数の指定(母分散・母平均) ・推定に使う信頼区間の指定 (90%・95%) 母分散 2つの母分散の比 母平均 2つの母平均の差 データに対応がある場合の 母平均の差 3つ以上の母分散の一様性 折れ線 グラフ ヒストグ ラム 検定と推 定の結果 検定のパラ メータを設定 群(層) の指定 変数の 指定 検定・推定 の種類選択 カテゴリ1 カテゴリ2入力形式2:特性値と群分け情報(質的変数)
(X1,C1)
(2つの母分散の比についての検定・推定,2つの母平均の差に関する検定・推定,3つ以上の母分散 の一様性) 変数 サンプル X1 [量的変数] メーカ別 [質的変数] 1 2 3 4 5 34 47 34 25 15 1 2 2 1 3入力形式3:2つの特性値(X1,X2)
(2つの母分散の比に関する検定・推定,2つの母平均の差に関する検定・推定) 変数 サンプル X1 [量的変数] X2 [量的変数] 1 2 3 4 5 34 47 34 25 15 32 45 35 30 25入力形式4:3つ以上の特性値(X1,X2,X3,…)
(3つ以上の母分散の一様性) 変数 サンプル X1 [量的変数] X2 [量的変数] X3 [量的変数] ・ 1 2 3 4 5 34 47 34 25 15 32 45 35 30 25 30 40 36 28 30 ・ ・ ・ ・ ・ ■変数の指定 次に,変数の指定ダイアログが表示され,解析に用いる変数を指定します. 指定できる変数は,検定と推定の種類によって以下のような制限があります. 検定・推定の種類 指定する変数の制限 対応する入力形式 量的変数 質的変数 母分散に関する検定・推定 1 0 入力形式1 2つの母分散の比についての検定・推 定 1 1 2 0 1 0 入力形式1 入力形式2 入力形式3計 量 値 の 検 定 ・ 推 定 P A R T 12
第
2
章
母平均に関する検定・推定 1 0 入力形式1 2つの母平均の差に関する検定・推定 1 1 2 0 1 0 入力形式1 入力形式2 入力形式3 データに対応がある場合の母平均の 差に関する検定 2 0 入力形式3 3つ以上の母分散の一様性の検定 1 1 3~6 0 1 0 入力形式1 入力形式2 入力形式4 群が複数ある場合でも量的変数を1つだけ選ぶ場合は,群分けを行う必要 があります.また,カテゴリの種類が解析できる群の個数より多い場合など も群分けおよび解析するカテゴリを指定する必要があります.変数指定によって群分けの必要がない場合
(母分散に関する検定・推定,母平均に関する検定・推定)
〈量的変数1の場合〉
変数指定で量的変数を1つ選び,[次へ進む]ボタンをクリックすると,仮説の設定へ進みます.変数指定(変数指定の組み合わせ)によって群分けの必要がある場合
(2つの母分散の比についての検定・推定,2つの母平均の差に関する検定・推定)〈量的変数1,質的変数1の場合〉
質的変数のカテゴリ種類が3種類以上ある場合は, 右図のダイアログが表示されますので,解析に用いる カテゴリを指定します.2種類以内の場合は,仮説の設 定へ進みます.〈量的変数1の場合〉
右図のダイアログが表示され,時系列順に 量的変数を分割(群分け)します.第 1 群と第 2 群のデータ数の合計を合わせます. 右の例では 30 にします.(3つ以上の母分散の一様性に関する検定・推定)
〈量的変数1,質的変数1の場合〉
質的変数のカテゴリ種類が3種類より多い場合は, 右図のダイアログが表示されます.3種類の場合は, 仮説の設定へ進みます.〈量的変数1の場合〉
下図のダイアログが表示され,時系列順に最大 6 カテゴ リまでを分割します.群ごとのデータ数の合計を実際の データ数に合わせます. (1)ヒストグラムの表示 解析する変数を指定後,ヒストグラムが表示されます.ここで現在入力されているデータの統計量 およびばらつきを確認することができます. (2)検定・推定条件の指定(「3つ以上の母分散の一様性に関する検定・推定」,「m×n分割表による検定・
指定」以外の場合)
[仮説の設定]ダイアログが表示されます. 仮説に用いる条件や条件値を指定します. このダイアログは以下のブロックから構 成されています.「帰無仮説」
帰無仮説では,過去の実績や設計値 などの値と,対象とする集団のパラメータが 等しくなると仮定します.「母分散に関する 検定・推定」,「母平均に関する検定・推定」, 「データに対応がある場合の母平均の差に関する検定・推定」の場合の帰無仮説はそれぞれ,母分散, 母平均,母平均の差を入力します.「対立仮説」
本来ありたい姿,目的とする条件を設定します.母分散σ2(母平均μ)と検定したい対象値σ 02(μ 0)との条件(≠,>,<)を指定します.デフォルトは,両側検定となっています.「区間推定の信頼率」
判断できる許容レベルを設定します.区間推定の信頼率(95%,90%)を指定します.デフォルト は 95%となっています.計 量 値 の 検 定 ・ 推 定 P A R T 12
第
2
章
「母標準偏差」
「母平均に関する検定・推定」,「2つの母平均に関する検定・推定」の場合のみ表示されます.母 標準偏差がわかっている場合と道の場合で結果は変わります. 検定・推定を行う上で,母標準偏差があらかじめわかっているときには「既知」として値を入力しま ずが,未知の場合にはそのままで入力しません.2-1.母分散に関する検定・推定
■目的 母集団のばらつき,すなわち母分散が従来の値と比較して変化したか否かを検定します.指定した変 数のヒストグラムが表示されますので現在の分布状態を確認することができます. ■活用場面 精密機械の加工機を改造した場合に、改造後の寸法精度が従来と比較して向上したかどうかを 検証 等 ■データ形式 収集したデータを 1 列にサンプルごとに入力します. 1.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[母分散] 1.2 変数の指定 検定・推定の対象となる量的変数を指定しま す. 1.3 検定・推定条件の指定 変数の指定で変数を選択後,「仮説の設定」ダ イアログが表示されます. 画面左上の「帰無仮説」の「σ02=」に従来の母分 散を入力し,画面右上の「対立仮説」の条件,すなわ ちありたい姿(どうなってほしいかの条件)を設定しま す.また,画面左下の「区間推定の信頼率」の信頼 率を選択します. 2-1. 母分散に関する検定・推定1.4 検定結果の確認 [OK]ボタンをクリックすると,指定された条件とデ ータについて母分散に対する検定結果を右図のよう に表示します. 検定結果は,帰無仮説がある有意水準で「棄却さ れる」「棄却されない」といった言葉で表示されます. 画面上部には指定した変数の基本統計量(平均 値,分散,標準偏差)および自由度(φ)が表示され, 平均値,分散の信頼区間が表示されます. 画面下部には,検定結果が表示されます.帰無仮 説H0と求めた統計量χ02,さらにχ02(φ,α)となる 上側確率(α)が()内に表示されます. 本システムでは,有意水準1%および5%につい ての検定結果を表示します.指定したデータの分散 と母分散の値を比較し統計的に有意な差が認めら れない場合は,「仮説H0は有意水準α%で棄却さ れない」と表示されます(αは1%および5%). 逆に統計的な差があると認められる場合には,「仮 説H0は有意水準α%で棄却される」と表示し,対立 仮説を採択した(ありたい姿となった)ことがわかりま す. ■評価・検討項目 チェック項目 使用する統計量等 1 棄却されたかどう か P 値 ■解釈のポイント P 値が 0.01 あるいは 0.05 以下となった場合, 帰無仮説が棄却され,対立仮説が採択されたと判 断します.
2-2.2つの母分散の比に関する検定・推定
■目的 2群のデータの母分散の比について等しいか否かの検定および推定を行います. 現在指定されている2群のデータのヒストグラムが表示され,ばらつきを視覚的に確認することができます. ■活用場面 2つの充填機の充填量のばらつきが等しいか否かを検証する 等 ■データ形式 データの形式は以下の3つがあります. ・特性値のみ(1 つの量的変数を 2 つに分割) ・特性値と群分け情報(量的変数と質的変数) ・2つの特性値変数(2 つの量的変数) 2つの特性値変数の場合 2.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[2つの母分散の比] 2-1. 母分散に関する検定・推定 2-2. 2つの母分散の比に関する検定・推定計 量 値 の 検 定 ・ 推 定 P A R T 12
第
2
章
2.2 変数の指定 検定・推定の対象となる量的変数を指定します. 変数の指定方法は以下の3つがあります. ・特性値に量的変数を1つ指定する ・特性値とカテゴリーに量的変数と質的変数 を1つずつ指定する ・特性値に量的変数を2つ指定する ここでは,特性値に量的変数を2つ指定してい ます. 2.3 検定・推定条件の指定 変数の指定で解析する変数を選択後,「仮説の設 定」ダイアログが表示されます. 画面右上の「対立仮説」の条件を選びます.例え ば,溶接機 1 号と溶接機 2 号の母分散がどうあれば よいかを条件式で設定します. 画面左下の「区間指定の信頼率」の信頼率を選択し ます. 2.4 検定結果の確認 [OK]ボタンをクリックすると,2つの母分散比に関 する検定・推定を行います.画面上部と中央に,2群 のデータの各統計量(平均値,分散,標準偏差)お よび自由度(φ)が表示され,画面下部には,検定 結果が表示されます.検定結果で,対立仮説が採択 されたかどうかを判断します.根拠は P 値の値です. 帰無仮説H0と対立仮説H1,求めた検定統計量F0と F0(φ1,φ2,α)となる上側確率値(α)を()内に表 示します. 有意水準1%および5%は判断を下す際の危険 率を示しています.計算した統計量が5%あるいは 1%のF値よりも大きい場合,つまり P 値が 0.05 ある いは 0.01 以下で,仮説H0を捨てます.統計的な差 が認められた場合には,「仮説H0は有意水準α% で棄却される」と表示され,対立仮説を採択します. 万が一,H0が棄却されない場合は,違いがある とはいえないので,別の溶接機を用いるか,P 値 が 0.1 以下ならサンプル数を増して実験をするこ となどを検討します. ■評価・検討項目 チェック項目 使用する統計量等 1 棄却されたかどう か P 値 ■解釈のポイント P 値が有意水準値以下なら対立仮説を採択しま す.2-3.3つ以上の母分散の一様性に関する検定・推定
■目的 3つ以上の母分散の一様性に関する検定(Bartlett の検定)を行います. ここでの帰無仮説は,「すべての母分散が等しい」であり,対立仮説は「k個の母分散のうち等しくないものがあ る」となります. 変数の指定で変数選択後,カテゴリが6を越える場合にはカテゴリを指定するダイアログが表示されるので,解 析に用いるカテゴリを選択します.ただし,指定できるデータの群の数は最大6群までです. ■活用場面 3つの加工機の加工精度のばらつきが等しいか否かを検証する 等 2-2. 2つの母分散の比に関する検定・推定 2-3. 3つ以上の母分散の一様性に関する検定・推定■データ形式 データの形式は以下の3つがあります. ・特性値のみ ・特性値と群分け情報(質的変数:カテゴリ数 3~6) ・3~6つの特性値 3つの特性値の場合 3.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[3つ以上の母分散の一様性] 3.2 変数の指定 検定・推定の対象となる量的変数を指定します. 変数の指定方法は以下の3つがあります. ・特性値に量的変数を1つ指定する ・特性値とカテゴリーに量的変数と質的変数 (カテゴリ数 3~6)を 1つずつ指定する ・特性値に量的変数を3~6つ指定する ここでは,特性値に量的変数を3つ指定してい ます. 3.3 検定結果の確認 各項目の設定が終了したら,[次へ進む]ボタンを クリックすると検定結果が表示されます. 検定結果には,指定したn群による分散の一様性 に関する検定結果を表示します. 画面中央には,各群の平方和,自由度等の統計量 を表示します. 画面下部には,検定結果が表示されます.帰無仮 説H0と求めた統計量χ02,さらにχ02(φ,α)となる 上側確率(α)を()内に表示します. 本システムでは,有意水準1%および5%につい ての検定結果を表示します.指定した群の分散が一 様でないと判断できない場合は,「仮説H0は有意水 準α%で棄却されない」と表示されます(αは1%お よび5%). 逆に 3 つ以上の群のうちどれか 1 つでも統計的な 差が認められる場合には,「仮説H0は有意水準 α%で棄却される」と表示されます. 本システムでは,Bartlett の方法を用いて検定を行 っています. ■評価・検討項目 チェック項目 使用する統計量等 1 棄却されたかどうか P 値 ■解釈のポイント P 値が 0.01 以下ならば帰無仮説 H0 は有意水準 1%で棄却されます.これは k 個の母分散で等しく ないものがあるというだけで,特定の組み合わせ の分散が等しくないといっているわけではありま せん. 2-3. 3つ以上の母分散の一様性に関する検定・推定
計 量 値 の 検 定 ・ 推 定 P A R T 12
第
2
章
2-4.母平均に関する検定・推定
■目的 設定した従来の母平均と,サンプリングされたデータの平均との差があるか否かの検定および推定を行いま す. 母平均μの検定・推定は母集団の分散σ2が既知であるか,未知であるかによって使いわけが異なります.分 散σ2が既知である場合には,平均値の分布がN(μ,σ2/n)であることを利用し,検定統計量uu
x
n
N
=
-
m
s
/
~
( , )
0 1
2 を,またσ2が未知の場合には,検定統計量tt
x
V n
=
-
m
/
を用いて検定を行います. 解析したい変数を指定すると,変数のヒストグラムが表示されます.データの平均とばらつきなどを視覚的に確 認することができます. ■活用場面 瓶詰め製品の内容量が設定値の 20ml からずれているか否かを検証する 等 ■データ形式 データの形式は以下になります. ・1つの特性値 4.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[母平均] 2-4. 母平均に関する検定・推定4.2 変数の指定 検定・推定の対象となる量的変数を指定します. 特性値に量的変数を1つ指定して,[次へ進む] ボタンをクリックします. 4.3 検定・推定条件の指定 変数指定で変数を選択後,「仮説の設定」ダイアロ グが表示されます. 「帰無仮説」の「(μ0= )」に母平均を入力しま す.母平均はあらかじめわかっている値を入力しま す.「対立仮説」の条件および画面左下の「区間推 定の信頼率」の信頼率を選択します. 基準値あるいは経験値から画面右上の母標準偏 差をあらかじめ判っている場合は,「既知」を選び母 標準偏差の値を入力します.判らないときは,「未 知」を選びます. 4.4 検定結果の確認 母標準偏差の入力において母標準偏差が判って いる場合の検定方法と判らない場合の検定方法は 異なります. (1)母標準偏差が判っている場合 検定に用いる統計量としてu0を用います(正規分 布を使用).母標準偏差が判っている場合の検定結 果を下図に表示します.(母標準偏差に 5.5 入力) 試験データから得られた平均値が母平均と同じであ るかどうかは母標準偏差とデータから得られた標準 偏差を用いて判断します. (2)母標準偏差が判らない場合 検定に用いる統計量としてt0を用います.(t分 布を使用).母標準偏差が判らない場合の検定結果 を下図に表示します. また,画面上には指定した変数の各統計量およ び自由度(φ)が表示され,平均,分散に関しては仮 説の設定で選択した信頼区間が表示されます. 画面下には,検定結果が表示されます.帰無仮 説H0が棄却されるかどうかを判断します. 本システムでは,有意水準1%および5%につい ての検定結果を表示します.いま指定したデータの 平均と母平均の値に統計的な差が認められない場 合は,「仮説H0は有意水準α%で棄却されない」と 表示されます(αは1%および5%). 逆に統計的 な差が認められる場合には,「仮説H0は有意水準 α%で棄却される」と表示され,対立仮説が採択さ れます. ■評価・検討項目 チェック項目 使用する統計量等 1 棄却されたかどう か P 値 ■解釈のポイント P 値が 0.05 もしくは 0.01 以下ならば帰無仮説 H0 は棄却され,対立仮説が採択されます. 2-4. 母平均に関する検定・推定
計 量 値 の 検 定 ・ 推 定 P A R T 12
第
2
章
2-5.2つの母平均の差に関する検定・推定
■目的 2群のデータの母平均が等しいか否かの検定および推定を行います. 解析したい変数を指定後,指定した変数のヒストグラムを 2 つ表示します.平均値とばらつきの値を用いて平均 の違いが明らかかどうかを視覚的に確認することができます. ■活用場面 2つの工場の生産能力に差があるかどうかを,平均の差が等しいか否かで検証する 等 ■データ形式 データの形式は以下の3つがあります. ・特性値のみ ・特性値と群分け情報(質的変数) ・2つの特性値 2つの特性値の場合 5.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[2つの母平均の差] 5.2 変数の指定 変数の指定ダイアログで,サンプル名と検定・ 推定対象データを選択します. 変数の指定方法は以下の3つがあります. ・特性値に量的変数を1つ指定する ・特性値とカテゴリーに量的変数と質的変数 を1つずつ指定する ・特性値に量的変数を2つ指定する ここでは,特性値に量的変数を2つ指定してい ます. 5.3 検定・推定条件の指定 解析に用いる変数を選ぶと,次に「仮説の設定」 ダイアログが表示されます.画面右上の「対立仮説」 はありたい姿を表しており,条件式で示します.画面 右下の「区間推定の信頼率」の信頼率を選びます. 画面左の「母標準偏差」に関しては,母標準偏差が 判っている場合(既知)は入力し,判っていない場合 (未知)は入力せずにおきます. 2-5. 2つの母平均の差に関する検定・推定5.4 検定結果の確認 母標準偏差の入力において母標準偏差が判って いる場合の検定方法と判らない場合の検定方法は 異なります. (1)母標準偏差が判っている場合 検定に用いる統計量としてu0を用います(正規分 布を使用).母標準偏差が判っていて等しくない場 合の検定結果を下図に表示します. この例では,検定・推定条件にσ1=1.400,σ 2=1.100 を指定しています. (2)母標準偏差が判らない場合 検定に用いる統計量としてt0を用います.(t分布 を使用).母標準偏差が判らないで母標準偏差が等 しくないと思われる場合(5%有意)は(Welch の方 法)を用い検定します. 画面上部には指定した変数の各統計量および自 由度(φ)が表示され,平均,分散に関しては仮説の 設定で選択した信頼区間が表示されます. 画面下部には,検定結果が表示されます.帰無 仮説H0と上記データによって求めた統計量(u0ある いはt0),さらにu0(α)あるいはt0(φ,α)となる上 側確率値(α)を()内に表示します. ■評価・検討項目 チェック項目 使用する統計量等 1 棄却されたかどう か P 値 ■解釈のポイント P 値が 0.05 もしくは 0.01 以下ならば帰無仮説 H0 は棄却され,対立仮説が採択されます.
2-6.データに対応がある場合の母平均の差に関する
検定・推定
■目的 2群の製品AとBの特性を比較する場合に,ある特定の条件のもとでどちらがよいかという問題と,いろいろな 条件のもとで総合的によいのはどちらかという2つの問題があります.前者については,「5 2つの母平均値の 差に関する検定・推定」で検定を行うことができます.後者については,「6 データに対応がある場合の母平均 の差に関する検定・推定」で検定を行うことができます. ■活用場面 部品 No ごとに,ある決められた部位のA地点とB地点の厚さを測定し,その結果から両地点での厚さが 等しいか否かを検証する 等 2-5. 2つの母平均の差に関する検定・推定 2-6. データに対応がある場合の母平均の差に関する検定・推定計 量 値 の 検 定 ・ 推 定 P A R T 12
第
2
章
■データ形式 データの形式は以下になります.材質 A と材質 B の測定値は対応があります.例えば 1 行目のデータは サンプル名 1 という条件で得られたものです.サンプル名 2 は別の条件ということになります. ・2つの特性値 2つの特性値の場合 6.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[データに対応がある場合の母平均の差] 6.2 変数の指定 変数の指定ダイアログで,サンプル名と検定・ 推定対象データを選択します. 特性値に量的変数を2つ指定して,[次へ進む] ボタンをクリックします. 6.3 検定・推定条件の指定 「データに対応がある場合の母平均の差…」の検 定を行うには,2群の各データが対応している,つま りサンプルごとに収集したデータを用います. 変数の指定で解析する変数を選択後,次に「仮説 の設定」ダイアログが表示されます. 画面上部の「帰無仮説」に,対応するデータの平 均値の差を「(δ0= )」に入力し,画面中央の 「対立仮説」の条件および画面下部の「区間推定の 信頼率」の区間推定の信頼率を選択します. 平均値の差の入力を行わずに[OK]ボタンを クリックすると,平均値の差を0として検定を 行います. 6.4 検定結果の確認 [OK]ボタンをクリックすると,入力した平均値の差 に対する 検定結果を表示します. 画面上部には,指定した変数の各統計量および 自由度(φ)が表示され,平均,分散に関しては「仮 説の設定」ダイアログで選択した信頼区間が表示さ れます. 画面下部には,検定結果が表示されます.帰無 仮説H0と求めた統計量t0,さらにt0(φ,α)となる上 側確率(α)を()内に表示します. 本システムでは,有意水準1%および5%につい ての検定結果を表示します.指定した2群の対応あ るデータの母平均の差に統計的な差が認められな い場合は,「仮説H0は有意水準α%で棄却されな い」と表示されます(αは1%および5%). 2-6. データに対応がある場合の母平均の差に関する検定・推定逆に統計的な差が認められる場合には,「仮説H0 は有意水準α%で棄却される」と表示されます. チェック項目 使用する統計量等 1 棄却されたかどう か P 値 ■解釈のポイント P 値が 0.05 もしくは 0.01 以下ならば帰無仮説 H0 は棄却され,対立仮説が採択されます.データ に対応関係があるかどうかは折れ線グラフからも わかります. ■解析操作 解析操作 内容 折れ線グ ラフ 2変数の折れ線グラフを表示する 6.4.1 折れ線グラフ ■起動方法 ツールボタン「折れ線グラフ」クリック. 2変数の折れ線グラフが表示されていますが, 変数に対応関係があることがわかります.
2-7.異常値の検定
■目的 一連のデータ群をサンプリング地点あるいは測定方法やデータ入力,転記ミスなどによって異常な値 がまぎれ込むことがあります.異常値はデータ群中の最大値または最小値となりますが,それを検出で きる方法があると便利です. 正規分布に従うデータ群の場合,異常値があるかどうかを統計的に検定する方法として“グラブス・ス ミルノフ棄却検定”があります. ■活用場面 ・データ測定(入力)時の異常検出 ・特定データ(最大値,最小値)をマスキングする場合の判断 等 ■データ形式 データの形式は以下になります. ・1つの特性値のデータ 磨き誤差のデータ 2-6. データに対応がある場合の母平均の差に関する検定・推定 2-7. 異常値の検定計 量 値 の 検 定 ・ 推 定 P A R T 12
第
2
章
異常値の検定を行うには,上表(例)のような2次元表形式のデータをワークシートに入力して下さい. 解析に用いることができる変数は量的変数 1 個のみです.データ数は3個以上から計算できますが,統計 的には7個以上が望ましいとされています. 欠測値のあるサンプルあるいはマスクされているサンプルは解析時に除かれます.また分散が 0 になるよ うなデータ群の場合(データ数が 2 個のときや最大値と最小値が同じ値のとき)は解析を続けることがで きません. 7.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[異常値の検定] 7.2 変数の指定 変数の指定ダイアログで,検定対象の変数名を 選択して[次へ進む]ボタンをクリックします. 特性値に量的変数を1つ指定して,[次へ進む] ボタンをクリックします. 7.3 仮説の設定 ここでは検定の条件として,帰無仮説を「すべ てのデータは同じ母集団からのものである」とし, 対立仮説と有意水準を指定します. 3 つの対立仮説H1 の中から目的に応じて1つを 選択します. 1.データのうち,最も外れている値は異常値で ある 2.データの最大値は異常値である 3.データの最小値は異常値である 上記の対立仮説の設定は,棄却域を両側 に設ける両側検定,片側に設ける片側検 定に対応しています. すなわち両側検定なら 1 を,片側検定な ら 2 か 3 を選びます. 片側検定は, 1)両側検定における対立仮説の一方が 実際には起こり得ない場合 2)あるいは起こっても問題にする必要 がない場合 で,それ以外の場合は通常,両側検定を おこないます. 有意水準αは「5%」,「1%」もしくは「任意」 いずれかから選択します.「任意」を選択した場 合,右横の入力項目にパーセント値(0<α<100) を入力して下さい. 仮説の設定が終わったら,確認して[OK]ボタンを クリックします. 7.4 検定結果の確認 帰無仮説,対立仮説,基本統計量,ヒストグラ ム,検定結果が表示されます. ■評価・検討項目 チェック項目 使用する統計量等 1 基本統計量と検定 統計量 基本統計量(データ 数,平均値,分散, 2-7. 異常値の検定検定対象のサンプ ル番号と値 標準偏差,自由度, 最大値,最小値) 検定対象サンプル 番号,検定統計量 (グラッブスの検 定統計量 T,棄却限 界値 G) 2 全データの分布を ヒストグラムで確 認 平均値(デフォル ト) 3 帰無仮説は棄却さ れたか否か グラッブスの検定 統計量 T,棄却限界 値 G ■解釈のポイント 帰無仮説の採択/非採択はグラッブスの検定統計 量 T と棄却限界値 G によって決まります. T < G のとき,帰無仮説を採択します. (例)「データのうち,最大(最小)のものは 異常値であるとはいえない」 T ≧ G のとき,帰無仮説を棄却します. (例)「データのうち,最大(最小)のものは 異常値である」 上記の例だと,グラッブスの検定対象のサンプ ルは 129 番のデータで 500(つまり最大値)です. グラッブスの検定統計量 T は 4.770,棄却限界値 G は 3.469 なので T>G となり,帰無仮説 H0 は有意水 準 5%で棄却されます.その結果,対立仮説が採択 され,129 番のサンプルは異常値であるというこ とになります. この 129 番のデータはなぜ異常値なのか,原因 を追究することになります.またワークシートに 戻り,129 番をマスクして再度,異常値の検定を おこなってもよいでしょう. 2-7. 異常値の検定
ノ ン パ ラ メ ト リ ッ ク 検 定 P A R T 12
第
3
章
第3章 ノンパラメトリック検定
F検定やt検定など,母集団に特定の分布(正規分布など)を仮定し,未知のパラメータに対して行う 検定を一般的にパラメトリック検定といいます.ここで扱う検定は,母集団に特定の分布(特に正規分布) を仮定しない場合あるいは正規化できない,測定値に信頼がおけない場合などに適用される検定です が,ノンパラメトリック検定と呼んでいます.数値が得られない場合に順位データとして扱うこともできます が,順位データは数値の大きさに依存しないため,はずれ値の影響は少なくなるといわれています. 検定の種類 データの特徴,検定統計量,検定方法など χ2検定 ・クロス表の項目間には関連がなく,相互に独立であることを調べる. ・χ2統計量 ウ ィ ル コ ク ソ ン の 順 位 和 検定 ・対応のない2つのグループの中心位置(メジアン)の違いを検定する. ・Wilcoxon の統計量 ・母集団分布が正規分布ではないが,メジアンに関しては対称性があっ たり,あるいはそれに近い分布に適用する. MOOD検定 ・2つの母集団のスケールパラメータ(バラツキ)の大きさに違いがあるか どうかを調べる. ・MOOD 統計量 ウ ィ ル コ ク ソ ン の 符 号 付 き 順 位 和 検 定 ・1つの母集団の中心位置の違いや対応のある2つのグループの中心 位置の差の違いを調べるために用いる. ・順位和統計量 ・測定がおおざっぱでデータの細かな値自体には信頼がおけない,あ るいは母集団分布が正規分布と大きく異なると判断できる場合に適用 する. ・対応するデータの差の分布が正規分布と大きく異なる場合に適用す る. クラスカル ・ ウ ォ リ ス 検 定 ・3つ以上のグループ間の順位の違いを調べるために用いる.(一元配 置分散分析データに適用する) ・KW統計量:χ2分布に近似できる ・誤差の分布が未知でもよいことがパラメトリック検定と本質的に違う. ①データが順位として得られている ②測定がおおざっぱで数値自体に信頼が置けない ③母集団分布が正規分布から大きく異なる ④誤差の等分散性が崩れている フ リ ー ド マ ン 検定 ・対応がある3つ以上のグループ間の順位の違いを調べるために用い る.(二元配置分散分析/乱塊法に対応する) ・検定統計量FR:χ2分布に近似できる. ・データ表の行あるいは列の因子Aの効果を知るために,因子Bの効果 を消し因子Aの効果のみを取り出したい場合. ■機能構成 最初に6つのノンパラメトリック検定を選択して変数指定,帰無仮説と対立仮説,信頼区間等 を設定して,検定結果を表示します. ■データ形式 検定によりデータ入力形式が異なります.(1) χ2検定 クロス表形式のデータ表を用います.行列項目間の独立性を検定します. 変数名 サンプル名 X1 [量的変数] X2 [量的変数] A 52 38 B 69 18 C 41 28 ・ ・ ・ F 35 57 ※度数の検定を行う場合は、基本解析の「度数表/多変量クロス表」の機能を使用してくだ さい. 2 つの質的変数を用いてクロス表を作成して検定することができます. 変数名 サンプル名 C1 [質的変数] C2 [質的変数] 1 晴れ A 2 曇り A 3 晴れ B ・ ・ ・ 4 雨 A (2) ウィルコクソンの順位和検定 3つのデータ形式が選択できます. 1)入力データ形式1:特性値と質的変数の入力. 変数名 サンプル名 X1 [量的変数] C1 [質的変数] 1 3.5 A 2 4.8 A 3 4.0 B ・ ・ ・ 4 2.0 A カテゴリー間で中心位置の違いを検定します.ただし,欠測値のあるサンプルは除きます. 2)入力データ形式2:対象データを複数列で比較・検定します. 変数名 サンプル名 X1 [量的変数] カテゴリA X2 [量的変数] カテゴリB 1 3.5 4.0 2 4.8 3.8 3 5.0 2.4 ・ ・ ・ ・ 4.3 4.8 6 2.0 - X1,X2 がともに欠側値であるサンプルは解析対象から除きます.
ノ ン パ ラ メ ト リ ッ ク 検 定 P A R T 12
第
3
章
3)入力データ形式3:順序カテゴリーの分割表.データは度数形式. 変数名 サンプル名 男性 [量的変数] 女性 [量的変数] 1(満足) 2 3 2(中) 5 5 3(不満) 3 6 男女間で中心位置に差があるかどうかを検定します.ただし欠側値のあるサンプルは除かれ ます.各セルに度数を入力します. (3) MOOD 検定 2つのデータ形式が選択できます.2 種類の母集団の間でバラツキに違いがあるかどうかをチェッ クします. 1)入力データ形式1:特性値と質的変数の入力. 変数名 サンプル名 特性値 [量的変数] C1 [質的変数] 1 3.5 A 2 4.8 A 3 4.0 B ・ ・ ・ 19 2.0 A データ表で欠測のあるサンプルは除きます. 2)入力データ形式2:入力データ形式1の質的変数のカテゴリ(A,B)ごとに複数列で データを入力.特性値形式. 変数名 サンプル名 X1 [量的変数] カテゴリA X2 [量的変数] カテゴリB 1 3.5 4.0 2 4.8 3.8 3 5.0 2.4 ・ ・ ・ 9 4.3 4.8 10 2.0 - X1,X2 がともに欠側値であるサンプルは除きます.(4) クラスカル・ウォリス検定 3つのデータ形式が選択できます.3 つ以上のグループ間で順位に違いがあるかどうかを検定しま す. 1)入力データ形式1:特性値と質的変数の入力. 変数名 サンプル名 特性値 [量的変数] C1 [質的変数] 1 3.5 A 2 4.8 C 3 4.0 B ・ ・ ・ ・ 2.0 A データ表で欠測のあるサンプルは除きます. 2)入力データ形式2:入力データ形式1の質的変数のカテゴリ(A,B)ごとに複数列でデ ータを入力.特性値形式. 変数名 サンプル名 X1 [量的変数] カテゴリA X2 [量的変数] カテゴリB X3 [量的変数] カテゴリC 1 3.5 4.0 4.2 2 4.8 3.8 3.9 3 5.0 2.4 3.0 ・ ・ ・ ・ ・ 4.3 4.8 4.9 6 2.0 - 3.4 X1,X2,X3 がともに欠側値であるサンプルは除きます. 3)入力データ形式3:順序カテゴリーの分割表.データは度数形式. 変数名 サンプル名 ビジネス(長 期) [量的変数] ビジネス(短 期) [量的変数] 旅行 [量的変数] 1(満足) 2 3 5 2(中) 5 5 4 3(不満) 3 6 2 データ表で欠測のあるサンプルは除きます.各セルに度数を入力します. (5) ウィルコクソンの符号付き順位和検定 対応のある 2 つのデータの中心位置の差の検定に用いる場合では,入力形式1,2が利用できます. 1)入力データ形式1:特性値と種類を表す質的変数の入力. 変数名 サンプル名 特性値 [量的変数] C1 [質的変数] 1 3.5 A 2 4.8 A 3 4.0 B ・ ・ ・ 20 2.0 A 欠測値のあるサンプルは除きます.
ノ ン パ ラ メ ト リ ッ ク 検 定 P A R T 12
第
3
章
2)入力データ形式2:入力データ形式1の質的変数のカテゴリ(A,B)ごとに複数列でデー タを入力.特性値形式. 変数名 サンプル名 X1 [量的変数] カテゴリA X2 [量的変数] カテゴリB 1 3.5 4.0 2 4.8 3.8 3 5.0 2.4 ・ ・ ・ 9 4.3 4.8 10 2.0 - X1,X2 がともに欠側値であるサンプルは除きます. ・一つの母集団の中心位置に関する検定の場合 3)入力データ形式4 変数名 サンプル名 X1 [量的変数] 1 1.5 2 3.0 3 2.8 4 4.0 5 2.3 欠測サンプルは除きます. (6) フリードマン検定 2つのデータ形式が扱えます. 1)入力データ形式5 因子A,Bのどちらかの水準数を 3 以上として下さい. 例.因子Aが4水準,因子Bは3水準 変数名 サンプル名 特性値 [量的変数] 因子A [質的変数] 因子B [質的変数] A1 B1 3.5 1 1 A1 B2 3.9 1 2 A1 B3 3.2 1 3 A2 B1 5.5 2 1 ・ ・ ・ ・ A4 B3 4.5 4 3 データ表で欠測のあるサンプルは除きます.2)入力データ形式 2 例.因子Aが4水準,因子Bは3水準 変数名 サンプル名 A1 [量的変数] A2 [量的変数] A3 [量的変数] A4 [量的変数] B1 3.5 5.5 4.0 4.7 B2 3.9 4.3 3.6 4.2 B3 3.2 4.8 3.9 4.5 データ表で欠測のあるサンプルは除きます. 変数指定のまとめ 下記のようにまとめることができます. 検定の種類 変数 対応するデータ形式 量的 質的 χ2検定 2~20 0 入力データ形式3(度数形式) ウィルコクソンの順位和検定 1 2 2 1 0 0 入力データ形式1 入力データ形式2(特性値形式) 入力データ形式3(度数形式) MOOD 検定 1 2 1 0 入力データ形式1 入力データ形式2(特性値形式) クラスカル・ウォリス検定 1 3~24 3~24 1 0 0 入力データ形式1 入力データ形式2(特性値形式) 入力データ形式3(度数形式) ウィルコクソンの符号付き 順位和検定 1 2 1 1 0 0 入力データ形式1 入力データ形式2(特性値形式) 入力データ形式4 フリードマン検定 1 3~24 2 0 入力データ形式5 入力データ形式2(特性値形式)
ノ ン パ ラ メ ト リ ッ ク 検 定 P A R T 12
第
3
章
3-1.χ
2検定
■目的 カイ 2 乗検定とは、ある仮説のもとで 2 つの事象(例:製造した機械や製品品質など)を調査 し、発生した頻度(出現確率)が統計的な有意性があるかどうか(製造機械の種類によって製品 品質の出方に違いがあると言えるかどうかなど)を判定します。 2つの事象について分類した項目から2元表(製造機械種類と製品品質レベルの分割表)を作 成し,それぞれの機械で製造される製品の集まりを母集団と考えて,各母集団から得られる品質 レベルの発生確率がすべて等しい(帰無仮説:Ho)と言えるかどうかを,検定統計量(χ2値) を用いて統計的に検定します.もし,p値が有意水準(例5%)以下であるならば帰無仮説は棄 却され,対立仮説(H1)が採択されます. 帰無仮説(H0):2項目間には関連性がない(独立である,一様である,違いがない) χ2値<χ2値(0.01 あるいは 0.05),p値>0.01 あるいは 0.05 で採択 対立仮説(H1):2項目間のには関連性がある(独立ではない,一様ではない,違いがある) χ2値≧χ2値(0.01 あるいは 0.05),p値≦0.01 あるいは 0.05 で採択 ■適用上の注意点 ・a×bの分割表と言う意味では,2元配置分散分析のデータ形式と同じですが,χ2検定で使 っている数値は特性値ではなく,度数であるという点が異なります. ・観察される事象は互いに排他的でなければなりません(例えば「さいころの目」、「ある人が 男か女か」など) ・検定の有意水準(α)を厳しくすると必要な実験数・症例数(N)は増えます.例えば,有意 水準を5%から1%にすると,実験数は約1.5倍必要です.また,有意差を見逃す確率(β) を小さくするには実験数Nが増大します. ■目的 あるグループ内でのデータの出現頻度が他のグループと同じかどうかを検定するために使用します. 本機能の場合,仮説および対立仮説は以下になります. ・帰無仮説H0:各グループ(下記のデータ表の場合ラインごと)に違いはない. ・対立仮説H1 :各グループ(下記のデータ表の場合ラインごと)に違いがある. ■活用場面 ・顧客が選ぶ商品の週ごとの変化が、意味あるレベルの変動を示しているかを判定する ・配置されたスタッフの数の違いが顧客満足度に影響を及ぼしているかどうかを判定する ・臨床試験で,プラセボ群と薬物投与群で患者が治癒した割合は等しいといえるか,2群間の治 癒率の差は本当は差が無くても起こりうるのではないか,などを判定する 等 ■データ形式 クロス表形式のデータ(セル内は度数)を使用します. 例:製造ラインの種類によって製品品質(良,普通,不良)の違いがないと言えるか. 3-1. χ2検定1.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[カイ二乗検定] 1.2 変数の指定 変数の指定ダイアログで,検定対象の変数名を 選択して[次へ進む]ボタンをクリックします. 1.3 検定結果の確認 ■評価・検討項目 チェック項目 使用する統計量等 1 統計量χ2 統計量χ2,P 値 2 検定結果 帰無仮説が棄却さ れる/されない ■解釈のポイント χ2分布は自由度によって異なります.データか ら求めたχ2値がχ2分布の上側 1%(もしくは 5%) の値より大きければ仮説は棄却され,それより小 さければ棄却されません.χ2値に対応する確率値 つまりP値が1%あるいは5%以下なら帰無仮説は棄 却され,対立仮説が採択されます. コンボボックスの切り換えによって規準化残差を 表示することができます.
3-2.ウィルコクソンの順位和検定
■目的 2つの母集団A,Bについて,中心位置の違いの検定を行ないます. 本機能の場合,仮説および対立仮説は以下になります. 帰無仮説H0:A,Bの中心位置は等しい. 対立仮説H1: a)A,Bの中心位置は等しくない. b)Bの方が大きな値がでる傾向がある. c)Aの方が大きな値がでる傾向がある. ■活用場面 金属部品の径の分布の中心位置がラインAとラインBで等しいか否かを検証する. 等 ■データ形式 量的変数(洗浄度)が2つ(洗浄方法1、2)の場合は,以下のデータ形式になります. この場合の「仮説の設定ダイアログ」も合わせて示します. 3-1. χ2検定 3-2. ウィルコクソンの順位和検定ノ ン パ ラ メ ト リ ッ ク 検 定 P A R T 12
第
3
章
入力形式1の場合には以下のように入力します. 2.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[ウィルコクソンの順位和検定] 2.2 変数の指定 変数の指定ダイアログで,検定対象の変数名を 選択して[次へ進む]ボタンをクリックします. データの入力形式に合わせて変数を指定します. ここでは入力形式2のため,量的変数を2つ指 定しています. 2.3 検定・仮説の設定 データ形式,対立仮説.有意水準を選択します.有 意水準の初期値は 5%です. 2.4 検定結果の確認 [OK]ボタンをクリックすると,指定された条件で検 定・推定を行います.本システムではデータ数,対 立仮説,有意水準等の組み合わせで,ウィルコクソ ン順位和検定表が使用できる場合は,検定表の有 意点値と比較し,検定しています. ウィルコクソン順位和検定表が使用できない場合 は正規近似で検定しています. 3-2. ウィルコクソンの順位和検定■評価・検討項目 チェック項目 使用する統計量等 1 統計量 u0 統計量 u0,P 値 2 検定結果 帰無仮説が棄却さ れる/されない ■解釈のポイント 検定統計量 U0 は 2.005 であり、確率 5%の統計量 u は 1.960 で,2.005>1.960 となります.このとき P 値は 0.045(<0.005)となっています.よって有意 水準 5.0%で帰無仮説は棄却され,対立仮説「二つ の母集団の分布の中心位置は等しくない」が採択 されます.
3-3.MOOD検定
■目的 二つの母集団(A,B)について,ばらつきの大きさに違いがあるかどうかを調べるときに用います. 帰無仮説H0:二つの母集団A,Bのばらつきは等しい. 対立仮説H1: a)二つの母集団のばらつきは等しくない. b)母集団Bの方がばらつきが大きい. c)母集団Aの方がばらつきが大きい. ■活用場面 加工機械Aと加工機械Bで製造した部品径のばらつきが違うかどうか検証する. 等 ■データ形式 量的変数(圧縮強度)が2つ(入力形式2を用いる,試験方法1、2を量的変数として用いる)の場合 は,以下のデータ形式になります. 3.1 手法の選択 選択方法 [手法選択]-[検定・推定]-[MOOD検定] 3-2. ウィルコクソンの順位和検定 3-3. MOOD検定ノ ン パ ラ メ ト リ ッ ク 検 定 P A R T 12