• 検索結果がありません。

乗検定

ドキュメント内 statistics_extended_project_book.ps (ページ 133-200)

第 9 章 t 検定

カイ 2 乗検定

期待確率をカスタマイズする: カテゴリーの指定したリストに不等な度数を指定できます。文字列値または 数値のリストを指定してください。リストの値は、サンプルに存在していなくても構いません。「カテゴリ ー」列でカテゴリー値を指定します。「相対度数」列で、各カテゴリーに 0 より大きい値を指定します。

カスタム度数は比率として処理されるので、例えば、1、2、および 3 の度数を指定することは 10、20、お よび 30 の度数を指定することと同じであり、両者ともレコードの 1/6 が最初のカテゴリーに、1/3 が 2 番目のカテゴリーに、1/2 が 3 番目のカテゴリーに当てはまるよう指定しています。カスタムの期待確率 を指定する場合、カスタムのカテゴリー値には、データ内のすべてのフィールド値が含まれる必要がありま す。そうでない場合は、そのフィールドの検定は実行されません。

Kolmogorov-Smirnov 検定のオプション: このダイアログは、検定する分布、および仮説の分布のパラメ

ーターを指定します。

正規 : 「サンプル・データを使用」では、観測された平均値および標準偏差が使用されます。「カスタ ム」では、値を指定することができます。

一様: 「サンプルデータを使用」では、観測された最小値および最大値が使用されます。「カスタム」で は、値を指定できます。

指数 : 「サンプル平均」では、観測平均値が使用されます。「カスタム」では、値を指定することができ ます。

ポワソン: 「サンプル平均」では、観測平均値が使用されます。「カスタム」では、値を指定することが できます。

ラン検定のオプション: ラン検定はフラグ型フィールド (カテゴリーが 2 つだけのカテゴリー・フィール ド) を対象としていますが、グループを定義するルールを使用することにより、すべてのフィールドに適用 できます。

カテゴリー・フィールドのグループを定義する: 使用可能なオプションは次のとおりです。

v 「サンプル内のカテゴリーは 2 つだけです」を指定すると、サンプルで検出された値を使用してラン 検定を実行し、グループを定義します。このオプションは、値が 2 つだけの名義型フィールドまたは順

序型フィールドにのみ適用できます。このオプションが使用されている、「フィールド」タブで指定し たその他すべてのカテゴリー・フィールドは検定されません。

v 「データを 2 つのカテゴリーに再コード化する」を指定すると、指定した値のリストを使用してラン 検定を実行し、グループの 1 つを定義します。サンプルのその他の値はすべて、もう 1 つのグループ を定義します。リストの値がすべてサンプルに存在する必要はありませんが、少なくとも 1 つのレコー ドが各グループに必要です。

連続型フィールドの分割点を定義する: 連続型フィールドのグループのを定義方法を指定します。最初のグ ループは分割点以下の値として定義されます。

v 「サンプル中央値」は、分割点をサンプル中央値に設定します。

v 「サンプル平均値」は、分割点をサンプル平均値に設定します。

v 「カスタム」を指定すると、分割点の値を指定できます。

検定オプション

有意水準: すべての検定の有意水準 (アルファ) を指定します。0 から 1 までの数値を指定してください。

デフォルトは 0.05 です。

信頼区間 (%): 作成されたすべての信頼区間の信頼度レベルを指定します。0 から 100 までの数値を指定 してください。デフォルトは 95 です。

除外されたケース: 検定のケース基準の決定方法を指定します。

v 「リストごとにケースを除外」を指定すると、「フィールド」タブで指定したフィールドに対して欠損 値を持つレコードは、すべての分析から除外されます。

v 「検定ごとに除外」を指定すると、特定の検定に使用されるフィールドに対して欠損値を持つレコード は、その検定から除外されます。分析に複数の検定を指定すると、各検定は個別に評価されます。

ユーザー欠損値

カテゴリー・フィールドのユーザー欠損値: レコードを分析に含めるには、カテゴリー・フィールドに有効 値が必要です。これらのコントロールを使用すると、カテゴリー・フィールドでユーザー欠損値を有効値と して扱うかどうかを決定できます。システム欠損値および連続型フィールドの欠損値は常に無効として処理 されます。

NPTESTS コマンドの追加機能

このコマンド・シンタックス言語では、次の作業を行うこともできます。

v 手続きを 1 回実行して、1 サンプル検定、独立サンプル検定、対応サンプル検定を指定する。

シンタックスについて詳しくは、「コマンド・シンタックス・リファレンス 」を参照してください。

独立サンプルのノンパラメトリック検定

独立サンプルのノンパラメトリック検定は、1 つ以上のノンパラメトリック検定を使用して 2 つ以上のグ ループ間の差分を特定します。ノンパラメトリック検定では、データが正規分布になると仮定しません。

目的は?: 目的により、一般的に使用される互いに異なる検定の設定を迅速に指定できます。

v 自動的にグループ間の分布を比較する: この目的では、2 つのグループのデータには Mann-Whitney の U 検定が、または k 個のグループのデータには Kruskal-Wallis の一元配置分散分析が適用されます。

v グループ間の中央値を比較する: メディアン検定を使用して、グループ間で観測された中央値が比較さ れます。

v カスタム分析: 「設定」タブで検定の設定を手動で修正する場合、このオプションを選択します。後で

「設定」タブのオプションに変更を行い、その変更が現在選択されている目的と互換性がない場合、こ の設定が自動的に選択されることに注意してください。

独立サンプルのノンパラメトリック検定を取得するには

メニューから次の項目を選択します。

「分析」 > 「ノンパラメトリック検定」 > 「独立サンプル...」

1. 「実行」をクリックします。

必要に応じて、以下の操作を実行することができます。

v 「目的」タブで目的を指定する。

v 「フィールド」タブでフィールド割り当てを指定する。

v 「設定」タブでエキスパート設定を指定する。

「フィールド」タブ

「フィールド」タブでは、検定するフィールドおよびグループを定義するために使用するフィールドを指定 します。

事前定義された役割を使用: このオプションでは、既存のフィールド情報が使用されます。事前定義された 役割が「目標」または「両方」に指定されているすべての連続型フィールドと順序型フィールドは、検定フ ィールドとして使用されます。事前定義された役割が「入力」である単一のカテゴリー・フィールドは、グ ループ化フィールドとして使用されます。そうでない場合、デフォルトではグループ化フィールドは使用さ れないため、カスタム・フィールドの割り当てを使用する必要があります。1 つ以上の検定フィールドおよ びグループ化フィールドが必要です。

カスタム・フィールド割り当ての使用: このオプションを使用すると、フィールドの役割をオーバーライド できます。このオプションを選択した後、以下のフィールドを指定します。

v 検定フィールド: 1 つ以上の連続型フィールドまたは順序型フィールドを選択します。

v グループ: カテゴリー・フィールドを選択します。

「設定」タブ

「設定」タブは、アルゴリズムがデータをどのように処理するかを調整するために変更できる、複数グルー プの設定で構成されています。現在選択されている目的と互換性のない変更をデフォルト設定に対して行う と、「目的」タブが自動的に更新され、「分析のカスタマイズ」オプションを選択します。

検定の選択

これらの設定は、「フィールド」タブで指定したフィールドに実行する検定を指定します。

データに基づいて検定を自動的に選択します: この設定では、2 グループのデータには Mann-Whitney の U 検定が、k 個のグループのデータには Kruskal-Wallis 一元配置分散分析が適用されます。

検定のカスタマイズ: この設定では、実行する特定の検定を選択できます。

v グループ間の分布を比較する: サンプルが同じ母集団から抽出されているかどうかに関する独立サンプル 検定を作成します。

「Mann-Whitney U (2 サンプル)」では、各ケースの順位を使用して、グループが同じ母集団から抽 出されているかどうかを検定します。昇順に並んだグループ化フィールドの最初の値が最初のグループ を定義し、2 番目の値が 2 番目のグループを定義します。グループ化フィールドに 2 つを超える値が ある場合、この検定は作成されません。

「Kolmogorov-Smirnov (2 サンプル)」は、2 つの分布間の中央値、散らばり、歪度などの差分に対して 敏感です。グループ化フィールドに 2 つを超える値がある場合、この検定は作成されません。

「ランダム性の順序をテストする (2 サンプルの Wald-Wolfowitz)」は、基準として所属グループを指定 してラン検定を作成します。グループ化フィールドに 2 つを超える値がある場合、この検定は作成され ません。

「Kruskal-Wallis の一元配置分散分析 ANOVA (k サンプル)」は、Mann-Whitney の U 検定の拡張であ り、一元分散分析のノンパラメトリック版です。オプションで、「すべてのペアごと」の多重比較、ま たは「ステップワイズのステップダウン」の比較のいずれかで、k 個のサンプルの多重比較を要求でき ます。

「順序付けのサンプルをテストする (k サンプルの Jonckheere-Terpstra)」は、k 個のサンプルが自然な 順序の場合、Kruskal-Wallis に比べてより強力な方法です。例えば、k 個の母集団が k 段階の温度上昇 を表すとします。異なる温度でも同じ応答分布になるという仮説が、温度が上昇するにつれて応答の大 きさが増えていくという対立仮説に対して検定されます。この場合、対立仮説が順序付けされるため、

使用する検定としては Jonckheere-Terpstra が最も適しています。対立仮説の順序を指定します。「最小 から最大」を指定すると、最初のグループの位置パラメーターが 2 番目と等しくなく、よって 2 番目 も 3 番目と等しくなく、以降も同様となるという対立仮説が規定されます。「最大から最小」を指定す ると、最後のグループの位置パラメーターが最後から 2 番目と等しくなく、よって最後から 2 番目も 最後から 3 番目と等しくなく、以降も同様となるという対立仮説が規定されます。オプションで、「す べてのペアごと」の多重比較、または「ステップワイズのステップダウン」の比較のいずれかで、k 個 のサンプルの多重比較を要求できます。

v グループ間の範囲を比較する: サンプルの範囲が同じかどうかに関する独立サンプル検定を作成します。

「Moses の外れ値反応検定 (2 サンプル)」は、比較グループに対して制御グループを検定します。昇順 に並んだグループ化フィールドの最初の値が制御グループを定義し、2 番目の値が比較グループを定義 します。グループ化フィールドに 2 つを超える値がある場合、この検定は作成されません。

v グループ間の中央値を比較する: サンプルの中央値が同じかどうかに関する独立サンプル検定を作成しま す。「メディアン検定 (k サンプル)」では、プールされたサンプル中央値 (データ・セットのすべての レコードで計算) またはカスタム値を仮説の中央値として使用できます。オプションで、「すべてのペア ごと」の多重比較、または「ステップワイズのステップダウン」の比較のいずれかで、k 個のサンプル の多重比較を要求できます。

v グループ間の信頼区間を推定する: 「Hodges-Lehman 推定 (2 サンプル)」を指定すると、2 つのグル ープの中央値の差分に対する独立サンプル推定および信頼区間が作成されます。グループ化フィールド に 2 つを超える値がある場合、この検定は作成されません。

検定オプション

有意水準: すべての検定の有意水準 (アルファ) を指定します。0 から 1 までの数値を指定してください。

デフォルトは 0.05 です。

信頼区間 (%): 作成されたすべての信頼区間の信頼度レベルを指定します。0 から 100 までの数値を指定 してください。デフォルトは 95 です。

ドキュメント内 statistics_extended_project_book.ps (ページ 133-200)

関連したドキュメント