• 検索結果がありません。

IV-1.検定の作業

N/A
N/A
Protected

Academic year: 2021

シェア "IV-1.検定の作業"

Copied!
3
0
0

読み込み中.... (全文を見る)

全文

(1)

IV.有意性の検定 IV-1. 検定の作業

有意性・有意差の検定にはさまざまなものがありますが、検定しようとするデータのタイ プの違いと検定の目的の違いが、様々な統計検定が生まれる理由です。すべての検定を説 明することは不可能ですが、データや分析の目的によって、分析方法をタイプ分けしてお くことは、適切に検定法を選択するために必要でしょう。よくあるのは、データについて、

パラメトリックなデータか、ノンパラメトリックなデータかという分け方です。しかし、

この考え方は多少観念的です。正直に告白すると、筆者にはパララメトリック、ノンパラ メトリックという分け方の境界が何なのかよくわかりません。計量的(quantitative)なデ ータはパラメトリック、形質的(qualitative)なデータだとノンパラメトリックと完全に二分 法的に分けることはできません。確かに、性別とか、国籍とか名義的変数で表現されるデ ータもありますが、多くのデータは、計量的な性質と形質的な性質を両方もっています。

このことについては、データとして表現するために使われる尺度の水準の問題として、対 応分析のところでもう一度改めて触れます。性別のような名義変数も、男性は男性性1、

女性性0、女性は女性性1男性性0と表現すれば、数値的に表現できます。そんなものは 定量性がないということはできますが、無理に理屈をこねれば、男性度1の物を男性、男 性度0を女性としたと言い訳することはできないわけでもありません。パラメトリックな 統計解析とは、データに母集団分布が確率的に分布していることが仮定できて、その分布 を決める母数を求めることによって、確率が計算できると考えられ場合に用いる検定法で す。ノンパラメトリックとは、そのような分布をあらかじめ仮定できない場合に用います。

少し、実戦的に考えると、少数例の実験データのように、等分散性が確認できない場合に は、パラメトリックなデータでも、ノンパラメトリックの分析方法を考えるというやり方 もあります。カイ二乗検定は、期待値からの差の分布であるカイ二乗分布を前提にしてい ますから、パラメトリックな分析なのですが、名義変数で表現されたグループ間の違いの 検定に使われます。F検定やstudentのt検定などは、そのままでは形質的なデータに使え ませんが、例えば、アンケートなどの選択肢などが、程度を表す順序データであれば、デ ータの分布の形を確かめて、単峰形に分布するのであれば、そのままでも、あるいは、プ ロビット変換やロジット変換あるいは何らかの関数を使って変換を行って、正規性と等分 散性を作り出してパラメトリックな手法で分析することも考えられます。著者が若かった ころには、コンピュータを使った統計解析のソフトウェアーはなかったので、様々な変形 をして、無理やりF 検定やt 検定をしました。おそらく今は、そういう無理なことをしな いで、ノンパラメトリックな分析法のソフトウェアーを使って統計解析が行われているも のと思います。

大切なことは分布が正規的で標本集団間に等分散性があるかないかを確認することです。

厳密に正規分布して等分散性が保証されているデータなど現実にはめったにないと言われ

(2)

れば、確かにその通りなのですが、ここでは、正規性や等分散性が明瞭に否定されていな ければよいぐらいにゆるく考えてください。データが得られたら、まず、記述統計的にそ れぞれの集団ごとに平均値と分散を求め、全体としてデータの頻度分布を描いてみるべき です。それによって、データについて様々な情報が得られます。習慣化しておきましょう。

場合によっては、データの数が少なすぎて等分散性や分布の形がわからない場合もありま す。そういう場合は、データが持っている性格や過去の知見を参考に分析方法を選択しま す。もし、それが有効で必要であれば、なんらかの関数でデータを変形して正規化して t 検定F検定などのパラメトリックな分析をすることもあり得ます。一般的に t 検定は一対 の集団の平均値の差の有意性に関する検定に用いられます。分子の自由度を1として 2 つ のグループ間の差のF検定で有意差を検定することもできますが、2グループの差の有意 性の検定はt検定で行うことが一般的です。それはt検定の方がわかりやすいからです。3 つ以上のグループ間の差の検定はF検定で行います。3つ以上のグループの場合、その中 から2つずつ選んで、t検定を行うというのも考えられます。しかし、初めからそれを行う ことは薦められません。統計検定を繰り返して行うと、統計的なエラーの可能性が増加す るからです。たとえば、一つの組み合わせについて、それが同じであるという帰無仮説が 正しい可能性が19/20のであれば、そうでないことが起こる可能性は𝑝 = 0.05です。つまり、

そのようなことが起これば、帰無仮説を否定して、それは同じではないと判断します。し かし、これを2回繰り返すと、2つの組み合わせとも帰無仮説が正しいという可能性は

= 0.9025になるので、二のうちどれかで帰無仮説が正しくないという確率は𝑝 = 1 − 0.9025 = 0.0975となります。いくら固い馬券でも続けて勝負して勝ち続けることはできな いということと同じです。もし、5つのグループがあると、そこから2つ取り出す組み合 わせの総数は

𝐶 = 105C2=10

ですので、それらの組み合わせのすべてで差がないという可能性は 19

20 = 0.598734

となります。もともと、帰無仮説(すべてのグループ間で差がない)を否定できる可能 性が 40%ぐらいしかないのです。あまり意味のある検定とは言えません。その場合、

もともと有意差のレベルを

𝑝 = 0.005程度に厳しく設定することも考えられます。こういう 補正をボンフェローニ補正と言います。そのような補正をして計算することが適切かどう かはわかりません。すべての帰無仮説が否定されなければ全体として差がないと判断でき ないというのは、あまりに極端な立場でしょう。この場合、まずF検定でグループ間の平 均的な分散がランダムな分散や組み合わせによる分散(交互作用)に比べて、十分に大き いかどうかを議論すべきでしょう。個別の組み合わせについての検定は、そのあとどこに 差があるのかを調べるものと考えて良いでしょう。

(3)

下図にパラメトリックな分析について、分析法の選択のフローチャートを示しました。

変 換

transform

分散の分離

F比

χ 検定 t 検定 F検定

yes

yes yes

期待値を考えられるか

yes no

差の検定か

no

no

分散 自由度

t 値 その他の分析

ノンパラメトリ ック

二項分布 ポアソン

計量的なデータか

正規分布的か

χ 値

no

参照

関連したドキュメント

4.4 コア強度の確率分布 周らの研究 6によれば既存 RC 造建築物から採取した コアの圧縮強度は対数正規分布に従うとされている。本 論では分析データのうち一つの建物から

1 分析方法  ここでは、 「カイ二乗検定」を用い、男女差の検証を 行った。

11章 母集団と指定値との量的データの検定 11.1 検定手順 前章で質的データの検定手法について説明しましたので、ここからは量的データの検定に ついて話します。量的データの検定は少し分量が多くなりますので、「母集団と指定値との 検定」、「対応のない2群間の検定」、「対応のある2群間の検定」と3つに章を分けて話

母分散の検定 • は正規母集団 か らの大きさ の無作為標本とする.このとき, は、検定問題 に対 する有意水準 αの検定である.

例として, $X$ にガンマ分布 , カイ 2 乗分

簡単には単純な積分の形にはならないでしょう。これを極座標にすることによって、極め

乱数の発生回数を増やせ ば増やすほどカイ 2

進度群)に示す。