6 章 - IBM SPSS Statistics Base 19

要約

ケースの要約手続きで、1 つ以上のグループ化変数から成るカテゴリ内の変数に対するサブグループ統計量を計算します。グループ化変数のすべてのレベルがクロス集計されます。統計量の表示順を選択できます。カテゴリ全体での各変数の要約統計量も表示されます。各カテゴリのデータ値をリスト表示したり、または表示を抑制できます。大きいデータセットでは、最初の n ケースだけを一覧表示できます。

例:€地区および顧客業種別の平均製品売上高はどのようなものでしょうか。

他地区に比べて西部地区の平均売上高はわずかに高いことがわかります。

西部地区の企業顧客からは最高の平均売上高が得られているからです。

統計量合計、ケースの数、平均値、中央値、グループの中央値、平均値の標準誤差、最小値、最大値、範囲、グループ化変数の最初のカテゴリの変数値、グループ化変数の最後のカテゴリの変数値、標準偏差、分散、尖度、尖度の標準誤差、歪度、歪度の標準誤差、総和のパーセント、総数のパーセント、グループ変数での合計のパーセント、グループ変数でのケース数のパーセント、幾何平均、調和平均。

データ。グループ化変数は、値が数値型または文字型のカテゴリ変数です。

カテゴリの数はかなり少ないものでなくてはなりません。他の変数は、

ランク付けできるものでなくてはなりません。

仮定。オプションのサブグループ統計量の中には、平均値や標準偏差などのように、通常の理論に基づいていて、対称的分布を持つ量的変数に適しているものがあります。中央値や範囲などの頑健な統計は、正規性の仮定に合う場合と合わない場合のある量的変数に適しています。

ケースの要約を行うには

E メニューから次の項目を選択します。

分析(A) > 報告書 > ケースの要約...

34 6 章

図 6-1

[ケースの要約] ダイアログボックス

E 1 つ以上の変数を選択します。

オプションとして、次の選択が可能です。

1 つ以上のグループ化変数を選択して、データをサブグループに分割する。

[オプション] をクリックして、出力表題を変更、解説を追加、または欠

損値を持つケースを除外する。

[統計]をクリックして、オプションの統計量にアクセスする。

[ケースの表示]を選択して、各サブグループのケースを一覧で表示する。

デフォルトでは、ファイル内の最初の 100 ケースだけが表示されます。[ケースの制限は最初の n ] の値を増やすか減らしたり、その項目を選択解除してすべてのケースを表示したりできます。

要約

ケースの要約のオプション

図 6-2

[オプション] ダイアログボックス

要約を使用して、出力の表題を変更したり、出力テーブルの下に表示される解説を追加することができます。また、表題や解説で改行を指定することもできます。テキスト中の任意の位置で\n と入力すると、その位置で改行されます。

欠損値のケースは、ピリオドまたはアスタリスクを付けて出力することが望ましい場合がしばしばあります。欠損値の発生時に表示させたい文字、語句、またはコードを入力します。それ以外の場合は、出力時に欠損値のケースに対して特別な処理は行われません。

36 6 章

ケースの要約の統計

図 6-3

[ケースの要約: 統計] ダイアログボックス

各グループ化変数のカテゴリ内の変数に対するサブグループ統計量としては、合計、ケースの数、平均値、中央値、グループの中央値、平均値の標準誤差、最小値、最大値、範囲、グループ化変数の最初のカテゴリの変数値、グループ化変数の最後のカテゴリの変数値、標準偏差、分散、尖度、

尖度の標準誤差、歪度、歪度の標準誤差、合計のパーセント、合計 N のパーセント、グループ化変数内の合計のパーセント、グループ化変数内の N のパーセント、幾何平均および調和平均を 1 つまたは複数選択できます。統計量が [セル統計量] リストに現れる順序は、出力に表示される順序です。カテゴリ全体で各変数に対する要約統計量も表示されます。

最初. データファイルで発生した最初のデータ値を表示します。

幾何平均. データの値の積の n 乗根です。n はケースの数を表します。

グループ中央値. グループに対してコード化されたデータについて計算され

た中央値。たとえば、年齢データで、30 代の各値が 35 にコード化され、

40 代の各値が 45 にコード化されるとすると、グループ中央値はコード化されたデータから計算された中央値になります。

調和平均. グループ間でサンプルの大きさが等しくないときに、グループの

大きさの平均を予測するために使われます。調和平均は、サンプルの合計をサンプルの大きさの逆数の和で割ったものです。

尖度. 観測値が中心の周りに群がる度合いの測定値。正規分布の場合、尖度統計値は 0 です。正の尖度は、正規分布に対して、観測が分布の中心あたりによりクラスタ化されており、分布の極値まで両裾が薄くなることを示します。急尖的分布の両裾は、正規分布に対して厚くなります。

要約

負の尖度は、正規分布に対して、観測のクラスタがより小さくなり、分布の極値まで両裾が厚くなることを示します。急尖的分布の両裾は、

正規分布に対して厚くなります。

最後. データファイルで発生した最後のデータ値を表示します。

最大値. 数値型変数の最大値。

平均. 中心傾向の測定値。観測値の合計をケース数で割った算術平均。

中央値. ケースの中央付近にある値です。50 パーセンタイルです。ケース数が偶数の場合、中央値は、昇順または降順に保存されたときの 2 つのまん中のケースの平均になります。中央値は、外れ値に対して敏感でない、中心化傾向の測定値です。それに対して平均値は、いくつかの極端に大きい、または小さい値に影響されます。

最小値. 数値型変数がとる最も小さい値。

ケースの数. ケース (観測値やレコード) の数。

総数のパーセント. 各カテゴリのケースの総数のパーセントです。

総合計のパーセント. 各カテゴリの総和のパーセントです。

範囲. 数値型変数の最大値と最小値の差。

歪度. 分布の非対称の測定値。正規分布は対称で、歪度は 0 となります。有意な正の歪度を持つ分布では、右の裾が長くなります。有意な負の歪度を持つ分布では、左の裾が長くなります。一般に、歪度がその標準誤差の 2 倍より大きい場合は、正規分布から逸脱していると考えられます。

尖度の標準誤差. 標準誤差に対する尖度の比率は、正規性の検定として使う

ことができます (すなわち、比率が -2 より小さいか +2 より大きい場合は、正規性を棄却することができます)。尖度として大きな正の値は、分布の裾が正規分布の裾より長いことを示し、尖度として負の値は短い裾を示します (箱型の一様分布の裾のようになります)。

歪度の標準誤差. 標準誤差に対する歪度の比率は、正規性の検定として使う

ことができます (すなわち、比率が -2 より小さいか +2 より大きい場合は、正規性を棄却することができます)。歪度として大きな正の値は、右の裾が長いことを示し、極端な負の値は左の裾が長いことを示します。

合計. 欠損値のないすべてのケースに対する変数の値の合計または全体。

分散 (信頼性分析). 平均値のまわりの値の散らばりの程度。平均値からの偏

差の平方和を、有効観測値の合計数から 1 を引いたもので割って求めます。分散の単位はその変数の単位の 2 乗です。

ドキュメント内 IBM SPSS Statistics Base 19 (ページ 47-52)