• 検索結果がありません。

MacR Manual Descriptive Statistics

N/A
N/A
Protected

Academic year: 2018

シェア "MacR Manual Descriptive Statistics"

Copied!
29
0
0

読み込み中.... (全文を見る)

全文

(1)

記述統計 3

統計量を算出する変数の指定 3

オプションの選択 4

Note 5

グラフ 5

グラフオプション 6

共通項目 7

ラベル 7

フォントサイズ 8

ラベルの向き 8

凡例 9

ヒストグラム (Histogram) 9

プロット範囲 9

平均ライン 10

密度ライン 10

バーの色指定 11

ヒストグラムの重ね合わせ 12

棒グラフ 13

箱ひげ図 (Box Plot) 15

プロット範囲 15

プロットタイプ 15

算術平均及び標準偏差 15

プロットの向き 16

プロットのグループ分け 16

(2)

プロットの色づけ 17

箱ひげ図 (box plot) 17

バイオリンプロット (violin plot) 18

ビーンプロット (beanplot) 18

ビースワーム (Bee Swarm) 19

QQ プロット (QQ Plot) 19

平均値プロット (Mean Plot) 20

エラーバー 20

グラフスタイルオプション 21

線グラフ (Line Plot) 21

棒グラフ (Bar Plot) 24

頻度組み合わせ表 27

頻度表 28

(3)

記述統計

データの記述統計を求めるには、データを読み込んだ後に、メニューの Stats ➜ Descriptive Stats ➜ Descriptive を選びます。

統計量を算出する変数の指定

Descriptive Statistics ウィンドウが現れると、メインウィンドウに読み込まれたデータの変 数が左側のテーブルに表示されます。変数名の右側の文字は、変数の型を示します。C は Categorical、N は Numeric です。点数などの Numeric 変数を Variables に、グループ分けな どの Categorical 変数を Grouping に移動させます。全体の記述統計を出したい場合は、 Grouping には何も移動させないでください。Grouping に 2 つ以上の変数を移動させると、 グループの組み合わせごとの記述統計が算出されます。移動させた変数は、テーブル上 で、並び順を変更できます。選択した変数をドラッグ&ドロップで移動させてください。

 変数を右側のテーブルに移動させて、Run ボタンをクリックすると、Results ウィンドウ が開き、記述統計が表示されます。算出される統計量は、サンプルサイズ (N)、算術平均 (Mean)、標準偏差 (SD)、最小値 (Min)、最大値 (Max)、標準誤差 (SE)、信頼区間 (CI)、歪 度 (Skewness)、尖度 (Kurtosis) です。CI は、Confidence Interval で、標準では、1.96 × SE (95%) となっています。

(4)

 正規性の判断基準ですが、歪度 (Skewness)、尖度 (Kurtosis) ともに、通常 ± 3 に収まっ ていれば正規性に問題はないとされています。

 ここで、表左上の Table 1 をクリックすると、表の値がタブ区切りのテキストとしてコ ピーされます。Numbers や Excel などにペーストすると、フォーマットが保たれたまま貼 付けることができます。

 グループ分けの変数を指定した場合のグループごとの記述統計は、次のように表示され ます。ここでも、Table 1 をクリックして表の値をコピーできます。

オプションの選択

現時点では、記述統計のオプションは、CI の種類と正規性の検定だけとなっています。将 来的には、もう少しオプションを増やしたいと考えています。

 CI のオプションは、どれにすべきか、という問題がよくわかっていないので、いろいろ 入れてあるというのが実情です。どれを標準にすべきかという助言をお待ちしています。

(5)

 Normality は、現時点では、自動的に N が 30 未満の時は Shapiro-Wilk、30 以上の時は Kolmogorov-Smirnov の検定が行われて、記述統計の結果の右端に表示されます。将来的に は、この 2 つの検定を選択できる、または、両方が計算されるようにする予定です。

Note

グループ分けがない場合の統計量は、R の標準の関数でそれぞれ計算しています。グルー プごとの統計量は、psych パッケージの describe.by を使っています。最新の psych パッケ ージでは describeBy を使うようにとのことなので、いずれは置き換えていきます。 グラフ

ウィンドウ右上のグラフボタンをクリックすると、ドロワーが表示されます。

 チェックボックスにチェックを入れることで、ヒストグラム (Histogram)、箱ひげ図 (Box Plot)、QQ プロット (QQ Plot)、平均値プロット (Mean Plot) が、グループの組み合わ せごとに描画されます。Mean Plot だけは、一つの変数では意味がないので、グループの組 み合わせで描画されますが、グループ分けの変数が 3 つ以上指定してある場合には、うま く描けないかもしれません。

(6)

ヒストグラム 箱ひげ図

QQ プロット 平均値プロット

 ggplot2 オプションは実験的に付けてありますが、うまく描画されない可能性がありま す。将来的には、ggplot2 で描画ができるといいのですが、優先順位は低いので、予定は未 定です。

グラフオプション

Preferences で Advanced にチェックを入れると、グラフのオプションが使えるようになり ます。Options ボタンをクリックするとオプションパネルが表示されます。

(7)

共通項目

グラフのオプションは、オプションパネル上部のタブで、それぞれのグラフに付いて設定 していきますが、共通の項目があります。

ラベル

Title, Subtitle, X Label, Y Label に関しては、デフォルト値から変更したい場合は左側のチェ ックボックスにチェックを入れて、テキストボックスの値を変更します。

Title: グラフの上部に表示されるグラフのタイトル

Subtitle: グラフの下(X ラベルのさらにした)に表示されるタイトル

X Label: X 軸のラベル Y Label: Y 軸のラベル

それぞれ、次の位置のテキストに反映されます。

(8)

Title

Subtitle

Score ( Room == 2 & ClassSize == 2 )

Y Label

20 40 60 80

0246810

フォントサイズ

 Font Size は、Title が、上部のメインタイトル、Axes が X, Y 軸ラベル、 Tick が、X, Y 軸の数値、グループラベルなどの値になります。

ラベルの向き

 右端のポップアップボタンは、軸の数値の向きの設定です。

Parallel: それぞれの軸に平行

Horizontal: 水平(X 軸に平行、Y 軸に垂直) Perpendicular: それぞれの軸に垂直

Vertical: 水平面に垂直(X 軸に垂直、Y 軸に平行)

(9)

凡例

 Legend をクリックすると、凡例が追加できます。位置と大きさ、並べて表示させる列数 を指定します。数が多い場合は、複数列に分けて表示させる方がいいでしょう。

ヒストグラム (Histogram)

タブで Histogram を選ぶと、ヒストグラムの描画オプションが設定できます。

プロット範囲

Plot Range にチェックを入れると、プロットする値の範囲を指定できます。Auto にチェッ クが入っていると、表示ができるだけきれいに収まるように調整が入ります。

 Bar Width では、ヒストグラムのバーの幅を指定できます。自動的に調整するには、 Adjust を選んで、分割のアルゴリズムを選びます。

Divide を選んだ場合は、区切る数を入力するか、コンマ区切りで区切る値を入力します。 その場合は、全変数の最小値と最大値の範囲が指定されるため、通常は、いくつに区切る かを入力します。

(10)

平均ライン

Mean Line にチェックを入れると、平均のところに立てに線が入れられます。線は赤にな ります。グループごとのヒストグラムを重ねる Overlay のオプションをつかうと、それぞ れの色で Alpha が 1.0 の線になります。

密度ライン

デフォルトでは、Y 軸方向の値は頻度ですが、密度でヒストグラムを作ることができま す。Y Type を Frequency から Density にします。

 Density を選ぶと、ヒストグラムの下に密度を表す Rub を描くことや、赤い線で正規密 度曲線 (Normal Density) を描くこともできます。

Density Line にチェックを入れると、サンプルの密度曲線を書くこともできます。その際 は、線の色と太さが指定できます。Line Var は、ヒストグラムを重ね合わせる際に (Overlay) 線の種類を変えることができるものです。

これらの指定をしてヒストグラムを書くと、次のようになります。

(11)

Histogram of Score

Score

Density

20 40 60 80

0.000.010.020.03

バーの色指定

ヒストグラムのバーの境目と中に色をつけることもできます。Color にチェックを入れ、 Bar と Border で色を指定したいものにチェックを入れて、色を指定します。

 この色の組み合わせでヒストグラムを書くと、次のようになります。

Histogram of Score

Score

Frequency

20 40 60 80

05101520253035

(12)

ヒストグラムの重ね合わせ

グループ分けの変数が指定してある場合、Overlay にチェックを入れると、2 つ以上のヒス トグラムを一つにまとめるためのオプションが表示されます。

 Color では、R のプリセットの色グループの色を使う他に、List を選択して、それぞれの グループの色を指定することもできます。

 List を選択すると Options ボタンがクリックできるようになり、クリックすると、色の 割当パネルが表示されます。最初の状態では何も表示されていないので、Fill ボタンをク リックして、グループの組み合わせをテーブルの表示させます。表示させたら、Bar と Border の色を指定します。指定したら Close をクリックしてパネルを閉じます。

 色の指定と凡例を表示させると次のようになります。左の図は、色に Rainbow を指定し ています。Alpha(透明度)が 0.2 なので、色がかなり薄くなっています。右側の図は、上

(13)

の例に示した色を指定してあります。こちらも Alpha が 0.2 なので、かなり薄い色の表示 になっています。薄い色を指定した場合は、Alpha の値を大きくするのがいいでしょう。

Histogram of Score

Score

Frequency

20 40 60 80

05101520

Room == "1" Room == "2"

Histogram of Score

Score

Frequency

20 40 60 80

05101520

Room == "1" Room == "2"

 Overlay で色を指定した上で、Y Type を Density に指定し、Density Line と Normal Density、Line Var、Mean Line にチェックを入れると、次のようなグラフが描けます。

Histogram of Score

Score

Density

20 40 60 80

0.000.010.020.030.040.05

Room == "1" Room == "2"

棒グラフ

ヒストグラムを描く場合、Overlay オプションを使うと、重ね合わせたグラフになります が、横に並べたり、積み重ねたりしたグラフにしたい場合は、Barplot オプションを使い ます。Besides で横に並べるグラフ、Accumulate で積み重ねるグラフになります。

(14)

 標準のオプションでは、左のようなグラフが描けます。Transpose のチェックを外す と、右のような図になります。Color にチェックを入れると Color で指定した色で描画さ れます。Horizontal にチェックを入れると、横向きのグラフになります。

20−25 25−30 30−35 35−40 40−45 45−50 50−55 55−60 60−65 65−70 70−75 75−80 80−85 85−90 90−95

Histogram of Score

Frequency

0 5 10 15 20

Room == "1" Room == "2" Histogram of Score

Frequency

0 5 10 15 20

 Accumulate を選択して、Horizontal、Transpose、Color にチェックを入れると、次のよう なグラフになります。

20−25 25−30 30−35 35−40 40−45 45−50 50−55 55−60 60−65 65−70 70−75 75−80 80−85 85−90

90−95 Room == "1"

Room == "2" Histogram of Score

Frequency

0 5 10 15 20 25 30

(15)

箱ひげ図 (Box Plot) プロット範囲

Plot Range にチェックを入れると、プロットする Y 軸の値の範囲を指定できます。X 軸は グループ分けなので、範囲がありません。

プロットタイプ

箱ひげ図のオプションでは、箱ひげ図だけでなく、バイオリンプロットや、ビーンプロッ トも描くことができます。

020406080100

Box Plot

020406080100

Score

Violin Plot

020406080100

Bean Plot

Box Plot Violin Plot Beanplot

算術平均及び標準偏差

Box Plot を選んだ時のみ、プロットに、算術平均 (Mean) と標準偏差 (SD) をプロットでき ます。

(16)

20406080

Box Plot

Score

Room == 1 ClassSize == 1

Room == 1 ClassSize == 2

Room == 1 ClassSize == 3

Room == 2 ClassSize == 1

Room == 2 ClassSize == 2

Room == 2 ClassSize == 3

プロットの向き

いずれのプロットも、縦と横のどちらにも対応しています。

右の図は、Horizontal

20 40 60 80

Box Plot

プロットのグループ分け

グループもしくは変数が複数ある場合、プロットをグループごとにまとめるか、変数ごと にまとめるかを選択できます。

(17)

 変数が 1 つで、グループが 2 つの場合、グループごとに分けると、グループそれぞれに 1 つずつ計 2 つのグラフが作成されます。変数ごとに分ける場合は、 変数が一つなので、 次のように 2 つのグループの箱ひげ図が 1 つにまとめられます。

Room == "1" Room == "2"

20406080

Box Plot

Score

プロットの色づけ 箱ひげ図 (box plot)

複数のグループの箱ひげ図を描く場合、箱の中の色を R のプリセットの色グループの色で 指定できます。複数の box が描かれる時は、色グループの色が順に当てはめられていきま す。

 それぞれのボックスに、任意の色を指定したい場合は、List を選んで Ops をクリック し、色指定パネルを表示させます。

 表示させたら、Fill をクリックして、グループ分けのリストを表示させ、箱の中 (Box) と箱の外枠 (Border) を指定します。Point は、下で説明する Bee Swarm の点の色を指定し ます。

(18)

バイオリンプロット (violin plot)

現在のバージョンでは、バイオリンプロットの色は、すべてのプロットに同じ色しか指定 できません。枠線の色も、同様に、すべてのプロットで同じになります。

ビーンプロット (beanplot)

バイオリンプロット同様、プロットの中と枠にはそれぞれ単一色しか割り当てることがで きません。また、Line Width で、横線の幅を調節できます。

 以下のグラフは、上に出てくるそれぞれの色の設定で描いた物です。

Room == "1" Room == "2"

20406080

Box Plot

Score

20406080

Room == "1" Room == "2"

Violin Plot

Score

20406080

1 2

Bean Plot

Score

(19)

ビースワーム (Bee Swarm)

ビースワームは、サンプルの分布を点で表す手法で、上の 3 つのタイプのすべてのグラフ に重ね合わせて描くことができます。ただ、バイオリンプロットとビーンプロットでは、 情報として追加される物がないので、通常は、箱ひげ図にのみ使います。

 ここでは、オプションで、どのように分布するかが選べます。Bee Swarm と Strip Chart の 2 種類です。

 それぞれ、どのように分布するかは、次の図を見てください。

Room == "1" Room == "2"

20406080

Box Plot

Score

Room == "1"Room == "2"

●●

●●

Room == "1" Room == "2"

20406080

Box Plot

Score

Room == "1"Room == "2"

Bee Swarm Strip Chart

QQ プロット (QQ Plot)

現在のバージョンでは、QQ 独自のオプションはありません。

(20)

平均値プロット (Mean Plot)

平均値の推移をプロットするオプションなので、複数の変数もしくはグループの記述統計 を算出する場合のみ意味があります。

 平均値プロットには、線グラフ (Line Plot) と 棒グラフ (Bar Plot) のオプションがあり、 デフォルトでは線グラフが選択されています。

5055606570

Mean Plot

Means

ClassSize

1 2 3

ClassSize == "1" ClassSize == "2" ClassSize == "3" Mean Plot

Means 0102030405060

線グラフ (Line Plot) 棒グラフ (Bar Plot)  

エラーバー

線グラフ、棒グラフのいずれの場合にも、エラーバーを追加することができます。エラー バーの種類は、記述統計のメインのウィンドウにある CI で選んだ値になります。ひげの 部分は、自動で長さが決まらないので、Width で指定します。

(21)

5055606570

Mean Plot

Means

ClassSize

1 2 3 ClassSize == "1" ClassSize == "2" ClassSize == "3"

Mean Plot

Means 020406080

線グラフ (Line Plot) 棒グラフ (Bar Plot)

グラフスタイルオプション 線グラフ (Line Plot)

グループ分け無し グループ分けあり

線グラフは、一つのグラフ上に 2 つのグループ分け変数のプロットが表示でき、それ以上 の場合は、グループ分けの組み合わせごとに 2 つずつにそれぞれグラフが描かれ、複数の データ変数がある場合は、変数ごとに別のグラフが描かれますが、 All in one を選ぶと、 一つのグラフにまとめることができます。ただし、見づらくなることと、十分な検証がで きていないので、気をつけてお使いください。

(22)

 線グラフでは、通常は、データ変数は、X 軸や Y 軸の値としては利用されませんが、 Include Vars のオプションにチェックを入れると、X 軸の値として利用できるようになり ます。

 グラフのまとめ方は、同じデータ変数のものをまとめる (By Variables)、もしくは、それ ぞれのグループ分け変数ですべてのデータ変数のグラフをまとめることができます。

 Transpose にチェックを入れると、X 軸と Y 軸に割り当てられた値を入れ替えることが できます。

 プロットのタイプ(スタイル)は、線のみ (Line Only)、点のみ (Marker Only)、線と点 (Line & Marker) 、線と点を結ぶ (Overlay) が選べます。

Line Only Marker Only Line & Marker Overlay  プロットの線、点、色は、それぞれスタイルを選択できます。すべて同じにするか、

 いずれも、同じ設定をすべてに当てはめる (Uniform)、順に変える (Variable)、細かく設 定する (Specify) が選べます。Uniform を選んだ場合は、右側の設定の物が、すべてのプロ

(23)

ットに適用されます。Variable を選ぶと、Line と Marker は、R のデフォルトの 1 から順 に、色は、プリセットの色グループを選んで、順に適用されます。

 Specify を選んだ場合は、Options ボタンをクリックして、それぞれ細かく設定します。

40506070

Mean Plot of Score

Means

Room

1 2

 複数の変数などのプロットをまとめた場合、それぞれのプロットの識別ができるよう に、凡例を追加できます。これは、元の凡例とは別の物になります。グループ分けの変数 などが 2 までの場合は、上記の凡例と同じになります。

(24)

 これらを組み合わせて、データ変数を 2 つ、グループ分け変数を 2 つで、すべてのグラ フを重ねてグラフを描くと、次に示すようになります。

404550556065

Mean Plot

Means

female

0 1

race == 1 race == 2 race == 3 race == 4

read write

棒グラフ (Bar Plot)

平均値を棒グラフで表すこともできます。Graph Type で Bar Plot を選んでください。  棒グラフのまとめ方は、次の 5 つから選ぶことができます。

 All で始まる選択肢を選ぶと、すべての変数のグラフが一つにまとめられます。By で始 まる選択肢を選ぶと、それぞれ別のグラフに描かれます。By First Group では、グループ分 け変数の一番上の変数ごとに、By Groups では、グループ分け変数のそれぞれのグループ の組み合わせごとに、By Variables では、データ変数ごとにグラフが描かれます。

(25)

female == "0" race == "1" female == "0"race == "2" female == "0" race == "3" female == "0"race == "4" female == "1" race == "1" female == "1" race == "2" female == "1"race == "3" female == "1" race == "4"

Mean Plot

Means

0 10 20 30 40 50 60 70

read write math

read write math

Mean Plot

Means

0 10 20 30 40 50 60 70

female == "0" & race == "1" female == "0" & race == "2" female == "0" & race == "3" female == "0" & race == "4"

female == "1" & race == "1" female == "1" & race == "2" female == "1" & race == "3" female == "1" & race == "4"

All by Groups All by Variables

read write math

Mean Plot (female == 0)

Means

0 10 20 30 40 50 60 70

race == "1" race == "2"

race == "3" race == "4"

read write math

MeanPlot ( female == "0" & race == "1" )

Means

0 10 20 30 40 50 60 70

read write

math

By First Group By Groups

(26)

female == "0" female == "1" Mean Plot of read

Means

0 10 20 30 40 50 60 70

race == "1" race == "2"

race == "3" race == "4"

By Variables

 By Groups を選んだ場合は、バーの間隔を Space で設定できます。

 Label Font Size は、X 軸に表示される、ラベルの文字の大きさを設定できます。変数の 組み合わせなどで長くなった際に、調整してください。

 色とバーに描く斜線の設定もできます。現在は、ここに設定できるようにはなっておら ず、あらかじめ設定された組み合わせを選んでください。将来的には対応したいと考えて います。

read write math

Mean Plot

Means

0 10 20 30 40 50 60 70

female == "0" & race == "1" female == "0" & race == "2" female == "0" & race == "3" female == "0" & race == "4"

female == "1" & race == "1" female == "1" & race == "2" female == "1" & race == "3" female == "1" & race == "4"

(27)

頻度組み合わせ表

2 つのグループ分け変数の組み合わせがどのようになるのかを見ることができます。デー タを読み込んだ後に、メニューの Stats ➜ Descriptive Stats ➜ Tabulate を選びます。

 ウィンドウでは、他のツールと同じように左側に読み込まれている変数が表示されま す。Var 1 から Var 4 に変数を移動させてください。

結果は、単純な頻度表になります。3 つ以上変数を指定すると、3 つめ 4 つめの組み合わ せごとに 1 つめと 2 つめの変数の頻度表が表示されます。

(28)

頻度表

それぞれの Categorical 変数の要素の頻度を集計します。データを読み込んだ後に、メニュ ーの Stats ➜ Descriptive Stats ➜ Frequency Counts を選びます。

 ウィンドウでは、他のツールと同じように左側に読み込まれている変数が表示されま す。頻度を集計したい Categorical 変数を Variables に移動してください。Grouping には、 グループ分けの変数も指定できます。

変数のレベル(カテゴリー)が多い場合は、リストが長くなるため、デフォルトでは最大 5 までに制限されています。Max List Length で最大値の設定をしてください。また、出力 の形式は、すべての変数を横に並べて、縦に頻度が並んで表示される (All) 形式と変数ご とに横に頻度が並んで表示される (Each Variable) 形式を指定できます。

(29)

 それぞれの出力は、次のようになります。By Group は、グループ分けの変数を指定した 時の出力になります。

All Each Variable By Group

参照

関連したドキュメント

前回パンダ基地を訪れた時と変わらず、パンダの可愛らしい姿、ありのままの姿に癒されまし

※ログイン後最初に表示 される申込メニュー画面 の「ユーザ情報変更」ボタ ンより事前にメールアド レスをご登録いただきま

奥付の記載が西暦の場合にも、一貫性を考えて、 []付きで元号を付した。また、奥付等の数

奥付の記載が西暦の場合にも、一貫性を考えて、 []付きで元号を付した。また、奥付等の数

(注)本報告書に掲載している数値は端数を四捨五入しているため、表中の数値の合計が表に示されている合計

“〇~□までの数字を表示する”というプログラムを組み、micro:bit

LF/HF の変化である。本研究で はキャンプの日数が経過するほど 快眠度指数が上昇し、1日目と4 日目を比較すると 9.3 点の差があ った。

2リットルのペットボトル には、0.2~2 ベクレルの トリチウムが含まれる ヒトの体内にも 数十 ベクレルの