グラフの作成は[挿入][グラフ]と進んで、グラフウィザードに沿っていけば大まかなグラフは作れます。
以下の表は資料(左側データ)を表計算ソフトに入力して出力したグラフ、ヒストグラム(右図)である。
ただし階級は、52.0kg以上55.0kg未満の階級のことを52.0-55.0などと表すことにする。ここで注意する ことは、棒グラフとヒストグラムの違いで、棒グラフは、質的データや離散変量などを表すために使います
が、例として挙げているデータは連続変量で、項目間の幅に意味をもちます。ですから取りあえず、グラフ ウィザードで棒グラフを選んでおいてから、変量間の間隔をゼロに設定します。具体的にはつぎのように行い ます。
(1) 縦軸に描く系列データ(度数値)を選んで、この範囲のセルをアクティブにする (2) 挿入‐グラフ選択‐縦棒‐2D縦棒,とすると大まかなグラフができる
(3) 横軸(項目データ)には指定をしていないので、1,2,3,などと出るのでこれを修正します
(4) グラフエリアで「横(項目)軸データ」(1,2,3,などの部分)をクリック、「データソースの選択」ウィ ザードで「編集」、「グラフデータの範囲」を階級値として選んでから,「OK」で入力される。ここまで で一応の棒グラフとして完成している
(5) ヒストグラムにするために横軸の幅を調整する。描かれている棒(系列1)にマウスを移動して右ク リックする
(6) 「データ系列の書式設定」で「系列のオプション」「要素の間隔」を「なし(0%)」にスライドさせると、
間隔がなくなり、ヒストグラムとして完成。
もし描いたグラフを他の利用するためにファイルとして保存するためには、まずグラフエリアをクリック し、「クリップボード」、「貼り付け」、「図」、「図としてコピー」「図のコピー」にてOKとすると、準備完了つ ぎに「スタート」「すべてのプログラム」「アクセサリー」と進んで「ペイント」を起動して、枠の右下側にて 範囲を設定してから、「編集」「貼り付け」とすれば、表示される。それから「名前を付けて保存」とすれば、
JPEGファイルなどとして保存される。
A B C
1 階級 階級値 度数
2 52.0-55.0 53.5 1 3 55.0-58.0 56.5 3 4 58.0-61.0 59.5 1 5 61.0-64.0 62.5 2 6 64.0-67.0 65.5 1 7 67.0-70.0 68.5 1 8 70.0-73.0 71.5 1
図5 度数折れ線グラフ
度数折れ線は左右両端に度数が0である階級があるも のとして作図をする。最初と最後の階級値に0(ゼロ)
を入れておく。このグラフを表計算ソフトで作成する場 合は表の2行の前の行に階級値が50.5であるもの、8 行の後の行に階級値が74.5であるもの(それぞれ度数 は0)を事前に作っておかなければならない。またこの ような度数折れ線は、複数のデータを比較するときには 都合がよい。ヒストグラムは重なりがあると見にくい。
同一のグラフ表に2つの集団を描くときには、度数分布 表に絶対度数ではなく、相対度数まで計算してグラフを
書く。
問5.2 表計算ソフトに上記の数値を入力してみよ。また、グラフ作成機能を用いてヒストグラムと度数折れ線 を作成してみよ。上のほうの「資料とグラフ」に挙げたようなグラフになるはずである。
組み込み関数を組み合わせて、平均・分散・標準偏差を計算する。
1 表計算ソフトに上記の表を作成し、D列にそれぞれの「階級値×度数」を求める式を入力せよ。例えば D2のセルの値はB2のセルの値とC2のセルの値を掛け合わせた数値なので= B2 * C2と入力。
2 B11のセルに平均値を求める式をSUMを使った式で入力せよ。
3 E列にそれぞれの偏差を求める式を入力せよ。例えばE2のセルの値はB2のセルの値からB11のセル の値を引いた数値なので= B2 - B11と入力される。
4 F列にそれぞれ偏差の2乗を入力した後、G9のセルに「偏差の2乗×度数」の合計を求める式を入力 せよ。また、F2のセルに= (B2 - $B$11)^2 * C2と入力しF3〜F8のセルに複写することもできる。
「$」については複写時に $ にはさまれている場合は複写しても引用する部分が変わらない。
5 B12のセルに分散、B13のセルに標準偏差をそれぞれ表示させてみよ。
全ての空欄を埋めた表は以下の通りになる。
A B C D E F G
1 階級 階級値 度数 階級値×度数 偏差 偏差の2乗 偏差の2乗×度数
2 52.0-55.0 53.5 1 53.5 -7.8 60.84 60.84
3 55.0-58.0 56.5 3 169.5 -4.8 23.04 69.12
4 58.0-61.0 59.5 1 59.5 -1.8 3.24 3.24
5 61.0-64.0 62.5 2 125.0 1.2 1.44 2.88
6 64.0-67.0 65.5 1 65.5 4.2 17.64 17.64
7 67.0-70.0 68.5 1 68.5 7.2 51.84 51.84
8 70.0-73.0 71.5 1 71.5 10.2 104.04 104.04
9 合計 10 613 309.6
10
11 平均値 61.3
12 分散 30.96
13 標準偏差 5.56
番号 データ(xi) 偏差値1(zi) 偏差値2(wi)
1 60.3 -0.176 -0.167
2 57.9 -0.646 -0.614
3 65.4 0.823 0.781
4 56.1 -0.999 -0.948
5 53.6 -1.489 -1.413
6 62.7 0.293 0.279
7 70.0 1.724 1.636
8 55.8 -1.058 -1.004
9 67.1 1.156 1.097
10 63.1 0.372 0.353
もし基本統計量という分析ツールのアドインをもちい、データに対して「統計情報」を選択するとより詳し い統計量が計算される。ここで偏差値とは、もとデータxiから
偏差1:zi= xi−X
s 、(分散で割る),偏差2:wi = xi−X
u (不偏分散で割る)
平均を原点にし、分散(n法)あるいは不偏分散(n−1法)で割り、基準化する。この2つを計算したものにつ いて、大小関係、あるいは不変となるものを比較すると次のような結果となる。
データ(xi) 偏差値1(zi) 偏差値2(wi)
平均X 61.20 0.00 0.00
標準誤差 s
√n 1.70 0.33 0.32
中央値median(メジアン)Me 61.50 0.06 0.06
最頻値mode(モード)Mo #N/A(不可) #N/A(不可) #N/A(不可) 標準偏差(√
不偏分散) stdevSD=√
u 5.38 1.05 1.00
分散varp(不偏分散)s2 28.93 1.11 1.00
尖度=∑(xi−X)4
u4 −3 -1.07 -1.07 -1.07
歪度=∑ (xi−X)3
u3 0.18 0.18 0.18
範囲range =max -min 16.40 3.21 3.05
最小min 53.60 -1.49 -1.41
最大max 70.00 1.74 1.64
合計sum 612.00 0.00 0.00
標本数count 10.00 10.00 10.00
数値結果の桁数が長いときには、「セルの書式形式ー表示形式「数値」ー小数点以下の桁数」で2桁とか、3桁 にまとめれば見やすい。
相関係数の計算にはCORREL(配列1,配列2)を用いる。これは共分散COVAR(配列1,配列2)n法とそれ ぞれの分散VARP(配列1,配列2)n法から、CORREL= COVAR(x,y)
VARP(x)·VARP(y) と計算できる。分散の値は必 ず正の値、相関係数は−1から1までの値となる。相関係数は偏差値を取ってから求めても同じ値である。
問5.3 次の組データ(体重、身長)の測定値に対するそれぞれの平均、分散および共分散さらに相関係数を表 ソフトで計算し、相関係数 約0.76となることを確かめよ。
(体重,身長)のデータ:
(60.3, 161.2) (57.9, 154.3) (65.4, 162.8) (56.1, 160.4) (53.6, 155.7) (62.7, 163.5) (70.0, 172.5) (55.8, 166.4) (67.1, 173.2) (63.1, 164.0)