平均値の異なる複数の分布が 混在しているときに得られる分布 離れ小島型と呼ばれる.
異なった性質をもつ分布が混在
しているときに得られる分布
48
6.1.2 ヒストグラムの基本
〜計量値データのヒストグラム〜
表
6.1
は,大学の講義科目である『確率統 計2』を受験したn=200
名の学生の成績を示 したものである.この表を眺めていても学生の成績がどのよ うな分布に従っているのかを理解することは できない.
しかし,図
6.1
のヒストグラムを作成すること で,どのような分布に従っているかを容易に 理解できる.図6.1 確率統計2の定期試験における成績のヒストグラム 0
5 10 15 20 25 30 35 40 45 50
42.5 46.5 50.5 54.5 58.5 62.5 66.5 70.5 74.5 78.5 82.5 86.5 90.5 94.5 98.5 定期試験の成績
度 数
n=200 x-=70.1 s=9.428
No. 2 3 4 5
1 75 72 78 60 83
2 70 65 61 81 63
3 63 69 75 68 69
4 76 59 89 83 63
5 67 71 69 79 72
6 68 75 77 88 79
7 74 67 74 61 45
8 72 73 79 78 59
9 64 78 70 60 59
10 71 62 60 75 80
11 68 70 67 73 56
12 65 71 73 80 59
13 61 53 76 96 69
14 55 60 94 54 85
15 57 78 54 78 71
16 71 62 69 69 73
17 77 69 74 89 71
18 74 56 68 64 77
19 70 73 92 79 57
20 77 69 64 66 65
21 76 71 70 73 60
22 74 72 60 74 62
23 63 62 61 73 63
24 50 55 68 70 65
25 73 71 92 74 64
26 78 56 48 83 70
27 75 66 67 68 78
28 67 65 66 91 67
29 69 52 57 70 71
30 84 81 84 67 80
31 86 69 62 63 71
32 73 60 78 71 71
33 75 57 68 80 62
34 71 65 66 58 70
35 96 72 89 66 60
36 70 60 71 61 79
37 63 86 70 81 69
38 81 71 77 56 76
39 78 70 73 57 76
40 67 71 57 88 60
表6.1 確率統計2の定期試験における成績
49
図5.5(a) コイン20回投げて表の出た回数のヒストグラム 0
5 10 15 20 25
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 表の出た回数
度 数
n=100 x-=10.1 s=2.221
図
6.5(a)
は,コイン投げを20
回 行ったときに表の出た回数をN=100
回の実験で調べたものである.
表が出る回数は,平均回数
10.1
回,標準偏差2.221
の分布 に従っていることがわかる.図
6.5(
b)
は,ある地方都市に おける1
日の死者の出た交通 事故件数を365
日間に亘って 調べたものである.事故件数は,平均回数
3.17
件,標準偏差
1.807
の分布に従っていることがわかる.
図5.5(b) ある都市における1日の交通事故件数のヒストグラム 0
10 20 30 40 50 60 70 80 90
0 1 2 3 4 5 6 7 8 9 10 11 12
交通事故件数 度
数
n=100 x-=3.17 s=1.807
6.1.3 ヒストグラムの基本
〜計数値データのヒストグラム〜
50
6.2.1 Excelによる度数表作成手順(1)
Excelの操作手順
得られたデータにもとづいて基本 指標を作成する.
1)「測定単位」を手入力する.
2)「サンプル数」をcount(B3:F42) で計算する.
3)「最大値」をmax(B3:F42)で計算 する
4)「最小値」をmin(B3:F42)で計算 する.
5)「仮の区間数」をsqrt(I7)で計算 する.
6)「区間数」をround(I10,0)で計算 する.
7)「仮の区間幅」を(I8-I9)/I11で 計算する.
8)「区間幅」を「仮の区間幅」を測 定単位の整数倍に丸めることで手 入力する.
51
6.2.2 Excelによる度数表作成手順(2)
Excelの操作手順
9)左図に習って,No. 区間下限,
区間上限,中心値,度数(f),X,
X*f,X^2*fの欄を作成する.
10)No.2の区間下限における値を 最小値-測定単位/2
によって計算する.
例題では,
=I9-I6/2 としている.
11)No.3の「区間下限」を No.3の区間下限
=No.2の区間下限+区間幅
の公式によって計算する(省略).
12)No.3の「区間下限」のセルをクリック し,右下の「+」十字をつまんで,
最大値を含むセルまで移動する
(省略).
52
6.2.3 Excelによる度数表作成手順(3)
Excelの操作手順
13)No.2の「区間上限」を 区間下限+区間幅
=I21+I$13
によって計算する.
14)No.2の区間の中心値を
(区間下限+区間上限)/2
=(I21++J21)/2 によって計算する.
15)No.2の「区間上限」と「中心値」の セルをクリックし,右下の「+」十字 をつまんで,最大値を含むセルまで 移動する(省略).
53
6.2.4 Excelによる度数表作成手順(4)
Excelの操作手順
16)度数(f)の欄をNo.1からNo.13まで 選択する.
17)ツールバーの「fx」(関数の挿入)
を選択する.
18)「関数の分類」のテキストボックス内 から「統計」を選択する.
19)「統計」の関数名から「Frequency」を 選択する.
20)「関数の引数」内の「データ配列」の テキストボックス内をクリックし,
データの範囲を選択する.又は,
B2:F42と直接入力する.
21)「関数の引数」内の「区間配列」の テキストボックス内をクリックし,
区間上限の範囲を選択する.又は,
J20:J32と直接入力する.
22)「Shift」キー,「Ctrl」キーを同時 に押さえた状態で「Enter」キーを操作 する.
54
7章 散布図の活用
ヒストグラムは1つの変数に関する経験分布から,その母集団分布 を推測する道具であった.散布図とは,2つの変数に関する母集団 分布を推測するための道具である.
適用局面2
回転軸のベアリング磨耗を調べるため,油中の鉄粉について自社内設備である X線で調べた特性(x)と外注による化学分析による特性(y)の関係を調べる。これに よって,安価な自社内設備の活用可能性を探る。
適用局面1
父親の身長(x)と息子の身長(y)の関係を調べることで,父親の身長がx=x0の 息子の身長y0を予測する。
適用局面3
合成繊維の加熱温度(x)を変えたときの製品の収縮率(y)の関係を把握し,最適 な過熱温度を設定する。
55
7.1 散布図の基本
着眼点
(1)相関関係の有無
(2)異常点の有無
(3)層別の有無
y
x y
(a)強い負相関 (b)負の相関 x
x y
x
y
(c)無相関 (d)非直線関係
x x
y y
(e)異常値 (f)層別
56
7.2.1 散布図の事例(1)
〜父親の身長と息子の身長〜
父親の身長 息子の身長
( x) (y)
1 1 7 5 1 7 6 2 1 6 8 1 6 2 3 1 6 5 1 6 6 4 1 7 0 1 7 7 5 1 7 9 1 8 8 6 1 6 2 1 7 0 7 1 6 4 1 5 3 8 1 7 3 1 7 4 9 1 7 8 1 8 7 1 0 1 6 0 15 3 1 1 1 5 8 15 3 1 2 1 6 3 15 4 1 3 1 5 9 14 8 1 4 1 7 3 17 0 1 5 1 7 0 16 7 1 6 1 6 9 15 9 1 7 1 7 5 17 4 1 8 1 6 9 16 8 1 9 1 7 3 17 5 2 0 1 8 0 18 2 No.
表7.1 データ表
例題
7.1 ランダムに抽出された父親とその息子の身長データを表 1 に,そ の散布図を下図に示す。 図より,(x,y)には正の相関関係が見られる。
図7.1 父親と息子の身長 140
145 150 155 160 165 170 175 180 185 190
155 160 165 170 175 180 185
父親の身長 息
子 の 身 長
n=20
57
7.2.2 散布図の事例(2)
〜X線による化学分析の代用〜
X線分析 化学分析
( x) ( y)
1 2 5 2 3
2 2 0 1 5
3 2 6 2 5
4 1 9 1 1
5 2 1 1 6
6 2 7 2 9
7 2 3 2 0
8 2 9 3 1
9 2 4 2 1
1 0 2 2 1 6
1 1 1 8 1 5
1 2 2 6 2 6
1 3 2 4 2 1
1 4 2 7 2 7
1 5 2 5 2 0
1 6 2 4 2 4
1 7 2 3 1 6
1 8 1 9 1 3
1 9 2 0 2 2
2 0 1 8 1 0
No.
表7 .2 データ表
例題