第 8 章 2項分布 63
14.6 R によるカイ 2 乗検定
110 第14章 独立性の検定
> fisher.test(x)
Fisher’s Exact Test for Count Data data: x
p-value = 1.162e-14
alternative hypothesis: two.sided
> x <- matrix(c(315,108,101,32), ncol=2, byrow=T)
> x
[,1] [,2]
[1,] 315 108 [2,] 101 32
> chisq.test(x)
Pearson’s Chi-squared test with Yates’ continuity correction data: x
X-squared = 0.0513, df = 1, p-value = 0.8208
> x <- matrix(c(56,6759,272,11396), ncol=2, byrow=T)
> x
[,1] [,2]
[1,] 56 6759 [2,] 272 11396
> chisq.test(x)
Pearson’s Chi-squared test with Yates’ continuity correction data: x
X-squared = 55.3714, df = 1, p-value = 9.978e-14
> x <- matrix(c(10,3,2,15), ncol=2, byrow=T)
> x
[,1] [,2]
[1,] 10 3
[2,] 2 15
> chisq.test(x)
14.6. R によるカイ 2乗検定 111
Pearson’s Chi-squared test with Yates’ continuity correction data: x
X-squared = 10.4581, df = 1, p-value = 0.001221
> fisher.test(x)
Fisher’s Exact Test for Count Data data: x
p-value = 0.0005367
alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval:
2.753438 300.682787 sample estimates:
odds ratio 21.30533
113
第 15 章 相関
15.1 散布図と相関係数
摂取塩分量と血圧の関係,年平均気温と年間降水量,日射量とコムギの収量など2つ の変数X, Y 間の関係を調べる問題は数多い.2変数の間の関係を調べようとするとき,
始めに散布図と呼ばれるグラフを描いて,変数X, Y 間関係の質的な性質を視覚的に調 べ,次に関係の強さを数値で表すために,相関係数を計算するのがふつうである.
15.1.1 例
小学校5年の児童 12名に国語X と算数Y の学力検査を実施したところ,下の表の ような結果が得られた(架空のデータ).散布図を描き,また相関係数を求めて,X, Y の関係について論ぜよ.
児童名 国語(X) 算数(Y)
A 50 22
B 54 25
C 56 34
D 59 28
E 60 26
F 62 30
G 61 32
H 65 30
I 67 28
J 71 34
K 71 36
L 74 40
(解) 上の表を,Excelのシートの A1:C13 に入力したとする.
• 散布図の描き方.
1. メニュー【挿入】【散布図】を実行し,5 種類の図の中から左上の図を選択 する.
2. メニュー【データの選択】を実行し,【グラフデータの範囲】ではB2:C13 を 選ぶ.
114 第15章 相関
• 相関係数の求め方.
1. メニュー【データ】【データ分析】を実行し,【分析ツール】から「相関」を 選択する.
2. メニュー【入力範囲】では B2:C13 を選ぶ.
散布図は次のようになる.このグラフより,国語の得点が高い児童は算数の得点も高 くなる「傾向」が見て取れる.
また相関係数は r= 0.784 となるので,国語と算数の得点には「強い相関がある」と判 断できる.
15.1.2 正の相関と負の相関
一方の変数が大きくなれば他方の変数も大きくなる(小さくなれば小さくなる)とき 正の相関があると言い,逆に,一方の変数が大きくなれば他方の変数も小さくなる(小 さくなれば大きくなる)とき負の相関があると言う.
15.1. 散布図と相関係数 115 正の相関関係
Xの値が増加するにつれてYの値も増加する
負の相関関係
Xの値が増加するにつれてYの値は減少する
曲線相関
XとYに直線的な関係はないが,一定の関係がある
無相関
XとYの間には何の関係も認められない
15.1.3 相関係数
相関係数(r で表す)は相関の強さを表す.
• −15r51
• 正の相関がある場合 r >0であり,逆に,負の相関がある場合 r <0 である.
• (現実のデータではありえないことであるが)もし r= 1 であるならば,散布図 においてデータを表す点は傾きが正の直線上にのり,逆に,もし r = −1 である ならば,散布図においてデータを表す点は傾きが負の直線上にのる.
普通,相関の強さを,相関係数の値の大小によって,次のように判断している(これ は,あくまでも慣習である).
負の相関 相関の強さの判定 正の相関
−1∼ −0.7 強い相関がある +1∼+0.7
−0.7∼ −0.4 中程度の相関がある +0.7∼+0.4
−0.4∼ −0.2 弱い相関がある +0.4∼+0.2
−0.2∼0 ほとんど相関がない +0.2∼0
15.1.4 レポート問題
*下の各問題で,描いた散布図の傍に,求めた相関係数を記し,それを印刷して提出せ よ.ただし印刷枚数は各問題で1 枚にせよ.
116 第15章 相関 問題1 次の表は鹿児島県内の幾つかの地点の標高 X と年平均気温 Y (1981 ∼ 2010 年間の平均気温)を表している.1散布図を描き,また相関係数を求めて,X, Y の関係 について論ぜよ.
地点 標高 年平均気温 鹿児島 3.9 18.6
喜入 4 18.2 指宿 5 18.1 枕崎 29.5 18.1 加世田 9 17.7 東市来 40 16.9 川内 5 17.0 さつま柏原 59 16.5 阿久根 40.1 17.2 大口 175 15.3 溝辺 272 15.9 牧之原 387 15.2 輝北 360 15.5 志布志 70 16.8 鹿屋 80 17.3 肝付前田 31 17.3 内之浦 8 18.1 田代 182 16.2
問題2 つぎの表は,プロ野球の試合50について,勝ったチームの得点X,負けたチー ムのエラー数 Y,勝ったチームのヒット数Z を調べたものである.X, Y,Y, Z,Z, X のそれぞれの組合せに対して,散布図を描き,また相関係数を求めて,X, Y, Z の関係 について論ぜよ.
(注意)Excel で散布図を描くときは,X, Y, Z のうち 2つずつ選んで,3回グラフを描
く必要がある.しかし,相関係数を求めるときは,X, Y, Z を一度に選んで,計算する ことができる.
1気象庁http://www.jma.go.jp/jma/menu/report.htmlより「過去の気象データ検索」のページから 得たデータ