• 検索結果がありません。

R によるカイ 2 乗検定

ドキュメント内 i (ページ 115-123)

第 8 章 2項分布 63

14.6 R によるカイ 2 乗検定

110 第14章 独立性の検定

> fisher.test(x)

Fisher’s Exact Test for Count Data data: x

p-value = 1.162e-14

alternative hypothesis: two.sided

> x <- matrix(c(315,108,101,32), ncol=2, byrow=T)

> x

[,1] [,2]

[1,] 315 108 [2,] 101 32

> chisq.test(x)

Pearson’s Chi-squared test with Yates’ continuity correction data: x

X-squared = 0.0513, df = 1, p-value = 0.8208

> x <- matrix(c(56,6759,272,11396), ncol=2, byrow=T)

> x

[,1] [,2]

[1,] 56 6759 [2,] 272 11396

> chisq.test(x)

Pearson’s Chi-squared test with Yates’ continuity correction data: x

X-squared = 55.3714, df = 1, p-value = 9.978e-14

> x <- matrix(c(10,3,2,15), ncol=2, byrow=T)

> x

[,1] [,2]

[1,] 10 3

[2,] 2 15

> chisq.test(x)

14.6. R によるカイ 2乗検定 111

Pearson’s Chi-squared test with Yates’ continuity correction data: x

X-squared = 10.4581, df = 1, p-value = 0.001221

> fisher.test(x)

Fisher’s Exact Test for Count Data data: x

p-value = 0.0005367

alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval:

2.753438 300.682787 sample estimates:

odds ratio 21.30533

113

15 章 相関

15.1 散布図と相関係数

摂取塩分量と血圧の関係,年平均気温と年間降水量,日射量とコムギの収量など2つ の変数X, Y 間の関係を調べる問題は数多い.2変数の間の関係を調べようとするとき,

始めに散布図と呼ばれるグラフを描いて,変数X, Y 間関係の質的な性質を視覚的に調 べ,次に関係の強さを数値で表すために,相関係数を計算するのがふつうである.

15.1.1

小学校5年の児童 12名に国語X と算数Y の学力検査を実施したところ,下の表の ような結果が得られた(架空のデータ).散布図を描き,また相関係数を求めて,X, Y の関係について論ぜよ.

児童名 国語(X 算数(Y

A 50 22

B 54 25

C 56 34

D 59 28

E 60 26

F 62 30

G 61 32

H 65 30

I 67 28

J 71 34

K 71 36

L 74 40

(解) 上の表を,Excelのシートの A1:C13 に入力したとする.

散布図の描き方.

1. メニュー【挿入】【散布図】を実行し,5 種類の図の中から左上の図を選択 する.

2. メニュー【データの選択】を実行し,【グラフデータの範囲】ではB2:C13 を 選ぶ.

114 第15章 相関

相関係数の求め方.

1. メニュー【データ】【データ分析】を実行し,【分析ツール】から「相関」を 選択する.

2. メニュー【入力範囲】では B2:C13 を選ぶ.

散布図は次のようになる.このグラフより,国語の得点が高い児童は算数の得点も高 くなる「傾向」が見て取れる.

また相関係数は r= 0.784 となるので,国語と算数の得点には「強い相関がある」と判 断できる.

15.1.2 正の相関と負の相関

一方の変数が大きくなれば他方の変数も大きくなる(小さくなれば小さくなる)とき 正の相関があると言い,逆に,一方の変数が大きくなれば他方の変数も小さくなる(小 さくなれば大きくなる)とき負の相関があると言う.

15.1. 散布図と相関係数 115 正の相関関係

Xの値が増加するにつれてYの値も増加する

負の相関関係

Xの値が増加するにつれてYの値は減少する

曲線相関

XとYに直線的な関係はないが,一定の関係がある

無相関

XとYの間には何の関係も認められない

15.1.3 相関係数

相関係数(r で表す)は相関の強さを表す.

• −15r51

正の相関がある場合 r >0であり,逆に,負の相関がある場合 r <0 である.

(現実のデータではありえないことであるが)もし r= 1 であるならば,散布図 においてデータを表す点は傾きが正の直線上にのり,逆に,もし r = 1 である ならば,散布図においてデータを表す点は傾きが負の直線上にのる.

普通,相関の強さを,相関係数の値の大小によって,次のように判断している(これ は,あくまでも慣習である).

負の相関 相関の強さの判定 正の相関

1∼ −0.7 強い相関がある +1+0.7

0.7∼ −0.4 中程度の相関がある +0.7+0.4

0.4∼ −0.2 弱い相関がある +0.4+0.2

0.20 ほとんど相関がない +0.20

15.1.4 レポート問題

*下の各問題で,描いた散布図の傍に,求めた相関係数を記し,それを印刷して提出せ よ.ただし印刷枚数は各問題で1 枚にせよ.

116 第15章 相関 問題1 次の表は鹿児島県内の幾つかの地点の標高 X と年平均気温 Y (1981 2010 年間の平均気温)を表している.1散布図を描き,また相関係数を求めて,X, Y の関係 について論ぜよ.

地点 標高 年平均気温 鹿児島 3.9 18.6

喜入 4 18.2 指宿 5 18.1 枕崎 29.5 18.1 加世田 9 17.7 東市来 40 16.9 川内 5 17.0 さつま柏原 59 16.5 阿久根 40.1 17.2 大口 175 15.3 溝辺 272 15.9 牧之原 387 15.2 輝北 360 15.5 志布志 70 16.8 鹿屋 80 17.3 肝付前田 31 17.3 内之浦 8 18.1 田代 182 16.2

問題2 つぎの表は,プロ野球の試合50について,勝ったチームの得点X,負けたチー ムのエラー数 Y,勝ったチームのヒット数Z を調べたものである.X, Y,Y, Z,Z, X のそれぞれの組合せに対して,散布図を描き,また相関係数を求めて,X, Y, Z の関係 について論ぜよ.

(注意)Excel で散布図を描くときは,X, Y, Z のうち 2つずつ選んで,3回グラフを描

く必要がある.しかし,相関係数を求めるときは,X, Y, Z を一度に選んで,計算する ことができる.

1気象庁http://www.jma.go.jp/jma/menu/report.htmlより「過去の気象データ検索」のページから 得たデータ

ドキュメント内 i (ページ 115-123)