• 検索結果がありません。

出典:「富裕層ビジネスは

10

兆円の消費市場」第一生命経済研究所

Economic Trends

2007

年)。

バブル経済の崩壊後、平均所得 が年々低下

「失われた 20 年」

にもかかわらず、なぜ年収 2000

~ 2500 万、 2500 万超の人数が

年々増えているのか ?

3 種類の平均

AVERAGE 算術平均 MODE 最頻値

MEDIAN 中央値

3 種類の平均は、一致すると

はかぎらない

課題

「統計でみる市区町村のすがた」のホーム ページから「経済基盤」のファイルをダウン

ロードし、福岡県内の市町村の住民数、納税 義務者数と課税対象所得のデータを用意し ます。

1.

福岡県内の市町村の住民一人あたりの課 税対象所得を算出してみましょう。

2.

福岡県内の市町村の住民一人あたりの課

3.

福岡県内の市町村の納税義務者一人あ たりの課税対象所得について、

3

種類の 平均値を算出してみましょう。そして、そ の違いについて、

200

400

字程度で考 察してみましょう。

4.

中間層が減少し、二極化が進行しつつあ るというのは本当でしょうか。あなたの周 囲の環境について

800

字程度で考察して みて下さい。

相関と回帰

関係

「関係がある、関係がない」

性別と、化粧しているかは、関係がある

?

少年犯罪と、親の離婚は関係がある

?

髪の長さと、野球部に入っているかは関係が ある

?

女子高生の援助交際経験率と、高校の偏差 値は関係がある

?

この部屋にいる人の年間欠席数と、家から大 学までの距離とは関係がある

?

関係

「関係がある、関係がない」

性別と、化粧しているかは、関係がある

?

少年犯罪と、親の離婚は関係がある

?

髪の長さと、野球部に入っているかは関係が ある

?

女子高生の援助交際経験率と、高校の偏差 値は関係がある

?

この部屋にいる人の年間欠席数と、家から大

質的変数と、質的変数

量的変数と、質的変数

量的変数と、量的変数

相関

関係があること

→ 「相関」という

二つ以上の事物(変数)の、

一方が変われば他方もそ

れに連れて変わるという関

正の相関と負の相関

正の相関

2 つの変数の増減が比例してい

る場合 負の相関

2 つの変数の増減が反比例して

相関係数

+1 から -1 の間で表される

2 変数の変動が全く同じ(比例)

→ 1.0

2 変数の変動が全く逆(反比例)

→ -1.0

A と B の相関係数が 0.001 だった場合

A

B

の関係はプラス(

A

が増えると

B

も増え、

B

が増

えると

A

も増える)

しかし、増えるのはごくわずか

A と B の相関係数が -0.3 だった場合

A

B

の関係はマイナス(

A

が増えると

B

が減り、

B

増えると

A

が減る)

増減は、あまり大きくないが小さくもない

注意

相関関係と因果関係は違う

相関関係=関係がある(類似し ているだけ)

因果関係=原因と結果という関

係がある(方向がある)

Office2003 以前の場合

Office2007 以降の場合

課題 コンビニの 1 日の雑誌類の売り上 げと店全体の売り上げは、関係がある か。相関分析を行ってみなさい。

雑誌類の売り上げ 全体の売り上げ

A 10450 106700

B 22430 345000

C 5980 298000

D 13400 234560

E 44500 345605

F 89430 193342

G 6700 220050

課題 県内政令都市の各区の火災発生 件数と交通事故発生件数は関係がある か。相関係数を行ってみなさい。

市 区 町 村 火 災 発 生 件 数 交 通 事 故 発 生 件 数

  門 司 区       3 9 9 0 4

  若 松 区       1 9 5 8 3

  戸 畑 区       2 5 5 5 3

  小 倉 北 区     6 0 2 , 6 7 5

  小 倉 南 区     3 9 1 , 7 8 3

  八 幡 東 区     2 4 6 5 6

  八 幡 西 区     6 2 2 , 8 1 7

  東 区         5 8 2 7 0 7

  博 多 区       6 6 3 9 9 8

  中 央 区       4 4 2 1 8 6

  南 区         6 0 2 3 5 8

  西 区         2 9 1 6 7 3

  城 南 区       2 5 1 3 3 7

行・列の移動

2 つ以上の変数の相関を分

析するには ?

相関を調べたい列が隣り合うように移

動してから、「入力範囲」で指定

移動したい列の名前をクリックして、列 を選択する

右クリック → 「切り取り」

挿入したい列の隣をクリック

C をク リックす

右クリック → 「切り取ったセルの挿入」

このとき、

「貼り付 け」を選 ばないよ

うに注意

「高齢化率」の列が、人口総数の列の隣

に移動する

課題

「統計でみる市区町村のすがた」データを用 意します。はじめに自分の予想(仮説)を立 てて、次に相関分析を行い、その結果をそ れぞれ文章でまとめなさい。

1. 65

歳以上人口の割合が増えると、どのよ うな影響を与えると思われるか

?

2.

福岡県内の市町村の外国人住民の割合 は、何と関係があるのか

?

3.

アンケートデータの入

力とクロス表

データの入力の仕方

アンケート用紙 集計:

1

人分(

1

ケース)を

1

行に入力する

集計の仕方

サンプルファイルの「クロス表用」

シートを利用する

性別ごとに、人数を集計するに は ?

「挿入」 → 「ピボットテーブル」

集計するデータが入っている表

の範囲を選択 → OK

レポートに追加するフィールドを

選択

「値フィールドの設定」

適切な種類を選ぶ

回帰分析

回帰分析

回帰分析とは regression

回帰分析の役割 予測

結果の分析

予測の例

新しいコンビニを開店した。この店は、

いくらぐらいの売り上げがあると予測さ

れるか。

結果分析の例

プロ野球昨年度の優勝チームは、

なぜ優勝したのか ?

12

球団のデータを集める

選手の平均年齢 選手の平均年棒 監督の年齢

コーチの人数

最大の

原因は?

原因と結果

Y

結果

をあらわす X 原因をあらわす

a,b,… 原因や結果には直接関係し

ない変数

散布図(プロット)による予測

2 つの変数間の関係を調べる

サンプル 身長( c m) 体重( kg)

A 1 8 8 6 1

B 1 6 0 5 0

C 1 7 3 5 5

D 1 5 9 4 9

E 1 8 7 6 2

プロットを作る(普通は原因を横軸、結果を縦 軸に引く)

A B

C

D

E F

プロットしてみると、原因(身長)と結果(体重)

との間の相関関係が高そうなことがわかった

原因(体重)をもとに結果(身長)を予測できな いだろうか?

0

直線を引く

A B

C

D

E F

直線に沿って予測

が可能と考えられ

88

あるクラスの人の自宅からの距離と 通学時間

学生 自宅からの距離

(Km)

通学時間(分)

A 0.1 1

B 0.7 10

C 5 15

D 30 40

E 30 45

F 1.1 15

G 0.5 9

H 10 30

I 40 65

J 20 40

K 20 35

課題 5

自宅からの距離が 15km の人は、

通学時間は何分かかると予想さ れるか ?

ヒント

まず散布図のグラフを作る。その

上に直線を引いてみる。

変数を、アルファベットを使って表す とき

結果 Y 原因 X

原因結果に関係のない変数

a,b,c,…

例 ある車の走行距離と使用するガ ソリン

走った距離(Km) 使ったガソリン(L)

20.5 3.5

13.9 2.4

47 5.5

69 10.7

30 4.7

作業 散布図

使ったガソリン(L)

0 1 2 3 4 5 6 7 8

0 10 20 30 40 50

使ったガソリン(L)

使ったガソリン(L)

0 1 2 3 4 5 6 7 8

0 10 20 30 40 50

使ったガソリン(L)

回帰直線

が、ゼロを

式で表すと

Y = a X +b

Y ガソリンの量 X 走った距離 a 回帰係数

b 定数 (X=0 の時の Y の値)

回帰

重回帰分析の注意

データの用意

質的な変数をデータにする場合 例:男女

ダミー化処理を行う 男性= 1 、女性= 0 例:「はい」「いいえ」

はい= 1 、いいえ= 0

回帰分析でわかること

(1) 予測

原因 X の値を入れた場合の、結

ドキュメント内 九州大学法学部「法情報学」 02 print (ページ 44-97)

関連したドキュメント