出典:「富裕層ビジネスは
10
兆円の消費市場」第一生命経済研究所Economic Trends
(2007
年)。バブル経済の崩壊後、平均所得 が年々低下
「失われた 20 年」
にもかかわらず、なぜ年収 2000
~ 2500 万、 2500 万超の人数が
年々増えているのか ?
3 種類の平均
AVERAGE 算術平均 MODE 最頻値
MEDIAN 中央値
3 種類の平均は、一致すると
はかぎらない
課題
「統計でみる市区町村のすがた」のホーム ページから「経済基盤」のファイルをダウン
ロードし、福岡県内の市町村の住民数、納税 義務者数と課税対象所得のデータを用意し ます。
1.
福岡県内の市町村の住民一人あたりの課 税対象所得を算出してみましょう。2.
福岡県内の市町村の住民一人あたりの課3.
福岡県内の市町村の納税義務者一人あ たりの課税対象所得について、3
種類の 平均値を算出してみましょう。そして、そ の違いについて、200
~400
字程度で考 察してみましょう。4.
中間層が減少し、二極化が進行しつつあ るというのは本当でしょうか。あなたの周 囲の環境について800
字程度で考察して みて下さい。相関と回帰
関係
「関係がある、関係がない」
性別と、化粧しているかは、関係がある
?
少年犯罪と、親の離婚は関係がある?
髪の長さと、野球部に入っているかは関係が ある
?
女子高生の援助交際経験率と、高校の偏差 値は関係がある
?
この部屋にいる人の年間欠席数と、家から大 学までの距離とは関係がある
?
関係
「関係がある、関係がない」
性別と、化粧しているかは、関係がある
?
少年犯罪と、親の離婚は関係がある?
髪の長さと、野球部に入っているかは関係が ある
?
女子高生の援助交際経験率と、高校の偏差 値は関係がある
?
この部屋にいる人の年間欠席数と、家から大
質的変数と、質的変数
量的変数と、質的変数
量的変数と、量的変数
相関
関係があること
→ 「相関」という
二つ以上の事物(変数)の、
一方が変われば他方もそ
れに連れて変わるという関
正の相関と負の相関
正の相関
2 つの変数の増減が比例してい
る場合 負の相関
2 つの変数の増減が反比例して
相関係数
+1 から -1 の間で表される
2 変数の変動が全く同じ(比例)
→ 1.0
2 変数の変動が全く逆(反比例)
→ -1.0
A と B の相関係数が 0.001 だった場合
A
とB
の関係はプラス(A
が増えるとB
も増え、B
が増えると
A
も増える)しかし、増えるのはごくわずか
A と B の相関係数が -0.3 だった場合
A
とB
の関係はマイナス(A
が増えるとB
が減り、B
が 増えるとA
が減る)増減は、あまり大きくないが小さくもない
注意
相関関係と因果関係は違う
相関関係=関係がある(類似し ているだけ)
因果関係=原因と結果という関
係がある(方向がある)
Office2003 以前の場合
Office2007 以降の場合
課題 コンビニの 1 日の雑誌類の売り上 げと店全体の売り上げは、関係がある か。相関分析を行ってみなさい。
店 雑誌類の売り上げ 全体の売り上げ
A 10450 106700
B 22430 345000
C 5980 298000
D 13400 234560
E 44500 345605
F 89430 193342
G 6700 220050
課題 県内政令都市の各区の火災発生 件数と交通事故発生件数は関係がある か。相関係数を行ってみなさい。
市 区 町 村 火 災 発 生 件 数 交 通 事 故 発 生 件 数
門 司 区 3 9 9 0 4
若 松 区 1 9 5 8 3
戸 畑 区 2 5 5 5 3
小 倉 北 区 6 0 2 , 6 7 5
小 倉 南 区 3 9 1 , 7 8 3
八 幡 東 区 2 4 6 5 6
八 幡 西 区 6 2 2 , 8 1 7
東 区 5 8 2 7 0 7
博 多 区 6 6 3 9 9 8
中 央 区 4 4 2 1 8 6
南 区 6 0 2 3 5 8
西 区 2 9 1 6 7 3
城 南 区 2 5 1 3 3 7
行・列の移動
2 つ以上の変数の相関を分
析するには ?
相関を調べたい列が隣り合うように移
動してから、「入力範囲」で指定
移動したい列の名前をクリックして、列 を選択する
右クリック → 「切り取り」
挿入したい列の隣をクリック
C をク リックす
る
右クリック → 「切り取ったセルの挿入」
このとき、
「貼り付 け」を選 ばないよ
うに注意
「高齢化率」の列が、人口総数の列の隣
に移動する
課題
「統計でみる市区町村のすがた」データを用 意します。はじめに自分の予想(仮説)を立 てて、次に相関分析を行い、その結果をそ れぞれ文章でまとめなさい。
1. 65
歳以上人口の割合が増えると、どのよ うな影響を与えると思われるか?
2.
福岡県内の市町村の外国人住民の割合 は、何と関係があるのか?
3.
アンケートデータの入
力とクロス表
データの入力の仕方
アンケート用紙 集計:
1
人分(1
ケース)を1
行に入力する集計の仕方
サンプルファイルの「クロス表用」
シートを利用する
性別ごとに、人数を集計するに は ?
「挿入」 → 「ピボットテーブル」
集計するデータが入っている表
の範囲を選択 → OK
レポートに追加するフィールドを
選択
「値フィールドの設定」
適切な種類を選ぶ
回帰分析
回帰分析
回帰分析とは regression
回帰分析の役割 予測
結果の分析
予測の例
新しいコンビニを開店した。この店は、
いくらぐらいの売り上げがあると予測さ
れるか。
結果分析の例
プロ野球昨年度の優勝チームは、
なぜ優勝したのか ?
12
球団のデータを集める選手の平均年齢 選手の平均年棒 監督の年齢
コーチの人数
最大の
原因は?
原因と結果
Y
結果をあらわす X 原因をあらわす
a,b,… 原因や結果には直接関係し
ない変数
散布図(プロット)による予測
2 つの変数間の関係を調べる
サンプル 身長( c m) 体重( kg)
A 1 8 8 6 1
B 1 6 0 5 0
C 1 7 3 5 5
D 1 5 9 4 9
E 1 8 7 6 2
プロットを作る(普通は原因を横軸、結果を縦 軸に引く)
体 重
A B
C
D
E F
プロットしてみると、原因(身長)と結果(体重)
との間の相関関係が高そうなことがわかった
↓
原因(体重)をもとに結果(身長)を予測できな いだろうか?
0
直線を引く
体 重
A B
C
D
E F
直線に沿って予測が可能と考えられ る
88
あるクラスの人の自宅からの距離と 通学時間
学生 自宅からの距離
(Km)
通学時間(分)A 0.1 1
B 0.7 10
C 5 15
D 30 40
E 30 45
F 1.1 15
G 0.5 9
H 10 30
I 40 65
J 20 40
K 20 35
課題 5
自宅からの距離が 15km の人は、
通学時間は何分かかると予想さ れるか ?
ヒント
まず散布図のグラフを作る。その
上に直線を引いてみる。
変数を、アルファベットを使って表す とき
結果 Y 原因 X
原因結果に関係のない変数
a,b,c,…
例 ある車の走行距離と使用するガ ソリン
走った距離(Km) 使ったガソリン(L)
20.5 3.5
13.9 2.4
47 5.5
69 10.7
30 4.7
作業 散布図
使ったガソリン(L)
0 1 2 3 4 5 6 7 8
0 10 20 30 40 50
使ったガソリン(L)
使ったガソリン(L)
0 1 2 3 4 5 6 7 8
0 10 20 30 40 50
使ったガソリン(L)