1
標準偏差と正規分布の関係
• 標準偏差って、何が「標準」なんでしょう?
• ある集団が正規分布に従うならば、データが平均値か ら標準偏差 (σ) だけ離れた範囲に入る確率が決まります
Q4. 正規分布で平均値 ±2σ と ±3σ の範囲は それぞれ何%となりますか?
この性質を利用して 例えば平均から 3σ も離れたら異常値だ と判断する
正規分布
この範囲に 68.2 6 %
ヒストグラム・基本統計量・正規分布
2
正規分布とは?
•データというのは、意図せずに 色々な原因で上下に変動します
•その原因がデータに与える効果 がランダムな場合、それは誤差 で有り、正規分布に従います
データ=真値 + 誤差 と考えて真値の範囲を推定したり データ=真値 + 原因 1 効果 + 原因 2 効果 + ・・・ + 誤差 と考えて、原因(要因)の効果が誤差に比べてどうかを 検討するというのが統計の最も基本的な考え方です。 正規分布を概念的に説明します
ヒストグラム・基本統計量・正規分布
正規分布・標準偏差の活用1
正規分布の最も基本的な活用法
である「規準化 ( =標準化 ) 」と
正規分布しないデータでも適切
な「変数変換」を行うことで正
規分布に近づけるテクニックを
紹介します。
データ規準化と変数変換
4
もしテストで 30 点を取ってしまっ
たら・・・
データ規準化・変数変換
30 点
そんなあなたは凹みますか?
100 50
0
100 50
0
50 100 0
国語
数学
英語
国語、数学、英語の3教科と も、なんと 30 点を取ってし まいました。
ちなみに全校生徒の得点をヒ ストグラムにしたらこのよう な分布だったとします。
5
偏差値って有りましたよ
ね・・・
データ規準化・変数変換
• 偏差値って何ですか?
• 何のために有るのですか?
あるテストでの A さんの偏差値の求め 方
A さんの点数 - 全員の平均
点全員の点数の標準偏差
× 10 + 50
6
標準偏差( σ )を目盛りにす
る
データ規準化・変数変換
普通 大き 小さ い
い 異常に大きい
異常に小さい
規準化データ( Z スコア) = (その値 - 平均値)
/ 標準偏差
7
3つのテスト結果を比べよう
データ規準化・変数変換
演習 2 のシートを開いて
Q1. 国語、数学、英語において 30 点という得点が平均から 何 σ 分外れているか、
それぞれ求めて下さい
30 点
100 50
0
100 50
0
50 100 0
国語平均点: 50 点 標準偏差: 10 点
数学平均点: 25 点 標準偏差: 8 点
英語平均点: 50 点 標準偏差: 8 点
これがデータの規準
Q2.Q1化 の計算結果を正規分布
上にプロットすることで、 それぞれのテストの結果を 評価して下さい
国語、数学、英語それぞ の 30 点の位置づけは?れ