• 検索結果がありません。

章 標本分布

N/A
N/A
Protected

Academic year: 2021

シェア "章 標本分布"

Copied!
67
0
0

読み込み中.... (全文を見る)

全文

(1)

数理統計

重川 一郎

平成

(2)
(3)

目 次

第 章 統計データ

データの整理

度数分布とヒストグラム

代表値

散らばりの尺度

章 標本分布

母集団と標本

標本分布

ガンマ分布・ベータ分布

カイ乗分布

分布, 分布

章 推定

点推定

フィッシャー情報量

クラメルラオの不等式

有効推定量

点推定

最尤法

区間推定

正規母集団の母平均の推定(分散が既知の場合)

正規母集団の母分散の推定

母平均の推定(分散が未知の場合)

2標本問題

母平均の差の推定

母分散の比の推定

章 仮説検定

検定の考え方

項分布の検定

検定の手順

誤りの種類

(4)

正規母集団の検定

平均の検定

分散の検定

等平均の検定

等分散の検定

¾ 検定

適合度検定

独立性の検定

章 統計解析

回帰分析

線型回帰分析

推定量の分布

分散の推定

分散分析

元間配置

推定量

(5)

第 章 統計データ

½º データの整理

統計学: 現象の法則性を見出す

記述統計学: ある集団の特徴を記述するために,全体の観測を行い,得られたデー タを整理・要約し,そこから現象の法則性を見出す

統計的推測: 一部を観測し,全体の法則性を見出す 度数分布とヒストグラム

例. 試験の成績

試験得点の度数分布表

階級 階級値 度数 相対度数 累積度数 累積相対度数

合計

代表値

観測値

(6)

試験得点のヒストグラムと累積度数グラフ 平均

幾何平均 地価の上昇、金利など

調和平均

メディアン 中央値 とするとき

が奇数 のとき

が偶数 のとき モード最頻値 一番出現回数の多いもの

ミッド・レンジ 最大と最小の中点

調和平均の例

自動車で行きは, 帰りは であったとき,平均時速 は?

距離を とすると

(7)

モード メディアン

平均

ミッド・レンジ 代表値

散らばりの尺度

観測値 レンジ 最大と最小

平均偏差

分散

標準偏差

分散の平方根 標準化

は 平均,分散 になる 偏差値

平均が 分散が, 標準偏差が

問題 試験をして次のような結果を得た.それぞれについて,平均,分散,標準偏差,偏 差値を計算せよ.

(8)

変曲点

偏差値 のグラフ

得点 人数

得点 人数

解答

平均 分散

標準偏差

偏差値 点の人

点の人

点の人

(9)

平均

分散

標準偏差

偏差値 点の人

点の人

(10)
(11)

章 標本分布

統計的推測 : 母集団から一部を選び出し,それを分析して母集団の 推測を行う.

½º 母集団と標本

母集団分布 母平均 母分散

標本

母集団を推測

統計的推測 母集団!"!#" 分析の対象となる集団全体 母集団分布: 母集団の分布

標本! 母集団から選び出された要素

母数! 母集団分布を決定するパラメーター

母集団の分布で最も重要なものは正規分布である.このとき,正規母集団という.正規分 布は平均,分散 で特徴付けられる. とかく.他に,ポアソン分布,二項分布,

指数分布などがよく使われる.

数学的に次のように定式化する.

(12)

母集団分布 密度関数 離散のときは確率関数 母数 母平均 母分散 など

標本 分布 を持つ独立な確率変数 標本平均 !

標本分散 !$

不偏標本分散

#%& ! $

標本平均,標本分散など,標本の関数で,未知の母数を含まないものを統計量 という.

定理 分布 の平均が ,分散が のとき の平均は,分散は である.

証明

'(

' ('

(' (

'(

定理 分布 の平均が ,分散が のとき不偏分散 の平均は である.

証明

'

(

'

('

('

(

である.また

'

('

(

'

(' ('

(

'

(

'

(

(13)

両者から

'

(

'

(

統計的推測では で平均,分散の推定を行う.母数の推定を行う統計量を推定量

" という.分散の推定に ではなく を用いるのは の平均が母分散と一致 するからである.このように推定量の平均が母数と一致するとき,不偏推定量であるという.

を不偏標本分散と呼ぶのはそのためである.

¾º 標本分布

以下,推定を行うために必要な標本分布を調べる.まず,正規分布に関する事を纏めてお く. 次元の(非退化)正規分布とする.すなわち,密度関数が次で与 えられる.

&

!

を平均ベクトル, を共分散行列という.次が成り立つ:

'

(

'

(

これらの事は特性関数を使うと容易に証明できる.ここで の特性関数

は次で定義される:

'!

(

Ê

特に,密度関数が で与えられる正規分布の場合は

!

であることが知られているので,これから平均,共分散が計算できる. では, の正 則性は必要ないので, が非退化の場合も特性関数で正規分布を特徴づけることが出来る.

が独立で,各 次元正規分布に従う場合は,密度関数が積になるの で, 次元正規分布に従う.また 次元正規分布

(14)

に従えば, 次結合は,次元正規分布に従う.また, 次元 正規分布に従い,共分散が であれば

!

!

!

½

¾

と,特性関数が積になるから独立性が従う.これは正規分布の非常に特殊な性質である.

定理 次元正規分布 に従うならば,

は標準正規分布に従う.

また が独立で,それぞれ次元正規分布

に従うとき,その 次元正規分布

に従う.

さらに

証明 特性関数を計算すればよい.

'! ('! !(

! !

!

これで の分布が であることが示せた.

次に の特性関数を計算しよう.独立性から

'!

('! ('!

(

!

!

!

これで の分布が

であることが分かった.

最後に については 定理 から分布は であることが分かる.

ガンマ分布・ベータ分布 定義 !に対し

)

"

(15)

で定まる関数をガンマ関数, # ! に対し

$ #

で定まる関数をベータ関数という.

) ) が成り立つことが容易に確かめられる.特に自然数に対して)

* である.

またベータ関数の定義式 % で変数変換すれば%"% だから

$ #

%

%

%"%%

% "

%%

の表示も得られる.これから $

が分かる.

定義 次の密度関数

) #

"

を持つ分布をガンマ分布という.記号で&' # と表す.

また'(で密度関数

$ #

を持つ分布をベータ分布という.記号で$" # と表す.

実際に が確率密度であることは

) #

"

)

#

"

( # (#

)

(

"

(

(

)

(

"

(

から分かる.

命題

½

¾

½¾

(16)

ここで は合成積

)

()((

を表す.

証明 のとき

½

¾

) #

½

(

½

"

)

#

¾ (

¾

"

(

) )

#

½

¾

(

½

(

¾

"

( ( (

) )

#

½¾

"

½

¾

) )

#

½¾

"

½

¾

½

¾

$

) )

#

½

¾

½¾

"

$

)

) )

½

¾

のとき½

¾

は明らかである.

ここで両辺を積分すると,確率密度であることを用いて

½

¾

$

)

) )

½

¾

$

)

) )

左辺は

½

¾

½

(

¾ ((

¾

((

½

(

結局

$

)

) )

も示せ,証明が終わる.

上の証明中で次の公式

$ #

) )#

(17)

も証明できている.ここで #

とすれば

$

)

)

これと$

とを考え合わせれば)

が示せたことになる.

ここで合成積の確率論的な意味を述べておく.* を独立な確率変数で,密度関数 ) を持つとする.このとき) * の密度関数になっているのである.これを見るには

' *(

()((

+( (

,(

,+

(

,(

,+

++

++)+

+)++

に注意すればよい.

カイ乗分布

定義 を自然数とするとき,分布 &' を自由度 ¾カイ乗)分布とい う.また記号で- と表す.

(18)

0 5 10 15 20 25

0.0 0.1 0.2 0.3 0.4

chi−square distribution

x

y

上のカイ乗分布分布の密度のグラフは自由度をから まで動かして描いてある.自 由度がのものは原点で発散している.自由度は指数分布であった.自由度が大きくなる とともにグラフは右側に移動しているのを見ることができる.

命題 - 証明

'

(

"

¾

"

¾

(

( (

(

(

"

(

(

(

(

"

(

(19)

(

)

(

"

(

( ((

命題

-

この事実を

-

とかく.

証明 の密度関数は で独立であるから,

*

-

証明 の密度関数は で独立であるから,

から 命題 を使えばよい.

*

-

証明 定理より であるから 命題 を使えば明らか.

命題

*

-

さらに,* は独立.

証明 まず の場合.

*

と変換する.* ** は正規分布に従う. をうまく選んで* ** が次の条 件を満たすようにする:

(20)

*

*

*

*

* *

*

これが成り立つと,

*

*

*

*

*

*

-

となる.さらに* *

が独立であるから,* も独立となって,定理の結論 を得る.

従って,上のことを示せば十分である.上で述べていることは次変換

* *

* が長さ

を保ち,* だから

で, が直交行列であればよい.分布密度を

* *

* .( (

(

とすれば

.( (

(

,( (

(

,

多変数の変数変換

これから

"

¾

½

¾

¾

¾

.( (

(

"

¾

½

¾

¾

¾

"

¾

½

¾

¾

¾

"

¾

参照

関連したドキュメント

 男子3名,女子1名ナリ.之等ノ内ユ名ハ27歳ノニ男子ニシテ内科ニハ結核憧疾患テ有セ

分配関数に関する古典統計力学の近似 注: ややまどろっこしいが、基本的な考え方は、q-p 空間において、 ①エネルギー En を取る量子状態

社会調査論 調査企画演習 調査統計演習 フィールドワーク演習 統計解析演習A~C 社会統計学Ⅰ 社会統計学Ⅱ 社会統計学Ⅲ.

[r]

[r]

2006 年 6 月号から台湾以外のデータ源をIMF のInternational Financial Statistics に統一しました。ADB のKey Indicators of Developing Asian and Pacific

告した統計をもとに編集されている 1 。国際連合統 計委員会(United Nations Statistical Commission、以 下 UNSC

現行制度で,メキシコの統計行政の中枢にある国 立統計地理情報院(Instituto Nacional de Estadística y Geografía: INEGI)は,統計総局(La Dirección