回帰分析(その3)
経済情報処理
価格弾力性の推定 ある商品について、その購入量をw
、単価をp
とし、それぞれの変化量を
w
、
p
で表 すことにする。この時、この商品の価格弾力性
は、w w
p p
により定義される。これ はp
が1 パーセント変化した場合にw
が何パーセント変化するかを示したものである。 ここで、
p
を0 に近づけていった極限を考えると、 0lim
pw w
dw w
p p
dp p
となるが、ln
1
d
w
dw
w
ln
dw
d
w
w
また、d
ln
p
1
dp
p
ln
dp
d
p
p
これより、ln
ln
dw w
d
w
dp p
d
p
である。 一方、ln
w
a b
ln
p
において、W
ln
w
、P
ln
p
とすると、この式は、W
a bP
と表される。この式をP
で微分すると、
dW
d
a bP
b
dP
dP
ところで、W
ln
w
、P
ln
p
であるから、ln
ln
dW
d
w
dP
d
p
よって、
b
はこの商品の価格弾力性となっている。 チョウ検定 年次データなどの時系列データに関して t t tY
a bX
u
t
1 , 2 ,
T
(ここでは時系列データなので添字を,
t
にした) の回帰分析を行うということは、この期間(第1
期から第T
期)を通じて、Y
はX
の変化 に対して同じ割合(具体的にはb
)で変化しているということを意味する。しかしながら、 期間の途中で、この割合が変化しているかもしれないと考えられる場合、それを以下のよ うにして検定することができる。今、その変化がT
1期とT
1
1
期の間で起こった、すなわち、 11, 2,
,
t
T
とt
T
11,
T
1
2,
,
T
とではb
が異なっているかどうかを調べてみる。これ には、t
1, 2,
,
T
についてY
t
a bX
t
u
tの回帰分析を行い、その残差の二乗和を求め (Excel では、残差のところの変動の項目の値が残差の二乗和となっている)、これをS
0と する。次にY
t
a bX
t
u
tの回帰分析をt
1, 2,
,
T
1 とt
T
11,
T
1
2,
,
T
のそれぞれ について行い、各々の残差の二乗和を求め、その和をS
1とする。この時、そうした変化はて、適当な有意水準
に対応する自由度
2,
T
4
のF 分布の値F
(Excel では =FINV(有 意水準,自由度1,自由度 2)により求める)とF
を比較し、F
F
となっていれば、帰 無仮説を棄却し、こうした変化が存在したと言える。 重回帰分析 1 1 2 2 i i i p pi iY
a
b X
b X
b X
u
というように説明変数が複数となっても係数の推定は可能
ˆ
2 i iY
Y
が最小となる係数を求める 最小二乗法で望ましい結果が出る条件(重回帰分析の場合) 単回帰分析の条件に加えて、説明変数の間に相関関係がない 自由度修正済み決定係数 2R
データの適合の度合いを示す決定係数 2R
については、既に説明したが、重回帰分析の 場合、説明変数の数を増やすと、たとえそれがどんなものであっても決定係数を増加して しまう。そのため、説明変数の数の違いを考慮した自由度修正済み決定係数 2R
というも のが用いられている。
2 2 21
1
i ie
n
p
R
Y
Y
n
この値の最大値は1 であるが、最小値は 0 とはならず、負の値も取りうる。 自由度修正済み決定係数は、Excel では補正 2R
として表示される。 Excel による重回帰分析 説明変数は隣り合った列になくてはならない回帰分析(その3) 上記より、鰯の価格弾力性はほぼ1 で あると推定される(価格が1%上昇する と購入量は1%減少する)。 左図は1975~2004 年における牛肉の 価格と購入量をプロットしたものであ る。この場合、一貫した関係があるとは 言えそうに無いことから、1975~1990 年と1991~2004 年について構造変化が 存在したかどうか(日本国内において BSE の発生が確認されたのが 2001 年) についてチョウ検定を行った(次ペー ジ)。その結果、有意水準1%で、F 値= 61.14>5.53 となっており、構造変化が
回帰分析(その3) 確率分布 統計学について学んだ際、その中の重要な手法として区間推定や検定がある。こうした 手法では正規分布やt-分布などを利用するが、従来はこうした連続確率分布に関する確率 などを求める際には、該当する確率分布表を用いるのが一般的であった。しかし、Excel を 用いれば、確率分布表を利用せずに直接求めることが可能である。 NORMSDIST 標準正規累積分布関数の値を求める。この分布は、平均が 0(ゼロ) で標準偏差が 1 であ る正規分布に対応する。 書式 NORMSDIST(z) z 関数に代入する値を指定する。 解説 ・z に数値以外の値を指定すると、エラー値 #VALUE! となる。 使用例 ・標準正規分布で
1.33
となる確率 NORMSDIST(1.333333) ・標準正規分布で
1.2
0.5
となる確率 NORMSDIST(0.5)-NORMSDIST(-1.2) NORMDIST 指定した平均と標準偏差に対する正規分布関数の値を求める。この関数を用いれば、標 準正規分布に変換しなくても直接確率を求めることができる。 書式 NORMDIST(x, 平均, 標準偏差, 関数形式) x 関数に代入する数値を指定する。 平均 分布の平均を指定する。 標準偏差 分布の標準偏差を指定する。 関数形式 ここを TRUE とすると累積分布関数の値が計算され、FALSE を指定 すると確率密度関数の値が計算される。 解説 ・平均、標準偏差 に数値以外の値を指定すると、エラー値 #VALUE! となる。 ・標準偏差≦0 の場合、エラー値 #NUM! となる。 使用例 ・平均40、標準偏差 1.5 の正規分布で
42
となる確率 NORMDIST(42,40,1.5,TRUE) ・平均-3、分散 21 の正規分布で
4
0
となる確率 NORMDIST(0,-3,SQRT(21),TRUE)-NORMDIST(-4,-3,SQRT(21),TRUE)書式 NORMSINV(確率) 確率 標準正規分布における確率を指定する。 解説 ・確率に数値以外の値、あるいは負や1 より大きい値を指定すると、エラーとなる。 NORMSINV 関数では、関数値の計算に反復計算の手法が利用され、確率の値が指定 されると、計算結果の精度が ±3×10-7 以内になるまで反復計算が行われる。100 回反 復計算を繰り返しても計算結果が収束しない場合、エラー値 #N/A が返される。 使用例 ・標準正規分布において
からの確率が0.908789 となる点 NORMSINV(0.908789) ・標準正規分布において0 からの確率が 0.25 となる点 NORMSINV(0.25)-0.5 NORMINV 指定した平均と標準偏差に対する正規累積分布関数の逆関数の値を求める。 書式 NORMINV(確率, 平均, 標準偏差) 確率 正規分布における確率を指定する。 平均 分布の平均を指定する。 標準偏差 分布の標準偏差値を指定する。 解説 ・確率に数値以外の値、あるいは負や1 より大きい値を指定すると、エラーとなる。 ・標準偏差≦0 の場合、エラー値 #NUM! となる。 ・NORMSINV と同様、反復計算が行われ、収束しない場合、エラー値 #N/A が返される。 使用例 ・平均40、標準偏差 1.5 の正規分布において
からの確率が0.908789 となる点 NORMINV(0.908789,40,1.5) TDIST スチューデントの t 分布の確率を求める。 書式 TDIST(x, 自由度, 尾部) x t 分布を計算する数値を指定する。 自由度 分布の自由度を整数で指定する。 尾部 1 ならば片側分布の値が計算され、2 ならば両側分布の値が計算される。回帰分析(その3) 解説 ・引数に数値以外の値を指定すると、エラー値 #VALUE! となる。 ・自由度 < 1 の場合、エラー値 #NUM! となる。 ・自由度、尾部 に小数点以下の値を指定しても切り捨てられる。 ・尾部 に 1 または 2 以外の数値を指定すると、エラー値 #NUM! となる。 使用例 TDIST(1.96,60,2) = 0.054645 または 5.46% ・自由度10 の t 分布において
1
(または1
)の確率 TDIST(1,10,1) ・自由度15 の t 分布において
1.23
及び1.23
の確率 TDIST(1.23,15,2) TINV スチューデントの t 分布の t 値を、確率と自由度から求める。 書式 TINV(確率, 自由度) 確率 スチューデントの両側 t 分布に従う確率を指定する。 自由度 分布の自由度を指定する。 解説 ・確率に数値以外の値、あるいは負や1 より大きい値を指定すると、エラーとなる。 ・自由度 に小数点以下の値を指定しても切り捨てられる。 ・自由度 < 1 の場合、エラー値 #NUM! となる。 ・NORMSINV と同様、反復計算が行われ、収束しない場合、エラー値 #N/A が返される。 使用例 ・自由度10 の t 分布において両側確率が 0.05 となる正の点 TINV(0.05,10) ・自由度15 の t 分布において片側確率が 0.01 となる正の点 TINV(2*0.01,15) CHIDIST 片側カイ 2 乗 (χ2) 分布の確率を求める。 書式 CHIDIST(x, 自由度) x 分布を評価する値を指定する。 自由度 自由度を指定する。 使用例 ・自由度10 のχ2分布において、18.3
の確率 CHIDIST(18.3,10) CHIINV カイ 2 乗 (χ2) 分布の逆関数を求める。使用例 ・自由度10 のχ2分布において、上側確率が0.05 となる点 CHIINV(0.05,10) FDIST F 確率分布を求める。 書式 FDIST(x, 自由度 1, 自由度 2) x F 分布を計算する数値を指定する。 自由度1 自由度の分子を指定する。 自由度2 自由度の分母を指定する。 使用例 ・自由度(6,4)の F 分布において 5.4 より上側の確率 FDIST(5.4,6,4) FINV F 確率分布の逆関数を求める。 書式 FINV(確率, 自由度 1, 自由度 2) 確率 F 分布に従う確率を指定する。 自由度1 自由度の分子を指定する。 自由度2 自由度の分母を指定する。 使用例 ・自由度(6,4)の F 分布において上側確率が 0.01 となる点 FINV(0.01,6,4)