1
Ⅱ.統計・確率の基礎知識
リスク計量化の前提となる統計・確率の基礎知識につい て整理、復習します。 図解中心の説明ですので、統計・確率は苦手だと感じて いる方も理解度アップに繋がります。目
次
1.基本統計量(1変量)
2.基本統計量(2変量)
3.確率変数と確率分布
4.推定と検定
3
1.基本統計量(1変量)
(1) 平
均
(2) 分
散
(3) 標準偏差
(4) パーセント点
(例) 東証TOPIX・日次変化率 250個 東証TOPIX・10日間変化率 250個 ・ ・ ・ ・ ・ ・ ・・・ ・ ・ ・ 東証 日次変化 10日 指 変化 200X/9/29 1610.73 0.508 0.785 200X/9/28 1602.57 0.722 1.194 200X/9/27 1591.04 2.651 0.319 200X/9/26 1549.41 -0.667 -2.994 200X/9/25 1559.78 -0.245 -3.783 200X/9/22 1563.60 -1.048 -3.139 200X/9/21 1580.08 0.629 -3.894 200X/9/20 1570.18 -1.379 -5.040 200X/9/19 1591.98 -0.091 -3.538 200X/9/15 1593.43 -0.295 -2.474 講義の中では、以下の観測データを使います。 200X/9/14 1591.04 2.651 0.319
5 東証TOPIX日次変化率の推移 -12 -8 -4 0 4 8 12 東証TOPIX10日間変化率の推移 -12 -8 -4 0 4 8 12
日次変化率 10日間 変化率 データ COUNT 250 250 平 AVERAGE 0.063 0.656 分 VARA 1.540 14.966 標準偏 STDEVA 1.241 3.869 基本統計 Excel関数 (設問) グラフと基本統計量をみて、どんなことに気付きましたか? 気付いて欲しいことは4つあります。 答えは、講義の中で・・・ (ヒント)
7
(1) 平 均
• 平均は、観測データセットの「中心の位置」を示す指標の
1つ。
データの数 データの和 X = = N X1+X2+・・・+XN• Excelでは、関数AVERAGE(データ範囲)を使って求
める。
(2‐ⅰ) 分 散(記述統計の立場で定義)
• 分散は、観測データセットの「バラツキ」を示す指標の1つ。
• Excelでは、関数VARP(データ範囲)を使って求める。
データの データの偏差平方和 Vp=σ2 = = N (X1-X)2+(X 2-X)2+・・・+(XN-X)2 - データの「偏差平方和」(平均との差を2乗して合計)を求めて 「データの数」で割る。 - 分散の「単位」は、データの持つ「単位」の2乗。9 4 3 6 7 偏差 (平均との差) 5 2 1 0 -2 -1 偏差平方 (-2)2 (-1)2 02 12 22 偏差平方和 10 観測データがバラつく(平均から離れる)と偏差平方和は増える。 しかし、観測データ数が増えても偏差平方和は増えてしまう。 合計すると ゼロ 合計すると 分散 偏差平方和 10 観測データ数 5 平均:中心の位 観測データ
記述統計: 中学・高校で学習する平均と分散
(例)(参考)記述統計の考え方
• 観測データを母集団全体と考えて、統計量の算定を 行い、観測データが持つ特性を分析・記述する。 X = N X1+X2+・・・+XN Vp = N (X1-X)2+(X 2-X)2+・・・+(XN-X)2 分散 平均 (例)ある特定の集団(N人)の身長の平均と分散を計算 する。11 × × × × × × × × × × × × × × × × × × × 母集団=標本の特性値を調べる 母集団=標本 平均μ 分散 V 標準偏差σ VaR など. 計測可
(2‐ⅱ) 分散(推測統計の立場で定義)
• 分散は、観測データセットの「バラツキ」を示す指標の1つ。
• Excelでは、関数VARA(データ範囲)を使って求める。
データ数-1 データの偏差平方和 Va=σ2 = = N-1 (X1-X)2+(X 2-X)2+・・・+(XN-X)2 - データの「偏差平方和」(平均との差を2乗して合計)を求めて 「データの数-1」で割る。 - 分散の「単位」は、データの持つ「単位」の2乗。13
• 観測データを、母集団から抽出した標本(サンプル)
と考えて、統計量の算定を行い、母集団の特性を推測
し、検証する。
X = N X1+X2+・・・+XN Va = N-1 (X1-X)2+(X 2-X)2+・・・+(XN-X)2 分散(不偏標本分散) 平均 (例)任意に抽出したN人(標本)の身長を計測して、日本人 全体(母集団)の身長の平均と分散を推定する。(参考)推測統計の考え方
× × × × × × × × × × × × × × × × × × × × × × × 母集団の特性値(真の値)は分からない 母集団 標本 推定 平均μ 分散 V 標準偏差σ VaR など. 標本の特性値 平均μ* 分散 V* 標準偏差σ* VaR* など
15 ・ 母集団の「真の分散」を、統計的手法で「推定」するときに N-1で割った「標本分散」を使うのは、以下のような特徴が あるため。 (一致性) ・ 「標本分散」は、Nが大きくなると、母集団の「真の分散」 に限りなく近づく (不偏性) ・ 「標本分散」は、母集団の「真の分散」の偏りのない推定 値となることが知られている
N-1で割った「標本分散」の特徴
母集団の 真の分散 V (誰も知らない) 標本分散V*(1) 標本分散V*(2) 標本分散V*(3) 標本分散V*(4) 標本分散V*(5) 標本分散V*(6) 標本分散V*(7) 標本分散(V*)を、標本を変えて繰り返し計算すると、 真の分散を中心にして偏りなく分布する(不偏性)
17
講義の中で、VaRを計測する際に使う
分散、標準偏差は、推測統計の立場
から定義したもの(N-1 で割ったもの)
です。
(3) 標準偏差(推測統計の立場で記載)
• 標準偏差は、観測データセットの「バラツキ」を示す指標
の1つ。分散の平方根(ルート)をとって定義する。
- 標準偏差の「単位」は、データの持つ「単位」と同じ。• Excelでは、関数STDEVA(データ範囲)を使って求める。
データ数-1 データの偏差平方和 σ = = N-1 (X1-X)2+(X 2-X)2+・・・+(XN-X)219 -4 -2 2 4 -1 -2 1 2 平均 標準偏差 標準偏差 標準偏差 標準偏差 3.162 1.581 1.581 3.162 0 【サンプル①】 【サンプル②】 0
東証TOPIX日次変化率の推移 -12 -8 -4 0 4 8 12 日次変化率 標準偏差 -標準偏差 東証TOPIX10日間変化率の推移 -8 -4 0 4 8 12 10日間変化率 標準偏差 -標準偏差
21
• 平均をみると、日次変化率、10日間変化率とも概ね
ゼロとなっている。
• 分散をみると、10日間変化率の分散は、日次変化率
の 分散の概ね10倍となっている。
• 標準偏差をみると、 10日間変化率の標準偏差は、
日次変化率の標準偏差の概ね√10倍(=3.162倍)
となっている。
日次変化 10日 変化 データ COUN 250 250 平 AVERAG 0.063 0.656 分 VAR 1.540 14.966 標準偏 STDEV 1.241 3.869 基本統計 Excel関株価・金利・為替等の変化率に関して
① その平均をゼロと仮定したり、
② T日間変化率の標準偏差は、日次変化率
の標準偏差の√T倍と仮定して
23
(4)パーセント点
• パーセント点とは、観測データを小さい順に並べたときに、
その値よりも小さな値の割合が指定された割合(百分率)
になるデータの値として定義される。
• 例えば、99パーセント点というのは、その値より小さな
データの割合が99%となるデータの値のことを指す。
- 50パーセント点のことを中央値(メジアン)と呼ぶ。 - 25パーセント点を第1四分位点、75パーセント点 を第3四分位点と呼ぶ。• Excelでは、関数PERCENTILE(データ範囲,率)を使っ
て求める。
99% (例) 1000個の損失データが観測されている場合、 99%点というのは、損失額を小さい順に並べて 990番目になるデータ値のこと。 百 分 位 損 失 額 9 8 5 番 目 9 8 .5 % 5 2 9 9 8 6 番 目 9 8 .6 % 5 5 8 9 8 7 番 目 9 8 .7 % 5 8 9 9 8 8 番 目 9 8 .8 % 6 1 8 9 8 9 番 目 9 8 .9 % 6 2 1 9 9 0 番 目 9 9 .0 % 6 3 2 9 9 1 番 目 9 9 .1 % 6 5 4 9 9 2 番 目 9 9 .2 % 6 7 1 9 9 3 番 目 9 9 .3 % 6 9 8 9 9 4 番 目 9 9 .4 % 7 0 3 9 9 5 番 目 9 9 .5 % 7 1 2 9 9 6 番 目 9 9 .6 % 7 7 6 9 9 7 番 目 9 9 .7 % 7 9 4 9 9 8 番 目 9 9 .8 % 8 1 0 9 9 9 番 目 9 9 .9 % 8 3 1 順 位
25 99パーセント点 損失額 小 大 99%
99%VaRは、文字通り、99パーセント点
のことです。
(1)散布図
(2)共分散
(3)相関係数
(4)相関行列
27 ・ ・ ・ ・・・ ・ ・ ・
(1) 散布図
以下のような2変量の関係を調べるためには、 散布図を書くのが直感的に理解しやすい。 東証TOPIX 10年割引国債 10日間変化率 10日間変化率 (X) (Y) 200X/9/29 0.785 -0.098 200X/9/28 1.194 0.010 200X/9/27 0.319 0.177 200X/9/26 -2.994 0.315 200X/9/25 -3.783 0.688 200X/9/22 -3.139 0.560 200X/9/21 -3.894 -0.088 200X/9/20 -5.040 0.295 200X/9/19 -3.538 -0.010 200X/9/15 -2.474 0.098-2.500 -2.000 -1.500 -1.000 -0.500 0.000 0.500 1.000 1.500 2.000 2.500 -15.000 -10.000 -5.000 0.000 5.000 10.000 東証TOPIX 国債10日間 変化 率 Ⅰ Ⅱ Ⅳ Ⅲ Ⅱ、Ⅳのエリアに分布が多い。 株価変化率がプラス(マイナス)のとき、 国債価格 変化率はマイナス(プラス)となる傾向がある。
株価変化率と国債価格変化率との関係
29
(2)共分散(推測統計の立場で記載)
• 共分散は、2つの変量(X、Y)の間の「直線的な比例
関係の強さ」を示す指標。
- データの「偏差積和」を求めて、「データ数-1」で割る。 - 共分散の「単位」は、 Xの持つ「単位」 掛ける Yの持つ「単位」。 (X1-X)(Y1-Y)+(X2-X)(Y2-Y)+・・+(XN-X)(YN-Y) COV(X、Y) N-1 データ数-1 データの偏差積和 = =• Excelでは、関数COVAR(データ範囲(X)、データ範囲
(Y))を使って求める。
(注)Excelでは、データの偏差積和をN-1ではなく、Nで割って共分散を定義して いる(記述統計の立場で定義している)ため、別途、調整を行う必要がある。偏差積和 = (X1-X)(Y1-Y)+ (X2-X)(Y2-Y)+・・・+(XN-X)(YN-Y) (Xi-X)(Yi-Y)>0 (Xi-X)(Yi-Y)<0 (Xi-X)(Yi-Y)<0 (Xi-X)(Yi-Y)>0 Y Ⅰ Ⅱ Ⅳ Ⅲ Ⅰ、Ⅲのエリアに多く分布 ⇒ 偏差積和 > 0 : 正の相関 Ⅱ、Ⅳのエリアに多く分布 ⇒ 偏差積和 < 0 : 負の相関 Xi Yi
31
(3)相関係数
• 相関係数は、2つの変量(X、Y)間の「直線的な比例
関係の強さ」を示す指標。
• 共分散を、2つの標準偏差の積で割って定義する。
- 相関係数は-1~+1までの値をとる。「単位」を持たない無名数。 - 相関係数の定義には、データ数Nが含まれていない(定義は1通りの み)。 COV(X、Y) = σ(X) σ(Y) ρ(X、Y) (X1-X)(Y1-Y)+ ・・・+(XN-X)(YN-Y) = (X1-X)2+・・・+(X N-X)2 (Y1-Y)2+・・・+(YN-Y)2• Excelでは、関数CORELL(データ範囲(X)、データ範囲
(Y))を使って求める。
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
相関係数と散布図
ρ=0.7 ρ=-0.7 ρ=1.0 (正の完全相関) ρ=-1.0 (負の完全相関) ρ=0 (無相関) 相関係数の定義 ρxy= COV(X,Y)/σxσyCOV(X,Y) : X,Yの共分散 =(1/N-1)*Σ(Xt-EX)(Yt-EY) σx : Xの標準偏差 EX : Xの平均値
33
(4)相関行列と分散共分散行列
・・・ ・・・ ・・・ ・・・ ・・・ 1 ρ(XN、X3) ρ(XN、X2) ρ(XN、X1) XN ρ(X1、X2) 1 ρ(X3、X2) ρ(X3、X1) X3 ρ(X2、XN) ρ(X2、X3) 1 ρ(X2、X1) X2 ρ(X1、XN) ρ(X1、X3) ρ(X1、X2) 1 X1 XN X3 X2 X1 ・・ ・ ・・・ ・・・ ・・・ ・・・ ・・・ ρ(Xi、Xi)=1 : 同じ変量(Xii)同士の相関は1 ρ(Xi、Xj)=ρ(Xj、Xi) : 2つの変量(Xi、Xj)の順序を変えて計算しても 相関係数の値は同じ。太枠内が相関行列
太枠内が分散共分散行列
・・・ ・・・ ・・・ ・・・ ・・・ VXN COV(XN、X3) COV(XN、X2) COV(XN、X1) XN COV(X1、X2) VX3 COV(X3、X2) COV(X3、X1) X3 COV(X2、XN) COV(X2、X3) VX2 COV(X2、X1) X2 COV(X1、XN) COV(X1、X3) COV(X1、X2) VX1 X1 XN X3 X2 X1 ・・ ・ ・・・ ・・・ ・・・ ・・・ ・・・35
VaRの計測手法として、分散共分散法
の説明をします。
VaRの計測において、分散共分散行列、
相関行列が重要な働きをします。
Ⅲ.VaRの計測と検証より
分散共分散法(デルタ法)による計算例② - リスクファクターが2つのケース VaRの計算シート 分散共分散法(デルタ法) 【ポートフォリオ】 株式投信 100 億円 単独VaR 標準偏差 ×信頼係数 ×感応度 10年割引国債 100 億円 株式投信 9.00 = 3.8686 2.33 100 割引国債 1.99 0.8568 2.33 100 保有期間 10日 信頼水準 99.00 % ポートVaR 単純合算 10.99 ① 観測データ 250 日 相関考慮後 8.35 ② ①>②:ポートフォリオ効果 東証TOPIX 10年割引国債 投信VaR 国債VaR 10日間変化率 10日間変化率 9.00 1.99 1 -0.4233 9.00 投信VaR 2006/9/29 0.785 -0.098 -0.4233 1 1.99 国債VaR 2006/9/28 1.194 0.010 ↓ ↓ 2006/9/27 0.319 0.177 2006/9/26 -2.994 0.315 8.1560 -1.8162 9.00 2006/9/25 -3.783 0.688 1.99 2006/9/22 -3.139 0.560 ↓ 行列計算式 2006/9/21 -3.894 -0.088 VaR2: 69.78 2006/9/20 -5.040 0.295 VaR : 8.35 2006/9/19 -3.538 -0.010 2006/9/15 -2.474 0.098 投信感応度 国債感応度 2006/9/14 -2.248 -0.197 100.00 100.00 14.96626 -1.3938 100.00 投信感応度 2006/9/13 -1.822 0.187 -1.3938 0.7364709 100.00 国債感応度 2006/9/12 -1.875 0.403 ↓ ↓ 2006/9/11 -0.235 0.433 2006/9/8 0.007 0.118 1357.2481 -65.7303 100.00 2006/9/7 -0.591 1.179 100.00 2006/9/6 0.155 1.228 ↓ 行列計算式 2006/9/5 0.582 1.051 ポート分散 : 12.92 (単位調整) 2006/9/4 1.534 1.296 ポート標準偏差 : 3.59 相関行列 分散共分散行列 行列計算式 行列計算式37
(1)確率変数
(2)確率分布
- 確率密度関数、分布関数
(3)様々な確率分布
- 一様分布、正規分布、対数正規分布
ポワソン分布、2項分布
(4)確率変数の独立
3.確率変数と確率分布
(1)確率変数
• 予め定まった確率にしたがって値が変動する数のこと
を「確率変数」という
(例)サイコロを振ったときに出る目の数 1/6 1/6 1/6 1/6 1/6 1/6 確 率 6 5 4 3 2 1 サイコロの目(X) 1/6 1 2 3 4 5 6 X 確率 ― 離散的な確率変数39 株価、金利、為替等の変化率を、 「確率変数」として捉えることも可能。 X 確率 下落(-) 上昇(+) X X X X0(現在値) X‐1 X‐2 X‐3 X ― 連続的な確率変数
• VaRを250回計測して、VaRを超える損失が 発生する回数 • 事件・事故発生に伴う損失の発生額(1回当たり) • 事件・事故の年間発生件数 • 個別企業の信用状態 その他の確率変数
41
• 確率分布を表わすとき、2種類の関数がある。
① 確率密度関数
確率変数(X)が 「ある値」 をとる確率(確率密度)
を表わす関数
② 分布関数(累積確率密度関数)
確率変数(X)が 「ある値
以下
」 になる確率を表わ
す関数
(2)確率分布
0 1 1 f(X) X 0 1 1 F(X) X0= X 確率密度関数 分布関数 0.7 F(X0)= 0.7 f(X0)= X0=0.7 0.7 (例)数直線上で、0から1までの値をランダムにとる 確率変数(X)を考える。 面積 0.7×1(確率密度) Xは 0~1の間で無限の値をとる可能性がある Xが 0.7の値をとる確率はゼロ Xが 0.7以下の値をとる確率は 0.7(斜線部の面積) 確率は面積で捉える
43 f(X) :各地域の広さ(km2) :人口密度(万人/km2) (参考)人口と人口密度 X 人口は面積で 表される :各地域の広さ(km2) X F(X):人口(万人)
0% 確率密度関数 P% P% f(X) X0 X X X 0 分布関数 F(X) 100% 斜線部の面積 縦軸上の点 X=X0となる確率(確率密度) X≦X0となる確率 積分 より一般的に概念図で示すと
45
一様分布
: ある区間の中の値が同じ確率で生起する分布。(3)様々な確率分布
0 0.2 0.4 0.6 0.8 1 1.2 f(X) 確率密度関数 F(X) 分布関数 a b 0 1 X X • 一様分布にしたがう乱数(一様乱数)は、Excel関数RAND() を使って生成することができる。 1/(b-a)0 0.2 0.4 0.6 0.8 1
正規分布
: 左右対称の釣鐘型をした確率分布。 平均(μ)、標準偏差(σ)を与えると分布の 形状が決まる。 ⇒ N(μ,σ2)と表す。 • 平均(μ)=0、標準偏差(σ)=1の正規分布を標準正規分布 と言い、N(0,1)と表す。 X X μ μ f(X) 確率密度関数 F(X) 分布関数 σ=1 σ=0.5 σ=2 σ=0.5 σ=1 σ=2 EXCEL関数 NORMDIST(X,μ,σ,関数形式)47
確率変数 X が 標準正規分布にしたがうとき
確率変数 σX+μ は 正規分布にしたがう。
f(X) 確率密度関数 X ~ N(0,1) σX+μ ~ N(μ, σ2) σX ~ N(0, σ2) 0 μ X確率変数 X が 正規分布にしたがうとき
確率変数 Δ
×X+定数項 は 正規分布にしたがう。
f(X) 確率密度関数 X ~ N(μ, σ2) Δ×X + 定数項 ~ N(Δ×μ+定数項 , (Δσ)2) μ Δ×μ+定数項 X 標準偏差がΔ倍になる49 ・ 平均からどれだけ離れているか(標準偏差の何倍か)という 情報から、X以下の値をとる確率が分かる。 ・ 例えば、XがN(0,σ2 )の正規分布にしたがって生起するとき X ≦ σとなる確率は 84.1% X ≦ 2σとなる確率は 97.7% X ≦ 2.33σとなる確率は 99.0% X ≦ 3σとなる確率は 99.9% となることが知られている。 ・ このとき、σの前に付いている係数 を「信頼係数」という。 ・ 正規分布は、Xが 「信頼係数」×σ以下となる確率が分かる 便利な確率分布の1つ。
正規分布の特徴
2.33σ 2σ σ X 99% 99%点株価、金利、為替等の変化率は、正規分布にしたがうと 想定されることが多い。 (注) 裾野部分の分布が厚くなることをいう。 東証TOPIX日次変化率の分布 0 5 10 15 20 25 30 35 40 45 50 実分布 正規分布 ファット・テール - しかし、実際の分布をみると、正規分布と比較して、歪み、 偏りやファット・テール が観察されることも少なくない。 (注)
51 0 0.02 0.04 0.06 0.08 0.1 0 0.2 0.4 0.6 0.8 1
対数正規分布
: X X f(X) 確率密度関数 F(X) 分布関数 変数Xの対数値(logX)が正規分布にしたがうとき、 変数Xは対数正規分布にしたがう、と言う。 logXの平均(μ)、logXの標準偏差(σ)を与えると 分布の形状が決まる。 左右非対象、片側に裾野が長いファットテールな分布。 logXの平均 = 0 logXの標準偏差 = 1 logXの平均 = 0 logXの標準偏差 = 1 EXCEL関数 LOGNORMDIST(X,μ,σ)0 0.05 0.1 0.15 0.2 0.25 0.3 0 0.2 0.4 0.6 0.8 1 1.2
ポワソン分布
: K K f(K) 確率密度関数 F(K) 分布関数 所与の領域、あるいは、所与の時間内において、0回、1回、 2回、3回・・・と発生する事象が、ちょうどK回発生する確率を 示す。 平均発生回数(λ回)を与えると分布の形状が決まる。 平均発生回数λ=2回 平均発生回数λ=2回 EXCEL関数 POISSON(K,λ,関数形式)53 講義(Ⅲ.)の中で、 市場VaRを計測(分散共分散法)するとき 正規分布を利用する例をあげます。 信用VaRを計測(モンテカルロ・シミュレー ション法)するとき、正規分布を利用する例 をあげます。 オペリスクVaRを計測(モンテカルロ・シミュレ ーション法)するとき、対数正規分布とポワソン 分布を利用する例をあげます。 ― 実務的には、フィットのよい別の確率分布 を利用することもあります。
2項分布
: (例)サイコロを10回振って 1の目が出る回数(K) 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 f(K) 確率密度関数 F(K) 分布関数 0 2 4 6 8 10 K 0 2 4 6 8 10 K N=10,p=1/6 N=10,p=1/6 1の目が出る回数 1の目が出る回数 結果が2通りある試行(実験)をN回繰り返したとき、片方の 結果が起こる回数(K)の確率分布。 試行回数(N回)と、片方の結果が起きる確率(p)を与えると 分布の形状が決まる。55 2項分布(Excel関数) = NCK pK (1-p)N-K N回の試行の中から ある事象が起きるK回の試行を 取り出す組み合わせ ある事象が起きる確率は p。 N回の試行のうち、K回は ある事象が起きる。 ある事象が起きない確率は1-p。 N回の試行のうち、N-K回は ある事象は起きない。 NCK = N×(N-1)×・・・×(N-K+1) K×(K-1)×・・・×2×1 (例)サイコロを10回振ったときに2回、1の目が出る確率 = 10C2 (1/6)2 (5/6)10-2 = 10×9 2×1 ×(1/6) 2 (5/6)8 BINOMDIST(K,N,p,false) BINOMDIST(2,10,1/6,false)
講義の中で、
VaR計測モデルのバックテストを行なう とき、2項分布を利用します。
57
確率変数 X
1、X
2が互いに影響されず、
それぞれの確率分布にしたがって値をとるとき、
確率変数 X
1、X
2は、互いに「独立」であると
いう。
(4)確率変数の独立
【定義】
• 2回続けて1の目が出ても、3回目の結果には影響を 及ぼさない。 • 3回目は、いずれの目が出る確率も1/6。
(例)サイコロを振ったときに出る目の数
1/6 1/6 1/6 1/6 1/6 1/6 確 率 6 5 4 3 2 1 サイコロの目(X3) 3回目: X3 = ? 1回目: X1 = 1、 2回目: X2 = 159
株価、金利、為替等の変化について
確率変数 X の推移と、その確率分布 現在 将来 X0 t0 X X X X 過去 Xt Xs ?互いに独立かつ同一の確率分布にしたがって
変動している、と考えられることが多い。
⇒ i.i.d.の想定
【独立の定義】 確率変数 Xt、Xsの確率関数に関して、以下の式が成り立つ とき、確率変数 Xt、Xsは互いに「独立」と言う P(Xt=a、Xs=b) = P(Xt=a)P( Xs=b) 【i.i.d.の定義】 確率変数 Xt、Xsについて、以下の2つの条件を満たすとき、 確率変数 Xt、Xsは互いに「 i.i.d.」(注)であると言う。 (注)independently and identically distributed ①確率変数 Xt、Xsは互いに独立である。 ②確率変数 X 、X は同一の確率分布にしたがう。
61 確率変数 X1、X2 が互いに「独立」のとき、以下のことが 成り立つ。 ① 確立変数 X1X2 の期待値は、それぞれの確率変数の 期待値の積になる。 E(X1X2)=E(X1)E(X2) ② 確率変数 X1+X2 の分散は、それぞれの確率変数の 分散の和に等しい。 V(X1+X2)=V(X1)+V( X2) ③ 確率変数 X1 と X2 は無相関である。 ρ(X1、X2)=0 【定理】 (証明省略)
【ルートT倍ルール】 日次ベースの対数変化率 or 変化幅を X1 、X2 、X3 、・・・ 、XT とすると、 T日間の対数変化率 or 変化幅は X1+X2 +X3 +・・・ +XT と表される。 各期のリスクファクター(X1,X2,X3,・・・XT)が、互いに独立かつ同一 の確率分布にしたがうと想定する。 【i.i.dの定義】 日次ベースの対数変化率 or 変化幅 X1 、X2 、X3 、・・・ 、XTの 分散を σ2 標準偏差を σ とすると、 T日間の対数変化率 or 変化幅 X1+X2 +X3 +・・・ +XTの 分散は T×σ2 標準偏差は √T ×σとなる。
63 (参考)対数変化率の定義
≒
≒
=
-1
Xt - Xt-1 Xt Xt-1 Xt-1=
-1
Xt - Xt-10 Xt Xt-10 Xt-10log
Xt 日次対数変化率 Xt-1log
Xt 10日間対数変化率 Xt-10 対数変化率は、通常の変化率と近似的に等しいことが知られている。 log(自然対数)は、Excelでは関数LN(・)で与えられる。対数変化率の特徴
対数変化率は、同率の低下、上昇により、元の値に戻る。 10日間対数変化率は、日次対数変化率(10日分)の和となる。 変化率(日次) 対数変化率(日次) 対数変化率(日次) 100 0.0101 0.0101 X10 100 0.2877 99 -0.0100 -0.0101 X9 75 -0.4700 100 0.0526 0.0513 X8 120 1.3863 95 -0.0500 -0.0513 X7 30 -0.6931 100 0.1111 0.1054 X6 60 -0.9163 90 -0.1000 -0.1054 X5 150 0.5108 100 0.2500 0.2231 X4 90 1.0986 80 -0.2000 -0.2231 X3 30 -0.6931 100 0.4286 0.3567 X2 60 -0.2877 70 -0.3000 -0.3567 X1 80 -0.1178 100 0.6667 0.5108 X0 90 ― 60 -0.4000 -0.5108 0.1054 100 1.0000 0.6931 50 -0.5000 -0.6931 対数変化率(10日間) Σlog(Xt/Xt-1)65 東証TOPIX日次変化率の推移 -12 -8 -4 0 4 8 12 日次変化率 標準偏差 -標準偏差 東証TOPIX10日間変化率の推移 -12 -8 -4 0 4 8 12 10日間変化率 標準偏差 -標準偏差
-15 -10 -5 0 5 10 -15 -10 -5 0 5 10 -4 -3 -2 -1 0 1 2 3 4 -4 -3 -2 -1 0 1 2 3 4 下図は、過去1年間のデータをもとに、東証TOPIX・ 変化率と、1期前の変化率との相関関係(自己相関) をみたもの。 当期 1期前 当期 1期前 相関係数ρ=0.037 相関係数ρ=0.905 東証TOPIX・日次変化率 東証TOPIX・10日間変化率 - 日次変化率の自己相関は弱いが、10日間変化率の自己 相関は強いことが観察される。 - 統計的に厳密に検証すると、多くの時系列データが(日次 変化率でみても10日間変化率でみても)独立とは言えない
67 日次 10日間 対数変化率 対数変化率 データ数 COUNT 250 250 平均 AVERAGE 0.063 0.656 分散 VARA 1.540 14.966 標準偏差 STDEVA 1.241 3.869 基本統計量 Excel関数 分散をみると、10日間対数変化率の分散は、日次対数 変化率の分散の概ね10倍となっている。 標準偏差をみると、 10日間対数変化率の標準偏差は、 日次対数変化率の標準偏差の概ね√10倍(=3.162 倍) となっている。
ルートT倍ルール
10日間対数変化率 X1+X2+・・・+XT の確率分布 日次対数変化率 Xの確率分布 σ -σ √T×σ -√T×σ 仮定69
ルートT倍ルール
仮定 リスクファクターの確率分布は i.i.d. X X X X ? 日次対数 変化率 日次対数 変化率 日次対数 変化率 日次対数 変化率 T日間 対数変化率 σ -σ √T×σ -√T×σ(1) 推 定
(2) 検 定
71 × × × × × × × × × × × × × × × × × × × × × × × 母集団確率密度関数 母集団の確率分布、特性値は、誰にも分からない。 標本の特性値から母集団の特性値を統計的に推測する。 母集団 標本(実現値) 特性値 平均μ 標準偏差σ 分散V VaR など. 特性値 平均μ* 標準偏差σ* 分散V* VaR* など
(1) 推 定
推定×
• 一定の確率分布を前提にして推定した値について、
その値をとる確率が十分に低いとき、
「偶然、珍しいことが起きた」と考えるのではなく、
「推定の際に置いた前提が誤っていた」
と結論付ける。
(2) 検 定
真の確率分布 推定の際に前提とした確率分布 ① 実現する確率が十分に低い ② 推定の前提(確率分布)が 誤っていたと結論付ける。 実現値73 (設問) 1の目がでやすいサイコロがあります。 サイコロを割ったり、X線透視などをせず、 サイコロを振るだけで、このサイコロが 「イカサマ」かどうかを決めたいと思います。 あなたは、このサイコロを600回振って、 何回、1の目が出たら、「イカサマ」だと判断しますか? 120回で 「イカサマ」だと判断しますか? 150回で 「イカサマ」だと判断しますか? 200回で 「イカサマ」だと判断しますか? 300回で 「イカサマ」だと判断しますか? 400回で 「イカサマ」だと判断しますか?
このサイコロを振ったとき、1の目が出る確率は 1/6 である。 このサイコロを600回振ったとき、1の目が?回以上発生した。 このサイコロを振ったとき、1の目が出る確率が 1/6 だとする と、600回のうち?回以上、1の目が出る確率は十分に低い (例えば0.1%未満)ことが分かる。
(例)1の目がでやすい「イカサマ・サイコロ」の
見付け方
このサイコロを振ったとき、1の目が出る確率は 1/6 とは 言えない。75
2項分布
NC
Kp
K(1-p)
N-KN回の観測で、K回、1の目が出る確率
N=600回 p=1/6 1-p=5/6 K回 確率 確率 K回以上 0 0.000% 100.000% 0回以上 100 4.264% 60.278% 100回以上 110 2.904% 20.634% 110回以上 120 0.652% 3.051% 120回以上 130 0.052% 0.184% 130回以上 140 0.002% 0.004% 140回以上 150 0.000% 0.000% 150回以上 160 0.000% 0.000% 160回以上 170 0.000% 0.000% 170回以上 180 0.000% 0.000% 180回以上 190 0.000% 0.000% 190回以上 200 0.000% 0.000% 200回以上 300 0.000% 0.000% 300回以上 400 0.000% 0.000% 400回以上 500 0.000% 0.000% 500回以上 600 0.000% 0.000% 600回以上①「帰無仮説」を立てる。 ② 「帰無仮説」 が「真」(true)であるという仮定の下に 「検定統計量」を決定する。 ― ただし「検定統計量の確率分布は既知とする。 ③試行や標本(サンプル)の抽出により、「検定統計量」 を計算する。 ④「検定統計量」の実現値(計算値)がどの程度の確率 でおき得ることかを確認する。 ⑤ 「検定統計量」の実現値(計算値)が十分に低い確率 (「有意水準」以下)でしか置きえないとき、 「帰無仮説」 を棄却する。
検定の一般的手続き
77 「検定」では、次の2通りの「過誤」(エラー)が起きる可能性が ある。
第1種の過誤(エラー)
本当は帰無仮説が正しいのに、
検定の結果、
帰無仮説が誤っていると結論付けてしまう。
第2種の過誤(エラー)
本当は帰無仮説が正しくないのに、
検定の結果、
帰無仮説が正しいと結論付けてしまう。
2種類の過誤
したがって、バックテストの結果も 「過誤」(エラー)を伴って いる可能性がある点、注意を要する。実現値 真の確率分布 推定に利用した確率分布 = 真の確率分布 推定に利用した確率分布 = 第1種の過誤 第2種の過誤
79