Microsoft PowerPoint - Ⅱ(リスク計量化入門）.ppt

(1)

1

Ⅱ．統計・確率の基礎知識

リスク計量化の前提となる統計・確率の基礎知識について整理、復習します。図解中心の説明ですので、統計・確率は苦手だと感じている方も理解度アップに繋がります。

(2)

目

次

１．基本統計量（1変量）

２．基本統計量（２変量）

３．確率変数と確率分布

４．推定と検定

(3)

3

１．基本統計量（１変量）

（１）平

均

（２）分

散

（３）標準偏差

（４）パーセント点

(4)

（例）東証ＴＯＰＩＸ・日次変化率 250個東証ＴＯＰＩＸ・10日間変化率 250個・・・・・・・・・・・・東証 _日次変化 10日指変化 200Ｘ/9/29 1610.73 0.508 0.785 200Ｘ/9/28 1602.57 0.722 1.194 200Ｘ/9/27 1591.04 2.651 0.319 200Ｘ/9/26 1549.41 -0.667 -2.994 200Ｘ/9/25 1559.78 -0.245 -3.783 200Ｘ/9/22 1563.60 -1.048 -3.139 200Ｘ/9/21 1580.08 0.629 -3.894 200Ｘ/9/20 1570.18 -1.379 -5.040 200Ｘ/9/19 1591.98 -0.091 -3.538 200Ｘ/9/15 1593.43 -0.295 -2.474 講義の中では、以下の観測データを使います。 200Ｘ/9/14 1591.04 2.651 0.319

(5)

5 東証TOPIX日次変化率の推移 -12 -8 -4 0 4 8 12 東証TOPIX１０日間変化率の推移 -12 -8 -4 0 4 8 12

(6)

日次変化率 10日間変化率データ _COUNT 250 250 平ＡＶＥＲＡＧＥ 0.063 0.656 分ＶＡＲＡ 1.540 14.966 標準偏ＳＴＤＥＶＡ 1.241 3.869 基本統計 Excel関数（設問）グラフと基本統計量をみて、どんなことに気付きましたか？気付いて欲しいことは４つあります。答えは、講義の中で・・・（ヒント）

(7)

7

（１）平均

• 平均は、観測データセットの「中心の位置」を示す指標の

１つ。

データの数データの和Ｘ＝＝ＮＸ_１＋Ｘ_２＋・・・＋Ｘ_Ｎ

• Ｅｘｃｅｌでは、関数ＡＶＥＲＡＧＥ（データ範囲）を使って求

める。

(8)

（２‐ⅰ）分散（記述統計の立場で定義）

• 分散は、観測データセットの「バラツキ」を示す指標の１つ。

• Ｅｘｃｅｌでは、関数ＶＡＲＰ（データ範囲）を使って求める。

データのデータの偏差平方和Ｖｐ＝σ２ _＝＝Ｎ（Ｘ_１－Ｘ）２_＋（Ｘ２－Ｘ）２＋・・・＋（ＸＮ－Ｘ）２－データの「偏差平方和」（平均との差を２乗して合計）を求めて「データの数」で割る。－分散の「単位」は、データの持つ「単位」の２乗。

(9)

9 ４３６７偏差（平均との差）５２１０－２－１偏差平方 _（－２）２ _（－１）２ _０２ _１２ _２２偏差平方和１０  観測データがバラつく（平均から離れる）と偏差平方和は増える。  しかし、観測データ数が増えても偏差平方和は増えてしまう。合計するとゼロ合計すると分散偏差平方和１０観測データ数５平均：中心の位観測データ

記述統計：中学・高校で学習する平均と分散

（例）

(10)

（参考）記述統計の考え方

• 観測データを母集団全体と考えて、統計量の算定を行い、観測データが持つ特性を分析・記述する。Ｘ＝ＮＸ_１＋Ｘ_２＋・・・＋Ｘ_ＮＶｐ＝Ｎ（Ｘ_１－Ｘ）２_＋（Ｘ２－Ｘ）２＋・・・＋（ＸＮ－Ｘ）２分散平均（例）ある特定の集団（Ｎ人）の身長の平均と分散を計算する。

(11)

11 × × × × × × × × × × × × × × × × × × × 母集団＝標本の特性値を調べる母集団＝標本平均μ 分散 V 標準偏差σ ＶａＲなど. 計測可

(12)

（２‐ⅱ）分散（推測統計の立場で定義）

• 分散は、観測データセットの「バラツキ」を示す指標の１つ。

• Ｅｘｃｅｌでは、関数ＶＡＲＡ（データ範囲）を使って求める。

データ数－１データの偏差平方和Ｖａ＝σ２ _＝＝Ｎ－１（Ｘ_１－Ｘ）２_＋（Ｘ２－Ｘ）２＋・・・＋（ＸＮ－Ｘ）２－データの「偏差平方和」（平均との差を２乗して合計）を求めて「データの数－１」で割る。－分散の「単位」は、データの持つ「単位」の２乗。

(13)

13

• 観測データを、母集団から抽出した標本（サンプル）

と考えて、統計量の算定を行い、母集団の特性を推測

し、検証する。

Ｘ＝ＮＸ_１＋Ｘ_２＋・・・＋Ｘ_ＮＶａ＝Ｎ－１（Ｘ_１－Ｘ）２_＋（Ｘ２－Ｘ）２＋・・・＋（ＸＮ－Ｘ）２分散（不偏標本分散）平均（例）任意に抽出したＮ人（標本）の身長を計測して、日本人全体（母集団）の身長の平均と分散を推定する。

（参考）推測統計の考え方

(14)

× × × × × × × × × × × × × × × × × × × × × × × 母集団の特性値（真の値）は分からない母集団標本推定平均μ 分散 V 標準偏差σ ＶａＲなど. 標本の特性値平均μ＊ 分散 V＊標準偏差σ＊ＶａＲ＊ _など

(15)

15 ･母集団の「真の分散」を、統計的手法で「推定」するときに N-1で割った「標本分散」を使うのは、以下のような特徴があるため。（一致性）・「標本分散」は、Nが大きくなると、母集団の「真の分散」に限りなく近づく（不偏性）・「標本分散」は、母集団の「真の分散」の偏りのない推定値となることが知られている

Ｎ－１で割った「標本分散」の特徴

(16)

母集団の真の分散Ｖ（誰も知らない）標本分散Ｖ＊_（１）標本分散Ｖ＊_（２）標本分散Ｖ＊_（３）標本分散Ｖ＊_（４）標本分散Ｖ＊_（５）標本分散Ｖ＊_（６）標本分散Ｖ＊_（７）標本分散（Ｖ＊_{）を、標本を変えて繰り返し計算すると、} 真の分散を中心にして偏りなく分布する（不偏性）

(17)

17

講義の中で、VaRを計測する際に使う

分散、標準偏差は、推測統計の立場

から定義したもの（Ｎ－１で割ったもの）

です。

(18)

（３）標準偏差（推測統計の立場で記載）

• 標準偏差は、観測データセットの「バラツキ」を示す指標

の１つ。分散の平方根（ルート）をとって定義する。

－標準偏差の「単位」は、データの持つ「単位」と同じ。

• Ｅｘｃｅｌでは、関数ＳＴＤＥＶＡ（データ範囲）を使って求める。

データ数－１データの偏差平方和 σ ＝＝Ｎ－１（Ｘ_１－Ｘ）２_＋（Ｘ２－Ｘ）２＋・・・＋（ＸＮ－Ｘ）２

(19)

19 －４－２２４－１－２１２平均標準偏差標準偏差標準偏差標準偏差３．１６２１．５８１１．５８１３．１６２０【サンプル①】【サンプル②】０

(20)

東証TOPIX日次変化率の推移 -12 -8 -4 0 4 8 12 日次変化率標準偏差－標準偏差東証TOPIX１０日間変化率の推移 -8 -4 0 4 8 12 10日間変化率標準偏差－標準偏差

(21)

21

• 平均をみると、日次変化率、１０日間変化率とも概ね

ゼロとなっている。

• 分散をみると、１０日間変化率の分散は、日次変化率

の分散の概ね１０倍となっている。

• 標準偏差をみると、１０日間変化率の標準偏差は、

日次変化率の標準偏差の概ね√１０倍（＝3.162倍）

となっている。

日次変化 10日変化データ COUN 250 250 平ＡＶＥＲＡＧ 0.063 0.656 分ＶＡＲ 1.540 14.966 標準偏ＳＴＤＥＶ 1.241 3.869 基本統計 Excel関

(22)

株価・金利・為替等の変化率に関して

① その平均をゼロと仮定したり、

② T日間変化率の標準偏差は、日次変化率

の標準偏差の√T倍と仮定して

(23)

23

（４）パーセント点

• パーセント点とは、観測データを小さい順に並べたときに、

その値よりも小さな値の割合が指定された割合（百分率）

になるデータの値として定義される。

• 例えば、９９パーセント点というのは、その値より小さな

データの割合が９９％となるデータの値のことを指す。

－５０パーセント点のことを中央値（メジアン）と呼ぶ。－２５パーセント点を第１四分位点、７５パーセント点を第３四分位点と呼ぶ。

• Ｅｘｃｅｌでは、関数ＰＥＲＣＥＮＴＩＬＥ（データ範囲,率）を使っ

て求める。

(24)

99％（例） 1000個の損失データが観測されている場合、９９％点というのは、損失額を小さい順に並べて９９０番目になるデータ値のこと。百分位損失額 9 8 5 番目 9 8 .5 % 5 2 9 9 8 6 番目 9 8 .6 % 5 5 8 9 8 7 番目 9 8 .7 % 5 8 9 9 8 8 番目 9 8 .8 % 6 1 8 9 8 9 番目 9 8 .9 % 6 2 1 9 9 0 番目 9 9 .0 % 6 3 2 9 9 1 番目 9 9 .1 % 6 5 4 9 9 2 番目 9 9 .2 % 6 7 1 9 9 3 番目 9 9 .3 % 6 9 8 9 9 4 番目 9 9 .4 % 7 0 3 9 9 5 番目 9 9 .5 % 7 1 2 9 9 6 番目 9 9 .6 % 7 7 6 9 9 7 番目 9 9 .7 % 7 9 4 9 9 8 番目 9 9 .8 % 8 1 0 9 9 9 番目 9 9 .9 % 8 3 1 順位

(25)

25 99パーセント点損失額小大９９％

99％ＶａＲは、文字通り、99パーセント点

のことです。

(26)

（１）散布図

（２）共分散

（３）相関係数

（４）相関行列

(27)

27 ・・・・・・・・・

（１）散布図

 以下のような２変量の関係を調べるためには、散布図を書くのが直感的に理解しやすい。東証ＴＯＰＩＸ 10年割引国債 10日間変化率 10日間変化率（Ｘ）（Ｙ） 200Ｘ/9/29 0.785 -0.098 200Ｘ/9/28 1.194 0.010 200Ｘ/9/27 0.319 0.177 200Ｘ/9/26 -2.994 0.315 200Ｘ/9/25 -3.783 0.688 200Ｘ/9/22 -3.139 0.560 200Ｘ/9/21 -3.894 -0.088 200Ｘ/9/20 -5.040 0.295 200Ｘ/9/19 -3.538 -0.010 200Ｘ/9/15 -2.474 0.098

(28)

-2.500 -2.000 -1.500 -1.000 -0.500 0.000 0.500 1.000 1.500 2.000 2.500 -15.000 -10.000 -5.000 0.000 5.000 10.000 東証ＴＯＰＩＸ国債10日間変化率 Ⅰ Ⅱ Ⅳ Ⅲ  Ⅱ、Ⅳのエリアに分布が多い。  株価変化率がプラス（マイナス）のとき、国債価格変化率はマイナス（プラス）となる傾向がある。

株価変化率と国債価格変化率との関係

(29)

29

（２）共分散（推測統計の立場で記載）

• 共分散は、２つの変量（Ｘ、Ｙ）の間の「直線的な比例

関係の強さ」を示す指標。

－データの「偏差積和」を求めて、「データ数－１」で割る。－共分散の「単位」は、Ｘの持つ「単位」掛けるＹの持つ「単位」。（Ｘ_１－Ｘ）（Ｙ_１－Ｙ）＋（Ｘ_２－Ｘ）（Ｙ_２－Ｙ）＋・・＋（Ｘ_Ｎ－Ｘ）（Ｙ_Ｎ－Ｙ）ＣＯＶ（Ｘ、Ｙ）Ｎ－１データ数－１データの偏差積和＝＝

• Ｅｘｃｅｌでは、関数ＣＯＶＡＲ（データ範囲（Ｘ）、データ範囲

（Ｙ））を使って求める。

（注）Ｅｘｃｅｌでは、データの偏差積和をＮ－１ではなく、Ｎで割って共分散を定義している（記述統計の立場で定義している）ため、別途、調整を行う必要がある。

(30)

偏差積和＝（Ｘ_１－Ｘ）（Ｙ_１－Ｙ）＋（Ｘ_２－Ｘ）（Ｙ_２－Ｙ）＋・・・＋（Ｘ_Ｎ－Ｘ）（Ｙ_Ｎ－Ｙ）（Ｘ_ｉ－Ｘ）（Ｙ_ｉ－Ｙ）＞０（Ｘ_ｉ－Ｘ）（Ｙ_ｉ－Ｙ）＜０（Ｘ_ｉ－Ｘ）（Ｙ_ｉ－Ｙ）＜０（Ｘ_ｉ－Ｘ）（Ｙ_ｉ－Ｙ）＞０Ｙ Ⅰ Ⅱ Ⅳ Ⅲ Ⅰ、Ⅲのエリアに多く分布 ⇒ 偏差積和＞０：正の相関 Ⅱ、Ⅳのエリアに多く分布 ⇒ 偏差積和＜０：負の相関Ｘ_ｉＹ_ｉ

(31)

31

（３）相関係数

• 相関係数は、２つの変量（Ｘ、Ｙ）間の「直線的な比例

関係の強さ」を示す指標。

• 共分散を、２つの標準偏差の積で割って定義する。

－相関係数は－１～＋１までの値をとる。「単位」を持たない無名数。－相関係数の定義には、データ数Nが含まれていない（定義は１通りのみ）。ＣＯＶ（Ｘ、Ｙ）＝ σ（Ｘ） σ（Ｙ） ρ（Ｘ、Ｙ）（Ｘ_１－Ｘ）（Ｙ_１－Ｙ）＋・・・＋（Ｘ_Ｎ－Ｘ）（Ｙ_Ｎ－Ｙ）＝（Ｘ_１－Ｘ）２_{＋・・・＋（Ｘ} Ｎ－Ｘ）２（Ｙ１－Ｙ）２＋・・・＋（ＹＮ－Ｙ）２

• Ｅｘｃｅｌでは、関数ＣＯＲＥＬＬ（データ範囲（Ｘ）、データ範囲

（Ｙ））を使って求める。

(32)

-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3

相関係数と散布図

ρ＝0.7 ρ＝－0.7 ρ＝1.0 （正の完全相関） ρ＝－1.0 （負の完全相関） ρ＝0 （無相関）相関係数の定義 ρｘｙ＝ COV(X,Y）/σｘσｙ

COV（X,Y）： X,Yの共分散＝（1/N-1）*Σ（Xｔ－EX）（Yt－EY） σｘ： Xの標準偏差 EX ： Xの平均値

(33)

33

（４）相関行列と分散共分散行列

・・・・・・・・・・・・・・・ 1 ρ（Ｘ_Ｎ、Ｘ_３） ρ（Ｘ_Ｎ、Ｘ_２） ρ（Ｘ_Ｎ、Ｘ_１）Ｘ_Ｎ ρ（Ｘ_１、Ｘ_２） 1 ρ（Ｘ_３、Ｘ_２） ρ（Ｘ_３、Ｘ_１）Ｘ_３ ρ（Ｘ_２、Ｘ_Ｎ） ρ（Ｘ_２、Ｘ_３） 1 ρ（Ｘ_２、Ｘ_１）Ｘ_２ ρ（Ｘ_１、Ｘ_Ｎ） ρ（Ｘ_１、Ｘ_３） ρ（Ｘ_１、Ｘ_２） 1 Ｘ_１Ｘ_ＮＸ_３Ｘ_２Ｘ_１・・・・・・・・・・・・・・・・・・ ρ（Ｘ_ｉ、Ｘ_ｉ）＝１：同じ変量（Ｘ_ｉｉ）同士の相関は１ ρ（Ｘ_ｉ、Ｘ_ｊ）＝ρ（Ｘ_ｊ、Ｘ_ｉ）：２つの変量（Ｘ_ｉ、Ｘ_ｊ）の順序を変えて計算しても相関係数の値は同じ。

太枠内が相関行列

(34)

太枠内が分散共分散行列

・・・・・・・・・・・・・・・Ｖ_ＸＮＣＯＶ（Ｘ_Ｎ、Ｘ_３）ＣＯＶ（Ｘ_Ｎ、Ｘ_２）ＣＯＶ（Ｘ_Ｎ、Ｘ_１）Ｘ_ＮＣＯＶ（Ｘ_１、Ｘ_２）Ｖ_Ｘ３ＣＯＶ（Ｘ_３、Ｘ_２）ＣＯＶ（Ｘ_３、Ｘ_１）Ｘ_３ＣＯＶ（Ｘ_２、Ｘ_Ｎ）ＣＯＶ（Ｘ_２、Ｘ_３）Ｖ_Ｘ２ＣＯＶ（Ｘ_２、Ｘ_１）Ｘ_２ＣＯＶ（Ｘ_１、Ｘ_Ｎ）ＣＯＶ（Ｘ_１、Ｘ_３）ＣＯＶ（Ｘ_１、Ｘ_２）Ｖ_Ｘ１Ｘ_１Ｘ_ＮＸ_３Ｘ_２Ｘ_１・・・・・・・・・・・・・・・・・・

(35)

35

ＶａＲの計測手法として、分散共分散法

の説明をします。

ＶａＲの計測において、分散共分散行列、

相関行列が重要な働きをします。

(36)

Ⅲ．ＶａＲの計測と検証より

分散共分散法（デルタ法）による計算例② －リスクファクターが２つのケースＶａＲの計算シート分散共分散法（デルタ法）【ポートフォリオ】株式投信 100 億円単独ＶａＲ標準偏差 ×信頼係数 ×感応度 10年割引国債 100 億円株式投信 9.00 ＝ 3.8686 2.33 100 割引国債 1.99 0.8568 2.33 100 保有期間 10日信頼水準 99.00 ％ポートＶａＲ単純合算 10.99 ① 観測データ 250 日相関考慮後 8.35 ② ①＞②：ポートフォリオ効果東証ＴＯＰＩＸ 10年割引国債投信VaR 国債VaR 10日間変化率 10日間変化率 9.00 1.99 1 -0.4233 9.00 投信VaR 2006/9/29 0.785 -0.098 -0.4233 1 1.99 国債VaR 2006/9/28 1.194 0.010 ↓ ↓ 2006/9/27 0.319 0.177 2006/9/26 -2.994 0.315 8.1560 -1.8162 9.00 2006/9/25 -3.783 0.688 1.99 2006/9/22 -3.139 0.560 ↓ 行列計算式 2006/9/21 -3.894 -0.088 VaR2: 69.78 2006/9/20 -5.040 0.295 VaR : 8.35 2006/9/19 -3.538 -0.010 2006/9/15 -2.474 0.098 投信感応度国債感応度 2006/9/14 -2.248 -0.197 100.00 100.00 14.96626 -1.3938 100.00 投信感応度 2006/9/13 -1.822 0.187 -1.3938 0.7364709 100.00 国債感応度 2006/9/12 -1.875 0.403 ↓ ↓ 2006/9/11 -0.235 0.433 2006/9/8 0.007 0.118 1357.2481 -65.7303 100.00 2006/9/7 -0.591 1.179 100.00 2006/9/6 0.155 1.228 ↓ 行列計算式 2006/9/5 0.582 1.051 ポート分散 : 12.92 （単位調整） 2006/9/4 1.534 1.296 ポート標準偏差 : 3.59 相関行列分散共分散行列行列計算式行列計算式

(37)

37

（１）確率変数

（２）確率分布

－確率密度関数、分布関数

（３）様々な確率分布

－一様分布、正規分布、対数正規分布

ポワソン分布、２項分布

（４）確率変数の独立

３．確率変数と確率分布

(38)

（１）確率変数

• 予め定まった確率にしたがって値が変動する数のこと

を「確率変数」という

（例）サイコロを振ったときに出る目の数１／６１／６１／６１／６１／６１／６確率６５４３２１サイコロの目（Ｘ）１／６１２３４５６Ｘ確率 ― 離散的な確率変数

(39)

39 株価、金利、為替等の変化率を、「確率変数」として捉えることも可能。Ｘ確率下落（－）上昇（＋）ＸＸ _Ｘ X_０（現在値） X_‐１ X_‐２ X_‐３Ｘ ― 連続的な確率変数

(40)

• ＶａＲを２５０回計測して、ＶａＲを超える損失が発生する回数 • 事件・事故発生に伴う損失の発生額（１回当たり） • 事件・事故の年間発生件数 • 個別企業の信用状態その他の確率変数

(41)

41

• 確率分布を表わすとき、２種類の関数がある。

① 確率密度関数

確率変数（Ｘ）が「ある値」をとる確率（確率密度）

を表わす関数

② 分布関数（累積確率密度関数）

確率変数（Ｘ）が「ある値

以下

」になる確率を表わ

す関数

（２）確率分布

(42)

0 ₁ 1 ｆ（Ｘ）Ｘ 0 ₁ 1 F（Ｘ）Ｘ_０＝Ｘ確率密度関数分布関数 0.7 Ｆ（Ｘ_０）＝ 0.7 ｆ（Ｘ_０）＝Ｘ_０＝0.7 0.7 （例）数直線上で、０から１までの値をランダムにとる確率変数（X）を考える。面積 0.7×１（確率密度） Xは 0～１の間で無限の値をとる可能性がある Xが 0.7の値をとる確率はゼロ Xが 0.7以下の値をとる確率は 0.7（斜線部の面積）確率は面積で捉える

(43)

43 ｆ（Ｘ）：各地域の広さ（km２_）：人口密度（万人/km２_）（参考）人口と人口密度Ｘ人口は面積で表される：各地域の広さ（km２_）ＸＦ（Ｘ）：人口（万人）

(44)

0％確率密度関数 P％ P％ｆ（Ｘ）Ｘ_０Ｘ _ＸＸ０分布関数 F（Ｘ） 100％斜線部の面積縦軸上の点Ｘ＝Ｘ_０となる確率（確率密度）Ｘ≦Ｘ_０となる確率積分  より一般的に概念図で示すと

(45)

45

一様分布

：ある区間の中の値が同じ確率で生起する分布。

（３）様々な確率分布

0 0.2 0.4 0.6 0.8 1 1.2 ｆ（Ｘ）確率密度関数Ｆ（Ｘ）分布関数ａｂ 0 1 Ｘ _Ｘ • 一様分布にしたがう乱数（一様乱数）は、Ｅｘｃｅｌ関数ＲＡＮＤ（）を使って生成することができる。１/（b－ａ）

(46)

0 0.2 0.4 0.6 0.8 1

正規分布

：左右対称の釣鐘型をした確率分布。平均（μ）、標準偏差（σ）を与えると分布の形状が決まる。 ⇒ N（μ,σ2_{）と表す。} • 平均（μ）＝０、標準偏差（σ）＝１の正規分布を標準正規分布と言い、N（０,１）と表す。Ｘ _Ｘ μ μ ｆ（Ｘ）確率密度関数Ｆ（Ｘ）分布関数 σ＝１ σ＝0.5 σ＝２ σ＝0.5 σ＝１ σ＝２ＥＸＣＥＬ関数ＮＯＲＭＤＩＳＴ（Ｘ，μ，σ，関数形式）

(47)

47

確率変数Ｘが標準正規分布にしたがうとき

確率変数 σＸ＋μ は正規分布にしたがう。

ｆ（Ｘ）確率密度関数Ｘ～ N（0,１） σＸ+μ ～ N（μ, σ2_） σＸ～ N（0, σ2_） 0 _μ Ｘ

(48)

確率変数Ｘが正規分布にしたがうとき

確率変数 Δ

×

Ｘ＋定数項は正規分布にしたがう。

ｆ（Ｘ）確率密度関数Ｘ～ N（μ, σ2_） Δ×Ｘ + 定数項～ N（Δ×μ+定数項 , （Δσ）2） μ _Δ_×_μ+定数項Ｘ標準偏差がΔ倍になる

(49)

49 ・平均からどれだけ離れているか（標準偏差の何倍か）という情報から、Ｘ以下の値をとる確率が分かる。・例えば、XがN（0，σ2 _{）の正規分布にしたがって生起するとき} X ≦ σとなる確率は 84.1％ X ≦ 2σとなる確率は 97.7％ X ≦ 2.33σとなる確率は 99.0％ X ≦ 3σとなる確率は 99.9％となることが知られている。・このとき、σの前に付いている係数を「信頼係数」という。・正規分布は、Xが「信頼係数」×σ以下となる確率が分かる便利な確率分布の１つ。

正規分布の特徴

2.33σ 2σ σ X 99％ 99％点

(50)

株価、金利、為替等の変化率は、正規分布にしたがうと想定されることが多い。（注）裾野部分の分布が厚くなることをいう。東証TOPIX日次変化率の分布 0 5 10 15 20 25 30 35 40 45 50 実分布正規分布ファット・テール－しかし、実際の分布をみると、正規分布と比較して、歪み、偏りやファット・テールが観察されることも少なくない。（注）

(51)

51 0 0.02 0.04 0.06 0.08 0.1 0 0.2 0.4 0.6 0.8 1

対数正規分布

：Ｘ _Ｘｆ（Ｘ）確率密度関数 _{Ｆ（Ｘ）分布関数} 変数Xの対数値（logX）が正規分布にしたがうとき、変数Xは対数正規分布にしたがう、と言う。ｌｏｇＸの平均（μ）、ｌｏｇＸの標準偏差（σ）を与えると分布の形状が決まる。左右非対象、片側に裾野が長いファットテールな分布。ｌｏｇＸの平均 = 0 ｌｏｇＸの標準偏差 = １ｌｏｇＸの平均 = 0 ｌｏｇＸの標準偏差 = １ＥＸＣＥＬ関数ＬＯＧＮＯＲＭＤＩＳＴ（Ｘ，μ,σ）

(52)

0 0.05 0.1 0.15 0.2 0.25 0.3 0 0.2 0.4 0.6 0.8 1 1.2

ポワソン分布

：Ｋ _Ｋｆ（Ｋ）確率密度関数Ｆ（Ｋ）分布関数所与の領域、あるいは、所与の時間内において、０回、１回、２回、３回・・・と発生する事象が、ちょうどＫ回発生する確率を示す。平均発生回数（λ回）を与えると分布の形状が決まる。 平均発生回数λ＝2回 _{平均発生回数λ＝2回} ＥＸＣＥＬ関数ＰＯＩＳＳＯＮ（Ｋ，λ，関数形式）

(53)

53 講義（Ⅲ．）の中で、市場ＶａＲを計測（分散共分散法）するとき正規分布を利用する例をあげます。信用ＶａＲを計測（モンテカルロ・シミュレーション法）するとき、正規分布を利用する例をあげます。オペリスクＶａＲを計測（モンテカルロ・シミュレーション法）するとき、対数正規分布とポワソン分布を利用する例をあげます。 ― 実務的には、フィットのよい別の確率分布を利用することもあります。

(54)

２項分布

：（例）サイコロを10回振って１の目が出る回数（Ｋ） 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 ｆ（Ｋ）確率密度関数Ｆ（Ｋ）分布関数 0 2 4 6 8 10 Ｋ 0 2 4 6 8 10 Ｋ N=10,ｐ=１/6 N=10,ｐ=１/6 １の目が出る回数１の目が出る回数結果が２通りある試行（実験）をＮ回繰り返したとき、片方の結果が起こる回数（Ｋ）の確率分布。試行回数（Ｎ回）と、片方の結果が起きる確率（ｐ）を与えると分布の形状が決まる。

(55)

55 ２項分布（Exｃel関数）＝ _ＮＣ_ＫｐＫ（１－ｐ）Ｎ－ＫＮ回の試行の中からある事象が起きるＫ回の試行を取り出す組み合わせある事象が起きる確率はｐ。Ｎ回の試行のうち、Ｋ回はある事象が起きる。ある事象が起きない確率は１－ｐ。Ｎ回の試行のうち、Ｎ－Ｋ回はある事象は起きない。ＮＣＫ＝Ｎ×（Ｎ－１）×・・・×（Ｎ－Ｋ＋１）Ｋ×（Ｋ－１）×・・・×２×１（例）サイコロを１０回振ったときに２回、１の目が出る確率＝ ₁₀Ｃ_２（1/6）2 _（5/6）10－2 _＝ 10×9 2×1 ×（1/6） 2 _（5/6）8 BINOMDIST(Ｋ，Ｎ，ｐ，false) BINOMDIST(2，10，1/6，false)

(56)

講義の中で、

ＶａＲ計測モデルのバックテストを行なうとき、2項分布を利用します。

(57)

57 

確率変数Ｘ

_１

、X

_２

が互いに影響されず、

それぞれの確率分布にしたがって値をとるとき、

確率変数Ｘ

_１

、X

_２

は、互いに「独立」であると

いう。

（４）確率変数の独立

【定義】

(58)

• ２回続けて１の目が出ても、３回目の結果には影響を及ぼさない。 • ３回目は、いずれの目が出る確率も１／６。

（例）サイコロを振ったときに出る目の数

１／６１／６１／６１／６１／６１／６確率６５４３２１サイコロの目（Ｘ_３）３回目：Ｘ_３＝？１回目：Ｘ_１＝１、２回目：Ｘ_２＝１

(59)

59

株価、金利、為替等の変化について

確率変数 X の推移と、その確率分布現在将来 X_０ｔ_０ＸＸＸＸ過去ＸｔＸｓ？

互いに独立かつ同一の確率分布にしたがって

変動している、と考えられることが多い。

⇒ ｉ.ｉ.ｄ.の想定

(60)

【独立の定義】  確率変数Ｘ_ｔ、X_ｓの確率関数に関して、以下の式が成り立つとき、確率変数Ｘ_ｔ、X_ｓは互いに「独立」と言うＰ（Ｘ_ｔ＝ａ、X_ｓ＝ｂ）＝Ｐ（Ｘ_ｔ＝ａ）Ｐ（ X_ｓ＝ｂ）【i．ｉ．ｄ．の定義】  確率変数Ｘ_ｔ、X_ｓについて、以下の２つの条件を満たすとき、確率変数Ｘ_ｔ、X_ｓは互いに「 i．ｉ．ｄ．」（注）であると言う。（注）ｉｎｄｅｐｅｎｄｅｎｔｌｙａｎｄｉｄｅｎｔｉｃａｌｌｙｄｉｓｔｒｉｂｕｔｅｄ ①確率変数Ｘ_ｔ、X_ｓは互いに独立である。 ②確率変数Ｘ、X は同一の確率分布にしたがう。

(61)

61  確率変数Ｘ_１、X_２が互いに「独立」のとき、以下のことが成り立つ。 ① 確立変数Ｘ₁X₂ の期待値は、それぞれの確率変数の期待値の積になる。Ｅ（Ｘ₁X₂）＝Ｅ（Ｘ₁）Ｅ（X₂） ② 確率変数Ｘ_１＋X_２の分散は、それぞれの確率変数の分散の和に等しい。Ｖ（Ｘ₁＋X₂）＝Ｖ（Ｘ₁）＋Ｖ（ X₂） ③ 確率変数Ｘ₁ と X₂ は無相関である。 ρ（Ｘ₁、X₂）＝０【定理】（証明省略）

(62)

【ルートT倍ルール】日次ベースの対数変化率ｏｒ変化幅をＸ_１、Ｘ_２、Ｘ_３、・・・、Ｘ_Ｔとすると、Ｔ日間の対数変化率 or 変化幅はＸ_１＋Ｘ_２＋Ｘ_３＋・・・＋Ｘ_Ｔと表される。各期のリスクファクター(Ｘ_１,Ｘ_２,Ｘ_３,・・・Ｘ_Ｔ)が、互いに独立かつ同一の確率分布にしたがうと想定する。 _{【i.i.dの定義】} 日次ベースの対数変化率ｏｒ変化幅Ｘ_１、Ｘ_２、Ｘ_３、・・・、Ｘ_Ｔの分散を σ２標準偏差を σ とすると、Ｔ日間の対数変化率 or 変化幅Ｘ_１＋Ｘ_２＋Ｘ_３＋・・・＋Ｘ_Ｔの分散はＴ×σ２標準偏差は √Ｔ ×σとなる。

(63)

63 （参考）対数変化率の定義

≒

＝

－1

Ｘ_ｔ－Ｘ_t-1 Ｘ_ｔＸ_t-1 Ｘ_t-1

＝

－1

Ｘ_ｔ－Ｘ_t-10 Ｘ_ｔＸ_t-10 Ｘ_t-10

ｌｏｇ

Ｘｔ日次対数変化率Ｘ_t-1

ｌｏｇ

Ｘｔ 10日間対数変化率Ｘ_t-10  対数変化率は、通常の変化率と近似的に等しいことが知られている。  ｌｏｇ（自然対数）は、Ｅｘｃｅｌでは関数ＬＮ（・）で与えられる。

(64)

対数変化率の特徴

 対数変化率は、同率の低下、上昇により、元の値に戻る。  10日間対数変化率は、日次対数変化率（10日分）の和となる。変化率(日次）対数変化率（日次）対数変化率（日次） 100 0.0101 0.0101 _X10 100 0.2877 99 -0.0100 -0.0101 _X9 75 -0.4700 100 0.0526 0.0513 _X8 120 1.3863 95 -0.0500 -0.0513 _X7 30 -0.6931 100 0.1111 0.1054 _X6 60 -0.9163 90 -0.1000 -0.1054 _X5 150 0.5108 100 0.2500 0.2231 _X4 90 1.0986 80 -0.2000 -0.2231 _X3 30 -0.6931 100 0.4286 0.3567 _X2 60 -0.2877 70 -0.3000 -0.3567 _X1 80 -0.1178 100 0.6667 0.5108 X0 90 ― 60 -0.4000 -0.5108 0.1054 100 1.0000 0.6931 50 -0.5000 -0.6931 対数変化率（10日間） Σlog(X_t/X_t-1)

(65)

65 東証TOPIX日次変化率の推移 -12 -8 -4 0 4 8 12 日次変化率標準偏差－標準偏差東証TOPIX１０日間変化率の推移 -12 -8 -4 0 4 8 12 10日間変化率標準偏差－標準偏差

(66)

-15 -10 -5 0 5 10 -15 -10 -5 0 5 10 -4 -3 -2 -1 0 1 2 3 4 -4 -3 -2 -1 0 1 2 3 4  下図は、過去1年間のデータをもとに、東証ＴＯＰＩＸ・変化率と、１期前の変化率との相関関係（自己相関）をみたもの。当期１期前当期１期前相関係数ρ＝0.037 相関係数ρ＝0.905 東証TOPIX・日次変化率東証TOPIX・10日間変化率－日次変化率の自己相関は弱いが、10日間変化率の自己相関は強いことが観察される。－統計的に厳密に検証すると、多くの時系列データが（日次変化率でみても10日間変化率でみても）独立とは言えない

(67)

67 日次 10日間対数変化率対数変化率データ数 COUNT 250 250 平均ＡＶＥＲＡＧＥ 0.063 0.656 分散ＶＡＲＡ 1.540 14.966 標準偏差ＳＴＤＥＶＡ 1.241 3.869 基本統計量 Excel関数  分散をみると、１０日間対数変化率の分散は、日次対数変化率の分散の概ね１０倍となっている。  標準偏差をみると、１０日間対数変化率の標準偏差は、日次対数変化率の標準偏差の概ね√１０倍（＝3.162 倍）となっている。

(68)

ルートＴ倍ルール

10日間対数変化率 X_１＋Ｘ_２＋・・・＋Ｘ_T の確率分布日次対数変化率 Xの確率分布 σ －σ √Ｔ×σ －√Ｔ×σ 仮定

(69)

69

ルートＴ倍ルール

仮定リスクファクターの確率分布はｉ．ｉ．ｄ．ＸＸＸＸ？日次対数変化率日次対数変化率日次対数変化率日次対数変化率Ｔ日間対数変化率 σ －σ √Ｔ×σ －√Ｔ×σ

(70)

（１）推定

（２）検定

(71)

71 × × × × × × × × × × × × × × × × × × × × × × × 母集団確率密度関数  母集団の確率分布、特性値は、誰にも分からない。  標本の特性値から母集団の特性値を統計的に推測する。母集団標本（実現値）特性値平均μ 標準偏差σ 分散ＶＶａＲなど. 特性値平均μ＊標準偏差σ＊分散Ｖ＊ＶａＲ＊ _など

（１）推定

推定

(72)

×

• 一定の確率分布を前提にして推定した値について、

その値をとる確率が十分に低いとき、

「偶然、珍しいことが起きた」と考えるのではなく、

「推定の際に置いた前提が誤っていた」

と結論付ける。

（２）検定

真の確率分布推定の際に前提とした確率分布 ① 実現する確率が十分に低い ② 推定の前提（確率分布）が誤っていたと結論付ける。実現値

(73)

73 （設問）１の目がでやすいサイコロがあります。サイコロを割ったり、Ｘ線透視などをせず、サイコロを振るだけで、このサイコロが「イカサマ」かどうかを決めたいと思います。あなたは、このサイコロを６００回振って、何回、１の目が出たら、「イカサマ」だと判断しますか？１２０回で「イカサマ」だと判断しますか？１５０回で「イカサマ」だと判断しますか？２００回で「イカサマ」だと判断しますか？３００回で「イカサマ」だと判断しますか？４００回で「イカサマ」だと判断しますか？

(74)

 このサイコロを振ったとき、１の目が出る確率は 1/6 である。  このサイコロを600回振ったとき、１の目が？回以上発生した。  このサイコロを振ったとき、１の目が出る確率が 1/6 だとすると、６００回のうち？回以上、１の目が出る確率は十分に低い（例えば0.1％未満）ことが分かる。

（例）１の目がでやすい「イカサマ・サイコロ」の

見付け方

 このサイコロを振ったとき、１の目が出る確率は 1/6 とは言えない。

(75)

75

２項分布

_Ｎ

C

_K

p

K

_(1-p)

Ｎ-K

Ｎ回の観測で、Ｋ回、1の目が出る確率

Ｎ＝６００回ｐ＝1/6 １－ｐ＝5/6 K回確率確率 K回以上 0 0.000% 100.000% 0回以上 100 4.264% 60.278% 100回以上 110 2.904% 20.634% 110回以上 120 0.652% 3.051% 120回以上 130 0.052% 0.184% 130回以上 140 0.002% 0.004% 140回以上 150 0.000% 0.000% 150回以上 160 0.000% 0.000% 160回以上 170 0.000% 0.000% 170回以上 180 0.000% 0.000% 180回以上 190 0.000% 0.000% 190回以上 200 0.000% 0.000% 200回以上 300 0.000% 0.000% 300回以上 400 0.000% 0.000% 400回以上 500 0.000% 0.000% 500回以上 600 0.000% 0.000% 600回以上

(76)

①「帰無仮説」を立てる。 ② 「帰無仮説」が「真」（true）であるという仮定の下に「検定統計量」を決定する。 ― ただし「検定統計量の確率分布は既知とする。 ③試行や標本（サンプル）の抽出により、「検定統計量」を計算する。 ④「検定統計量」の実現値（計算値）がどの程度の確率でおき得ることかを確認する。 ⑤ 「検定統計量」の実現値（計算値）が十分に低い確率（「有意水準」以下）でしか置きえないとき、「帰無仮説」を棄却する。

検定の一般的手続き

(77)

77  「検定」では、次の2通りの「過誤」（エラー）が起きる可能性がある。

第１種の過誤（エラー）

本当は帰無仮説が正しいのに、

検定の結果、

帰無仮説が誤っていると結論付けてしまう。

第２種の過誤（エラー）

本当は帰無仮説が正しくないのに、

検定の結果、

帰無仮説が正しいと結論付けてしまう。

２種類の過誤

 したがって、バックテストの結果も「過誤」（エラー）を伴っている可能性がある点、注意を要する。

(78)

実現値真の確率分布推定に利用した確率分布＝真の確率分布推定に利用した確率分布＝第１種の過誤第２種の過誤

Microsoft PowerPoint - Ⅱ(リスク計量化入門）.ppt

Ⅱ．統計・確率の基礎知識

目

次

１．基本統計量（1変量）

２．基本統計量（２変量）

３．確率変数と確率分布

４．推定と検定

１．基本統計量（１変量）

（１） 平

均

（２） 分

散

（３） 標準偏差

（４） パーセント点

（１） 平 均

• 平均は、観測データセットの「中心の位置」を示す指標の

１つ。

• Ｅｘｃｅｌでは、関数ＡＶＥＲＡＧＥ（データ範囲）を使って求

める。

（２‐ⅰ） 分 散（記述統計の立場で定義）

• 分散は、観測データセットの「バラツキ」を示す指標の１つ。

• Ｅｘｃｅｌでは、関数ＶＡＲＰ（データ範囲）を使って求める。

記述統計： 中学・高校で学習する平均と分散

（参考）記述統計の考え方

（２‐ⅱ） 分散（推測統計の立場で定義）

• 分散は、観測データセットの「バラツキ」を示す指標の１つ。

• Ｅｘｃｅｌでは、関数ＶＡＲＡ（データ範囲）を使って求める。

• 観測データを、母集団から抽出した標本（サンプル）

と考えて、統計量の算定を行い、母集団の特性を推測

し、検証する。

（参考）推測統計の考え方

Ｎ－１で割った「標本分散」の特徴

講義の中で、VaRを計測する際に使う

分散、標準偏差は、推測統計の立場

から定義したもの（Ｎ－１ で割ったもの）

です。

（３） 標準偏差（推測統計の立場で記載）

• 標準偏差は、観測データセットの「バラツキ」を示す指標

の１つ。分散の平方根（ルート）をとって定義する。

• Ｅｘｃｅｌでは、関数ＳＴＤＥＶＡ（データ範囲）を使って求める。

• 平均をみると、日次変化率、１０日間変化率とも概ね

ゼロとなっている。

• 分散をみると、１０日間変化率の分散は、日次変化率

の 分散の概ね１０倍となっている。

• 標準偏差をみると、 １０日間変化率の標準偏差は、

日次変化率の標準偏差の概ね√１０倍（＝3.162倍）

となっている。

株価・金利・為替等の変化率に関して

① その平均をゼロと仮定したり、

② T日間変化率の標準偏差は、日次変化率

の標準偏差の√T倍と仮定して

（４）パーセント点

• パーセント点とは、観測データを小さい順に並べたときに、

その値よりも小さな値の割合が指定された割合（百分率）

になるデータの値として定義される。

• 例えば、９９パーセント点というのは、その値より小さな

データの割合が９９％となるデータの値のことを指す。

• Ｅｘｃｅｌでは、関数ＰＥＲＣＥＮＴＩＬＥ（データ範囲,率）を使っ

て求める。

99％ＶａＲは、文字通り、99パーセント点

のことです。

（１）散布図

（２）共分散

（３）相関係数

（４）相関行列

（１） 散布図

株価変化率と国債価格変化率との関係

（２）共分散（推測統計の立場で記載）

• 共分散は、２つの変量（Ｘ、Ｙ）の間の「直線的な比例

関係の強さ」を示す指標。

• Ｅｘｃｅｌでは、関数ＣＯＶＡＲ（データ範囲（Ｘ）、データ範囲

（Ｙ））を使って求める。

（３）相関係数

• 相関係数は、２つの変量（Ｘ、Ｙ）間の「直線的な比例

関係の強さ」を示す指標。

• 共分散を、２つの標準偏差の積で割って定義する。

• Ｅｘｃｅｌでは、関数ＣＯＲＥＬＬ（データ範囲（Ｘ）、データ範囲

（Ｙ））を使って求める。

相関係数と散布図

（１）平

（２）分

（３）標準偏差

（４）パーセント点

（１）平均

（２‐ⅰ）分散（記述統計の立場で定義）

記述統計：中学・高校で学習する平均と分散

（２‐ⅱ）分散（推測統計の立場で定義）

から定義したもの（Ｎ－１で割ったもの）

（３）標準偏差（推測統計の立場で記載）

の分散の概ね１０倍となっている。

• 標準偏差をみると、１０日間変化率の標準偏差は、

（１）散布図

－確率密度関数、分布関数

－一様分布、正規分布、対数正規分布

確率変数（Ｘ）が「ある値」をとる確率（確率密度）

確率変数（Ｘ）が「ある値

」になる確率を表わ

確率変数Ｘが標準正規分布にしたがうとき

確率変数 σＸ＋μ は正規分布にしたがう。

確率変数Ｘが正規分布にしたがうとき

Ｘ＋定数項は正規分布にしたがう。

確率変数Ｘ

確率変数Ｘ

（１）推定

（２）検定

（１）推定