• 検索結果がありません。

リスクとは何か?

N/A
N/A
Protected

Academic year: 2022

シェア "リスクとは何か?"

Copied!
42
0
0

読み込み中.... (全文を見る)

全文

(1)

イノベーションマネジメント研究科 イノベーションマネジメント研究科

技術経営専攻 技術経営専攻

金融リスク・マネジメント 金融リスク・マネジメント

第3講:市場リスク(1)

東京工業大学イノベーションマネジメント研究科 中川 秀敏

E-mail: [email protected]

Office Hour : 17:00-18:30, every Tuesday, at W9-105  

※講義資料は、講義前日の午後5時までにはアップするので事前に

   http://www.craft.titech.ac.jp/~nakagawa/dir2/lecture.html#TIT2005_1 から各自でダウンロードして用意すること。

(2)

2

Agenda

• 今回の問題について

• 復習:統計学の基礎

– 平均・分散(標準偏差)・中央値 – ヒストグラム

– 推定と検定のお話(詳しくは扱わない)

• データの扱いに関する注意

• Value at Risk

(3)

3

今回の問題 (前回の続き)

• TOPIX (東証株価指数)の「リスク」を過去の

日次データを用いて計測する。

• リスク指標の例

– リターンが正規分布に従うと仮定したときの年次ボラティ リティは?

– 10日後に95%の確率で起こりうる最大損失額は?

(4)

4

前回の内容を受けて・・・

• TOPIX の日次リターンを確率変数で表す。

• その際に日次リターンが「正規分布」に従うと仮 定する。

– 実際のデータは、正規分布に従わない(厳密には正 規性の検定で棄却される)ことが多い

• このとき、「平均」と「分散( or 標準偏差)」という2 つのパラメータを決める必要がある。

• 実際の日次データから「平均」と「標準偏差」を求 める方法を考える。

– この2つが分かれば Value at Risk も計算可能。

(5)

5

リターンの計算についての補足

• 日次リターンを計算する際に前日との価格比の 対数を取る場合もある

N日分の日次対数リターンの和は、N日対数リターンに一致する が、ポートフォリオの対数リターンは各資産の対数リターンの加 重和に一致しない。

• 個別の株式の場合は権利落ちや株式分割等の 影響を考慮して、修正した株価を利用するのが 一般的

終値 前日の

日次対数リターン 終値

TOPIX TOPIX

= log

(6)

6

統計学の基礎

• 平均・分散(標準偏差)・中央値

• ヒストグラム

• 推定と検定のお話

(7)

7

統計学の基礎

• 統計学は観測データ(確率変数の標本)が あることを前提とした話

• 以下、 N 日分の TOPIX 日次リターンの観測

データ  

 が与えられているとして話を進める。

x N

x

x 1 , 2 , L ,

(8)

8

平均・分散(標準偏差)・中央値

• 平均とは次の計算式で与えられるもの

• 平均はデータ集合の特性を表す有効な量 であるが、分布の形状が対称型でないとき は注意が必要。

=

=

N

i

x

i

x N

1

1

EXCELAVERAGE関数

(9)

9

平均・分散(標準偏差)・中央値

• 詳しいことをいうと先の平均は「標本平均」

と呼ばれるもの

• データの元になる確率変数の真の平均は

「母平均」と呼ばれる

• 本当に知りたいのは「母平均」であり、「標

本平均」はあくまでも「母平均」の推定値で

ある。

(10)

10

平均・分散(標準偏差)・中央値

• 分散とは次の計算式で与えられるもの・・・

• 各データ値と平均とのずれを2乗したものをデー タ集合全体で平均化したもの

• 標準偏差は分散の正の平方根

=

− −

=

N

i

i

x

N

1

x

2

2

( )

1 ˆ 1

σ

σ ˆ

EXCEL関数 VAR

EXCEL関数 STDEV

(11)

11

平均・分散(標準偏差)・中央値

• 詳しいことをいうと先の分散は「標本分散」

と呼ばれるもの

(さらに詳しく言うと「不偏標本分散」というもの)

• データの元になる確率変数の真の分散は

「母分散」と呼ばれる

• 本当に知りたいのは「母分散」であり、「標

本分散」はあくまでも「母分散」の推定値で

ある。

(12)

12

• 中央値とは文字通り、データを昇順に並べたとき の中央に位置する値

• 中央値は分布の形状によらずに、データ集合の 特性を表す量と考えられる。

• 他にも、第1四分意点( 25% 点)、第3四分意点

( 75% 点)や、あるいは一般的に「○○%点」のよ うなものを考えることもある。

EXCEL関数 MEDIAN

EXCEL関数

QUARTILE, PERCENTILE

平均・分散(標準偏差)・中央値

(13)

13

平均・分散(標準偏差)・中央値

• (平均)絶対偏差

• 元々、各データ値と平均の差の絶対値を「偏差」と呼ぶ。

従って、上の絶対偏差がデータ集合のばらつき度合いを 表すものとして直感にあう。

• 理論的な計算の都合や正規分布との相性の良さもあり、

標準偏差の方が研究されてきたという経緯もある。

EXCEL関数 AVEDEV

=

N

i

i

x

N x

1

|

1 |

(14)

14

ヒストグラム

• 平均や分散だけでは、データ集合の様子 を正しくとらえられない場合もある

• 度数分布表やヒストグラムを作成してデー タ集合全体の散らばり具合を把握すること は有効

※TOPIXの日次リターンのヒストグラムは?

(15)

15

ヒストグラム

☆ 同じ平均・分散をもつデータについての注意

ヒストグラム(平均 0,分散 2.08)

0 1 2 3 4 5 6

-2 -1 0 1 2

ヒストグラム(平均 0,分散 2.08)

0 2 4 6 8 10 12 14 16

-1.1547 0 1.732049

(16)

16

推定と検定のお話

• あるデータ集合を何かしらの確率変数 X の 標本値の集合と見なし、その確率分布を 考えることは自然な考え方

• かしこまった言い方をすると、上のような考

え方は観測している対象の「モデル」を与

えることを意味する

(17)

17

推定と検定のお話

• ただし、確率分布を最初から完全に特定すること はできず、一般にはある未知数を含んだ形で

「○○分布」ということだけ仮定する。

– 例えば、あるデータ集合が「正規分布」に従うと仮定で きても、「平均」と「標準偏差」を与えないと完全に特定 されたことにならず、一般にこの2つを最初は未知数 と考える

– このような未知数のことを「パラメータ」や「母数」と呼 ぶ

• 最終的にはパラメータを与える必要がある

(18)

18

推定と検定のお話

• 推定とは、データ集合から適当な方法を用いて、

モデルとなる確率分布のパラメータの値を決める こと

• 推定には「誤差」がつきものであることに注意

– パラメータの推定値≠パラメータの真の値 – 区間推定という考え方

• 推定する方法はいくつかあり、問題に応じて使い 分けられたりする。

– 最尤法、最小2乗法、モーメント法など

(19)

19

推定と検定のお話

• 例:視聴率調査

– ある番組の視聴率を調査したい。視聴率 p が ここでのパラメータとなる。

– 400 世帯をサンプルとして、 28 世帯がその番組

を視聴したことがわかった。

– p の最も自然な推定値は

% 7 07

. 400 0

ˆ = 28 = =

p

(20)

20

推定と検定のお話

• 例:視聴率調査(つづき)

– 一方で日本全体には数千万(?)の世帯があ り、7%という視聴率がどの程度確からしいか問 題になる。

– 実は真の視聴率は95%の確率で、

4.5%〜9.5% の区間に含まれていることが計算 で求められる。

(区間推定の結果は、このように確率(信頼水

準とよばれる)の設定の仕方で変わる)

(21)

21

推定と検定のお話

• 信頼水準95%における平均の信頼区間

n x s

n

x − 1 . 96 s < µ < + 1 . 96

標準誤差

) 975 .

0 ( 96

. 1

: , :

: ,

NORMSINV

=

標本標準偏差 標本平均

データ数(十分多い)

:母平均

s x

µ

n

(22)

22

推定と検定のお話

• 先の視聴率調査の場合

400

) 07 . 0 1 ( 07 . 96 0

. 1 07 . 0 400

) 07 . 0 1 ( 07 . 96 0

. 1 07 .

0

+

<

<

p

095 .

0 045

.

0 < p <

(23)

23

推定と検定のお話

• また、観測対象について、何らかの仮説を立て それをデータを用いて肯定的に主張したいと考 えることも一般的である

– 株価リターンは正規分布に従う

– 自己資本比率が低い企業は倒産しやすい、などなど

• しかし、データを用いて、このような仮説が100%

成り立つと断定することは難しい。

• そこで何らかのルールに従って、仮説が妥当か

どうかを調べる方法論が必要になる

(24)

24

推定と検定のお話

• 検定とは、仮説が正しいかどうかをデータを用い て判定すること

– 自分が主張する仮説を否定する「帰無仮説」を考える。

自分が主張したい仮説は「対立仮説」とする。

– 帰無仮説のもとで計算したある統計量が観測される 確率が非常に小さいとき(実際は有意水準と呼ばれる 確率の基準を与えて、それと比較する)、帰無仮説は

「棄却」されると言う。

(25)

25

推定と検定のお話

• 「帰無仮説」はそもそも棄却したい仮説であり、め でたく「帰無仮説」が検定によって棄却されると、

その「対立仮説」すなわち自分が主張したかった 仮説が採択されるという理屈になる。

– その意味で検定の問題の設定は難しい – 2種類の誤りに注意

第1種の過誤:「帰無仮説が正しい」にもかかわらず、「正しく ない」としてしまう誤り

第2種の過誤:「帰無仮説が正しくない」にもかかわらず、「正 しい」としてしまう誤り

(26)

26

推定と検定のお話

• 例:再び視聴率調査

– ある番組の視聴者年齢層を調査した。

– 20代と50代それぞれ400人について調査したところ、

20代でその番組を見たのが40人で、50代では28人で あった。

– それぞれの年齢層での視聴率を単純に推定すると、

20代が10%で、50代が7%となる。

– この結果だけで、この番組は50代よりも20代に人気が ある(より多く視聴されている)と言えるだろうか?

(27)

27

推定と検定のお話

• 例:再び視聴率調査(つづき)

– そこで次のような統計的検定を行う

帰無仮説:20代と50代での当該番組の視聴率は同じ

対立仮説:20代の方が50代よりも当該番組の視聴率は高い

– 検定のための統計量を計算してみると、帰無仮説の もとでそのような統計量が観測される確率(p値と呼ば れる)は6.4%となり、5%の有意水準では帰無仮説は 棄却されない→この番組が20代の方に人気が高いこ とは言えない

– もし、50代の視聴者が24人(視聴率の推定値6%)だと、

p値は1.9%となり、帰無仮説は棄却される。

(28)

28

推定と検定のお話

• 2群の比率の片側検定(例:視聴率調査)

– 仮説の設定

– 検定統計量

(対立仮説)

(帰無仮説)

代の視聴率 代の視聴率

50 20

1

50 20

0

50 20

: :

50 : ,

20 :

p p

H

p p

H

p p

>

=





+

=

50 20

50 20

1 ) 1

1

( p n n

p

p t p

代サンプル数 代サンプル数

代合わせた視聴率 代と

50 :

20 :

50 20

:

50 20

n n p

(29)

29

推定と検定のお話

• 2群の比率の片側検定(例:視聴率調査)

– p値の算出

– 例の場合

) (

1 検定統計量の絶対値

NORMSDIST p =

05 . 0 064 . 0 ) 521 . 1 ( 1

521 . 1 400

1 400

) 1 085 . 0 1 ( 085 . 0

07 . 0 10 . 0

>

=

=

=

+

=

NORMSDIST p

t

帰無仮説を棄却できない

(30)

30

データの扱いに関する際の注意

• 何日分の過去データを用いて推定するか によって推定値は変わる。

• 月次や年次のパラメータを推定するときに、

直接月次リターンや年次リターンのデータ を用いると、データ数が少なくなる。

• 過去データから推定される「平均リターン」

は将来に対してあまり当てにならない。

(31)

31

データの扱いに関する際の注意

• 観測データに重み付けをする方法

現時点に近いデータほど重要と考えて、過去に遡るにつれてデー タのウェイトを小さくする方法

指数加重移動平均法(λが小さいほど過去の影響を小さくとらえ る)

2 0

2

1 0

0

1

ˆ) 1 (

ˆ

0 ,

1 ˆ ,

, , ,

µ σ

µ

=

+

=

=

+

=

>

>

=

=

N

i

i t i

i i

N

i

i N

i

i t i

N t t

t

x N w

N

w w

w x

w

x x

x t

に対して、

という過去データ として、

現時点を L

) 1 0

( ) 1

( < <

= λi λ λ

wi

(32)

32

データの扱いに関する際の注意

• 保有期間の変換

– Box-Car法:N日収益率の計算に重複しないN日分のデータを利 用する

– Moving-Window法: N日収益率の計算に重複を許してN日分の データを利用する

ルートt倍法: N日収益率のボラティリティを日次ボラティリティの    倍として計算するN

・・・

・・・

(33)

33

データの扱いに関する際の注意

• ルートt倍法で仮に年次ボラティリティを計算する場合は、

年間の取引営業日数が約250日なので、次のように変換 することになる。(252 とか別の数字を使うこともある)

年次リターンの場合は、Box-Car 法やMoving-Window法を直接 使うことは困難。

• データ数が十分でない場合には、ブートストラップ法とい うランダム・サンプリングなどを利用することがある。

× 250

=

daily

annual

σ

σ

(34)

34

データの扱いに関する際の注意

• 平均リターン(期待収益率)は過去データから推 定するのではなく、別のモデルを作って当てはめ ることも多い。

– 例えば、過去のTOPIXリターンとマクロ変数(金利や 為替レート、物価指数など)との関係を分析し、回帰 分析モデルで予測する

K TOPIX

K マクロ変数 マクロ変数 マクロ変数 のリターン

× +

× +

× +

=

β β β β

L

2 1

2 1 0

(35)

35

データの扱いに関する際の注意

• ボラティリティもARCHやGARCHといった時系列モデル を用いて推定する場合もある。

=

=

=

+ +

=

+

= +

=

q

i

i t i p

i

i t i t

p

i

i t i t

t t

t t

t t

b a

a p,q

a a

p

N x

1

2 1

2 2

1

2 2

2) ,

, 0 ( ,

: ,

σ ε

σ

ε σ

σ ε

µ ε

µ

) GARCH(

) ARCH(

:誤差項

〜 期待リターン

ARCH: AutoRegressive Conditional Heteroskedasticity GARCH:Generalized ARCH

(36)

36

Value at Risk(VaR) の計測

• Value at Risk とは?

• 分散共分散(デルタ)法

• モンテカルロ・シミュレーション法

• ヒストリカル・シミュレーション法

(37)

37

Value at Risk とは?

• Value at Risk(VaR) とは

– ある保有期間後に、ある一定の確率(信頼水準)で想 定される資産の最大損失額

– 例えば「α%-N日VaR」と言えば、『N日後にα%の確 率で被る可能性のある最大の損失額』を意味する。

(αとしては、95や99が一般的)

– 金融機関にとっての国際的自己資本規制ルール(BIS 規制)では、金融機関が(市場性のある)保有資産の リスク資産額を算出する時の指標として認定

(BIS規制では、α=99, N = 10を指定)

※規模の小さい金融機関では、保有資産額に資産別に決められ たリスク掛け目を掛けてリスク資産額としている場合もある

(38)

38

Value at Risk とは?

• Value at Risk(VaR) への批判

– リスク指標が満たすべき4つの公理の一つ「劣加法性」

を満たすとは限らない。

• Conditional VaR(CVaR)...

他の言い方もあり

– 「VaR よりも大きな損失が出た場合」の平均損失額 – VaR≦CVaR が成り立ち、より保守的なリスク指標 – 「劣加法性」も満たす

のリスク量 のリスク量

のリスク量

(劣加法性) X +Y (X +Y)

(39)

39

分散共分散(デルタ)法

• 個々の資産の将来のリターン(価値)の分布に正規分布 を仮定し、ポートフォリオ全体のリターンの標準偏差を計 算するために、分散共分散行列を用いてリスクの合成を 行う方法。

「共分散」については次回。今回は単一資産を考えているので、

そのボラティリティだけを考えればよい。

• 本質は、ポートフォリオ収益率の分散(標準偏差)の計算

(長所)

単純な行列計算なので、計算量が比較的少なくてすむ。

ポートフォリオ理論との親和性もあり、理論的背景も確立してい る。

(短所)

正規分布でない場合やリスクファクターとリターンの関係が非線 形の構造をもつものには、理論的には適用できない。

(40)

40

モンテカルロ・シミュレーション法

• 将来のリターンの分布に何らかのパラメトリックな分布

(正規分布に限らず)を仮定し、その分布に従う疑似乱数 または準乱数を発生させるシミュレーションにより、仮想 的な将来のリターンのシナリオを多数作成し、その全体 の中で下位(100−信頼水準)%に相当する実際のデー タを利用して、その時点での VaR を算出する方法。

(長所)

パラメトリックな方法だが、分布は特に問わず、原理的には複雑 な多次元分布にも対応できる。

(短所)

計算負荷が大きい(最近はハード性能の向上で問題は少なくなっ ている)。

乱数の性能に注意を払う必要がある。

(41)

41

ヒストリカル・シミュレーション法

• 過去に起こったデータ・サンプルを集め、全体の中で下 位(100−信頼水準)%に相当する実際のデータを利用 して、その時点での VaR を算出する方法。(過去が繰り 返すという考え方)。

(長所)

ノンパラメトリックな方法なので、データさえあればどのような場 合にも利用できる。

計算量も少ない

(短所)

過去に生じたケースしか扱えないので、比較的サンプルの抽出 期間にリターンが安定していると、リスクを過小評価しがち。

データが少ないと異常値に振り回されるおそれがある。

(42)

42

分散共分散法 vs ヒストリカル・シミュレーション法

(問題)

TOPIX データを利用して実際に、分散共分散法とヒスト

リカル・シミュレーション法でそれぞれ

10日VaRを計算(ルートt倍法を用いれば良い)して、その 値を比較してみよ。

参照

関連したドキュメント

「文字詞」の定義というわけにはゆかないとこ ろがあるわけである。いま,仮りに上記の如く

Bでは両者はだいたい似ているが、Aではだいぶ違っているのが分かるだろう。写真の度数分布と考え

前章 / 節からの流れで、計算可能な関数のもつ性質を抽象的に捉えることから始めよう。話を 単純にするために、以下では次のような型のプログラム を考える。 は部分関数 (

相談件数約 1,300 件のうち、6 割超が東京都、大阪府、神奈川県をはじめとした 10 都

となる。こうした動向に照準をあわせ、まずは 2020

、肩 かた 深 ふかさ を掛け合わせて、ある定数で 割り、積石数を算出する近似計算法が 使われるようになりました。この定数は船

町の中心にある「田中 さん家」は、自分の家 のように、料理をした り、畑を作ったり、時 にはのんびり寝てみた

1地点当たり数箇所から採取した 試料を混合し、さらに、その試料か ら均等に分取している。(インクリメ