ES バックテスティング手法の比較分析　シミュレーションにもとづく

(1)

平成 29 ^{年度修士論文}

シミュレーションにもとづく

ES バックテスティング手法の比較分析

首都大学東京大学院

社会科学研究科経営学専攻学修番号 16877271

小松勇介

指導教員室町幸雄教授

2018 ^年 1 ^月

(2)

【要旨】

2016

年

1

月にバーゼル委員会が公表した資料の中で，資本計算のリスク指標が

VaR(

バリュー・アット・リスク

)

から

ES

（期待ショートフォール

)

へと変更されているように，近年では

ES

への注目が高まっている．

VaR

は概念的なわかりやすさ，計算の簡便さなどから金融機関のリスク管理実務で最も標準的に使用されているが，劣加法性を持たず，テールリスクを捉えることができないなど，リスク指標として幾つかの欠点を抱えている．一方

ES

は，これらの問題点を内包せず，

VaR

よりも優れたリスク指標であると考えられているが，バックテスティングの構成が難しいという欠点が指摘されてきた．そこで，本研究では

ES

のバックテスティング手法について検討する．

ES

のバックテスティングの構成は難しいとはいえ実際には可能であり，すでに幾つかの手法が提案されている．本論文では，理論的な制約が少なく，リスク管理実務での適用に適していると思われる

Kratz et al. (2016)

と

Acerbi et al. (2014, 2017)

によるノンパラメトリックアプローチに焦点をあてて分析する．

Kratz et al. (2016)

は，複数の異なる信頼水準の

VaR

を同時にバックテスティングすることで，間接的に

ES

のバックテスティングをおこなう．

Acerbi et al. (2014, 2017)

は，モンテカルロシミュレーションにより仮説検定の

p

値を計算する．本論文では，これらの検定の有効性や性質を同じ枠組みの下で数値的に調査し，実務において最も有効な検定について検討し考察する．実務のリスク管理手順を模倣した数値実験からは，正規分布を使用しているためリスクを過小評価するモデルを検出する場合，

Acerbi et

al. (2014, 2017)

が提案した手法の一つが優れた性能を示すことがわかった．

(3)

1

はじめに

3 2 ES

バックテスティングの既存研究

6 2.1 VaR

，

ES

の定義

. . . . 6

2.2

バックテスティングとは

. . . . 7

2.3 VaR

バックテスティング

. . . . 7

2.4 ES

1 : Kratz et al. (2016)

によるアプローチ

. . . . 8

2.5 ES

2 : Acerbi et al. (2014

，

2017)

. . . . 11

2.6 Kratz

アプローチと

Acerbi

アプローチの比較

. . . . 18

3

静的バックテスティング実験

20 3.1

実験設定

. . . . 20

3.2

結果

. . . . 21

4

動的バックテスティング実験

27 4.1 S&P500 . . . . 27

4.2

イノベーションの自由度に対する

ES

バックテスティングの頑健性

. . . . 30

4.3

様々な金融資産に対する

ES

バックテスティングの頑健性

. . . . 34

5

実データへの適用

39 6

両側検定

41 6.1

両側検定の可否

. . . . 41

6.2

実験

. . . . 44

7

結論

50 8

謝辞

52 9 Appendix 53 9.1

多項分布

. . . . 53

9.2 Skewed t

分布

. . . . 53

9.3

エリシタブル

. . . . 53

9.4

エクスペクタイル

. . . . 54

(4)

1 ^はじめに

2016

年

1

月にバーゼル委員会により公表された，マーケット・リスクの最低所要自己資本

(Basel Committee (2016))

で，資本計算のリスク指標が

VaR(

バリュー・アット・リスク

)

から

ES

（期待ショートフォール

)

へと変更されているように，近年では

ES

への注目が高まっている．

VaR

や

ES

などのリスク指標は，確率分布として表される将来の損失予測を

1

つの数値に要約したものである．このようなリスク指標としては，他にも分散や標準偏差などが挙げられる．

VaR

は概念的なわかりやすさ，計算の簡便さなどから金融機関のリスク管理実務で最も標準的に使用されているが，

VaR

はリスク指標としての欠点を抱えており，しばしば批判される．よく言われる欠点は，

VaR

はポートフォリオの分散効果を常に適切に表現できるとは限らないということである．例えば，デフォルト確率が

0.7%

の企業に

10

億円融資するポートフォリオ

A

と，同じ確率でデフォルトが独立に発生する企業

2

社に

5

億円ずつ融資するポートフォリオ

B

を考える．一般的にはポートフォリオ

B

のほうがリスクは低いと考えられるが，信頼水準が

99%

の

VaR

を計算すると，ポートフォリオ

A

の

VaR

は

0

円，ポートフォリオ

B

の

VaR

は

5

億円となる．

つまり

VaR

をリスク指標として使うと，ポートフォリオ

B

のほうがリスクは高いということになる．この直観に反する結果は，

VaR

はその定義上，信頼区間外のリスクを捉えられないことに起因する．

このようによく使われている

VaR

のようなリスク指標でも，それがリスク管理上の直観に合致するとは限らない．リスク指標がもつべき合理的な性質を公理として整理し議論したのが

Altzner et al. (1999)

である．

Altzner et al. (1999)

はリスク指標が満たすべき性質として，

1.

単調性

(monotonicity) : X ≥ Y ⇒ ρ(X ) ≤ ρ(Y )

2.

移動不変性

(translation invariance) : ρ(X + k) = ρ(X ) − k k

は定数

3.

正の

1

次同次性

(positive homogeneity) : ρ(λX) = λρ(X), λ ≥ 0 4.

劣加法性

(subadditivity) : ρ(X + Y ) ≤ ρ(X) + ρ(Y )

を挙げ，これらの性質を満たすリスク指標をコヒレント・リスク指標と呼んだ．

X, Y

はポートフォリオの損益を表す確率変数，

ρ(X ), ρ(Y )

がリスク指標である．劣加法性とは，「リスク指標はポートフォリオ分散によるリスク削減効果を織り込むべき」という考え方を表現したものであり，

VaR

はこの性質を常に満たすとは限らない．

一方，

ES

はコヒレントなリスク指標である．簡潔に言うと，

VaR

は損失分布の分位点

(

一定の確率で発生しうる最大損失額

)

として定義されるが，

ES

は損失額が

VaR

以上となることを条件とした損失額の条件付期待値として定義される．

ES

は

VaR

の劣加法性を満たさないという欠点を克服しており，理論的には

VaR

より優れたリスク指標であると考えられている．

しかしリスク指標をリスク管理実務で使う場合には，理論的な性質の良さ以外にも，様々な観点を考慮する必要がある．最も不可欠な点は，リスク指標を正しく推定できることと，推定したリスク指標の有効性を事後に観測された損失から確認できることである．リスク指標の推定に関しては，損失分布の裾部分での条件的期待値を扱う

ES

は，裾部分の分位点を扱う

VaR

よりも正確に推定することが難しい．そしてもう一方のリスク指標の有効性の確認が，本研究で扱うテーマである．事前に予測したリスク指標の予測値と，事後に観測した損失を比較することによって，リスク管理の手順を評価することはバックテスティングと呼ばれる．

VaR

のバックテスティングを構成することは容易であるが，

ES

のバックテスティングを構成することは難しいことが知られている．

(5)

2011

年には，

Gneiting (2011)

が

ES

はエリシタブル

(elicitable)

でないことを示した．詳細は

9.3

節で述べるが，エリシタブルとはある種の最適化問題の解としてリスク指標が表現できることを指す．そのような表現を使えば，様々なモデルから推定したリスク指標を直接比較することができ，モデルの優劣を検討することができる．そして，この議論の中で，

ES

のバックテスティングを構成することは，そもそも不可能ではないのかという疑問が生じた．その後，

Acerbi et al. (2017)

が，バックテスティング可能な統計量のフォーマルな定義を提案し，エリシタブルとバックテスト可能性は異なる概念であることが示されて，理論的にはこの問題は解決した．しかしながら

ES

バックテスティングの構成が難しいという点は変わらない．エリシタブルの定義や，この議論の中で注目されたエクスペクタイル

(expectile)

というリスク指標については

9

節の

Appendix

に簡単な説明を載せた．

VaR

のバックテスティングに関する文献は多い．例えば

Kupiec (1995)

や

Christoﬀersen (1998)

などがある．

Christoﬀersen (1998)

は，

VaR

の予測モデルが正確であるかどうかを判定することは，事後的に実現した損失が

VaR

を超過するか否かの事象の時系列

(

以下，

VaR

超過時系列と呼ぶ

)

が「無条件カバレッジ仮説」

「独立性仮説」を満たしているかどうかを判定することに単純化できると述べた．

VaR

バックテスティングの多くは，

VaR

超過時系列がこの

2

つ

(

または

1

つ

)

の仮説を満たしているか否かを調べることで，予測モデルの正確性を判定している^*1．バーセル規制のトラフィックライトシステムも，この考え方をもとにしている．

ES

のバックテスティングに関する文献は

VaR

に比べてはるかに少ないが，すでにいくつかの方法が提案されている．

McNeil et al. (2000)

は残差アプローチと呼ばれる手法を提案し，

Kerkhof et al. (2004)

は確率積分変換

(probability-integral-transform, PIT)

にもとづく方法を提案したが，これらの手法が有効に働くには大標本が必要であり，あまり多くの標本数を確保できない実務では活用することが難しい．

Wong (2008)

は按点技術を使ったパラメトリックな方法を提案した．この手法は小標本でも良い結果を出力するが，損益分布に正規分布を仮定するなどモデルに対する制約が強く，これも実務では好ましくない．パラメトリックな手法は他にも

Righi et al. (2013)

による方法が挙げられるが，これも依然として制約が強い．

ところが近年，

Kratz et al. (2016)

や

Acerbi et al. (2014, 2017)

が注目すべき

ES

のバックテスティング手法を提案した．これらの手法はノンパラメトリックな検定であり，理論的な制約が少なく，実際のリスク管理実務に適していると考えられる．なお，実務で有望な手法として他にも

Costanzino et al. (2015)

による方法も挙げられるが，この手法の検討は後日行いたいと考えている．

このように

ES

バックテスティングの構成は難しいながらも様々な手法が提案されているが，学者や実務家の間でコンセンサスを得られた手法はまだ存在しない．これは，各

ES

バックテスティングの有効性や性質

(

長所，短所

)

が十分に整理されていないためと考えられる．

本論文では，理論的な制約が少なく，実務に適していると考えられる

Kratz et al. (2016)

と

Acerbi et al.

(2014, 2017)

によるノンパラメトリックなアプローチに焦点をあてる．この

2

つのアプローチには様々な検

定が含まれる．これらの検定の有効性や性質を同じ枠組みの下で調査をし，実務において最も有効な検定は何かを検討する．具体的には，

(1)

どのような状況でどの手法が最も優れているのか，それぞれの手法の特性を分析する．

(2)

そのうえで，実務において好ましい手法はどれか．

(3)

リスク量が保守的すぎる（過大評価する）モデルを検出する両側検定に適した手法はどれか．

を調べる．特に

(1)

では，実際に用いる時系列データは独立でないと考えられるため，この点に注目した分析

*1この2つの仮説を同時に満たす場合，VaR超過時系列は互いに独立なベルヌーイ試行の列になる．

(6)

を行う．

(3)

は，バーセル規制の根底には，過度に保守的なモデルも望ましくないという考えがあると思われることから生じる．

Acerbi et al. (2014, 2017)

によるアプローチはリスク量を過小評価するモデルのみを排除する片側検定であり，そのままでは過度に保守的なモデルを排除することはできない．そこで

Acerbi et al.

(2014, 2017)

によるアプローチが両側検定に拡張できるかどうかも検討する．

本論文の構成は以下の通りである．まず

2

節では，バックテスティングとは何か，なぜバックテスティングは難しいのかを説明し，本論文で焦点を当てる

Kratz et al. (2016)

と

Acerbi et al. (2014, 2017)

によるノンパラメトリックなアプローチについて概観する．

3

節では，損益のデータ生成構造が時間と共に変化しない静的な状況を想定し，各

ES

バックテスティング手法の有効性や性質を調べる．

4

節では，損益のデータ生成構造に時系列構造がある状況を想定し，各

ES

バックテスティングの有効性や性質を調べる．

5

節では，実データに対して

ES

バックテスティングを適用する．

6

節では，

Acerbi et al. (2014, 2017)

によるアプローチが両側検定に拡張できるかどうかを調べ，

7

節で結論を述べる．

(7)

2 ES バックテスティングの既存研究

本節では

ES

バックテスティングの既存研究を紹介する．はじめに

VaR

，

ES

の定義を示し，次にバックテスティングについて説明する．そしてバーゼル規制にも関連する，有名な

VaR

バックテスティングを紹介した後，本論文で焦点を当てている

ES

バックテスティングの

Kratz et al. (2016)

と

Acerbi et al. (2014,

2017)

によるアプローチを説明し，この

2

つのアプローチを比較検討する．

2.1 VaR

，

ES

の定義

はじめに

VaR

，

ES

の定義を述べる．

VaR

は金融機関のリスク管理で幅広く使われているリスク指標であり，バーゼル規制でも大きな役割を担っている．まず分布関数

F

の一般化逆関数

F

^←を

F

^←

(y) := inf { x ∈ R : F(x) ≥ y } (2.1)

と定義する．一般化逆関数

F

^←を使うと，分布関数

F

の

α

分位点は

q

α

(F) := F

^←

(α)

で与えられる．この表記を使うと，

VaR

の定義は以下のようになる．

定義

2.1 VaR

信頼水準を

α ∈ (0, 1)

，ポートフォリオの損失

L

の分布関数を

F

Lとする．このとき信頼水準

α

の

VaR

α

(L)

は，

VaR

α

(L) := F

_L^←

(α) (2.2)

として与えられる．

簡潔に述べれば，

VaR

は損失分布の分位点である．信頼水準には

α = 0.99

がよく使われる．

ES

は，劣加法性を満たさないという

VaR

の欠点を克服しており，理論的には

VaR

より優れたリスク指標であると考えられている．

ES

の定義は以下のようになる．

定義

2.2 ES

損失

L

の分布関数を

F

Lとする．さらに

E( | L | ) < ∞

^{とする．信頼水準}

α

の

ES

α

(L)

は，

ES

α

(L) = 1 1 − α

∫

1 α

q

u

(F

L

)du (2.3)

として与えられる．

E( | L | ) < ∞

^は，

(2.3)

式の積分が

well defined

であることを保証する．これらの定義により，

ES

と

VaR

には

ES

α

(L) = 1 1 − α

∫

1 α

VaR

u

(L)du (2.4)

という関係がある．

ES

は

α

を超える信頼水準の

VaR

の平均値である．これが

ES

はテールリスクを捕捉していると言われる所以である．

損失分布が連続の場合は，より直感的な表現で

ES

をあらわすことができる．

(8)

補題

2.1

損失

L

の分布関数

F

Lが連続と仮定する．このとき信頼水準

α

の

ES

α

(L)

は，

ES

_α

(L) = E[L | L ≥ VaR

_α

(L)] (2.5)

として与えられる．これは「

ES

は

α

を超える信頼水準の

VaR

の平均値」という解釈により近い表現である．

2.2

バックテスティングとは

バックテスティングとは，事前に予測したリスク指標の推定量と事後に実際に実現した損失や収益を比較することによって，リスク計測手順を評価することである．バックテスティングを行うことで，与えられたリスク指標の推定手順（つまり予測モデル）が，信頼できるリスク指標の推定値を出力するか否かという疑問に答えることができる．

リスク指標には

VaR

，

ES

，標準偏差などが挙げられるが，これらに対してバックテスティングを行うことは，単純ではない．その理由を競馬の予想を例に説明する．

1

年を通して，

1

着になる馬を都度予想することを考える．

1

年後に，あなたの予想の精度を評価することは簡単である．なぜならばレース終了後に，毎回，

1

着となった馬が公に宣言されるからである．公に宣言された内容と，自らの予想を比較することで，予想精度を簡単に評価することができる．

しかしリスク指標のバックテスティングの場合，予想精度の評価は競馬予想のように簡単ではない．日々，

翌日の

ES

を予想するという例から説明する．将来の損失分布を

F

tとし，その

ES

を

ES

^F^t とする．競馬予想と対応させると，将来の損失分布

F

tは競馬のレースに対応し，

ES

^F^tは

1

着になる馬に対応する．仮に私達が日々

ES

^F^t に対する予想を行ったとしても，予想精度を評価することは難しい．なぜならば，

F

tも

ES

^F^tも日々の終わりに観測することができないからである．私達が日々観測できるものは，

(

未知の

)

真の損失分布

F

_tからのたった１つの実現値だけである

(

図

1

参照

)

．これがリスク指標のバックテスティングを構成することが難しい理由である．

基本的にはリスク指標のバックテストを構成することは単純ではない．バックテスティングの構成が容易な

VaR

は特別なケースである．

図

1 2.3 VaR

VaR

のバックテスティングとしてよく使われる方法は，二項分布を用いて

VaR

超過回数を評価する方法である．バーゼル規制による

VaR

バックテスティングもこの方法をもとにしている．事前に予測した信頼水準

(9)

α(

例えば，

α = 0.99)

の

VaR

を

V aR

α,t，事後に実現した損失を

L

tとする．そして損失が

VaR

を超過したかどうかを示す違反インディケータを

I

t,α

:= 1

_{_L_t_>VaR_α,t_}

(2.6)

と定義する．

1

Aは定義関数であり，事象

A

がおきたら

1

を，さもなくば

0

をとる．違反インディケータの列は，例えば

(1, 0, 0, 1, 1, 0, . . . , 0)

となる．これは日々の損失が

VaR

を超過したか否かを記録したものである．

Christoﬀersen (1998)

は，

VaR

の予測モデルが正確であるかどうかを判定することは，違反インディケー

タの列

{ I

t,α

, t = 1, . . . , n }

^{が，以下の}

2

つの仮説を満たしているかどうかを判定することに単純化できると述べた．

•

^{無条件カバレッジ仮説}

(unconditional coverage hypothesis) : E[I

_t,α

] = 1 − α,

^∀

t

•

^{独立性仮説}

(independence hypothesis) : s ̸ = t

ならば

I

_t,αと

I

_s,αは独立．

VaR

バックテスティングに関する多くの手法は，違反インディケータの列がこの

2

つ

(

または

1

つ

)

の仮説を満たしているかどうかを調べることで，

VaR

予測モデルが正確であるかどうかを判定している．

この

2

つの仮説を同時に満たす場合，違反数

I

α

= ∑

n

t=1

I

t,αは

I

α

∼ B(n, 1 − α) (2.7)

となる．

B(n, 1 − α)

は成功確率が

1 − α

，試行数が

n

の二項分布を表す．二項分布を用いて

VaR

超過回数を評価する手法では，

(2.7)

式から仮説検定の

p

値を計算する．例えば，

VaR

超過回数が

k

回ならば，

p

値は

p

_k

=

∑

k i=0

P (I

_α

= k) =

∑

k i=0

n

C

_i

(1 − α)

ⁱ

α

ⁿ⁻ⁱ

(2.8)

となる．

2.4 ES

1 : Kratz et al. (2016)

本節では

Kratz et al. (2016)

により提案された

ES

バックテスティング（以下，

Kratz

アプローチと呼ぶ）

を紹介する．

Kratz

アプローチは，

ES

が複数の信頼水準の

VaR

で近似できることを利用して

ES

のバックテスティングを間接的に構成するという

Emmer et al. (2015)

の考え方にもとづく．損失分布を

L

とし，信頼水準

α

の

ES

と

VaR

を

ES

α

(L)

，

VaR

α

(L)

と記す．

Emmer et al. (2015)

は

ES

の近似値を

ES

α

(L) ≈ 1

4 [q(α) + q(0.75α + 0.25) + q(0.5α + 0.5) + q(0.25α + 0.75)]

= 1 4

[

q(α) + q

( 3α + 1 4

) + q

( 2α + 2 4

) + q

( α + 3 4

)]

(2.9)

とした．但し

q(γ) = VaR

γ

(L)

である．

(2.9)

式は

(2.3)

式を離散近似したものである．

(2.9)

式からは，損失分布

L

に対する

4

つの

VaR

推定値

q(aα + b)

が十分妥当であるならば，

ES

の推定値

ES

α

(L)

も妥当であると考えることができることが示唆される．この考え方をもとに，

Kratz

アプローチは複数の異なる信頼水準の

VaR

を同時にバックテスティングすることで，間接的に

ES

のバックテスティングをおこなう．

2.4.1 Kratz

アプローチの設定

事前に予測したモデルの列を

{ F

t

, t = 1, . . . , n }

，事後に実現した損失の列を

{ L

t

, t = 1, . . . , n }

^{，フィルト} レーションを

{F

t

, t = 1, . . . , n }

^とする．

F

tは確率分布で

F

t−1

-

可測，

L

tはスカラー値

F

t

-

可測である．モデ

(10)

ル

F

tは，各時点

t

で様々な信頼水準

α

の

VaR

α,t，

ES

α,tを予測

(

推定

)

するために使われる．

VaR

の予測値

VaR

α,tと損失の実現値

L

tを比較することで，モデルの妥当性を評価する．

(2.9)

式の発想を一般化するために，出発水準

α

^*2に対して，複数の信頼水準を

α

j

= α + j − 1

N (1 − α), j = 1, . . . , N, N ∈ N

= (N − j + 1)α + (j − 1)

N (2.10)

と定義する．

N = 4

のとき，

(2.10)

式は

(2.9)

式に一致する．さらに便宜上

α

₀

= 0, α

_N₊₁

= 1

と定義する．

そして時点

t

の信頼水準

α

_jの違反インディケータを

I

t,j

:= 1

_{_L_t_>VaR_{αj ,t}_}

(2.11)

と定義する．

VaR

の予測モデルが正確であるか否かを判定することは，違反インディケータの列

(I

t,j

)

t=1,...,nが以下の

2

つの仮説を満たすか否かを判定することに単純化できる．

• : E[I

t,j

] = 1 − α

j

,

^∀

t

•

^{独立性仮説}

: s ̸ = t

ならば

I

t,jと

I

s,jは独立．

もし

VaR

の予測値が両方の仮説を満たすならば，違反数

∑

n

t=1

I

t,j は成功確率

(

違反確率

)

が

1 − α

jの二項分布に従う．

上述のように単一の

VaR

の予測値の検定では二項分布が使われるが，複数の

VaR

の予測値の同時検定では多項分布が使われる．

X

_t

= ∑

N

j=1

I

_t,jと定義すると，これは設定した複数の信頼水準の

VaR

_α_j_,tを，損失

L

_t が何個超過したかを示し，

(X

_t

)

_t=1,...,nはその時系列である．もし

VaR

の予測値が適切なモデルから予測されているならば，

(X

_t

)

_t=1,...,nは以下の

2

つの条件を満たす．

• : P (X

t

≤ j) = α

j+1

, j = 0, . . . , N,

^∀

t

•

^{独立性仮説}

: s ̸ = t

ならば

X

tと

X

sは独立これらの特性は

X

_t

∼ MN(1, (α

₁

− α

₀

, . . . , α

_N₊₁

− α

_N

)),

^∀

t (2.12)

と書くこともできる．但し，

MN(n, (p

0

, . . . , p

N

))

は，試行

n

の多項分布^*3である．ここで，セルカウントを

O

j

=

∑

n t=1

I

_{_X_t_=j_}

, j = 0, 1, . . . , N (2.13)

で定義すると，上述の

2

つの条件を満たす場合，セルカウントのベクトル

(O

0

, . . . , O

N

)

は多項分布

(O

₀

, . . . , O

_N

) ∼ MN(n, (α

₁

− α

₀

, . . . , α

_N₊₁

− α

_N

)) (2.14)

に従う．多項分布については

9.1

節を参照されたい．

*22.4節ではKratz et al. (2016)にあわせてα= 0.975とする．

*31回の試行では，{0,1, . . . , N}からp0, . . . , pNの確率で要素を1つ出力する．

(11)

より形式的には

0 = θ

0

< θ

1

< · · · < θ

N

< θ

N+1

= 1

を任意のパラメータとし，

(O

0

, . . . , O

N

)

は

MN(n, (θ

1

− θ

0

, . . . , θ

N+1

− θ

N

))

というモデルからの実現値と考える．そして帰無仮説と対立仮説が

H

0

: θ

j

= α

j

,

for j = 1, . . . , N

H

₁

: θ

_j

̸ = α

_j

,

for at least one j ∈ { 1, . . . , N } (2.15)

で与えられる検定を行うことで予測モデルの妥当性を評価することができる．

2.4.2 Kratz

アプローチの検定

(2.15)

式の仮説を評価するために様々な検定統計量を使うことができる．

Kratz et al. (2016)

は，

Cai &

Krishnamoorthy (2006)

で使われた

5

つの手法の中から，以下の

3

つの手法を使用した．

1.

ピアソンのカイ二乗検定

2.

ナス検定

(Nass test)

3. LRT

検定

(likelihood ratio test)

ピアソンのカイ二乗検定では，検定統計量は

S

N

=

∑

N j=0

(O

j+1

− n(α

j+1

− α

j

))

²

n(α

j+1

− α

j

)

∼

d

H0

χ

²_N

(2.16)

となる．

∼

^d

H0

は帰無仮説のもとで分布収束することを意味する．仮説検定の有意水準を

κ

，

χ

²_N

(1 − κ)

を

χ

²_N 分布の

(1 − κ)

分位点とすると，

S

N

> χ

²_N

(1 − κ)

ならば，帰無仮説は棄却される．

ナス検定は，

(2.16)

式で定義された統計量

S

N の分布を改良した方法である．検定統計量の定義は以下の通りである．

cS

N

∼

d

H0

χ

²_ν

, c = 2E[S

N

]

V[S

_N

] , ν = cE[S

N

] E[S

_N

] = N

V[S

N

] = 2N − N

²

+ 4N + 1

n + 1

n

∑

N j=0

1 α

j+1

− α

j

(2.17)

cS

N

> χ

²_ν

(1 − κ)

ならば，帰無仮説は棄却される．ナス検定はセル確率^*4が低い時，カイ二乗検定より優れていることが多い．

LRT

検定は，まず対立仮説

H

1のもとでパラメータ

θ

jの最尤推定量

θ ˆ

jを計算する．そして検定統計量

G

_N

= 2

∑

N j=0

O

_j

ln

( θ ˆ

_j+1

− θ ˆ

_j

α

j+1

− α

j

)

(2.18)

を形成する．

(O

₀

, . . . , O

_N

) ∼ MN(n, (θ

₁

− θ

₀

, . . . , θ

_N₊₁

− θ

_N

))

のもとでは，セル確率は

θ ˆ

_j+1

− θ ˆ

_j

= O

_j

/n

と推定できる．しかし

O

_jがゼロの時は，

θ ˆ

_j+1

− θ ˆ

_j がゼロになるため，この場合は検定統計量を定義することができない．そのため

N ≥ 2

の時は，

Cai & Krishnamoorthy (2006)

によって提案された

LRT

の別手法を使用する．

*4多項分布の成功確率

(12)

その方法ではパラメータが

θ

_j

= Φ

( Φ

⁻¹

(α

_j

) − µ σ

)

, j = 1, . . . , N (2.19)

によって与えられると仮定して

H

0

: µ = 0 and σ = 1

H

₁

: µ ̸ = 0 or σ ̸ = 1 (2.20)

として検定を行う．この場合

θ ˆ

j+1

− θ ˆ

j

= Φ

( Φ

⁻¹

(α

j+1

) − µ ˆ ˆ σ

)

− Φ

( Φ

⁻¹

(α

j

) − µ ˆ ˆ σ

)

(2.21)

となる．

µ ˆ

と

σ ˆ

は対立仮説

H

₁のもとでの最尤推定量である．そのためセル確率の推定値がゼロになることはない．この検定統計量を

G

N とすると，

G

N は漸近的に自由度が

2

のカイ二乗分布に従う．

G

N

> χ

²₂

(1 − κ)

ならば，帰無仮説は棄却される．

LRT

検定は，

(2.21)

式のとおり

θ

j

, j = 0, 1, . . . , N

を

µ, σ

の

2

パラメータに縮約する．これは大胆な仮定であり，現段階では

LRT

検定が本当に適切に機能するかどうかは疑わしいが，以降の実験では，この点にも留意しながら分析を行う．

2.5 ES

2 : Acerbi et al. (2014

，

2017)

本節では

Acerbi et al. (2014

，

2017)

により提案された

ES

バックテスティング（以下，

Acerbi

アプローチと呼ぶ）を紹介する．

Acerbi

アプローチでは

Kratz

アプローチと異なり，検定統計量が従う分布を解析的に求めることができない．そのため帰無仮説のもとでモンテカルロシミュレーションを行い，検定統計量が従う分布を手に入れる．

Kratz

アプローチより計算時間が長いという欠点があるが，

Acerbi

アプローチでは

Kratz

アプローチと異なり

ES

を直接検定することができる．

Acerbi et al. (2014)

では

3

つの異なる方法が提案されている．本稿ではこれらの方法を検定

1

，検定

2

，検定

3

と呼ぶ．検定

3

は検定

1

，検定

2

より計算時間がかかるため後述する実験が現実的な時間で終わらないこと^*5，

Acerbi et al. (2014)

によると検定

3

のパフォーマンスは検定

1

，検定

2

に比べて劣後することなどから，本論文では検定

3

を分析の対象から外す．さらに

Acerbi et al. (2017)

では，

VaR

の推定精度によって検定の結果が左右されるという検定

2

の欠点を改良した方法が提案されているので，この方法を検定

4

と呼び，

本論文では検定

1

，検定

2

，検定

4

に焦点を当てる．

2.5.1 Acerbi

アプローチの設定

Acerbi

アプローチは損失分布ではなく損益分布をもとにバックテスティングを構成する．そのため

Kratz

アプローチにおける信頼水準

97.5%(α = 0.975)

は，

Acerbi

アプローチでは信頼水準

2.5%(α = 0.025)

に対応するなど，両アプローチ間で表記法が異なる．本来であれば

Kratz

アプローチ，

Acerbi

アプローチともに同じ表記法を使うほうが好ましいが，各アプローチ内の説明を分かりやすくすることを優先し，異なる表記法を使用する．

*5Clift et al. (2016)によると，検定3の計算コストは検定1，検定2の4倍．厳密に計算時間を計測したわけではないが，筆者の感覚ではそれ以上の差があるように思われる．

(13)

時点を

t = 1, . . . , T

，損益を表す確率変数を

X

tとする．

{F

t

}

t∈Nをフィルトレーションとする．時点

t − 1

までの情報を

F

t−1を所与とした時，

X

tは

(

未知の

)

真の分布

F

tをもつと仮定する．同様に時点

t − 1

までの情報を

F

t−1を所与とした時，モデルによる損益の予測分布を

P

tとする．

確率変数の集合

X ⃗ = { X

t

}

は互いに独立と仮定するが，同分布ではないとする．

X

t

∼ F

tの時，信頼水準

α

の

VaR, ES

を

VaR

^F_α,t

, ES

^F_α,tと記す．さらに損益分布は連続で厳密に増加すると仮定する．違反インディケータを

I

t

= 1

_{_X_t_+VaR_α,t_<0_}

(2.22)

と定義する．

I

_t^F^t は

I

_t^F^t

:= 1

_{_X

t+VaR^Ft_α,t<0}とする．

この時，興味があるリスク指標は，時点

t − 1

までの情報

F

t−1を所与とした場合の時点

t

の

VaR

，

ES

つまり

VaR

^F_α,t^t

, ES

^F_α,t^t である．

VaR

^F_α,t^t

, ES

^F_α,t^t は

VaR

^F_α,t^t

= − F

_t⁻¹

(α) (2.23)

ES

^F_α,t^t

= − E

_t₋₁

[X

_t

| X

_t

+ VaR

^F_α,t^t

< 0]

= − E

t−1

[ X

t

I

_t^F^t

α ]

(2.24)

と計算することができる^*6．但し，

E

t−1

[X] := E[X |F

t−1

]

である．

同様に，予測モデル

P

tから計算した

VaR

，

ES

を

VaR

^P_α,t^t

, ES

^P_α,t^t とする．

Acerbi

アプローチは，予測モデル

P

tから計算した

(VaR

^P_α,t^t

, ES

^P_α,t^t

)

t=1,...,T が，真のモデル

F

tから計算した

(VaR

^F_α,t^t

, ES

^F_α,t^t

)

t=1,...,T に十分近いかどうかを評価する方法である．現実には

(VaR

^F_α,t^t

, ES

^F_α,t^t

)

t=1,...,T を観測することはできない．そのため

(VaR

^P_α,t^t

, ES

^P_α,t^t

)

_t=1,...,T と実際に観測された損益

(X

_t

)

_t=1,...,T から予測モデルの妥当性を判断する．

2.5.2

検定

1 : testing ES after VaR

検定

1

は

VaR

が正しいという前提のもとで

ES

の検定を行う．検定統計量は

ES

^F_α,t^t

= − E[X

t

| X

t

+ VaR

^F_α,t^t

< 0] (2.25)

という関係式をもとに構築される．検定

1

の検定統計量

Z

1は

Z

₁

= 1 N

_T^P

∑

T t=1

X

_t

I

_t^P^t

ES

^P_α,t^t

+ 1 (2.26)

N

_T^P

=

∑

T t=1

I

_t^P^t

> 0 (2.27)

I

_t^P^t

= 1

_{_X

t+VaR^Pt_α,t<0}

(2.28)

と定義される．

*6VaR^F_α,t^t,ES^F_α,t^t はFt−1-可測．

(14)

帰無仮説

H

0，対立仮説

H

1は

H

0

: X

t

∼ F

t

, (2.29)

P

t

(x) = F

t

(x), x < − VaR

^F_α,t^t

,

^∀

t (2.30)

H

1

: X

t

∼ F

t

, (2.31)

P

t

̸ = F

t

,

^∃

t (2.32)

ES

^F_α,t^t

≥ ES

^P_α,t^t

, for

^∀

t, > for

^∃

t (2.33) VaR

^F_α,t^t

= VaR

^P_α,t^t

, for

^∀

t (2.34)

とおく．

(2.34)

式が不等号ではなく等号であるのは，検定

1

の考え方では，別の検定により

VaR

は事前に正

しいことが確認されているという前提があるためである．そのため対立仮説のもとでも

VaR

は依然として正しい．

次に検定統計量

Z

1の性質を調べる．具体的には帰無仮説

H

0及び対立仮説

H

1のもとで，

Z

1の期待値を計算する．検定

1

では帰無仮説

H

0，対立仮説

H

1いずれにしても

VaR

^F_α,t^t

= VaR

^P_α,t^t であるので

I

_t^F^t

= I

_t^P^tとなることに注意すると，

H

₀

: E[Z

₁

] = E [

1 N

_T^P

∑

T t=1

X

t

I

_t^P^t

ES

^P_α,t^t

+ 1

N

_T

> 0

]

= E [

1 N

_T^F

∑

T t=1

X

_t

I

_t^F^t

ES

^P_α,t^t

+ 1

N

_T

> 0

]

= E [

E [

1 N

_T^F

∑

T t=1

X

t

I

_t^F^t

ES

^P_α,t^t

I

₁^F¹

, . . . , I

_T^F^T

]

+ 1 N

T

> 0

]

= E [

1 N

_T^F

∑

T t=1

I

_t^F^t

E[X

t

| I

_t^F^t

] ES

^P_α,t^t

+ 1

N

T

> 0

]

= E [

− 1 N

_T^F

∑

T t=1

I

_t^F^t

ES

^F_α,t^t

ES

^P_α,t^t

+ 1

N

_T

> 0

]

= E [

− 1 N

_T^F

∑

T t=1

I

_t^F^t

+ 1 N

_T

> 0

]

, (

∵

ES

^F_α,t^t

= ES

^P_α,t^t

)

= 0 (2.35)

となる．複数の条件

I

₁^F¹

, . . . , I

_T^F^T での条件付期待値を単一の条件

I

_t^F^t の条件付期待値にするために，確率変数の集合

X ⃗ = { X

t

}

が互いに独立であることを用いている．

対立仮説

H

1のもとで

Z

2の期待値を計算する．

(2.35)

式の

5

行目までは帰無仮説

H

0と変わらない．

H

1

: E[Z

1

] = E [

1 N

_T^P

∑

T t=1

X

t

I

_t^P^t

ES

^P_α,t^t

+ 1

N

T

> 0

]

= E [

− 1 N

_T^F

∑

T t=1

I

_t^F^t

ES

^F_α,t^t

ES

^P_α,t^t

+ 1

N

T

> 0

]

≤ E [

− 1 N

_T^F

∑

T t=1

I

_t^F^t

+ 1 N

_T

> 0

]

, (

∵

ES

^F_α,t^t

≥ ES

^P_α,t^t

)

= 0 (2.36)

(15)

以上より検定統計量

Z

1の期待値は，帰無仮説

H

0のもとではゼロ，対立仮説

H

1のもとでは負になることがわかる．

2.5.3

検定

2 : testing ES directly

検定

2

は検定

1

と異なり，

VaR

と

ES

を同時に検定する．検定統計量は

ES

^F_α,t^t

= − E

t−1

[ X

_t

I

_t^F^t

α ]

(2.37)

⇔ E

_t₋₁

[

X

_t

I

_t^F^t

αES

^F_α,t^t

]

+ 1 = 0 (2.38)

という関係式をもとに構築される．検定

2

の検定統計量

Z

₂は

Z

2

=

∑

T t=1

X

t

I

_t^P^t

T αES

^P_α,t^t

+ 1

(2.39)

I

_t^P^t

= 1

_{_X

t+VaR^Pt_α,t<0}

(2.40)

と定義される．

帰無仮説

H

0，対立仮説

H

1は

H

₀

: X

_t

∼ F

_t

, (2.41)

P

t

(x) = F

t

(x), x < − VaR

^F_α,t^t

,

^∀

t (2.42)

H

1

: X

t

∼ F

t

, (2.43)

P

t

̸ = F

t

,

^∃

t (2.44)

ES

^F_α,t^t

≥ ES

^P_α,t^t

, for

^∀

t, > for

^∃

t (2.45) VaR

^F_α,t^t

≥ VaR

^P_α,t^t

, for

^∀

t (2.46)

とおく．

次に検定統計量

Z

₂の性質を調べる．具体的には帰無仮説

H

₀，対立仮説

H

₁のもとで，

Z

₂の期待値を計算する．

H

₀

: E[Z

₂

] = E [

_T

∑

t=1

X

_t

I

_t^P^t

T αES

^P_α,t^t

+ 1

]

= E [

_T

∑

t=1

X

t

I

_t^F^t

T αES

^F_α,t^t

+ 1

]

=

∑

T t=1

E [

X

t

I

_t^F^t

T αES

^F_α,t^t

] + 1

=

∑

T t=1

E [

E

_t₋₁

[

X

t

I

_t^F^t

T αES

^F_α,t^t

]]

+ 1

=

∑

T t=1

E [

1 T ES

^F_α,t^t

E

_t₋₁

[

X

_t

I

_t^F^t

α

]]

+ 1

=

∑

T t=1

E

[ − ES

^F_α,t^t

T ES

^F_α,t^t

]

+ 1

= 0 (2.47)

ES バックテスティング手法の比較分析 シミュレーションにもとづく

平成 29 年度修士論文

シミュレーションにもとづく