統計的分析ツール - リスクシミュレーション分析ツール - Risk Simulator 2012B- User Manual (Japanese)

5. リスクシミュレーション分析ツール

5.9 統計的分析ツール

他の強力なリスクシミュレーターのツールは統計分析ツールで、データーの統計的な性質を定義します。診断の実行は、データーの確率性質と検定の為に基本的な統計の記述による複数の統計的な性質のデーターの確認が含まれています。

 例証モデルを開き(リスクシミュレーター | 例証 | 統計的分析) 、データーワークシートと変数名称を含めたデーターを選択してください (セル C5:E55)。

 リスクシミュレーター | ツール | 統計分析(図 5.28) を選択してください。

 データータイプを確認し、選択されたデーターは、列に変換された単一変数からかそれとも複数の変数からかのどちらかです。この例証では、選択されたデーターの範囲は、複数の変数からだと考慮してください。終了後、OKをクリックして下さい。

手順:

 希望する統計的検定を選択してください。お勧めは（デフォルトで）は、全ての検定を選択する事です。終了後、OK をクリックして下さい(図5.29)。

実行された検定のより良い読解の為に生成されたレポートに目を通してくださ

い (図5.30-5.33でサンプルレポートが表示されています)。

図5.28 –統計的分析ツールの実行

133

図5.29 – 統計的検定

統計の分析

統計的概要

統計 X1

観測 50.0000 標準偏差 (サンプル) 172.9140

算術平均 331.9200 標準偏差 (母集団) 171.1761

幾何平均 281.3247 標準偏差の信頼区間の下限 148.6090

トリム平均 325.1739 標準偏差の信頼区間の上限 207.7947

算術平均の標準誤差 24.4537 分散 (サンプル) 29899.2588

平均値の信頼区間の下限 283.0125 分散 (母集団) 29301.2736

平均値の信頼区間の上限 380.8275 変動係数 0.5210

中央値 307.0000 第 1 四分位数 (Q1) 188.0000

最小値 47.0000 第 3 四分位数 (Q3) 435.0000

最大値 764.0000 四分位範囲 247.0000

範囲 717.0000 歪度 0.4838

尖度 -0.0952

記述統計

ほとんどすべての分布法は4つ以下のモーメントで記述できます(分布法によって、モーメントが1つ必要な場合もあれば、2つまたはそれ以上必要となる場合もあります)。記述統計では、これらのモーメントを定量的に表します。1次モーメントは分布の位置(平均値および中間値、モード)を記述し、期待値、期待される返り値、または発生の平均値として解釈されます。

算術平均は、すべてのデータポイントの和をポイント数で割ることで、すべての発生の平均値を算出します。幾何平均は、すべての正のデータポイントの積の累乗根を取ることで算出されます。幾何学平均は、大幅に変動する割合や比率に対して、より正確な値を示します。たとえば、複利型の変動金利がわかっている場合に平均成長率を計算するのに使用できます

。トリム平均は、極異常値を除外した後のデータセットの算術平均を算出します。平均値は、異常値が存在する場合に重大なバイアスを含みやすく、トリム平均はこれらのバイアスを傾斜分布で低減します。

平均値の標準誤差は、サンプル平均値の誤差を算出します。サンプルサイズが大きくなればなるほど、誤差は小さくなります。無限大のサンプルでは誤差がゼロに近づき、母集団パラメータが推定されたことを示します。サンプリング誤差に基づき、平均値には95%の信頼区間が算出されます。サンプルのデータポイントの分析に基づき、実際の母平均は、平均値の上限と下限の区間に存在することになります。

中間値は、すべてのデータポイントの50%がこの値を上回り、残りの50%は下回るデータポイントです。3つある1次モーメントのうち、中間値は異常値に最も影響を受けにくいといえます。対称分布では、中間値は算術平均値と同一になります。中間値が平均値から大きく離れている場合、傾斜分布が存在します。モードは、最も頻繁に発生するデータポイントを示します。

尖度は、正規分布と比較したピーク度または平坦度を示しています。これは、分布の4次モーメントです。正の尖度値は相対的にピーク度の高い分布を示し、否の尖度は相対的に平坦な分布を示します。ここでの尖度は、ゼロを中心に測定されています(尖度は3.0を中心に測定される場合もあります)。これらはともに同様にに有効ですが、ゼロを中心にすることで解釈が容易になります。正の尖度が高い場合は中心周辺にピークのある分布で、集中分布、または分布の裾部分が広い(ファットテール)分布を示します。これは、極端なイベント(たとえば破局的なイベントやテロリストの攻撃、株式市場の暴落など)が発生する確率が正規分布より高いことを示しています。

最小値はデータセット内で最も小さい値、最大値は同様に最も大きい値を示します。範囲は最高値と最小値間の差です。

2次モーメントは分布の離散と幅を測定するもので、標準偏差、分散、四分位数、四分位範囲などを用いて記述されます。標準偏差は、全データポイントの平均値からの偏差の平均を示します。リスクと関連するため、頻繁に使用される測定です(標準偏差が大きいと分布の幅が広く、リスクが高い、データポイントが平均値の上下にで広く離散していることを示します）。単位は、元のデータセットと同一となります。サンプル標準偏差は、サンプルサイズが小さい場合に自由度修正を利用する点で母標準偏差とは異なります。また、標準偏差では信頼区間の上限と下限が得られ、真の母標準偏差はこの区間内にあります。データセットが母集団のすべての要素に及ぶ場合は、代わりに母標準偏差を用います。2つの分散値は、

標準偏差の平方値です。

変動係数は、サンプル標準偏差をサンプル平均値で割ったもので、単位に依存せず、異なる分布法間で比較が可能な離散を算出します(たとえばメートルとキログラム、何百万ドルと何億ドルを単位とする数値の分布を比較するなど)。 第1四分位数は、データポイントを最小値から最大値の順に並べた場合の25パーセンタイルの値を測定します。第3四分位数は、7 5パーセンタイルのデータポイントの値です。データセットから異常値を切り捨てるために、分布の上位および下位範囲として四分位数が使用されることがあります。四分位範囲は第1 四分位数と第3四分位数の差で、分布中心の幅を測定するのに使用されます。

歪度は分布の3次モーメントです。歪度は、平均値を中心とする分布の非対称度を示します。正の歪度は、正の値の方に非対称な分布が広がっていることを示し、否の歪度は負の値の方に非対称の分布が広がっていることを示します。

図5.30 – 統計的分析ツールのレポートのサンプル

統計的概要

データセットからの統計: 計算された統計:

観測 50 t 統計 13.5734

サンプル平均値 331.92 P 値 (右側) 0.0000

サンプル標準偏差 172.91 P 値 (左側) 1.0000

P 値 (両側) 0.0000

ユーザーから提供された統計:

帰無仮説 (Ho):  = 仮説平均仮説平均 0.00 対立仮説 (Ha):  < > 仮説平均

仮説検定の概要

両側仮説検定

右側仮説検定

左側仮説検定

左側テール仮説は、母平均が統計的に仮説平均より大きいか等しいかという帰無仮説Hoを検定します。また、対立仮説は、サンプルデータセットを使用して検定を行った場合に、真の母平均が仮説平均より統計的に小さいというものです。t検定では、p値が指定した有意値(通常は0.01または0.05、0.10)より小さい場合、母平均は仮説平均と統計的に1%、5%、10%の有意水準で(または90%、95%、99%の統計的な信頼度で)有意に小さいことを意味します。

一方、p値が0.10または0.05、0.01より大きい場合は、母平均が統計的に仮説平均と近いまたは仮説平均より小さく、偶然によってのみ差が生じることを示しています。

メモ: 「<>」は、仮説検定において、右側では「> (大なり)」、

左側では「(<) 小なり」、両側では「≠ (不等号)」を示します。

Z検定とは異なり、t検定はより保守的で母標準偏差も不要なため、ここではt検定のみをを使用します。

仮説検定 (1 変数の母平均の t 検定)

1つの変数のt検定は、母標準偏差値が未知で、サンプルの分布が正規分布に近似すると想定される場合に適切です(t検定は通常、サンプルサイズが30より小さい場合に用いられますが、データセットが大きい場合にも適切に用いられ、より保守的な結果が得られます)。このt検定は、両側検定と片側検定(右側と左側)の3つの仮説検定に適用できます。参照のため、これら3つの検定とその結果を以下に示します。

両側検定は、母平均が仮説平均と統計的に一致する帰無仮説　Hoを検定します。また、対立仮説は、サンプルデータセットを使用して検定を行った場合に、真の母平均が仮説平均とは統計的に異なるというものです。t検定では、算出されたp値が指定した有意値(通常は0.01または0.05、0.10)より小さい場合、母平均は仮説平均と統計的に1%、5%、10%の有意水準で(または90%、95%、99%の統計的な信頼度で)有意差があることを意味します。一方、p値が0.10または0.05、0.01より大きい場合は、母平均が仮説平均と統計的に同一で、偶然によってのみ差が生じることを示しています。

右側テール仮説は、母平均が統計的に仮説平均より小さいか等しいかという帰無仮説Hoを検定します。また、対立仮説は、サンプルデータセットを使用して検定を行った場合に、真の母平均が仮説平均より統計的に大きいというものです。t検定では、p値が指定した有意値(通常は0.01または0.05、0.10)より小さい場合、母平均は仮説平均と統計的に1%、5%、10%の有意水準で(または90%、95%、99%の統計的な信頼度で)有意に大きいことを意味します。

一方、p値が0.10または0.05、0.01より大きい場合は、母平均が統計的に仮説平均と近いまたは仮説平均より小さいことを示しています。

図5.31 – 統計的分析ツールのレポートのサンプル(一つの変数の仮説検定)

データ平均 331.92 データ相対度数観測予想 O-E

標準偏差 172.91 47.00 0.02 0.02 0.0497 -0.0297

D 統計 0.0859 68.00 0.02 0.04 0.0635 -0.0235

1% の D 基準 0.1150 87.00 0.02 0.06 0.0783 -0.0183

5% の D 基準 0.1237 96.00 0.02 0.08 0.0862 -0.0062

10% の D 基準 0.1473 102.00 0.02 0.10 0.0918 0.0082

帰無仮説: データは正規分布。 108.00 0.02 0.12 0.0977 0.0223

114.00 0.02 0.14 0.1038 0.0362

127.00 0.02 0.16 0.1180 0.0420

153.00 0.02 0.18 0.1504 0.0296

177.00 0.02 0.20 0.1851 0.0149

186.00 0.02 0.22 0.1994 0.0206

188.00 0.02 0.24 0.2026 0.0374

198.00 0.02 0.26 0.2193 0.0407

222.00 0.02 0.28 0.2625 0.0175

231.00 0.02 0.30 0.2797 0.0203

正規性検定

検定結果

正規性検定はノンパラメトリック検定の一種で、サンプルが抽出された母集団に特定の形状を想定しないため、小さいサンプルデータセットでも分析が可能です。この検定は、サンプルデータが正規分布の母集団から抽出されたかどうかという帰無仮説と、サンプル

データは正規分布ではないという対立仮説を評価します。算出された p

値が有意値アルファ以下であった場合、帰無仮説は却下され、対立仮説が受け入れられます。反対に、p

値が有意値アルファより大きい場合は、帰無仮説は却下されません。この検定は、サンプルデータセットからの累積度数と、サンプルデータの平均値と標準偏差に基づく理論分布からの累積度数という 2 つの累積度数に依存します。正規性の別の検定として、カイ 2 乗検定があります。カイ 2 乗検定では、ここで用いている方法より多くのデータポイントが比較に必要となります。

ドキュメント内 Risk Simulator 2012B- User Manual (Japanese) (ページ 132-136)