• 検索結果がありません。

Cauchy分布を用いた正規分布の歪対称化

N/A
N/A
Protected

Academic year: 2021

シェア "Cauchy分布を用いた正規分布の歪対称化"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

Cauchy

分布を用いた正規分布の歪対称化

2017SS091山田祐揮 指導教員:阿部俊弘

1

はじめに

正規分布やCauchy分布は対称分布であるが, 実際の データの分布は対称であるとは限らず, 非対称であるほう が自然である. 本研究では, Cauchy分布の特徴と正規分布 との比較を行い, 相違点を明確にした後にCauchy分布を 用いた正規分布の歪対称化を行うことで歪Cauchy正規分 布のモデルを与える. また, 同一データに対してNewton 法を用いたパラメータ推定を行うことにより, Azzaliniの 歪正規分布との数値的な比較を行う.

2

Cauchy

分布について

Cauchy分布はt分布の自由度n = 1のときのものであ る. 期待値や分散が定義されず, 最頻値と中央値は常に与えら れ, Cauchy分布は2つの標準正規分布の比を用いて生成 される.(白石[3]) Cauchy分布の分布関数を FC(x) = 1 2 + arctan x π , −∞ < x < ∞ 密度関数を fC(x) = 1 π 1 1 + x2 とする. Cauchy分布の期待値は, E[X] = −∞ xfC(x)dx = lim α,β→∞ 1 πβ −α x 1 + x2dx = lim α,β→∞ 1 2π[log(1 + x 2 )]β−α = lim α,β→∞ r log ( 1 + β2 1 + α2 ) となるので, 定義できない. このとき, Cauchy分布の期 待値が定義できないので,分散も定義することはできない. 推定を行う場合, 外れ値が多い場合には正規分布よりも Cauchy分布を用いる方が有効なことがある.

3

Azzalini

の歪対称正規分布について

Azzalini[1]の提案した歪対称正規分布は,正規分布を含 む確率分布である. 歪パラメータにより正規分布以上に柔 軟なデータのあてはめが可能なだけでなく, 正規分布と類 似した性質を持つため, 解析的に扱いやすい確率分布であ る. この分布は3パラメータで表現され,そのうちの1つ である歪パラメータを0とするときに正規分布となること から, 平均と分散の2パラメータで表現する正規分布の拡 張であるといえる. 標準正規分布に対応する歪正規分布SN (0, 1, λ),−∞ < λ <∞の確率密度関数は fSN(x) = 2ϕ(x)Φ(λx) で与えられる. ここで, ϕとΦは標準正規分布の密度関数 と分布関数であり,次により与えられる: ϕ(x) = 1 exp ( −x2 2 ) , Φ(x) =x −∞ ϕ(t)dt. この分布の特徴として, 特別な場合に正規分布を含む 数学的に扱いやすい 幅広い歪度と尖度を持っている という点があげられる.

4

Cauchy

分布を用いた正規分布の歪対称化

Azzalini [1]のLemma 1の公式を用いて, Cauchy分布

の歪対称版について考える: gSCN(x) = 2FC(λx)ϕ(x) =2 ( 1 2 + arctan λx π ) e−x22 ここで,位置パラメータµと尺度パラメータσは通常の手 法x7→ (x − µ)/σにより導入できるが,歪パラメータにつ いては, λ/σ7→ λとリパラメトライズする. 関数fSCN(x)fSCN(x) = 2 σFC(λ(x− µ))ϕ ( x− µ σ ) =1 2πσ ( 1 + 2 πarctan λ(x− µ) ) e−(x−µ)22σ2 とする. ここで, −∞ < λ < ∞ である. π2arctan λx も奇関数であるので, fSCN(x)は密度関数になっている ことを確認できる. 密度関数がfSCN(x)である分布を SCN (µ, σ, λ)と表記する. リパラメトライズをしなかっ た密度関数gSCN(x)とリパラメトライズをした密度関数 fSCN(x)λの値は, gSCN(x)λgSCN(x)σで 割った値として定義することによって同じ分布を描くこ とができるのでリパラメトライズを行うことによって数 学的な問題は発生しないと言える. このリパラメトライズ を行うことにより, 密度関数に現れるパラメータを減らす ことができるので, gSCNを複数回微分し, Score方程式と Fisher情報行列を導出する場合に比べ, 簡潔な形であらわ すことができる. 1

(2)

5

Cauchy

正規分布の対数尤度関数

x1, . . . , xn がパラメータ(µ, σ, λ)の歪Cauchy正規分 布SCN (µ, σ, λ)に従うとき,対数尤度関数をl(µ, σ, λ) = log L(µ, σ, λ)とすると, l(µ, σ, λ) = n 2log 1 2π− n log σ + n log 2 + ni=1 log ( 1 2 + arctan (λ(xi− µ)) π ) ni=1 (xi− µ)2 2 により与えられ, この関数を最大化する(µ, σ, λ)が推定値 として定まり, ∂l ∂µ = 0, ∂l ∂σ = 0, ∂l ∂λ = 0 の条件を満た す. この尤度方程式の勾配ベクトルをScore関数という.

6

Cauchy

正規分布の

Fisher

情報行列

本節では,歪Cauchy正規分布のFisher情報行列を与え る. Fisher情報行列の対角要素は以下のようになる: 2l ∂µ2 = ni=1 2πλ3(x i− µ)fC(λ(xi− µ))2 FC(λ(xi− µ)) ni=1 λ2f C(λ(xi− µ))2 FC(λ(xi− µ))2 n σ2, 2l ∂σ2 = ni=1 3(xi− µ)2 σ4 + n σ2, 2l ∂λ2 = ni=1 2πλ(xi− µ)3fC(λ(xi− µ))2 FC(λ(xi− µ)) ni=1 (xi− µ)2fC(λ(xi− µ))2 FC(λ(xi− µ))2 . λ = 0のときに, Fisher情報行列が退化しないという利点 があることがわかる.

7

Newton-Raphson

x1, . . . , xnSCN (µ, σ, λ) に 従 う デ ー タ と し, x = (x1, . . . , xn) とする. このとき, ξ = (µ, σ, λ)⊤ とする と,観測Fisher情報行列J (ξ)J (ξ) =−∂ 2l(ξ) ∂ξ∂ξ⊤ で与えられる. J (ξ)を用いてNewton-Raphson法を適用 する. kth stepのパラメータをξ(k)とすると, (k + 1)th stepのパラメータは ξ(k+1)= ξ(k)+ J (ξ(k))−1S(x, ξ(k)) で更新される.

8

実データへの適用

Cook & Weisberg (1994) [2]のn = 202のオーストラ

リアのアスリートデータを使用する. このデータは全部で

6変量あり, それぞれ, 202人のアスリートのLBM, BMI, SSF, PcBfat, Height, Weight等のデータがまとめてある.

今回はSSF data, PcBfat dataを用いて推定を行った. (1)はSSF dataについての歪Cauchy正規分布, (2)は

SSF dataについての歪正規分布, (3)はPcBfat dataにつ いての歪Cauchy正規分布, (4)はPcBfat dataについて

の歪正規分布の推定結果である. ˆ µ ˆσ λˆ M LL (1) 29.60 51.80 6.93 −945.86 (2) 29.24 51.36 46.74 −945.33 (3) 5.63 10.01 ∞ −611.92 (4) 5.71 9.95 81.56 −612.39

表1 SSF dataとPcBfat dataに対する歪Cauchy正規 分布と歪正規分布のパラメータ推定の結果

図1 左図はSSF dataであり, 右図はPcBfat dataであ る. 黒の曲線は歪正規分布の推定した密度関数, 赤の曲線 は歪Cauchy正規分布の推定した密度関数である

9

おわりに

本研究では, Cauchy分布による正規分布の歪対称化に ついて検討した. その結果, λ = 0のときにFisher情報行 列が退化しないという利点があることが分かった. 分布の 単峰性についても検討したが, 密度関数の微分の形が複雑 になってしまうため, モードの位置を陽的に求めることは 容易ではないことがわかった. 歪Cauchy正規分布のパラ メータ推定の例として, SSF dataとPCBfat dataに対し て当てはめをおこなった.

参考文献

[1] Azzalini, A. (1985). A class of distributions which includes the normal ones. Scandinavian Journal of

Statistics, 12, 171–178.

[2] Cook, R. D. & Weisberg, S. (1994). An Introduction to Regression Graphics. New York: Wiley.

[3] 白石高章(2012).統計科学の基礎: データと確率の結 びつきがよくわかる数理,日本評論社.

図 1 左図は SSF data であり , 右図は PcBfat data であ る . 黒の曲線は歪正規分布の推定した密度関数 , 赤の曲線 は歪 Cauchy 正規分布の推定した密度関数である 9 おわりに 本研究では , Cauchy 分布による正規分布の歪対称化に ついて検討した

参照

関連したドキュメント

例えば,立証責任分配問題については,配分的正義の概念説明,立証責任分配が原・被告 間での手続負担公正配分の問題であること,配分的正義に関する

例えば,立証責任分配問題については,配分的正義の概念説明,立証責任分配が原・被告 間での手続負担公正配分の問題であること,配分的正義に関する

Bでは両者はだいたい似ているが、Aではだいぶ違っているのが分かるだろう。写真の度数分布と考え

 千葉 春希 家賃分布の要因についての分析  冨田 祥吾 家賃分布の要因についての分析  村田 瑞希 家賃相場と生活環境の関係性  安部 俊貴

中里貝塚の5つの本質的価値「貝類利用に特化した場」 「専業性の高さを物語る貝塚」 「国内最

・谷戸の下流部は、水際の樹林地 に覆われ、やや薄暗い環境を呈し ている。谷底面にはミゾソバ群落