R勉強会_Bayse 基本_2015_7_10 Recent site activity Namba's HP

(1)

Bayesian analysis

R _イ

難波修史

(2)

イ？！？

わ！

(3)

資料内容本第1章内容

多分含了承

(4)

ふわイ考え方説明

：頻度論従来考え方対比

従来確率頻度論

→無限回試行前提確率

＝真値 1 値神知

イ確率

→ _{時点有} _ー _{確率仮定}

＝実際ー＋予備知識確率

→確率的真値 1 値

(5)

イ基本原理

．直観的信頼度確率変数定量化

．観察ー使事前情報事後情報

That’s it( ^)!

(6)

実際例：BCM( ワイ本) 1章



_同 _難 _{問題 10問あ}



_知 _あ _能力

(θ＝正解率



_直接あ _{能力あ θ 見}

観察可能：得点

(7)

例

 _あ _{能力θ 関} 事前情報(事前分布) 特定

※_{θ＝0～1 問題関} _情報(難 _{熟知度) 一切} _状態

 _{事前分布 p(θ)}

※_{事前情報一切} ₍_{予測不可)}

右図一様分布(全確率同 )

(8)

例



_{実際あ} 回答：10問中9問正解



観察ー (D：9/10) → θ知識(一様分布 ⁾ 更新



事後分布p(θ│D)＝θ 関

各確率変数真値条件確率

(9)

イ公式



_イ _公式

ー (＝尤度p(D│θ))+事前分布(＝p(θ)：一様分布)

→ 事後分布(＝ p(θ│D))



_{言換え} 事後＝尤度×事前/ ー得確率

p( θ|D)=p(D|θ)p(θ)/p(D)

事後分布事前分布

(10)

事後尤度×事前比例関係竹林先生資料

(11)

Q _：

A _{：事前分布予備知識} _実際

ー事後分布

予測

(12)

例

 _F

_igure1.1 _参照



事前分布(Prior)

9/10 _正解率 _ー _情報

利用事後分布(Posterior)

求：右図参照

新ー与え分θ 不確実性下事前分

布事後分布狭分布＝分布尖

(13)

イ：予測

 事後分布使方一：予測

 _{前例同} _難 _新 _問題5問

前回事後分布(p(θ│n=10 k=9) 使問題(n^rep⁼⁵⁾ 予測？

 _数学的 _{事後積分} 追加5問題正解数(=k^rep⁾予測

∫p(k^rep|θ,n^rep^=5)p(θ|n=10,k=9)dθ

事後分布予測可能！！

(14)

イ：逐次更新

 _{別個情報} _イ _有用

例：同難問題5問 → 正解率：5問中3問

 過去得事後分布事前分布 (θ アッー方法)



_観測 _び _ー _更新 ₍ _{＝イ更新)}

(15)



_{事後分布＝知} _ー _{不確実性記述}

＆確率的予測逐次更新有用



尤度( ー ) 二項分布従場合：一様事前＝ー

分布( ＝＝ ) ー組合わ →事後

ー分布( +k +ｎ-k)



_{単一結合例} _{事前事後同分}

布多場合都合

→ 複雑ー対応？

単純上記例話

(16)

Markov Chain Monte Carlo

 _{上例} 事後分布比較的単純ー対使え

＝現実複雑イ的解釈使え

 _{上記現状打破} _{連鎖ンカ} _{法呼} _発

展的ンュー駆動ンン手法(通称MCMC)

→ Gibbs ンン Metropolis-Hastings_ア MCMC _使事後分布抽出可能！

 “Bayesian models are limited only by the user’s imagination._”

(17)

MCMC _結局 _わ

 _本資料 _MCMC_ア _詳 _語 ₍ _ワ

イ本同様 )

 _あえ _一方向 _{乱数ュ} _{ーョン繰返} _妥

当結果出道具理解大丈夫思

 _詳 _知 _人

https://www.youtube.com/watch?v=4gNpgSPal_8 _参照

竹林先生資料http://www.slideshare.net/yoshitaket/32-

35647139_見 _{自分検索}

(18)

イッ・ッ

by _清水先生

ッ

 _ー _推定値 _{分布制約} ( _要請 _制約

あ (例：回帰分析＝残差正規分布

 _{事前分布活用可能}

ッ

 _{推定時間}

 _実際 _使え _わ ₍_→ _{会分} _！ ₎

(19)

Stan vs BUGS



_Stan _！

 No-U-Turn Sampler(NUTS) _{利用：階層} _混合 _潜在

変数変数間相関高複雑向

※BUGS Gibs Sampler, Metropolis-Hastings_ア _利用

 _Stan _BUGS _許非正則事前分布利用可能

＋Shinystan 関連開発活発

心理ー実用性

高

(20)

Rstan _導入

 _{ッー} _CRAN _{ウンー}

出来 ⁽多分)

 ₃_行 _ー _走

( C_{＋環境同時用意} _必要有)

 _{導入詳細小杉先生} _イ

http://www.slideshare.net/KojiKosugi/r-stan あ本家イ (Rstan 検索検索 )

参照難波相談意味

(21)

R _例

実際！！

(22)

※[ _“”] _{書直}

stancode<- _“ data {

int<lower=1> n; int<lower=0> k; }

parameters {

real<lower=0,upper=1> theta; }

model {

theta ~ beta(1, 1);

// Observed Counts k ~ binomial(n, theta); }”

(23)

続

library(rstan)

datas <- list(n=10, k=9)

# parameters to be monitored: parameters <- c("theta")

# The following command calls Stan with specific options. samples <- stan(model_code=stancode,

data=datas, pars=parameters, iter=20000, chains=2, thin=1,

# warmup = 100, # Default = iter/2

# seed = 123 # Setting seed; Default is random seed )

(24)

Stan model _{適当説明}

stancode<- _“

data { # data _{実際存在} _ー _定義

int<lower=1> n; #_{問題数n} 意味：lower 下限 int<lower=0> k; #_{正解数k 〃}

}

parameters { #_知ー ( ー上観察え ⁾ 定義

real<lower=0,upper=1> theta; #real=_実数＋<>内=下限～上限 → 能力θ }

model { #_{分布設定}

theta ~ beta(1, 1); #事前分布：一様分布あ (1，1) β分布 // Observed Counts

k ~ binomial(n, theta_{); }” #}_正解数 _ー _{n, θ} _{二項分布従}

(25)

Stan code _{適当説明}

samples <- stan(model_code=stancode, ( _書 ) data=datas, pars=parameters,

iter=20000, # _ン _{ン数} _{適切数} _ー chains=2, # _ン _ン _ン _{行回数}

thin=1, # _{数：全部取出} _多 iter 1 _{飛び抽出}

# warmup = 100, #burn out_{期間：最初方収束}

# Default = iter/2 #default

# seed = 123 #乱数指定; Default is random seed(＝ ⁾ )

(26)

# The commands below are useful for a quick overview: print(samples)

print(summary(samples))

公式HP 結果

見

ー実際

煩雑

Shinystan

ッー使

え結果見 ⁽例)公式HP 全然関係ー

(27)

見！Shinystan( 導入)

https://github.com/stan-dev/shinystan/wiki

インー

devtools_イン _{ー (多分} CRAN _思

)

→ library(devtools)

source_url("https://github.com/stan-

dev/shinystan/raw/develop/install_shinystan.R") install_shinyStan()

詳上記本家イ参照

(28)

結果見方

library(shinyStan)

Sys.setlocale(locale=“English”) launch_shinystan(samples)

ｋ ^※“” 注意

自分書直終わ

Sys.setlocale(locale=“Japanese”)

(29)

実際ー使？

 _上記 _ー尤度( ー ) 二項分布従単純例

？

慣親！

存相関係数

イ推定！！

(30)

相関係数出！

※BCM5 _章

 アソン積率相関係数 (r) ＝2変量関係

－～＋

計算式：r = x y 共分散/SDx × SDy

 通常点推定値 (1値) 報告 ^r イ的推定：相関程度

(31)

Pearson _{積率相関係数}

※ _{詳細 Code}

i data

xi:_{観測ー}

平均 , 標準偏差σ 多変量正規分布 r:_相関係数

-1 1 範囲無情報事前分布仮定

x_i

μ ^r ^σ

μ₁,μ₂ ~ Gaussian(0,0.001)

σ₁,σ₂ ~ InvSqrtGamma(0.001,0.001) r ~ Uniform(-1,1)

x_i ~ MvGaussian((_μ₁_,μ₂_{), σ}²₁ _rσ₁_σ₂ ) rσ₁σ₂ σ²₂

(32)

Code _：長 _覚悟 _！

※ _“” _以下略

 model <- " // Pearson Correlation data {

int<lower=0> n; vector[2] x[n]; }

parameters { vector[2] mu;

vector<lower=0>[2] lambda; real<lower=-1,upper=1> r; }

transformed parameters { vector<lower=0>[2] sigma; cov_matrix[2] T;

Stan内多変量正規分布分散共分散行列

代わ共分散行列利用：多変量正規分布

変数化必要あ

(33)

// Reparameterization

sigma[1] <- inv_sqrt(lambda[1]); sigma[2] <- inv_sqrt(lambda[2]); T[1,1] <- square(sigma[1]);

T[1,2] <- r * sigma[1] * sigma[2]; T[2,1] <- r * sigma[1] * sigma[2]; T[2,2] <- square(sigma[2]);

}

model { // Priors

mu ~ normal(0, inv_sqrt(.001)); lambda ~ gamma(.001, .001); // Data

x ~ multi_normal(mu, T); }"

逆平方根＝σ

逆平方Gamma分布

仮定：逆平方根処理

Gamma_関数仮定

※豆知識：Gamma分布

＝発生率1/ 事象複数( )

回起待時間分布

(34)

Data

x <- matrix(c( .8, 102, 1.0, 98, .5, 100, .9, 105,

.7, 103, .4, 110, 1.2, 99, 1.4, 87, .6, 113, 1.1, 89,

1.3, 93), nrow=11, ncol=2, byrow=T)

行・列指定

(35)

n <- nrow(x) # number of people/units measured

data <- list(x=x, n=n) # to be passed on to Stan myinits <- list(

list(r=0, mu=c(0, 0), lambda=c(1, 1)))

# parameters to be monitored: parameters <- c("r", "mu", "sigma")

# The following command calls Stan with specific options.

# For a detailed description type "?rstan". samples <- stan(model_code=model,

data=data,

init=myinits, # If not specified, gives random inits pars=parameters, iter=10000,

chains=1, thin=1,

# warmup = 100, # Stands for burn-in; Default = iter/2

# seed = 123 # Setting seed; Default is random seed )

Init_{＝ン} _ン _ン

時最初値決定

(36)

！ー！

 launch_shinystan(samples)

 _→

-0.8

事前確率エーー考慮自由分析可能

※_詳 _BCM ₅_章後半

(37)

普通 Cor.test ¹ 行

(38)

(39)

Bayes _{統計従来統計違}



Bayes 正規分布以外分布複数仮定事前情報自由

更新利点あ



一方本当自由分析可能ー・分布・

関数理解必要不可欠あ



_{従来統計} SPSS, Amos _{分析用ソ} _手軽

可能あ利点一え

一方統計解析ッボッ危険性

(40)

・・・イ利用 User次第

ベイズ

(41)

今日イ！

(42)

・・・

 _長 _{イ的相関求方}

function _定義 _使 _思

R勉強会_Bayse 基本_2015_7_10 Recent site activity Namba's HP

Bayesian analysis

R イ

イ ？ ！？

わ ！

資料 内容 本 第1章 内容

多分 含 了承

ふ わ イ 考え方 説明

：頻度論 従来 考え方 対比

従来 確率 頻度論

→無限回 試行 前提 確率

＝真 値 1 値 神 知

イ 確率

→ 時点 有 ー 確率 仮定

＝実際 ー ＋予備知識 確率

→確率的 真 値 1 値

イ 基本原理

．直観的信頼度 確率変数 定量化

．観察 ー 使 事前 情報 事後 情報

That’s it( )!

実際 例 ：BCM( ワイ本) 1章

同 難 問題 10問あ

知 あ 能力

(θ＝正解率

直接あ 能力 あ θ 見

観察可能： 得点

例

例

実際 あ 回答：10問中9問正解

観察 ー (D：9/10) → θ知識(一様分布 ) 更新

事後分布p(θ│D)＝θ 関

各確率変数 真値 条件 確率

イ 公式