• 検索結果がありません。

Microsoft PowerPoint - IBIS2012_open.pptx

N/A
N/A
Protected

Academic year: 2021

シェア "Microsoft PowerPoint - IBIS2012_open.pptx"

Copied!
30
0
0

読み込み中.... (全文を見る)

全文

(1)

福水

健次

統計数理研究所 / 総合研究大学院大学

第15回情報論的学習理論ワークショップ(IBIS2012)

カーネル法の新展開

ー その理論と応用 ー

(2)

Outline

1. イントロダクション: カーネル法の概要 2. 確率分布の表現としてのカーネル法 3. 条件付確率の表現と推定精度 4. カーネル推論則 5. おわりに

(3)

データの高次元性,非線形性

高次元データに潜む非線形性,複雑な構造

生物,遺伝,文書,ソーシャルネットワーク,宇宙,気象,…

データの非線形性の抽出

Common practice: (X, Y, Z)  (X, Y, Z, X2, Y2, Z2, XY, YZ, ZX, …)

• 高次元性に伴う計算量爆発

例) 10,000 次元データに2次特徴を加えると

特徴空間の次元 = 10000C1 + 10000C2 = 50,005,000 (!)

(4)

正定値カーネルと再生核ヒルベルト空間

定義. : 集合. ∶ Ω Ω → が正定値であるとは, , , [対称] かつ任意の ∈ , , … , ∈  に対し Gram行列 が半正定値行列. 例) Gaussian RBFカーネル Laplace カーネル • 再生核ヒルベルト空間(Reproducing kernel Hilbert space, RKHS) • 正定値カーネルにより定まる,Ω上の関数からなる関数空間. • 特殊な内積を持つ. , exp || || /2 exp ∑ | | (再生性)

, ∙ ,

(5)

データ変換:

RKHSへの特徴写像

• 特徴ベクトル: , … , ↦ Φ , … , Φ • カーネルトリック 内積計算: ∑ Φ , ∑ Φ ∈ ,

,

,

β

Φ

, Φ

∙ , , ⋅ ,

,

特徴空間上で 線形データ解析を行う. SVM, PCA, CCA, etc

特徴空間(関数空間) xiHx i xj x  元のデータ空間 特徴写像 Φ Φ

(6)

線形アルゴリズムのカーネル化(既存)

• 特徴ベクトルに対する線形アルゴリズム  さまざまなカーネル法 e.g. カーネルPCA, 非線形SVM, カーネルCCA, etc. • 大きさ (データ数)の Gram 行列計算に還元される. • 高次元データに適する. c.f. 高次項による展開 • データ数 が大きい時は低ランク近似 が有効.

カーネル法の新しい展開

• カーネル平均,条件付カーネル平均を用いた確率分布の表現 • Gram行列計算によるノンパラメトリックな推論計算の実現

(7)

既存のノンパラメトリック推定

• 平滑化カーネル(正定値とは限らない): カーネル密度推定, 局所多項式 / • 特性関数の方法: • スプライン,ウェーブレット, etc, etc, 「次元の呪い」 • 平滑化カーネル: 高次元(4, 5次元ぐらい)で困難

カーネル法によるノンパラメトリック推定

• 何ができるのか? • 「次元の呪い」を解決しているか?

(8)
(9)

カーネル平均:特徴ベクトルの平均

: 可測空間 Ω上に値を取る確率変数 ~  : Ω上の正定値カーネル. : で定まるRKHS. Def. における のカーネル平均: • 期待値の再生性 , ∀ ∈ . • カーネル平均は の高次モーメントの情報を持つ. 例) , ⋯ 0 , e.g., モーメント母関数

Φ

⋅ ,

⋅,

(10)

特性的なカーネル

(Fukumizu et al. JMLR 2004, AoS 2009; Sriperumbudur et al. JMLR2010) Def. 有界で可測な正定値カーネル が特性的(characteristic) とは, が単射であることをいう.すなわち ~ ⋅ , ~ ⋅ , ⇔ . 特性的なカーネルによるカーネル平均 は,確率分布を一意に 定める. 例: Gaussian, Laplace カーネル (多項式カーネル: 非特性的.) c.f. 特性関数 . カーネル平均  効率的な計算が可能. P → , ↦

(11)

カーネル法によるノンパラメトリック推論の原理

特性的なカーネルにより,

確率分布に関する推論 ⇒ カーネル平均に関する推論・計算

• 分布の均一性検定( か?)  ?

(12)

RKHSにおける分散共分散

(X , Y : XY に値を取る確率変数 , , , : X , Y 上のRKHSと正定値カーネル Def. (非心化) 共分散作用素 : → , : → • 通常の共分散行列 (線形写像)のRKHS値変数への一般化 • テンソル(積空間)との同一視: 一般に 線形写像 ≅ 2階のテンソル Φ Φ , Φ Φ Φ ⊗ Φ ∈ ⊗

(13)

サンプルによる推定

, , , … , , ~ , i.i.d., 推定量: 標本平均,標本共分散でOK • さまざまな量がGram行列で表現可能 • 1/ ‐オーダーでの一致性 (in norm) や中心極限定理が保証され る (see e.g., Berlinet & Thomas‐Agnan 2004) 1 ⋅, , 1 ⋅, ⊗ ⋅,

(14)
(15)

条件付カーネル平均

X, Y: ガウス確率変数(∈ , ℓ, resp.) • 特性的なカーネルを用いると, 一般のX , Y に対し argmin ∈ ℓ , Φ Φ argmin ∈ ⊗ Φ , , Φ Φ

(16)

条件付カーネル平均の応用

• 確率モデルに基づく推論 e.g. グラフィカルモデル (後述) • 条件付独立性/依存性 (Fukumizu et al. JMLR 2004, AoS 2009, NIPS 2010) • ノンパラメトリック回帰(c.f. ガウス過程/ カーネルリッジ回帰) ⋅ ⋅, , … , ⋅, ∈ , , … , ∈ | : 正則化係数

(17)

収束の速さ

Y : 1次元と仮定.X のみに カーネルを用いる  ガウス過程/ カーネルリッジ回帰 • 一致性 1 (Eberts & Steinwart , NIPS2011) ∈ , :ガウスカーネル, ∈ , ある種の緩い 仮定のもと,任意の

> 0 に対し, Note: は,線形推定量の最適オーダー (Stone 1982). | ≔

|

|

→ ∞

(18)

• 一致性 2 (case: ∈ ) を特性的, ∈ Range ( 0)とするとき, • 収束のレートは m ( の次元)に依存しない(「次元の呪 い」の解消?) しかし「一致性1」の → ∞の場合より遅い. • Gaussian RKHS ⊂ , 稠密 • 「一致性1」では, の任意の関数をGaussian RKHSの

|

|

,

|

,

(19)

比較実験

実験条件

カーネルリッジ回帰(Gaussカーネル)

局所線形回帰(Epanechnikov kernel) (R: ‘locfit’パッケージ)

, ~ 0,

,

~ 0, 0.1 (A) exp (B) ⋯ , not included in Gaussian RKHS (C) 1/ 1.5 | | not included in Gaussian RKHS データ数 n = 100, 次元 m = 1,…,10 (at most) , 500 runs バンド幅,正則化係数はCVで選択.

(20)

0 2 4 6 8 10 0 0.005 0.01 0.015 0.02 0.025 0.03 0.035 0.04 Dimension of X M e a n s qua re e rrors Kernel method Local linear 0 2 4 6 8 10 0 0.005 0.01 0.015 Dimension of X M e a n s qua re e rrors Kernel method Local linear 0.5 1 1.5 2x 10 -3 M e a n s qua re e rrors Kernel method Local linear (A) exp (C) 1/ 1.5 | |

(21)
(22)

条件付確率を用いた推論則

Sum rule:

|

Chain rule:

,

Bayes’ rule:

カーネル化:

• 変数の関係をすべてデータで表す(ノンパラメトリック!) • 分布をすべて(重み付)カーネル平均,共分散作用素で表現 • Gram行列計算によって上記の計算ルールを実現する.

(23)

Kernel Sum Rule

• Sum rule: | • カーネル化: ≔ • Gram行列表現: Input: ∑ℓ Φ , , , … , , ~ ,

Φ

,

.

• Intuition: Φ , Φ Φ Φ Φ ,

(24)

Kernel Chain Rule

• Chain rule: , | • カーネル化: ≔ • Gram行列表現: Input: ∑ℓ Φ , , , … , , ~

Φ

⊗ Φ

,

.

• Intuition: Note : → ⊗ , Φ ⊗ Φ ⊗ Φ From Sum Rule, Φ ⊗ Φ ′ , |

(25)

Kernel Bayes’ Rule

• ベイズルール • カーネルベイズルール (KBR, Fukumizu et al NIPS2011) ベイズ則は, , に対する, → の回帰. • Gram行列表現: Input: ∑ℓ Φ , , , … , , ~ , | ∑ Φ , | , , , … , , | Λ Λ Λ , , . , |

Φ

where

(26)

KBRによる推論

KBR は事後確率 | 自身ではなく,そのカーネル平均を推定. Bayes推論にどのように用いるか? • ∈ に対する のノンパラメトリック回帰 where , … , . • 点推定: 数値的解法が必要 | → . argmin | Φ (一致性) KBR推定量

(27)

カーネル推論則の応用例

完全な「ノンパラメトリック」ベイズ推論 分布の情報もサンプルで表現 c.f. “いわゆる”ノンパラメトリックベイズ 応用例 • ノンパラメトリックHMM (Fukumizu et al. NIPS 2011) や | をサンプルで表現. • Kernel Approximate Bayesian Computation (Kernel ABC) (Nakagome , Fukumizu, Mano. 2012) 尤度関数が陽に書けない場合 • カーネルBelief Propagation (Song et al, AISTATS2011) • POMDP: Bellman方程式のカーネル化 (Nishiyama et al UAI2012) X0 X1 X2 X3 XT Y0 Y1 Y2 Y3 YT

(28)

ノンパラメトリックHMMへの応用:カメラ角度の推定

• 隠れ変数 : 室内に位置を固定されたビデオカメラの角度.

• 観測変数 : 部屋の動画像 + 人工ガウスノイズ.

• 20 x 20 RGB 画素 (1200次元 ).

noise KBR (Trace) Kalman

filter(Q) 2 = 10-4 0.15 0.01 0.56 0.02 2 = 10-3 0.21 0.01 0.54 0.02 Average MSE for camera angles (10 runs) To represent SO(3) model, Tr[AB‐1] for KBR, and quaternion expression for Kalman filter

(29)

おわりに

カーネル法は,ノンパラメトリック推論の有力な方法論

• 高次元データに対する適性: 計算量,推定精度

カーネル平均,共分散作用素に基づく推論則

.

• 完全な「ノンパラメトリック」な推論 • ベイズ推論が実現可能.

セミパラメトリックなカーネルベイズへの展開

• パラメトリック部分 + ノンパラメトリック部分(カーネル法) 例)セミパラメトリックHMM 遷移過程:条件付確率known 観測過程:unknownだがデータが存在 • 粒子フィルタ+カーネル法(D40, 金川ら) X0 X1 X2 X3 XT Y0 Y1 Y2 Y3 YT

(30)

Arthur Gretton (UCL/MPI)

Bernhard Schölkopf (MPI)

Le Song (Georgia Tech) Bharath Sriperumbudur (Cambridge)

参照

関連したドキュメント

First three eigenfaces : 3 個で 90 %ぐらいの 累積寄与率になる.

No ○SSOP(生体受入) ・動物用医薬品等の使用記録による確認 (と畜検査申請書記載) ・残留物質違反への対応(検査結果が判

 複雑性・多様性を有する健康問題の解決を図り、保健師の使命を全うするに は、地域の人々や関係者・関係機関との

READ UNCOMMITTED 発生する 発生する 発生する 発生する 指定してもREAD COMMITEDで動作 READ COMMITTED 発生しない 発生する 発生する 発生する デフォルト.

参考資料ー経済関係機関一覧(⑤各項目に関する機関,組織,企業(2/7)) ⑤各項目に関する機関,組織,企業 組織名 概要・関係項目 URL

図 キハダマグロのサプライ・チェーン:東インドネシアの漁村からアメリカ市場へ (資料)筆者調査にもとづき作成 The Yellowfin Tuna Supply Chain: From Fishing Villages in

国の5カ年計画である「第11次交通安全基本計画」の目標値は、令和7年までに死者数を2千人以下、重傷者数を2万2千人

・大都市に近接する立地特性から、高い県外就業者の割合。(県内2 県内2 県内2/ 県内2 / / /3、県外 3、県外 3、県外 3、県外1/3 1/3