1
ベ 的視覚情報処理
兼村厚範
脳 視覚情報処理
眼球を通 知覚さ 視覚情報
次 高次 領 次々 処理さ
■ 例:網膜→LGN →V1 →V2 →V4 →IT 解剖学的知見
前
後
視覚皮質
各領 内 領 間
視覚情報 表現 処理 伝達
う 行わ い ?
3
仮説
仮説:
脳 効率的 情報表現を い
統計的 情報理論的 観点
効率的 情報表現 学習を定式化
■ Predictive coding
■ Bayesian surprise
■ 3D reconstruction
初期視覚 け 情報表現
5
神経細胞
樹状突起 多数 ~ 100,000 神経細胞
入力をうけ 軸索を通 自分 発火を出力
出典:IPA
神経細胞 数理モ
入力 荷 内積を閾値 比較
■ 神経細胞 可塑性=荷 変化
)
(
)
(
T1
θ
f
θ
u
I
f
r
N
i
i
i
− = −
= ∑
=
u
I
I u θ
u
I1
I2
IN
…
…
∑
ru1
u2
uN θ
f :非線形写像
7
マ 猿 視覚皮質
脳 後 側 V1, V2, …
■ 次 領 原始的 処理
高次 ほ 複雑 特徴を処理
■ 網膜:光 強さを まま伝達
■ V1:局所 ッ 等 単純 特徴抽出
■ V4:V1 広い範囲 応答 色選択性を持
■ 側頭葉:顔 表情 応
■ (Lewis & Van Essen,
2000)
受容
V1 視覚神経細胞
提示さ 画像 視覚刺激
応答 発火
各細胞 応答 や い ン あ
細胞 受容 (receptive fied) :
1. 細胞 応答 領域 場所 2. 細胞 応答 視覚刺激
形状 画像 ッ
V1
9
V1 神経細胞 受容
生 猿 視覚 電極を刺 視覚刺激を見せ
神経細胞 発火を観察
細胞 く 応 ン
=細胞 受容 を 逆相関法 検出
V1 単純型細胞 受容
■ 局所的
■ 方 選択的
■ 様々 大 さ
出典:阪大大澤研
線形ニュ ンモ 説明
線形ニュ ンモ
内積
受容 視覚刺激
高い発火率
い発火率
r = u I
T− θ
u I
細胞 応答 r
11
基底 線形結合 画像表現
1 枚 画像 ッ をN個 神経細胞 表現
■ 各神経細胞 受容 基底
■ 基底 線形結合 表現
基底関数展開
)
(
)
(
1
r
u
I f r f U
N
i
i
i
=
= ∑
=
u1
… u2
uN
I
神経細胞
画像 ッ
… …
r1
r2
rN
…
応答
ui
} {ui
]
[ 1 2 N
U = u u ! u
を並 行列
} {ui
PCA 基底 V1 を説明 い
自然画像 ッ
PCA 基底を求
V1 細胞 受容
う 形状
い
13
V1 説明 ベ 的原理主義
仮説:脳 効率的 情報表現を い
多 を扱う 科学 統計学
視覚細胞 役割を確率的 モ ン
ベ 定理
を利用 推論を こ う
Likelihood
Prior
Posterior ∝ ×
Predictive Coding
Rajesh Rao U Washington
Dana Ballard
U Texas at Austin
15
方向 再帰的結合
領 同士 結合 方向的
解剖学的知見
■ え
V1→V2 V2→V1
方向 神経接続 観察さ
同 領 内 神経細胞
再帰的 結合 見
LGN V1 V2 V4 IT
听 叺 吠 听 吀 呆 吠 听
叺 吠 吧 吚 吆
Predictive Coding 仮説
フ ッ ップ ウン 予測値を伝達
■ 各領 領 活動 予測を計算
フ フ ワ 予測 実際 値
誤差を伝達
(Rao & Ballard,
Nat. Neurosci. 1999)
17
階層ネッ ワ
各 PE(predictive estimator) 層を予測
PE 受容 PE 広い
確率モ
画像 基底関数 線形結合
神経細胞 応答を
ップ ウン (td) 予測 誤差 モ ン
応答 基底 ウ 事前分布を置く
∑
=
+
=
+
=
N
i
i
r
if
U
f
1
)
(
)
( r n u n
I
td
td
n
r
r = +
) Gauss(0,
~ σ2 n
) Gauss(0,
~ 2
td σtd
n
) ,
0 ( Gauss
~ ),
, 0 ( Gauss
~ α−1 U λ−1
r
) ( h h
td r
r = f U h 層を示
19
事後確率最大化推定
事後確率 最大 を求
(MAP)
事後確率 負 対数
■ 罰則項
)
(
)
1 (
)
1 (
22 td td 2
2
f U σ g h U
σ
E = I − r + r − r + r +
∑
=
j i
Uij
λ U
h
,
) 2
∑
(=
i
ri
g(r) α 2
r U
ボ ム ップ誤差 罰則項
い 勾配法 最適化
r U
ップ ウン誤差
受容 学習結果
学習 使 画像
ベ 1 2 受容 大 さ 画像 ッ 数 数万
ベ 1
学習さ 受容
⇒方向選択性を持 V1 類似
ベ 2
学習さ 受容
⇒ 複雑 形状
21
Endstopping 終端抑制
V1 endstopping 挙動を示
神経細胞 あ
Endstopping :
■ 刺激を提示 細胞 応答
▲ 長さ 受容 ま
長いほ 応答 い
▲ 長さ 受容 を越え 長いほ 応答 弱く
■ 層を抑制 見 く
Endstopping 予測的説明
層 予測 い あ ⇒ 誤差大 ⇒ 応答大
長い 層 存在を予測
⇒ 誤差小 ⇒ 応答小
23
Endstopping 応答 比較
くあ ま
モ 実際 神経細胞