今後の課題 - 議論 54

4. 議論 54

4.2 今後の課題

本研究では，基底関数と受容野の対応が主観的かつ定性的であった．そのため基底関数の区別を定量的にすることが第1の課題である．生物学実験において初期視覚野の受容野は，周波数特性と色特性で区別される[10]．よって基底関数も，

その周波数特性と色特性で区別するのが適切である．周波数特性は，基底関数をフーリエ変換し，その周波数成分で区別する方法が考えられる．特定の周波数成分しか持たない場合をガボール型，複数の周波数成分を持つ場合を同心円型とする方法である．色特性は，(赤，緑，青)の画素値で区別する方法が考えられる．

しかし，この方法には問題がある．カラー画像の画素値を既知の表色系へ変換し，

実際の生物が持つ色特性との互換性を知る必要があるからである．そのため色特性は，より定量化指標を調べる必要がある．

本研究で得られた基底関数の色のペア(図30)の中に，純粋な赤と緑の画素値を持つものは存在しなかったことが第2の課題である．この課題の解決法の一つとして，網膜における錐体細胞の分布を数理モデルに取り入れることである．本研究では，1画素は(赤，緑，青)の画素値によって表現される．これは画像を視野と考えたとき，網膜上全ての領域で錐体細胞が一様に分布している状態を意味する．しかし，網膜において錐体細胞の分布は一様でない[2]．この非一様性をモデルに入れるには，領域によって赤，緑，青のいずれかが応答しないようにモデルを変える必要がある．このモデル変化によって色相関も変化し，生物学的に確認されている純粋な赤−緑の色対が出現する可能性がある．

5. 結論

これまでの研究により冗長度圧縮原理に従った数理モデルを用いて，初期視覚野におけるガボール型(白黒ガボール型と二重反対色ガボール型)の受容野が形成できることが知られていた．しかし，同心円型(一重反対色同心円型と二重反対色同心円型)の受容野形成の数理モデルは存在しなかった．そこで本研究では、外側膝状体の神経細胞が持つローパスフィルターをカラー画像に適用した学習サンプルに対して，Fast ICAを適用することにより，二重反対色同心円型の基底関数を形成できた．しかし，一重反対色同心円型の基底関数は形成できなかった．これらの結果から，本研究は二重反対色同心円型の形成機構として，外側膝状体の神経細胞が持つローパスフィルター機構と視覚系の神経細胞が持つ冗長度圧縮原理を，また一重反対色同心円型の形成機構として，外側膝状体に一重反対色同心円型の神経細胞から初期視覚野への直接投射を提案する．

謝辞

本研究を進める上で，研究を行う機会と多大なる御助言を頂いた石井信教授，

日々の研究生活において私を直接指導して下さり，またお忙しい中でも常に親身に私を支えて下さった作村諭一准教授に，この場を借りて深く御礼申し上げます．

そして，数度に渡る議論の場を設けて頂き，的確な助言までして頂いた，吉本潤一郎准教授，京都大学の前田新一助教，理化学研究所の木村塁博士に，深く御礼申し上げます．また，本研究に対して活発な議論と貴重な助言をして頂いた，今基織博士，山尾将隆さんに心より御礼を申し上げます．また，本研究に対して多くの助言をして頂いただけでなく，本論文の作成にあたり，私の拙い文章を隅々まで何度も推敲し，その度に的確な助言をして下さった，五十嵐康伸助教に深く御礼申し上げます．また，学生生活を円滑に送るために日々支えて下さった，齋藤絵理さんに心より御礼申し上げます．そして，充実した学生生活を共に過ごして下さった森本智志さん，青木佑紀さんに，心から感謝致します．最後に，本論文を審査して下さった，石井信教授，湊小太郎教授，作村諭一准教授，吉本潤一郎准教授に深く御礼申し上げます．

参考文献

[1] http://www.cs.helsinki.fi/u/ahyvarin/.

[2] 新編色彩科学ハンドブック第2版. 東京大学出版会, 1998.

[3] Bevil R. Conway and Margaret S. Livingstone. Spatial and temporal properties of cone signals in alert macaque primary visual cortex. J. Neurosci., 26(42):10826 – 10846, 2006.

[4] A. M. Derrington and P. Lennie. Spatial and temporal contrast sensitivities of neurones in lateral geniculate nucleus of macaque. J. Physiol, 357:219 – 240, 1984.

[5] Karl R. Gegenfurtner and Daniel C. Kiper. Color vision. Annu. Rev. Neurosci., 26:181 – 206, 2003.

[6] Hubel D. H. and Wiesel T. N. Receptive fields, binocular interaction and func-tional architecture in the cat’s visual cortex. J. Physiol, 195:215 – 244, 1968.

[7] Aapo Hyvarinen. Survey on independent component analysis. Neural Computing Surveys, 2:94 – 128, 1999a.

[8] Aapo Hyvarinen. Fast and robust fixed-point algorithms for independent compo-nent analysis. IEEE Trans. on Neural Networks, 10(3):626 – 634, 1999b.

[9] L. Iwai and H. Kawasaki. Molecular development of the lateral geniculate nu-cleus in the absence of retinal waves during the time of retinal axon eye-specific segregation. Neuroscience, 159:1326 – 1337, 2009.

[10] Elizabeth N. Johnson, Michael J. Hawken, and Robert Shapley. The orientation selectivity of color-responsive neurons in macaque v1. J. Neurosci., 2008.

[11] Avi Karni and Dov Sagi. Where practice makes perfect in texture discrimination:

Evidence for primary visual cortex plasticity. Neurobiology, 88:4966 – 4970, 1991.

[12] Carole E. Landisman and Daniel Y. Color processing in macaque striate cor-tex: Relationships to ocular dominance, cytochrome oxidase, and orientation. J.

Neurophysiol, 87:3126 – 3137, 2002.

[13] D. Luenberger. Optimization by Vector Space Methods, Wiley, 1969.

[14] Jone M. and Sibson R. What is projection pursuit? J. of the Royal Statistical Society, ser. A, 150:1 – 36, 1987.

[15] Bruno A. Olshausen and David J. Field. Emergence of simple-cell receptive field properties by learning a sparse code for natural images. Nature, 381:607 – 609, 1996.

[16] Bruno A. Olshausen and David J. Field. Sparse coding with an overcomplete basis set: A strategy employed by v1? Vision Res., 37(23):3311 – 3325, 1997.

[17] Comon P. Independent component analysis - a new concept? Signal Processing, 36:287 – 314, 1994.

[18] D. R. Peeples and D. Y. Teller. Colour vision and brightness discrimination in two-month-old human infants. Science, 189:1102 – 1103, 1975.

[19] Shapley R and Lennie P. Spatial frequency analysis in the visual system. Rev.

Neurosci., 8:547 – 583, 1985.

[20] E. Sernagor, S. Eglen, B. Harris, and R. Wong. Retinal development. 2006.

[21] Dharmesh R. Tailor, Leif H. Finkel, and Gershon Buchsbaum. Color-opponent receptive fields derived from independent component analysis of natural images.

Vision Research, 40:2671 – 2676, 2000.

付録

A. スパースコーディング

コントラストフィルターを適用した画像をI(a,b)で表すことにする．ここで扱う画像は，グレースケールの自然画像であり，aは横方向の位置を，bは縦方向の位置を示す．また，I(a,b)はa，bで表される位置の画像の輝度を表している．画像は16×16画素から構成されていると想定するので，a，bは1∼16の間で離散値を取るとする．これは外側膝状体の神経細胞1つが持つ受容野の範囲を，16×16 画素分と仮定している．画像は初期視覚野の神経細胞の活動度a_iを用いて，

I(a,b)=∑

aiϕi(a,b) (40)

で表されるとするモデルを考える．ここで，ϕi(a,b)は初期視覚野での細胞iを仮定した基底関数である．

ここで，基底関数の数を192個に制限し，どのような基底関数の集合が自然画像を記述するのに適当であるかを評価する．そのために，基底関数の良さの基準を自然画像の統計的な性質に求めることを考える．

n個の基底関数により，画像を，

ˆI(a,b)=

∑n i

aiϕi(a,b) (41)

という形で近似する．源画像I(a,b)と近似した画像ˆI(a,b)との誤差を，

E₁ =∑

a,b

[I(a,b)− ˆI(a,b)]2

=∑

a,b



I(a,b)−

∑n i

a_iϕi(a,b)





(42) とし，誤差関数E₁を最小にする基底関数ϕi(a,b)と，その活動度a_iを選ぶ．

ここで，活動度aiに関して，生物の視覚系に携わる神経細胞が持つ発火特性をモデルに組み込む．この発火特性は，スパースコーディングと呼ばれている．スパースコーディングとは，生物が視覚情報を処理するとき，発火する神経細胞がなるべく少なくなるようにする情報処理戦略である．

従って，できるだけ多くのa_iが，0に近くなるようにしながら式42を最小化することを考える．このとき，基底関数は，この考えを実現できるようなものでなければならない．よって誤差関数E₂として，

E₂= ∑

a,b



I(a,b)−

∑n i

a_iϕi(a,b)





+λ

∑n i

log [

1+(a_i σ

)2]

(43) を考える．ここで，σはスケール定数である．式43第1項は，源画像との誤差をできるだけ小さくするという条件で，第2項がスパース項，すなわちaiをなるべく0に近くするという条件になっている．λはスパース項が誤差関数E₂に与える影響を調節する定数である．

実際に，パラメータϕi(a,b)とa_iを求める方法として，次のような反復試行をおこなう．まず，ϕi(a,b)を固定し，誤差関数E₂をa_iについて最小化する．

∂E₂

∂a_i =∑

a,b

ϕi(a,b)I(a,b)−∑

∑

a,b

ϕi(a,b)ϕj(a,b)a_j−λ 1+ _σ^aⁱ2

1+(_a

σi

)2 (44) これは画像が入力された際の，短いタイムスケールでの初期視覚野の細胞の活動変化を表すものと考える．

一方，初期視覚野の細胞を表すϕi(a,b)の状態変化は，活動変化の時間スケールと比較して，十分長く多数の画像の提示によって引き起こされると仮定する．

よってϕi(a,b)に関する学習則を，

∆ϕi(a,b)=η⟨ a_i[

I(a,b)− ˆI(a,b)]⟩

(45) とする．ηは学習係数であり，<… >は多数の画像に関する平均を意味する．まず，a_iを式44に従って100回更新した後，ϕi(a,b)を式45に従って1回更新する．

この操作を4,000回繰り返し，基底関数を得る．

B. 先行生物学実験の実験条件

Elizabethらは，マカク猿の初期視覚野から，輝度と色に反応する112本のニュー

ロンを選び，そのスパイク活動を記録した．まず，色に反応するかを調べた．刺

激には，赤色と緑色の帯が，視野角1度あたりに決まった波数(周波数)で交互に表れる刺激を用いた．色に反応せず，輝度にのみ反応する場合，それらの細胞は，

白黒ガボール型か複雑型に分けた．この区別は，方位選択性の有無によりなされる．方位選択性がある場合は白黒ガボール型とし，無い場合は複雑型とした．本研究では，輝度の情報を処理する受容野に関して，複雑型については触れず白黒ガボール型のみを扱う．色に反応する場合，それらの細胞を次に，一重反対色同心円型か二重反対色型かに分けた．この区別は，周波数特性によりなされた．その結果，一重反対色同心円型受容野を持つ神経細胞には，周波数に対する応答が高周波成分を通さないローパスフィルター特性(図11A)を示すものがいた．また，

二重反対色型には，低い周波数に対して応答せず，バンドパスフィルター特性(図 11B)を示すものがいた．さらに，二重反対色型は二重反対色ガボール型と二重反対色同心円型に分けた．方位選択性の有る場合を二重反対色ガボール型，無い場合が二重反対色同心円型とした．

C. 先行計算理論研究の実験条件

Olshausenらは512×512画素のグレースケール自然画像から，16×16画素の大きさの学習データ400,000個作成した．学習データにスパースコーディングを適用し，16×16画素の基底関数192個を学習した[15]．

Dharmeshらは240×320画素のカラー自然画像から，6×6画素の大きさの学習

データ20,000個を作成した．学習データにICAを適用し，6×6画素の基底関数

108個を学習した[21]．

D. ラグランジュの未定乗数法

制約条件付き最小化問題の一解法にラグランジュの未定乗数法がある．ここでは解y_kに制約を付け，近似ネゲントロピーJ(y_k)(式28)の最小化を考える．

min J(y_k), subject to K_i(w)=0, (i= 1, ...,p) (46)

ここで，Ki(w)=0はy_kの制約方程式を示す．

以下のラグランジュ関数を定義する．

L(yk, λ1, ..., λk)= J(yk)+

∑k i=1

λiHi(yk) (47)

λ1, ..., λpはラグランジュ乗数である．ラグランジュ関数(47)の最小点が，制約条

件付き最適化問題(式46)の解となる．そのため，L(yk, λ1, ..., λk)において，y_kとλi

に関する勾配が共に0になる点を探す．L(y_k, λ1, ..., λk)のλiに関する勾配は，K_i(y_k) となる．Ki(yk)=0は，元の制約条件と同じである．L(w, λ1, ..., λk)のwに関する勾配を求め，それを0と置くと，

∂J(w)

∂w +

∑k i=1

λi

∂H_i(w)

∂w =0 (48)

となる．式48の解は，式46の解に一致する．

E. ニュートン法

数値解析において，誤差関数の最小化(あるいは最大化)のため，簡単な勾配降下法より効率のよい数多くの方法が導入されている．これらの利点は，少ない反復回数で解に収束することであるが，しばしば，1回の反復に必要な計算が複雑になるのが欠点である．ここで，単純な1次の勾配よりも次の更新のよりよい方向をみつけるために，誤差関数の2次導関数に含まれる情報を利用するという意味の2次の方法を考える．明らかに，この情報は誤差関数の表す地形の曲率に関連する．ネゲントロピーJ(w)のテイラー級数から考える(2.7節を参照)．J(w)の wの周囲でのテイラー級数展開は，

J(w^∗)= J(w)+

[∂J(w)

∂w ]T

(w^∗−w)+ 1

2(w^∗−w)^T∂²J(w)

∂w² (w^∗−w)+... (49) となる．このJ(w)を最小化しようとするとき，どのように新しい点w^∗を選べば，

J(w)の値を一番減少させられるかを考える．変化量をw^∗−w= ∆wとし，

ドキュメント内 ( ) (ページ 66-76)