1.は じ め に
小脳は大脳の後下部に位置する脳部位である [Eccles 67].文字どおり小さい部位であり,ヒトでは脳全体 のわずか 10%の体積しか占めていないが,そこに含ま れている神経細胞の数は脳全体の実に 80%にも及ぶ [Azevedo 09].このように膨大な数の神経細胞を背景に して,小脳は高度な情報処理を行っていると考えられて いる.小脳は,損傷すると運動失調や運動学習の消失が 見られることから,以前から運動制御・運動学習におい て重要な役割を担っていると考えられてきた [Ito 84]. 特に大脳皮質の運動野との双方向性の解剖学的な結合が あることから(大脳小脳ループ),運動野の活動を小脳 が修飾することで精緻な運動を実現していると考えられ ている.最近では前頭前野との双方向性の解剖学的な結 合も発見され,思考や直観などの高次認知機能にも関与 していることが示唆されている [Ito 11]. 小脳が何を計算しているのかについてはこれまで膨大 な数の仮説が提唱されてきたが,最も有力なものは「内 部モデル仮説」である [Wolpert 98].内部モデルとは外 界の物理的オブジェクト,例えば自身の身体や道具,あ るいは環境そのものの脳内表現であり,内部モデル仮説 とは小脳は内部モデルを学習によって獲得しているとす る仮説である.内部モデルを操作することで,例えば運 動を実行する前に結果を予測したり,目標となる運動を 実現するために必要な運動指令を事前に計算するなど, 外界に直接働きかけることなく脳内で予測やリハーサル が可能になる(図 1). 内部モデルを獲得するために,小脳は学習をしなけれ ばいけない.学習機械としての小脳の理論は 1970 年前 後に最初に提唱され(パーセプトロン仮説)[Albus 71, Marr 69],現在に至るが,一貫して教師付き学習機械 であると考えられている [Dean 10, Fujita 82, Gomi 92, Yamazaki 07a].教師付き学習機械とは,文脈信号とそ れに対する教師信号が与えられ,学習後は文脈信号の入 力に対して,対となる教師信号で与えられたものと同じ 信号を出力するようになる機械である.文脈信号・教 師信号がともに時系列であり,神経細胞の時空間発火パ ターンで表現されるような場合でも学習ができなければ ならないため,小脳は万能の時系列教師付き学習機械で あるという仮説が提唱されている [Koziol 14]. 後述するように,小脳はその簡潔かつ明快な回路構造 と,挙動を検証しやすい実験系が早くから確立されたこ とにより,分子レベルから行動レベルまで膨大な量の実 験データが存在する [Eccles 67, Ito 84, Ito 11].これら を組み合わせてすべて計算機上に実装し,数値計算を行 うことで,計算機上に小脳を再現することができる.こ のような計算神経科学(Computational Neuroscience) の研究は,計算機の性能向上とともに発展している. 本稿では,2 章でまず小脳の構造と機能についてより 詳しく解説し,次に一般の脳神経回路の数値シミュレー ション法について簡単に解説する.グラフィクスプロ セッシングユニット(GPU)を用いた計算の高速化の工 夫についても述べる.GPU による小脳の数値シミュレー ションの特徴にも触れる.脳神経回路のシミュレーショ ンを行う目的は,一つは実験的に証明することが困難な 神経科学上の問題に対して,理論的な仮説を考え,その 妥当性を検討することであり,もう一つは脳機能の工学 応用である.3 章ではそのような事例を三つ紹介する. 最後に今後の脳のシミュレーション研究に関する展望を 述べ,本稿の結びとする.小脳の計算機シミュレーション
Computer Simulation of the Cerebellum
山﨑 匡
電気通信大学大学院情報理工学研究科Tadashi Yamazaki Graduate School of Informatics and Engineering, The Universityof Electro-Communications. [email protected], http://NumericalBrain.Org/
Keywords:
cerebellum, model, spiking neuron, realtime simulation, graphics processing unit. 「脳神経系シミュレーション」 図 1 運動制御における内部モデルの役割. 運動計画が制御器によって運動指令に変換され,制御対象 を駆動して運動が起こる.運動の結果は制御器にフィード バックされ,運動指令を随時更新する.制御対象の内部モ デルはフィードバックを模倣することで,実際に制御対象 を駆動せずに運動の結果を制御器に返すことが可能になる2. 小脳神経回路のシミュレーション
2・1 小脳の構造と機能 図 2 は小脳神経回路の模式図である.小脳は 2 入力 1 出力の神経回路であり,小脳皮質と呼ばれる表層にある 主に 5 種類の細胞,入力を与える二つの核,さらに出力 を与える一つの核からなる.文脈信号は橋核から苔状線 維を介して顆粒細胞と小脳核へ,興奮性の刺激として入 力する.顆粒細胞は軸索である平行線維を介してゴルジ 細胞,バスケット細胞,星状細胞,プルキンエ細胞をそ れぞれ興奮させる.その一方,これらの細胞はそれぞれ, 顆粒細胞,プルキンエ細胞,小脳核を抑制する.教師信 号は下オリーブ核から登上線維を介してプルキンエ細胞 へと投射し,非常に強い興奮性入力を与える.小脳核が 最終的な小脳の出力を与える. 神経回路による学習は細胞同士の結合における信号伝 達の変化(シナプス可塑性)であると一般的に考えられ ている.小脳においては,平行線維─プルキンエ細胞間 シナプス(図 2 白星印)の可塑性が重要であり,特に平 行線維と途上線維が同時に発火したときにその平行線維 シナプスの伝達効率を減少させる長期抑圧(long-term depression:LTD)がその機序であると考えられている. また,学習によって獲得された記憶の一部は学習後に苔 状線維─小脳核間シナプス(図 2 灰星印)へと転送され, 長期記憶として定着することが明らかになりつつある [Yamazaki 15]. 図 2 の回路は小脳皮質核微小複合体と呼ばれており, これで一つの教師付き学習機械として動作する.この微 小複合体が一つの機能単位となり,さらに同じ回路がコ ピーされ整然と配置されて,小脳全体の回路が構成され る.脳・身体のあらゆる部位から文脈信号・教師信号が 入力するため,小脳はあらゆる文脈信号・教師信号の組 合せに基づいて学習を行う機械であると考えられる. はじめに小脳には脳全体の80%の神経細胞が存在する と述べたが,そのほぼすべては顆粒細胞である.1 mm3 当たり 100 万個存在する.この膨大な数の顆粒細胞がゴ ルジ細胞と抑制性のループを構成することで何らかの高 度な情報処理を行っていると考えられる.また,大脳皮 質の細胞は一つの細胞はたかだか数万個のシナプス結合 しかもたないが,一つのプルキンエ細胞は 20 万個もの 顆粒細胞とシナプス結合している.以下で述べるが,こ の膨大な数の顆粒細胞および平行線維シナプスの計算を いかにして効率良く行うかが,小脳のシミュレーション では重要である. 2・2 神経回路の数理モデル 図 3 は一般的な神経回路の模式図である.脳はニュー ロンと呼ばれる神経細胞が複雑に結合し合ったネット ワークである.神経細胞は,別の神経細胞から入力を受 けとる樹状突起,入力を統合する細胞体,別の神経細胞 に出力を与える軸索の 3 部位からなる.神経細胞は電気 的素子であり,膜の性質により細胞内外に電位差を生じ る.これを膜電位といい,その変化は式(1)で記述さ れる [Gerstner 14]. ( Cdvdt =-gleak(v t)-Eleak)+ Isyn(t )+ Iext(t) (1) ここで,v(t)は時刻 t での膜電位〔V〕,C は膜の キャパシタンス〔F〕,gleakは膜のコンダクタンス〔S〕,
Eleakは静止電位〔V〕,Isyn(t)は別の細胞からのシナ
プス入力〔A〕,Iext(t)はもし存在すれば直接外部から 入力される電流〔A〕である.入力がなければ v(t)は Eleakに収束する. 神経回路での情報のキャリヤはスパイクと呼ばれる電 気パルスである.スパイクは細胞内外でさまざまなイオ ンが流入・流出し,膜電位が短時間で急激に上昇・下降 することによって生成される.その機構を数学的に記述 することは可能であるが,本稿では式(2)のように抽 象化し,膜電位の値があるしきい値θを超えるとスパイ クを発射し,適当な値 Eresetまで下げるものとする. v (t)> θ ⇒スパイク発射, v(t)← Ereset (2) 式(1),式(2)は積分発火型と呼ばれる,数学的に 非常に抽象化されたモデルである.実際の細胞の形状を 無視しており,かつさまざまなイオン機構を正確に記述 図 2 小脳神経回路の模式図. 矢印は信号の伝達方向を表す.詳細は本文を参照 図 3 神経ネットワークの模式図. 詳細は本文を参照
していない.そのような 1 細胞の詳細なモデリングとシ ミュレーションの研究については 4 章で触れる. ある神経細胞が別の神経細胞にシナプスを介してスパ イクを伝達すると,後者の膜電位が変化する.前者をシ ナプス前細胞,後者をシナプス後細胞と呼ぶことにする と,スパイク入力によってシナプス後細胞には式(3) で記述される電流 Isyn(t)が加わる.
Isyn( t)=-gsyn(t)(v(t)-Esyn) (3)
ここで,v(t)はシナプス後細胞の膜電位,gsyn(t)はシ ナプスのコンダクタンス,Esynは反転電位と呼ばれる電 位である.さらに gsyn(t)は式(4)で記述される. gsyn(t)= w · gsyn f G(t -t(f))Θ(t -t(f)) (4) ここで,w はそのシナプスの結合強度を表す定数,─gsyn は最大コンダクタンス値を表す定数,G(t)は 1 発のス パイクがシナプス後細胞においてどのような膜電位の変 化を引き起こすのかを記述する関数,t( f )はシナプス前 細胞が f 番目のスパイクを発射した時刻,Θ(x)=1(x > 0),0(それ以外)である.G(t)は例えば式(5)のよ うに時定数 τ1で急速に上昇してτ2でゆっくり下降する ような関数を用いる(τ1 τ2). G(t)= e-t/τ2 -e-t/τ1 (5) シナプス電流は,シナプス前細胞ごとに計算し加算する 必要がある.また,シナプスの種類に応じてコンダクタ ンス値や反転電位などのパラメータ値が異なる.シナプ スには興奮性・抑制性の 2 種類がある.興奮性シナプス ではシナプス前細胞からグルタミン酸が放出され,それ がシナプス後細胞の受容体に取り込まれることにより, シナプス後細胞の膜電位を上昇させる.抑制性シナプス では GABA(γ-アミノ酪酸)が放出され,シナプス後 細胞の膜電位を下降させる. 神経細胞の活動によってシナプス結合の強度 w を変 化させることをシナプス可塑性という.可塑性のルール にはさまざまなものが存在するが,シナプス結合してい るシナプス前細胞と後細胞のそれぞれの発火頻度(単位 時間当たりの発射スパイク数)νpre,νpostの積に比例さ せるヘブ則 w νpre· νpost (6) と,その亜種が広く用いられている.小脳プルキンエ細 胞では,平行線維のシナプス結合強度 w を,その平行 線維の発火頻度νpfと,同じプルキンエ細胞に投射する 登上線維の発火頻度νcfの積に比例させるパーセプトロ ン則 w νpf· νcf (7) がよく用いられ,実際の実験結果とも一致する.ここで, 〈・〉は時間平均を表す.ヘブ則がシナプス前細胞と後細 胞の活動相関を用いるのに対し,パーセプトロン則は二 つのシナプス前細胞(平行線維と登上線維)の活動相関 を用い,シナプス後細胞であるプルキンエ細胞の活動を 考慮しない点が異なっている.図 2 に示したとおり,登 上線維は教師信号を伝達しており,プルキンエ細胞にお けるシナプス可塑性は教師付き学習を実現していると考 えられている. 2・3 神経回路の数値シミュレーション 以上の方程式を,モデル化する神経回路のすべての 神経細胞,すべてのシナプスについて記述し,各細胞 やシナプスの種類に合わせてパラメータを設定し,何 らかの数値計算手法で 1 単位時間∆tごとに解を数値的 に求めていくことが,神経回路のシミュレーションであ る [Brette 07].1 スレッドで計算する場合は,おおよそ 図 4 のようなプログラムになる.各計算ごとに神経細胞 に関するループを実行するのは,ある計算の際,それ以 前の計算がすべて完了していることを保証するためであ る.例えば可塑性の計算では,それまでにすべての神経 細胞の膜電位が計算済みでなければならない. 2・4 計算の高速化の工夫 一般に,あるネットワークに含まれる神経細胞数を Nとすると,同じネットワークに含まれるシナプス数は O(N2)である.このため,シナプスの計算がボトルネッ クになる.1 ニューロン当たりのシナプス数を定数にす れば O(N)となるため,そのような簡略化がもし許容 されれば,それは計算の高速化に有用であるが,大規模 な神経回路モデルには膨大な数の神経細胞が含まれる ため,そもそも N が大きいという問題もある.よって, 現実的な時間でシミュレーションを行うためには,何ら かの方法で計算を高速化する必要がある.幸い神経回路 モデルの場合,多くの計算は細胞ごとに独立に行うこと が可能であり,かつ同じ種類の細胞は同じ式の計算を行 えばよい.そのためスパコンを含むマルチコア計算機や, GPUのようなアクセラレータは広く活用されており, for(時間刻み DT で 1 ステップずつ進める){ for(すべての神経細胞に対して){ シナプス電流の計算 (); } for(すべての神経細胞に対して){ 膜電位の計算 (); } for(すべての神経細胞に対して){ スパイクの計算 (); } for(すべての神経細胞に対して){ 可塑性の計算 (); } } 図 4 神経回路モデルの数値シミュレーションプログラムの概略
並列計算によって計算を高速化している.
例えば GPU を使って CUDA [NVIDIA 15] でコード を書く場合,図 5(A)のような CPU コードは,図 5(B) のように書き直すことができ,関数 compute が GPU 上 の多数のコアで並列に実行される(ただし,関数 compute は神経細胞ごとに独立に計算してよいものとする). シナプスの計算では,シナプス前細胞とシナプス後 細胞の二重のループになるため,1 スレッドでの計算は 図 6(A)のようになる.この場合はシナプス後細胞の 個数 N_ post とシナプス前細胞の個数 N_pre を比較し て,大きいほうを並列化する.もし N_post>N_pre で あれば,シナプスの計算はシナプス後細胞ごとに独立に 計算できるから,図 6(B)のようなコードになる.一 方,N_post < N_pre の場合は,そのまま同じようにす ると加算の際に競合が起こり,正しく計算が行われない. アトミック演算を使えば競合を防ぐことができるが,並 列性が全く活かされない.定石どおり二分木を考えて, O(log N_pre)回のループでリダクションする方法や, アトミック演算を複数回に分けるなどの工夫が必要にな る.シェアードメモリをうまく使うことも重要である. 2・5 GPU による小脳のシミュレーションの高速化 小脳の神経回路のシミュレーションをするうえでは, 顆粒細胞の数の多さがとにかく問題である.逆にいうと, それ以外の神経細胞の計算にかかる時間はほとんど無視 してよい.顆粒細胞の挙動はすべて同じ方程式で記述さ れ,パラメータの数値だけが違うので,GPU のような SIMT(Single Instruction Multiple Thread)の計算モ デルと非常に相性が良く,計算を容易に高速化できる. 我々は GPU を 4 枚同時に利用して,1 枚当たり 25 万顆 粒細胞の計算に分割し,100 万個以上の細胞からなる小 脳 1 mm3のシミュレーションを実時間で実行している [Gosui 15].ここで実時間とは,1 秒間の小脳活動のシ ミュレーションを実世界の 1 秒間で完了するという意味 である.
3.事 例 紹 介
3・1 小脳のタイミング学習機構の解明 運動制御にはタイミング制御(いつ始めていつ止める か)とゲイン制御(どれくらい大きく動くか)の二つの 側面があり,両方を適切に制御することで精緻な運動が 可能になる.タイミングを制御するためには時間経過を 表現するための神経機構が必要であり,運動制御に必要 な数百ミリ秒程度の時間経過表現には小脳が関与してい ることが知られている. 小脳により時間経過表現は瞬目反射条件付けによって よく調べられている(図 7).動物に音を聞かせ(条件 刺激,CS),音が鳴っている間に目にエアパフを当てて (A) //時間に関するループ for(int t = 0; t < T; t ++){ : //神経細胞に関するループ for(int i = 0; i < N; i ++){ compute(t, i); } : } (B)__global__ void kernel(int t) {
int i = blockIdx.x * K + threadIdx.x; compute(t, i); } for(int t = 0; t < T; t ++){ : kernel<<<N/K, K>>>(t); : } 図 5 シミュレーションプログラム(A)のGPUを用いた並列化(B). Tは最大のステップ数,N は神経細胞数,K は一つの計算ブ ロックにいくつの神経細胞を含めるかのパラメータである (A) : // i:シナプス前細胞 , j: シナプス後細胞 for(int i = 0; i < N_post; i ++){ for(int j = 0; j < N_pre; j ++){ g[i] += w[i][j] * psp[j]; } } : (B)
__global__ void kernel(int t) {
int i = blockIdx.x * K + threadIdx.x; for(int j = 0; j < N_pre; j ++){ g[i] += w[i][j] * psp[j]; } } : kernel<<<N_post/K, K>>>(); : 図 6 シナプスの計算(A)の GPU を用いた並列化(B). N_postはシナプス後細胞の細胞数,N_pre はシナプス前 細胞の細胞数,g は式(4)のコンダクタンス値,w[i][j] は細胞 i, j 間のシナプスの結合強度,psp[j] は式(4)の 積分の値であり,あらかじめ計算され配列に格納されてい るとする 図 7 瞬目反射の条件付け
(侵害刺激,US)瞬きを起こさせる.このとき,音が鳴 り始めてからエアパフを当てるまでのインタバルを,例 えば 500 ミリ秒なら 500 ミリ秒に決めておく.これを 何度も繰り返すと,動物は音を聞くだけで瞬きをする (条件反応,CR)ようになるが,単に瞬きをするのでは なく,事前に決めたインタバルで瞬きをする.小脳を損 傷するとこの課題はできなくなるので,小脳のどこかで CS-US間の時間経過が表現されていることになる.言 い換えると,エアパフ信号の時系列が内部モデルとして 小脳内に形成されたことになる.条件付け可能なインタ バルは 100 ミリ秒∼ 2 秒程度であることが実験的にわ かっている.神経細胞の時定数は数ミリ秒∼数十ミリ秒 であるから,そのような素子を用いて数百ミリ秒∼数秒 程度の時間スケールのダイナミクスをつくり出すことは それほど自明ではない. 瞬目反射条件付けにおいて,CS の信号は文脈信号で あり,音が鳴っている間持続するスパイク列として苔状 線維から入力する.US の信号は教師信号であり,エア パフのタイミングで 1 発のスパイクとして登上線維から 入力する(図 2 参照).また,小脳核の出力が CR となり, まぶたの筋肉を収縮させ瞬きを起こす.条件付け開始時 は,音が鳴っている間プルキンエ細胞はスパイクを発射 し,エアパフの有無にかかわらず小脳核を抑制し続ける. 一方,条件付け完了後は,プルキンエ細胞はエアパフが 与えられるタイミングの直前にスパイク発射を止める. これにより小脳核がエアパフのタイミングでスパイクを 発射し,瞬きをする.よって,プルキンエ細胞は時間間 隔の情報をもっていることになる.一方,苔状線維のス パイク列は時間的に定常であり,時間情報は含まれてい ないことがわかっている.よって,時間情報はその途中, 顆粒細胞とゴルジ細胞からなる局所ネットワークで生成 されているものと考えられる. その真偽は実際の動物の顆粒細胞から記録を取れば明 らかになるが,顆粒細胞は脳内で最も小さい細胞なので, 記録が非常に難しく,覚醒動物を用いてきちんと記録し た報告はいまだ存在しない.そこで計算機シミュレー ションの出番となる.顆粒細胞─ゴルジ細胞の局所ネッ トワークで時間情報が生成されるかどうかを検討する. 我々の小脳モデルで瞬目反射条件付けをシミュレート すると,時間的に定常な苔状線維入力に対して,個々の 顆粒細胞は時間的に非定常な活動パターンを示す(図 8). このパターンは一見ランダムだが,同じ刺激に対しては ノイズによる揺らぎを除いて同じ活動パターンを示すこ とから,再現性がある.各時刻ごとに活動する顆粒細胞 を集団として見ると,各時刻ごとに集団は一意に定まり, かつ時間の経過に伴って徐々に遷移していくことがわか る.このようにして,活動する顆粒細胞集団の時間的な 遷移によって時間経過を表現し得る.エアパフのタイミ ングで活動する顆粒細胞集団は一意に定まるから,その 集団の平行線維をパーセプトロン則で減弱すれば,プル キンエ細胞は,エアパフのタイミングでスパイク発射を 止め,条件付けが完成する(図 9). 小脳内に膨大な数の顆粒細胞が存在する理由として, これまでにさまざまな説が考えられてきたが,我々はあ らゆる文脈信号を,それぞれ固有の空間パターンにとど まらず時空間パターンに変換するために必要になるから であると考えている.このように,文脈信号である時系 列信号を一度より高次元の別の時系列信号に変換し,超 平面上での分離性を高めたうえで例えばパーセプトロン 則を用いて教師付き学習を行う機械学習法には,レザボ ア計算(Reservoir Computing)という名称が付いている. 小脳はレザボア計算を行っていると考えられる有力な脳 部位である [Yamazaki 07a].同じ機構でゲイン制御も 可能であることを報告しているが [Yamazaki 12],紹介 はスペースの都合で割愛する. 図 8 瞬目反射条件付けのシミュレーションにおける,音刺激呈 示時の顆粒細胞の活動パターン [Yamazaki 13]. 時刻 0 で音刺激が与えられ,650 ミリ秒間持続する.細胞 1 000個のスパイク発射パターンを表示しており,黒丸がス パイクを表す 図 9 瞬目反射条件付けのシミュレーションにおけ る,トレーニング中のプルキンエ細胞(上段) と小脳核(下段)のスパイクパターンの変化. プルキンエ細胞はエアパフのタイミングでスパ イク発射を停止するように学習し,小脳核への 抑制を解除することで,小脳核がスパイクを発 射するようになる.エアパフは音が鳴ってか ら 500 ミリ秒後に与えられるとしてシミュレー ションを行った [Yamazaki 07b]
3・2 小型ヒューマノイドロボットの適応制御 実時間シミュレーションの利点の一つは,実時間で情 報処理が行えるということである.小脳モデルを使った 信号処理やアクチュエータの制御が可能になる.そこで, 小脳モデルのデモンストレーションとして,小型ヒュー マノイドロボットによるバッティングのタイミング学習 を行った [Yamazaki 13]. ホビー用のピッチングマシンを用意し,ピンポン球 大のボールを発射すると,発射したという情報を苔状線 維に加える.ロボットは手にうちわをもっていて,それ をスイングすることが可能である(図 10).正しいタイ ミングでスイングすればボールを打ち返すことができる が,失敗するとボールはロボットの背後にあるバック ネットに衝突する.その情報を教師信号として登上線維 に与える.小脳の出力はロボットのスイングの運動指令 となる.ボールの発射を CS,スイングを CR,ボール がバックネットにぶつかることをスイングの失敗として 解釈し US とみなせば,これはまさに瞬目反射条件付け である. ロボットは最初の数トライアルは振り遅れるが,徐々 にスイングのタイミングが早くなり,10 トライアル程 度でボールを打ち返すことに成功した(図 11).ボール が発射されてからバックネットに当たるまでの時間は 600ミリ秒程度であり,この程度の時間スケールで実機 の制御が可能であることを示した.また,これは実際の 瞬目反射条件付けで用いられる時間間隔と同等である. このように非常にリアリスティックな神経回路モデルを 用いて実機の制御ができたことは,「脳っぽい何か」で はなく「脳そのもの」の人工物による運動機能の代替の 可能性を強く示唆する. 3・3 運動記憶の固定化のシミュレーション 実時間シミュレーションのもう一つの利点は,非常に 長時間のシミュレーションを現実的な時間で実施できる ことである.運動学習では毎日 1 時間程度のトレーニン グを 1 週間程度連続して行う.これは,新しい記憶が形 成されるのはトレーニング中だが,その記憶が定着する のはトレーニング後だからである.記憶の形成過程は, トレーニング中のたかだか数時間分の神経活動を記録し 続けることで実験的に追跡可能であるが,記憶の定着過 程は,トレーニング後の数十時間∼数日間継続して記録 し続けなければいけない.そのため記憶の形成過程の研 究は膨大に存在するが,記憶の定着過程の研究は非常に 少ない.そこで計算機シミュレーションの出番となる が,一般に計算機シミュレーションは現実の時間に比べ て 10 ∼ 100 倍程度遅いため,数十時間∼数日分のシミュ レーションは,これまで実質的に不可能だった.しかし シミュレーションが実時間になり,1 週間のトレーニン グのシミュレーションが 1 週間で完了するようになった ことで,ようやくその研究が可能になった. 我々は小脳が関与する眼球運動の学習課題において, 1週間毎日トレーニングすることによって,運動の記憶 がどのように形成され定着するのかを,実際に 1 週間計 算を行うことで検討してみた.その結果,毎日のトレー ニングによって,平行線維─プルキンエ細胞間シナプス の結合強度が変化して記憶が形成されるが,その記憶は トレーニング後に徐々に消失してしまった.しかし消失 の過程で苔状線維─小脳核間シナプスの結合強度が変化 し,そこに記憶が定着することがわかった.この結果 図 10 バッティングロボット [Yamazaki 13]. (A)ピッチングマシン,(B)うちわをもつロボット 図 11 バッティング中のロボットの動作
は,我々がすでに発表した記憶の定着過程の理論モデル (図 12)[Yamazaki 15] と定性的に一致しており [Gosui 15],シミュレーション結果の妥当性を示唆している. この結果は,単に従来不可能だった長時間のシミュ レーションが可能になったことを示すだけでなく,本物 を模倣した人工小脳を計算機の中で育成することが可能 になったということを意味する.外から適当に刺激を与 えてやれば,人工小脳はそれに基づいて学習し挙動を変 更する.機能モジュールとして自律することで,永続的に 学習し記憶を蓄え続ける装置としての利用が可能になる.
4.まとめと今後の課題
本稿では,脳神経回路のシミュレーション,特に小脳 のシミュレーションの現状について紹介した. 1章でも述べたが,小脳は脳の中でも恐らく最も深く 研究され,理解が進んでいる部位である.全脳アーキテ クチャ*1研究においては,脳をきちんと定義された機械 学習器の組合せとみなし,人工的に構成した機械学習器 を組み合わせることで,人間並みかそれ以上の能力をも つ汎用の知能機械の構築を目指しているが,小脳はその ための最も先導的な役割を果たし得る脳部位であると強 く予想される.小脳は運動制御のみならず近年は高次脳 機能への関与が示唆されていることから [Ito 11],小脳 を足掛かりにして大脳皮質へアプローチすることも可能 であろう.その意味で,まず小脳をきちんと理解し,か つ将来全脳アーキテクチャのビルディングブロックとし て利用可能な,小脳の機能モジュールを提供していくこ とは大切である. 本稿では神経細胞の具体的な形状については触れな かったが,本来神経細胞はそれぞれ異なった特徴的な形 状をしている.例えばプルキンエ細胞は二次元平面上に 広範囲に広がった,文字どおり樹の枝のような樹状突起 をもつ.このような神経細胞では,異なる樹状突起末端 のシナプスへの入力が細胞内でどのように合流し,どの ような細胞応答を引き起こすのかが,何らかの機能的意 義をもっている可能性がある.神経細胞の形状までを考 慮する場合は,膜電位の方程式は偏微分方程式になり, 数値解法が複雑になる.特に陰解法で求解する場合は連 立方程式を解かなければならないため,並列計算上の工 夫が必要となる [Mascagni 98].実際,小脳細胞の形状 や多数のイオン機構を考慮した非常に詳細な単一細胞 のモデルも多数発表されている(顆粒細胞・ゴルジ細胞 [Solinas 10],プルキンエ細胞 [De Schutter 94],小脳核 [Steuber 11]).これらを接続すれば非常に精緻な小脳神 経回路のシミュレーションが可能になるが,計算資源の 問題でいまだ実現していない.同様に,シナプス可塑性 は本来であれば,非常に詳細な分子カスケードの反応方 程式を解いていかなければならないが,本稿では単に定 数を直接変更することで簡略化した.神経回路のダイナ ミクスは非線形なので,非常にミクロなパラメータがマ クロなダイナミクスに影響を及ぼす可能性は否定できな い.より詳細なシミュレーションは今後の課題である. 全脳アーキテクチャが解明された暁には,病気や事故 によって損なわれた脳機能の一部を,人工脳で代替でき る未来が訪れるかもしれない.小脳に限っていえば,そ のような研究はすでに始まっており [Alonso 14],予備 的な結果が出始めている.実際の脳を代替するためには 計算の実時間性が非常に本質的である.GPU のような 汎用アクセラレータのみならず,FPGA[Luo 14]やニュー ロチップ [Merolla 14] などの,高性能かつ省電力のハー ドウェアが求められる.これは神経科学と計算科学が切 り拓いていく未来の一つである. 最後に,我々が開発しているソフトウェアのソース コードのいくつかは,小脳プラットフォーム*2で公開さ れている.他にも文献情報などさまざまなリソースがあ るため,ご覧いただけたら幸いである. 謝 辞 本稿で紹介した研究の一部は,JSPS 科研費(20700301, 23300055,26430009),人工知能研究振興財団助成金, INCF日本ノード小脳プラットフォームの支援を受けて いる. 図 12 記憶の定着過程のシミュレーション [Yamazaki 15]. (A)視機性眼球運動(OKR)のゲイン適応課題における, 5日間のトレーニングでのゲイン変化.頭部を固定した状 態で視界が動くと,目はそれと同じ方向に動いて像のぶ れを減少させる.この反射運動を OKR と呼び,そのとき の目の動きの大きさをゲインと呼ぶ.目の前に模様の描 いてあるスクリーンを置き,1 時間程度左右にゆっくり動 かし続けると,ゲインは大きくなり,より像のぶれを減 少させるように適応する.これを毎日 1 時間繰り返すと, 少しずつゲインが大きくなり,記憶として定着していく. エラーバー付きの黒丸は実際の動物実験の結果,太線は 理論モデルの結果である.(B)そのときの平行線維─プル キンエ細胞間シナプス(灰色)と,苔状線維─小脳核間シ ナプス(黒)の結合強度.前者は 1 時間のトレーニング で減少し,トレーニング後は元に戻る.後者はトレーニ ング後にゆっくり増加する.前者が短期記憶,後者が長 期記憶に相当する *1 http://www.sig-agi.org/wba *2 https://cerebellum.neuroinf.jp/◇ 参 考 文 献 ◇
[Albus 71] Albus, J.S.:A theory of cerebellar function,
Mathematical Biosciences, Vol. 10, pp. 25-61(1971)
[Alonso 14] Alonso, I. H., et al.: A cerebellar neuroprosthetic system: Computational architecture and in vivo experiments,
Frontiers Bioengineering and Biotechnology, Vol. 2, pp. 1-17
(2014)
[Azevedo 09] Azevedo, F. A., et al.: Equal numbers of neuronal and nonneuronal cells make the human brain an isometrically scaled-up primate brain, J. Comparative Neurology, Vol. 513, pp. 532-541(2009)
[Brette 07] Brette, R., et al.: Simulation of networks of spiking neurons: A review of tools and strategies, J. Computational
Neuroscience, Vol. 23, pp. 349-398(2007)
[De Schutter 94] De Schutter, E. and Bower, J. M.: An active membrane model of the cerebellar Purkinje cell. I. Simulation of current clamps in slice, J. Neurophysiology, Vol. 71, pp. 375-400(1994)
[Dean 10] Dean, P., Porrill, J., Ekerot, C.-F. and Jörntell, H.: The cerebellar microcircuit as an adaptive filter: Experimental and computational evidence, Nature Reviews Neuroscience, Vol. 11, pp. 30-43(2010)
[Eccles 67] Eccles, J. C., Ito, M. and Szentágothai, J.: The
Cerebellum as a Neuronal Machine, Springer-Verlag, NewYork
(1967)
[Fujita 82] Fujita, M.: Adaptive filter model of the cerebellum,
Biological Cybernetics, Vol. 45, pp. 195-206(1982)
[Gerstner 14] Gerstner, W., Kistler, W. M., Naud, R. and Paninski, L.: Neuronal Dynamics: From Single Neurons to Networks and
Models of Cognition, Cambridge(2014)
[Gomi 92] Gomi, H. and Kawato, M.: Adaptive feedback control models of the vestibulocerebellum and spinocerebellum,
Biological Cybernetics, Vol. 68, pp. 105-114(1992)
[Gosui 15] Gosui, M. and Yamazaki, T.: Realtime simulation of memory consolidation in a large-scale cerebellar model, Proc.
INCF Congress Neuroinformatics 2015, doi: 10.3389/conf.
fnins.2015.91.00069(2015)
[Ito 84] Ito, M.: The Cerebellum and Neuronal Control, Raven Press, NewYork(1984)
[Ito 11] Ito, M.: The Cerebellum: Brain for an Implicit Self, FT Press(2011)
[Koziol 14] Koziol, L.F., et al.: Consensus Paper: The cerebellum’s role in movement and cognition, The Cerebellum, Vol. 13, pp. 151-177(2014)
[Luo 14] Luo, J., et al.: A Scalable FPGA-based cerebellum for passage-of-time representation, Proc. 36th Annual Int. Conf. of
the IEEE Engineering in Medicine and Biological Society, pp.
3102-3104(2014)
[Marr 69] Marr, D.: Atheory of cerebellar cortex, J. Physiology, Vol. 202, pp. 437-470(1969)
[Mascagni 98] Mascagni, M. V. and Sherman, A. S.: Numerical Methods for Neuronal Modeling, in Koch, C. and Segev, I. eds.,
Methods in Neuronal Modeling, MIT Press(1998)
[Merolla 14] Merolla, P. A., et al.: A million spiking-neuron integrated circuit with a scalable communication network and interface, Science, Vol. 345, pp. 668-673(2014)
[NVIDIA 15] NVIDIA: CUDA Programming Guide 7.0, NVIDIA (2015)
[Solinas 10] Solinas, S., Nieus, T. and D’Angelo, E.: A realistic large-scale model of the cerebellum granular layer predicts circuit spatio-temporal filtering properties, Frontiers in
Cellular Neuroscience, Vol. 4, pp. 1-17(2010)
[Steuber 11] Steuber, V., et al.: Determinants of synaptic integration and heterogeneity in rebound firing explored with data-driven models of deep cerebellar nucleus cells, J.
Computational Neuroscience, Vol. 30, pp. 633-658(2011) [Wolpert 98] Wolpert, D. M., Miall, R. C. and Kawato, M.: Internal
models in the cerebellum, Trends in Neuroscience, Vol. 2, pp. 338-347(1998)
[Yamazaki 07a] Yamazaki, T. and Tanaka, S.: The cerebellum as a liquid state machine, Neural Networks, Vol. 20, pp. 290-297 (2007)
[Yamazaki 07b] Yamazaki, T. and Tanaka, S.: A spiking network model for passage-of-time representation in the cerebellum,
European J. Neuroscience, Vol. 26, pp. 2279-2292(2007) [Yamazaki 12] Yamazaki, T. and Nagao, S.: A computational
mechanism for unified gain and timing control in the cerebellum, PLoS ONE, Vol. 7, e33319(2012)
[Yamazaki 13] Yamazaki, T. and Igarashi, J.: Realtime cerebellum: A large-scale spiking network model of the cerebellum that runs in realtime using a graphics processing unit, Neural Networks, Vol. 47, pp. 103-111(2013)
[Yamazaki 15] Yamazaki, T., Nagao, S., Lennon, W. and Tanaka, S.: Modeling memory consolidation during post-training periods in cerebellovestibular learning, Proc. National
Academy of Sciences of the United States of America, Vol. 112,
pp. 3541-3546(2015) 2015年 7 月 19 日 受理