DOI: http://dx.doi.org/10.14947/psychono.34.8
条件づけにおける時間 I
―古典的条件づけ―
神 前 裕
a, b*・時 暁 聴
a・松 井 大
a・
新 保 彰 大
a・藤 巻 峻
a, c a 慶應義塾大学社会学研究科心理学専攻 b 慶應義塾大学先導研究センター c 日本学術振興会Roles of temporal information in conditioning I: Classical conditioning
Yutaka Kosaki*, Xiaoting Shi, Hiroshi Matsui, Akihiro Shimbo, and Shun Fujimaki
a Department of Psychology, Keio University b Advanced Research Centers, Keio University
c Japan Society for the Promotion of Science
Throughout the history of research on animal learning, it has been widely acknowledged that the temporal rela-tionship between events exerts a critical influence on the acquisition of a conditioned response. Until more recently, however, no explicit and systematic studies had investigated how animals learn the temporal relationship itself. In this article, we first review some basic functions of temporal information in classical conditioning. We then focus on one influential learning theory, temporal coding hypothesis, which posits that animals can automatically encode temporal relationships between events and express learned behaviour through integration of multiple temporal rela-tionships acquired across contexts. After reviewing basic results supporting the temporal coding hypothesis, we present an alternative explanation of some temporal coding-like phenomena on the basis of AESOP model com-bined with the potentially different contributions of motivational and sensory US representations in higher-order conditioning. In a second article (Fujimaki, Shimbo, Matsui, Shi, & Kosaki, 2015), we will discuss interval timing in operant conditioning and neural substrates of timing behaviour.
Keywords: classical conditioning, temporal coding hypothesis, higher-order conditioning, backward conditioning,
AESOP model 1. は じ め に 動物は時間的,空間的広がりを持った環境の中に生き ている。ある事象と別の事象が何かしらの関連性を持っ ていることを知ることは動物にとって重要であるが,そ こに事象間の時間的,空間的な関係性を含まない情報 は,環境への適応において不十分である。したがって動 物の学習行動に関する根本的な理解は,時間および空間 に関する情報を動物が処理するメカニズムの解明なしに は成り立たない。 時間情報は,Pavlov以来,動物の学習において核心的 な役割を果たすことが知られてきたが,それは主に条件 づけの強度を決定する要因としての重要性であり(例え ばHull, 1943),事象間の時間関係そのものを動物がどの ように学習しているかについては,より近年になるまで 系統立った研究は見られなかった。本稿および別稿(藤 巻・新保・松井・時・神前,2015)では,これまで明ら かになってきた条件づけ学習における時間情報の果たす 役割を広く概観し,今後の研究の方向性を探ることを目 的とする。本稿では古典的条件づけにおける時間の役割 および時間に関する学習を取り扱い,別稿ではオペラン ト条件づけにおける計時研究,そして時間学習の神経基 盤に関する研究を概観する。時間情報の学習にはミリ秒 Copyright 2015. The Japanese Psychonomic Society. All rights reserved. * Correspondence author. Department of Psychology, Keio
University, 2–15–45 Mita, Minato-ku, Tokyo, 108–8345, Japan. E-mail: [email protected]
単位の学習から,日周期や季節変動に基づく数時間から 数カ月単位の学習,さらには数年単位におよぶ学習まで 非常に広い水準があるが,ここでは条件づけ学習におい てよく用いられる数秒から数分単位の時間水準を取り扱 うことにする。 2. 古典的条件づけにおける時間 本章では,古典的条件づけにおいて時間が連合の形成 に果たす役割を簡単に概観したうえで,動物が複数事象 の時間的配置をどのように学習し,利用しているのかと いう問題を,Millerらが提唱した時間的符号化仮説を中 心として見ていくことにする。 2.1 時間的符号化仮説以前 2.1.1 事象間の時間的接近と時間的順序 条件づけ 研究において,条件刺激(conditioned stimulus: 以下CS とする)と無条件刺激(unconditioned stimulus: 以下 USとする)との間の時間関係が重要であることは古く からよく知られてきた。CSとUSの時間関係の決定的な 重要性を表す例として,CSがUSに先行する通常の順行 条件づけに比べて,CSとUSが同時に生起する同時条件 づけ,あるいはUSがCSに先行する逆行条件づけでは, 同じ刺激を用いても条件反応(conditioned response: 以 下CR)が生じにくいということが挙げられる(例えば Asratyan, 1965; Smith, Coleman, & Gormezano, 1969)。また 順行条件づけにおいても,CS開始からUS呈示までの時 間間隔を独立変数として変化させ,得られたCRの強度
を従属変数としてプロットすると,逆U字型の時間–反応
曲線が得られることが,アメフラシからヒトまで広い種 において,様々な条件づけ課題において確認されている (例えば Clark, Hawkins, & Kandel, 1994; Garcia, Ervin, &
Koelling, 1966; Schneiderman, 1966; Smith et al., 1969)。接 近の原理と呼ばれるこのような事象間の遅延に依存した 学習量の変動はオペラント学習事態においてもみられ, オペラント反応と強化子の間の遅延も同様に遅延時間依 存的に反応率の低下をもたらすことが知られている(例 えばDickinson, Watt, & Griffiths, 1992; Hull, 1943)。これら は時間がその形態を問わず条件づけ学習に共通して根本 的な役割を果たすことを示している。 Pavlov (Pavlov, 1927, p. 104)によれば,条件づけは, USの直前に存在していた特定の神経系の活動状態のパ ターンと,USによって引き起こされるURとの間に生じ る。言い換えれば,CSが引き起こす様々な神経活動状 態のうち,有効なCSとしてUSとの間に条件づけが成立 するのはUSの直前に生じていた特定の活動状態である。 したがって,逆行条件づけや痕跡条件づけにおいて US が条件づけるのはその直前の,刺激が実際にはすでに消 失したあるいは存在しない時点での神経活動状態であ り,これがCS存在時の活動状態とどの程度類似してい るかによってCSに対する条件づけの強度が決まること になる。これはまた,動物が事象間の関係性に関する学 習を,常にある一方向の時間の流れ―現在から未来へ― に沿って行うことを意味している。学習という機能の適 応的な意味を考えたときに,これは極めて妥当な仮定で あるように思われる2。この考えに従えば,逆行条件づ けや長い痕跡期間を用いた痕跡条件づけでは,US呈示 直前にはCSによって引き起こされた活動は弱化あるい は消失しており,CSが存在しない試行間の状態,すな わち文脈刺激とより類似しているため,CSに対しては 学習が生じない。この考えは, 様々な痕跡期間を用いた 痕跡条件づけにおいてCSに対する学習と文脈刺激に対 する学習が負の相関を示すという結果(Marlin, 1981) や,上記のオペラント条件づけの遅延強化場面におい て,文脈刺激の消去訓練を同時に行うことによって反応 と強化子呈示の間に長い遅延を導入しても反応が獲得さ れ得るという結果からも支持される(Dickinson et al., 1992; Dickinson, Watt, & Varga, 1996)。さらに,逆行条件
づけにおいてCSの生起はUSがしばらくの間到来しない
ことを予告するために,逆行性CSは制止性の連合強度 を獲得すると予測されるが(Pavlov, 1927),実際にその ような予測を支持する結果が得られている(Barnet & Miller, 1996a; Kamin, 1963; Moscovitch & LoLordo, 1968; Sie-gel & Domjan, 1971)。ただし,逆行条件づけによって興 奮性CRが生じるという報告も数多く存在する(例えば Heth, 1976; Wagner & Terry, 1975)。興奮性CRあるいは制 止性CRのどちらが形成されるかに関しては,試行数や 刺激間間隔といった要因が逆行条件づけの成立に影響す ることが知られている(詳細は漆原,1999を参照)。 2.1.2 随伴性と事象間間隔 事象間の接近性が連合 の形成に重要な役割を果たすことに疑いの余地は無い が,より近年の連合学習理論は基本的な学習メカニズム として事象間の随伴性を重視してきた(Kamin, 1968; Mackintosh, 1975; Pearce & Hall, 1980; Rescorla, 1968; Re-scorla & Wagner, 1972; Wagner, Logan, Haberlandt, & Price,
2 これは回顧的学習が成立しないということを意味す るものではない。回顧的再評価においては,現在新 たに得られた情報を元に,過去に形成された事象間 の「予測」,すなわち前向的な学習が修正されるので あって,修正される予測関係自体は常に現在から未 来へ向かう流れに沿ったものである。
1968)。これは,ある特定のCSとUSとの間に連合が形 成される程度はそのCSとUSとの関係のみならず,当該 CS以外に存在する全ての刺激がUSを予告する程度との 相対的な関係によって決定されるというものであり,こ れによってブロッキング(Kamin, 1968)や隠 (Pavlov, 1927)といった刺激間の接近性のみでは説明できない現 象をよく説明することができる。しかしこれらの理論に は接近性を表すパラメータは入っておらず,ある刺激と USとの時間間隔のみが変化するような場合には,これ らの理論は当該刺激の連合強度の変化という間接的な形 でしかその影響を取り扱うことはできない。 この点をより明示的な形で扱った研究として,事象間 間隔および試行間間隔(inter-trial interval: 以下ITIとす る)を変数として取り入れたGibbonらの研究がある。 Gibbon, Baldock, Locurto, Gold, & Terrace (1977)は,ハト の自動反応形成手続きを用いて,キーが点灯している試 行時間(つまりCS開始からUS呈示までの時間; 以下T とする)とキーが消灯している時間(以下Iとする)を系 統的に変化させることの反応獲得への影響を調べた。そ の結果,一定のIの下ではTが増加するにしたがって獲 得に要する試行数は増加したが,Tが一定の場合にはIが 増加するにしたがって反応獲得に要する試行数は減少し た。さらに,獲得までの試行数はTあるいはIの絶対値で はなく,TとIとの比率I/Tによって決定されることが明 らかになった。つまり,条件づけの速度は,CS呈示から US呈示までの時間Tそのものではなく,CSが存在しない 時間IとTとの比較によって決定されることを見出したの である。これはCSと文脈刺激を含むその他の刺激の持つ 予測価の比較によって連合強度の変化が決定されるとす る随伴性理論の考えと一致するが,CS–US間隔やITIと いった時間的側面に関する情報を連続的に記述すること を可能にした点で重要である。こうしたGibbonらの考え は,時間は条件づけの結果として獲得される連合に付随 した情報ではなく,逆に時間情報こそが学習の根本にあ り,CSが次のUSの到来時間に関してもたらす情報量の 変化こそが反応を生起させる根本的な要因である,とい う情報理論的なアイデアへとつながっていくことになる。 一方,事象間の連合および随伴性の概念を保ちなが ら,刺激間の時間関係を刺激表象の時間的変化として学 習モデルに取り入れた理論として,Wagner (1981)の SOP理論がある。概要として,SOP理論では刺激は個体 内で3つの異なる表象状態を取り,時間によってその状 態が遷移するとされる。直接的に知覚された刺激はまず 1次活性状態(A1)に表象され,この表象が時間ととも に素早く減衰し,2次活性状態(A2)へ移行する。そし てA2は時間経過とともにより緩やかに不活性状態(I) へと遷移する。大まかに言うと,これら3つの状態は刺 激に対して向けられる「注意」の水準に相当する。ある 刺激が連合強度を獲得するのは注意を向けられた状態, すなわちA1にあるときのみであり,2つの刺激表象がと もにA1にあるときにはそれらの間に興奮性の連合が, A1とA2にある場合にはA1にある刺激からA2にある刺 激への制止性の連合が形成されることになる。実際には ある刺激の表象はそれを構成する要素の集合からなり (各要素は刺激の細かな特徴に対応する),そして各要素 の各活性状態への遷移は確率的に表現される。ある刺激 表象についてA1およびA2状態にある要素の割合は時間 の関数として表され,通常,実際の刺激呈示によって A1に活性化された多くの要素は刺激呈示終了直後から 急速にA2に減衰を始めるが,これに対応して増加した A2状態の要素は,より緩やかにIへと減衰する。これは A1からA2への減衰確率がA2からIへの減衰確率よりも 高く設定されるからである(これらの減衰確率は減衰先 の状態の容量と反比例すると仮定される)。具体的な適 用例を示すと,例えば痕跡条件づけにおいてCRが生じ にくいのは,USが呈示される時点においてCS表象のう ち多くの要素がすでにA1から減衰しA2にあるからであ る。また逆行条件づけにおいては,USが呈示された直 後,つまり US表象の大部分がまだA1にある時点でCS が呈示されると興奮性の逆行連合が生じ,より長い時間 間隔でCSが呈示されるとUS表象の多くはすでにA2状 態にあるため,制止性の連合が獲得されることになる (SOP理論に基づく逆行条件づけのシミュレーションと しては,Mazur & Wagner, 1982を参照)。また,特に次節 で述べるような,CRが時間的に分化する現象を取り扱 うことを可能とする発展型として,C-SOP理論 (Bran-don, Vogel, & Wagner, 2003)が提唱されている。元来の SOP理論ではCS表象の各要素はCS呈示によって,試行 ごとにCS中のランダムな時間位置でA1に活性化される とされていたが,この C-SOPでは各要素が複数試行を 通じて一定の時間位置でA1に活性化され,それらがUS と独自に連合を形成することで, 時間的な分布を持った CRが表出されるとしている(Brandon et al., 2003)。この 他にもSOP理論は連合する刺激がCSであるかUSである かを問わず適用できるため,CS同士の連合を説明する ことに困難を示さないという特徴がある。さらに SOP およびその発展モデルは馴化や刺激般化,刺激間競合と いった様々な現象をよく説明するが,紙数の制限上,こ こでは刺激間の時間関係について触れるにとどめたい。 SOP理論によるこうした多様な現象の説明については今
田・漆原(2003)を参照されたい。 2.1.3 時間関係の学習 これまでに述べたような研 究が,総じて事象間の時間関係がCRの強度におよぼす 影響を調べたものであるのに対し,事象間の時間関係が CRの生起タイミングに影響を及ぼすことを示唆する研 究もある。例えばPavlov (1927)は長いCS–US間隔を用 いた条件づけでは,CRはCSの終わりにかけて,すなわ ちUSの直前に生じやすいことを報告している。また彼 が「時間条件づけ」と呼んだ,現在は固定時間(fixed time)スケジュールとして知られる状況においても,餌 が予期される時間の前後に唾液反射が出現することを 報告し,”時間間隔が条件刺激としての性質を獲得した ことは明らかである”としている(Pavlov, 1927, p. 41)。 これと同様の結果は後年,より定量的な形で数多く報告 さ れている(例 え ば Davis, Schlesinger, & Sorenson, 1989; Delamater & Holland, 2008; Drew, Zupan, Cooke, Couvillon, & Balsam, 2005; White, Kehoe, Choi, & Moore, 2000)。Pavlov
の考えによれば,長い遅延を伴う条件づけにおいてCRが US直前のタイミングに生じやすいのは,CSによって引き 起こされる内的反応が時間とともに変化し,その中でUS の直前に生じていた活動パターンが有効なCSとして条件 づけられるからである(Mackintosh, 1974)。このような, 強化された時点でのCSによって惹起される内部状態のパ ターンと,現在の内部状態の活動パターンとの比較に よって時間特異的な反応が生起するという考え方は,そ の詳細においては大きく異なるものの,その後様々な計 時行動理論において広く共有されてきた(例えばBuhusi & Schmajuk, 1999; Machado, 1997; Staddon & Higa, 1999)。
上記のような時間間隔による制御が条件づけの結果と して獲得されるという見方に対し,より根源的な役割を 時間情報に与える立場もある。例えばDrew et al. (2005) は,キンギョに光刺激と電気ショックの対呈示を行い, USが呈示されずCSのみが延長して呈示されるピーク試 行(Bitterman, 1964)を用いて,活動量を指標としたCR が生起するタイミングを調べた。その結果,訓練の最初 期段階から,USの予測される時点において明確な反応 ピ ー ク が観 察 さ れ た(同 様 の 結 果 は Balci et al., 2009; Balsam, Drew, & Yang, 2002; Kirkpatrick & Church, 2000も参 照)。またOhyama & Mauk (2001)は,ウサギに750ミリ 秒の CS–US間隔(800ミリ秒のCS開始から50ミリ秒の US開始までの間隔)で延滞瞬目条件づけを行い,CRが 安定して出現するようになる前に訓練を止め,CS–US間 隔を250ミリ秒へと変更した。この短いCS–US間隔によ る訓練でCRが安定して出現するようになった後,1250 ミリ秒の長い刺激を呈示するプローブ試行を行った。そ の結果,被験体は 250ミリ秒と750ミリ秒の2つの時点 でCRを生起させた。この結果は,最初の 750ミリ秒間 隔による訓練において CRが反応として生起する前か ら,ウサギが潜在的に時間間隔を学習していたことを意 味する。こうした知見から,Balsam & Gallistel (2009)は 事象間間隔に関する情報は学習によって獲得される付随 情報ではなく,むしろ学習を成立させる根本的な情報で あり,動物によって自動的かつ迅速に符号化されるとし ている。 2.1.4 時間間隔とCRの種類 一方で,より詳細なCR の種類と時間間隔との対応に関する知見が存在する。よ く知られるように,Konorski (1967)は古典的条件づけ を二種類に区分し,あるUSの感覚特異的な表象によっ て成立するものを消費条件づけ(consummatory condi-tioning),そして同じUSの情動的表象あるいは一般的動 機づけ表象によって成立するものを準備条件づけ(pre-paratory conditioning)と呼んだ(近年の概説としては Dickinson & Balleine (2002)を参照)。食餌の味や匂い, 電撃の加えられる身体の部位に応じた体性感覚などが USの感覚表象に含まれる。これによって生起するCRの 例としては,餌箱つつきや口腔内食餌呈示に対する条件 性の顎運動,瞬目条件づけにおける眼瞼反射等が挙げら れる。これらは一般にUSに対する方向性を持ち,USの 具体的な感覚特性を反映したものである。それに対し USの動機づけ表象は,空腹を満たす,あるいは痛みを 引き起こす,といったより抽象的で広い範囲の刺激に共 有されるものであり,こうした特性を反映したCRとし ては心拍や全体的活動性の変化などが挙げられる。例え ば異なる味の食餌は,感覚特性としては異なるが,空腹 を満たすという共通の動機づけ特性を持つため,活動量 増加という共通のCRを生じさせる。このようなUS表象 区分に関する知見は,例えば異強化子間ブロッキング (Ganesan & Pearce, 1988)や反対条件づけ(counter condi-tioning; Dearing & Dickinson, 1979; Pearce & Dickinson, 1975),パブロフ型条件づけから道具的条件づけへの転 移(Pavlovian-instrumental transfer; 以下PITとする; 例え ばHolland, 2004)などから得ることができる。
ここで重要なのは,同じUSを用いても,異なるUS表
象に応じて異なる種類のCRが生起し,そしてそれらの CR は異なる時間特性を持つという点である。例えば Staddon & Simmelhag (1971)は,時間スケジュールにお いて強化間間隔(inter-reinforcement interval: 以下IRIと
する)中の時間経過に応じて2つの異なる種類の反応が
出現することを見いだし,それぞれを中間行動(interim behavior)および終端行動(terminal behavior)と呼んだ。
中間行動はIRIの前半に現れ,USに対する方向性を持た ない行動(全体的な活動量の増加や床をつつくなど)で ある一方,終端行動はUSに対する方向性を持った特異 的な行動(例えばハトが餌箱をつつくなど)であり,餌 USの呈示直前に現れる。これらはそれぞれUSの準備性 CRおよび消費性CRの例として考えることができる。一 般に,準備性 CRは消費性CRより少ない試行数で獲得 され,また長い持続性のCSを用いた訓練では準備性CR が, 短 い CS で は 消 費 性 CR が 生 じ や す い と さ れ る (Vandercar & Schneiderman, 1967)。また一般的にUSに近 い位置で生じるCRほど,USの具体的な感覚特性を反映 するといえる。さらに後節で触れるように,時間のみな らず,用いられるCSの物理的特性あるいは条件づけの 種類によっても,CRに反映されるUSの表象が異なって くることが知られている(例えばHolland, 1977)。 このような感覚表象および動機づけ表象の区分を取り 入れた学習モデルとして,SOP理論を発展させたAESOP 理論(Wagner & Brandon, 1989)がある。詳細については 同じく今田・漆原(2003)を参照されたいが,このモデル が刺激表象の時間的減衰について,感覚表象と動機づけ 表象で異なる関数を設定している点は記しておく必要があ る。この点に関しては後節でもう一度触れることにする。 2.1.5 時間を手がかりとする分化条件づけ 刺激の時 間長あるいは刺激間の時間間隔を動物が弁別判断の手が かりとして利用することも,時間の重要な機能的側面で ある。Kyd, Pearce, Haselgrove, Amin, & Aggleton (2008)は長 さだけが異なりその他の点では同一である2つのCSを継 時的にラットに呈示し,CS+(例えばある条件では12秒) が終了してから10秒後には餌を呈示,CS−(ある条件では 3秒)が終了してから10秒後には呈示しないという訓練を 行った。各CS終了後10秒間の痕跡期間において,CS−に 比べCS+が呈示された後により多くCRが観察されたこと から,ラットが2つのCSの長さを弁別していたことが示 された。また,同一のCSに先行するITIの異なる長さ(例 えば16分と4分)がUSの生起/不生起を信号する課題に おいて,ラットがITIの長さを条件性刺激として学習でき ることも示され ている(Bouton & Garcia-Gutierez, 2006; Bouton & Hendrix, 2011; Todd, Winterbauer, & Bouton, 2010)。 上記の研究では,より長いCSまたはITIがUSを予告 する(すなわち,長+/短−)場合には学習が容易に成立 するが,逆に短い刺激がUSを予告する(短+/長−)場 合には学習が困難であるという学習の非対称が共通して 観察されている。このような弁別学習の非対称性は,視 覚刺激の空間的な長さを用いた弁別課題(Kosaki, Jones, & Pearce, 2013)や,数量弁別課題(Inman, Honey, & Pearce,
2015; Watanabe, 1998; Vonk & Beran, 2012),聴覚 CS の強 度による弁別課題(Zielinski & Jakubowska, 1977)におい て同様に見られ,時間,空間,数量,そして強度といっ た,量的に変化する刺激次元が何らかの共通の機構を通 じて処理されていることを示唆する。
2.2 時間的符号化仮説(temporal coding hypothesis)
前節2.1では,時間が条件づけの強度に影響を与える のみならず,時間的に分化したCRが見られることや,刺 激持続時間の弁別が可能であることを紹介し,動物が事 象間の時間情報に敏感であることを示した。これをより 系統的に発展させた条件づけ理論に,Millerらの時間的 符号化仮説(temporal coding hypothesis)がある。Savas-tano & Miller (1998)は,時間的符号化仮説の要旨として 次の4つの特徴を挙げている。(1)時間的接近性は事象 間の連合形成にとって必要十分条件である,(2)事象間 の時間関係は自動的に連合の一部として符号化される, (3)符号化された時間情報は条件反応の表出において大 きな役割を果たす,(4)個体は別々に符号化した時間情 報を統合し,時間地図内に表現できる。これらはそれま での理論的枠組みからは大きく外れた独創的な仮説であ り,本節では以下にこれらの根拠となった実験を紹介し, 時間的符号化仮説の概要を紹介する。なお,時間的符号 化仮説についてはすでに漆原・中島(2003)による日本 語の総説が存在するので,より詳しくはそちらを参照され たい。またTable 1に,時間的符号化仮説に関連する基本 的な実験の概要をまとめたものを参考として示しておく。
2.2.1 基本的現象 Matzel, Held, & Miller (1988)は感
性予備条件づけの手続きを使用して,同時条件づけおよ び逆行条件づけの効果を検出することを試みた(Figure 1 を参照)。まず CS2–CS1を対呈示し(第1期)3,その後 CS1–USの対呈示(第2期)を行い,テストではCS2を呈 示して2次条件づけの効果を,またCS1を呈示して1次条 件づけの効果を調べた。第2期の1次条件づけ訓練とし て,実験1では同時条件づけを,実験2では逆行条件づ けを行い,それぞれその効果を順行条件づけ訓練がなさ れた群と比較した。いずれの場合もUSは電撃,CSは2 種類の聴覚刺激であり,CRの指標には条件性抑制が用 いられた。その結果,同時条件づけ群(実験1)や逆行 条件づけ群(実験 2)よりも順行条件づけ群において, CS1に対するより強い1次性CRが見られた。これに対 し,CS2に対する2次性CRは群間で差がなかった。これ 3 ここではCSの次数を表すため,1次性のCSをCS1, 2 次性のCSをCS2と表記する。
らの結果から,第2期のCS1に対する同時または逆行条 件づけは,連合形成において順行条件づけと同様に有効 であったが,それを検出するためにはCS2とUSとの間 に,CS1を介した順行的な予測関係を設けることが必要 であったという主張がなされた。このCS2とUSとの順行 的予測関係の重要性は,実験5においてCS2とCS1およ びCS1とUSをそれぞれ同時条件づけする,すなわちCS2 とUSとの順行的関係を取り去る条件を用いることによっ て確かめられている。これらの基本的現象は,感性予備 条件づけの代わりに2次条件づけ手続き(第1期と2期が 逆転)を用いた実験でも同様に確認されている(Barnet, Arnold, & Miller, 1991; Barnet, Cole, & Miller, 1997)。 Table 1.
ここで特筆すべきは,2次性CSを介して検出された同 時または逆行条件づけの効果が,単に統制群(非対呈示 群)を上回っていた,すなわち同時条件づけや逆行条件 づけの成立が確認されたというだけでなく,それらが順 行条件づけの効果と同程度であった,もしくは逆行条件 づけに限れば数字上はそれを上回っていたという点であ る。Barnet et al. (1997)は刺激条件を変えた追試を行い, 実際に2次性CSによって検出される逆行条件づけの効果 が,順行条件づけの効果を統計的に有意に上回ることを 示した。上記のMatzel et al. (1988)では各CSの長さは5秒 であったのに対し,Barnet et al. (1997)は1次性CS (CS1) に10秒の刺激,2次性CS (CS2)に5秒の刺激を用いた。 すなわちこの実験において,CS2が呈示されたとき,CS1 を介して予測されるUSの生起位置は順行条件づけ群で15 秒後であるのに対し,逆行条件づけでは4.5秒後(USの 持続時間が0.5秒であるため)であった。この予測される USへの接近性が,順行条件よりも強い2次性CRを逆行 条件において生み出したとBarnetらは主張した。 2.2.2 時間地図 上記の結果は,様々な場面で訓練 された複数の事象間間隔を,動物が統合して用いること が出来るという可能性を示唆している。これは Honig (1981)が提唱した,個体が経験を通じて心的な「時間 地図」を構成するという考え方と同様であり,Millerら はこの考えを検証する様々な実験を行った。
Cole, Barnet, & Miller (1995)は痕跡条件づけを用いた 2次条件づけ課題によって,独立に経験した複数の時間 Table 1.
Continued.
S1, S2, S3, S4, X, and Y represent different CSs, while X and Y are used for those trained as conditioned inhibitors. The numbers in parenthe-ses represent durations of the trace period. Stimuli adjacent to each other without hyphens (e.g. S1S2) indicate a simultaneous (compound) presentation. A slash mark indicates that stimuli were presented in an explicitly unpaired fashion. “Ext” stands for extinction training, and “?” indicates that the stimulus was tested. An asterisk following a reference indicates that the experiment was conducted using an appetitive US; Electric shock was employed otherwise as a US. “CR” in uppercase and lower case represent strong and weak CR, respectively. Test re-sults for different stimuli are separated by commas.
関係が統合される可能性を検討した(Table 1参照)。第 1期の痕跡条件づけでは,5秒間のCS1が終了してから 電撃USが呈示されるまでの間隔が,ある群では0秒(0 秒群),別の群では5秒(5秒群)であった。次の第2期 において,両群ともにCS1終了と同時に5秒間のCS2が 呈示される 2次条件づけ訓練を受けた。CS1およびCS2 は異なる種類の聴覚刺激であった。この結果,CS1に対 するCRは0秒群において5秒群よりも強いという通常の 痕跡条件づけの効果が確認されたが,CS2に対する2次 条件づけの効果は,逆に5秒群で0秒群よりも強かった。 この結果に対し著者らは,仮に第2期で被験体がCS1-US の時間関係とCS1–CS2の時間関係を統合していたとする と,5秒群ではCS2の終了時にUSの到来が予測されるた めより強い2次性CRが生じるとし,したがって上記の結 果は時間地図仮説を支持するものであると主張した。
またBarnet, Grahame, & Miller (1993)はブロッキング
における時間情報の影響を検討した。彼らは,第1期で 2群に対してともに刺激AとUSの順行条件づけ(Aの終 了と同時にUSが生起)およびBとUSの同時条件づけを 行った。第2期では,ある群には複合刺激AXとUSの順 行条件づけ(一致群)を,別の群にはBXとUSの順行条 件づけ(不一致群)を行った。刺激A, Bは異なる種類の 5 秒間の聴覚刺激,X は 5 秒間の点滅光,US は 5 秒間の 電撃(0.5 mA)であった。結果,ブロッキング刺激(A またはB)とブロックされる刺激Xとの間でUSに対す る時間関係が同一に保たれた群,すなわち一致群におい てより強いブロッキング効果が見られた(実験 1)。こ れに対応する結果として,第2期において両群に対し同 時条件づけを用いて複合刺激とUSを呈示した場合には, 第 1期でブロッキング刺激が順行条件づけによってUS と対呈示された不一致群よりも同時条件づけによって対 呈示された一致群において,より強いブロッキング効果 が見られた(実験 3)。ブロッキングに関して同様の結 果は Amundson & Miller (2008)によっても得られてい る。また隠蔽(Blaisdell, Denniston, & Miller, 1998, 1999) や条件性制止(Barnet & Miller, 1996b; Burger, Denniston, & Miller, 2001; Denniston, Blaisdell, & Miller, 1998, 2004; Denniston, Cole, & Miller, 1998), Hall & Pearce (1979)によっ Figure 1. A schematic illustration of experimental designs used by Matzel, Held, & Miller (1988; Experiment 1, 2, and 5; note
that only excerpts of conditions are shown). Filled triangles represent the occurrence of US, and open triangles represent ex-pected timing of US in relation to CS2. “CR” in upper case indicates strong CR, while “cr” in lower case indicates weak CR.
て報告されたHall–Pearce負の転移課題(Savastano, Yin, Barnet, & Miller, 1998)についても,同様に時間関係の統合 を反応の表出に用いていることを示唆する結果が報告さ れている(総説としてはDenniston & Miller, 2007を参照)。
2.2.3 時間情報統合のメカニズム こうした時間情報 の統合は,具体的にはどのようなメカニズムによって可 能になるのであろうか?近年のMillerらの研究はこの点 を明らかにしつつある。例えば,CS2–CS1,次いでUS– CS1という2つの関係性を学習した個体がCS2とUSとの 間の時間関係を符号化するやり方としては,(1)第2期 でCS1との連合によって活性化されたCS2表象とUSとの 間に時間関係を含む直接的な連合を形成する,(2)最後 のテストにおいてCS2呈示に伴い活性化されたCS1表象 を介してUSの時間位置を予測する,という2つの可能性 がある。Molet, Miguez, Cham, & Miller (2012)はこれらの 可能性を検証した。彼らの実験において,第1期でラッ トは5秒の痕跡期間を挟んだCS2 (3秒)–CS1 (3秒)対呈 示を受け,第2期では4秒の痕跡期間を挟んだUS (1秒の 電撃)–CS1逆行対呈示を受けた。CSはいずれも聴覚刺激 であり,CS2は6 Hzのクリック音,CS1は白色雑音または 1000 Hzと800 Hzの複合持続音のいずれかであった。CS2 テストの前に設けられた第3期では,ある群はCS1の消 去を受け(消去群),別の群は訓練に用いられなかった CS3の単独呈示を経験した(非消去群)。結果として,非 消去群でCS2に対するより大きなCRが見られた。仮に第 2期でCS1との共通の連合を介してCS2–US–CS1という表 象の時間的配置がなされ,その結果としてCS2–US連合 が直接形成されたとすると,連合成立後にCS1を消去し てもその効果は観察されなかったはずである。すなわち, CS1消去によりCS2 へのCR が減弱したという結果は, CS2–CS1, US–CS1の連合はそれぞれ独立に貯蔵されてお り,テストでCS2が単独呈示されたときにCS1を介して 初めてCS2–US関係の予測が成立したことを示唆する。 言い換えれば,CS1の役割はCS2–US連合の獲得にではな く,即座的な表出にあったということができる。 もしMolet et al. (2012)の結論が正しく,CS2のテスト時 にCS1を介する形でCS2–USの予測が即座に成立するな ら,一度連合が成立した後,つまり一度CS2のテストを 行った後にCS1を消去しても,影響は見られないはずで ある。この点を,Polack, Molet, Miguez, & Miller (2013)は 次のような実験によって調べた。基本的なデザインは同 じであるが,第3期でCS1消去を行う前後に1度ずつ, CS2のテストセッションが行われた。結果としては,CS1 消去前のテストでCS2への曝露を受けた群では,その後 のCS1消去の効果が低く,2度目のテストでCS2に対する 反応は統制群と比較して減弱しなかった。すなわち,CS2 とUSとの連合は第2期ではなく,CS2のテスト時にCS1を 介する形で即座に形成されるというMolet et al. (2012)の 結論と一致する結果を得た。以上をまとめると,刺激間 の時間関係は独立に貯蔵されており,それらはテスト時 に統合され表出されるという結論を導くことができる。 2.3 時間的符号化仮説の一般性 前節で述べたように,Millerらの時間的符号化仮説は これまで説明が難しかった逆行条件づけや同時条件づけ の失敗という現象を,時間関係が反応表出に及ぼす影響 という仮説に沿って非常によく説明してきた。これは獲 得された連合がどのように反応表出に変換されるかとい う古くからの問題に一定の回答を与えるものであり,同 様の前提を持つコンパレータ仮説(Miller & Matzel, 1988) とともに,非常に大きな理論的意義を持つ。さらに,時 間的符号化仮説はこれまで知られていなかった時間関係 の統合に関する現象を次々と明らかにしていった点で, 学習理論に対する貢献に疑いの余地はない。その一方 で,この理論がどの程度の一般性を持つかという点に関 しては,他の優れた学習理論と同様に,いくらかの疑問 の余地があると考えられる。例えば,漆原・中島(2003) も指摘しているように,ほぼすべての実験においてUS として電撃を,CR指標として摂水反応の抑制を用いる という単一の手法に依拠している点が挙げられる。ま た,時間関係の統合という現象を調べるうえで,高次条 件づけを基本手続きとしている点にも注目したい。さら に,Millerらは事象間の関係を逆行,同時,順行,と質 的に変化させることでそれらの間の差を検証する方法を 用いているが,定量的な分析,例えば同じ順序条件の下 で事象間間隔を変化させるといった分析が欠如している 点も指摘できるかもしれない。本節では以下に,これら の問題が持つ潜在的な意味を考えてみることにする。 2.3.1 2 種類の US 表象と高次条件づけ 本節では, US が持つ感覚表象および動機づけ表象の時間的特性, および高次条件づけにおけるそれらの表象の役割を考慮 することで,複数の場面での時間関係の統合という仮定 を用いずに,時間的符号化仮説のもとになるいくつかの 結果,特に逆行条件づけの効果を2次CSとUSとの間に 順行時間関係を設定することで検出できるとする結果を 説明できるかどうか検討する。以下に述べる仮説は, 1次条件づけとして逆行条件づけあるいは同時条件づけ を用いその効果を高次条件づけ手続きによって検出する 研究に限定的に適用されるもので,時間的符号化仮説全 体に対する反論ではないことをあらかじめ記しておく。
2.1.4.で述べた通り,CS–US対呈示は複数のUS表象を介 して複数のCRを生み出す(Konorski, 1967)。このうち, Millerらがほぼすべての実験で用いている電撃USによる 摂水行動の条件性抑制は,しばしば条件性情動反応と呼 ばれることからも明らかなように,主にUSの動機づけ表 象を強く反映する準備性CRの代表的なものであることに 注意する必要がある。準備性CRは,先に述べた通り時間 的な特異性の低い種類の反応である。すなわち,Millerら の実験で逆行USに対しても2次条件づけを通して高い水 準のCRが生じるのは,これらの条件で反応を制御する US動機づけ表象が,感覚表象に比べて低い時間特異性を 持つからであるからという可能性が考えられる。この点 について,以下にAESOP理論(Wagner & Brandon, 1989) を元にした議論を行う。2.1.2において,SOP理論(Wag-ner, 1981)では刺激表象はA1とA2の異なる時間推移を示 す2種類の活性状態を取り,ある時間におけるUS表象の A1とA2状態のバランスによって,逆行条件づけにおいて 制止性および興奮性の反応がどちらも形成され得ると説 明されることを述べた。これを発展させたAESOP理論で は,さらにKonorskiによる2種類のUS表象の概念を取り 入れ,A1・A2状態のそれぞれの時間推移がUSの感覚表 象と動機づけ表象で異なると仮定している。より具体的 には,ある刺激表象の個々の要素がA1からA2へ減衰す る確率pd1およびA2からIへ減衰する確率pd2の2つのパラ メータがともに,US感覚表象に比べてUS動機づけ表象 において低く設定される。したがって,US動機づけ表象 では,US呈示に伴うA1の減衰およびA2の発達が,US感 覚表象におけるそれらの推移よりも緩やかに進行するこ とになる(つまり時間特異性が低い)。これにより,逆行 条件づけにおいてUS後にCSが到来する時点で,US動機 づけ表象の多くの部分はまだA1に存在するため(A1> A2),US動機づけ表象の多くの要素とCSとの間に興奮性 の反応が形成される。これに対してUS感覚表象とCSと の連合では,A1の減衰およびA2の発達が急速に進むた め,CS到来時にはA1<A2となり,連合の合計として制 止性の反応が形成されることが予測される(Figure 2を参 照)。つまり,USの動機づけ表象は,感覚表象よりも時間 的に非特異的な性質を持つために,より長い範囲の時間 に渡って興奮性の逆行条件づけを成立させるのである。
これを支持する実験例として,Tait & Saladin (1986) はウサギの眼窩周辺へ電撃を加える瞬膜条件づけ手続き を用いて逆行条件づけを行い,感覚表象を強く反映する CRである瞬膜反射に関しては制止性の反応が形成され, 動機づけ表象を強く反映したCRである摂水抑制に関し ては興奮性の反応が形成されることを見出している(同
様 の 結 果 は McNish, Betts, Brandon, & Wagner, 1997 も 参 照)。またDelamater, LoLord, & Sosa (2003)は2種類の食 餌 USと2種類のCSを用いて逆行条件づけを行った結 果,食餌の感覚表象特異的なPIT4,および遅滞テストを 通じて,これらの逆行CSが感覚表象に特異的な制止を 獲得していたことを示している。これらの結果は, Millerらの実験において主にUSの動機づけ表象を大き く反映する反応を指標に用いることが,逆行条件づけに おいても興奮性反応の検出を可能にしている1つの要因 であることを示唆する。ただし,このこと自体は,時間 関係統合の証拠として用いられている,2次性CSに対し て1次性逆行CSよりも高い水準のCRが見られる現象を 説明しない。この点に関しては次に高次条件づけの特性 に基づいた仮説を述べる。 Millerらが用いる手続きに共通するもう1つの特徴は, 条件づけの獲得と表出を区別するために高次条件づけを 用いていることであるが,高次条件づけでは反応の獲得 または表出に用いられる US表象が1次条件づけのそれ と異なることが過去の研究から示唆されている。例えば 2次条件づけでは,一般に USの低価値化や 1次CSの消 去によって反応が減弱しにくいことが知られており (Holland & Rescorla, 1975; Rescorla, 1973; Rizley & Rescorla,
1972),また反応トポグラフィが1次CRのそれと異なり USの種類を反映しないこと(Stanhope, 1992)などから, 2次条件づけにおける反応は具体的なUSの感覚表象に 依存しないと考えられている。また条件性強化子を用い たオペラント条件づけにおいても,US (1次性強化子) の低価値化はオペラント反応の獲得に影響しない,つま り条件性強化はUSの感覚表象に依存しないことが知ら れている(Burke, Franz, Miller, & Schoenbaum, 2008; Par-kinson, Roberts, Everitt, & Di Ciano, 2005)。さらに,味覚 嫌悪条件づけにおいては溶液CSの摂取量,および舐め 反応のまとまりの大きさ(lick cluster size)が,それぞれ
4 感覚表象特異的PITは,オペラント反応のCS呈示に よる増加または減少の程度が,オペラント反応と結 果を共有するCSの呈示による場合と,反応と結果を 共有しないCSの呈示による場合とで異なることを指 す。例えばCSA–USA, CSB–USBを訓練後,2種類のオペ ラント反応 RA, RBをRA–USA, RB–USBという随伴性で 訓練すると,結果としてテストにおいてCSB呈示よ りもCSA呈示によってRAの反応率がより大きく増強 されることをいう。これに対し一般動機づけ表象に 基づくPITは,CSAまたはCSBの呈示により反応が同 程度に修飾される現象,あるいはUSA, USBと動機づ け表象のみを共有する USCと結びついた刺激 CSCの 呈示によりオペラント反応が修飾される現象を指す。
CS摂取の動機づけ側面(“wanting”)および感覚的側面 (“liking”)を反映するとされているが(Dwyer, 2009; 味 覚に対する舌および口を中心とした顔の反応を指標とす る感覚的側面の計測については Berridge, 2000も参照), 二つの異なる風味を複合CSとして呈示した後に一方を 単独で塩化リチウムUSと対呈示する感性予備条件づけ を行うと,2次CSに対して摂取量は低下するが舐め反応 のまとまりの大きさは影響を受けないことが示されてい る(Dwyer, Burgess, & Honey, 2012)。これらの結果は総 じて,高次条件づけでは連合構造において次数の高い距 Figure 2. (a) Representative simulations of a single trial of backward conditioning based on the AESOP model. The top panel
shows the pattern of A1 activity in a CS node across time. The middle and bottom panels show the patterns of A1 and A2 activities for the sensory representation of the US (USσ) and the motivational representation of the US (USε), respectively. pd1 and pd2 are decay rate parameters that control the speed of change of stimulus representations from A1 to A2 and from A2 to I state, respectively. Note that AESOP assumes that both of these parameters are smaller for USε. (b) Associative strength accrued to the CS with respect to the USε and USσ, as a function of US–CS intervals. Note that VCS–US is negative
(inhibitory) for USσ and positive (excitatory) for USε, at the interval point indicated by the arrow below the abscissa. Un-labeled functions represent the results of similar simulations with intermediate or more extreme US decay rate parameters. (The figure is reproduced from Wagner & Brandon, 1989, with permission of the publisher).
離にあるUS事象に関して詳細な感覚的特性が失われて おり,反応は主にその動機づけ特性によって維持されて いることを示唆する。 これらをまとめると,次のように考えることができ る。1次条件づけにおいては,AESOP理論によって予測 されるようにUS動機づけ表象の時間非特異性が興奮性 の逆行条件づけを成立させるが,同時に電撃USに含ま れる一定の感覚表象が持つ時間特異性によって制止性の 反応が形成され,合計反応は抑制される。2次条件づけ においては感覚表象の果たす役割は小さくなっているた め,動機づけ表象によって獲得された興奮性連合強度が 最大限に表出される。このように考えると,1次条件づ けよりも2次条件づけでより高い逆行性CRが得られて いることを説明できる。つまり別の言い方をすれば,逆 行1次CSと結びついた2次性CSの呈示に対して,「いつ 電撃が来るかは判断できないが,漠然とした恐怖が生じ るために」CRが生じている可能性がある。これは時間 的符号化仮説が想定する,時間関係の正確な統合的配置 によってCRが生起するという過程とは全く異なる過程 によって時間的符号化様の現象が生じている可能性を意 味する。 ただし,この仮説の前提となっているのは,電撃US の感覚表象によって形成される制止性の反応が,動機づ け表象によって形成される興奮性の反応を1次条件づけ において抑制するという点である。これを媒介する過程 としては,2つの可能性がある。1つは,電撃USに対す る行動抑制というCRが,そもそもUSの動機づけ表象と ともにいくらかの感覚表象に基づく反応を含んでいると いう可能性である。Tait & Saladin (1986)では,それぞ
れのUS表象を反映しやすい瞬膜反射と摂水行動の抑制 を別の指標として計測することで,それぞれに対して制 止と興奮という異なるCRを検出したが,このこと自体 は必ずしも摂水抑制が動機づけ表象のみによって媒介さ れていることを示す結果ではなく,それぞれのCRに含 まれる2つの表象の割合の違いを反映していると考える ことが可能である。したがって,ある反応に含まれる2 つのUS表象の配分によっては,1次性逆行条件づけに おいて興奮と制止の加算により反応が相殺される可能性 が考えられる。1次性逆行CSが実際に興奮とともに制止 の成分を含むかどうかを検証するためには,同一のCR 指標を対象として,興奮性連合の形成を確認するととも に遅滞テストや加算テストによって制止性連合の形成を テストすることが考えられるが,Barnet & Miller (1996a) は実際に,CS2に対する興奮性CRの形成を支持するCS1 が,制止性連合を同時に獲得していることを,同一の摂
水抑制指標を用いた加算テストにおいて示している (Williams & Overmier, 1988も参照)。
2 つ目の可能性として,AESOP 理論では,US の感覚 表象および動機づけ表象に基づく異なる反応は独立でな く,ある表象に基づく反応が別の表象に基づく異なる種 類の反応に影響を及ぼすことを仮定している(Wagner & Brandon, 1989)。彼らは音に対する驚愕反応の恐怖に よる増幅や,恐怖条件づけられた文脈での瞬膜反射の増 強などを例として,動機づけ表象に基づく反応が感覚表 象に基づく異なった反応を修飾する点について述べてい る。一方,逆の方向性を持った影響については述べられ ていないものの,例えば食餌の感覚表象に特異的なPIT の大きさが,感覚表象の変化に由来する強化子低価値化 の影響を受けない,すなわちオペラント反応がある強化 子の動機づけ表象のみに基づく場合(低価値化条件)と 動機づけ表象および感覚表象の両方に基づく場合(非低 価値化条件)とで,反応によって得られるのと同じ結果 を予告するCSの呈示が同程度に,結果特異的なオペラ
ント反応の増強をもたらすこと(Colwill & Rescorla, 1990; Holland, 2004)からは,US感覚表象が同じ食餌の動機づ け表象に基づく反応を修飾する可能性も示唆される。 しかしながら,ここまで述べたような説明ではMatzel et al. (1988)の実験5における,2つのCSを同時呈示し て感性予備条件づけを行う手続きでSimultaneous–Simul-taneous群での2次性CRが低かった理由を説明できない 点も記しておく必要がある。ただし,この実験では持続 音とクリック音という2つの音刺激を第1期において同 時呈示して感性予備条件づけを行っているため,2次性 CSに対する反応は,CS2–CS1–USという高次連合の結果 というよりは,単にCS1からCS2への反応の般化であっ た可能性が否定できない。なぜなら,CS2はテストにお いて初めて単独で呈示され,それまでに 2つの音CSを 知覚的に弁別する機会がなかったはずだからである。 ここまで述べてきたように,Millerらが時間的符号化 仮説によって説明する現象のいくつかは,AESOP理論 と高次条件づけにおけるUS表象の特性を組み合わせる ことによって説明できると考えられるが,それはすなわ ち,現在のAESOP理論に対してある仮定を追加する必 要があることを意味する。具体的には,例えば2次条件 づけについてAESOP理論(SOPも同様)は,CS2がCS1 表象をA2状態に活性化し,それによりCS1と連合した US表象がA2状態に活性化され,その結果としてCRが 表出されるとする。この際,連合的に活性化されたCS1 表象が取り出すことのできる US表象の種類について AESOP理論は特別な仮定を持たないが,ここで述べた
議論に基づき,連合的に活性化されたCS1 (A2状態)は US の動機づけ表象ノードを活性化するが,感覚表象 ノードにはアクセスできない,という仮定を設けること が考えられる。 また,本稿では紙数の制限上詳しく述べる余裕がない が,1次条件づけとして逆行条件づけを用いる場合以外 の手続きによる時間的統合現象,例えば感性予備条件づ けによってA–Xを訓練し,その後異なる痕跡期間を用 いてA–USを訓練し,XとUSとの統合時間配置とXに対 するCRの程度との関係を問題とするような研究(例え
ばCole et al., 1995)については,媒介条件づけ(Holland, 1983)による説明(Ward-Robinson & Hall, 1996, 1998)や, 1次CSがUSと連合する際の活性状態(痕跡条件づけに おいてはA2に減衰している)とテストにおいて連合的 に活性化された1次CSの活性状態(A2)との状態一致 性に注目した説明(Lin, Dumigan, Dwyer, Good, & Honey, 2013; Lin & Honey, 2010, 2011)が可能であることを指摘
しておきたい。これらの説明のいずれにおいても,SOP が持つ仮定のうち,A2状態に表象されるCSと実際に提 示されるUS (A1状態)との間には学習が成立しないと いう仮定について,それらの間の興奮性連合の形成を許 容するような修正を提唱していることは注目に値するで あろう。 本節の最初に述べたように,ここで述べた議論は Millerらの時間的符号化仮説に対する全体的な反論・批 判を行うことを目的としたものではなく,あくまでも動 機づけ表象に基づいた CRを指標とすることへの偏重 と,高次条件づけに伴うUS表象の変化が及ぼす影響に 注意する必要性を指摘することを目的としたものであ る。いずれにせよ,上記のような議論が正しいか否かに かかわらず,より詳細な感覚表象に基づくCRを指標と しても動物が同様の時間的符号化を行っているという結 果を得ることができれば,時間的符号化仮説の理論的立 場がより強まることは確かであろう。電撃USを用いて より詳細な時間的反応が得られる手続きとしては,Da-vis et al. (1989)が示したように,音に対する驚愕反応の 恐怖による増強(Brown, Kalish, & Farber, 1951)を用いる
ことや,オペラント回避反応を用いること(Kamin,
1954)などが考えられる。また食餌USを用いて,感覚 表象に特異的なPIT (例えばCorbit & Balleine, 2005; Hol-land, 2004)を指標として用いることも可能かもしれな い(Delamater, Desouza, Rivkin, & Derman, 2014; Delamater & Holland, 2008)。また,ここではUSの具体的感覚表象 が時間的側面を含むことを議論の前提としてきたが,こ れらが一体のものであるのか,それともそれぞれが独立 に獲得,処理されるのかについては現在議論がなされて いるところであることを指摘しておきたい(例えば Delamater et al., 2014)。 2.3.2 定量的分析 Millerらの研究におけるもう1つ の潜在的な問題点として,定量的分析が見られない点を 挙げておきたい。先にも述べた通り,時間的符号化仮説 についての研究では,ある等しい順序条件の下で事象間 間隔を系統的に変化させ,反応の量的変化を見るという 分析を見つけることが難しい。もし連合形成の本質が時 間的接近であると主張するならば,このような実験的検 討はなされてしかるべきである。例えばMillerらは,高 次条件づけを通じて予測されるCS2とUSとの時間的配 置の影響を検証するにあたって,2つのCSの間に連合を 形成する際にその痕跡期間が0秒である条件と5秒の条 件を比較するという手続きを用いるが(例えばArcedia-no, Escobar, & Miller, 2003; Molet et al., 2012),こうした比 較においては,刺激間の時間間隔のみならず他の条件も 同時に変わってしまう問題がある。例えば,0秒痕跡で CS1–CS2を訓練された群では,CS2が後に単独呈示され る場面において,連続的複合刺激CS1CS2の一部として のCS2と単独呈示されたCS2との間に般化減少が生じる ことが予想されるが,5秒痕跡群では2つの実験場面で のCS2の間に般化減少は生じないであろう。こうした問 題を解決するには,例えばCS間にどちらも痕跡期間が あるがその長さが 5秒と2秒であるような,パラメト リックな条件間比較が必要であると考えられる。 本節では最後に,こうした問題に対して一定の解決を 提供する方法として,食餌条件づけを用いて時間関係の 統合を検証した研究を紹介する。Leising, Sawa, & Miller (2007)は,まず60秒の聴覚性CS2呈示中に10秒間の点 滅光 CS1を複合呈示することで感性予備条件づけを行 い,その後第 2期で光CS1と餌USを同時呈示した。実 験操作として,感性予備条件づけ期においてある群では 光 CS1はCS2の開始5秒後に(早期群),別の群では45 秒後に呈示された(後期群)。テストでは,60秒の聴覚 CS2が単独呈示され,その間のマガジンへの頭部挿入回 数がCRとして記録された。結果としては,早期群では CS2の前半に,後期群では後半にCRの増加が見られた。 これは第1期における音と光の時間関係と,第2期で得 られた光と食餌との関係性を被験体が統合して表出した 結果であると解釈できる。Taylor, Joseph, Zhao, & Balsam (2014)も,これに類する手続きを用いて同様の結果を
得ている(実験3)。こうした手続きの利点は,時間関係 の学習効果を2次性CRの量的変化として捉える,すなわ ち時間統合が生じたか否かを問うだけでなく,CRの生起
を時間の関数として表すことによって,統合された時間 表象の詳細を検証することができる点である。今後,こ うした手法を用いて,1次条件づけとして逆行条件づけ を用いた場合における時間的統合や,2.2.1で紹介したよ うな様々な現象に関しても研究が進展することが期待さ れる。また上でも述べたように,電撃USを用いた場合 にも,これと同様にCRの詳細な時間分布が得られるよ うな指標を用いて研究が進展することが期待される。 3. 結 論 本稿では,古典的条件づけにおいて時間が果たす役割 を,条件づけの強度に事象間間隔が及ぼす影響,US生 起時間の正確な予測,弁別刺激としての時間の利用と いった点について簡単に紹介し,そのうえで動物が複数 場面における事象間の時間関係を統合して時間的な予測 を行うとする現象について,Millerらの時間的符号化仮 説を中心に見てきた。前節2.3で論じたように,手続き 上の改善点や他の理論による代替説明の可能性が考えら れるものの,こうした研究が動物の時間情報処理に関す る理解に大きな前進をもたらしたことは明らかである。 今後はこうした時間情報の場面間での統合が,実際に神 経系においてどのように実現されているのかという点の 解明が期待される。また,別稿で述べるオペラント行動 における計時との関わりについては,それぞれが独立し た研究分野として発展してきた経緯から,いまだ不明な 点が多い。例えば前節では時間的符号化仮説に対する批 判として,定量的分析が欠如していることを挙げたが, 時間研究における定量的分析の1つの重要なあり方は, 反応の時間分布そのものの特性に関するものである。 2.1.3や2.3.2で紹介したように,CRを時間の関数として 検証する研究は過去にも存在するが,反応の時間分布そ れ自体の性質を問うような研究,例えば刺激として与え られる時間間隔とそれに伴う反応分布の変動性の関係性 を検証するような,精神物理学的な研究は比較的少数で ある(Gibbon, 1977; White et al., 2000)。時間情報処理の こうした量的側面に関する研究は,別稿で見ていくよう にオペラント計時行動の分野においてはるかによく発展 しており,今後古典的条件づけにおいても同様の理論的 発展が期待されるところである。 謝 辞 本稿の準備・執筆にあたり,慶應義塾大学の渡辺茂名 誉教授に多くの貴重なご助言をいただきました.また本 稿の出版にあたり,日本学術振興会科学から責任著者へ の研究費補助金(課題番号: 26885079)による助成を受 けました.ここに謝意を表します. 引用文献
Amundson, M. R. F., & Miller, R. R. (2008). CS–US temporal relations in blocking. Learning & Behavior, 36, 92–103. Arcediano, F., Escobar, M., & Miller, R. R. (2003). Temporal
integration and temporal backward association in human and nonhuman subjects. Learning & Behavior, 31, 242–256. Asratyan, E. A. (1965). Compensatory adaptation, reflex
activi-ty, and the brain (Trans. by S. A. Corson). New York:
Ox-ford University Press.
Balci, F., Gallistel, C. R., Allen, B. D., Frank, K. M., Gibson, J. M., & Brunner, D. (2009). Acquisition of peak responding: What is learned? Behavioural Processes, 80, 67–75.
Balsam, P. D., Drew, M. R., & Yang, C. (2002). Timing at the start of associative learning. Learning and Motivation, 33, 141–155.
Balsam, P. D., & Gallistel, C. R. (2009). Temporal maps and in-formativeness in associative learning. Current Opinion in
Neurobiology, 32, 72–78.
Barnet, R. C., Arnold, H. M., & Miller, R. R. (1991). Simulta-neous conditioning demonstrated in second-order condi-tioning: Evidence for similar associative structure in for-ward and simultaneous conditioning. Learning and
Motivation, 22, 253–268.
Barnet, R. C., Cole, R. P., & Miller, R. R. (1997). Temporal integration in second-order conditioning and sensory pre-conditioning. Animal Learning & Behavior, 25, 221–233. Barnet, R. C., Grahame, N. J., & Miller, R. R. (1993). Temporal
encoding as a determinant of blocking. Journal of
Experi-mental Psychology: Animal Behavior Processes, 19, 327–341.
Barnet, R. C., & Miller, R. R. (1996a). Second-order excitation mediated by a backward conditioned inhibitor. Journal of
Experimental Psychology: Animal Behavior Processes, 22,
279–296.
Barnet, R. C., & Miller, R. R. (1996b). Temporal encoding as a determinant of inhibitory control. Learning and Motivation,
27, 73–92.
Berridge, K. C. (2000). Measuring hedonic impact in animals and infants: Microstructure of affective taste reactivity pat-terns. Neuroscience & Biobehavioral Reviews, 24, 173–198. Bitterman, M. E. (1964). Classical conditioning in the gold fish
as a function of the CS–US interval. Journal of Comparative
and Physiological Psychology, 58, 359–366.
Blaisdell, A. P., Denniston, J. C., & Miller, R. R. (1998). Tem-poral encoding as a determinant of overshadowing. Journal
of Experimental Psychology: Animal Behavior Processes, 24,
72–83.
Blaisdell, A. P., Denniston, J. C., & Miller, R. R. (1999). Post-training shifts in the overshadowing deficits. Journal of
Experimental Psychology: Animal Behavior Processes, 25,
18–27.
Bouton, M. E., & Garcia-Gutierez, A. (2006). Intertrial interval as a contextual stimulus. Behavioural Processes, 71, 307–317. Bouton, M. E., & Hendrix, M. C. (2011). Intertrial interval as a
contextual stimulus: Further analysis of a novel asymmetry in temporal discrimination learning. Journal of
Experimen-tal Psychology: Animal Behavior Processes, 37, 79–93.
Brandon, S. E., Vogel, E. H., & Wagner, A. R. (2003). Stimulus representation in SOP: I: Theoretical rationalization and some implications. Behavioural Processes, 62, 5–25. Brown, J. S., Kalish, H. I., & Farber, I. E. (1951). Conditioned
fear as revealed by magnitude of startle response to an audi-tory stimulus. Journal of Experimental Psychology, 41, 317– 328.
Buhusi, C. V., & Schmajuk, N. A. (1999). Timing in simple conditioning and occasion setting: A neural network ap-proach. Behavioural Processes, 45, 33–57.
Burger, D. C., Denniston, J. C., & Miller, R. R. (2001). Tempo-ral coding in conditioned inhibition: Retardation tests.
Animal Learning & Behavior, 29, 281–290.
Burke, K. A., Franz, T. M., Miller, D. N., & Schoenbaum, G. (2008). The role of the orbitofrontal cortex in the pursuit of happiness and more specific rewards. Nature, 454, 340–344. Clark, G. A., Hawkins, R. D., & Kandel, E. R. (1994). Activity-dependent enhancement of presynaptic facilitation provides a cellular mechanism for the temporal specificity of classical conditioning in Aplysia. Learning & Memory, 1, 243–257. Cole, R. P., Barnet, R. C., & Miller, R. R. (1995). Temporal
en-coding in trace conditioning. Animal Learning & Behavior,
23, 144–153.
Cole, R. P., & Miller, R. R. (1999). Conditioned excitation and conditioned inhibition acquired through backward condi-tioning. Learning and Motivation, 30, 129–156.
Colwill, R. M., & Rescorla, R. A. (1990). Effect of reinforcer devaluation on discriminative control of instrumental be-havior. Journal of Experimental Psychology: Animal Behavior
Processes, 16, 40–47.
Corbit, L. H., & Balleine, B. W. (2005). Double dissociation of basolateral and central amygdala lesions on the general and outcome-specific forms of Pavlovian-instrumental transfer.
The Journal of Neuroscience, 25, 962–970.
Davis, M., Schlesinger, L. S., & Sorenson, C. A. (1989). Tempo-ral specificity of fear conditioning: Effects of different con-ditioned stimulus–unconcon-ditioned stimulus intervals on the fear-potentiated startle effect. Journal of Experimental
Psy-chology: Animal Behavior Processes, 15, 295–310.
Dearing, M. F., & Dickinson, A. (1979). Counterconditioning of shock by a water reinforcer in rabbits. Animal Learning &
Behavior, 7, 360–366.
Delamater, A. R., Desouza, A., Rivkin, Y., & Derman, R. (2014). Associative and temporal processes: A dual process approach. Behavioural Processes, 101, 38–48.
Delamater, A. R., & Holland, P. C. (2008). The influence of CS–US interval on several different indices of learning in appetitive conditioning. Journal of Experimental Psychology:
Animal Behavior Processes, 34, 202–222.
Delamater, A. R., LoLordo, V. M., & Sosa, W. (2003). Out-come-specific conditioned inhibition in Pavlovian back-ward conditioning. Learning & Behavior, 31, 393–402. Denniston, J. C., Blaisdell, A. P., & Miller, R. R. (1998).
Tem-poral coding affects transfer of serial and simultaneous in-hibitors. Animal Learning & Behavior, 26, 336–350. Denniston, J. C., Blaisdell, A. P., & Miller, R. R. (2004).
Tem-poral coding in conditioned inhibition: Analysis of associa-tive structure of inhibition. Journal of Experimental
Psychol-ogy: Animal Behavior Processes, 30, 190–202.
Denniston, J. C., Cole, R. P., & Miller, R. R. (1998). The role of temporal relationships in the transfer of conditioned inhibi-tion. Journal of Experimental Psychology: Animal Behavior
Processes, 24, 200–214.
Denniston, J. C., & Miller, R. R. (2007). Timing omitted events: An analysis of temporal control of inhibitory behav-ior. Behavioural Processes, 74, 274–285.
Dickinson, A., & Balleine, B. (2002). The role of learning in the operation of motivational systems. In C. R. Gallistel (Ed.), Stevens handbook of experimental psychology:
Learn-ing, motivation, and emotion. New York: Wiley, pp. 497–534.
Dickinson, A., Watt, A., & Griffiths, W. J. H. (1992). Free-operant acquisition with delayed reinforcement. Quarterly
Journal of Experimental Psychology Section B, 45, 241–258.
Dickinson, A., Watt, A., & Varga, Z. I. (1996). Context condi-tioning and free operant acquisition under delayed rein-forcement. Quarterly Journal of Experimental Psychology
Section B, 49, 97–110.
Drew, M. R., Zupan, B., Cooke, A., Couvillon, P. A., & Balsam, P. D. (2005). Temporal control of conditioned responding in goldfish. Journal of Experimental Psychology: Animal
Behav-ior Processes, 31, 31–39.
Dwyer, D. M. (2009). Microstructural analysis of ingestive be-haviour reveals no contribution of palatability to the incom-plete extinction of a conditioned taste aversion. Quarterly
Journal of Experimental Psychology, 62, 9–17.
Dwyer, D. M., Burgess, K. V., & Honey, R. C. (2012). Avoid-ance but not aversion following sensory preconditioning with flavors: A challenge to stimulus substitution. Journal of
Experimental Psychology: Animal Behavior Processes, 38,
359–368.
藤巻 峻・新保彰大・松井 大・時 暁聴・神前 裕 (2015).条件づけにおける時間II―オペラント計時行 動,および時間学習の神経機構― 基礎心理学研究,
34, 78–90.
(Fujimaki, S., Shimbo, A., Matsui, H., Shi, X., & Kosaki, Y. (2015). Roles of temporal information in conditioning II: Operant conditioning and neural substrates of timing. The
Japanese Journal of Psychonomic Science, 34, 78–90)
Ganesan, R., & Pearce, J. M. (1988). Effect of changing the un-conditioned stimulus on appetitive blocking. Journal of
Ex-perimental Psychology: Animal Behavior Processes, 14, 280–
291.
Garcia, J., Ervin, F. R., & Koelling, R. A. (1966). Learning with prolonged delay of reinforcement. Psychonomic Science, 5, 121–122.
Gibbon, J. (1977). Scalar expectancy theory and Weber’s law in animal timing. Psychological Review, 84, 279–325. Gibbon, J., Baldock, M. D., Locurto, C., Gold, L., & Terrace, H.