条件づけにおける時間I―古典的条件づけ―

(1)

DOI: http://dx.doi.org/10.14947/psychono.34.8

条件づけにおける時間 I

―古典的条件づけ―

神前裕

a, b

_{*・時暁聴}

a

_{・松井大}

a

_・

新保彰大

a

_{・藤巻峻}

a, c a_{慶應義塾大学社会学研究科心理学専攻} b_{慶應義塾大学先導研究センター} c_{日本学術振興会}

Roles of temporal information in conditioning I: Classical conditioning

Yutaka Kosaki*, Xiaoting Shi, Hiroshi Matsui, Akihiro Shimbo, and Shun Fujimaki

a_{Department of Psychology, Keio University} b_{Advanced Research Centers, Keio University}

c_{Japan Society for the Promotion of Science}

Throughout the history of research on animal learning, it has been widely acknowledged that the temporal rela-tionship between events exerts a critical influence on the acquisition of a conditioned response. Until more recently, however, no explicit and systematic studies had investigated how animals learn the temporal relationship itself. In this article, we first review some basic functions of temporal information in classical conditioning. We then focus on one influential learning theory, temporal coding hypothesis, which posits that animals can automatically encode temporal relationships between events and express learned behaviour through integration of multiple temporal rela-tionships acquired across contexts. After reviewing basic results supporting the temporal coding hypothesis, we present an alternative explanation of some temporal coding-like phenomena on the basis of AESOP model com-bined with the potentially different contributions of motivational and sensory US representations in higher-order conditioning. In a second article （Fujimaki, Shimbo, Matsui, Shi, & Kosaki, 2015）, we will discuss interval timing in operant conditioning and neural substrates of timing behaviour.

Keywords: classical conditioning, temporal coding hypothesis, higher-order conditioning, backward conditioning,

AESOP model 1. はじめに 動物は時間的，空間的広がりを持った環境の中に生きている。ある事象と別の事象が何かしらの関連性を持っていることを知ることは動物にとって重要であるが，そこに事象間の時間的，空間的な関係性を含まない情報は，環境への適応において不十分である。したがって動物の学習行動に関する根本的な理解は，時間および空間に関する情報を動物が処理するメカニズムの解明なしには成り立たない。時間情報は，Pavlov以来，動物の学習において核心的な役割を果たすことが知られてきたが，それは主に条件づけの強度を決定する要因としての重要性であり（例えばHull, 1943），事象間の時間関係そのものを動物がどのように学習しているかについては，より近年になるまで系統立った研究は見られなかった。本稿および別稿（藤巻・新保・松井・時・神前，2015）では，これまで明らかになってきた条件づけ学習における時間情報の果たす役割を広く概観し，今後の研究の方向性を探ることを目的とする。本稿では古典的条件づけにおける時間の役割および時間に関する学習を取り扱い，別稿ではオペラント条件づけにおける計時研究，そして時間学習の神経基盤に関する研究を概観する。時間情報の学習にはミリ秒 Copyright 2015. The Japanese Psychonomic Society. All rights reserved. * Correspondence author. Department of Psychology, Keio

University, 2–15–45 Mita, Minato-ku, Tokyo, 108–8345, Japan. E-mail: [email protected]

(2)

単位の学習から，日周期や季節変動に基づく数時間から数カ月単位の学習，さらには数年単位におよぶ学習まで非常に広い水準があるが，ここでは条件づけ学習においてよく用いられる数秒から数分単位の時間水準を取り扱うことにする。 2. 古典的条件づけにおける時間 本章では，古典的条件づけにおいて時間が連合の形成に果たす役割を簡単に概観したうえで，動物が複数事象の時間的配置をどのように学習し，利用しているのかという問題を，Millerらが提唱した時間的符号化仮説を中心として見ていくことにする。 2.1 時間的符号化仮説以前 2.1.1 事象間の時間的接近と時間的順序条件づけ 研究において，条件刺激（conditioned stimulus：以下CS とする）と無条件刺激（unconditioned stimulus：以下 USとする）との間の時間関係が重要であることは古くからよく知られてきた。CSとUSの時間関係の決定的な重要性を表す例として，CSがUSに先行する通常の順行条件づけに比べて，CSとUSが同時に生起する同時条件づけ，あるいはUSがCSに先行する逆行条件づけでは，同じ刺激を用いても条件反応（conditioned response：以下CR）が生じにくいということが挙げられる（例えば Asratyan, 1965; Smith, Coleman, & Gormezano, 1969）。また順行条件づけにおいても，CS開始からUS呈示までの時間間隔を独立変数として変化させ，得られたCRの強度

を従属変数としてプロットすると，逆U字型の時間–反応

曲線が得られることが，アメフラシからヒトまで広い種において，様々な条件づけ課題において確認されている（例えば Clark, Hawkins, & Kandel, 1994; Garcia, Ervin, &

Koelling, 1966; Schneiderman, 1966; Smith et al., 1969）。接近の原理と呼ばれるこのような事象間の遅延に依存した学習量の変動はオペラント学習事態においてもみられ，オペラント反応と強化子の間の遅延も同様に遅延時間依存的に反応率の低下をもたらすことが知られている（例えばDickinson, Watt, & Griffiths, 1992; Hull, 1943）。これらは時間がその形態を問わず条件づけ学習に共通して根本的な役割を果たすことを示している。 Pavlov （Pavlov, 1927, p. 104）によれば，条件づけは， USの直前に存在していた特定の神経系の活動状態のパターンと，USによって引き起こされるURとの間に生じる。言い換えれば，CSが引き起こす様々な神経活動状態のうち，有効なCSとしてUSとの間に条件づけが成立するのはUSの直前に生じていた特定の活動状態である。したがって，逆行条件づけや痕跡条件づけにおいて US が条件づけるのはその直前の，刺激が実際にはすでに消失したあるいは存在しない時点での神経活動状態であり，これがCS存在時の活動状態とどの程度類似しているかによってCSに対する条件づけの強度が決まることになる。これはまた，動物が事象間の関係性に関する学習を，常にある一方向の時間の流れ―現在から未来へ― に沿って行うことを意味している。学習という機能の適応的な意味を考えたときに，これは極めて妥当な仮定であるように思われる2_{。この考えに従えば，逆行条件づ} けや長い痕跡期間を用いた痕跡条件づけでは，US呈示直前にはCSによって引き起こされた活動は弱化あるいは消失しており，CSが存在しない試行間の状態，すなわち文脈刺激とより類似しているため，CSに対しては学習が生じない。この考えは，様々な痕跡期間を用いた痕跡条件づけにおいてCSに対する学習と文脈刺激に対する学習が負の相関を示すという結果（Marlin, 1981）や，上記のオペラント条件づけの遅延強化場面において，文脈刺激の消去訓練を同時に行うことによって反応と強化子呈示の間に長い遅延を導入しても反応が獲得され得るという結果からも支持される（Dickinson et al., 1992; Dickinson, Watt, & Varga, 1996）。さらに，逆行条件

づけにおいてCSの生起はUSがしばらくの間到来しない

ことを予告するために，逆行性CSは制止性の連合強度を獲得すると予測されるが（Pavlov, 1927），実際にそのような予測を支持する結果が得られている（Barnet & Miller, 1996a; Kamin, 1963; Moscovitch & LoLordo, 1968; Sie-gel & Domjan, 1971）。ただし，逆行条件づけによって興奮性CRが生じるという報告も数多く存在する（例えば Heth, 1976; Wagner & Terry, 1975）。興奮性CRあるいは制止性CRのどちらが形成されるかに関しては，試行数や刺激間間隔といった要因が逆行条件づけの成立に影響することが知られている（詳細は漆原，1999を参照）。 2.1.2 随伴性と事象間間隔事象間の接近性が連合 の形成に重要な役割を果たすことに疑いの余地は無いが，より近年の連合学習理論は基本的な学習メカニズムとして事象間の随伴性を重視してきた（Kamin, 1968; Mackintosh, 1975; Pearce & Hall, 1980; Rescorla, 1968; Re-scorla & Wagner, 1972; Wagner, Logan, Haberlandt, & Price,

2 _{これは回顧的学習が成立しないということを意味す} るものではない。回顧的再評価においては，現在新たに得られた情報を元に，過去に形成された事象間の「予測」，すなわち前向的な学習が修正されるのであって，修正される予測関係自体は常に現在から未来へ向かう流れに沿ったものである。

(3)

1968）。これは，ある特定のCSとUSとの間に連合が形成される程度はそのCSとUSとの関係のみならず，当該 CS以外に存在する全ての刺激がUSを予告する程度との相対的な関係によって決定されるというものであり，これによってブロッキング（Kamin, 1968）や隠（Pavlov, 1927）といった刺激間の接近性のみでは説明できない現象をよく説明することができる。しかしこれらの理論には接近性を表すパラメータは入っておらず，ある刺激と USとの時間間隔のみが変化するような場合には，これらの理論は当該刺激の連合強度の変化という間接的な形でしかその影響を取り扱うことはできない。この点をより明示的な形で扱った研究として，事象間間隔および試行間間隔（inter-trial interval：以下ITIとする）を変数として取り入れたGibbonらの研究がある。 Gibbon, Baldock, Locurto, Gold, & Terrace （1977）は，ハトの自動反応形成手続きを用いて，キーが点灯している試行時間（つまりCS開始からUS呈示までの時間；以下T とする）とキーが消灯している時間（以下Iとする）を系統的に変化させることの反応獲得への影響を調べた。その結果，一定のIの下ではTが増加するにしたがって獲得に要する試行数は増加したが，Tが一定の場合にはIが増加するにしたがって反応獲得に要する試行数は減少した。さらに，獲得までの試行数はTあるいはIの絶対値ではなく，TとIとの比率I/Tによって決定されることが明らかになった。つまり，条件づけの速度は，CS呈示から US呈示までの時間Tそのものではなく，CSが存在しない時間IとTとの比較によって決定されることを見出したのである。これはCSと文脈刺激を含むその他の刺激の持つ予測価の比較によって連合強度の変化が決定されるとする随伴性理論の考えと一致するが，CS–US間隔やITIといった時間的側面に関する情報を連続的に記述することを可能にした点で重要である。こうしたGibbonらの考えは，時間は条件づけの結果として獲得される連合に付随した情報ではなく，逆に時間情報こそが学習の根本にあり，CSが次のUSの到来時間に関してもたらす情報量の変化こそが反応を生起させる根本的な要因である，という情報理論的なアイデアへとつながっていくことになる。一方，事象間の連合および随伴性の概念を保ちながら，刺激間の時間関係を刺激表象の時間的変化として学習モデルに取り入れた理論として，Wagner （1981）の SOP理論がある。概要として，SOP理論では刺激は個体内で3つの異なる表象状態を取り，時間によってその状態が遷移するとされる。直接的に知覚された刺激はまず 1次活性状態（A1）に表象され，この表象が時間とともに素早く減衰し，2次活性状態（A2）へ移行する。そしてA2は時間経過とともにより緩やかに不活性状態（I）へと遷移する。大まかに言うと，これら3つの状態は刺激に対して向けられる「注意」の水準に相当する。ある刺激が連合強度を獲得するのは注意を向けられた状態，すなわちA1にあるときのみであり，2つの刺激表象がともにA1にあるときにはそれらの間に興奮性の連合が， A1とA2にある場合にはA1にある刺激からA2にある刺激への制止性の連合が形成されることになる。実際にはある刺激の表象はそれを構成する要素の集合からなり（各要素は刺激の細かな特徴に対応する），そして各要素の各活性状態への遷移は確率的に表現される。ある刺激表象についてA1およびA2状態にある要素の割合は時間の関数として表され，通常，実際の刺激呈示によって A1に活性化された多くの要素は刺激呈示終了直後から急速にA2に減衰を始めるが，これに対応して増加した A2状態の要素は，より緩やかにIへと減衰する。これは A1からA2への減衰確率がA2からIへの減衰確率よりも高く設定されるからである（これらの減衰確率は減衰先の状態の容量と反比例すると仮定される）。具体的な適用例を示すと，例えば痕跡条件づけにおいてCRが生じにくいのは，USが呈示される時点においてCS表象のうち多くの要素がすでにA1から減衰しA2にあるからである。また逆行条件づけにおいては，USが呈示された直後，つまり US表象の大部分がまだA1にある時点でCS が呈示されると興奮性の逆行連合が生じ，より長い時間間隔でCSが呈示されるとUS表象の多くはすでにA2状態にあるため，制止性の連合が獲得されることになる（SOP理論に基づく逆行条件づけのシミュレーションとしては，Mazur & Wagner, 1982を参照）。また，特に次節で述べるような，CRが時間的に分化する現象を取り扱うことを可能とする発展型として，C-SOP理論（Bran-don, Vogel, & Wagner, 2003）が提唱されている。元来の SOP理論ではCS表象の各要素はCS呈示によって，試行ごとにCS中のランダムな時間位置でA1に活性化されるとされていたが，この C-SOPでは各要素が複数試行を通じて一定の時間位置でA1に活性化され，それらがUS と独自に連合を形成することで，時間的な分布を持った CRが表出されるとしている（Brandon et al., 2003）。この他にもSOP理論は連合する刺激がCSであるかUSであるかを問わず適用できるため，CS同士の連合を説明することに困難を示さないという特徴がある。さらに SOP およびその発展モデルは馴化や刺激般化，刺激間競合といった様々な現象をよく説明するが，紙数の制限上，ここでは刺激間の時間関係について触れるにとどめたい。 SOP理論によるこうした多様な現象の説明については今

(4)

田・漆原（2003）を参照されたい。 2.1.3 時間関係の学習これまでに述べたような研 究が，総じて事象間の時間関係がCRの強度におよぼす影響を調べたものであるのに対し，事象間の時間関係が CRの生起タイミングに影響を及ぼすことを示唆する研究もある。例えばPavlov （1927）は長いCS–US間隔を用いた条件づけでは，CRはCSの終わりにかけて，すなわちUSの直前に生じやすいことを報告している。また彼が「時間条件づけ」と呼んだ，現在は固定時間（fixed time）スケジュールとして知られる状況においても，餌が予期される時間の前後に唾液反射が出現することを報告し，”時間間隔が条件刺激としての性質を獲得したことは明らかである”としている（Pavlov, 1927, p. 41）。これと同様の結果は後年，より定量的な形で数多く報告されている（例えば Davis, Schlesinger, & Sorenson, 1989; Delamater & Holland, 2008; Drew, Zupan, Cooke, Couvillon, & Balsam, 2005; White, Kehoe, Choi, & Moore, 2000）。Pavlov

の考えによれば，長い遅延を伴う条件づけにおいてCRが US直前のタイミングに生じやすいのは，CSによって引き起こされる内的反応が時間とともに変化し，その中でUS の直前に生じていた活動パターンが有効なCSとして条件づけられるからである（Mackintosh, 1974）。このような，強化された時点でのCSによって惹起される内部状態のパターンと，現在の内部状態の活動パターンとの比較によって時間特異的な反応が生起するという考え方は，その詳細においては大きく異なるものの，その後様々な計時行動理論において広く共有されてきた（例えばBuhusi & Schmajuk, 1999; Machado, 1997; Staddon & Higa, 1999）。

上記のような時間間隔による制御が条件づけの結果として獲得されるという見方に対し，より根源的な役割を時間情報に与える立場もある。例えばDrew et al. （2005）は，キンギョに光刺激と電気ショックの対呈示を行い， USが呈示されずCSのみが延長して呈示されるピーク試行（Bitterman, 1964）を用いて，活動量を指標としたCR が生起するタイミングを調べた。その結果，訓練の最初期段階から，USの予測される時点において明確な反応ピークが観察された（同様の結果は Balci et al., 2009; Balsam, Drew, & Yang, 2002; Kirkpatrick & Church, 2000も参照）。またOhyama & Mauk （2001）は，ウサギに750ミリ秒の CS–US間隔（800ミリ秒のCS開始から50ミリ秒の US開始までの間隔）で延滞瞬目条件づけを行い，CRが安定して出現するようになる前に訓練を止め，CS–US間隔を250ミリ秒へと変更した。この短いCS–US間隔による訓練でCRが安定して出現するようになった後，1250 ミリ秒の長い刺激を呈示するプローブ試行を行った。その結果，被験体は 250ミリ秒と750ミリ秒の2つの時点でCRを生起させた。この結果は，最初の 750ミリ秒間隔による訓練において CRが反応として生起する前から，ウサギが潜在的に時間間隔を学習していたことを意味する。こうした知見から，Balsam & Gallistel （2009）は事象間間隔に関する情報は学習によって獲得される付随情報ではなく，むしろ学習を成立させる根本的な情報であり，動物によって自動的かつ迅速に符号化されるとしている。 2.1.4 時間間隔とCRの種類一方で，より詳細なCR の種類と時間間隔との対応に関する知見が存在する。よく知られるように，Konorski （1967）は古典的条件づけを二種類に区分し，あるUSの感覚特異的な表象によって成立するものを消費条件づけ（consummatory condi-tioning），そして同じUSの情動的表象あるいは一般的動機づけ表象によって成立するものを準備条件づけ（pre-paratory conditioning）と呼んだ（近年の概説としては Dickinson & Balleine （2002）を参照）。食餌の味や匂い，電撃の加えられる身体の部位に応じた体性感覚などが USの感覚表象に含まれる。これによって生起するCRの例としては，餌箱つつきや口腔内食餌呈示に対する条件性の顎運動，瞬目条件づけにおける眼瞼反射等が挙げられる。これらは一般にUSに対する方向性を持ち，USの具体的な感覚特性を反映したものである。それに対し USの動機づけ表象は，空腹を満たす，あるいは痛みを引き起こす，といったより抽象的で広い範囲の刺激に共有されるものであり，こうした特性を反映したCRとしては心拍や全体的活動性の変化などが挙げられる。例えば異なる味の食餌は，感覚特性としては異なるが，空腹を満たすという共通の動機づけ特性を持つため，活動量増加という共通のCRを生じさせる。このようなUS表象区分に関する知見は，例えば異強化子間ブロッキング（Ganesan & Pearce, 1988）や反対条件づけ（counter condi-tioning; Dearing & Dickinson, 1979; Pearce & Dickinson, 1975），パブロフ型条件づけから道具的条件づけへの転移（Pavlovian-instrumental transfer; 以下PITとする；例えばHolland, 2004）などから得ることができる。

ここで重要なのは，同じUSを用いても，異なるUS表

象に応じて異なる種類のCRが生起し，そしてそれらの CR は異なる時間特性を持つという点である。例えば Staddon & Simmelhag （1971）は，時間スケジュールにおいて強化間間隔（inter-reinforcement interval：以下IRIと

する）中の時間経過に応じて2つの異なる種類の反応が

出現することを見いだし，それぞれを中間行動（interim behavior）および終端行動（terminal behavior）と呼んだ。

(5)

中間行動はIRIの前半に現れ，USに対する方向性を持たない行動（全体的な活動量の増加や床をつつくなど）である一方，終端行動はUSに対する方向性を持った特異的な行動（例えばハトが餌箱をつつくなど）であり，餌 USの呈示直前に現れる。これらはそれぞれUSの準備性 CRおよび消費性CRの例として考えることができる。一般に，準備性 CRは消費性CRより少ない試行数で獲得され，また長い持続性のCSを用いた訓練では準備性CR が，短い CS では消費性 CR が生じやすいとされる（Vandercar & Schneiderman, 1967）。また一般的にUSに近い位置で生じるCRほど，USの具体的な感覚特性を反映するといえる。さらに後節で触れるように，時間のみならず，用いられるCSの物理的特性あるいは条件づけの種類によっても，CRに反映されるUSの表象が異なってくることが知られている（例えばHolland, 1977）。このような感覚表象および動機づけ表象の区分を取り入れた学習モデルとして，SOP理論を発展させたAESOP 理論（Wagner & Brandon, 1989）がある。詳細については同じく今田・漆原（2003）を参照されたいが，このモデルが刺激表象の時間的減衰について，感覚表象と動機づけ表象で異なる関数を設定している点は記しておく必要がある。この点に関しては後節でもう一度触れることにする。 2.1.5 時間を手がかりとする分化条件づけ刺激の時 間長あるいは刺激間の時間間隔を動物が弁別判断の手がかりとして利用することも，時間の重要な機能的側面である。Kyd, Pearce, Haselgrove, Amin, & Aggleton （2008）は長さだけが異なりその他の点では同一である2つのCSを継時的にラットに呈示し，CS＋（例えばある条件では12秒）が終了してから10秒後には餌を呈示，CS−（ある条件では 3秒）が終了してから10秒後には呈示しないという訓練を行った。各CS終了後10秒間の痕跡期間において，CS−に比べCS＋が呈示された後により多くCRが観察されたことから，ラットが2つのCSの長さを弁別していたことが示された。また，同一のCSに先行するITIの異なる長さ（例えば16分と4分）がUSの生起／不生起を信号する課題において，ラットがITIの長さを条件性刺激として学習できることも示されている（Bouton & Garcia-Gutierez, 2006; Bouton & Hendrix, 2011; Todd, Winterbauer, & Bouton, 2010）。上記の研究では，より長いCSまたはITIがUSを予告する（すなわち，長＋/短−）場合には学習が容易に成立するが，逆に短い刺激がUSを予告する（短＋/長−）場合には学習が困難であるという学習の非対称が共通して観察されている。このような弁別学習の非対称性は，視覚刺激の空間的な長さを用いた弁別課題（Kosaki, Jones, & Pearce, 2013）や，数量弁別課題（Inman, Honey, & Pearce,

2015; Watanabe, 1998; Vonk & Beran, 2012），聴覚 CS の強度による弁別課題（Zielinski & Jakubowska, 1977）において同様に見られ，時間，空間，数量，そして強度といった，量的に変化する刺激次元が何らかの共通の機構を通じて処理されていることを示唆する。

2.2 時間的符号化仮説（temporal coding hypothesis）

前節2.1では，時間が条件づけの強度に影響を与えるのみならず，時間的に分化したCRが見られることや，刺激持続時間の弁別が可能であることを紹介し，動物が事象間の時間情報に敏感であることを示した。これをより系統的に発展させた条件づけ理論に，Millerらの時間的符号化仮説（temporal coding hypothesis）がある。Savas-tano & Miller （1998）は，時間的符号化仮説の要旨として次の4つの特徴を挙げている。（1）時間的接近性は事象間の連合形成にとって必要十分条件である，（2）事象間の時間関係は自動的に連合の一部として符号化される，（3）符号化された時間情報は条件反応の表出において大きな役割を果たす，（4）個体は別々に符号化した時間情報を統合し，時間地図内に表現できる。これらはそれまでの理論的枠組みからは大きく外れた独創的な仮説であり，本節では以下にこれらの根拠となった実験を紹介し，時間的符号化仮説の概要を紹介する。なお，時間的符号化仮説についてはすでに漆原・中島（2003）による日本語の総説が存在するので，より詳しくはそちらを参照されたい。またTable 1に，時間的符号化仮説に関連する基本的な実験の概要をまとめたものを参考として示しておく。

2.2.1 基本的現象 Matzel, Held, & Miller （1988）は感

性予備条件づけの手続きを使用して，同時条件づけおよび逆行条件づけの効果を検出することを試みた（Figure 1 を参照）。まず CS2–CS1を対呈示し（第1期）3_，その後 CS1–USの対呈示（第2期）を行い，テストではCS2を呈示して2次条件づけの効果を，またCS1を呈示して1次条件づけの効果を調べた。第2期の1次条件づけ訓練として，実験1では同時条件づけを，実験2では逆行条件づけを行い，それぞれその効果を順行条件づけ訓練がなされた群と比較した。いずれの場合もUSは電撃，CSは2 種類の聴覚刺激であり，CRの指標には条件性抑制が用いられた。その結果，同時条件づけ群（実験1）や逆行条件づけ群（実験 2）よりも順行条件づけ群において， CS1に対するより強い1次性CRが見られた。これに対し，CS2に対する2次性CRは群間で差がなかった。これ 3 _{ここではCSの次数を表すため，1次性のCSをCS1, 2} 次性のCSをCS2と表記する。

(6)

らの結果から，第2期のCS1に対する同時または逆行条件づけは，連合形成において順行条件づけと同様に有効であったが，それを検出するためにはCS2とUSとの間に，CS1を介した順行的な予測関係を設けることが必要であったという主張がなされた。このCS2とUSとの順行的予測関係の重要性は，実験5においてCS2とCS1およびCS1とUSをそれぞれ同時条件づけする，すなわちCS2 とUSとの順行的関係を取り去る条件を用いることによって確かめられている。これらの基本的現象は，感性予備条件づけの代わりに2次条件づけ手続き（第1期と2期が逆転）を用いた実験でも同様に確認されている（Barnet, Arnold, & Miller, 1991; Barnet, Cole, & Miller, 1997）。 Table 1.

(7)

ここで特筆すべきは，2次性CSを介して検出された同時または逆行条件づけの効果が，単に統制群（非対呈示群）を上回っていた，すなわち同時条件づけや逆行条件づけの成立が確認されたというだけでなく，それらが順行条件づけの効果と同程度であった，もしくは逆行条件づけに限れば数字上はそれを上回っていたという点である。Barnet et al. （1997）は刺激条件を変えた追試を行い，実際に2次性CSによって検出される逆行条件づけの効果が，順行条件づけの効果を統計的に有意に上回ることを示した。上記のMatzel et al. （1988）では各CSの長さは5秒であったのに対し，Barnet et al. （1997）は1次性CS （CS1）に10秒の刺激，2次性CS （CS2）に5秒の刺激を用いた。すなわちこの実験において，CS2が呈示されたとき，CS1 を介して予測されるUSの生起位置は順行条件づけ群で15 秒後であるのに対し，逆行条件づけでは4.5秒後（USの持続時間が0.5秒であるため）であった。この予測される USへの接近性が，順行条件よりも強い2次性CRを逆行条件において生み出したとBarnetらは主張した。 2.2.2 時間地図上記の結果は，様々な場面で訓練 された複数の事象間間隔を，動物が統合して用いることが出来るという可能性を示唆している。これは Honig （1981）が提唱した，個体が経験を通じて心的な「時間地図」を構成するという考え方と同様であり，Millerらはこの考えを検証する様々な実験を行った。

Cole, Barnet, & Miller （1995）は痕跡条件づけを用いた 2次条件づけ課題によって，独立に経験した複数の時間 Table 1.

Continued.

S1, S2, S3, S4, X, and Y represent different CSs, while X and Y are used for those trained as conditioned inhibitors. The numbers in parenthe-ses represent durations of the trace period. Stimuli adjacent to each other without hyphens （e.g. S1S2） indicate a simultaneous （compound） presentation. A slash mark indicates that stimuli were presented in an explicitly unpaired fashion. “Ext” stands for extinction training, and “?” indicates that the stimulus was tested. An asterisk following a reference indicates that the experiment was conducted using an appetitive US; Electric shock was employed otherwise as a US. “CR” in uppercase and lower case represent strong and weak CR, respectively. Test re-sults for different stimuli are separated by commas.

(8)

関係が統合される可能性を検討した（Table 1参照）。第 1期の痕跡条件づけでは，5秒間のCS1が終了してから電撃USが呈示されるまでの間隔が，ある群では0秒（0 秒群），別の群では5秒（5秒群）であった。次の第2期において，両群ともにCS1終了と同時に5秒間のCS2が呈示される 2次条件づけ訓練を受けた。CS1およびCS2 は異なる種類の聴覚刺激であった。この結果，CS1に対するCRは0秒群において5秒群よりも強いという通常の痕跡条件づけの効果が確認されたが，CS2に対する2次条件づけの効果は，逆に5秒群で0秒群よりも強かった。この結果に対し著者らは，仮に第2期で被験体がCS1-US の時間関係とCS1–CS2の時間関係を統合していたとすると，5秒群ではCS2の終了時にUSの到来が予測されるためより強い2次性CRが生じるとし，したがって上記の結果は時間地図仮説を支持するものであると主張した。

またBarnet, Grahame, & Miller （1993）はブロッキング

における時間情報の影響を検討した。彼らは，第1期で 2群に対してともに刺激AとUSの順行条件づけ（Aの終了と同時にUSが生起）およびBとUSの同時条件づけを行った。第2期では，ある群には複合刺激AXとUSの順行条件づけ（一致群）を，別の群にはBXとUSの順行条件づけ（不一致群）を行った。刺激A, Bは異なる種類の 5 秒間の聴覚刺激，X は 5 秒間の点滅光，US は 5 秒間の電撃（0.5 mA）であった。結果，ブロッキング刺激（A またはB）とブロックされる刺激Xとの間でUSに対する時間関係が同一に保たれた群，すなわち一致群においてより強いブロッキング効果が見られた（実験 1）。これに対応する結果として，第2期において両群に対し同時条件づけを用いて複合刺激とUSを呈示した場合には，第 1期でブロッキング刺激が順行条件づけによってUS と対呈示された不一致群よりも同時条件づけによって対呈示された一致群において，より強いブロッキング効果が見られた（実験 3）。ブロッキングに関して同様の結果は Amundson & Miller （2008）によっても得られている。また隠蔽（Blaisdell, Denniston, & Miller, 1998, 1999）や条件性制止（Barnet & Miller, 1996b; Burger, Denniston, & Miller, 2001; Denniston, Blaisdell, & Miller, 1998, 2004; Denniston, Cole, & Miller, 1998）, Hall & Pearce （1979）によっ Figure 1. A schematic illustration of experimental designs used by Matzel, Held, & Miller （1988; Experiment 1, 2, and 5; note

that only excerpts of conditions are shown）. Filled triangles represent the occurrence of US, and open triangles represent ex-pected timing of US in relation to CS2. “CR” in upper case indicates strong CR, while “cr” in lower case indicates weak CR.

(9)

て報告されたHall–Pearce負の転移課題（Savastano, Yin, Barnet, & Miller, 1998）についても，同様に時間関係の統合を反応の表出に用いていることを示唆する結果が報告されている（総説としてはDenniston & Miller, 2007を参照）。

2.2.3 時間情報統合のメカニズムこうした時間情報 の統合は，具体的にはどのようなメカニズムによって可能になるのであろうか？近年のMillerらの研究はこの点を明らかにしつつある。例えば，CS2–CS1，次いでUS– CS1という2つの関係性を学習した個体がCS2とUSとの間の時間関係を符号化するやり方としては，（1）第2期でCS1との連合によって活性化されたCS2表象とUSとの間に時間関係を含む直接的な連合を形成する，（2）最後のテストにおいてCS2呈示に伴い活性化されたCS1表象を介してUSの時間位置を予測する，という2つの可能性がある。Molet, Miguez, Cham, & Miller （2012）はこれらの可能性を検証した。彼らの実験において，第1期でラットは5秒の痕跡期間を挟んだCS2 （3秒）–CS1 （3秒）対呈示を受け，第2期では4秒の痕跡期間を挟んだUS （1秒の電撃）–CS1逆行対呈示を受けた。CSはいずれも聴覚刺激であり，CS2は6 Hzのクリック音，CS1は白色雑音または 1000 Hzと800 Hzの複合持続音のいずれかであった。CS2 テストの前に設けられた第3期では，ある群はCS1の消去を受け（消去群），別の群は訓練に用いられなかった CS3の単独呈示を経験した（非消去群）。結果として，非消去群でCS2に対するより大きなCRが見られた。仮に第 2期でCS1との共通の連合を介してCS2–US–CS1という表象の時間的配置がなされ，その結果としてCS2–US連合が直接形成されたとすると，連合成立後にCS1を消去してもその効果は観察されなかったはずである。すなわち， CS1消去によりCS2 へのCR が減弱したという結果は， CS2–CS1, US–CS1の連合はそれぞれ独立に貯蔵されており，テストでCS2が単独呈示されたときにCS1を介して初めてCS2–US関係の予測が成立したことを示唆する。言い換えれば，CS1の役割はCS2–US連合の獲得にではなく，即座的な表出にあったということができる。もしMolet et al. （2012）の結論が正しく，CS2のテスト時にCS1を介する形でCS2–USの予測が即座に成立するなら，一度連合が成立した後，つまり一度CS2のテストを行った後にCS1を消去しても，影響は見られないはずである。この点を，Polack, Molet, Miguez, & Miller （2013）は次のような実験によって調べた。基本的なデザインは同じであるが，第3期でCS1消去を行う前後に1度ずつ， CS2のテストセッションが行われた。結果としては，CS1 消去前のテストでCS2への曝露を受けた群では，その後のCS1消去の効果が低く，2度目のテストでCS2に対する反応は統制群と比較して減弱しなかった。すなわち，CS2 とUSとの連合は第2期ではなく，CS2のテスト時にCS1を介する形で即座に形成されるというMolet et al. （2012）の結論と一致する結果を得た。以上をまとめると，刺激間の時間関係は独立に貯蔵されており，それらはテスト時に統合され表出されるという結論を導くことができる。 2.3 時間的符号化仮説の一般性 前節で述べたように，Millerらの時間的符号化仮説はこれまで説明が難しかった逆行条件づけや同時条件づけの失敗という現象を，時間関係が反応表出に及ぼす影響という仮説に沿って非常によく説明してきた。これは獲得された連合がどのように反応表出に変換されるかという古くからの問題に一定の回答を与えるものであり，同様の前提を持つコンパレータ仮説（Miller & Matzel, 1988）とともに，非常に大きな理論的意義を持つ。さらに，時間的符号化仮説はこれまで知られていなかった時間関係の統合に関する現象を次々と明らかにしていった点で，学習理論に対する貢献に疑いの余地はない。その一方で，この理論がどの程度の一般性を持つかという点に関しては，他の優れた学習理論と同様に，いくらかの疑問の余地があると考えられる。例えば，漆原・中島（2003）も指摘しているように，ほぼすべての実験においてUS として電撃を，CR指標として摂水反応の抑制を用いるという単一の手法に依拠している点が挙げられる。また，時間関係の統合という現象を調べるうえで，高次条件づけを基本手続きとしている点にも注目したい。さらに，Millerらは事象間の関係を逆行，同時，順行，と質的に変化させることでそれらの間の差を検証する方法を用いているが，定量的な分析，例えば同じ順序条件の下で事象間間隔を変化させるといった分析が欠如している点も指摘できるかもしれない。本節では以下に，これらの問題が持つ潜在的な意味を考えてみることにする。 2.3.1 2 種類の US 表象と高次条件づけ本節では， US が持つ感覚表象および動機づけ表象の時間的特性，および高次条件づけにおけるそれらの表象の役割を考慮することで，複数の場面での時間関係の統合という仮定を用いずに，時間的符号化仮説のもとになるいくつかの結果，特に逆行条件づけの効果を2次CSとUSとの間に順行時間関係を設定することで検出できるとする結果を説明できるかどうか検討する。以下に述べる仮説は， 1次条件づけとして逆行条件づけあるいは同時条件づけを用いその効果を高次条件づけ手続きによって検出する研究に限定的に適用されるもので，時間的符号化仮説全体に対する反論ではないことをあらかじめ記しておく。

(10)

2.1.4.で述べた通り，CS–US対呈示は複数のUS表象を介して複数のCRを生み出す（Konorski, 1967）。このうち， Millerらがほぼすべての実験で用いている電撃USによる摂水行動の条件性抑制は，しばしば条件性情動反応と呼ばれることからも明らかなように，主にUSの動機づけ表象を強く反映する準備性CRの代表的なものであることに注意する必要がある。準備性CRは，先に述べた通り時間的な特異性の低い種類の反応である。すなわち，Millerらの実験で逆行USに対しても2次条件づけを通して高い水準のCRが生じるのは，これらの条件で反応を制御する US動機づけ表象が，感覚表象に比べて低い時間特異性を持つからであるからという可能性が考えられる。この点について，以下にAESOP理論（Wagner & Brandon, 1989）を元にした議論を行う。2.1.2において，SOP理論（Wag-ner, 1981）では刺激表象はA1とA2の異なる時間推移を示す2種類の活性状態を取り，ある時間におけるUS表象の A1とA2状態のバランスによって，逆行条件づけにおいて制止性および興奮性の反応がどちらも形成され得ると説明されることを述べた。これを発展させたAESOP理論では，さらにKonorskiによる2種類のUS表象の概念を取り入れ，A1・A2状態のそれぞれの時間推移がUSの感覚表象と動機づけ表象で異なると仮定している。より具体的には，ある刺激表象の個々の要素がA1からA2へ減衰する確率pd1およびA2からIへ減衰する確率pd2の2つのパラメータがともに，US感覚表象に比べてUS動機づけ表象において低く設定される。したがって，US動機づけ表象では，US呈示に伴うA1の減衰およびA2の発達が，US感覚表象におけるそれらの推移よりも緩やかに進行することになる（つまり時間特異性が低い）。これにより，逆行条件づけにおいてUS後にCSが到来する時点で，US動機づけ表象の多くの部分はまだA1に存在するため（A1＞ A2），US動機づけ表象の多くの要素とCSとの間に興奮性の反応が形成される。これに対してUS感覚表象とCSとの連合では，A1の減衰およびA2の発達が急速に進むため，CS到来時にはA1＜A2となり，連合の合計として制止性の反応が形成されることが予測される（Figure 2を参照）。つまり，USの動機づけ表象は，感覚表象よりも時間的に非特異的な性質を持つために，より長い範囲の時間に渡って興奮性の逆行条件づけを成立させるのである。

これを支持する実験例として，Tait & Saladin （1986）はウサギの眼窩周辺へ電撃を加える瞬膜条件づけ手続きを用いて逆行条件づけを行い，感覚表象を強く反映する CRである瞬膜反射に関しては制止性の反応が形成され，動機づけ表象を強く反映したCRである摂水抑制に関しては興奮性の反応が形成されることを見出している（同

様の結果は McNish, Betts, Brandon, & Wagner, 1997 も参照）。またDelamater, LoLord, & Sosa （2003）は2種類の食餌 USと2種類のCSを用いて逆行条件づけを行った結果，食餌の感覚表象特異的なPIT4_{，および遅滞テストを} 通じて，これらの逆行CSが感覚表象に特異的な制止を獲得していたことを示している。これらの結果は， Millerらの実験において主にUSの動機づけ表象を大きく反映する反応を指標に用いることが，逆行条件づけにおいても興奮性反応の検出を可能にしている1つの要因であることを示唆する。ただし，このこと自体は，時間関係統合の証拠として用いられている，2次性CSに対して1次性逆行CSよりも高い水準のCRが見られる現象を説明しない。この点に関しては次に高次条件づけの特性に基づいた仮説を述べる。 Millerらが用いる手続きに共通するもう1つの特徴は，条件づけの獲得と表出を区別するために高次条件づけを用いていることであるが，高次条件づけでは反応の獲得または表出に用いられる US表象が1次条件づけのそれと異なることが過去の研究から示唆されている。例えば 2次条件づけでは，一般に USの低価値化や 1次CSの消去によって反応が減弱しにくいことが知られており（Holland & Rescorla, 1975; Rescorla, 1973; Rizley & Rescorla,

1972），また反応トポグラフィが1次CRのそれと異なり USの種類を反映しないこと（Stanhope, 1992）などから， 2次条件づけにおける反応は具体的なUSの感覚表象に依存しないと考えられている。また条件性強化子を用いたオペラント条件づけにおいても，US （1次性強化子）の低価値化はオペラント反応の獲得に影響しない，つまり条件性強化はUSの感覚表象に依存しないことが知られている（Burke, Franz, Miller, & Schoenbaum, 2008; Par-kinson, Roberts, Everitt, & Di Ciano, 2005）。さらに，味覚嫌悪条件づけにおいては溶液CSの摂取量，および舐め反応のまとまりの大きさ（lick cluster size）が，それぞれ

4 _{感覚表象特異的PITは，オペラント反応のCS呈示に} よる増加または減少の程度が，オペラント反応と結果を共有するCSの呈示による場合と，反応と結果を共有しないCSの呈示による場合とで異なることを指す。例えばCSA–USA, CSB–USBを訓練後，2種類のオペラント反応 RA, RBをRA–USA, RB–USBという随伴性で訓練すると，結果としてテストにおいてCSB呈示よりもCSA呈示によってRAの反応率がより大きく増強されることをいう。これに対し一般動機づけ表象に基づくPITは，CSAまたはCSBの呈示により反応が同程度に修飾される現象，あるいはUSA, USBと動機づけ表象のみを共有する USCと結びついた刺激 CSCの呈示によりオペラント反応が修飾される現象を指す。

(11)

CS摂取の動機づけ側面（“wanting”）および感覚的側面（“liking”）を反映するとされているが（Dwyer, 2009; 味覚に対する舌および口を中心とした顔の反応を指標とする感覚的側面の計測については Berridge, 2000も参照），二つの異なる風味を複合CSとして呈示した後に一方を単独で塩化リチウムUSと対呈示する感性予備条件づけを行うと，2次CSに対して摂取量は低下するが舐め反応のまとまりの大きさは影響を受けないことが示されている（Dwyer, Burgess, & Honey, 2012）。これらの結果は総じて，高次条件づけでは連合構造において次数の高い距 Figure 2. （a） Representative simulations of a single trial of backward conditioning based on the AESOP model. The top panel

shows the pattern of A1 activity in a CS node across time. The middle and bottom panels show the patterns of A1 and A2 activities for the sensory representation of the US （USσ） and the motivational representation of the US （USε）, respectively. pd1 and pd2 are decay rate parameters that control the speed of change of stimulus representations from A1 to A2 and from A2 to I state, respectively. Note that AESOP assumes that both of these parameters are smaller for USε. （b） Associative strength accrued to the CS with respect to the USε and USσ, as a function of US–CS intervals. Note that VCS–US is negative

（inhibitory） for USσ and positive （excitatory） for USε, at the interval point indicated by the arrow below the abscissa. Un-labeled functions represent the results of similar simulations with intermediate or more extreme US decay rate parameters. （The figure is reproduced from Wagner & Brandon, 1989, with permission of the publisher）．

(12)

離にあるUS事象に関して詳細な感覚的特性が失われており，反応は主にその動機づけ特性によって維持されていることを示唆する。これらをまとめると，次のように考えることができる。1次条件づけにおいては，AESOP理論によって予測されるようにUS動機づけ表象の時間非特異性が興奮性の逆行条件づけを成立させるが，同時に電撃USに含まれる一定の感覚表象が持つ時間特異性によって制止性の反応が形成され，合計反応は抑制される。2次条件づけにおいては感覚表象の果たす役割は小さくなっているため，動機づけ表象によって獲得された興奮性連合強度が最大限に表出される。このように考えると，1次条件づけよりも2次条件づけでより高い逆行性CRが得られていることを説明できる。つまり別の言い方をすれば，逆行1次CSと結びついた2次性CSの呈示に対して，「いつ電撃が来るかは判断できないが，漠然とした恐怖が生じるために」CRが生じている可能性がある。これは時間的符号化仮説が想定する，時間関係の正確な統合的配置によってCRが生起するという過程とは全く異なる過程によって時間的符号化様の現象が生じている可能性を意味する。ただし，この仮説の前提となっているのは，電撃US の感覚表象によって形成される制止性の反応が，動機づけ表象によって形成される興奮性の反応を1次条件づけにおいて抑制するという点である。これを媒介する過程としては，2つの可能性がある。1つは，電撃USに対する行動抑制というCRが，そもそもUSの動機づけ表象とともにいくらかの感覚表象に基づく反応を含んでいるという可能性である。Tait & Saladin （1986）では，それぞ

れのUS表象を反映しやすい瞬膜反射と摂水行動の抑制を別の指標として計測することで，それぞれに対して制止と興奮という異なるCRを検出したが，このこと自体は必ずしも摂水抑制が動機づけ表象のみによって媒介されていることを示す結果ではなく，それぞれのCRに含まれる2つの表象の割合の違いを反映していると考えることが可能である。したがって，ある反応に含まれる2 つのUS表象の配分によっては，1次性逆行条件づけにおいて興奮と制止の加算により反応が相殺される可能性が考えられる。1次性逆行CSが実際に興奮とともに制止の成分を含むかどうかを検証するためには，同一のCR 指標を対象として，興奮性連合の形成を確認するとともに遅滞テストや加算テストによって制止性連合の形成をテストすることが考えられるが，Barnet & Miller （1996a）は実際に，CS2に対する興奮性CRの形成を支持するCS1 が，制止性連合を同時に獲得していることを，同一の摂

水抑制指標を用いた加算テストにおいて示している（Williams & Overmier, 1988も参照）。

2 つ目の可能性として，AESOP 理論では，US の感覚表象および動機づけ表象に基づく異なる反応は独立でなく，ある表象に基づく反応が別の表象に基づく異なる種類の反応に影響を及ぼすことを仮定している（Wagner & Brandon, 1989）。彼らは音に対する驚愕反応の恐怖による増幅や，恐怖条件づけられた文脈での瞬膜反射の増強などを例として，動機づけ表象に基づく反応が感覚表象に基づく異なった反応を修飾する点について述べている。一方，逆の方向性を持った影響については述べられていないものの，例えば食餌の感覚表象に特異的なPIT の大きさが，感覚表象の変化に由来する強化子低価値化の影響を受けない，すなわちオペラント反応がある強化子の動機づけ表象のみに基づく場合（低価値化条件）と動機づけ表象および感覚表象の両方に基づく場合（非低価値化条件）とで，反応によって得られるのと同じ結果を予告するCSの呈示が同程度に，結果特異的なオペラ

ント反応の増強をもたらすこと（Colwill & Rescorla, 1990; Holland, 2004）からは，US感覚表象が同じ食餌の動機づけ表象に基づく反応を修飾する可能性も示唆される。しかしながら，ここまで述べたような説明ではMatzel et al. （1988）の実験5における，2つのCSを同時呈示して感性予備条件づけを行う手続きでSimultaneous–Simul-taneous群での2次性CRが低かった理由を説明できない点も記しておく必要がある。ただし，この実験では持続音とクリック音という2つの音刺激を第1期において同時呈示して感性予備条件づけを行っているため，2次性 CSに対する反応は，CS2–CS1–USという高次連合の結果というよりは，単にCS1からCS2への反応の般化であった可能性が否定できない。なぜなら，CS2はテストにおいて初めて単独で呈示され，それまでに 2つの音CSを知覚的に弁別する機会がなかったはずだからである。ここまで述べてきたように，Millerらが時間的符号化仮説によって説明する現象のいくつかは，AESOP理論と高次条件づけにおけるUS表象の特性を組み合わせることによって説明できると考えられるが，それはすなわち，現在のAESOP理論に対してある仮定を追加する必要があることを意味する。具体的には，例えば2次条件づけについてAESOP理論（SOPも同様）は，CS2がCS1 表象をA2状態に活性化し，それによりCS1と連合した US表象がA2状態に活性化され，その結果としてCRが表出されるとする。この際，連合的に活性化されたCS1 表象が取り出すことのできる US表象の種類について AESOP理論は特別な仮定を持たないが，ここで述べた

(13)

議論に基づき，連合的に活性化されたCS1 （A2状態）は US の動機づけ表象ノードを活性化するが，感覚表象ノードにはアクセスできない，という仮定を設けることが考えられる。また，本稿では紙数の制限上詳しく述べる余裕がないが，1次条件づけとして逆行条件づけを用いる場合以外の手続きによる時間的統合現象，例えば感性予備条件づけによってA–Xを訓練し，その後異なる痕跡期間を用いてA–USを訓練し，XとUSとの統合時間配置とXに対するCRの程度との関係を問題とするような研究（例え

ばCole et al., 1995）については，媒介条件づけ（Holland, 1983）による説明（Ward-Robinson & Hall, 1996, 1998）や， 1次CSがUSと連合する際の活性状態（痕跡条件づけにおいてはA2に減衰している）とテストにおいて連合的に活性化された1次CSの活性状態（A2）との状態一致性に注目した説明（Lin, Dumigan, Dwyer, Good, & Honey, 2013; Lin & Honey, 2010, 2011）が可能であることを指摘

しておきたい。これらの説明のいずれにおいても，SOP が持つ仮定のうち，A2状態に表象されるCSと実際に提示されるUS （A1状態）との間には学習が成立しないという仮定について，それらの間の興奮性連合の形成を許容するような修正を提唱していることは注目に値するであろう。本節の最初に述べたように，ここで述べた議論は Millerらの時間的符号化仮説に対する全体的な反論・批判を行うことを目的としたものではなく，あくまでも動機づけ表象に基づいた CRを指標とすることへの偏重と，高次条件づけに伴うUS表象の変化が及ぼす影響に注意する必要性を指摘することを目的としたものである。いずれにせよ，上記のような議論が正しいか否かにかかわらず，より詳細な感覚表象に基づくCRを指標としても動物が同様の時間的符号化を行っているという結果を得ることができれば，時間的符号化仮説の理論的立場がより強まることは確かであろう。電撃USを用いてより詳細な時間的反応が得られる手続きとしては，Da-vis et al. （1989）が示したように，音に対する驚愕反応の恐怖による増強（Brown, Kalish, & Farber, 1951）を用いる

ことや，オペラント回避反応を用いること（Kamin,

1954）などが考えられる。また食餌USを用いて，感覚表象に特異的なPIT （例えばCorbit & Balleine, 2005; Hol-land, 2004）を指標として用いることも可能かもしれない（Delamater, Desouza, Rivkin, & Derman, 2014; Delamater & Holland, 2008）。また，ここではUSの具体的感覚表象が時間的側面を含むことを議論の前提としてきたが，これらが一体のものであるのか，それともそれぞれが独立に獲得，処理されるのかについては現在議論がなされているところであることを指摘しておきたい（例えば Delamater et al., 2014）。 2.3.2 定量的分析 Millerらの研究におけるもう1つ の潜在的な問題点として，定量的分析が見られない点を挙げておきたい。先にも述べた通り，時間的符号化仮説についての研究では，ある等しい順序条件の下で事象間間隔を系統的に変化させ，反応の量的変化を見るという分析を見つけることが難しい。もし連合形成の本質が時間的接近であると主張するならば，このような実験的検討はなされてしかるべきである。例えばMillerらは，高次条件づけを通じて予測されるCS2とUSとの時間的配置の影響を検証するにあたって，2つのCSの間に連合を形成する際にその痕跡期間が0秒である条件と5秒の条件を比較するという手続きを用いるが（例えばArcedia-no, Escobar, & Miller, 2003; Molet et al., 2012），こうした比較においては，刺激間の時間間隔のみならず他の条件も同時に変わってしまう問題がある。例えば，0秒痕跡で CS1–CS2を訓練された群では，CS2が後に単独呈示される場面において，連続的複合刺激CS1CS2の一部としてのCS2と単独呈示されたCS2との間に般化減少が生じることが予想されるが，5秒痕跡群では2つの実験場面でのCS2の間に般化減少は生じないであろう。こうした問題を解決するには，例えばCS間にどちらも痕跡期間があるがその長さが 5秒と2秒であるような，パラメトリックな条件間比較が必要であると考えられる。本節では最後に，こうした問題に対して一定の解決を提供する方法として，食餌条件づけを用いて時間関係の統合を検証した研究を紹介する。Leising, Sawa, & Miller （2007）は，まず60秒の聴覚性CS2呈示中に10秒間の点滅光 CS1を複合呈示することで感性予備条件づけを行い，その後第 2期で光CS1と餌USを同時呈示した。実験操作として，感性予備条件づけ期においてある群では光 CS1はCS2の開始5秒後に（早期群），別の群では45 秒後に呈示された（後期群）。テストでは，60秒の聴覚 CS2が単独呈示され，その間のマガジンへの頭部挿入回数がCRとして記録された。結果としては，早期群では CS2の前半に，後期群では後半にCRの増加が見られた。これは第1期における音と光の時間関係と，第2期で得られた光と食餌との関係性を被験体が統合して表出した結果であると解釈できる。Taylor, Joseph, Zhao, & Balsam （2014）も，これに類する手続きを用いて同様の結果を

得ている（実験3）。こうした手続きの利点は，時間関係の学習効果を2次性CRの量的変化として捉える，すなわち時間統合が生じたか否かを問うだけでなく，CRの生起

(14)

を時間の関数として表すことによって，統合された時間表象の詳細を検証することができる点である。今後，こうした手法を用いて，1次条件づけとして逆行条件づけを用いた場合における時間的統合や，2.2.1で紹介したような様々な現象に関しても研究が進展することが期待される。また上でも述べたように，電撃USを用いた場合にも，これと同様にCRの詳細な時間分布が得られるような指標を用いて研究が進展することが期待される。 3. 結 論本稿では，古典的条件づけにおいて時間が果たす役割を，条件づけの強度に事象間間隔が及ぼす影響，US生起時間の正確な予測，弁別刺激としての時間の利用といった点について簡単に紹介し，そのうえで動物が複数場面における事象間の時間関係を統合して時間的な予測を行うとする現象について，Millerらの時間的符号化仮説を中心に見てきた。前節2.3で論じたように，手続き上の改善点や他の理論による代替説明の可能性が考えられるものの，こうした研究が動物の時間情報処理に関する理解に大きな前進をもたらしたことは明らかである。今後はこうした時間情報の場面間での統合が，実際に神経系においてどのように実現されているのかという点の解明が期待される。また，別稿で述べるオペラント行動における計時との関わりについては，それぞれが独立した研究分野として発展してきた経緯から，いまだ不明な点が多い。例えば前節では時間的符号化仮説に対する批判として，定量的分析が欠如していることを挙げたが，時間研究における定量的分析の1つの重要なあり方は，反応の時間分布そのものの特性に関するものである。 2.1.3や2.3.2で紹介したように，CRを時間の関数として検証する研究は過去にも存在するが，反応の時間分布それ自体の性質を問うような研究，例えば刺激として与えられる時間間隔とそれに伴う反応分布の変動性の関係性を検証するような，精神物理学的な研究は比較的少数である（Gibbon, 1977; White et al., 2000）。時間情報処理のこうした量的側面に関する研究は，別稿で見ていくようにオペラント計時行動の分野においてはるかによく発展しており，今後古典的条件づけにおいても同様の理論的発展が期待されるところである。謝辞本稿の準備・執筆にあたり，慶應義塾大学の渡辺茂名誉教授に多くの貴重なご助言をいただきました．また本稿の出版にあたり，日本学術振興会科学から責任著者への研究費補助金（課題番号： 26885079）による助成を受けました．ここに謝意を表します．引用文献

Amundson, M. R. F., & Miller, R. R. (2008). CS–US temporal relations in blocking. Learning & Behavior, 36, 92–103. Arcediano, F., Escobar, M., & Miller, R. R. (2003). Temporal

integration and temporal backward association in human and nonhuman subjects. Learning & Behavior, 31, 242–256. Asratyan, E. A. (1965). Compensatory adaptation, reflex

activi-ty, and the brain (Trans. by S. A. Corson). New York:

Ox-ford University Press.

Balci, F., Gallistel, C. R., Allen, B. D., Frank, K. M., Gibson, J. M., & Brunner, D. (2009). Acquisition of peak responding: What is learned? Behavioural Processes, 80, 67–75.

Balsam, P. D., Drew, M. R., & Yang, C. (2002). Timing at the start of associative learning. Learning and Motivation, 33, 141–155.

Balsam, P. D., & Gallistel, C. R. (2009). Temporal maps and in-formativeness in associative learning. Current Opinion in

Neurobiology, 32, 72–78.

Barnet, R. C., Arnold, H. M., & Miller, R. R. (1991). Simulta-neous conditioning demonstrated in second-order condi-tioning: Evidence for similar associative structure in for-ward and simultaneous conditioning. Learning and

Motivation, 22, 253–268.

Barnet, R. C., Cole, R. P., & Miller, R. R. (1997). Temporal integration in second-order conditioning and sensory pre-conditioning. Animal Learning & Behavior, 25, 221–233. Barnet, R. C., Grahame, N. J., & Miller, R. R. (1993). Temporal

encoding as a determinant of blocking. Journal of

Experi-mental Psychology: Animal Behavior Processes, 19, 327–341.

Barnet, R. C., & Miller, R. R. (1996a). Second-order excitation mediated by a backward conditioned inhibitor. Journal of

Experimental Psychology: Animal Behavior Processes, 22,

279–296.

Barnet, R. C., & Miller, R. R. (1996b). Temporal encoding as a determinant of inhibitory control. Learning and Motivation,

27, 73–92.

Berridge, K. C. (2000). Measuring hedonic impact in animals and infants: Microstructure of affective taste reactivity pat-terns. Neuroscience & Biobehavioral Reviews, 24, 173–198. Bitterman, M. E. (1964). Classical conditioning in the gold fish

as a function of the CS–US interval. Journal of Comparative

and Physiological Psychology, 58, 359–366.

Blaisdell, A. P., Denniston, J. C., & Miller, R. R. (1998). Tem-poral encoding as a determinant of overshadowing. Journal

of Experimental Psychology: Animal Behavior Processes, 24,

72–83.

Blaisdell, A. P., Denniston, J. C., & Miller, R. R. (1999). Post-training shifts in the overshadowing deficits. Journal of

18–27.

Bouton, M. E., & Garcia-Gutierez, A. (2006). Intertrial interval as a contextual stimulus. Behavioural Processes, 71, 307–317. Bouton, M. E., & Hendrix, M. C. (2011). Intertrial interval as a

(15)

contextual stimulus: Further analysis of a novel asymmetry in temporal discrimination learning. Journal of

Experimen-tal Psychology: Animal Behavior Processes, 37, 79–93.

Brandon, S. E., Vogel, E. H., & Wagner, A. R. (2003). Stimulus representation in SOP: I: Theoretical rationalization and some implications. Behavioural Processes, 62, 5–25. Brown, J. S., Kalish, H. I., & Farber, I. E. (1951). Conditioned

fear as revealed by magnitude of startle response to an audi-tory stimulus. Journal of Experimental Psychology, 41, 317– 328.

Buhusi, C. V., & Schmajuk, N. A. (1999). Timing in simple conditioning and occasion setting: A neural network ap-proach. Behavioural Processes, 45, 33–57.

Burger, D. C., Denniston, J. C., & Miller, R. R. (2001). Tempo-ral coding in conditioned inhibition: Retardation tests.

Animal Learning & Behavior, 29, 281–290.

Burke, K. A., Franz, T. M., Miller, D. N., & Schoenbaum, G. (2008). The role of the orbitofrontal cortex in the pursuit of happiness and more specific rewards. Nature, 454, 340–344. Clark, G. A., Hawkins, R. D., & Kandel, E. R. (1994). Activity-dependent enhancement of presynaptic facilitation provides a cellular mechanism for the temporal specificity of classical conditioning in Aplysia. Learning & Memory, 1, 243–257. Cole, R. P., Barnet, R. C., & Miller, R. R. (1995). Temporal

en-coding in trace conditioning. Animal Learning & Behavior,

23, 144–153.

Cole, R. P., & Miller, R. R. (1999). Conditioned excitation and conditioned inhibition acquired through backward condi-tioning. Learning and Motivation, 30, 129–156.

Colwill, R. M., & Rescorla, R. A. (1990). Effect of reinforcer devaluation on discriminative control of instrumental be-havior. Journal of Experimental Psychology: Animal Behavior

Processes, 16, 40–47.

Corbit, L. H., & Balleine, B. W. (2005). Double dissociation of basolateral and central amygdala lesions on the general and outcome-specific forms of Pavlovian-instrumental transfer.

The Journal of Neuroscience, 25, 962–970.

Davis, M., Schlesinger, L. S., & Sorenson, C. A. (1989). Tempo-ral specificity of fear conditioning: Effects of different con-ditioned stimulus–unconcon-ditioned stimulus intervals on the fear-potentiated startle effect. Journal of Experimental

Psy-chology: Animal Behavior Processes, 15, 295–310.

Dearing, M. F., & Dickinson, A. (1979). Counterconditioning of shock by a water reinforcer in rabbits. Animal Learning &

Behavior, 7, 360–366.

Delamater, A. R., Desouza, A., Rivkin, Y., & Derman, R. (2014). Associative and temporal processes: A dual process approach. Behavioural Processes, 101, 38–48.

Delamater, A. R., & Holland, P. C. (2008). The influence of CS–US interval on several different indices of learning in appetitive conditioning. Journal of Experimental Psychology:

Animal Behavior Processes, 34, 202–222.

Delamater, A. R., LoLordo, V. M., & Sosa, W. (2003). Out-come-specific conditioned inhibition in Pavlovian back-ward conditioning. Learning & Behavior, 31, 393–402. Denniston, J. C., Blaisdell, A. P., & Miller, R. R. (1998).

Tem-poral coding affects transfer of serial and simultaneous in-hibitors. Animal Learning & Behavior, 26, 336–350. Denniston, J. C., Blaisdell, A. P., & Miller, R. R. (2004).

Tem-poral coding in conditioned inhibition: Analysis of associa-tive structure of inhibition. Journal of Experimental

Psychol-ogy: Animal Behavior Processes, 30, 190–202.

Denniston, J. C., Cole, R. P., & Miller, R. R. (1998). The role of temporal relationships in the transfer of conditioned inhibi-tion. Journal of Experimental Psychology: Animal Behavior

Processes, 24, 200–214.

Denniston, J. C., & Miller, R. R. (2007). Timing omitted events: An analysis of temporal control of inhibitory behav-ior. Behavioural Processes, 74, 274–285.

Dickinson, A., & Balleine, B. (2002). The role of learning in the operation of motivational systems. In C. R. Gallistel (Ed.), Stevens handbook of experimental psychology:

Learn-ing, motivation, and emotion. New York: Wiley, pp. 497–534.

Dickinson, A., Watt, A., & Griffiths, W. J. H. (1992). Free-operant acquisition with delayed reinforcement. Quarterly

Journal of Experimental Psychology Section B, 45, 241–258.

Dickinson, A., Watt, A., & Varga, Z. I. (1996). Context condi-tioning and free operant acquisition under delayed rein-forcement. Quarterly Journal of Experimental Psychology

Section B, 49, 97–110.

Drew, M. R., Zupan, B., Cooke, A., Couvillon, P. A., & Balsam, P. D. (2005). Temporal control of conditioned responding in goldfish. Journal of Experimental Psychology: Animal

Behav-ior Processes, 31, 31–39.

Dwyer, D. M. (2009). Microstructural analysis of ingestive be-haviour reveals no contribution of palatability to the incom-plete extinction of a conditioned taste aversion. Quarterly

Journal of Experimental Psychology, 62, 9–17.

Dwyer, D. M., Burgess, K. V., & Honey, R. C. (2012). Avoid-ance but not aversion following sensory preconditioning with flavors: A challenge to stimulus substitution. Journal of

359–368.

藤巻峻・新保彰大・松井大・時暁聴・神前裕（2015）．条件づけにおける時間II―オペラント計時行動，および時間学習の神経機構― 基礎心理学研究，

34, 78–90.

(Fujimaki, S., Shimbo, A., Matsui, H., Shi, X., & Kosaki, Y. (2015). Roles of temporal information in conditioning II: Operant conditioning and neural substrates of timing. The

Japanese Journal of Psychonomic Science, 34, 78–90)

Ganesan, R., & Pearce, J. M. (1988). Effect of changing the un-conditioned stimulus on appetitive blocking. Journal of

Ex-perimental Psychology: Animal Behavior Processes, 14, 280–

291.

Garcia, J., Ervin, F. R., & Koelling, R. A. (1966). Learning with prolonged delay of reinforcement. Psychonomic Science, 5, 121–122.

Gibbon, J. (1977). Scalar expectancy theory and Weber’s law in animal timing. Psychological Review, 84, 279–325. Gibbon, J., Baldock, M. D., Locurto, C., Gold, L., & Terrace, H.

条件づけにおける時間I―古典的条件づけ―