強化研究の展開と展望(日本基礎心理学会第30回大会)

(1)

TheJapnneseJou

川

at 　ef　Psychonomic　S‘セ”‘e

2Dl3

，

Vo畳

．

3且

，

No

．

2

，

175

一

夏8且

講演論文

強化研究

の

_{展開}

と

_展望

石

　井

拓

徳山大学

A

review

ofrecent

studies

on

positive

reinforcement

Taku

ISHII

Tokuyama　University

　　Psycholog童sts　may 　think　that　positive　reinfbrcement 　is　already 　a　wel レknown　process　and　that　studies　on　rein

−

forcement

　_are　_o_ロtdated

．

　These　beliefs　are　co

’

unterfactual 　in　that　behaVioral　researchers 　

have

　not　agreed 　on　the　exa⊂t

articulation 　of　the　fUnction　of　reinforcement

．

　Historically

，

　an　articulation 　_proposed　

by

　choice 　researchers 　was　domi

−

nant ：reinforcement 　

determines

　the　allocation 　of　different　behaviors

，

　which 　is　the　manifestation 　of　the　 relative

strength 　of　those　

behaViors

．

　However

，

　recent 　studies　on　the　dynamics　of　choice 　revealed 　that　the　allocation 　could 　be

determined　not　

by

　the　strengthening 　effect　

but

by

　the　signaling 　effect　of　reinforcement

．

　Further

，

　a　study 　using 　a　rein

−

forcement

−

omission 　procedure　with 　a　

fixed

−

interval　schedUle 　in　a　choice 　situation 　revealed 　that　the　_presentation　ofa

reinfercer 　had　two　simultaneous 　opposite 　effects　on　the　short

−

term　and 　long

−

term　allocations　of　

behaViors

．

　These studies 　suggest 　that　the　repetition 　of　reinf（〕rcement　inevitably　assigns　signaling　

functions

　to　reinforcing 　events

，

　and there丘）re

，

　reinft）rcement 　as　a　procedure　has　multiple 　effects 　on 　behavion　Behavioral　studies　clarifying 　these　and other 　functions　of　reinforcement 　will　

provide

　an　important　

basis

fbr

　_{physiological}　and 　computational 　studies　on rein丘）rcement

．

Key 　words ：　operant 　conditioning

，

positive

　reinfercement

，

　response 　strength

，

　signaling 　effect

はじめに　2013 年現在では，強化の研究の嚆矢となったSkinner の著書（

Skinner

，

1938）から数えて65年

，

さらにThorn

−

dike

による効果の_法則の_{定式}化（Thorndike

，

1911）まで遡ると100年以上が経過している。もはやオペラント条件づけにおける正の強化は心理学における常識の ₁つとなっ _{てお} り，それに関する研究は歴史的役割を終えたと考えている読者も少なくないだろう。そうでないとしても

，

“

認知革命

’

以降は「_{単純な}オペ _ラント条件づけでは説明できない

，

高次の」行動的過程の研究が重視されていることを認めざるを得ないのではないか

。

しかし

，

強化とは本当に単純な過程で

，

私たちはそれについて本当によく知っているだろうか。本稿では強化についての研究を振り返ることで

，

その複雑さや今後の研究課題を

Corresponding　author

．

　Facult_{γ of}　Economics

，

　Tokuyama　Uni

−

versity

，

　Gakuendai

，

　Shunan

−

shi

，

　YamaguChi　745

−

8566

，

_尹apan

．

E

−

mail ：ishii＠tokuyama

・

u

．

ac

．

jp

示したい

。

なお

，

本稿で取り上げられなかった話題については

，

坂上（2004）が参考になる。

強化

の

定

義と解釈

　まず

，

行動分析学における正の強化の基本的な定義を

確認する

。

定義にはプロセスとしての_定義と_{操作}としての定義の 2種類がある（Catania

，

　2007_；Cooper

，

　Heron

，

　＆

Heward

，

2007）。プロセスとしては，ある刺激や出来事がある行動に後続したことにより同様の行動が_起こりやすくなることである

。一

方

，

操作としては

，

そのような効果をもつ_刺激や出来事を特定の行動の後に呈示することである。どちらの定義も個体の行動と環境の関係のみに基づいた記述的な定義である

。

特に

_，

プロセスとしての定義にも生理的過程や心的過程などの_内的過程は含まれていないことに注意していただきたい。　例えば

，

標準的なオペ _ラント箱の中でハトがキイ_つ_つき行動をした直後に餌が出現し

，

それによってキイつつき行動が生起しやすくなったとい _うことは

，

プロセスとしての正の_強化である。

一

方

，

実験者がハトのキイつつ

(2)

き行動を生起しやすくさせようとしてキイつつき行動の直後に餌を呈示することが

，

操作としての正の強化である

。

ここで

，

ハトの体内で起こる生理学的変化は定義に含まれておらず

，

ハトがキイつつき行動と_結果の関係を「_{理解}_{した」か}_否かや

，

餌を出現させることを「目的として」キイつつき行動を増やすかどうかは関係ない。　しかし

，

現象を理解するときに記述にとどまるのは非常に_難しいようで

，

_行動分析学者の間においてすらも単なる記述をはみ出した正の強化の解釈が生み出された

。

解釈には_少なくとも「_結_果による選択」と「_反応強度の増強」という2つがある

。

　まず「_結_果による選択」という解釈では

，

生物進化における淘汰と同様の論理で正の強化を解釈しようとする（Skinner

，

1981）

。

つまり

，

生存と繁殖に繋がった生物の形質が後の世代で増えたり維持されたりするのと同様に

，

正の強化に繋がった行動が増えたり維持されたりすると考える

。

たしかに

，

「_{結果}による選択」という論理は生物進化と正の強化の間で少なくとも表面上は類似している

。

しかし，生物が繁殖に成功することと行動が強化子の出現をもたらすことはどれだけ似ているかなど

，

類似性を細かく検討すると疑問も少なくない。　もう1つの解釈は

，

特定の行動が強化されるとその行動の「反応強度（response 　strength ）」が強まり

，

それが観察される行動に反映されるというものである（Nevin

，

1974；de　Villiards＆ Herrnstein

，

1976；Williams

，

1988）

。

　Skin

−

ner も1938 年当時は「_{反射強度（}reflex 　strength ）」という

同様の概念を用いていた

。

おそらくこの概念が導入された当初は反応強度の強さが時間当たりの反応率の高さとほぼ同義であったと見なせそうである。しかし

，

反応率の高さを基準として選択的に行動を強化する高反応率分化強化スケジュ

ー

ルや低反応率分化強化スケジュ

ー

ルによって反応率の高さを操作できることが示された（Fer

−

ster　＆　Skinner

，

1957）ことにより

，

反応率を反応強度の直接的な指標と見なすのは困難になった。そのため行動の_他の_{側面}が反応強度を反映するという考え方がいくつか提案されるようになり

，

それに伴い反応強度は抽象的なパラメ

ー

タになった。反応率以外の反応強度の指標としては

，

選択肢間の選好

，

累進比率スケジュ

ー

ルにおけるブレ

ー

クポ_イント

_，

_反応の変化抵抗

，

需要の弾力性などが提案されている（Hursh　＆　Silberberg

，

2008）。これらのそれぞれについては指標としての欠陥が指摘されていたり

，

研究がまだ十分に進んでいなかったりするため

，

強化によって増強されたと考えられる反応強度がどのように行動に反映されるかという問題は未だ決着に至っていない。選択行動研究　定義を超えて強化の_働きを理解しようとする_研究の_中で

，

最も重点的に取り上げられてきたのは選択場面である

。

生きている動物にとっては常に複数の行動が可能であるとい _う意味で

，

実際に生起したすべての行動は選択された行動であると見なすことができ

，

選択について明らかにすることがすべてのオペラント行動に対する強化の働きを明らかにすることに繋がる。このような包括的な視点に根ざしていたことと

，

その実現を保証するかのようなマッチングの法則が見出されたことが

，

選択行動研究の盛り上がりを生んだと考えられる。　選択行動研究で多く使われてきた実験場面は並立スケジュ

ー

ルと呼ばれる。本稿では以降でハトを被験体とした実験のみを紹介するため

，

その_{場合}の_{標準的}な実験を紹介すると次のようになる

。

実験装置となるオペラント箱の中には2つの反応キイが左右に並べて配置され

，

ハトはいつでも自由にそれらをつつくことができる

。

ただし

，

2つは離れているため同時に両方をつつくことはできない

。

それぞれの反応キイに_対する反応は

，

独立した変時隔（variable 　interval ；VI ）スケジュ

ー

ルに基づいて強化される。例えば

，

左キイでは以前に左キイへの反応が強化されてから平均して 30_{秒経}過した後の最初の反応が強化され，右キイでは以前に右キイへの反応が強化されてから平均して60秒経過した後の最初の反応が強化される。この手続きは並立VI　30秒 VI　60秒スケジュ

ー

ルである。この場面では次にいつ

，

どちらの反応キイへの反応が強化されるかを示す刺激は存在しない

。

それでもハ _トの_行動にはマッチングの法則という規則性が見出される（Herrnstein

，

1961）

。

この法則は

，

ある反応キイに対する反応の相対強化率に

，

その反応の相対反応率が

一

致するというものである。例えば

，

前述の例では左キイへ _の反応は平均して 1分あたり2回強化され

．

右キイへの反応は平均して1分あたり1回強化されるため

，

左キイからの相対強化率は3分の2となり

，

行動もそれに

一

致するように調整されてすべてのキイつつき反応のうち 3 分の2が左キイに対する反応となる。

ここで

，

左キイと右キイのそれぞれに対する反応率を B_，とB_、

，

それぞれの反応に対する強化率をR，とR，とすると

，

マッチングの法則は以ドの式で表される。

B1

＝

Rl

_（1）　　 B

］

＋B2 　　　　R，＋R2 この式の左辺は左キイへの相対反応率を表し

，

右辺は左キイへの反応に対する相対強化率を表す

。

この法則は Baum ＆ Rachlin（1969）によって拡張され

，

強化率では

(3)

石井：_{強化研究}の展開と展望 177 なく強化量や強化子呈示の即時性を左右のキイで_操作した場合や

，

相対反応率ではなく左右に対する反応数の比（B，1B，）や

，

左右での反応に費やした時間の比を従属変数とした場合にも選択行動を記述できるようになっている（Baum

，

1974）

。

　もしもこのような法則をさらに拡張して_， 2つの行動間の選択のみではなく

，

特定のときに可能なすべての行動とそれらに対するすべての強化を含む場面を扱えるようにするなら

，

そこから強化の役割を次のように解釈することができる

。

すなわち

，

強化の役割は可能な行動のうち特定の_行動の_配分を決めることである。実際 Her

−

rnstein _（lg70_）はこのような考えに_基づいてマッチングの法則を拡張し

，

単

一

の VIスケジュ

ー

ルで強化された反応の絶対反応率を記述できることを示した。　その後

，

並立VI　VI _スケジュ

ー

ルの下での相対反応率は相対強化率に完全に

一

致するよりも

，

やや無差別な選好に近寄った値をとることが多いなどの事実が明らかになり

，

マッチング法則はそれらを加味した形で

一

般化マッチング法則として改めて定式化された

。

芸

；

−k

（

餐

：

1

… ここで a は感度パ _ラメ

ー

タと呼ばれており

，

これが 1よりも小さな値をとると各反応キイに対する反応率の比は

，

それぞれの反応キイで得られる強化率の比ほど極端ではなくなる

。一

方

，

kはバイァスパラメ

ー

タと呼ばれており

，

この値が 1より大きければ左キイ

，

1より小さければ右キイに対して選択が偏っていることになる。 a とkがともに 1に等しければ

，

式（2）は式（1）と同値である。　このような選択行動研究の理論的な拡張のほかに

，

手続き的な拡張としては

，

並立スケジュ

ー

ルでVIスケジュ

ー

ル以外の強化スケジュ

ー

ルを用いた研究や

，

より複雑な並立連鎖スケジュ

ー

ルを用いた研究が多数行われてきた（レビュ

ー

として

，

Williams

，

1988）_。それらの研究の多くが根ざしている考え方は

，

強化スケジュ

ー

ルのさまざまなパラメ

ー

タによって選択肢の価値が決まり

，

それが行動間の選好に反映されるζいうものである

。

選択肢が持つとされる「価値」も反応強度と同様に抽象化されたパラメ

ー

タであるため

_，

これを行動の側から表現し直すと

，

行動間の選好として表現される相対的な反応強度が選択肢の強化スケジュ

ー

ルによって決まっているという考えになる

。

行

動ダイナミクス研

究

への展開以上のような研究は

，

1つの実験条件ごとに行動が安定するまで同じ条件を維持するという静的な実験場面で行われたものであった。例えば

，

並立VI　VIスケジュ

ー

ルでマッチング法則を調べ _る_{場合}

，

_{左右}_{それぞれ}の反応キイでの強化率を固定したまま実験セッションを何日も連続して実施し

，

その下で安定した相対反応率を観察した後で別の強化率を用いた条件に移る手続きが用いられていた

。

これに対して

，

1990年代からは実験条件が変化するときの行動の変化を調べるために条件を敢えて変化させる動的場面での実験が次第に増えてきた（例えば

，

Bailey＆ Mazur

，

1990；Grace

．

　Bragason ＆ McLean

，

2003；Ma

−

zur_，　1992_，1995）_。そして_，そのような_{研究}の中から強化についての_新しい見方が生まれつつある。ここではその代表例として動的並立スケジュ

ー

ルを用いた研究を紹介する。　Baum とDavis・n による動的並立スケジュ

ー

ルを使った

一

_連_の研究（Baum　_＆　Davison

，

2004 ；　Davison　＆　Baum

，

2000

，

2003

，

2006

，

2D10）の典型的な手続きは次のようなものである。実験装置としては静的な実験場面と同様に2つの反応キイを左右に並べ _{たオ}ペ _ラント箱が使われた

。

強化のタイミングは単

一

のVIスケジュ

ー

ルによって決められたが

，

その強化が左右どちらへの反応に随伴するかは確率的に浹められたため

，

実質的には通常の並立 VI　VI スケジュ

ー

ルと同様となっていた

。

左右の反応キイでの強化確率の比としては， 27；1，9：1，3：1，1：1，1：3，1：9， 1：27という7つの条件が用意されていた

。

そして

，

同じ強化確率比の条件の下で左右合わせて10回の強化が起こるごとに強化確率比が別の条件に入れ替えられるようになっており

，

すべての条件が 1回の実験セッション内でランダムな順序で用いられた。つまり

，

この実験場面は実験中に選択に対する強化確率が変化するという動的な場面になっていた

。

　この手続きでは主に新しく3つの現象が確認された。（1）同じ強化確率比の下で強化が繰り返されると

，

左右に対する反応の比が強化確率の比に対応するときの感度（式（2）の a）が増していった。（2）

一

_方_の反応キイでの強化が連続して起こると次第にそのキイへの選好が増していった

。

（3）

一

方の反応キイへ _の反応_が強化_{されてか} らしばらくはその反応キイへ _の_{反応}が極端_に選ばれやすくなるという選好パルスが見られた。反応強度を解釈に用いると

，

これらは強化ごとに反応強度が変化する様子や

，

2つの行動間の相対的な反応強度が徐々に調整されていく様子を捉えたものと見なすことができる。　しかし

，

以ドに説明するように

，

餌呈示という

一

次性強化子と組み合わせて条件性強化子を用いた実験の結果は

，

この解釈と整合しないものであった（Davison＆

(4)

Baum

_，

2006の実験2）

。

この実験では

，

給餌器ライトの点灯が_餌と対呈示されたほか

，

それとは独立した強化スケジュ

ー

ルにより給餌器ライトが単独でも反応に随伴して呈示1れた。給餌器ライト単独呈示による条件性強化の確率比と

一

次性強化の確率比の関係には，正の相関，負の相関

，

無相関という3つの条件があった

。

正の相関条件では

，

例えば

一

次性強化子の呈示確率の比が左右に対して 27 ：1ならば

，

条件性強化子の呈示確率比も27：1であった。負の相関条件では逆に

，一

次性強化子の呈示確率比が 27：1ならば条件性強化子の呈示確率比は1：27であった

。

無相関条件では2つの呈示確率比がそれぞれ独立に決められた。実験の目的は

，

これらそれぞれの条件において条件性強化子も

一

次性強化子と同様の効果を持つかどうかを調べ _ることであった。　この実験で特に重要な結果が得られたのは

．

選好パルスを検討したときであった

。

正の相関条件において

一

方の反応キイへ _の反応_に条件性強化_{子が}随伴_{した}直後_{から} しばらくは

，一

次性強化予が随伴した場合と同様に同じ反応キイへ _の_反応_が多_{く見られた}

。一

方

，

_負_の_相_{関条件} においては条件性強化子の呈示をもたらしたのとは反対の反応キイに対する選好パルスが見られ

，

無相関条件では条件性強化子の出現直後の選好パルスが見られなかった

。

つまり

，

負の相関条件と無相関条件では給餌器ライトの点灯が文字通りの「_{条件性強化}子」としては機能しておらず

，

特に負の相関条件では条件性強化子で強化されなかった反応が

一

時的に増えるという逆説的な結果が得られたと言える。　この結果は

，

条件性強化子が

一

次性強化子と同様に反応強度を増強する効果をもつという考えに反するものであった

。

また

，

選好パルスは強化によって

一

方の反応キイへの反応強度が

一

時的に高められたことを反映するものとは見なせなくなった

。

むしろ

，

反応に随伴した給餌器ライトの点灯は

，

次にどちらの反応に対して餌呈示が随伴しやすいかを示す弁別刺激として機能していたと考えられる。　さらに重要なのは

，

このような弁別刺激としての機能は給餌器ライトの点灯のような「_{条件性強化子}_」のみがもつのではなく

，一

次性強化子も同様の機能をもつ _{可能} 性があることである

。

通常の動的並立スケジュ

ー

ルの実験では

，一

方の反応が_強化されると次も同じ反応が_強化される確率が高い。そのため

，一

次性強化子が随伴した後の選好パルスもこの弁別刺激としての機能によるものであった可能性がある。　このことは強化の定義にとって重要な意味をもつ。なぜなら

，

元々のプロセスとしての強化の_定義は「ある_刺激や出来事が行動に随伴することによって同様の行動が起こりやすくなること」であるが

，

「_同_様の_{行動}が起こりやすくなるのは

，

同様の行動に対しては同様の刺激や出来事が随伴しやすいということをすでに_経験しているため」である可能性が考えられるからである。少なくとも

，

行動の変動性に関する研究によって知られているところでは

，

「既に強化子が随伴した行動ではない行動のほうが次に強化されやすい」という環境におかれた動物は同じ行動を繰り返さないことをある程度まで学習できる（

Page

　＆　

Neuringer

，

1985）

。

このことを踏まえると

，

逆に

一

度強化された行動を繰り返すのは同じ行動が繰り返し強化されやすいという環境におかれてきた結果である可能性はト分に考えられる

。

それに加えて

，

同じような行動が繰り返し強化されやすいのは動的並立スケジュ

ー

ルを用いた場面に限らず

，

ヒトやヒト以外の動物が普通に暮らす環境でもおおむね同じかもしれない

。

　もちろん

h

記はあくまでも口_∫_{能性}_{であるが}

，

_{もしも正} しければ「同様の行動が繰り返されやすくなること」は強化の_{定義}にとって本質的ではなくなる、そしてこの口∫ 能性を考慮するならば

，

正味の強化効果を調べるためには「それまで行動が強化されたことのない個体の行動を

一

_回_だ_け_{強化す}_る_{」と}_い _{う方法を}_と_る_か

_，

_そ_れ _ま_で_{行動} が強化されてきた履歴の効果を排除するような方法をとらなくてはならないかもしれない。　念のため付け加えると

，

このような可能性が考えられるからといって

，

これまでの強化研究が無意味になるわけではない。すでにさまざまな行動が強化されてきた個休を使って

，

その行動をさらに強化することがどのような効果をもつかを調べ _るのも重要である

。

むしろ

，

正味の強化効果を調べ _{るために}_{強化履歴}の効果を排除するのではなく

，

積極的に強化履歴の効果を明らかにしたほうが生産的であるかもしれない

。

ただしその場合でも

，

強化子となる出来事の出現自体が弁別刺激としても機能する可能性を十分に考慮しておくこごが重要となるだろう

。

強化

の

信

号

効

果と

FI

スケジュ

ー

ル　強化子として働く出来事が同時に弁別刺激としても機能するという強化の信号効果はオペラント条件づけ研究の_{初期}から知られていた

。

その知見の 1つは_，定時隔（fixed　interval_；FI）スケジュ

ー

ルにおける反応パタ

ー

ンに

関するものである。このスケジュ

ー

ルでは以前に反応が

強化されてから

一

定の時閤が経過した後の最初の反応が

強化される

。

そのため

，

強化子呈示から

一

定時間は反応

(5)

石井：_強化研究の展開と展望 179 の弁別刺激となる。反応パタ

ー

ンはこの弁別刺激によって制御され

，

強化子呈示からしばらくは反応休止期間が続き

，

その後で_徐々に反応率が上昇していくというパタ

ー

ンが生み出される

。

これはF1スキャロップと呼ばれる。　

FI

スキャロップが強化子呈示という弁別刺激によって生み出されることは

，

強化子呈示を確率的に省略する実験によってさらに明確に示される

。

FIスケジュ

ー

ルの下で強化子としての餌呈示をときどきランダムに省略して代わりに中性刺激を呈示すると

，

その_直後にはFIスキャロップの初期の反応休止期間が短くなり，強化子が呈示されなかったにもかかわらず反応が増えるという逆説的

な効果が_得られる（

Staddon

　＆　lnnis

，

1969；Starr　＆　Staddon

，

1974_）。この強化省略効果は「フラストレ

ー

ション」などによっては説明できず

，

弁別刺激としての強化子呈示が省略された結果として起こることが知られてい _る（Kello

，

1972_）。　上記のような知見に基づいて

，

強化子の強化機能

，

すなわち反応強度を増強する働きを調べ _る_{場合}には FIスケジ

ュー

ルを避け

，

強化間の時間間隔がランダムになるようなVIスケジュ

ー

ルを用いるのが定石とされてきた

。

しかし

，

V1スケジュ

ー

ルを使った場合ですら強化子が弁別刺激として働く可能性を排除できないとすると

，

むしろ強化子の弁別刺激機能を詳しく調べたほうがよいかもしれない

。

それを実際に行った研究として

，

Ishii＆ Sakagami （2007）による実験を挙げられる。この実験ではそれまで _単

一

の FIスケジュ

・

一

ルを用いて研究されてきた強化省略効果が選択場面で調べ _ら_{れた}_。 _{左右}に並んだ2つの反応キイのうち

，

一

方に対する反応はFIスケジュ

ー

ルで強化され

，

他方に対する反応はランダム時隔（random interva1・RI）スケジュ

ー

ルというVIスケジュ

ー

ルと同様のスケジュ

ー

ルで強化された。この場面で訓練を続けると

，

ハトの選択パタ

ー

ンに規則性が表れ

，

H スケジュ

ー

ルで反応が_強化されてからしばらくはRIスケジュ

ー

ルの反応キイを選択し続け

，

それから再びFIスケジュ

ー

ルの反応キイへの選択を増やしていくというものになった

。

これは単

一

の FIスケジュ

ー

ルの下で見られるFIスキャロップと似た_{反応}パタ

ー

ンだと言える

。

そこで _， FI スケジュ

ー

ルが満たされた時の強化子を確率的に省略する条件が開始

1

れた。具体的には

，

4回に 1同の割合でランダムに餌呈示がキャンセルされ

，

代わりに_餌呈示と同じ長さのブラックアウト期間に置き換えられた

。

　この実験では2つの結果が _得られた。まず， FIスケジュ

ー

ルで強化子呈示が省略された直後から次にFIスケジ

ュー

ルが満たされるまでの_期間では

，

FIスケジュ

ー

ルの反応キイに対する相対反応率が増えていた。つまり

，

選択場面でも単

一

スケジュ

ー

ル場面と同様の強化省略効果が起きたものと見なせる。

一

方

，

強化省略直後以外も含めた実験セッション中の全体的な反応を平均すると

_，

_強化省略条件が開始される前に比べて FIスケジュ

ー

ルへ _の相対_反応率_が低下_{して}いた

。

これは

，

強化省略条件によりFIスケジュ

ー

ルの強化確率が低ドし

，

それによって選好が低

F

したものと見なせる。これらの結果をまとめると

，

FIスケジュ

ー

ルでの強化省略は

，

省略直後には短期的に反応を増やすが

，

より長期的には反応を減らす効果を持っていたと言える。後者の結果は

，

強化省略効果を敢えて選択場面で検討することにより明らかになったものである。　ヒ記の結果を強化省略ではなく強化子呈示の_側から表すと

，

FIスケジュ

ー

ルによって反応が強化されると

，

短期的には強化後休止が牛み出されることにより反応が減るが

_，

長期的には反応が増えていたと言えるe 前者の短期的効果は餌呈示の_{弁別}刺激としての効果である

。一

方

．

後者の長期的効果については少なくとも2通りの解釈が可能である

。

1つはt 強化子呈示がやはり反応強度を増強する効果をもち

，

それは短期的には強化子呈示の弁別刺激としての効果によって行動に表れにくくなることもあるが

，

長期的には行動に表れるという解釈である

。

もう1つの解釈は

，

長期的な効果も強化子の弁別刺激としての効果によるというものである。す

．

なわち

，

強化子の呈示は短期的には次の強化までの時間間隔についての弁別刺激となり

，

それと同時に長期的には同じ行動に_強化子が随伴しやすいことの_{弁別刺激}ともなって， 2 つの弁別刺激の効果が複合されて行動に表れるとも考えられる

。

　現時点では強化の長期的効果に関する上記

2

つの解釈を実験的に区別するのは難しいように思われる

。

また

，

結局は 2つの解釈は同義であると示されることになるかもしれない。それらの可能性を見極めるには

，

長期的な効果が現出するまでのダイナミックな行動変容過程をより詳細に検討していく必要があるだろう。

強化効

果に関するその

他

の研

究

　上記のような選択行動研究のほかにも

t

いくつかのアプロ

ー

チで強化の機能が研究されてきた

。

ここでそれぞれについて_詳しく解説することはできないが

，

以ドに4 つのアプロ

ー

チを簡単に紹介する

。

　強化子の効果は実験セッション内で呈示を繰り返すことにより次第に変化する。このことは

，

反応パタ

ー

ンの

(6)

セッション内変化（within

−

session 　changes ）こして研究されてきた。餌呈示を強化子とした場合には呈示を繰り返すことで強化効果が弱くなる

。

このようなセッション内変化は飽和化によるものだと考えられがちだが

，

実際にはそれよりも同じ刺激呈示が繰り返されることによる馴化が重要な要因になっていることが知られている（Mc

−

Sweeney＆Murphy

，

　2000）。　強化によってどの程度の反応数まで維持できるかは強化子の種類によって異なる

。

このことは行動経済学における強化子の_{需要弾力性}の研究で_調べられている

。

_{需要} 弾力性とは

，

1単位の強化子を得るのに必要な反応数（行動価格）と

，

その下で実際に獲得される強化子の量（需要）との関係のことである。強化子の種類によって

，

行動が頻繁に強化される場面では多量の強化子が獲得されるものの強化率が低下すると行動をあまり維持できなくなり獲得量が減ってしまう強化子や

，

逆に行動価格が増えても需要があまり低下せず高い行動価格での反応を維持できる強化子などがある

。

近年では

，

このような需要弾力性こそが強化子の本質的な価値を表すとする理論も提案されている（Hursh＆Silberberg

，

2008）

。

　強化によって行動間の相対的な配分が変わるだけでなく

，

動物の活動性が増して行動の全体量が増えることもある。このことは

，

動物の覚醒（arousaD 水準に対する強化の効果として研究されてきた

。

強化子の活動亢進効果は少なくとも標準的なオペ _ラント箱で餌呈示を強化子と

した場合には確認されている（Killeen＆Bizo

，

1998；Killeen

，

Hanson

，

＆　Osborne

，

1978_）。　強化は行動の_変化抵抗にも影響する

。

変化抵抗とは環境が変化したときに元の反応率がどの程度維持

1

れるかを表す概念である。反応に対する強化子の呈示が中止されて反応が消去されるときに

，

その反応がどれだけ消去されにくいかを表す消去抵抗は変化抵抗の

一

種である

。

変化抵抗に関する

一

連の研究により

，

変化抵抗の強さを決めるのは反応と_強化子の_随伴性ではなく

，

反応が強化されるときの弁別刺激と強化子の随伴性であることが知

られている（Nevin

_，

1974；Nevin ＆　Grace

，

2000；ただし例

外として

，

Bell

，

　1999_；Grace

，

　Schwendiman

，

＆Nevin，1998）。

結

論

　本稿では主に選択行動研究における強化の役割の分析について概説した

。

それらの研究が示しているように

，

強化子となる刺激が弁別刺激としても機能していたり，それによる短期的な効果は長期的効果とは別のものであったりするなど

，

強化子の出現は同時に複数の効果をもつようである

。

しかも

，

現在の実験的分析においてはそれらの効果を十分に切り分けることができているとは言えない

。

さらに

，

強化の研究には選択行動研究以外にもさまざまなアプロ

ー

チがあり

，

それらの間では強化の本質についての見方が統合されていない。そのため

，

将来の研究動向によっては正の強化の定義そのものを見直す必要すら出てくるかもしれない。　このように行動的な研究だけから見ても強化の_働きは複雑である

。

そのため

，

いわゆる「_{強化効果}_{」の}生理的基盤を調べ _る_場_合_{には}

_，

_{対象}_{とな}っている生理現象が強化の_働きのどの_側面に関係しているものであるかについて十分に知っておく必要がある。このような必要性を満たすためにも

，

強化にっいての行動的研究はこれからも重要性を増していくだろう。引用文献

Bailey

，

1．

　T

，

＆Maz鵬尹

．

　E

．

（1990）

．

　Choice　behavior　in　tran8i

−

　tion：Development　ef　preferen⊂e　for　the　higher　probability

　of　reinfor ⊂ement

．

JOU

厂nal　of　the　Experimental　Anal_）！si5〔ゾBθ

・

　haγier

，

53

，

409

−

422

．

Baum

，

　W 　M

．

，

＆Rachlin

，

　H

，

（1969_）

．

　Choice　as　time　allocation

，

Journal

　qノ「_the

Expe

厂

imentaJ

Anal

＞lsis 〔ゾ

Behavior

，

12

，

861−

　874

．

Baum

，

　W 　M

．

（1974）

．

　On　two　types　of　deviation　from　the

　matching 　law；Bias　and　undermatching

．

10urnal

（］

f

　the　Ex

−

　perimental　AnalJ！∫f50fBehavior

，

22

陶

231

−

242

．

Baum

，

　W 　M

，

＆Davison

_，

　M

．

_（2004_）

．

　Choice　in　a　variable 　en

−

　vironment ：　Visit　

patterns

　in　the　

dynamics

　ofcheice

．

　Journat

　qプthe　Experimentat　Ana り！sis　ofB ¢

i1avior

，

81

，

85

−

127

．

Bell

，

　M

，

　C

，

_（1999）

．

　Pavlovian　contingencies 　and 　resistance 　to

　change 　in　a　multiple 　schedule

．

Journal

　of　the　Experimentat

　Analysis（］

fBeha

γio_ら72

，

81

−

96

．

Catania

，

　A

．

　C

．

（2007）

，

　Learning

，

　4亡h　interim　ed

．

　ed ゴtion

．

　Corn

−

　wal 卜on

−

Hudson

，

　NY ：Sloan　Publish正ng

．

Cooper

，

1，

0

，

　Heron

，

　T

．

　E

．

，

＆Heward

，

　W 　L

．

（2007）

．

　App’ied

　Behavior　Analysis

．

2nd　ed

．

　Upper　Saddle　River

，

　NJ：Pearson

　Education

，

　Inc

，

Davison

_，

　M

．

，

＆Baum

_，

　W 　M

，

_（2000_）

．

　Choice　in　variable 　envi

−

　ronment ：Every　reLnfercer 　counts

．

Journal

Of

　the　Experimen

−

　tcllAna_り，sis〔ゾBehavior

，

74

，

1

−

24

．

Davison

，

　M

．

，

＆Baun1

，

　W

．

　M

．

（2003）

，

　Every　reinforcer 　counts ：

　Reinfbrcer血 agnitude 　and 亘ocal　preference

，

Journal

　qブthe

EXPe

「

imentalAna

り！sis　q_广Behavior

，

80

，

95

−

129

，

Davison

_，

　M

．

，

_＆ Baum

，　W

．

　M

．

（2006）

，

　Do 　conditional 　rein

−

f

・rcers　_C_・_unt_り_・_urnal _（_ゾtheExperimentalAnalrsis_・

f

Be

−

havior

，

86

_，

269

−

283

．

Davison

，

　M

．

，

＆Baum

，

　W 　M

．

_（2010）

．

　Stirnulus　_effects　_on　

locaI

preference

：Stimulus

−

response 　contingencies

，

　stimulus

−

f｛）od

　pairing

，

　and　stimulus

−

food　correlation

．

10urnat

　of　the　Exper

−

　imental　Ana リノsi50fBeha ソゴor

，

93

，

45

−

59

．

de　Villerds

，

　R　A

．

，

_＆ Herrnstein

，

　R

，

1

．

_（1976_）

．

］Poward　a　law　of

　response 　strength

．

　Psychologicat　Bulletin

，

83

．

1131

−

1153

・

(7)

Ert:

iutItMaoneceatRS

181

ment.

New

Ybrk:

Appleton-Century-Crofts.

Grace,R,C,,Bragason,O,,& McLean, A. R

(2003).

Rapid

quisition

of

_preference

inconcurrent chains.

Jburnal

of

the

Experimental

Analysis

_ofBehavior,

80,235-252.

Grace,R,

C.,

Schwendiman,

J.

NM,& Nevin,

_J.

A,

(1998).

Ef

fects

of unsignaled

delay

of reinforcement on

_preference

and resistance tochange.

journal

of

the

ExperimentalAnaly-sis

ofBehavior,

69,247-261,

Herrnstein,R.

_J.

(1961).

Relativeand absolttte strength of

spense as a

function

of

frequency

ofreinforcement. _journal

ofthe

ExperimentalAnalysisqfBehavior,4,267-272. Herrnstein,R.

_J.

(1970).

On the lawof effect.

Jburnal

of

the

ExperimentalAnalysis

ofBehavior,

13,243-266.

Hursh,S.R.,& Silberberg,A.

(2008).

Economic demand and

essential value. PsycholqgicalRevie",,115,186-198,

Ishli,T:,& Sakagami,T.

(2007).

Reinforcementomission in

concurrent fixed-intervaland random-interval schedules.

BehaviouralProcesses,74,334-341.

Kello,

_J.

E.

(1972).

The reinforcement-omission effect on

fixed-intervalschedules: Frustrationor inhibitienrLearning

and Motivation,3,l38-147.

Kineen,P R.,& Bizo,L A.

(1998),

The mechanics of

forcement.

Psychonomic

Bulletin& Review,5,221-238,

Killeen,R R,,Hanson.

_S.

_J.,

& Osborne,S.R.

(1978).

Arousal: Itsgenesisand manifestation as response rate.Rsycholagical

Revieiv,85,571-581.

Mazur,

J,

E.

(1992).

Cheicebehayiorintransition:

ment of

_preference

with ratio and intervalschedules,

nal

of

Experimental

Psychol[tgy:AninialBehaviorProcesses,

18,364-378.

Mazur,

_J.

E.

(1995),

Developmentof _preferenceand

ous recovery inchoice behaviorwith concurrent

interval schedules, Animal Learning& Behavior,23, 103,

McSweeneM F,K,,& Murphy E.S.

(2000).

Criticismof the

satiety hypothesisas an explanation of within-session

decreases

inresponding.

journal

of

theExperintental

sis

ofBehavior,

74,347-36l,

Nevin,

_J.

A.

(1974).

Responsestrength inmultiple schedule,

journat

_of

theExperimentalAnalysis

_of

Behavior,21,

408,Nevin,

J.

A,,& Grace,R.

C,

(2000).

Behavioral momentum

and thelawof effect.Behavioraland BrainSciences,23, 130.Page,

S.,

&

Neuringer,

A,

(1985).

Vdriabilityisan operant,

Jburnal

of

ExperimentatRsycholqg),:Animal Behavior

cesses,11,429-452,

ty.Efi2

(2oo4).

gin{kontyoop

eeigeTi

(scg)

Xva,ilmp70MLLih,lt6

axI:-Ste,

pp.122-153.

(Sakagami,

T.)

Skinner,B.E

(1938).

Tliebehavior

_of

otganisms: an

mentalanalysis.Oxford,England:Appleton-Centurv

Skinner,B.E

(1981).

Selectionbyconsequences. Science,213,

501-504.

Staddon,

_J,

E,R.,& Innis,N.K

(1969).

Reinforcement

sion on

fixed-interval

schedules.

Jburnai

of

theExperitnental Analysis

ofBehavior,

12,689-700.

Star4B.C.,& Staddon,

J,

E,R,

(1974).

Tlemporalcontrol on

periodicschedules: Signal_propertiesof reinforcement and

blackout.

iburnal

of

theExperimentaiAnalysis

of

Behavior,

22,S35-S45.

Thorndike,E.L.

(1911).

Animal inteUigence:Experimental

Studies,New Ybrk:Macmillan.

Williams,B.A.

(1988).

Reinforcement,choice, and response

strength. InR.Atkinson, R,J,Herrnstein, G,Lindzey& L. R.Duncan

(Eds.),

Stevens'

handbook

_of

experimental

cholog)l Vl)l,2;Learning and cagnition. 2nd ed, Oxfbrd,

強化研究の展開と展望(日本基礎心理学会第30回大会)

川

，

．

，

．

，

一

講演論文

強 化研 究

の

展 開

と

展望

石

井

拓

A

review

ofrecent

studies

on

positive

reinforcement

Taku

ISHII

−

forcement

．

’

have

．

，

by

−

determines

，

behaViors

．

，

by

but

by

．

，

−

−

fixed

−

−

−

behaViors

．

functions

，

，

provide

basis

fbr

．

，

positive

，

，

Skinner

，

，

−

dike

，

，

“

’

，

。

，

，

，

．

，

強化研究

_{展開}

_展望

　井

_，