• 検索結果がありません。

’ ’ 反応問時間の系列依存性における個人差と変動性

N/A
N/A
Protected

Academic year: 2022

シェア "’ ’ 反応問時間の系列依存性における個人差と変動性"

Copied!
13
0
0

読み込み中.... (全文を見る)

全文

(1)

反応間時間の系列依存性における個人差と変動性 13 

反応問時間の系列依存性における個人差と変動性

川 嶋 健 太 郎

「毎日この

Web

サイトを確認しないと。でもこっちのサイトはたまにで十分」。人間も動物も特 定の行動を途切れなくし続けるのではなく、ある程度の間隔をもってする。どうしである行動は 頻繁に行うのに、別の行動はめったに行わないのだろうか? 本稿では、強化可能な行動単位と

しての反応間時間

G n t e r r e s p o n s et i m e s :  

IRT)とその系列依存性についての研究を概観する。

1 .

反応問時間

強化スケジュールのもとでの行動についての理論には大きく分けて巨視的(m

o l a r

)理論と微視 的(m

o l e c u l a r

)理論の

2

種類がある。巨視的理論は主に平均的で集約的な行動指標、例えば強化ス ケジ、ュールのもとでの反応率と強化率との聞の関数的関係を扱っている。そしてある実験条件で の被験体の行動は被験体が行動とその結果の関係を最適化することから導かれると仮定している。

例えば、

v a r i a b l e ‑ i n t e r v a l( V I )スケジ、ユールのもとでの反応率はオペラント反応とそれ以外の測

定されていない行動をそれらの相対的な強化量に対応するように配分されると説明される

( H e r r n s t e i n ,  1 9 7 0

。)

一方、微視的理論は一つ一つの行動と強化の結果として、スケジュールのもとでの行動が現れ ていると考えている。例えば、IRTや強化間隔(i

n t e r ‑ r e i n f o r c e m e n ti n t e r v a l :  

IRI)、強化にいたる までの残りの反応数といった局所的な指標から、反応率といった集約的な指標を導き出すことが 目標となる。特にIRTに対する強化は微視的理論の一種であるIRT強化理論での重要な要因と

IRTn RTn+2  RTn+3 

「 斗‑v‑一 入 ーrー ん 「 反応 Rn  Rn R同+2 R岡 崎

砂時間

結果

Cn  Cn Cn+2 

c

岡 崎

|は報酬あり  . .. は報酬なし 図

1

フリーオペラント実験の事象系列

(2)

考えられる。

ここで

IRT

とは、フリーオペラント実験における、オペラント反応聞の時間である。図lは反 応と

IRT

、および反応の結果(報酬あり/なし)の時間的関係を表している。反応キーがlつの 場合のフリーオペラシト実験における事象系列は{I

R T i ,C i ,  I R T 2 ,  C z ,  . . .   I R T n ,  C n .  I R T n + b  C n + J ,  . .  .

}と 表すことができる(c

f .Norman, 1 9 6 6

)。このような事象系列はさまざまな学習過程の中で見られる ものである。

IRT

は学習実験の中で重要な指標であり、また強化学習の重要な要因の

1

つである と考えられる。

IRTと 関連が深いその他の微視的な行動指標として、強化後休止(p o s t ‑ r e i n f o r c e m e n t  p a u s e :  PRP

)がある。これは強化後の最初の

IRT

である。また強化間隔(I

R I )

は強 化と強化の聞の時間である。これらの指標は事象系列から導き出すことができる。

1‑1.初期のIRT強化理論

IRT

強化理論とは、強化スケジュールのもとでの被験体の行動は、強化スケジュールによって

IRT

に対する強化の仕方が異なることによるという見方である。

IRT

強化理論は特定の理論をさ すのではなく、むしろ

IRT

に対する強化が行動に影響を与えるという理論の総称である。

IRT

強 化理論は強化スケジュール研究のごく初期から見られる。

Skinner( 1 9 3 8

)は

VI

スケジュールと

v a r i a b l e ‑ r a t i o ( V R

)スケジュールのもとでの被験体の行動の違いを

IRT

に対する強化の違いに よって説明している。被験体の反応はばらばらに生起するのはなく、連続した反応が塊となって 生起する場合が多い。

VR

スケジュールでは、ランダムに決められた回数だけ反応すれば強化さ れるため、反応の塊の最初の反応よりも塊の途中の反応で強化される可能性が高い。反応の塊の 途中では

IRT

が短いため、

VR

スケジュールでは短い

IRT

が強化されることになる。この結果、

VR

スケジュールでは高い反応率(短い

IRT

)が多く見られる。一方、

VI

スケジュールでは以前 の強化からランダムに決められた時聞が経過して最初の反応が強化される。このため、しばらく 反応を休んでいたことになる、塊の最初の反応が強化されやすい。塊の最初の反応は

IRT

が長い ため、

VI

スケジュールでは長い

IRT

が強化されることになる。この結果、

VI

スケジュールでは 安定した比較的低い反応率(長い

IRT

)が多く見られる、とした。

IRT

強化理論は

IRT

に対して選択的に強化する強化スケジュールでの被験体の行動からも支 持された。

d i

e r e n t i a l ‑ r e i n f o r c e m e n t ‑ o flow r a t e  (DRL

)スケジュール(または

IRT>t

スケジュー ル)では、実験者が定めた基準の長さ以上の

IRT

での反応に対して、強化を与える。例えば、

DRL15s

では以前の反応から

1 5

秒以上過ぎてから反応しないと強化が与えられない。

DRL

スケ ジュールのもとでは基準の

IRT

よりも長い

IRT

の比率が増え、低い反応率が観察される。一方、

d i

e r e n t i a l ‑ r e i n f o r c e m e n to f ‑ h i g h  r a t e  (DRH

)スケジュールでは、実験者が定めた基準よりも短い

IRT

での反応に対して強化を与える。

DRH

スケジュールのもとでの被験体の

IRT

は短くなり、

高い反応率が観察される。これらのスケジュールの結果から

IRT

は実際には反応と反応の聞の時

(3)

反応問時間の系列依存性における個人差と変動性 15 

聞であるので行動そのものではないが、強化が可能な行動単位であること、また特定の

IRT

に対 する強化により、その

IRT

の頻度が増えると考えられた。

IRT

に対する強化が、

VI

VR

スケジュールのもとでの被験体の行動、特に

IRT

の分布に与え る影響を示すため、

Anger( 1 9 5 6

)は

i n t e r r e s p o n s et i m e s  p e r  o p p o r t u n i t y  ( I R T  /Op

)という指標を提 唱した。

IRT/Op

IRT

の長さについての条件付確率である。

IRT/Op

は、まず測定した

IRT

データをその長さによっていくつかのクラスにわけ、次にクラス毎に、そのクラスに入った

IRT

の数を、その

IRT

クラス以上の長さの

IRT

の数で割ることによって求められる。

IRT/Op

によっ て、短い

IRT

よりも生起する確率が小さい、長い

IRT

についても公平に図示することができる。

ある瞬間に反応が生起する確率が一定である場合を考えてみよう。どの瞬間でも同じ確率で反応 が生起するのに、短い

IRT

のほうが生起する確率が高くなってしまう。長い

IRT

が生起するには、

その間反応が起らなかったという条件が必要になるからである。

Anger( 1 9 5 6

)は

VI

スケジュー ルのもとでの、強化された

IRT

IRT/Op

と生起したすべての

IRT

IRT/Op

を比較し、高い 相闘があることをしめした。このことから

VI

スケジュールでの

IRT

分布は

IRT

が強化されたこ

とによって生じたのだとした。

最初の数量的な

IRT

強化理論である、

Shimp( 1 9 6 9

)の

momentarym a x i m i z i n g

の理論では、

被験体が一瞬ごとに強化確率が最大となるような選択をすると考えられた。

VI

スケジュールに ついては、被験体は自分が生起した

IRT

が強化されたかを記憶していき、各

IRT

クラスに対して 強化率を計算していく。そして被験体は、強化率を

IRT

の長さで重み付けした値を最大化するよ

うな、

IRT

を選択して反応すると考えられた。

1 ‑2. IRT強化理論に対する批判

R e y n o l d s  

McLeod ( 1 9 7 0

)は

IRT

強化理論の問題点について指摘し、強く批判した。彼らの批 判は①強化された

IRT

の分布と生起したすべての

IRT

の分布の相関の問題点、②

IRT

の分化強 化に対する異なった見解の

2

点である。まず、①

IRT

分布の相関の問題点については、数学的に 証明している。

VR

スケジュールのもとで強化された

IRT

IRT/Op

の値は全体の

IRT

のそれと 理論的にはまったく同じになることが示された。また

VI

スケジュールにおいても、高い相関と なることが証明された。このことから、強化された

IRT

IRT/Op

を証拠とした、

IRT

強化理論 はまったく無価値であると批判している。

また、②

IRT

の分化強化に対しては、オペラント反応以外の付随行動(a

d j u n c t i v er e s p o n s e

)に よって説明が可能であるとした。

DRL

スケジュールといった

IRT

の分化強化スケジュールで あっても、被験体が

IRT

の長さを弁別しているとは限らないと考えたのである。強化スケジュー ルの実験においては、強化の対象であるオペラント反応(例えばレバー押し反応)が観察の対象 となっている。しかし、オペラント反応以外の行動、例えば、毛づくろいをするなどといった行

(4)

動は常に測定しているわけではない。

DRL

スケジュールなどでは長い

IRT

でのオペラント反応 にいたる前に、これらの付随行動のいくつかが系列的に繰り返されることが多いことから、付随 行動の連鎖が

DRL

スケジュールによって強化されたため、長い

IRT

の頻度が増加したと考えら れるとした。

1 ‑ 3.近年のIRT強化理論

P e e l e ,  C a s e y ,  

S i l b e r b e r g  ( 1 9 8 4

)は、

VI

VR

スケジュールにおいて、

IRT

強化と全体的な強化 率のどちらが、

IRT

分布および反応率に影響を与えるかを調べた。

M u l t i p l etandem yokedVI‑VR  tandemVR

yokedVI

スケジ、ユールのもとでは、どちらの連結(

tandem

)スケジュールでも反応率と 強化率との関係は同一で、あるが、

IRT

に対する強化が異なる。実験の結果、短い

IRTを強化しや

すい

tandemyokedVI‑VR

では反応率が高く、短い

IRT

が生起しやすかった。さらに

VI

および

VR

スケジュールにおける反応率を

IRT

強化によって説明するシミュレーションも提案している。

このシミュレーションでは、

r e i n f o r c e m e n tmemory

に強化された

IRT300

個を記録する。新た に強化が起ると、その

IRT

r e i n f o r c e m e n tmemory

に追加され、最も古い

IRT

が取り除かれる。

次に、この

r e i n f o r c e m e n tmemory

の中から lつの

IRT

が選ばれる。

IRT

の選ばれる確率は、

IRT

の長さの逆数に比例する。これは

Shimpsr e s p o n s e  r u l e

と呼ばれているもので、たとえば、

2

秒の

IRT

6

秒の

IRTよりも 3

倍選ばれやすい。次に、選ばれた

IRT

の長さを分布の平均値 とする指数分布が作られ、この指数分布からランダムに抽出された値が新しい

IRT

となる。この

IRT

に対して強化スケジュールにしたがって強化が与えられ、以上のことが繰り返される。

VR64

V I 2 5 s

、VR64でシミュレーションが実施され、

VR

における高い反応率、

VIにおいて反応率の低

下が見られた。これらの結果から、

VIVR

スケジュールのもとでの被験体の行動は、全体的な強 化率よりも

IRT

に対する強化が重要であると結論付けられた。

P e e l e  e t  a l .  ( 1 9 8 4

)に対する批判は、実験およびシミュレーションそれぞ、れについて行われてい る。

McDowell

Wixted ( 1 9 8 6

)は

VR

スケジュールを

VIp l u s  l i n e a r  f e e d b a c k  ( V I

スケジュールで はあるが、反応率が高ければ高いほど、強化率が高くなるようにしたもの)と表現できることを 指摘した。この

V I ‑ w i t h ‑ l i n e a r ‑ f e e d b a c k

スケジュールのもとでは、被験体は

VR

スケジュールの もとでと同じような反応率を示し、

P e e l ee t  a l .  ( 1 9 8 4

)の

IRT

強化理論では同様の結果が起らない はずであると指摘した。

また

Wearden

C l a r k  ( 1 9 8 8

)は

P e e l ee t  a l .  ( 1 9 8 4

)のシミュレーションを再現して、様々な強化 率に対してのシミュレーションモデルの感応度を調べた。その結果、強化率を変化させても、反 応率はほとんど変化しないことを明らかにし、シミュレーションの根幹である

Shimpsr e s p o n s e   r u l e

の不備を指摘した。実際の被験体が強化率に応じて反応率を変化させる事実とシミュレー

ションの結果は一致しない。一方で、、オペラント反応以外の付随行動をシミュレーションモデル

(5)

反応間時間の系列依存性における個人差と変動性 17 

に付け加えることで強化率に対する感度が増すことを示した。

このように

IRT

強化理論による強化スケジュールのもとでの行動の説明は不十分であるが、

IRT

が強化可能な行動単位であるという証拠は豊富にある。まず特定の

IRT

クラスを強化するこ とによって、その

IRT

クラスの頻度は増加する。

W i l k i e &  P e a r  ( 1 9 7 2

)はl秒から

2

秒の区間の

IRT

を強化することによって、その区間の

IRT

が生起する頻度が増加することを示した。また

IRT

に対する強化と、全体的な強化率を独立に操作する試みが数多く行われている。また

Kuch

&  P l a t t  ( 1 9 7 6

)は

I n t e r v a lP e r c e n t i l e  ( I P

)スケジュールにより、強化確率をほぼ一定に保ったまま 長い(または短い)

IRT

を強化した。その結呆、全体の強化率は同じであっても、長い

IRT

を強 化した場合には反応率が低く、短い

IRT

を強化した場合には反応率が高かった。

G a l b i c k a & 

P l a t t  ( 1 9 8 6

)は

I P

スケジ、ユールを改良して、

IRT

の長さに依存して強化する比率と、全体の強化 率による強化の比率を自由にコントロールできるようにした。この結果、全体の強化率を一定に 保った場合に、

IRT

の長さに対する強化の比率を多くすればするほど、長い

IRT

が多く見られた。

このことから

VI

スケジュールにおける反応率および

IRT

分布は

IRT

強化によると結論付けて いる。

IRT

が行動単位であることは、

IRT

を罰することができることからも示された。特定の長さの

IRT

クラスに対して罰を与えると、その

IRT

クラスの頻度が減少する。

G a l b i c k a

Branch ( 1 9 8 1 )  

V I 6 0 s

のエサ提示による強化で維持されたレバー押しに対して、長い

IRT

であった場合に電 気ショックを与えた。この結果、反応率が高まり、短い

IRT

の頻度が増えた。

IRT

とは無関係に、

同じ頻度で電気ショックを与えた場合には、逆に反応率は低下した。

またオペラント反応以外の付随行動についての微視的な観察が行われている。

Henton( 1 9 8 5

)は エサを強化子に

V I 5 0 s

でレバー押し反応をしているラットの

IRT

を測定した。付随行動として、

輪回し、水を飲む、

f o o d ‑ c u p

への反応、

f o o d

up

からえさをとる反応を測定した。さらにレバー 押し反応から最初に移行した付随行動によって、レバー押し反応の

IRT

を分類した(例えば、レ バー押し→最初の付随行動→別の付随行動…→レバー押しと記録する。次にレバー押し反応の

IRT

を最初に水を飲んだ場合、最初に輪回しをした場合、…と分類した)。この結呆、

1

秒から

2

秒の短い

IRT

では

f o o d ‑ c u p

への反応をしていることが多く、

1 0

秒以上の長い

IRT

では輪回しま

たは水を飲んでいることが多かった。また中程度の長さの

IRT

では、強化後に

f o o dcup

からエ サをとる反応をしていることが多かった。このように

IRT

は強化可能な行動単位ではあるが、

VI

スケジュールのもとであっても被験体は

IRT

中に付随行動をしており、付随行動によって

IRT

の長さも変化していることがわかる。

2 .   IRT

の系列依存性

IRT

が強化可能な行動単位であり、行動の微視的な指標のひとつであることを見てきた。それ

(6)

では

IRT

は強化スケジュールのもとでどのような過程で変化していくのだろうか? ここまで 紹介した実験の結呆での

IRT

分布は

l

セッションもしくは数セッションに渡る

IRT

データをま とめて表示したものである。より微視的で、学習過程の一瞬、一瞬の変化を表現する方法が必要 である。

IRT

の系列依存性についての研究は、最も微視的な分析のひとつであり、学習の変化の過程お よび反応パターンをあらわしている(Hyten& 

Madden, 1 9 9 3

。)

IRT

の系列依存性とは、以前の

IRT

の系列{…,

I R T n ‑ hI R T n

}が

I R T n . i l

こ与えている影響である。もしも

IRT

に系列依存性がない 場合には、独立同分布に従う

( i n d e p e n d e n t l yand i d e n t i c a l l y  d i s t r i b u t e d :  I I D

)といわれる。これは 以前の

IRT

系列がどのようなものであっても、次回の

IRT

は同じ形の独立な分布(例えば指数分 布など)に従うということである。

2‑1.

系列依存性のデータ分析法

IRT

の系列依存性を分析する方法は主に

3

種類ある。第

l

I R T n

I R T n + i

の分割表である。こ の方法では、まずある基準(たとえば

IRT

の中央値よりも短いまたは長い)によって

IRT

を短い

IRT

および長い

IRT

に分類する。次に

I R T n

が短い

IRT

であった場合に

I R T n + i

が短い

IRT

であっ た回数、および長い

IRT

であった回数を数える。

I R T n

が長い

IRT

であった場合についても同様 にして数える。このようにして

I R T n

(短い/長い)×

I R T n . 1

(短い/長い)という

2

×

2

の分割表 を作成する。この分割表について、カイ

2

乗検定、または連関係数により

I R T n

の長さによって

I R T n + 1

の長さに違いがあるか検定をする。分割表の利点は、簡単に

IRT

の系列依存性を表形式で 表すことができること、また系列依存性の有無を簡単な有意差検定によって調べることができる ことである。反対に短所は

IRT

を短い/長い、の

2

つにしか分類していないため、

IRT

の生起す るパターンが読み取れないことである。また一般に実験で観察される

IRT

データ数は大量で、ある ため、検定をした場合、

I R T n

の長さによって

I R T n + 1

の長さがほとんど変わらなくても、統計的に は有意な差であるという結呆が得られやすいことである。

2

の方法は、

I R T n

I R T n . 1

の散布図で、ある。散布図にはx軸に

I R T n

の長さを、y軸に

I R T n + 1

の長さをとって、 IRTn と IRTn.1 のデータの組を点として図示する。さらに IRTn と IRTn•1 のデー タから相関係数を計算する。散布図の利点は実験中に得られたすべての

IRT

データを一覧できる ことである。このため

I R T n

I R T n + 1

の聞の一種のパターンを読み取ることができる。例えば、

P a l y a  ( 1 9 9 2

)の散布図には頻度の高いところが帯状に見られ、一種の縞となっていることを見る ことができる。反対に短所は、一般に非常に短い

IRT

の頻度が多いため、その部分はほぼデータ 点、で塗りつぶされてしまい、短い

I R T n

の後の

I R T n . 1

がどのように分布しているのか、長い

I R T n

の後の

I R T n + 1

の分布と比較することが難しいことである。また分割表にもいえることではあるが、

I R T n

より前の

IRT

系列が

I R T n . i l

こ与える影響を見ることができないことである。

(7)

反応間時間の系列依存性における個人差と変動性 19 

第3の方法は、 IRT系列の自己相関関数(autocorrelationfunction: ACF)である。ACFとは、実 験で観測したIRT系列と、そのIRT系列をラグ分だけずらしたIRT系列聞の相関係数である。

ラグが1の場合にはIRTnとIRTn+1の相関係数で、あり、ラグが2の場合にはIRTnとIRTn+zの相関 となる。 ACFは式(1)'によって計算する。

X(t)豆J.[X(t+k)一文] ACF(k) 1=1 

X(t)主]2 (1) 

ここでXはIRT系列、 nはIRT系列の長さ、 kはラグ、 XはIRTの平均値である。 ACFはラ グをx軸に、自己相関の値をy軸に図示される。自己相関の値の範囲は±1であり、ラグがOの 場合にはまったく同じ系列であるため必ず自己相関の値は1となる。あるラグにおいて自己相関 の値が±l.93Fnよりも大きい場合、そのラグにおいて自己相関が有意であり、 IRT系列はIID ではなく、系列依存性があるといえる。ACFの利点はその他の2つの方法と比べて、より高次の 系列依存性について分析できるため、どれくらい前のIRTまでが現在のIRTに影響を与えてい るのか見ることができることである。反対に短所は、IRTnとIRTn+1の散布図のように詳細なIRT 生起のパターンを読み取ることができないことである。

2 ‑2.  IRT系列依存性を確認した研究

IRTに系列依存性があることを確認した実験報告は強化スケジュールについての研究のごく初 期からある。 IRTを分化強化する DRLスケジュールでのIRT系列依存性を示す報告がある。例 えばFerraro,Schoenfeld, 

Snapper (1965)はラットを被験体にDRL60sスケジュールの獲得期 および消去期におけるIRTの系列依存性を調べた。 IRTnの平均値とIRTn+1の平均値のグラフか ら、強化・非強化にかかわらず、 IRTnとIRTn+1はほぼ同じ長さ、つまり短いIRTnの次には短い IRTn+1が、長いIRTnの次には長いIRTn+1が続きやすいことを示した。またWeiss,Laties, Siegel, 

Goldstein (1966)はベニガオザルを被験体にDRL20sスケジュールでのIRTを測定した。 IRT 系列からトレンドを除去し、自己相関関数を計算したところ、ラグ1で自己相闘が有意であり、

IRT系列を l次のマルコフ過程として扱えるとしている。またIRT系列のスベクトル解析により、

l次の依存性のほかにも IRT系列には弱い依存性があり、この依存性が短い期間でのIRTの変 動をもたらしていることが示唆された。

DRLスケジュール以外の、基本的な強化スケジュールのもとでのIRT系列依存性についても 調べられている。Blough& Blough (1966)はハトを被験体にVllminおよびVI2minスケジュール でのIRT分布および系列依存性について報告している。 IRTを短いIRT(Vllminでは0.3秒以下、

VI2minでは0.6秒以下)と長いIRT(短いIRT以外のIRT)に分けてrun検定を行ったところ、

(8)

検定されたほとんどの実験セッションで有意であった。このことから短いIRTnの後には短い IRTn+1が、長いIRTnの後には長いIRTn+1が続く傾向が示された。またWilliams(1968)はラットを 被験体にfixed‑interval(FI) 4minとfixed‑ratio(FR) 60スケジ、ユールでIRTの系列依存性を調べたo

FIスケジ ユールのもとではIRTnが長くなるほど、 IRTn+1のIRT/Opの値が右肩上がりに高くな る傾向が見られた。 FRスケジュールのもとでは0.3秒よりも短いIRTnの場合には、 IRTn+lは0.3 秒以内に偏る傾向が見られる一方で、 0.3秒よりも長いIRTnの場合には、 IRTn+1のIRT/Opの値 は比較的変化が少なかった。 Crossman,Trapp, Bonem, & Bonem (198日はハトを被験体に様々な FRスケジュール(FRl,2,  3, 4, 5,  6,  7,  30)のもとでのIRTおよびPRP(強化後のIRT)の系列依 存性を調べた。ほとんどのFRスケジュールで短いPRPnの後に短いPRPn+1の生起する頻度が高 かった。また長いPRPnの後に長いPRPn+1の生起する頻度はFRの要求反応回数が増えるにした がって増加した。 IRTの系列依存性についての分析では短いIRTnの後に短いIRTn+1が生起する 頻度が高いことが示された。

2‑3

圃系列依存性がないという研究

近年IRTの系列依存性が認められないとする結果もいくつか発表されている。 Palya(1992)は ハトを被験体にFI、FR、VI、DRH、DRLといった基本的な強化スケジュールのもとでの時間的 行動指標を広範に分析している。 IRTの系列依存性の分析では、 IRTnとIRTn+1の散布図を用いて、

比較的短い範囲(0秒から3秒)を分析している。その結果、 DRLの一部の例外を除いて、ほか の強化スケジ、ユールすべてで系列依存性が認められないとした。またGomez,Ruiz Adan, Llosa, 

& Ruiz (1992)はラットを被験体にVIスケジュールのもとでのIRT分布をガンマ分布に当てはめ ている。 IRTの自己相関関数からIRTには系列依存性が見られないとしている。このことから IRTはIIDでありガンマ分布によく当てはまると結論している。

2 ‑4.  IRT系列依存性研究の問題点

ここまでIRT系列依存性についての研究を概観してきたが、これらの研究には問題点がある。

IRT系列を変化させる最大の要因である、強化および罰・反応コスト等の反応の結果を系列依存 性分析に導入していないことである。最初に見たように、フリーオペラント実験での事象系列は IRTとそのIRTでの反応の結果によって表現することができる。IRT系列のみを扱い、反応の結 果の系列を取り除くことは事象系列の一部分しか分析しないことになる。またIRT強化理論の節 で見たように、 IRTは行動単位であり、ある長さのIRTに報酬を与えると強化され頻度が増し、

罰によって頻度が低下する。また理論的に見ても、 IRT強化理論では強化スケジュールがIRTを 分化強化することにより強化スケジ、ユール特有の行動を引き起こすと考えられている。 IRTの系 列依存性はIRTに対して、強化スケジュールが与える反応の結果によって引き起こされていると

(9)

反応間時間の系列依存性における個人差と変動性

2 1  

考えられる。このように、

IRT

系列依存性分析から反応の結果を省くことは不十分な分析という ことカすできる。

A n g l e  ( 1 9 7 0

)は

IRT

系列依存性分析に強化および非強化の影響を検討している。この実験では ラットを被験体に混合スケジュール(

mixDRL5s DRL15s

)および連結スケシ、ユール(

t a n dDRL5s  DRL15s

)での

IRT

の系列依存性を調べている。

MixDRL5s DRL15s

スケジ、ユールでは、有効なス ケジュールが

DRL5s

DRL15s

に強化が与えられる毎に入れ替わるため、

5

秒から

1 5

秒までの

IRT

DRL5s

が有効の場合には強化、

DRL15s

が有効の場合には非強化となる。

A n g l e( 1 9 7 0

)は

5

秒から

1 0

秒の

I R T n

および

1 0

秒から

1 5

秒の

I R T n

に対して、強化が与えられた場合の

I R T n + 1

の分 布、および非強化の場合の

I R T n + 1

の分布を比較している。この結果、強化後と非強化後で

I R T n + 1

には大きな違いが見られた。強化が与えられた場合には、短い

I R T n + 1(  0

秒から

5

秒)が生起され ることがほとんどない。反対に非強化の場合には短い

I R T n + 1

の頻度が増加していた。また

I R T n

の 長さによっても違いが見られた。

I R T n

5

秒から

1 0

秒のクラスに入る場合、強化されると長い

I R T n + 1  ( 1 5

秒以上)の頻度が高いが、

I R T n

1 0

秒から

1 5

秒の場合には中程度の

I R T n + 1(  5

秒から

1 0

秒)の頻度が高かった。

A n g l e  ( 1 9 7 0

)の実験の問題点は、第一に混合スケジュールであったため、強化される

IRT

クラ スが交代的であったことである。

DRL5s

スケジュールで強化された後には、長い

IRT

で反応する と

DRL15s

スケジュールで強化されやすい。このため強化後の

IRT

に独特の系列依存性が観察さ れたと考えられる。 VIや

VR

スケジュールといった、より一般的な強化スケジュールにおいて、

IRT

と反応の結果(事象系列)の系列依存性を調べるべきである。第

2

の問題点は、分析された

IRT

の区聞が偏っていることである。

A n g l e( 1 9 7 0

)が分析できた

IRT

区聞は

5

秒から

1 0

秒と

1 0

秒 から

1 5

秒の区間のみである。

VI

VR

スケジュールでは

IRT

O

秒から

5

秒の間に多く観察さ れるため、より区間幅を狭くして

O

秒から

5

秒の

IRT

を含めて系列依存関係を調べるべきである。

3 .   IRT

系列依存性の個人差と変動性

3 ‑1. IRTの系列依存性における個人差(個体差)

IRT

の系列依存性は個人(個体)に特有の行動パターンをよく表すという特徴を持っている。

G e n t r y ,  W e i s s ,  &  L a t i e s  ( 1 9 8 3

)は

F I

スケジュールでのハトの

IRT

系列依存性を調べている。

I R T n

I R T n + 1

の相対頻度を分析したところ、個々のハトによって

IRT

系列依存性が固有であることが 示された。

Kawashima( i n  p r e s s

)は人聞を被験者に

randomr a t i o  ( R R

)スケジュールでの

IRT

系列 依存性を調べた。図

2

上段は被験者ごとの、

I R T n

の後に強化を与えた場合の

I R T n + 1

の分布を表し ている。図

2

下段は同様に反応コストを与えた場合をあらわしている。このグラフで対角線上に 高い頻度がある場合には、

I R T n + 1

I R T n

とほぼ同じ長さであることを示しており、高い系列依存 性があることを意味する。また、

I R T n

の長さに関係なく、

I R T n + 1

の分布が同じ形状である場合に

(10)

〉、

υ 

E

g

;  

CT 

~ 0.51 

(],) 

崎剛e

c o  

(],) 

Ct: 

ω 〉、

~

~ 0.51 

LL 

Reinforcement  KY 

Response Cost 

g

;  

率 三 翠~'

4

I& 

~- EJ0. 

0. 

2 RR

スケジュールのもとでの

I R T n

×

I R T n + 1

相対頻度(

K a w a s h i m a ,i n  p r e s s )  

は、系列依存性がないことを意味する。図

2

から強化が与えられた場合に

IRT

の系列依存性に大 きな個人差を読み取れる。被験者

KY

はほぼ系列依存性がない。被験者

M M

I R T 0

0 . 5

秒から

4

秒まででは

I R T n + 1

分布がほぼ同じであるが、

4 . 5

秒以降には

I R T n + 1

分布が変化している。被験者 NTはほぼ対角線上に高い頻度があり、強い系列依存性が認められる。一方で、、反応コストが与え

られた場合には、各被験者とも同様に対角線上に高い頻度があり、系列依存性が認められる。

IRT

と反応の結果の系列依存性に個人差があることが、強化スケジュールのもとでの行動の個 人差の要因の

l

っと考えられる。

IRT

と反応の結果の系列依存性に個人差があると、被験者・被 験体により、同じ長さの

I R T n

に対して、同じように強化子を与えても異なった長さの

I R T n + d

こな る。特に

VI

スケジュールなどでは

IRT

の長さによって異なった確率で強化を与えているため、

次の反応に対する強化確率も被験者・被験体によって異なることになる。このような過程が繰り 返されることで、被験者・被験体により、実験全体で見た

IRT

分布や全体的な強化率に大きな違 いが見られることになると考えられる。

Harzem( 1 9 8 4

)は強化スケジュールのもとでの人間の被 験者の行動に大きな個人差があることを指摘している。

F I

FR

といった基本的な強化スケ ジ、ユールでの行動から、被験者を

3

グループに分類している。適応グループの被験者は強化スケ

(11)

反応間時間の系列依存性における個人差と変動性

2 3  

ジ、ユールに応じて反応を変化させることができる。非適応(変動的反応)グループでは、反応率 が増加したり低下したりするが、強化スケジュールおよび強化子提示とも関連していない。非適 応(一定反応)グループでは、一定の反応率で反応し続け、強化スケジュールとは関連がない。

このように人聞は強化に対する感受性に大きな個人差があり、強化スケジ、ユールのもとでの行動 に大きな違いがある。

3 ‑ 2.  IRTの変動性

IRT

の変動性とは、

IRT

の長さのばらつきのことである。

IRT

変動性は一種の行動の多様性で あり、人間・動物は変動性があることにより様々な強化スケジュールに対応した行動をとること ができると考えられる。たとえば、もしも

IRT

に変動性がなく、O秒から3秒の

IRT

のみを生起 する被験体がいたとしよう。この被験体は

DRL15s

スケジュールでは強化子を得ることができな い。通常は、強化が得られなくなると

IRT

の変動性が増し、様々な

IRT

での反応も起るため、強 化子を得ることができる。

IRT

の変動性の強さは、強化および消去によって強めることができる。

Morgan &  Lee ( 1 9 9 6

)は 人聞を被験者に

IRT

の変動性に対する消去手続きの効果を検証した。

DRL

スケジュールで強化 が与えられる基準となる

IRT

周辺で安定的に反応するまで学習をする。次に消去手続きが実施さ れ、その聞の

IRT

の変化が調べられた。この結果、

DRL

期間中と比べて、消去期間中は

IRT

に 高い変動性があったこと、また短い

IRT

でたくさんの反応をする消去パーストが見られた。

Blough ( 1 9 6 6

)は理想的にランダムな間隔で被験体が反応を生起することを目標に

LF

スケジュー ル

( l e a s tf r e q u e n t  i n t e r r e s p o n s e  t i m e s

)を考案し、ハトを被験体にこのスケジュールの効果を調べ た。

LF

スケジュールでは

IRT

が指数分布に従うことを目標にしている。まず指数分布を区間の 面積が等しくなるように、区間に区切る。被験体の直近1

5 0

個の

IRT

データを各区間に割り振り、

最も頻度の低かった区聞を強化区間とする。次の反応での

IRT

がこの強化区間に入った場合に強 化が与えられる。実験の結呆、

IRT/Op

のグラフは比較的平坦であり、

IRT

分布は指数分布に類 似していた。ただし、非常に短い

IR

0 . 8

秒以下)は被験体による頻度の違いが大きく、強化され ないにもかかわらず頻度が高かった。これは個々のハトに特有の反応パターンではないかと指摘 している。また

IRT

が指数分布に従う場合には系列依存性がないはずであるが、

IRT

系列には系 列依存性が認められた。このように

IRT

の変動性自体も強化・非強化による影響を受けることか ら、

IRT

と反応の結果をともに含んだ事象系列の系列依存性を微視的に調べていくことが、強化 スケジュールのもとでの人間・動物の行動を説明するためには重要であると考えられる。

4 .

ま と め

本稿では反応間時間

IRT

が強化可能な行動単位であること、および

IRT

強化理論とそれに対

(12)

する批判を概観した。また

IRT

系列依存性の分析方法を紹介し、系列依存性に関する研究を概観 した。

IRT

系列依存性には個人差があり、同じ強化スケジュールのもとでの行動の個人差の一因 と考えられる。

IRT

の変動性の研究からも、

IRT

のみの系列依存性ではなく、強化・非強化を含 んだ、学習場面の事象系列の依存関係を調べることが、強化スケジ、ユールのもとでの人間・動物 の行動を微視的に説明するためには必要である。

引用文献

Anger, D. (1956). Thdependenceof interrsponsetimes upon the relative reinforcement of dierentinterresponse  times. Journαl of Expθ門叶wntαlPsychnlgy,52,  145‑161. 

Angle, H. V. (1970). The role of reinforcement in controlling sequential irt dependencies. Jiurnalof the Experim叩 ー

tαl Anαlysis of Behαt io14,145 151. 

Blough, D. S. (1966). The reinforcement of least frquentinterresponse times. Journαl of th ExperimentαlAnαly  sis of Behαvioη9, 581‑591. 

Blough, P. M., Blough, D. S. (1968). The distribution of interresponse times in the pigeon during variable interval  reinforcement. Journαl of the Experi竹 松 叫talAαlysisof Behαvio11,23 27. 

Crossman, E. K., Trapp, N. L., Bonem, E. J., Bonem, M. K. (1985). Temporal patterns of responding in small fixed‑ ratio schedules. Journal of the Experim tαlAnαlysis of Behrwior, 43, 115‑130. 

Frraro,D. P.,  Schoenfeld, W. N., & Snapper, A. G. (1965). Sequential response Eectsin the white rat dunng con  ditioning and extinction on a drl schedule. Journαl Ethc;Expemc;ntr1lAnαlysisof Beha?Ji~円 8,255 260.  Galbicka, G., Branch, M. N. (1981). Selective punishment of interresponse times. Journal of the Expementαl

Anαlysis of Behα.vi 35,311 322. 

Galbicka, G., Platt, 

J .  

R. (1986). Parametric manipulation of interresponse time contingency independent of rem  forcement rate. Journal of Expe門叶Z tαlPsycholgy:Animal Beh ClViγProcesses,12, 371 380. 

Gentry, G.D., Weiss, B., Laties, V. G. (1983). The microanalysis of fixed interval rsponding.Journαl ojtheExpe門 一

mentαl Aηαlysis of Behavioη39, 327 343. 

Gomez, C., Ruiz Adan, A., Llosa, M., Ruiz, G. (1992). Quantitative analysis of irt variability during the first trammg  stages of a variable‑interval schedule in rats. The Psycholngicαl Re coγd, 42, 273 284. 

Harzem, P. (1984). Experimental analysis of individual direncesand personality. Journal CグtheExpeγ附 印 刷

Anαlysis ofBehαvioη42, 385 395. 

Herrnstin,R. 

J .  

(1970). On the law of effect. JournαlthRExpementalAηαlysis of Behα川 町 13,243‑266.  Henton, W.W. (1985). Interresponse times and the molecular control of behavior: Irts conditional upon changeovers 

to alternate behaviors. The Psychologir,αl Recoγd, 35, 549 557. 

Hyten, C., & Madden, G. 

J .  

(1993). The scallop in human fixed interval research: A review of problems with data de‑ scription. The Psychologir,αI Re coγd, 43, 4 71‑500. 

Kawashima, K. (in press). Sequential dependencies in interresponse timsand reinforcement/ response cost. The  Psychologir,αl Re coγd 

Kuch, D. 0. Platt, 

J .  

R. (1976). Reinforcement rate and interresponstimdifferentiation.Journαl of the Exp百円

menlαt Anαlysis of Beha?Jioη26, 471 486. 

McDowell, 

J .   J .  

Wixted, 

J .  

T. (1986). Variable‑ratio schedules as variable interval schedules with linear feedback  loops. Journαl of the Expeγimentαl Analysis of Behα.vioη46, 315‑329. 

Morgan, D. L. & Lee, K. (1996). Extinction induced response variability in humans. The PsychologicαlRecoγd, 46,145 

(13)

反応閏時間の系列依存性における個人差と変動性 25 

159. 

Norman, M. F. (1966). An approach to free responding on schedules that prescribe reinforcement probability as a  function of interresponse time. Journal cMαthemαticαlPsychnlogy, 3, 235 268. 

Palya, W. L. (1992). Dynamics in thfinestructure of schedule controlled behavior. Journαl oftheExpeγimRntαl  Anαlysis of Behαvioη57, 267 287. 

Peele, D. B., Casey, 

J    . .

& Silberberg, A. Primacy of interresponstimereinforcemntin accounting for rate differ  ences under variable ratio and variable interval schedules. Journαl ofExpeγimeηtαl Psychology: AimalBe  havioγProcesses, 10, 149 167. 

Reynolds, G. S., McLeod, A. (1970). On the theory of interresponse time reinforcement. In G. H. Bower(Ed.), The  Psychology of leαming  and motivαtion: Advαnces in theoryγesearch (Vol. 4,  pp. 85 107). New York: Aca‑ demic Press. 

Shimp, C. P. (1969). Optimal behavior in freoperant experiments. Psych つ logi~alReview, 76, 97 112.  Skinner, B. F. (1938). The behavior of organisms. New York: Appleton‑Century Crofts. 

Weiss, B., La ties, V. G., Siegel, L., & Goldstein, D. (1966). A computer analysis of serial interactions in spaced respond‑ ing. Journal of the Expeγimentαl Aηαlysis of Behα.vioη9, 619‑626. 

Wilkie, D. M., & Pear, 

J .   J .  

(1972). Intermittent reinforcement of an interrsponsetime. Journal of the Expe門 悦 仰tαl Anαlysis of Beh ioη17,67 74. 

Williams, D. R. (1968). The structure of response rate. Jour・na,lof the Expeγ'imenta,l Aηαlysis of Behαυioη11, 251  258. 

参照

関連したドキュメント

いま宗教(祭り。地方)なのか?」という基 本的な課題には?未だ十分に答えられないで

本研究の結果から得られた新たな認識に基づくと、これまでとは大きく異なる視点

在的に

となる場合、700 nm と 735 nm 近辺の過渡吸収信号に特徴が現れる。前者は P700 の状態変化

前後の違いで収まる. 熱入力の不均一性の影響を除した結果の評価 これらの中心変位のヒステリシスには熱入力の不均一

の分析結果から、生成した粒子が酸化物あるい

 運動の場面において,刺激に対してすばやく反応するこ

このことから,体育・スポーツ関係の学者による反応時間