• 検索結果がありません。

雑誌名 心理学の諸領域

N/A
N/A
Protected

Academic year: 2022

シェア "雑誌名 心理学の諸領域"

Copied!
11
0
0

読み込み中.... (全文を見る)

全文

(1)

心理学研究の技法: 論文読みから実験の計画まで (II)

著者 小牧 純爾

著者別表示 Komaki Junji

雑誌名 心理学の諸領域

巻 5

号 1

ページ 53‑62

発行年 2016

URL http://doi.org/10.24517/00053206

Creative Commons : 表示 ‑ 非営利 ‑ 改変禁止 http://creativecommons.org/licenses/by‑nc‑nd/3.0/deed.ja

(2)

論 説

心理学研究の技法−論文読みから実験の計画まで (II) 小牧 純爾

1)

An introduction to strategies and tactics for research in Psychology: (2) How to design an experiment

Junji KOMAKI1)

2

章 実験を実施する

前章を承けて

実証研究を念頭に置いて心理学の研究を考えた場合,

研究は「読む」「書く」「実証する」という3つの局面 に分けて考えることができる。これらの局面には,そ れぞれに,外してはいけないポイントやルールがあり,

的確に進めるための「工夫」や「秘訣」がある。前の 巻に掲載した第1章では,論文を読む時のこうしたこ とがらについて述べた。この章では実験を中心に,実 証を進める際のポイントなどについて,私の考えを明 らかにしたい。

実験の妥当性2)

心理学実験の特殊性 心理学実験は,ヒトを中心と する生活体の心的過程について,研究者の想定を検証 し,筋の通った理解を得るために行われる。研究者の 想定に見込みがあるかどうかを確かめる探索実験と いった単純な実験がある一方,PETやfMRIなどで 大脳活動を測定し,それをもとに心的過程に関する仮 説を検証するといった,複雑で技術化された実験もあ る。実験の手法に技術化水準のバラエティがあること は他の実証科学と同じである。ただし,心理学実験に は,単純であれ,複雑であれ,他の科学領域の実験に は,まず「ない」と思われる1つの制約がつきまとっ ている。それは,特殊な場合を除き,関心を持ってい る心的過程を身体組織から切り離して検討することが できないという「宿命」である。

他の実証科学,たとえば,化学実験では,検討対象

1)金沢大学名誉教授 Kanazawa University

22名の査読者からは,的確なご指摘と有益なご示唆をいただきまし た。感謝します。

の化学物質に直接的に実験操作を加え,その結果を直 接的に測定することができる。しかし,ヒトや動物の

「心」については,それを支えている脳・神経組織を身 体から取り出し,じかに実験操作を加えて効果を測定 することはできない。研究対象の「心」を構成してい るもろもろの心的過程は,ヒトや動物が自然に活動し ている状態において,はじめて研究対象として存在し うるからである。この制約をこえ,ヒトや動物を「そ のまま」にして研究するために,心理学は「心」の身 体的実体ではなく,その「機能」を問題にする。つま り,検討を意図している心的過程を実験事態において 生起させ,それに伴って「外部に現れる反応」overt

responseを主要な情報として,その過程の機能の実

態を明らかにする。そして,解明したもろもろの心的 機能の諸法則を理論的に体系化し,心的過程の主体で ある「心」の解明を進めようとするのである。この研 究方略は,たとえば,生物の身体組織の研究とは独立 に,生物の「行動過程の機能と環境との交互作用」に ついて研究する生態学といった,行動に関する科学の アプローチと類似である。

実験方法の妥当性 実験を通じて心的過程の解明を 進めるためには,検討しようとしている心的過程を実 験事態において適正に生起させるとともに,実験操作 に対応して現れる心的過程の出力を正しく測定するこ とが必要になる。実験心理学はいまや100年以上の歴 史を重ねてきており,成果の蓄積されている研究領域 については,心的過程の生起と測定を的確に遂行する ことのできる「妥当性の高い」実験方法が確立されて いる。こうした実験の基礎的な方法は,心理学の初学 者に対する実験実習として,多くの大学で教育が行わ れている。また,長年にわたる関係者の努力によって 作成された実験方法のテキスト「実験とテスト−心理 学の基礎 」(心理学実験指導研究会, 1985)も刊行され 心理学の諸領域 Vol. 5 No. 1 pp. 53–62 c北陸心理学会2016 53

(3)

ている。現在の心理学の実験方法は相当に精度が高く なっているといってよい。

しかし,ヒトや動物の心的過程については,まだ多 くの未解決の問題が残されている。また,手がつけら れたばかりの新たな研究領域もある。こうした問題や 研究領域については,従来からの方法やその部分的改 良では確実な成果が得られにくいことから,新たな実 験方法を模索し,確立する必要があることが多い。つ まり,検討を進めている心的過程をより的確に生起さ せ,より適正に測定できるように,蓄積されている法 則的知識をフルに活用し(小牧, 2015, p. 55),「より妥 当な実験方法」を考え出す必要に迫られることが多い のである。適切な方法が見つかった場合,研究は飛躍 的に進歩する。不幸にして見つからない場合,方法の 模索を中心に手探りの状態が続く。研究は方法の進歩 を契機に進捗する。こうした事情の経緯を,最近とみ に盛んとなった動物の知的機能の研究領域を例にとっ て,その大筋を辿ってみよう。最初に取り上げるのは 類人猿の言語訓練である。

チンパンジーの手話実験 ヒト以外の動物が「人間 のことば」を使ってヒトと対話することができるかど うか,この問題は長年にわたる動物心理学の懸案で あった(小牧, 1982, p. 15–16)。いろいろな試みが続 けられたが,かんばしい結果は得られなかった。たと えば,Hayes & Hayes (1951)はメスのチンパンジー Vikiを,生後2日目から6ヶ月以上家庭内で飼育し,

人間のことばを「話させる」べく,さまざまな工夫を 凝らして努力した。しかし,訓練は失敗に終わった。

このことから,チンパンジーのような知能の高い類人 猿でも,人間のことばを使う能力はないとする悲観的 な見方が一時期優勢になった。

しかし,研究は予想外の展開を示した。Hayesらの 研究の10数年後,Gardner & Gardner (1971)はメ スのチンパンジーWashoeに「身ぶり語」に属する

「手話」(American Sign Language : ASL)を訓練し,

手話を媒体とすればチンパンジーとヒトは会話ができ ることを証明したのである。チンパンジーの言語能力 を実験的に検討する「新たな方法」が見つかったこと になる。ASL訓練は,数名の実験協力者が,多様な方 法を活用して交替で実施した。その結果,3年が経過 した段階で,Washoeは85語のサインを習得し,294 種の2語文と245種の3語文を表示するまでになっ た。これらの発語の語順には規則性があることが分 かった。また,Washoeが自発的にサインを創出する

といった重要な発見もあった(小牧, 2000, p. 75–78)。 手話を用いる新しい実験の方法は画期的な成功をおさ めたといってよい。

この成功の背後には,音声語ではなく,身ぶり語が 意思の伝達に有効であることを示唆する法則的知識が あったことに注目したい。まず,Gardnerらは,飼育 されているチンパンジーが人間に何かをねだる時,発 声ではなくジェスチャーを用いることが多いことを知っ ていた。さらに,上述のHayesらは,Vikiが何かを伝 えたいとき,歯を噛み鳴らすといった非音声的な音響 や多様なジェスチャーを用いることを報告していた。

これらはいずれも身ぶり語によるコミュニケーション の可能性を示唆している。Gardnerらの研究方法には,

加えて,もう1つのイノベーションがあった。それは,

被験体の表示の判読を正しく行い,測定の妥当性を高 めるため,一般には2重盲検法double-blind method と呼ばれている新たな方法を導入したことである。

Washoeプロジェクトを始める際,Gardnerらはいわ ゆる「賢いハンス」現象(Premack, 1976, p. 29–36;

Suter, Lindgren, & Hiebert, 1989, p. 247–249)のリ スクを意識していた。これは,動物がヒトのしぐさ を 敏感に読み取って行う反応を,知的な判断の結果であ ると取り違えるリスクのことで,ヒトと動物とが直接 的に対面して実験する場面では起こりやすい「判定の 誤り」のことである(小牧, 2000, p. 69)。

Gardnerらは,名詞サインのテストにおいて,質問と

測定とを2人の実験者で分けて行った。まず,Washoe にスライドなどのテスト刺激を提示する実験者は,ど んな刺激を見せているかを知らなかった。また,刺激

に対するWashoeの手話のパタンを判読する測定者

も,刺激が何かを知らないままに観察を行った。この 方法の導入により,Washoeの反応を取り違えて解釈 する誤りや,手話を構成する手指のパタンを「拡大解 釈」する誤りは減少し,実験方法の妥当性は高められ ることになった。なお,Terrace (1979)はオスのチン パンジーNimに,Patterson & Linden (1981)はメ スのゴリラ・ココに,ASLを媒体とする言語訓練の実 験を実施している。これらの研究は,いずれも,実験 者と被験体との対面型の実験方法を用いていたが,2 重盲件法による語彙テストは行っていない。

LANA計画と実験の自動化

身ぶり語を用いる実験は,大型類人猿の人工言語訓 練の1つの類型となったが,Premack (1971, 1976)は

(4)

心理学研究の技法−論文読みから実験の計画まで(II)

「つづり語」を用いる方法を創案している。形,大き さ,きめ,色の4つの次元特徴を持つプラスチック片 を一定の順序で並べることが文章を書くことに相当す る。PremackはメスのチンパンジーSarahを訓練し,

最終的には否定文,条件文をつづらせるのに成功して いる。彼の実験は,基本的には,文章完成法のフォー マットを用い,Sarahの選択したブラスティック片を

もとにSarahの応答を同定しており,チンパンジーの

表示を判定する点での妥当性が高くなっている。

こうした成果に続き,1972年,いくつもの新機軸を 盛り込んだ画期的な研究がスタートし,訓練方法の妥 当性は飛躍的に向上した。被験体であるメスのチンパ ンジーの名を冠した「Lana計画」である(Rumbaugh, 1977)。Rumbaughは,まず,言語学者,コンピュー タ技師,それに,行動訓練士の加わった学際チームを 組織し,言語であることの必要条件の確認,「相関文 法」にもとづいた人工言語Yerkishの設計,自動分析 システムの開発などを行って(小牧, 1982, p. 18–21), めざましい成果をあげている。たとえば,Rumbaugh らは,小型コンピュータを援用した自動応答システム を導入し,日に24時間,週7日の継続的言語訓練を 可能にしている。このことにより,訓練の効率はいち じるしく向上した。この自動化は,さらに,行動記録 の範囲を拡大するとともに,記録の客観性を確保し,

測定の妥当性を向上させる狙いも持っていた。

Yerkishの語は,図形要素を組み合わせて生成した

255語,1語1意味であり,Lanaの居住室のキーボー ドのキーに刻印されていた。キーを押すとキーの輝度 が一段高くなると同時に,図形文字がプロジェクタに 表示された。訓練者からのメッセージは別のプロジェ クタに提示された。Lanaのキー押しと実験者のキー 押しによる応答は全てコンピュータに記録された。ま た,コンピュータは,Lanaのさまざまな要請に対し て,自動的に対応した。Lanaのキー押し記録に実験 者の判断が介入する余地はなかった。また,Lanaと 実験者との対話は,キーボードとプロジェクタ表示を 介して行われた。こうした実験事態において,基礎訓 練のほぼ1年後,Lanaは自発的・積極的にヒトと対 話するようになった。名称の訓練を受けていないオレ ンジを「黄色いリンゴ」と学習済みの語で記述したり,

物の名称を質問したり,学んだ用語法を別の事例に適 用したりするなど,人工言語の習得だけでなく,人工 言語を相当の水準で使いこなせていることが明らかと なった。

わが国では,1978年に,京都大学霊長類研究所の 心理研究部門において,室伏教授の指導の下に,チン パンジーの知能・言語機能に関する総合的な研究が始 まった(松沢, 1991, p. 15)。図形文字を使用し,原則 としてコンピュータ制御の自動システムで実験を行う など,基本的な方法はLana計画と共通しているが,

いくつもの点で違いがある。1つは,語と指示対象と の対応の「任意性」を高め,自然言語に近いシステム を実現する意図から,図形文字の背景色3)を語クラス の指標として用いることを行っていない。また,語彙 目録として,アルファベット,アラビア数字,漢字を 含めた,約1500語に及ぶ図形文字を用意している。

さらに,図形文字による記述の順序をチンパンジーに まかせる「自由構成法」を用いており,チンパンジー の側から自発的に語順の規則を生成することを可能に している。ただし,語順が先験的に決められている場 合には,チンパンジーはその「文法」的規則を習得で きることが分かっている(松沢, 1991, p. 20)。なお,

訓練の進捗につれ,学習行動の形成と維持に食物報酬 を必要とせず,正誤のフィードバック刺激,ホロホロ 音とブザー音,だけで十分であることが分かった。こ うした実験方法の展開に加え,この総合的研究では,

心的イメージ,個体認知,記憶など,Lana計画より も広い範囲の心的機能について検討がなされており,

チンパンジーが,言語能力だけでなく,豊かな知的能 力を発揮できることを明らかにしている。ちなみに,

チンパンジーの知覚・認知機能の比較研究「AIプロ ジェクト」は,この総合的研究の一環として,メスの チンパンジーAiを主要な「パートナー」として,松 沢(1991, 2001)が中心となって推進したものである。

ラットの選択的計数能力 コンピュータの援用は,

妥当性の高い実験の必要条件ではない。Taniuchiら (Taniuchi, Sugihara, Wakashima, & Kamijo, 2016) は,従来からの弁別学習のパラダイムを巧妙な手続き で運用し,ラットの計数能力に関する確かな証拠を得 るのに成功している。実験装置は,基本的には,直線 の通路に沿って10個の隔室を1列に配置したボックス で,各隔室には1方向ドアがついている。通路に入っ たラットが正しい「順序位置」にあるドアを押して隔 室に入ると,報酬を得ることができる。10個ある隔 室の6つを選び,ドアの前に刺激物体を提示する。こ

3Lana計画では,たとえば,空間的な事物を表す語のクラスにはオ レンジ色の背景色が,食べられるものを表す語のクラスには赤の背景色 がつけられていた。

55

(5)

のことから,4つのドアの前は,刺激物体が提示され ない空白のスペースになる。6つの刺激を置く位置は 試行ごとにランダムに変化させる。正しい隔室の順序 位置は,通路の入り口から数えて3番目の刺激物体の 隔室と定める。入り口から1番目の刺激までの間に,

または,1番目から3番目までの刺激の間に空白のス ペースが入る試行では,正しい刺激の位置は,その分,

入り口から奥の方向にズレることになる。この手続き により,ラットは隔室の絶対位置ではなく,刺激物体 の序列の3番目を見定めて反応しなければならないこ とになる。

手順を踏んで訓練を進め,7匹中5匹のラットが,

同一物体からなる3種の刺激セットの3番目を,有意 な水準で選択することを学習した。これらの個体は,

さらに,未訓練の新たな刺激物体のセットに対して確 かな転移を示した(実験1と2)。この遂行が刺激物体 の個別性認知にもとづいたものかどうかを確かめるた め,Taniuchiらは,実験2の3匹の個体に「選択的 計数訓練」selective countingを与えた。つまり,6個 の刺激の列に1個の特異な刺激を紛れ込ませ,これを

「無視して」3番目を選ぶ訓練を与えたのである(実験 3)。この訓練は迅速に進んだ。さらに,新たな2組の 刺激セットについて同じ選択をテストしたところ,2 匹が確かな転移を示した。驚くべき結果は実験4の成 績である。実験3の個体に6個の「同一刺激の列」を 提示する試行と6個の「異なる刺激の列」を提示する 試行とを与えたところ,3匹ともが,どちらの試行に おいても,ほぼ80%の正答率で3番目の刺激に反応 するようになった。この結果は,ラットが,課題の要 請に応じて,カウントする刺激属性をスイッチできる ことを強く示唆している。

Taniuchiらの実験は,被験体の手がかり受容と反応

遂行がノイズを受けにくい実験装置を用いていること に加え,巧妙な課題と訓練手続きを考案することで説 得力のある実験データを得ており,注目に値する。実 験パラダイムの一層の精錬と展開を期待したい。

実験方法の非日常性 初学者は,心理学の実験が過 度に複雑で,非日常的であると感じることがあるよう だ。普通の簡単なやり方の実験ではっきりしたことが 分かれば,それにこしたことはない。しかし,確実な 情報を得るためには,複雑で人工的な実験方法を採用 するほかはないことが多い。ちなみに,動物がヒトの ことばを話せるかどうかを調べる場合,考えられる最 も簡単な方法は,日常で使っている自然言語を普通の

やり方で被験体に教えることであろう。しかし,この 試みは,オウムのAlexの訓練では一定の成功をおさ めた(Pepperberg, 1981; Rumbaugh & Hillix, 2001) ものの,チンパンジーの訓練では役に立たなかった。

霊長類の言語能力を適正に調べるためには,先に述べ たように,たとえば,図形文字という人工的な媒体と,

シンボルに対応して正しくキーを押させるといった手 続きが必要であった。こうした人工的な方法を用いる ことで,心理学は,はじめて,霊長類の知的能力に関 して確かな証拠を手に入れることができたのである。

コンピュータからの表示に応じてキーを操作する といった状況は,チンパンジーの自然な生活ではまっ たく起こりえない。したがって,こうした実験は,チ ンパンジーには生態学的に妥当ではないことになる。

Neisser (1976)は,かって,実験的研究の「生態学的 妥当性」について論じ,心理学は,操作するのが容易 な実験変数について優先的に研究するのではなく,生 態学的に重要な変数についてもっと研究するべきであ ると批判した(Neisser, 1976, p. 8)。これは実験心理 学の関心が日常性から乖離することに対する正当な警 告であり,賛同できる。しかし,この妥当性の概念を

「実験方法」の非日常性を告発する基準に適用すること には疑問がある(小牧, 2000, p. 211–213)。日常的に 意味のあることを研究するのと,日常性にならって実 験の状況を定めるのとは,別の次元の問題であり,同 じ基準で評価するのは筋違いである。実験方法の是非 はそこで何を検証しようとするかによって決まる。検 証しようとしている目的に関して妥当である限り,実 験方法はどれほど非日常的で,人工的であってもよい と私は考えている4)

実験結果の変動性

追証研究の必要性 新たな発見を示す実験結果が報 告されたとして,その報告をそのまま確かなものとし て受け取る研究者はまずいない。ほとんどの研究者は,

当の報告が別の実験によって追証されるのをまって,

はじめてその報告を考察に値する証拠として認知する。

理論の是非に触れるような重要な発見の場合は特にそ うである。このように,研究結果の承認には「追証」

replicationが必須であるとする原則が広く理解されて

いるにもかかわらず,個々の追証研究の結果をどのよ

4) 非日常的・特殊的な実験事態で得られた結論は,当然,適用範囲が 限定される。特殊的な事態で得られた結論を別の事態に適用する際には,

一般化の妥当性に関する新たな実証的検討が必要になる(小牧, 2000, p. 16–17)

(6)

心理学研究の技法−論文読みから実験の計画まで(II) うに評価するべきかについては,明確な原則は定着し ていないようである。追証実験が一貫してもとの研究 に肯定的,または,否定的な結果を示しているのであ れば,評価に悩むことは少ない。しかし,一貫性の示 されるケースばかりではない。最初の研究と基本的に は同じ方法を用いているにもかかわらず,その後の実 験の結果に変動が現れることは珍しくないのである。

一部には,統計的な有意性を示した実験の結果は,

追証実験で再現されて当然と考える「思い込み」があ るようである。しかし,統計的有意性は実験結果の再 現性そのものを表す指標ではない。結果の有意性は実 験結果の一般性を「主張する」ための根拠と考えるべ きである(小牧, 2015, p. 56)。サイズの小さい標本を 扱うことが多い実験心理学者は,これまで,有意性の 有無を主に問題にしてきており,実験結果の「検定力」

powerを計算することは少なかった。たとえば,条件

間に差があることを検証する実験の場合,データの分 析においては,もっぱら,第一種の過誤(帰無仮説が 正しいときにこれを棄却してしまう確率)が5%以下 であるかどうかを確かめるだけで済ませてしまうこと が多かった。そして,検定力(帰無仮説が偽であると きに正しく帰無仮説を棄却する確率),大久保らの分 かりやすい表現をかりれば,「差があるときにきちん と差があると判断できる確率」(大久保・岡田, 2012,

p. 28),これを算出することはほとんどなかった。こ

のように,検定力に対して無頓着であったことが,統 計的に有意な実験結果は再現されて当然と思い込む背 景にあるのかも知れない。

再現性の統計学 では,最初の研究で報告されてい た統計的有意性が,後続の追証研究で再現されなかっ た場合,その結果からどんな結論を導いたらよいので あろうか。最初の報告は「偽陽性」false positiveで あったとして,直ちにもとの報告を否定してよいので あろうか。追証の必要性を信じる原則にしたがえば,

追証実験の否定的な結果もまた同様に,単独では信頼 できないはずである5。Maxwellら(Maxwell, Lau,

& Howard, 2015)は,こうした「再現性の失敗」の問 題について論じ,ある追証研究が統計的に有意でない 結果を生じたとして,その結果だけから,もとの研究 には何らかの問題があり,もはや信頼するべきではな

5) 実験結果の再現性については,現在盛んに議論がなされており,追 試の公共性を企図した対策なども提案されている。三浦(2015)にそう した現状についての解説がある。

いと結論してはならないと指摘している6)。彼らの指 摘の根拠は,適正な検定力を持つ追証研究を計画する ことには,いくつもの取り扱いのむつかしい問題が絡 んでおり,策定が思ったほど簡単ではないこと,さら に,適正な検定力を備えた追証研究であっても,その 有意でない結果の解釈は一筋縄では行かないことなど の理解にあると思われる。

Maxwellらは,追証研究から明確な結論を導くた

めには,多くの場合,大方の研究者の予測を超えるよ うな大きなサイズの標本が必要になると指摘し,文 献に見られる不整合を解決するためには,「多元的な」

multiple追証研究が必要であることを認識するべきで

あると述べ,さらに,多元的な追証研究には,純粋に 統計学的な考察をこえる意味があると付け加えている。

私は,彼らのいう多元的追証研究には,追証に合わせ,

問題の効果の再現性に関する条件分析的検討や,再現 性の成否についての推論の実証的検討を進めることが 示唆されている(Maxwell et al., 2015, p. 495-496)と 理解している。

真逆の実験結果 後続研究で最初の報告の統計的有 意性が再現されなかっただけでなく,最初の研究とは

「真逆の結果」が現れることがある。つまり,最初の研 究とは反対のパタンの結果が生じ,しかもそれが統計 的に有意であるといったケースである。私の記憶にあ る事例の1つは,ラットによる「過剰学習逆転効果」

にかかわる実験で,位置弁別においてとくに顕著に現 れた結果の変動である。過剰学習逆転効果とは,学習 基準に達した後に付加する過剰訓練(OT)がその逆 転学習を促進するというパラドキシカルな効果(小牧 , 2012, p. 219)のことである。白・黒カードの弁別と いった視覚弁別では,多くの実験でこの効果が追証さ れている。ところが,単純な位置弁別position habit においては,追証実験の結果が流動的であった。すな わち,もとの研究を支持し,OT訓練群が統制群より 有意に早く位置弁別の逆転を学習するという結果を得 た実験(e.g., Capaldi, 1963),この効果がなく,OT 訓練群と統制群との間に有意差がなかった実験(e.g., Komaki, 1962),それに,OT訓練群の逆転学習速度 が統制群より有意に低く,過剰訓練による「遅延効 果」が見られた実験(e.g., Hill & Spear, 1963)の3 通りの結果が得られていたのである(Sutherland &

6Tryon (2016)は,この指摘に賛同するコメントを述べ,効果量の 信頼区間にもとづいた再現性問題への対応を提案している。

57

(7)

Mackintosh, 1971, p. 280)。

これらの実験はY型またはT型の迷路の,右また は左が正選択肢になる課題を与えており,「名目的」に は等しく位置弁別であったが,選択肢の左右を指示す る諸位置手がかりの総体としての優越性dominance に実験によって多少の差があった。Lovejoy (1966)は このことに着目し,視覚弁別における過剰学習逆転効 果だけでなく,位置弁別における実験結果の流動性を も統一的に説明する注意学習のモデルを提起した。彼 は,まず,弁別行動は,「適切手がかり」に対する注意 反応attendingと正刺激に対する選択反応の2つの成 分から構成されるとする仮定をおく。OTはこの2つ の成分にともに作用し,学習基準までの訓練以上にこ れらを増強する。ただし,ラットに与える位置弁別訓 練では,位置の手がかりがもともと優勢であることか ら,OTによって適切手がかりに対する注意反応が増 強される余地は少なく,OTの作用はもっぱら選択反 応成分を増強することに発揮される。この推測は,注 意反応の生起傾向がもともと高い学習事態では,OT は,増強されたもとの正反応傾向のもたらすマイナス 作用,つまり,強い消去抵抗の作用によって,逆転学 習を妨害するであろうという予測を導く。Lovejoyは こうした予測を確率モデルのシミュレーションによっ て検証し,注意反応の生起確率が1.0と高い場合には,

OTによる逆転学習の遅延効果が導かれることを確か めている。

その他のデータを参照し,Lovejoyは,OTによる 逆転促進効果が現れる学習事態は,視覚弁別であれ,

位置弁別であれ,適切手がかりに対する注意反応の初 期的生起確率が0.3から0.7と,中程度である事態に 限られると予測する。位置弁別の学習事態では,ほと んどの場合,注意反応の生起確率は0.8以上である。

したがって,彼のモデルは,位置弁別においては,OT による逆転促進効果の現れる可能性が全体的に小さい こと,そして,注意反応の生起確率が,0.8から1.0 近くと,高い事態になればなるほど,逆転の「遅延効 果」が現れやすくなると予言することになる。では,

位置弁別において,OTの逆転促進効果があることを 報告している研究があるが,これはどのように解釈し たらよいのであろうか。Lovejoyは,促進効果を見出 した実験では,非過剰統制群の逆転学習が,何らかの 局外的な原因によって,異常に遅くなったことによる のではないかと推測している。たとえば,先に引用し たCapaldi (1963)の実験結果について,彼は,非過

剰群のラットが高架式のT型迷路を恐怖なしに走行 するだけの十分な先行訓練を受けていなかったことに 由来すると解釈している。さらに,彼は,位置弁別に おいて促進効果を見出したもう1つの実験(Pubols, 1956)についても,類似の解釈を下している(Lovejoy, 1966, p. 96)。

Lovejoyは,視覚弁別におけるOTの作用について

も彼のモデル7)を適用し,OTの作用に関する実験結 果の変動のパタンが,位置弁別同様,彼のモデルと整 合的であることを明らかにしている。弁別学習におけ るOTの作用とその変動性を分析するこの理論的作 業において,Lovejoyが,錯綜する実験結果を,「想定 外」の変動としてではなく,注意反応を規定する学習 事態の特性の違いに連関する,「理由のある」変動とし て扱っていることに注目したい。

体系的追証 中程度の効果量(d=.50)を想定し,2 つの条件の間の差を検討する追証実験を計画するとし て,大久保・岡田の表(大久保・岡田, 2012, p. 154) から最小の標本数を読み取ると,検定力を慣習的な水 準の.80とした場合で,標本のサイズは2条件を合わ せて128になる。Maxwell et al. (2015)の指摘する 通り,これは相当に大きな値であり,ヒトを実験参加 者とする実験はともかく,ラットの学習実験の場合で は,慣例的に用いられている条件当たりの標本数の約 8倍に相当する。ラットで,1条件64個体の実験を実 施するのは現実的ではない。これを補完し,結果変動 性の問題を解決するための何らかの方策を考える必要 がある。

別々に実施されたいくつもの実験データを統合し,

信頼性の高い統計的結論を得ることを企図するメタ分 析の方法(大久保・岡田, 2012)は,結果変動に対処す るための順当な統計学的方策である。ただし,メタ分 析では分析対象を選定する基準が重要になる。メタ分 析の結果はどのような先行研究を分析に含めるかにし ばしば大きく依存することから,「分析の対象を選択す る基準は妥当で客観的であることが重要である」と指 摘されている(大久保・岡田, 2012, p. 167)。先に紹 介したMaxwell et al. (2015, p. 496)は,単独では有 意性のない31の個別研究をメタ分析にかけ,有意な 結果が得られた示範的事例を紹介しているが,対象の 諸研究が同一の手続きに従って行われていることを明

7LovejoyのモデルはMackintoshのアナライザ理論(Sutherland

& Mackintosh, 1971)とは独立に提起されたものであるが,基本的な 原理は同じである。

(8)

心理学研究の技法−論文読みから実験の計画まで(II) 記している。先に紹介したラットの弁別逆転の研究に は,名目的には同じ位置弁別であるものの,Lovejoy

(1966)の理論的分析が示すように,ラットの注意反応

を誘発する上で差のある訓練事態が混在していた。こ うした場合について,名目的な同一性にしたがい,報 告されている研究を一律にメタ分析の対象にするのに 意味があるのかどうか,私は判じかねている。

統計学的な検証とは別に,変動の原因に関する想定 を実験によって確認し,変動性についての「傍証」を 得る実証的な方策が考えられる。変動の見られる諸研 究を点検・比較し,変動の原因を探索してみる。そし て,原因について何らかの想定が得られる場合には,

想定の是非を検証する確認実験を新たに実施してみる のである。Lovejoy (1966)は,先に紹介した通り,実 験間の結果変動の原因が注意反応の生起率にあるとす る仮説を提示した。しかし,彼はこの想定を「事後分 析」によって確かめただけであった。こうした想定が 実験によって証明されれば,実験結果の変動に関する 理解を深めることが期待できる。また,間接的な方策 ながら,個々の実験の精度を高め,効果量の増大を図 ることで,実験結果の変動を低減させることも考えら れる。このためには,蓄積されてきた法則的知識を活 用し,実験方法を改善する工夫が重要になる。

もとの研究を厳密に同じ方法で追証する直接的追証 direct or exact replicationは,再現性をテストするに は必要である。しかし,直接的追証を「無為に」反復 し,肯定的結果と否定的結果の統計を取ることに意味 はない。追証の失敗が問題にされる理由の1つは,失 敗について筋の通った説明ができないためである。効 果の発現を左右する要因を同定し,失敗を含めた実験 結果の変動を統一的に説明できるようになれば,再現 性に関する疑問の一部は解消する。この意味で,問題 の効果を新たな実験変数との関連において検証する体 系的追証systematic replicationの実験パラダイムは 直接的追試にもまして重要であると私は考えている。

このことについては後で触れる。

実験計画の策定

実験目的の設定 心理学を専攻した学生には,専攻 の理由として,ヒトや動物の何らかの行動に関心が あったことをあげる人が多い。しかし,こうした学生 で,当初の関心をそのままの形で研究に生かせる人は まれであろう。初学者の問題関心は常識的な心理学を 土台にしており,心理学の先端的な知識体系とはギャッ

プがあることが多い。このギャップの生み出す違和感 が,一方で,心理学の専門論文を「取り付きにくい」

と感じさせる原因の1つになっていると思われる(小 牧, 2015, p. 53)。しかし,自己流の考えだけでは学問 にならない。初学者のユニークな発想を生かすために は,当初の問題関心を専門的なものに「仕立て直す」

必要がある。つまり,当初の興味の基礎にあった問題 意識を今日的な知識体系とかみ合うように調整し,学 問的に意味のある研究課題に変換することが必要にな る。これは初学者が専門的な心理学に取り組む段階で 出くわす最初の関門であり,問題関心の常識的心理学 からの「発展的な訣別」の契機である。

既成の考えにとらわれず,創造的な研究を目指す意 欲は大いに評価したい。しかし,斬新な研究の展開に は,新たな問題関心の表明だけでなく,研究方法の開 発など,多大な時間と労力が必要になることが多い。

初学者が最初に手がける研究として私が推奨したいの は,既に報告されている研究に添った研究で,体系的 追証に直接的追証を合わせた2重追証の計画である。

専門雑誌の論文や学会での報告に接して,何らかの関 心を抱いた研究があったとしよう。関心の背後には問 題の効果に関する然るべき想定があるはずである。た とえば,報告されている効果は別の要因がもたらした

「見せかけの効果」artifactなのではないかとか,この 効果は他の種の被験体でも現れるだろうかとか,この 効果は主張されているのとは違う別の理論でも説明が つくのではないかとか,いろいろな考えが浮かぶので はないだろうか。

こうした想定を実験のアイデア(小牧, 2000, p. 36–

38)に変換する。そして,そのアイデアを展開した体 系的追証の実験条件をまず策定する。そして,この体 系的追証の実験条件に,関心を抱いた研究の直接的追 証の実験条件を加えるのである。この計画の直接的追 証の部分は再現性のテストであり,うまく実施できれ ば学界に貢献することができる。この部分は,さらに,

研究者個人の「実験技術」のテストにもなる。先行研 究に整合的な実験結果が得られれば,それはその実験 者の実験遂行能力を保証する証拠になる。 実験者の実 験技能は直裁的に問われることは少ないが,研究者に とっては重要な資質である。一方,体系的追証の部分 は成功すれば問題の研究に関する新たな知見を提供す ることができる。このように,2重の追証を計画する ことにより,問題の効果に関する研究者独自のアイデ アを検証する目的と,先行研究の再現性を追証する目

59

(9)

的とを一挙に達成することができる。2重追証実験の 標本数は単純な追証実験の2倍以上になる。意欲に溢 れた大学院生など,若い研究者の挑戦を期待したい。

実験法のタイプ 心的過程に及ぼす実験変数,また は,要因の作用を調べる方式には,群比較型実験法と 個体型実験法の2つのタイプがある。群比較型の実験 法は,複数の個体からなる複数の群に異なる実験操作 を与え,群と群との成績の比較から要因の作用を評価 する方法である。個体型実験法は同一の個体に異なる 実験操作を与え,作用の個体内比較から要因の作用を 評価する方法であり,この比較を異なる個体で「繰り 返す」ことによって要因作用の個体間一般性を確かめ るやり方である。先に触れた過剰訓練の実験は,実験 群だけに過剰訓練を与え,与えなかった統制群と逆転 学習の成績を比較し,過剰訓練という要因の効果を評 価する群比較型の実験であった。この方式では個体の 成績を込みにした群単位のデータを統計的方法で処理 し,要因の効果が有意であることを確かめて個体間一 般性の証拠とする。一方,個体型実験法では要因効果 の比較に統計的な手法を用いることはまれである。個 体ごとにデータを点検し,確かな効果が現れているか を目で点検する。このvisual inspectionを一定数の 個体で繰り返し,データの等価なパタンが見られるこ とで個体間一般性を確認する(小牧, 1992)。

検討する要因が複数ある場合,群比較型の実験法で はそれぞれの要因の水準を組み合わせた複数の群を 構成し,群構成に対応した統計的分析法を適用して要 因の効果を評価する。要因間の相互的な作用について は「交互作用」の検定によって評定する。個体型実験 法において複数の要因の作用を検討する際には,体 系的追証を行う。作用の分かっている要因と新たな要 因とを組み合わせた実験パラダイムを構成し,この パラダイムについて個体間一般性の確認を進めるや り方である。既知の条件づけ技法を新たな要因を評 価する基準として用いる base line 技法と,その属 性が既知であり,実験的に制御が可能な技法を新たな

要因のprobesとして用いる probe 技法など,詳

細な方法の説明と適用条件の解説が明示されている (Sidman, 1960, p. 110–139)。直接的追証と体系的追 証はともにSidmanの提起した用語であるが,先に紹

介したMaxwellらの追証は実験全体を単位とする追

証であり,Sidmanの個体内および個体間「繰り返し」

の意味(小牧, 1992)は含まれていない。原語はともに replicationである。注意が必要である。

実験を計画する際には,個々の被験体,または,実 験参加者から1つだけの測定値を得るのか,それと も,反復測定repeated measurement(南風原, 2014,

p. 146)を行って複数の測定値を得るのかを決定する

必要がある。学習実験では段階ごとの測定値を比較 し,学習の進捗を吟味することが多い。反復して測定 した値は独立ではなく,そのことを勘案した分析を行 う必要がある。また,異なる群,または,条件に割り 当てた別々の個体の反復測定値を群,または,条件間 で比較することを計画している場合には,測定値を

「混合効果モデル」mixed-effects model(南風原, 2014,

p. 156)によって分析する必要がある。測定値の統計

的分析については,分散の期待値,誤差項の選定,信 頼区間の算出などを含め,次章で触れるが,ここでは 実験の計画しだいで結果の分析法が決まってしまうと いうことを指摘しておきたい。

標本のサイズ 実験にどの程度の数の被験体,また は,実験参加者を投入するのかは,研究の進捗段階,

または,実験のタイプによって決まると私は考えてい る。効果の有無が不明である要因について探索実験を 行う場合,高い検定力を志向して多くの個体を準備す る研究者はいない。大抵の研究者は,動物実験なら,

たかだか数個体で手探りの実験を行い,統計処理より も個体ごとに遂行の詳細な分析を行うのではないか。

そして,探索実験で一定の見通しを得たあと,確認実 験を遂行する段階になって,はじめて,統計的分析に 必要な数の個体を投入するのではあるまいか。ただし,

要因効果の有意性がもっぱら問題にされてきた従来と 異なり,最近では,検定力への配慮が必要になってき ている。

大久保・岡田(2012)は,検定力に関する第5章に おいて適切な検定力の問題を取り上げ,Cohenが推奨 した「5−80ルール」に言及している。5−80の5 は第1種の過誤α=.05の5,80は推奨する検定力の 水準であり,第2種の過誤βをαの4倍として算定し た値である。このルールは一定の支持を得てはいるも のの,絶対的で一般的な基準ではないようである。大 久保らは,「研究の目的や仮説によって,適切な検定力 のレベルは異なると考えるべきでしょう」と指摘し,

さらに「先行研究などの研究の文脈も適切な検定力を 考える上で,重要になるでしょう」と述べている(大 久保・岡田, 2012, p. 158)。

検定力への配慮は必要であり,研究者は検定力を向 上させる努力を払うべきである。しかし,80%の検定

(10)

心理学研究の技法−論文読みから実験の計画まで(II) 力を前提とする研究には,先にあげた事例の示唆する ように,想定を超える数の個体を必要とする。検定力 を向上させる手立ては個体数の増加だけではない。実 験の精度を上げ,効果量を増大させることによっても,

検定力の向上は実現できると思われる。私は,仮説検 証型の研究においては,無理のない個体数を確保した 上で,仮説の修正や実験方法の精錬などによって効果 量を上げることに専念し,その結果としての検定力の 向上に期待するのが現実的ではないかと考えている。

なお,5−80ルールを満足する「単一の」実験を実現 することは相当にむつかしい。仮説検証型の研究にお ける検定力についての合意はまだないようであるが,

私は,低い検定力しかない実験でも,同一研究者の,

あるいは,多くの研究者による直接的,または,体系 的な追証の遂行,つまり,Maxwell et al. (2015)のい う多元的追証によって,実験結果の再現性を確認する のが現実的なアプローチではないかと考えている。

なお,先に紹介した類人猿の認知機能研究では,単 一の被験体による研究が行われていた。こうした研究 結果の一般性の問題については次章で取り上げること にしたい。

引 用 文 献

Capaldi, E. J. (1963). Overlearning reversal effect in a spatial discrimination task. Perceptual and Motor Skills,16(2), 335–336.

Gardner, B. T., & Gardner, R. A. (1971). Two- way communication with an infant chimpanzee.

In A. M. Shreier, & F. Stollnitz (Eds.),Behav- ior of non-human primates. Vol. 4. New York:

Academic Press. pp. 117–184.

南風原朝和(2014).続・心理統計学の基礎−統合的理 解を広げ深める 有斐閣

Hayes, K. J., & Hayes, C. (1951). The intellectual development of a home-raised chimpanzee.Pro- ceedings of the American Philosophical Society, 95(2), 105–109.

Hill, W. F., & Spear, N. E. (1963). A replication of overlearning and reversal in a T-maze.Journal of Experimental Psychology,65(3), 317.

Komaki, J. (1962). Reversal retardation through

introducing forced non-rewarding trials in over- training by white rats. Annual of Animal Psy- chology,12(1), 1–10.

小牧純爾(1982).チンパンジーの言語学習―LANA

計画を中心に 金沢大学文学部論集行動科学科篇, 2,15–28.

小牧純爾(1992).変動と一般性:個体型実験法の理解

をめぐって 心理学評論,35(2),133–155.

小牧純爾(2000).心理学実験の理論と計画 ナカニシ

ヤ出版

小牧純爾(2012).学習理論の生成と展開 ナカニシヤ

出版

小牧純爾(2015).心理学研究の技法: 論文読みから実

験の計画まで(1) 心理学の諸領域,4(1),53–61. Lovejoy, E. (1966). Analysis of the overlearning re- versal effect. Psychological Review, 73(1), 87–

103.

松沢哲郎(1991).チンパンジーから見た世界 東京大

学出版会

松沢哲郎(2001).おかあさんになったアイ 講談社

Maxwell, S. E., Lau, M. Y., & Howard, G. S.

(2015).Is psychology suffering from a replica- tion crisis? What does failure to replicate really mean? American Psychologist, 70(6), 487–498.

三浦麻子(2015).心理学研究の「常識」が変わる?−

心理学界における再現性問題への取り組み 心理学 ワールド,68(1),9–12.

Neisser, U. (1976).Cognition and reality. Sanfran- cisco and London: W.H.Freeman and Company, Inc.

(ナイサー,U.古崎 敬・村瀬旻(監訳) (1978).認知 の構図: 人間は現実をどのようにとらえるか サイ エンス社).

大久保街亜・岡田謙介(2012).伝えるための心理統 計−効果量・信頼区間・検定力 勁草書房

61

(11)

Patterson, F., & Linden, E. (1981).The education of Koko. New York: Holt, Rinehart and Winston.

(パターソン,F.都守 淳夫(訳) (1984).ココ,お話 しよう どうぶつ社).

Pepperberg, I. M. (1981). Functional vocalizations by an African grey parrot (Psittacus erithacus).

Zeitschrift f¨ur Tierpsychologie,55(2), 139–160.

Premack, D. (1971). On the assessment of language competence in the chimpanzee. In A. M. Shreier,

& F. Stollnitz (Eds.), Behavior of non-human primates. Vol. 4. New York: Academic Press. pp.

186–228.

Premack, D. (1976).Intelligence in Ape and Man.

New Jersey: Lawrence Erlbaum Associates, Pub- lishers.

Pubols, B. H., Jr. (1956). The facilitation of visual and spatial discrimination reversal by overlearn- ing.. Journal of Comparative and Physiological Psychology,49(3), 243–248.

Rumbaugh, D. M. (Ed.) (1977).Language learning by a chimpanzee: The Lana project. New York:

Academic Press.

Rumbaugh, D. M., & Hillix, W. A. (2001). Holy cork nut, batman!: It’s the parrot! Alex de pep- perberg!.PycCRITIEQES,48(3), 289–290.

Sidman, M. (1960). Tactics of scientific research.

Boston: Authors Cooperative, Inc., Publishers..

心理学実験指導研究会(1985).実験とテスト―心理学 の基礎 培風館

Suter, W. N., Lindgren, H. C., & Hiebert, S. J.

(1989). Experimentation in psychology. Boston:

Allyn and Bacon. pp. 247–249.

Sutherland, N. S., & Mackintosh, N. J. (1971).

Mechanisms of animal discrimination learning.

New York: Academic Press.

Taniuchi, T., Sugihara, J., Wakashima, M., &

Kamijo, M. (2016). Abstract numerical discrim- ination learning in rats. Learning & Behavior, 44(2), 122–136.

Terrace, H. S. (1979). Nim: A chimpanzee who learned sign language. New York: Alfred A.

Knopf. Publisher.

Tryon, W. W. (2016). Replication is about effect size: Comment on Maxwell, Lau, and Howard (2015).American Psychologist,71(3), 236–237.

(2016513日受稿,84日受理)

参照

関連したドキュメント

FEED キーを押しながら LINE キーを押します FEED キーを押し. ながら LINE

アメリカ心理学会 APA はこうした動向に対応し「論 文作成マニュアル」の改訂を実施してきている。 21 年前 の APA Publication Manual 4th Edition(American

MENU キーを 3 秒間押して設定モードに入ります。次に ( DISP ) キーと ( FUNC ) キー を同時に 3

研究に従事されてい乱これまで会計学の固有の研究領域とされてきた都面のみに隈定

 さて,日本語として定着しつつある「ポスト真実」の原語は,英語の 'post- truth' である。この語が英語で市民権を得ることになったのは,2016年

状態を指しているが、本来の意味を知り、それを重ね合わせる事に依って痛さの質が具体的に実感として理解できるのである。また、他動詞との使い方の区別を一応明確にした上で、その意味「悪事や欠点などを

状態を指しているが、本来の意味を知り、それを重ね合わせる事に依って痛さの質が具体的に実感として理解できるのである。また、他動詞との使い方の区別を一応明確にした上で、その意味「悪事や欠点などを

C−1)以上,文法では文・句・語の形態(形  態論)構成要素とその配列並びに相互関係