• 検索結果がありません。

日本における統計改革 : 基礎心理学研究を資料として

N/A
N/A
Protected

Academic year: 2021

シェア "日本における統計改革 : 基礎心理学研究を資料として"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

The

XaPaneSE fournal of Psychonnm

ic Scienee 2009

Vol

28

 No

8自

93

け る

統 計改 革

一 基

心 理

学研 究

資料

と して

大 久保  街  亜

* 専 修 大 学*

Statistical

 

reform

 

in

 

Japan

The

 case  of 

the

tZt

anese

bzarnal

 of 

Psychonomic

 

Science

Matia

 

OKUBO

Senshu

 

b’

niversity *

   In the late l990s

 

the

 American  

Psycho

ogical 

Association

 advocated  improved  statistical

practices

 

inc

uding  reporting  confidence  

intervals

Js

and  effect sizes

 

Since

 this statisticα

1

the numbers  o 〔reports  in international academic  

journals

 of psychology  which  have included the

α and  effect  sizes have 

increased、

 

We

 

investigated

 the evidence  

for

 statisticaI reform  

in

 

Japan

 

by

examining  papers  published  

from

 l 

982

 to 

2008

 

in

 theノ御)anese /Ournat of Psychonomic  Science

 Thc reports  which  included Cls and  e 「fect sizes  were  extremely  rare  in the 

journal

 even  after  2001

This

 observation  suggcsts  that this statistical reform  

has

 not yet started  among  

Japanese

 research

ers  

in

 psychology

Key

 words :

inferential

 statistics

 null

−hypothesis

 significance  testing

 confidence  

interval

 effect

      size

 Neyman & Pearson (1933)によっ て提 案さ れ た有意 性検定 (ある い は無仮説有意性検 定)は

これ まで さ

ま ざ ま な批判を受けて き た (レ ビ

=一

と して

,Cohen ,

1994i Harris

1997aMorrison & Henkel 1970Krue

ger

2001

Lbftus,1996

)。 例えば, 有意性 検定に お け る 鷺値 的な判 断は

かの Ronald  A

 Fishcr が強 く問 題 視 し た ことで知 ら れ る 〔

Fisher,1959

ま た

標 本 数によ りp 値が変 化す る た め

注 意 して定 結 果を解釈すべ き だ と多 くの 研 究 者が指 摘 して き た (e

g

南 風 原

1990 )。 し か し

長 年にわ たる激 しい批 判がある

有 意 性 検 定を擁 護す る立 場 も あ る (e

g

 Abelson

1997a ; Harris

1997a

例え ば

 Abelson 1997a

有 意性検 定に よ る二的な判 断こそ が

実験結果の解 釈に必要だ と 主張 し た (also  see Abelson

1997b その理 由 と し

心 理学 者が 知 り たい ことは

効 果のき さで はな く

二値 的に記 述で き る効 果の有 無で あ ること が多い こ と が

指 摘された (例

左右 対 称な顔は

非 対 称な顔よ り魅 力

 * Dcpartment

 of Psychology

 Senshu  University

   

2−

1

1Higashimita

 Tama

ku

 Kawasaki

 Kana

    gawa  214

8580 的か ?)

ま た

Harris (1997a )は

従 来の有 意 性 検 定に 論理的問題が生 ずる の は 1)差が な い μ 1

μ 22)差 が ない と は言え ない (μユ≠μ2)の間で二値の判 断を行う か らで

Kaiser 1960 の ア

イ デアに従い

1μ小な りμ 2 (μ1 〈μ2)

2

)μ且大な りμ2(μ[〉μ2)

3

>そ0)ど ち ら か ((μ1 〈 μ2) or(

k

μ1> μ2の間で 三値 的な判 断を行え ば論理的な問 題は解 消で き る と主 張し

t

: 

J 加えて

有 意 桝i検 定に よっ て得ら れ る

p

値か ら

冉現性確率を推 定で きる と も述べ

also  see Harris

1997b

さ らに

心 理学で は ほ ぼす

べて の実 証 的 研 究で有 意 性 検 定が使 われて い る のが現 状 で あ る

これは有 意 性 検 定の価 値を (潜 在 的に せ よ)ほ ぼすべ て の研 究 者が認めて い る こと を示 唆 する

 だ が

近 年に なっ て

主に雑 誌 論 文な ど研 究 発 表の場 を申心に有 意性 検定の 取 り扱いにっ いて さ ま ざ ま な 変化 が 生 じて き た。 この動き は有意性 検 定が抱え る問題 の改 善を日指す もの で あ る。 これ を 心 理学に お ける統 計 改 革

と呼ぶ研 究 者もい る Curnming

 Fidler

 Leonard

 Kali

nowski

 Christiansen

, K]einig

 Lo

 McMenamin

& Wilson

2007 ;Finch

 Cumming

 Williams

 Palrner

GriMth

 

A

]ders

 Anderson

& GoQd エnan

2004 )

こ の Copyright

The japanesePsychonomjc Society

All

(2)

大 久 保 : 日本にお け る統 計 改 革

89

統 計 改 革は

Cohen

1994

)の有 意性検定にす る批判と 効果 量 の重 要性 を主張 し た 論文に端を発 する

この論 文 を受け

アメ リカ心 理学 会で は

,Leland

 

Wi

kinson

を 中 心と す る推 測 統 計に関す る専 門 委 員 会が開か れ

統 計 手法にする問題点が議 論さ れた そ して

版に お け る推 測統 計の取 り扱い にっ い て ガ イ ドラインが発表さ れ

た (Wilkinson & APA  Task  Force on  StatiSticaHnfcr

ence

1999

>。 この ガ イ ドラインで は, 結 果の分 析にっ い て 〔1>必 要 最 小 限の 分 析を選 択 する こ と

(2)信 頼 区 間 (confidence  

interval

以 ド

Cl

と略す) を使用 した 区 間 推 定を行 うこ と

3

)重要な知見 あ るい は ρを報 告す る と きは必 ず 効 果 量を告 する こ と

(4)分 析の前 提が 瀧た さ れて い るこ と を き ち ん と示すことの

4

点につ い て主に述べ られて い る。 他に もソ フ ト ウエ ア の使用等に つ いて諤及がなされた

これ らの う ち有 意 性 検 定の問 題 点と直接 関連 するの は   と (3)

すな わちα と効 果 量 で ある。  α と は

あ る信 頼 水 準に お いて母 数 を 含む区 間 を 指 す。 信 頼 水 準 と して

95 が用い ら れる こと が多くt これ を

95

Cf

と呼ぶ

例えば

平 均 値の

95

CI

は        

95

CI

M

±

SE

t95        (

1

と定 義さ れ る。 こ こ で

M は平 均 値

 SE は標 準 誤 差 (以 下

SE と略 す )

 tg5 はt分 布の

95

%に対 応 する t値で あ る。   結 果の解 釈におい て

有 意 性 検 定よ り も

CI

を重 視 す べ と いう主 張は

医 学で は 1980 年 代か ら存 在 した

Lancet,

 

Americ

αn 

Joumal

 of  

Pubtic

 

llealth

 

British

MedicaJ 

fourn

α1な どの著 名な論 文 誌が

結 果におい て

p

値を強調せ ず,

CI

をっ けて報告す るこ とを 当時か ら推

奨して い る (

Gardner

& Altman

1989 >。 こ の方釘は医

学 論 文 誌 編 集 委 員 国 際 委 員 会で も賛 同を得た lnterna

tional 

Committee

 of 

Medica1

 

Journal

 

Editors,1988

医 学 論 文 誌で は実 際にCfが多 く報 告 されて

fO’

 

O

 

 Amer

ican 

foumal

 of Pubtic Health に 2000 年に掲 載された

論 文で は お よ そ

60

%で

CI

が報告さ れ た。 

Epidemiotogy

の よ うに ほ ぼ 100%の論 文で C∬が報 告さ れる場 合 も

あっ た(Fidler

 

Thomason ,

 

Cumming ,

 

Finch

, &

Lee−

rnan

2004

 心 理学で も

Loftus

ら が, 

Cl

の重要 性を長ら くギ張 し て き た (

Loftus

Masson ,1994

Loftus,

19961 

Masson

& Lo正tus

2003 )。 Loftus は

論 文や学 会において主張 す る だ けに と ど ま らず

彼 自身が主 任 編 集 者を務め た

Memory

 &

Cognition

誌におい て

投 稿さ れ た論 文に対 しC/を報 告 する こと を求めた

そ の結 果

Loftus 就 任 以 前 (1990 年か ら1992 年 )で は

CI

を 報 告 した論 文は お よ そ

1

%にす ぎな か っ た が

彼が就 任し た

1994

年か ら徐 々 に 増 加 し1998 年 に は36% に ま で 上 昇 し た

Finch

 et aL

,2004

ま た

 

Journ

αZ of ExPerimental

PSNchology

:(;ener α

1

な ど

Memory

Cognition

以外の

論文誌で も

90 年代は 5%程度だっ た α の報 告 率が

2000

年 代に は お よ そ

30

% に な っ た(

Cumming

 et aL

2DO7 )

た だ し

報 告 率は論 文 誌に よっ て大きく異なる よ うで あ る (

Cumlning

 et a!

2007,

 

Figure

 

l

を 見よ)。  α を重 視 する立 場で は

研 究 者が興味を持っ の は測 定さ れ た効 果が有意か否かで は な く

そ の効 果の大き さ だ と考え る。 ま た

有意 か否か とい う

2

分 法に論理的な 根 拠は なく

適 切な判 断 基 準で は な い と 主張する。 例え ば

Rosnow

Rosenthal

1989

}は

有 意 性 検 定の極 端 な 2 分法を皮肉り

神は

p

06 を

p

05

と等し く

そ して強 く愛 して くださ る (p

1277)

と述べ た。 加えて

α は

有意性検 定で 扱うこ と がで き ない 検 定 力にっ い て有 用な情 報を得る こ と がで きる Loftus

1996;Mas

son &

Loftus,2003

  α だ けで な く

効 果量 も有意性 検 定の 題点を考え るうえ で重 要 だ

効 果 量は単 位に依 存 しない効 果の大 き さの指 標で あ る。 測定単位に頼ら ず実 験 操 作の効 果や変 数 間の関 係さ を表 すこと がで きる。 代 表 的な効 果 量 で ある

Cohen

d

は 糠 準 化された平 均 偵 差

と呼 ば れ (

Cohen ,1988

ふ たっ の母 平 均の 差 を

母 集 団 標 準 偏 差で割っ たもの と定 義されるn すなわ ち

標 準 偏 差を 用いた単純な標 準 化に よ り

単 位に依 存 し ない効果の大 き さ を表 すこ と がで き る。

p

値は前 述のように

サ ンプ ル サ イ ズによっ て変 わり

効 果の大 きさにつ い て情 報は 何も与え ない。 そ こで, サ ンプル サ イ ズ に よ っ て, ま た 測 定 単 位によっ て変 化 する ことの ない

標 準 化さ れ た指 標で あ る効 果量 が 用い ら れ るこ と と なっ た

近 年の 論 文 で は

,C

∫ よ り も

効 果量の 記 載が 日立っ て増えて きて い る ようだ

現 在

心琿学に お い て ournal  ef ExPen

men

tal Psychology’ APPIied な ど およそ

30

もの論文誌が

果量の記載を明 示 的に求めて い る (

Thompson ,2007

)。

実 際

近 年にな り効 果 量を記 載した論 文 数は増 加してお り

例えば

丿

b

π   認 of 

Consulting

αnd  

Clinicai

 

Psy−

chotogy で は

分散 分析に伴う効果量報 告率は 1993 年

20

% だ

た が

2001 年 に は 46%に まで 上昇 し た (

FidLer,

 

Cumming ,

  Thomason

  Pannuzzo

  Smith

Fyffe

 Edmonds

 Harrington

& Schmitt

2005)。

  効 果 量は有 意 性 検 定に含ま れ ない情 報 を提 供 する。 繰

り返 し述べ よ うに有 意 水 凖や

p

値は効 果の 大 小やそ の関 係 性の強さ にっ い て

切の情 報を与えな い

実 際

小さ な効 果で もサ ンプル数が多い と有意 と な る場 合があ

(3)

go

基礎心 理学 研 究   第 28巻   第 1号 る

例えば

ピ ア ソ ンの積 率 相 関 関 数は

r

10

とい う 弱い相 関で すら

N

;400

な ら ば 5%水準で有意と なっ て し ま う。 こ の ような事 態を想 定 する と

有 意 差の有 無 だ け で な く

や は り効果 量を同時に考慮す るこ と が不 可 欠で あるe  こ のよ う な有 意 性 検 定の改 善 を 試み る統計改革の 流れ を受けア メ リ カ 心 理学会に よる

APA

 Publicatton Man

ual の第 5版で は

論 文の執 筆に おいて

Cl

と効 果 量の 報 告 が 重視されて い る

まず

推 定値の報告において必 ず 誤差 範 囲の報 告が求め ら れており

な かで もCiが最 善の策と され

強 く推 奨された(American  

Psychologi−

cal 

Association,200Lp .

22

果 量 あるい は何 らかの か たちで関 係 性の強 さ を 示 すことが結 果の報 告で は 不 可欠と 記 さ れ た 〔p

25

)。

APA

 

Publication

 

Manuat

1

000 誌 を 超え る論 文 誌で採 用されて おり〔Ameri

can  

Psychologica

Association,2001,

 p

 xxi

その影

響は極めて大きい 近の国 際 論 文 誌に は α

効 果量 を ともに報 告 する論 文が多 くある

実 際に統 計 改 革 以 降

す な わ ち

2000

年 代にな り 論 文 にお け る α と 効 果 量の 報 告 数が増 大し た (Cu エnming  et a1

2007 ;Fidler ct a1

2005

:Finch et al

2004

これ らの事 実は海 外で統 計 改 革が着実に進んで い るこ と を示 して いる。  本 研 究の 目的は

Cumming  et a ]

2007 )が述べ た心 理 学 にお け る統 計改革にっ いて

凵本の 現状を検討す る ことに ある。 国 際 的な統 計 改 革の流れに も か か わ らず

小 野 寺

菱 村 (2005 } に よれ ば 日本で は効 果量 を重 視す る流れ は ほ と ん ど ない とい 日本 語に よ る心理学 論 文 執 筆

出版の指 針で あ る

H

本 心理学 会 執 筆

投 稿の手 び き (2005 年改訂 版)

に も

CI

や効巣 量にする は ない (日本心理学 会

,2005

),, 加えて

,CI

や効 果量に つ い て 日本 語で体 系 的に解 説 し た書 籍 もほ と ん ど な く

教 育 体制も 整 っ て いない こ と が 最近の文で指 摘さ れて い る (井上

2008 ;水 本

竹 内

2008 )

これ らの指 摘は あ る もの の

日本に おける統 計 改 革の現状につ い て

定 量 的な指 標を 用 いた検 討はこれ ま で な さ れ てい ない

日 本 にお け る 心 理 統 計 手 法の 歴 史 的 変 遷 を 検 討 し た

Omi

Komata

2005

)で も, 2000 年 代で ほ ぼ すべて の 論 文 が有 意

1

生検 定を行っ て い るこ と は示さ れ た もの の

,Cl

や 効 果量 に関する報 告はな か っ た そ こ で

本 研 究で は 論 文 誌

基 礎 心理学 研 究

を資 料と して

凵本にお ける 統 計 改 革にっ い て検 討する こ と と し た

調査にあ た り

1982 年か ら 2008 年にかけ て 基 礎 心理 学 研 究に掲 載 さ れた論 文にっ い て

結 果の項 において (

1

)誤 差 範囲の指 標 (例

CJ,

 

SD ,

 

SE

  効 果 量 を報 告 し た論 文 数 を集 計 し た。 海 外と「司様 に 日本で も統計改革が 起 こ

て い る な ら,

Cl

や効果 量の報 告が

2000

年 代に入 り増 加し た と予 測される

方 法   1982 年 (1巻 1 弓)か ら 2008 年 (26 巻 2 号)に刊行 さ れ た基礎心 理学研究 に掲載さ れ, 実 証的検 討を含ん だ 研 究 論 文を対 象に コ

ド化を行っ た

な お

基 礎 心 理 学 研究に は

原 著 論 文, 研 究ノ

評論

書評, 優秀発 表賞 抄 録

講演論 文な ど幾っ かの投稿種 別が ある

これ らの う ち

本 研 究で は原 著 論 文および 研究ノ

ト の区 分 で掲 載さ れ たもの のみ を対象と し た。 評論は 理論も し く は方 法 論を議 論 し た もの で

書 評は書 籍を紹 介 し た もの である

今 回の調 査で はど ちらの投 稿 種 別で も

1

次 資 料 と して証 デ

タ を記 載 し た ものが な かっ た た め検討の 対 象と はしな かっ た

.一

優 秀 発 表 賞 抄 録

講演 論 文 に は実証デ

タ が記載さ れ る もの も多か っ た た だ し

これ らの 論 文は

1)掲 載を前 提に著 者に依 頼された も ので

  紙1に厳 しい制 限が あ り

必要な統 計情報を省 か ざ る を え ない 場 合が あ る。 これ らの理 由 か ら優 秀 発 表 賞 抄 録と講 演 論 文 を 検 討 対 象 とし なかっ た。 こ の某 準に おいて検 討 対 象 となっ た総 論 文 数は

199

本で あっ た

こ れ ら を

1982〜

1984 年

,1985〜1988

年、 1989

992

 1993

1996 年

 1997

2000 年

 2001

2004 年

2005 〜2008

年の

7

つ の 期間にけ 分折を 行 っ た

そ れ ぞ れの期 間にお い て検 討 対 象と なっ た論 文 数は

22

24

27

31,

31

31,

33 本で あっ た

これ らの 論 文にっ い て

誤 差 範 囲の 指 標

な ら びに有意 性 倹 定   値の報 告 )と そ の効 果 量の記 載にっ い て コ

ド化を行 っ た

誤 差 範 囲の 指 標にっ いて は,APA  1 )ublication  Manual におい て も, 最 善のと さ れ る

Cl

, お よ び その他の指標 (例, 

SD ,

SE)を集 計の対 象と し た

効 巣 量にっ い て は

 Cohen の

d,

Giass

d

, 

R2,

72

乙ω 2

η2

ηP2

 

Cramer

V ,

叨 な ど が対 象と な

た (実 際に報 告が あ

たの はこ の う ちの

部で あ っ た) 結 果 誤差範囲 指 標  誤差範囲の 指標にっ い て集 計し た もの を図

1

(a)に示 し た。 何 ら かの指 標を用い誤 差範囲 を報 告し た論 文は

全体で 47

24%で あ

た。 報 告 数は年と と もに有意に増 加 し

Xz 

C6,

 N

199

=31.

37

ρ

OOL  ze

=.

40

2000 年 代で はおよ そ 70%の論 文に誤 差 範 囲の指 標が記 載され る よ うに なっ た

ただし

1

の とおり

α の報 告はほ ぼ全 くとい っ て 良い く らい な く

すべ 論 文

1

件で あっ た 報告さ れ た 誤 差範 囲の指 標は ほ と

(4)

大 久 保:

H

本にお ける統 計 改 革

91

〇    

 

〇    

 

〇    

 

〇    

 

〇       6    

 

4    

 

2

o 檀 く

o Φ 団 ε 匚

8

Φ ユ ’

9

82

84 85r88 89

92 93

96 97

00 01

04 05

08 〃

22 N

24 〃

27 〃

31 〃

31 〃

31 N

33         Yearof Publication 効果 量と して ω 2の値が報 告された

ち な みに

分散 分 析は基 礎心 理学研 究において最も多く使わ れ る統 計 解 析 法で

p 値を報 告し た論文の

78.

82

%で使用さ れ た。 な お

24

70%を占め る ’検 定を用い た論 文で は

効 果 量は ひ とっ も報告さ れ な か っ た 考 察 100 80 60 40 20 の

9

冒 く ち  

9

8

£ o     82

84 85

88 89

92 93

96 97

00 01

04 05

08     〃

22 〃

24 〃

27  〃

31 〃

3圃 〃

31 〃

33        Yearof Publication

図 1

 percentages  of articles  (a) reporting  measures  of variabihty  and (b )reporting  

p

 values  and  effect sizes

 

S

ヱ)

 

SE

, and  

C

/stand

 

for

 standard  

deviation

 standard  error

 and

 con 員dence interval

 respectively

ん ど が

SD

も し く は

SE

87.

23

%を 占めた。 

SD

SE

につ い て興 味 深い点は

1980 年 代で は誤 差 範 囲の報 告 数が

SD

報 告 数と ほ ぼ

致 するの に対 し

,90

年代 以 降で はそ の割 合が変 化し た ことで あ る。 この 90 年代以 降の変 化は

そ れ まで は全 く な か っ

t

: SE 報 告時 期 を同じ くし て始まっ た よ う に見え る

そして

,2005

年 以降に なる と

両 者の報 告 数はほぼ等 し く なっ た C∫

SD

 SE 以 外の指 標 と して は

レン

4分 偏 差の報 告が あっ た

有 意 性 検 定 と その効 果 量  有 意 性 検 定 とその 効果量にっ い て集 計 したもの を図

1

b

)に示 し た。 有意性 検定 を 行

たこ と を示す

p

値の報 告は

年と と もに増え

X2(6

1>

199)

22

03

 

p =.

OOI

w

=,

33

2000 年 代に な るとほぼ すべ て の論 文でp 値が 報 告された。

効 果 量の報 告は年 代にか か わ らず 少 な く

,p

値を報 告 した論 文 すべ て の 10

58%で あっ たe しか も

効 果 量を報 告 し た論 文は

1件を除き

相 関 係 数 単 回 帰 分 析

重 回帰 分析な ど効 果 量 自 体が 察の 中 心 的 対 象と な る分析 方法 を 用いていた

そ れ 以外の ケ

ス で効 果 量 が報 告さ れ たの は わ ず か

1

件で

分 散 分 析の  α の報 告は過 去24年の基 礎 心理学 研 究の論 文に おい て わずか 1 件に過 ぎな か っ た 心 理学に お ける統 計 改 革 におい て最善のと して強 く推奨さ れて い ること を考え る と驚 くべ き少な さ で あ る

また

有 意 性 検 定が行わ れ た と して も効果 量 が報告さ れこと は ほ と ん ど な かっ た

特に

分 散 分 析や t検 定の よ う な使 用 頻 度が高い 手 法で は たっ た

1

件の報 告し か な かっ た これ らの結 果は 有 意性検定を改善する試み と して の統 計 改 革が

日木で は ま るで進ん で い な い こ とをはっ き りと示す もの で あ る  

Omi

Komata

2005

>は

口本にお ける心理統 計手 法の歴 史 的 変 遷にっ い て検 討し

ア メ リカ で起こ っ た変 化が

5〜10

年を経て 日本で起こること を報 告 し た。 例え ば

ア メ リ カ で は 1950 年ごろ分 散 分 析を中 心と する実 験 計画法が定着し たの に対し, 日本で は

1960

年代ま で は っ きりと し た変 化が見ら れ な かっ た

これ と同じく

今回の統 計 改 革 も日本に定 着 するまで

しば らく時 間を 要す るのか も し れ ない  ただ し

統 計 改 革と関 連 する変 化が 日本で全 くな か っ た わ けで は ない よ う だ。 統計 改 革が始ま

1990

年代 以 降

図 1の通 り誤差範 囲の指 標を報 告する論 文 数が基 礎心理 学 研 究に おい て も増 加し た。

APA

 

PIatblic

αtion Manual 第 5 版で は

推 定値の報告におい て そ の誤 差範 囲を必ず記 載す るよ うに求めて い る。 こ の流れ を受け

日本においても 誤 差範 囲の報 告が増え たの かもし れ な い。 この増 加に関して興 味 深い ことは

SE の報 告が増 え たの に対 し

SD

の報 告が減 少し たことで あ る

理由 は定かで は な いが

数値の き さ が関 係す る の か も し れ ない

同 じロ

か ら算 出 する な ら

SE

の 値は

SD

よ り小さ く な る。

誤差 範囲が小さい ほ ど印 象が 良い た め

ど う せ報 告を す るな ら印 象の良い SE が報 告さ れる よ うになっ た可 能 性 も ある。 また

  SE は

標 本 分 布の標 準 偏 差で あ り

標 本 統 計 量と 母数が平 均 して ど の くら い異な る か示す指 標で あ る

こ の よ うな 推 測 統 計の基 礎とな る性 質のため

t検 定や分 散 分 析な ど利用頻 度の高い手 法と直 接の対 応が あ る

これ も理由 の ひ とっ か も し れな い 。  も ち ろ ん

,SD

SE

は本来 的に意味が異なっ てお り

研 究 者が そ れ を 意図 的に使い分ける場 合 もある

例え

(5)

92

基 礎 心 理 学 研 究   第 28 巻  第 1弓 ば

集 団の属性の ひ とっ としてばらつ き を記 述 する ため に は

SD

を用い るべ きで ある。 ま た

推 測 統 計を行わ な い なら

,SE

を 記 載 する意 味 は ない。 今 回検討対 象と な っ た論 文に も

上 述の よ う な目 的か ら研 究 者が 意図 的 に SD を選 択した場 合 も あっ たで あろう

だが

論 文の 記述の み か ら誤差 指 標の 選択に お け る薺者の 意図 を読み 取るの は困 難で ある。 そ のた め本 論 文で は個々 の研 究 内 容にまで踏み込んだ 誤 差 指 標の分 類は行わ なかっ た た だ し

SE

の記 載 が 現 れて き た 1990 年 代後 半以降

ほぼ すべ て の論 文で有 意 性 検 定 が 行 わ れて いた 〔図 lb)

明 確 な因 果 関 係を言 及で き る もの で は ない が

こ の結 果は SE と推 測 統 計との直 接の対 応が

 SE の記 載の増 加に関 わ る とい う解釈と符号 する と言っ て よい だ ろ

5c、

 

Lotus

Masson

(1994 )は

分 散 分 析 と対 応 付 けが 極 めて容 易な

95

% α の算 出方法 を 提案し た。 これ は分散 分 析の誤 差項を使 用する もの で

参 加 者 間の計 画で は

 

 

 

 

 

 

95%α 一

tg5 ・) … と な る。 こ こ で

,Mi

は条 件 ブにお け る平 均 値

 

MSw

は郡 内 平 均 平 方

N は サ ンプル数

 tgi

va

誤 差の自 由 度に おい て t分 布の

95

に対 応するt{直であ る。 ま た

参加 者 内の計 画では

 

 

 

 

 

95%α

MF

M

・t・5・) (・・ とな る

こ こ で

MSsxc は

参 加 者 と要 因の 交 互 作用 (誤差)の で あ る。 な お,

Loftus

Masson

〔19941 の手 法は どの よ う な デ

タに も使 用で き る わ け で はな い 散分 析にお ける種々 の定を満たす 必要が あ る%   分 散 分 析で は要 因の効 果と誤 差を分 割で きる

そ の た め, 式  

3

)を使用し た ほ うが,

従 来

1

) よ り も小さ なで Cfが算 出さ れ る

に参加 者 内計画 で は, 個 人 差と誤 差を切り分ける こ とがで きる ので そ の 効 果が大きい。 た だ し

Loftus

Masson

1994

)の 手 法 は単に小さ いを算出で き る か ら優れて い る の で はな い。 理 論 的な利 点が少なくと も ふ たつ あ る。 まず

1

) Loftus & Masson 1994)の提 案 し た方 法は

実 験 研 究 で主 流の分 析 手 法で ある分 散 分 析のモ デル に基 づ く た め

対 応づ けが 極め て容 易で ある

加えて

(2)分 散 分 析

1)

Masson

Loftus

2003

)に よ れ ば

 

Loftus

  Masson  〔1994)の于 法を用い るため に は分散の等   質 性が満た されて い なけれ ば な ら ない

ま た

参   加 者 内 計 画に おいて球 面 性の仮 定 が 満たさ れて い  る 必 要 が あ る

詳 し く は Masson & Loftus 2QQ3 )  の p207

〜208

を 見よ

の 原理 を利用 し

要 因の効果と誤 差の効 果を分け

誤 差 の みを抽 出 する こと が可 能に なる

これ は

誤 羌に対 す る要因の効 果 を知 り たいくの究者に は 理想的な方法 で ある

 残 念な が ら

Loftus

Masson

1994

)の手 法は 日本で はほ と ん ど使用さ れて い ない 上 (2008 や水 本

竹 内 (2008 >が 指 摘 する ように

,Cf

や効 果 量にっ いて 日本 語で体 系的に解 説し た書籍がほ と ん ど ない こと が 理由の ひ とっ か も し れな い。 そ のた め も あ り

こ こ で L〔}ftus&

Masson

(1994>の手 法にっ いて詳 述 した。 も ちろ ん本邦 に も

メ タ分 析に焦点を あて 効 果量 にっ いて 詳述 し た 芝

南 風 原 (1990)や

入 門 書に も か かわ らず 効 果 量や 信頼区 間の 紙幅を割いた南 風 原 〔2002 )の よ う な 意 欲 的な取 り組みも あっ た

それでも実際の研 究 場 面に 対応し た手法につ いて は ま だ ま だ情 報が不足 して い る。 な お

効 果量 にっ い て は

水 本

竹 内 〔2008)で実 践 的な 取り扱い につ いて短 く分 かり やす くまとめてある。 効 果 量に馴 染みの ない に は参 考にな るであ ろう。   今 回の調 査か ら

心 理 学にお ける統 計 改 革は 日本で全 く進んで い ない こと が 明 ら かにな っ た 本研究で は基 礎 心 理 学 研 究のみを 資 料と し た が

他の國 内 誌 も最 新 号 を 概観 する限 り大 きな違い は ないで あろ う。 もちろ ん

海 外で行わ れて い ること を

1

批 判に取 り入れて

その と お り真 似 す れ ば 良いわ けで はない

また

海 外でも

CJ

や 効 果 量 の報告こそ 増 え た が

そ れ ら を使 っ た考 察は論 文 で ほとん ど な さ れ ない とい う報 告 もある (F

td!er et al

2004 )

け れど も有 意 性 検 定に数 多 くの 問 題が存 在 する こ と は明 らかで あり

そ れ ら をで き る限 り改 善して い こ と が望 ましい,

さらに

,Cf

や効 果 量の報 告は有 意 「生検 定の問 題点を改善 す る だ け で な く

そ れ 以 ヒに 有益な情 報を読 者に与えて くれ る。 まず

DCI

 

p

値より

ずっ と正 確に再 現 性 を予測 する (

Cumming ,

2008 )

ま た

2

)効 果量 を使用す るこ とに よ り

異な るパ ダ イム で検 討 さ れて き た効 果の 比較 検 討が容 易に なる (Tho

mpson

2006

実 際

(3〕効 果量

  Cl と もに メ タ分 析に 有 用な情 報である。 加え て

(4)こ の ふ たっ の指 標に よ り 検 定 力 に っ い て簡 便かっ 有 益な検 討が可 能だ (Loftus

1996

;Masson &Loftus

2003 )

最 後に

(5)有 意 性 検 定 に よ り

p

06

とい う

死刑宣 告

を受け た デ

タが 陽 の 目を見る よ うにな る か も し れ ない

。Loftus

1996

分 析 方 法を変え る と 心 理学はずっ と素 晴ら しい科 学に な る だ ろう (p

161)♂ と

いみ じ く も彼の論 文の タイF ル で述べ た。 統 計 改 革が進め ば確かに そ の可 能 性が膨 ら むに違い ない

(6)

V<bkeeiHptictslt6M:・[-es(g

93

Gl

M

St

wt

Abelson,

R.

P.

(1997a).

On

the surprising

longevity

of

fiegged

horses: Why there isa case for the sig-nificance test.Rsychological

Science,

8,

12-1

5.

Abelson,

R.

(1997b).

A

retrospective on the

sig-nificance test ban of 1999

(If

there were no sig-nificance tests, they would

be

invented).

In

L.L.

Harlow,

S.

A.

Mulaik,

&

J.

H.

Steiger

{Eds.),

What

tf

thereweTe no signtficance tests?

Mahwah,

NJ:

Law-rence

Erlbaum

Associates.

pp.

117-141L.

American

Psychological

Association

(2001),

IJletblica-tion manual

of

the

Amen'can

Rsychologicat tion

(5`b

edn,>

Washington,

DC:

American

I'sycho-IogicaLAssociation.

Cohen,

J.

(1988),

Statistical

Power

anaCysis

for

the

behaviorsciences

(2nd

edn.),

Hillsdale,

NJ:

Lawrence

ErlbaumAssociates.

Cohen,

J.

(1994).

The earth isround

(P<.05),

AmenL

can Rsycholagist,49, 997-1003.

Cumming,

G,

{2008),

Replication

and

P

intervals:

P

vaLues predict the future only vaguely,

but

con-fidence

interva]s

do

much

better.

Pempectives

on

PsychologiealScience,3,286-300.

Cumming, G.,Fidler,F.,Leonard, M., Kalinowski, P,,

Christiansen,

A.

Kleinig,

A.

Lo,

J.,

McMenamin,

N,,

& Wi}son, S,

(2007),

Statisticalreform in

psychol-ogy:

Is

Anything

Changing?,

Rsycholagical

Science,

18,23e-232.

Fidler,

F.

Thomason, N.

Cumming,

G.,Finch,

S.

&

Leeman,

J.

(2004).

Editors

can

lead

researchers to

confidence

intervals,

but

can't make them think:

Statisticalreforrn lessons from medicine,

Psycho-logicalScience,15,!19-126.

Fidler,

F,,

Cumming,

G.

Thomason, N,,Pannuzzo, D. Smith,

J.

Fyffe,P.,Edmonds, H. Harrington,

C.

&

Schmitt,

R.

(2005).

Evaiuating

the effectix,"eness of editorial policy toimprove statistjca] practi'ce:The

case of

the

Journal

of

Consulting

and

Clinical

Psy-cho}ogy.

foumal

of

Consutting and Clinicat Rsychot-ogly,

73,

136-143.

Finch,

S,,

Cumming,

G.

Williams,

J.

Palmer,

L.

Grif-fith,E. Alders, C. Anderson,

J.

& Goodrnan, O,

{2004).

Reform of statistica] inference

in

psychol-ogy:

The

case of

Memory

&

Cognitien.

Behavior Research hethods

instruments

and

ComPuters,

36,

312-324.

Fisher,

R.

A.

(1959),

Statistical

Mlithods and Scientijic ioference

<2nd

edn.}. Edinburgh: Oliver and Boyd.

Gardner,

M,

J.,

& Altman, D.G,

(1989).

Statisticswith cortiZdence. Londen: British Medical

Journal

lishingGroup.

MmkM*m

(2oo2).

Jtiveen'G't#ogee &ndash;

enats

mpfiI

O lt

to

l:

erama.

Harris, R,J.

(1997a).

Significance tests have their

place.RsycholQgicatScience,8,8-11.

Harris, R.

J.

(1997b),

Reforming significance testing

via three-valued ]ogic.InL.L.I'Iar]ow,

S.

A.

Mulaik,

&

J.

H. Steiger

(Eds.),

PVhat

if

theretvere no

sig-nifcance tests?. Mahwah,

NJ:

Law'rence

Erlbaum

Associates.

pp.

145-174.

#-Ews)t

(20o8),

?v-f tzv

-

7

'TM;.ttaM・ieeJZ

tg

U

JClive\V-yV

N,

42,

24-25.

Internationa]Committee oi Medica]

Joumal

Editors

{1988).

Uniform requirements

for

manuscripts sub-mitted to

biomedical

journa]s.

BritishMedical

foeer-na{, 269, 401-405.

Kaiser,H,F,

(1,960).

Directjonal

statistical decisions.

Rsychological

Reviezv,67, 160-167,

Krueger,

J.

(2001).

Null hypothesis significance

test-ing.

On

the survival of a flawed method. American

Ilsychologtst,

56,

l6-26,

Loftus,

G.

R.

&

Masson

M, E,

J,

{1994).

Using

con-fidence intervats in within-subject

clesigns.

Psy-chonomic

Bulletin

&

Review,

1,

476-

490.

Loftus,

G,

R,

(1996).

Psychology will

be

amuch

better

science when we change the way we analyze

data,

Czarvent

Directions

in

PsycholagicalScr'ence,

5,

17LMasson,

M.

E.

J.

&

Loftus,

G.

(2003).

Using confidence

interva]sforgraphically

based

data

interpretation.

Canadian

Jburnal

of

Expen'mentag Rsychologlv,57,

203-220.

IF<7is

ee・lt'A

l-e(2oo8).

Ifffi:maRletsctr4fetIMEea

k

a)

f:

to

l1-g

es

ee

k

L

nl

P.

Je:ft-

ee

:,ti・#

ff

E}f

n,

31, 57-66.

Morrison,

D.E.,

&

HenkeL

R.E.

(1970).

The sig-niiZcanee testconmoversy. Chicago: Aldine.

Neyman,J.

&

Pearson,

E,

S.

(1933>.

On

the problem of

the most efficient testsof statistical hypotheses,

Philosophicat

Transactions

of

the

Royal

Societ)p

of

London. Sen'esA, 231,289-337.

Elgbff\ft

(2oos).

R7RJC,lva#ft

tug

rc$fi-

a)E]!es

g

(20o51flkEYW)

H2tsOve\k.

Omj,

Y,,& Komata, S.

(2005).

The evolution of

data

analyses in

Japanese

psychology.

jopanese

logtcatResearch,47, 137-143,

!Jiff-Ytk・iN

=(2oos)

RiY-%altto

¢

reT-M'a,te7

th;YV-an,

Rosnow, R.

&

Rosenthal,

R.

(1989).

Statistical

dures

and the

justification

of knowledge in

logicalscience. Amen'can Psychologist,

44,

1284.

2

talwa

ptMEor*n

(lggo).

fi:tzFFei;:e:tsct4M:-fts4

heza

mfirt\thuzft.

Thompson,

B.

(2006).

Research

$ynthesis: Effectsizes.

In

J,

Green, G.Camilli,& P.B.Elmore

(Eds.),

booh

of

comptementa7:y methods in education

search,

Washington

DC: American Educationa]

search As$ociation. pp.583-603.

Thompson, B.

(2007).

Effectsizes, cenfidence

vaLs, and confidence

intervals

for

effect sizes.

chotogy

in

Theschoois,

44,423-432.

Wilkinson,

L.,

&

APA

Task Force on Statistical

ence

(1

999).Statisticalmethods inpsychology

nals:

Guidelines

and explanations.

Amen'can

cholQgist, 54,

594-604,

図 1 .   percentages   of   articles   ( a )   reporting   measures   of   variabihty   and ( b ) reporting   p

参照

関連したドキュメント

「心理学基礎研究の地域貢献を考える」が開かれた。フォー

さらに体育・スポーツ政策の研究と実践に寄与 することを目的として、研究者を中心に運営され る日本体育・ スポーツ政策学会は、2007 年 12 月

経済学研究科は、経済学の高等教育機関として研究者を

(1)  研究課題に関して、 資料を収集し、 実験、 測定、 調査、 実践を行い、 分析する能力を身につけて いる.

 本学薬学部は、薬剤師国家試験100%合格を前提に、研究心・研究能力を持ち、地域のキーパーソンとして活

       緒  爾来「レ線キモグラフィー」による心臓の基礎的研

文献資料リポジトリとの連携および横断検索の 実現である.複数の機関に分散している多様な

3月6日, 認知科学研究グループが主催す るシンポジウム「今こそ基礎心理学:視覚 を中心とした情報処理研究の最前線」を 開催しました。同志社大学の竹島康博助 教,