The
.
XaPaneSE fournal of Psychonnm・
ic Scienee 2009,
Vol.
28,
No.
【,
8自一
93璽
日
本
に
お
け る
統 計改 革
一 基
礎
心 理学研 究
を
資料
と して一
大 久保 街 亜
* 専 修 大 学*Statistical
reform
in
Japan
一
The
case ofthe
/
tZt
)anese/
bzarnal
ofPsychonomic
Science
一
Matia
OKUBO
*Senshu
b’
niversity *In the late l990s
,
the
AmericanPsycho
】ogicalAssociation
advocated improved statisticalpractices
,
inc
廴uding reporting confidenceintervals
〔(]Js
)and effect sizes.
Since
this statisticα1
帥 襯,
the numbers o 〔reports in international academic
journals
of psychology which have included theα and effect sizes have
increased、
We
investigated
the evidencefor
statisticaI reformin
Japan
by
examining papers published
from
l982
to2008
in
theノ御)anese /Ournat of Psychonomic Science,
Thc reports which included Cls and e 「fect sizes were extremely rare in thejournal
even after 2001.
This
observation suggcsts that this statistical reformhas
not yet started amongJapanese
research−
ers
in
psychology.
Key
words :inferential
statistics,
null−hypothesis
significance testing,
confidenceinterval
,
effectsize
Neyman & Pearson (1933)によっ て提 案さ れ た有意 性検定 (ある い は帰無仮説有意性検 定)は
,
これ まで さま ざ ま な批判を受けて き た (レ ビ
.
=一
と して,Cohen ,
1994i Harris
,
1997a;Morrison & Henkel ,1970;Krue−
ger
,
2001
;Lbftus,1996
)。 例えば, 有意性 検定に お け る 鷺値 的な判 断は,
かの Ronald A.
Fishcr が強 く問 題 視 し た ことで知 ら れ る 〔Fisher,1959
)。
ま た,
標 本 数によ りp 値が変 化す る た め,
注 意 して検定 結 果を解釈すべ き だ と多 くの 研 究 者が指 摘 して き た (e.
g,
芝・
南 風 原,
1990 )。 し か し,
長 年にわ たる激 しい批 判がある一
方,
有 意 性 検 定を擁 護す る立 場 も あ る (e.
g.
Abelson,
1997a ; Harris,
1997a )。
例え ば,
Abelson (1997a)は,
有 意性検 定に よ る二値的な判 断こそ が,
実験結果の解 釈に必要だ と 主張 し た (also see Abelson,
1997b >。 その理 由 と して
,
心 理学 者が 知 り たい ことは,
効 果の大き さで はな く,
二値 的に記 述で き る効 果の有 無で あ ること が多い こ と が
指 摘された (例
,
左右 対 称な顔は,
非 対 称な顔よ り魅 力* Dcpartment
of Psychology
,
Senshu University,
2−
1−
1Higashimita,
Tama−
ku,
Kawasaki,
Kana−
gawa 214
−
8580 的か ?)。
ま た,
Harris (1997a )は,
従 来の有 意 性 検 定に 論理的問題が生 ずる の は, 〔1)差が な い (μ 1=
μ 2)と (2)差 が ない と は言え ない (μユ≠μ2)の間で二値の判 断を行う か らで,
Kaiser 〔1960 )の ア.
イ デアに従い,
(1)μ]小な りμ 2 (μ1 〈μ2),
(2
)μ且大な りμ2(μ[〉μ2),
(3
>そ0)ど ち ら か ((μ1 〈 μ2) or(k
μ1> μ2))の間で 三値 的な判 断を行え ば論理的な問 題は解 消で き る と主 張しt
:.
J 加えて,
有 意 桝i検 定に よっ て得ら れ るp
値か ら,
冉現性確率を推 定で きる と も述べた(also see Harris
,
1997b )。
さ らに,
心 理学で は ほ ぼすべて の実 証 的 研 究で有 意 性 検 定が使 われて い る のが現 状 で あ る
。
これは有 意 性 検 定の価 値を (潜 在 的に せ よ)ほ ぼすべ て の研 究 者が認めて い る こと を示 唆 する。
だ が,
近 年に なっ て,
主に雑 誌 論 文な ど研 究 発 表の場 を申心に有 意性 検定の 取 り扱いにっ いて さ ま ざ ま な 変化 が 生 じて き た。 この動き は有意性 検 定が抱え る問題 の改 善を日指す もの で あ る。 これ を 心 理学に お ける統 計 改 革と呼ぶ研 究 者もい る (Curnming
,
Fidler,
Leonard,
Kali−
nowski
.
Christiansen, K]einig
,
Lo,
McMenamin,
& Wilson,
2007 ;Finch,
Cumming,
Williams,
Palrner,
GriMth
,
A
]ders,
Anderson,
& GoQd エnan,
2004 )、
,
こ の Copyright、
The japanesePsychonomjc Society、
All.
大 久 保 : 日本にお け る統 計 改 革
89
統 計 改 革はCohen
(1994
)の有 意性検定に対す る批判と 効果 量 の重 要性 を主張 し た 論文に端を発 する。
この論 文 を受け,
アメ リカ心 理学 会で は,Leland
Wi
]kinson
を 中 心と す る推 測 統 計に関す る専 門 委 員 会が開か れ,
統 計 手法に関する問題点が議 論さ れた。 そ して,
出版に お け る推 測統 計の取 り扱い にっ い て ガ イ ドラインが発表さ れた (Wilkinson & APA Task Force on StatiSticaHnfcr
−
ence
,
1999
>。 この ガ イ ドラインで は, 結 果の分 析にっ い て 〔1>必 要 最 小 限の 分 析を選 択 する こ と,
(2)信 頼 区 間 (confidenceinterval
,
以 ドCl
と略す) を使用 した 区 間 推 定を行 うこ と,
(3
)重要な知見 あ るい は ρ値を報 告す る と きは必 ず 効 果 量を報告 する こ と,
(4)分 析の前 提が 瀧た さ れて い るこ と を き ち ん と示すことの4
点につ い て主に述べ られて い る。 他に もソ フ ト ウエ ア の使用等に つ いて諤及がなされた。
これ らの う ち有 意 性 検 定の問 題 点と直接 関連 するの は と (3),
すな わちα と効 果 量 で ある。 α と は,
あ る信 頼 水 準に お いて母 数 を 含む区 間 を 指 す。 信 頼 水 準 と して.
95 が用い ら れる こと が多くt これ を95
%Cf
と呼ぶ。
例えば,
平 均 値の95
%CI
は95
%CI
=M
±SE
(t95%) (1
) と定 義さ れ る。 こ こ で,
M は平 均 値,
SE は標 準 誤 差 (以 下,
SE と略 す ),
tg5% はt分 布の95
%に対 応 する t値で あ る。 結 果の解 釈におい て,
有 意 性 検 定よ り もCI
を重 視 す べ きと いう主 張は,
医 学で は 1980 年 代か ら存 在 した。
Lancet,
Americ
αnJoumal
ofPubtic
llealth
,
British
MedicaJ
fourn
α1な どの著 名な論 文 誌が,
結 果におい てp
値を強調せ ず,CI
をっ けて報告す るこ とを 当時か ら推奨して い る (
Gardner
& Altman,
1989 >。 こ の方釘は医学 論 文 誌 編 集 委 員 国 際 委 員 会で も賛 同を得た 〔lnterna
−
tional
Committee
ofMedica1
Journal
Editors,1988
)。医 学 論 文 誌で は実 際にCfが多 く報 告 されて
fO’
O
,
Amer−
ican
foumal
of Pubtic Health に 2000 年に掲 載された論 文で は お よ そ
60
%でCI
が報告さ れ た。Epidemiotogy
の よ うに ほ ぼ 100%の論 文で C∬が報 告さ れる場 合 もあっ た(Fidler
,
Thomason ,
Cumming ,
Finch
, &
Lee−
rnan,
2004 )。
心 理学で も
Loftus
ら が,Cl
の重要 性を長ら くギ張 し て き た (Loftus
&Masson ,1994
;Loftus,
19961Masson
& Lo正tus
,
2003 )。 Loftus は,
論 文や学 会において主張 す る だ けに と ど ま らず,
彼 自身が主 任 編 集 者を務め たMemory
&Cognition
誌におい て,
投 稿さ れ た論 文に対 しC/を報 告 する こと を求めた。
そ の結 果,
Loftus 就 任 以 前 (1990 年か ら1992 年 )で はCI
を 報 告 した論 文は お よ そ1
%にす ぎな か っ た が,
彼が就 任し た1994
年か ら徐 々 に 増 加 し1998 年 に は36% に ま で 上 昇 し た(
Finch
et aL,2004
)。 ま た,
Journ
αZ of ExPerimentalPSNchology
:(;ener α1
な どMemory
&Cognition
以外の論文誌で も
,
90 年代は 5%程度だっ た α の報 告 率が,
2000
年 代に は お よ そ30
% に な っ た(Cumming
et aL,
2DO7 )。
た だ し,
報 告 率は論 文 誌に よっ て大きく異なる よ うで あ る (Cumlning
et a!.
,
2007,
Figure
l
を 見よ)。 α を重 視 する立 場で は,
研 究 者が興味を持っ の は測 定さ れ た効 果が有意か否かで は な く,
そ の効 果の大き さ だ と考え る。 ま た,
有意 か否か とい う2
分 法に論理的な 根 拠は なく,
適 切な判 断 基 準で は な い と 主張する。 例え ば,
Rosnow
&Rosenthal
(1989
}は,
有 意 性 検 定の極 端 な 2 分法を皮肉り,
“
神はp
く.
06 をp
く.
05
と等し く,
そ して強 く愛 して くださ る (p.
1277)”
と述べ た。 加えて,
α は,
有意性検 定で 扱うこ と がで き ない 検 定 力にっ い て有 用な情 報を得る こ と がで きる (Loftus,
1996;Mas−
son &Loftus,2003
)。
α だ けで な く,
効 果量 も有意性 検 定の 問題点を考え るうえ で重 要 だ。
効 果 量は単 位に依 存 しない効 果の大 き さの指 標で あ る。 測定単位に頼ら ず実 験 操 作の効 果や変 数 間の関 係の強さ を表 すこと がで きる。 代 表 的な効 果 量 で あるCohen
のd
は 糠 準 化された平 均 偵 差”
と呼 ば れ (Cohen ,1988
),
ふ たっ の母 平 均の 差 を,
母 集 団 標 準 偏 差で割っ たもの と定 義されるn すなわ ち,
標 準 偏 差を 用いた単純な標 準 化に よ り,
単 位に依 存 し ない効果の大 き さ を表 すこ と がで き る。p
値は前 述のように,
サ ンプ ル サ イ ズによっ て変 わり,
効 果の大 きさにつ い て情 報は 何も与え ない。 そ こで, サ ンプル サ イ ズ に よ っ て, ま た 測 定 単 位によっ て変 化 する ことの ない,
標 準 化さ れ た指 標で あ る効 果量 が 用い ら れ るこ と と なっ た。
近 年の 論 文 で は,C
∫ よ り も,
効 果量の 記 載が 日立っ て増えて きて い る ようだ,
,
現 在,
心琿学に お い て /ournal ef ExPen’
men−
tal Psychology’ APPIied な ど およそ
30
もの論文誌が 効果量の記載を明 示 的に求めて い る (
Thompson ,2007
)。実 際
,
近 年にな り効 果 量を記 載した論 文 数は増 加してお り,
例えば,
丿b
π 認 ofConsulting
αndClinicai
Psy−
chotogy で は
,
分散 分析に伴う効果量報 告率は 1993 年で
20
% だっ
た が,
2001 年 に は 46%に まで 上昇 し た (FidLer,
Cumming ,
Thomason,
Pannuzzo,
Smith,
Fyffe,
Edmonds,
Harrington,
& Schmitt,
2005)。効 果 量は有 意 性 検 定に含ま れ ない情 報 を提 供 する。 繰
り返 し述べ たよ うに有 意 水 凖や
p
値は効 果の 大 小やそ の関 係 性の強さ にっ い て一
切の情 報を与えな い。
実 際,
小さ な効 果で もサ ンプル数が多い と有意 と な る場 合があgo
基礎心 理学 研 究 第 28巻 第 1号 る。
例えば,
ピ ア ソ ンの積 率 相 関 関 数は,
r.
一
・
.
10
とい う 弱い相 関で すら,
N;400
な ら ば 5%水準で有意と なっ て し ま う。 こ の ような事 態を想 定 する と,
有 意 差の有 無 だ け で な く,
や は り効果 量を同時に考慮す るこ と が不 可 欠で あるe こ のよ う な有 意 性 検 定の改 善 を 試み る統計改革の 流れ を受けア メ リ カ 心 理学会に よるAPA
Publicatton Man−
ual の第 5版で は
,
論 文の執 筆に おいてCl
と効 果 量の 報 告 が 重視されて い る、
まず,
推 定値の報告において必 ず 誤差 範 囲の報 告が求め ら れており,
な かで もCiが最 善の策と され,
強 く推 奨された(AmericanPsychologi−
calAssociation,200Lp .
22
)。一
方,
効果 量 あるい は何 らかの か たちで関 係 性の強 さ を 示 すことが結 果の報 告で は 不 可欠と 記 さ れ た 〔p.
25
)。APA
Publication
Manuat
は,
1,
000 誌 を 超え る論 文 誌で採 用されて おり〔Ameri−
can
Psychologica
!Association,2001,
p.
xxi),
その影響は極めて大きい 。 最近の国 際 論 文 誌に は α
,
効 果量 を ともに報 告 する論 文が多 くある。
実 際に統 計 改 革 以 降,
す な わ ち2000
年 代にな り 論 文 にお け る α と 効 果 量の 報 告 数が増 大し た (Cu エnming et a1.
,
2007 ;Fidler ct a1.
,
2005
:Finch et al.
.
2004
},
,
これ らの事 実は海 外で統 計 改 革が着実に進んで い るこ と を示 して いる。 本 研 究の 目的は,
Cumming et a ].
(2007 )が述べ た心 理 学 にお け る統 計改革にっ いて,
凵本の 現状を検討す る ことに ある。 国 際 的な統 計 改 革の流れに も か か わ らず,
小 野 寺・
菱 村 (2005 } に よれ ば 日本で は効 果量 を重 視す る流れ は ほ と ん ど ない とい う。 日本 語に よ る心理学 論 文 執 筆,
出版の指 針で あ る“
H
本 心理学 会 執 筆・
投 稿の手 び き (2005 年改訂 版)”
に もCI
や効巣 量に関する記載 は ない (日本心理学 会,2005
),, 加えて,CI
や効 果量に つ い て 日本 語で体 系 的に解 説 し た書 籍 もほ と ん ど な く,
教 育 体制も 整 っ て いない こ と が 最近の論文で指 摘さ れて い る (井上,
2008 ;水 本・
竹 内,
2008 )、
、
これ らの指 摘は あ る もの の,
日本に おける統 計 改 革の現状につ い て,
定 量 的な指 標を 用 いた検 討はこれ ま で な さ れ てい ない。
日 本 にお け る 心 理 統 計 手 法の 歴 史 的 変 遷 を 検 討 し たOmi
&Komata
(2005
)で も, 2000 年 代で ほ ぼ すべて の 論 文 が有 意1
生検 定を行っ て い るこ と は示さ れ た もの の,Cl
や 効 果量 に関する報 告はな か っ た。 そ こ で,
本 研 究で は 論 文 誌“
基 礎 心理学 研 究”
を資 料と して,
凵本にお ける 統 計 改 革にっ い て検 討する こ と と し た。
調査にあ た り,
1982 年か ら 2008 年にかけ て 基 礎 心理 学 研 究に掲 載 さ れた論 文にっ い て,
結 果の項 において (1
)誤 差 範囲の指 標 (例,
CJ,
SD ,
SE
),
効 果 量 を報 告 し た論 文 数 を集 計 し た。 海 外と「司様 に 日本で も統計改革が 起 こっ
て い る な ら,Cl
や効果 量の報 告が2000
年 代に入 り増 加し た と予 測される。
方 法 1982 年 (1巻 1 弓)か ら 2008 年 (26 巻 2 号)に刊行 さ れ た基礎心 理学研究 に掲載さ れ, 実 証的検 討を含ん だ 研 究 論 文を対 象に コー
ド化を行っ た。
な お,
基 礎 心 理 学 研究に は,
原 著 論 文, 研 究ノー
ト,
評論,
書評, 優秀発 表賞 抄 録,
講演論 文な ど幾っ かの投稿種 別が ある。
これ らの う ち,
本 研 究で は原 著 論 文および 研究ノー
ト の区 分 で掲 載さ れ たもの のみ を対象と し た。 評論は 理論も し く は方 法 論を議 論 し た もの で,
書 評は書 籍を紹 介 し た もの である。
今 回の調 査で はど ちらの投 稿 種 別で も1
次 資 料 と して実証 デー
タ を記 載 し た ものが な かっ た た め検討の 対 象と はしな かっ た.一
方,
優 秀 発 表 賞 抄 録,
講演 論 文 に は実証デー
タ が記載さ れ る もの も多か っ た。 た だ し,
これ らの 論 文は,
(1)掲 載を前 提に著 者に依 頼された も ので,
紙1隔に厳 しい制 限が あ り,
必要な統 計情報を省 か ざ る を え ない 場 合が あ る。 これ らの理 由 か ら優 秀 発 表 賞 抄 録と講 演 論 文 を 検 討 対 象 とし なかっ た。 こ の某 準に おいて検 討 対 象 となっ た総 論 文 数は199
本で あっ た。
こ れ ら を1982〜
1984 年,1985〜1988
年、 1989〜
上992
年,
1993〜
1996 年,
1997〜
2000 年,
2001〜
2004 年,
2005 〜2008
年の7
つ の 期間に分け 分折を 行 っ た。
そ れ ぞ れの期 間にお い て検 討 対 象と なっ た論 文 数は,
22,
24,
27,
31,
31,
31,
33 本で あっ た。
これ らの 論 文にっ い て,
誤 差 範 囲の 指 標,
な ら びに有意 性 倹 定 値の報 告 )と そ の効 果 量の記 載にっ い て コー
ド化を行 っ た。
誤 差 範 囲の 指 標にっ いて は,APA 1 )ublication Manual におい て も, 最 善の方法と さ れ るCl
, お よ び その他の指標 (例,SD ,
SE)を集 計の対 象と し た。
効 巣 量にっ い て は,
Cohen のd,
Giass
のd
,R2,
72,
乙ω 2,
η2,
ηP2,
Cramer
のV ,
叨 な ど が対 象と なっ
た (実 際に報 告が あっ
たの はこ の う ちの一
部で あ っ た)。 結 果 誤差範囲 指 標 誤差範囲の 指標にっ い て集 計し た もの を図1
(a)に示 し た。 何 ら かの指 標を用い誤 差範囲 を報 告し た論 文は,
全体で 47.
24%で あっ
た。 報 告 数は年と と もに有意に増 加 し,
XzC6,
N=
199}=31.
37,
ρ<.
OOL ze/
=.
40,
2000 年 代で はおよ そ 70%の論 文に誤 差 範 囲の指 標が記 載され る よ うに なっ た。
ただし,
図1
の とおり,
α の報 告はほ ぼ全 くとい っ て 良い く らい な く,
すべ て の 論 文の 中で たっ
た1
件で あっ た。 報告さ れ た 誤 差範 囲の指 標は ほ と大 久 保:
H
本にお ける統 計 改 革91
〇〇
〇
〇
〇 6
4
2
墨
o 檀 く←
o Φ 団 ε 匚8
」
Φ ユ ’:
9
82【
84 85r88 89−
92 93−
96 97−
00 01−
04 05−
08 〃=
22 N=
24 〃=
27 〃=
31 〃=
31 〃≡
31 N≡
33 Yearof Publication 効果 量と して ω 2の値が報 告された。
ち な みに,
分散 分 析は基 礎心 理学研 究において最も多く使わ れ る統 計 解 析 法で,
p 値を報 告し た論文の78.
82
%で使用さ れ た。 な お,
24.
70%を占め る ’検 定を用い た論 文で は,
効 果 量は ひ とっ も報告さ れ な か っ た。 考 察 100 80 60 40 20 の9
冒 く ち9
芒8
」
£ o 82−
84 85−
88 89−
92 93−
96 97−
00 01−
04 05−
08 〃=
22 〃=
24 〃=
27 〃=
31 〃=
3圃 〃=
31 〃=
33 Yearof Publication図 1
.
percentages of articles (a) reporting measures of variabihty and (b )reportingp
values and effect sizes
,
S
ヱ),
SE
, andC
/stand
for
standarddeviation
,
standard error,
andcon 員dence interval
,
respectively.
ん ど が
SD
も し く はSE
で,
87.
23
%を 占めた。SD
とSE
につ い て興 味 深い点は,
1980 年 代で は誤 差 範 囲の報 告 数がSD
の報 告 数と ほ ぼ・
致 するの に対 し,90
年代 以 降で はそ の割 合が変 化し た ことで あ る。 この 90 年代以 降の変 化は,
そ れ まで は全 く な か っt
: SE の報 告と時 期 を同じ くし て始まっ た よ う に見え る。
そして,2005
年 以降に なる と,
両 者の報 告 数はほぼ等 し く なっ た。 C∫,
SD,
SE 以 外の指 標 と して は,
レン ジ,
4分 偏 差の報 告が あっ た。
有 意 性 検 定 と その効 果 量 有 意 性 検 定 とその 効果量にっ い て集 計 したもの を図1
(b
)に示 し た。 有意性 検定 を 行っ
たこ と を示すp
値の報 告は,
年と と もに増え,
X2(6,
1>=
199)=
22.
03,
p =.
OOI,
w=,
33,
2000 年 代に な るとほぼ すべ て の論 文でp 値が 報 告された。一
方,
効 果 量の報 告は年 代にか か わ らず 少 な く,p
値を報 告 した論 文 すべ て の 10.
58%で あっ たe しか も,
効 果 量を報 告 し た論 文は,
1件を除き,
相 関 係 数 単 回 帰 分 析,
重 回帰 分析な ど効 果 量 自 体が 考察の 中 心 的 対 象と な る分析 方法 を 用いていた。
そ れ 以外の ケー
ス で効 果 量 が報 告さ れ たの は わ ず か1
件で,
分 散 分 析の α の報 告は過 去24年の基 礎 心理学 研 究の論 文に おい て わずか 1 件に過 ぎな か っ た。 心 理学に お ける統 計 改 革 におい て最善の策と して強 く推奨さ れて い ること を考え る と驚 くべ き少な さ で あ る。
また,
有 意 性 検 定が行わ れ た と して も効果 量 が報告さ れこと は ほ と ん ど な かっ た、
,
特に,
分 散 分 析や t検 定の よ う な使 用 頻 度が高い 手 法で は たっ た1
件の報 告し か な かっ た。 これ らの結 果は, 有 意性検定を改善する試み と して の統 計 改 革が,
日木で は ま るで進ん で い な い こ とをはっ き りと示す もの で あ る。Omi
&Komata
(2005
>は,
口本にお ける心理統 計手 法の歴 史 的 変 遷にっ い て検 討し,
ア メ リカ で起こ っ た変 化が5〜10
年を経て 日本で起こること を報 告 し た。 例え ば,
ア メ リ カ で は 1950 年ごろ分 散 分 析を中 心と する実 験 計画法が定着し たの に対し, 日本で は1960
年代ま で は っ きりと し た変 化が見ら れ な かっ た。
これ と同じく,
今回の統 計 改 革 も日本に定 着 するまで,
しば らく時 間を 要す るのか も し れ ない。 ただ し,
統 計 改 革と関 連 する変 化が 日本で全 くな か っ た わ けで は ない よ う だ。 統計 改 革が始まっ
た1990
年代 以 降,
図 1の通 り誤差範 囲の指 標を報 告する論 文 数が基 礎心理 学 研 究に おい て も増 加し た。APA
PIatblic
αtion Manual 第 5 版で は,
推 定値の報告におい て そ の誤 差範 囲を必ず記 載す るよ うに求めて い る。 こ の流れ を受け,
日本においても 誤 差範 囲の報 告が増え たの かもし れ な い。 この増 加に関して興 味 深い ことは,
SE の報 告が増 え たの に対 し,
SD
の報 告が減 少し たことで あ る。
理由 は定かで は な いが,
数値の 人き さ が関 係す る の か も し れ ない。
同 じロー
デー
タか ら算 出 する な ら,
定義上,
SE
の 値はSD
よ り小さ く な る。一
般に,
誤差 範囲が小さい ほ ど印 象が 良い た め,
ど う せ報 告を す るな ら印 象の良い SE が報 告さ れる よ うになっ た可 能 性 も ある。 また,
SE は,
標 本 分 布の標 準 偏 差で あ り,
標 本 統 計 量と 母数が平 均 して ど の くら い異な る か示す指 標で あ る。
こ の よ うな 推 測 統 計の基 礎とな る性 質のため,
t検 定や分 散 分 析な ど利用頻 度の高い手 法と直 接の対 応が あ る。
これ も理由 の ひ とっ か も し れな い 。 も ち ろ ん,SD
とSE
は本来 的に意味が異なっ てお り,
研 究 者が そ れ を 意図 的に使い分ける場 合 もある。
例え92
基 礎 心 理 学 研 究 第 28 巻 第 1弓 ば,
集 団の属性の ひ とっ としてばらつ き を記 述 する ため に はSD
を用い るべ きで ある。 ま た,
推 測 統 計を行わ な い なら,SE
を 記 載 する意 味 は ない。 今 回検討対 象と な っ た論 文に も,
上 述の よ う な目 的か ら研 究 者が 意図 的 に SD を選 択した場 合 も あっ たで あろう。
だが,
論 文の 記述の み か ら誤差 指 標の 選択に お け る薺者の 意図 を読み 取るの は困 難で ある。 そ のた め本 論 文で は個々 の研 究 内 容にまで踏み込んだ 誤 差 指 標の分 類は行わ なかっ た。 た だ し,
SE
の記 載 が 現 れて き た 1990 年 代後 半以降,
ほぼ すべ て の論 文で有 意 性 検 定 が 行 わ れて いた 〔図 lb)。
明 確 な因 果 関 係を言 及で き る もの で は ない が,
こ の結 果は SE と推 測 統 計との直 接の対 応が,
SE の記 載の増 加に関 わ る とい う解釈と符号 する と言っ て よい だ ろ5c、
Lotus
&Masson
(1994 )は,
分 散 分 析 と対 応 付 けが 極 めて容 易な95
% α の算 出方法 を 提案し た。 これ は分散 分 析の誤 差項を使 用する もの で,
参 加 者 間の計 画で は95%α 一
回
[
孥
・tg5 ・) … と な る。 こ こ で,Mi
は条 件 ブにお け る平 均 値,
MSw
は郡 内 平 均 平 方,
N は サ ンプル数,
tgiコ
vaは,
誤 差の自 由 度に おい て t分 布の95
%に対 応するt{直であ る。 ま た,
参加 者 内の計 画では95%α
一
MF/
M
整
・t・5・) (・・ とな る。
こ こ で,
MSsxc は,
参 加 者 と要 因の 交 互 作用 (誤差)の 平均平方で あ る。 な お,Loftus
&Masson
〔19941 の手 法は どの よ う な デー
タに も使 用で き る わ け で はな い。 分散分 析にお ける種々 の仮定を満たす 必要が あ る% 分 散 分 析で は要 因の効 果と誤 差を分 割で きる。
そ の た め, 式,
〔3
)を使用し た ほ うが,一
般 に従 来型の式 (1
) よ り も小さ な値で Cfが算 出さ れ る。
特に参加 者 内計画 で は, 個 人 差と誤 差を切り分ける こ とがで きる ので そ の 効 果が大きい。 た だ し,
Loftus
&Masson
(1994
)の 手 法 は単に小さ い値を算出で き る か ら優れて い る の で はな い。 理 論 的な利 点が少なくと も ふ たつ あ る。 まず,
(1
) Loftus & Masson (1994)の提 案 し た方 法は,
実 験 研 究 で主 流の分 析 手 法で ある分 散 分 析のモ デル に基 づ く た め,
対 応づ けが 極め て容 易で ある。
加えて,
(2)分 散 分 析1)
Masson
&Loftus
(2003
)に よ れ ば,
Loftus
&Masson 〔1994)の于 法を用い るため に は分散の等 質 性が満た されて い なけれ ば な ら ない
.
ま た,
参 加 者 内 計 画に おいて球 面 性の仮 定 が 満たさ れて い る 必 要 が あ る.
詳 し く は Masson & Loftus (2QQ3 ) の p207〜208
を 見よ.
の 原理 を利用 し,
要 因の効果と誤 差の効 果を分け,
誤 差 の みを抽 出 する こと が可 能に なる。
これ は,
誤 羌に対 す る要因の効 果 を知 り たい多くの研究者に は 理想的な方法 で ある。
残 念な が らLoftus
&Masson
(1994
)の手 法は 日本で はほ と ん ど使用さ れて い ない。 井上 (2008 )や水 本・
竹 内 (2008 >が 指 摘 する ように,Cf
や効 果 量にっ いて 日本 語で体 系的に解 説し た書籍がほ と ん ど ない こと が 理由の ひ とっ か も し れな い。 そ のた め も あ り,
こ こ で L〔}ftus&Masson
(1994>の手 法にっ いて詳 述 した。 も ちろ ん本邦 に も,
メ タ分 析に焦点を あて 効 果量 にっ いて 詳述 し た 芝・
南 風 原 (1990)や,
入 門 書に も か かわ らず 効 果 量や 信頼区 間の 説明に紙幅を割いた南 風 原 〔2002 )の よ う な 意 欲 的な取 り組みも あっ た。
それでも実際の研 究 場 面に 対応し た手法につ いて は ま だ ま だ情 報が不足 して い る。 な お,
効 果量 にっ い て は,
水 本・
竹 内 〔2008)で実 践 的な 取り扱い につ いて短 く分 かり やす くまとめてある。 効 果 量に馴 染みの ない 方に は参 考にな るであ ろう。 今 回の調 査か ら,
心 理 学にお ける統 計 改 革は 日本で全 く進んで い ない こと が 明 ら かにな っ た。 本研究で は基 礎 心 理 学 研 究のみを 資 料と し た が,
他の國 内 誌 も最 新 号 を 概観 する限 り大 きな違い は ないで あろ う。 もちろ ん,
海 外で行わ れて い ること を1
批 判に取 り入れて,
その と お り真 似 す れ ば 良いわ けで はない。
また,
海 外でもCJ
や 効 果 量 の報告こそ 増 え た が,
そ れ ら を使 っ た考 察は論 文 で ほとん ど な さ れ ない とい う報 告 もある (F’
td!er et al.
,
2004 )。
け れど も有 意 性 検 定に数 多 くの 問 題が存 在 する こ と は明 らかで あり,
そ れ ら をで き る限 り改 善して い く こ と が望 ましい,,
さらに,Cf
や効 果 量の報 告は有 意 「生検 定の問 題点を改善 す る だ け で な く.
そ れ 以 ヒに 有益な情 報を読 者に与えて くれ る。 まず,
(DCI
は,
p
値より,
ずっ と正 確に再 現 性 を予測 する (Cumming ,
2008 )。
ま た,
(2
)効 果量 を使用す るこ とに よ り,
異な るパ ラ ダ イム で検 討 さ れて き た効 果の 比較 検 討が容 易に なる (Tho−
mpson.
2006 )。
実 際,
(3〕効 果量,
Cl と もに メ タ分 析に 有 用な情 報である。 加え て,
(4)こ の ふ たっ の指 標に よ り 検 定 力 に っ い て簡 便かっ 有 益な検 討が可 能だ (Loftus,
1996
;Masson &Loftus,
2003 )。
最 後に,
(5)有 意 性 検 定 に よ りp
く,
06
とい う“
死刑宣 告”
を受け た デー
タが 陽 の 目を見る よ うにな る か も し れ ない。Loftus
(1996
)は,
“
分 析 方 法を変え る と 心 理学はずっ と素 晴ら しい科 学に な る だ ろう (p.
161)♂ と,
いみ じ く も彼の論 文の タイF ル で述べ た。 統 計 改 革が進め ば確かに そ の可 能 性が膨 ら むに違い ない。
V<bkeeiHptictslt6M:・[-es(g
93
Gl
M
St
wt
Abelson,
R.
P.
(1997a).
On
the surprisinglongevity
offiegged
horses: Why there isa case for the sig-nificance test.RsychologicalScience,
8,
12-1
5.
Abelson,
R.
(1997b).
A
retrospective on thesig-nificance test ban of 1999
(If
there were no sig-nificance tests, they wouldbe
invented).
In
L.L.Harlow,
S.
A.
Mulaik,
&
J.
H.
Steiger
{Eds.),
Whattf
thereweTe no signtficance tests?
Mahwah,
NJ:
Law-renceErlbaum
Associates.
pp.117-141L.
American
Psychological
Association
(2001),
IJletblica-tion manualof
theAmen'can
Rsychologicat tion(5`b
edn,>Washington,
DC:
American
I'sycho-IogicaLAssociation.
Cohen,
J.
(1988),
Statistical
Power
anaCysisfor
the
behaviorsciences
(2nd
edn.),Hillsdale,
NJ:
Lawrence
ErlbaumAssociates.Cohen,
J.
(1994).
The earth isround(P<.05),
AmenLcan Rsycholagist,49, 997-1003.
Cumming,
G,
{2008),
Replication
andP
intervals:
P
vaLues predict the future only vaguely,but
con-fidence
interva]s
do
muchbetter.
Pempectives
onPsychologiealScience,3,286-300.
Cumming, G.,Fidler,F.,Leonard, M., Kalinowski, P,,
Christiansen,
A.
Kleinig,
A.
Lo,
J.,
McMenamin,
N,,
& Wi}son, S,
(2007),
Statisticalreform inpsychol-ogy:
Is
Anything
Changing?,
Rsycholagical
Science,
18,23e-232.
Fidler,
F.
Thomason, N.Cumming,
G.,Finch,S.
&Leeman,
J.
(2004).
Editors
canlead
researchers toconfidence
intervals,
but
can't make them think:Statisticalreforrn lessons from medicine,
Psycho-logicalScience,15,!19-126.
Fidler,
F,,Cumming,
G.
Thomason, N,,Pannuzzo, D. Smith,J.
Fyffe,P.,Edmonds, H. Harrington,C.
&
Schmitt,
R.
(2005).
Evaiuating
the effectix,"eness of editorial policy toimprove statistjca] practi'ce:Thecase of
the
Journal
ofConsulting
andClinical
Psy-cho}ogy.foumal
of
Consutting and Clinicat Rsychot-ogly,73,
136-143.Finch,
S,,
Cumming,
G.
Williams,
J.
Palmer,
L.
Grif-fith,E. Alders, C. Anderson,
J.
& Goodrnan, O,
{2004).
Reform of statistica] inferencein
psychol-ogy:The
case ofMemory
&
Cognitien.
Behavior Research hethodsinstruments
andComPuters,
36,
312-324.
Fisher,
R.A.
(1959),
Statistical
Mlithods and Scientijic ioference<2nd
edn.}. Edinburgh: Oliver and Boyd.Gardner,
M,J.,
& Altman, D.G,(1989).
Statisticswith cortiZdence. Londen: British MedicalJournal
lishingGroup.
MmkM*m
(2oo2).
Jtiveen'G't#ogee –enats
mpfiI
O ltto
l:erama.
Harris, R,J.
(1997a).
Significance tests have theirplace.RsycholQgicatScience,8,8-11.
Harris, R.
J.
(1997b),
Reforming significance testingvia three-valued ]ogic.InL.L.I'Iar]ow,
S.
A.
Mulaik,
&
J.
H. Steiger(Eds.),
PVhatif
theretvere nosig-nifcance tests?. Mahwah,
NJ:
Law'rence
Erlbaum
Associates.
pp.145-174.
#-Ews)t
(20o8),
?v-f tzv-
7'TM;.ttaM・ieeJZ
tg
UJClive\V-yV
N,
42,
24-25.
Internationa]Committee oi Medica]
Joumal
Editors{1988).
Uniform requirementsfor
manuscripts sub-mitted tobiomedical
journa]s.
BritishMedicalfoeer-na{, 269, 401-405.
Kaiser,H,F,
(1,960).
Directjonal
statistical decisions.Rsychological
Reviezv,67, 160-167,Krueger,
J.
(2001).
Null hypothesis significancetest-ing.
On
the survival of a flawed method. AmericanIlsychologtst,
56,
l6-26,Loftus,
G.
R.
&
Masson
M, E,J,
{1994).
Usingcon-fidence intervats in within-subject
clesigns.
Psy-chonomicBulletin
&
Review,
1,
476-
490.
Loftus,
G,
R,(1996).
Psychology willbe
amuchbetter
science when we change the way we analyze
data,
Czarvent
Directions
in
PsycholagicalScr'ence,5,
17LMasson,
M.
E.
J.
&
Loftus,
G.
(2003).
Using confidenceinterva]sforgraphically
based
data
interpretation.
Canadian
Jburnal
of
Expen'mentag Rsychologlv,57,203-220.
IF<7is
ee・lt'A
l-e(2oo8).Ifffi:maRletsctr4fetIMEea
k
a)f:
to
l1-ges
ee
k
L
nl
P.
Je:ft-ee
:,ti・#
ff
E}f
n,
31, 57-66.Morrison,
D.E.,
&
HenkeL
R.E.
(1970).
The sig-niiZcanee testconmoversy. Chicago: Aldine.Neyman,J.
&
Pearson,
E,
S.
(1933>.
On
the problem ofthe most efficient testsof statistical hypotheses,
Philosophicat
Transactions
of
theRoyal
Societ)p
of
London. Sen'esA, 231,289-337.
Elgbff\ft
(2oos).
R7RJC,lva#ft
tug
・
rc$fi-
a)E]!es
g
(20o51flkEYW)
H2tsOve\k.
Omj,
Y,,& Komata, S.(2005).
The evolution ofdata
analyses inJapanese
psychology.jopanese
logtcatResearch,47, 137-143,
!Jiff-Ytk・iN
=(2oos)
RiY-%altto
¢reT-M'a,te7
th;YV-an,
Rosnow, R.
&
Rosenthal,R.
(1989).
Statistical
dures
and thejustification
of knowledge inlogicalscience. Amen'can Psychologist,
44,
1284.
2
talwa
・ptMEor*n
(lggo).
fi:tzFFei;:e:tsct4M:-fts4
heza
mfirt\thuzft.
Thompson,
B.
(2006).
Research
$ynthesis: Effectsizes.In
J,
Green, G.Camilli,& P.B.Elmore(Eds.),
booh
of
comptementa7:y methods in educationsearch,
Washington
DC: American Educationa] search As$ociation. pp.583-603.Thompson, B.
(2007).
Effectsizes, cenfidencevaLs, and confidence
intervals
for
effect sizes.chotogy
in
Theschoois,
44,423-432.Wilkinson,
L.,
&
APA
Task Force on Statisticalence
(1
999).Statisticalmethods inpsychologynals:
Guidelines
and explanations.Amen'can
cholQgist, 54,