植物防疫基礎講座
正しい分散分析結果を導 く ための変数変換法
独立行政法人農業環境技術研究所 やま
山
む ら村 光
司じ
は じ め に
表-1 は 1993 年 に 本誌の基礎講座で多重比較法の解説 を 行 っ た 際 に 用 い た デ ー タ で あ る ( 山 村, 1993 a ; b ; c) 。 当 時 は 多重比較法 に 関 し て 間違 っ た 手法が頻繁 に使 わ れ て い た よ う で あ る 。 DUNCAN (1955) の 多 重範囲検 定法 は そ れ ら 間違 っ た 手法の 中 で も 代表的な存在で あ っ た 。 こ れ は DUNCAN (1955) が間違 っ て い た と い う よ り も , 正確 に は ユ ー ザ ー の誤用が広が っ て い た と い う べ き 現象であ る ( 山 村, 1998) 。 な ぜ誤用 が こ れ ほ ど 広 く 拡 散 し た か と い う 問題 は そ れ 自 体がた い へ ん面 白 い研究課 題 で あ る よ う に 思 わ れ る 。 た だ し , 2000, 2001 年 の 日 本応用動物昆虫学会誌 (Applied Entomology and 2001- ogy) に 掲 載 さ れ た 論 文 を 調 べ て み る と , DUNCAN
( 1955) の 多 重範囲検定法 は も は や全 く 見 ら れ な く な っ て い る 。 ノ ンパ ラ メ ト リ ッ ク 検定後 に Dunn 法 と い っ た 不適切 な 多重比較法が依然 と し て 一部で使用 さ れて は い る も の の, 全体的 に は 多 重比較法の誤用 は か な り 減少 し た と い え る 。 し か し , ま た別 の面で不適切な検定処理が し ば し ば見 ら れ る 。 本稿で は 1993 年 の 解説 で は 十分 に は記述 し き れな か っ た 問題の 中か ら , 特 に 変数変換 に 関 連 し た 話 題 に つ い て 解 説 し て み た い。 な お , 本 稿 は 2002 年度 の 日 本応用 動物昆虫学会 で開催 さ れた 小集会
「操作実験 に お け る 方法論j でお 話 し し た 内容 に 手 を 加 え た も の であ る 。 本文 に 先立 ち , 小集会 を企画 さ れた戒 能洋一氏, 高林純示氏 に 感謝 し た い 。
表 ー 1 ハ ス モ ン ヨ ト ウ の フ ェ ロ モ ン ト ラ ッ プ誘殺 実験結果
地域 | ト ラ ッ プ番号 各 月 の誘殺個体数
5 月
1
6 月1
7 月1
8 月2 3
A A B
Transformation Formulae for Performing Correct ANOV A.
By Kohj i
Y
AMAMlIRA( キ ー ワ ー ド : 変 数 変 換, 分 散 分 析, 等 分 散 性, Taylor's power law, Box-Cox 変換, ノ ンパ ラ メ ト リ ッ ク 検定, 一般化線 型 モ デル)
I な ぜ変数変換が重要 か
分散分析 に お い て は 「測定値の分散 ( ぱ ら つ き ) が平 均値 に よ ら ず一定であ る 」 と い う 「等分散性j の仮定が 必要 と さ れ る 。 し か し , 例 え ば個体数 デー タ の場合 に は 測 定 値 の 分散 は 平均値 が大 き く な る に つ れ て 大 き く な る 。 こ の た め 変数変換 を行わ ず に 分散分析 を行 う と 有意 差が検出 で き な く な る こ と も 多 い 。 例 え ば表一1 の デ ー タ で三つ の ト ラ ッ プ に 捕獲 さ れ る 個体数 に 差 が あ る か ど う か を検定 し て み よ う 。 こ こ で は 月 を プ ロ ッ ク と 見 な し て 「乱塊法の分散分析J を 行 う こ と に す る 。 こ の場合,
対数変換 In(x) を施 し て か ら 分析 を 行 う と 三 つ の ト ラ ッ プ聞の有意確率 は P = 0 . 0007 で あ り 非常 に 有意 と な る 。 し か し , 変数変換 を行わ ず に 分散分析 を 行 う と 有意確率 は P = 0 . 283 で あ り , 全 く 有意差 は 見 ら れ な く な る 。 ま た 平方根変換 IX を 施 し て か ら 分散分析 を 行 う と 有意 確率 は P= 0 . 0793 で あ り , や は り 5% で は 有 意 差 が 見 ら れ な い 。 こ の例か ら も , 適切 な変数変換法 を 選択 す る こ と がい か に 重要で あ る かが示唆 さ れ る 。
E 個体数の平均一分散関係 に 関 す る 論争 一般 に 生物価体数の分散 S2 は そ の 平均 m と と も に 大 き く な る 。 表-1 の デー タ に お い て も , 5 月 か ら 8 月 に か り で 平均個体数が増加す る と 同時 に , そ の個体数のバ ラ ツ キ も 大 き く な っ て い る 。 イ ギ リ ス の ロ ザム ス テ ッ ド 農 業試験場 の TAYLOR (1961) は個体数 の 平均 と 分散 の 聞 に 次式が経験的 に 成立 し や す い こ と を 示唆 し た 。
s2 = amb ( 1 )
こ こ に a, b は定数で あ る 。 こ の 式 の 両辺の対数 を と れ ば log(s2) = log(α) + b log(m) ( 2 ) し た が っ て , log(s2) と log( m) の 聞 に 直線関係 が成立す る 。 こ の 関係 は Taylor's power law と 呼 ばれて き た 。 一方, 京都大学 の IWAO (1968) は 次 式 が理論 的 か つ 経 験的 に成立 し や す い こ と を 示唆 し た 。
S2 ニ ( α + l) m + (β - l) m2 ( 3 ) こ こ に α と β は定数で あ る 。 平均 こ み あ い 度 m* ( = m + s2/m - l) を 用 い る と 上式 は m* と m の 聞 の 直線関係 に 帰着す る o
22
m* = α + ßm ( 4 ) こ の 関係 は Iwao's m* - m 回 帰 と 呼 ば れ て き た 。 ( 1 ) 式 と ( 3 ) 式 は相容れ な い 関係 に あ る た め , 一方が正 し け れ ば他方 は 間違 っ て い る こ と に な る 。 ど ち ら の 式の方が デー タ に よ く 当 て は ま る か に つ い て , 今 ま で に 多 く の論 争が行わ れて き た 。 現在で は ( 1 ) 式の方が全般 に 当 て は ま り が よ い こ と がわ か っ て い る 。 図-1 は 静 岡 県 柑橘試 験場で行われた ミ カ ン ハ ダニ の調査デー タ に 当 て は め た 例であ る 。 こ の例の場合 も ( 1 ) 式 の方が ( 3 ) 式 よ り も 当 て は ま り カま よ い 。
( 3 ) 式 は, コ ロ ニ ー の平均サ イ ズ が常 に 一定であ り , かつ, コ ロ ニ ー数が増加す る 際 に コ ロ ニ ー の 空間分布が 常 に fk 一定 の 負 の 二項分布J に 従 う と い う モ デ ル を 想 定 す れ ば 導 く こ と が で き る (IWAO, 1968 ; IWAo and KUNO, 1971) 。 一方, ( 1 ) 式が成立 す る 理 由 に つ い て は 長 ら く 不明 で あ り , 1990 年頃 に は こ れ は 「現代生態学 に お け る ミ ス テ リ ー の一つ」 と 言わ れ て い た 。 し か し , 現在で は ( 1 ) 式が成立す る 仕組み も 一応 は理解す る こ と が可能で あ る 。 す な わ ち , コ ロ ニ ー の サ イ ズ が可変的で あ り , 個体群が増殖す る 際 に 各 コ ロ ニ ー の 空間的広が り が相対生長 的 に 一定倍 に 大 き く な る と い う モ デル を想定 す れ ば導 く こ と が で き る (YAMAMURA, 2000) 。 た だ し , い ずれの モ デル も ま だ野外で十分 に 実 証 さ れた こ と は な
長 さ , 重量, 葉面積の よ う に O を 下限値 と す る デー タ の場合 に は , 個体数の場合 と 同様 に O の近傍で分散が小
5
4
3
2
logぷ,,') 1
。
2 - 1 0 2 3
loglO (m)
図 ー 1 不等分散性の例. ミ カ ン ハ ダニ の 木 当 た り 個体数
に 関 す る 平 均 分 散 関 係. ( 1 ) 式 の 推 定 式 : S2=
8 . 234 m1・62' (R' = O . 982). ( 3 ) 式 の 推 定 式 : ♂ = 1 . 554 m + 3 . 415m' (R' = O . 965).
さ く な る 傾 向 が あ る 。 こ の た め , 大 ま か に は ( 1 ) 式 や ( 3 ) 式が成立す る と 期待で き る で あ ろ う 。 し た が っ て , こ れ ら の式のパ ラ メ ー タ ー を推定す る こ と に よ り , 後述 の よ う に 最適 な変数変換式 を 決定す る こ と がで き る 。 た だ し , パ ラ メ ー タ ー を 最小二乗法で推定す る 際 に は や は り 等分散性 の仮定が必要 と な る 。 一般 に log(s2) の 分 散 に 関 し て は等分散性が成立 し や す い。 こ の た め , パ ラ メ ー タ ー は log(s2) に 関 す る 最小二乗法 を 使 っ て 求 め る の が妥 当 と さ れ て い る (TAYLOR et al., 1978 ; PERRY,
1981 ; KUNO, 1991)
0
( 1 ) 式 の 場 合 に は log(s2) は log (m) と 直線関係 に あ る た め 直線回帰 を 用 い て パ ラ メ ー タ ー を推定 す る こ と がで き る 。皿 変数変換式の決定法 1 : Taylor 展 開近似 平均 と 分散の 聞の 関数関係が事前 に わ か っ て い る 場合 に は . Taylor 展 開近似 に も と づ い て 変数変換式 を 決定 す る こ と が で き る 。 い ま , も と の 変 数 の 分散 S2 が平均 m の 関 数 g( m) で表 さ れ る と す る 。 変数変換式 を f(x) と す る と , 変換後 の 分散 V[j(x)] は近似的 に 次式 で与 え ら れ る 。
V[j(x)] :::: [j'( m))2g( m) ( 5 ) こ こ に f'( m) は 関数 f(x) の x = m に お り る 1 階微分値 であ る 。 こ の近似法 は 「 デル タ 法j と 呼 ばれて お り , 推 定値の分散 を推定す る 際の 定石 と し て頻繁 に使用 さ れて い る 。 い ま の 目 標 は推定値 の分散 を推定す る こ と で は な く , 変数変換後 の 分 散 V[j(x)] が一定 に な る よ う な 関 数 f(x) を 見 つ け る こ と に あ る 。 そ こ で, ( 5 ) 式 の 左辺 を定数 ωZ と お い て 変形 し f(x) を 逆算 し て 求 め て み る 。 す る と 次の よ う な 結果が得 ら れ る 。
f(x) =
f指命
( 6 )こ の 方法 を ( 1 ) 式 の Taylor's power law に 適用 し て み よ う o g(x) = axb を ( 6 ) 式 に 代入 し て 積分 を 実行 す れ ば f(X) = X1-b/2 ( b 宇 2)) ( 7 ) f(x) = ln(x) ( b = 2)J
w は 変換 の 効果 に 関係 し な い の で, こ こ で は 無視 し で あ る 。 こ の 式 か ら , 対数変換 ln(x) が最適 な の は b = 2 の場合であ り , 平方根変換 !x ( つ ま り f勺 が最適 な の は b = l の場合で あ る こ と がわ か る 。 図-1 の ミ カ ンハ ダニ の場合 に は b = 1 . 625 で あ っ た か ら ( 7 ) 式 に よ れ ば f(X) = XO.19 が最適で あ る こ と に な る 。
W 変数変換式の決定法 2 : 比率デー タ の場合
実験の 結果が比率で与 え ら れ る 場合 も 多 い で あ ろ う 。 例 え ば, 殺虫剤試験 の 結 果, n 匹 の 昆 虫 の う ち r 匹 が
死亡 し た , と い っ た 場合 に は死亡率 x = r/n が問題 と な る 。 こ の 場合 Z に は O と 1 と い う 下 限値 と 上 限値 の 両 方が存在す る た め , こ の両端で分散が小 さ く な り や す い は ずで あ る 。 し た が っ て 分散 は ( 1 ) 式や ( 3 ) 式で は表現 す る こ と がで き な い。 も し , 死亡確率 が n 匹 の 見 虫 に お い て 一 定値 ρ で あ る な ら ば r の分布 は 二項分布 と な る 。 し た が っ て , 観察 さ れ た 死亡率 Z の 分散 S2 は 二項 分布 の性質 に よ り ρ(1 - ρ) /n で与 え ら れ る こ と に な る 。
し か し , 死亡確率 は個体 に よ っ て 変動す る た め , 実際の 分散は し ば し ば p(l - ρ)/n よ り も 大 き く な る 。 こ の よ う な 状態 は overdispersion と 呼 ば れ て い る 。 そ こ で, よ り 一般 的 に 分散 が p(l - ρ) /n に 比例 す る と 考 え て み よ う 。 す な わ ち ,
S2 = ゆ(1 - ρ) /n ( 8 )
こ こ に ゆ は dispersion parameter と 呼 ばれ る 係 数 で あ り , 多 く の場合 は 1 以上の値 を と る と 期待 さ れ る 。 ゆ が 一定 に保た れ る と い う 保証 は な い の だが, 使宜上 こ の よ う な 関係 を 仮定 す る の が普通 で あ る 。 こ の と き g(x) = øx(1 - x)/n を ( 6 ) 式 に代入 し て 積分 を 実行 す れ ば, 最 適 な変数変換式 と し て 次式 を 導 く こ と がで き る 。
f(x) =sin-I /X ( 9 )
こ の 変数変換式 は 「逆正弦変換J r ア ー ク サ イ ン 変換J あ る い は 「角変換」 と 呼 ばれて い る 。 変換後の分散 は,
ラ ジ ア ン 尺度 で は近似的 に ゆ/(4 n) と な る 。 分散式がサ ン プル数 n を 含 む た め , n が一定 で な い 場 合 に は 等 分 散性が満た さ れな い 。 し た が っ て , サ ン プル数が試験区 に よ っ て 大 き く 異 な る 場合 に は, 分散の逆数で重み づ け る 方式, つ ま り n で重 み付 け た 「重 み 付 け 最小二乗法」
を逆正弦変換後の値 に 適用 す る 必要があ る 。 重み付け最 小二乗法 は 多 く の統計解析 ソ フ ト ウ エ ア で実行す る こ と がで き る で あ ろ う 。
V 変数変換式の決定法 3 : Box-Cox 変換 Taylor 展開近似法 を 用 い る た め に は事前 に 平均 と 分 散の 関係式がわ か っ て い な い と い け な い 。 一方, 事前 に 平均分散関係がわ か っ て い な い場面で も 使用 で き る 変換 方式 と し て Box-Cox 変換が挙 げ ら れ る 。 こ の 変換で は
( 7 ) 式 と 同様 に べ き 乗型の変換 を想定す る 。 fパ仰刈(ωωZd)
」f子戸1立1
(附件刷刷0ω)f(x) = ln(x) (À = Oω) J
(10) ( 7 ) 式 で は 二 つ の 式 は b = 2 の 周 り で不連続 で あ る の に 対 し , (10) 式 で は 二 つ の 式 は À = O の周 り で連続 す る よ う に 修正 さ れ て い る 。 Box-Cox 変換 で は 「変数変換 を 行 っ た 結果, 誤差が等分散正規分布 に な っ た 」 と 仮定 し
て , rべ き 係 数 ÀJ を 最尤推定 法 に よ り 求 め る 。 そ の た め に , ま ず元 の デ ー タ x か ら 次 の よ う な 試 行 デ ー タ H を作成す る 。
xA - 1
y = ÀGAオ ( 1 1 )
こ こ に G は x の 幾何平均 で あ る 。 こ の 試行 デ ー タ g に 関 し て 分散分析 を行 い 残差平方和 を 計算 す る 。 様々 な A に 関 し て こ の分散分析 を 行い , 得 ら れた 残差平方和 を比 較す る 。 そ し て , 最 も 残差平方和が小 さ く な る よ う な A の 値 を 試行錯誤的 に 見 つ け れ ば, そ れ が A の 最尤 推 定 値 に 一致す る ( Box and Cox, 1964) 。 表ー1 の デ ー タ に こ の 方法 を適用 す る と , 最 も 残差平方和 を 小 さ く す る A 値 は 0 . 048 で あ っ た ( 山 村, 1993 a) o À = - 0 . 048 は ほ と ん ど À = O に 近 い の で, 事実上 は 対数変換が推薦 さ れ る 。 実際 に は こ れ ほ ど正確 に A を 決定 す る 意味 は な し 0 . 2 程度 の 間 隔 で探索 す れ ば十分で あ ろ う 。 0 . 5 間 隔で十分だ と す る 意見 も あ る 。 な お , 統計解析 ソ フ ト ウ エ ア の JMP を 用 い れ ば 自 動的 に 最適 な A を 探索 し て く れ る (SAS, 2000)
0
GLIM や S-PLUS に も 同 様 の マ ク ロ や 関 数 が 用 意 さ れ て い る (AITKIN et al., 1989 ; V�;NABLES and RIPLEY, 1999) 。VI f(x + O . 5) 型変換の す す め
デー タ の 中 に O が含 ま れて い る 場合 に は対数変換 を 実 行す る こ と がで き な い し , Box-Cox 変換 も 実行 す る こ と が で き な い。 こ の 場 合, 対 数 変 換 に お い て は ln(x + 1) と い っ た 形 の 変換が伝統的 に 採用 さ れ て き た 。 し か し , x に 1 を 足す の が よ い と い う 理屈 は存在 し な い。
Box and Cox (1964) は (10) 式 の 右 辺 の Z を (x + c) で 置 き 換 え た 修正式 を 提 案 し , 最適 な 定 数 C の 値 を 最 尤 推定法で求 め る こ と を 示唆 し た 。 し か し , こ の点 に 関 し て は Box and Cox (1964) は楽観的す ぎた と 言 え る 。 例 え ば対数変換後 に 正確 に 正規分布 に 従 う ケ ー ス を考 え る と , c の 最尤推定値 は 元 デ ー タ Z の 中 の も っ と 小 さ な デー タ 値 の 負値 に 一致 し て し ま い, ま と も な推定値 に は な ら な い の で あ る (HILL, 1963 : 丹後, 2000) 。
O デー タ を 扱 う こ と がで き な い の は, べ き 乗型変換が 内在す る 仮定 を デー タ が満た し て い な い た め だ と 解釈す る こ と がで き る 。 対数変換や平方根変換な ど の べ き 乗型 変換 は, 0 か ら 遠 い部分 の 変動 を圧縮 し , 0 に 近 い 部 分 の変動 を 引 き 延 ばす性質があ る 。 そ の 引 き 延 ば し効果 は x が O に 近づ く に つ れ て 大 き く な る 。 し た が っ て , こ れ ら の べ き 乗型変換 は , 図-2 の 曲線 に 示 さ れ る よ う な (0,
∞) の定義域 を 持つ 連続分布 に 適 し た 方法 で あ る と い え る 。 と こ ろ が, 個体数 な ど の デ ー タ の分布 は {O, 1 , 2, …}
一一一 24 一一一
分析 に 用 い る 場合 に は 0 . 5 で は な く 0 . 5X 10-6 を 足 し て か ら 対数変換 を 行 う 必要 が あ る 。 も し こ こ で 0 . 5 を 足 し て対数変換 を行 う と , 3 ト ラ ッ プ間 の 差 の 有意確率 は P
= 0 . 283 と な り , 無変換の場合の 有意確率 と 一致 し て し ま う 。 0 . 5 を個体数 自 体 で は な く 平均値 に 足 し て か ら 対 数変換 を 行 う と , こ の よ う に 一般 に 変数変換の効果が薄 れて し ま う こ と が証明 さ れ る 。
推定検定 に 用 い ら れ る モ デル は, 多 く の場合 「誤差成 分」 と 「系統成分」 と 呼 ばれ る 成分か ら な っ て い る 。 本 稿では誤差成分 に の み注 目 し , 誤差成分が等分散性 を 満 た す よ う な変数変換 を 考 え て き た 。 し か し , 変数変換 に は一般 に も う 一つ の重要 な 役割があ る 。 そ れ は 系統成分 に 関 し て 「相加性 を 満 た す j と い う 役割 で あ る 。 例 え ば 要因がか け 算の形で作用 す る 場合 に は , 対数変換 を 採用 す れ ば要因の効果 は 足 し 算 の 形で表現す る こ と がで き る た め , パ ラ メ ー タ ー の解釈が容易 に な る 。 生命表 の key -factor /key-stage 分析で は こ の 理 由 か ら 対数変換が採 用 さ れ て き た ( 山 村, 2001) 。 と こ ろ が, 要 因 が 足 し 算 の形で作用 す れ ば, 各要因 に 付随す る 誤差 も 足 し 算 の 形 で作用 す る た め , 等分散性が満た さ れや す い と い う 性質
変数変換後の分散
「系統成分j への影響 四
4
3
2.5 3.5
と い っ た値 を と る 離散分布で あ る 。 そ こ で, ま ず離散分 布 を連続分布 に近づ け て や る 方が よ い。 そ の た め に は 図 -2 の 右図 に 示 さ れ る よ う に , 離散分布 を 0 . 5 だ け 右 に ず ら せ ば よ い で あ ろ う 。 こ の こ と か ら , 一般 に べ き 乗型 の 変数変換 で は f(x + 0 . 5) 型 を 用 い る の が よ い と 予想 さ れ る 。 た だ し , 0 . 5 は最大の移動幅で あ り , 最適 な値 は O と 0 . 5 の 間 に あ る と 期待で き る 。
図-3 は ln(x + c) と い う 変数変換式 に お い て , 定数 C を 様々 に 変 え て , そ の 効 果 を 計 算 し た も の で あ る (YAMAMURA, 1999)
0
x の 分布 と し て は 負 の 二項分布 を 仮定 し , 平均分散関係 に つ い て は, 対数変換が最適 と な る s2 = m2 と い う 形 を 仮定 し で あ る 。 ま た , 比較 の た め に , 連続分布であ る ガ ン マ 分布の場合の効果 を破線で示 し で あ る 。 ガ ン マ 分布の場合 に は変換後の分散 は ほ と ん ど一定 に保た れて お り , 変換の効果が極 め て 高い。 こ れ は べ き 乗型変換が連続分布 に 適 し て い る こ と を例示 し て い る 。 定数 C の効果 に つ い て 比較す る と c = l の 曲線 よ り も c = 0 . 5 の 曲線の 方が水平 に 近い。 す な わ ち c = 0 . 5 の方が等分散化 の効果 に お い て優れて い る 。 同様の計算 を 行 え ば, 平方根変換や そ の他のべ き 乗型変換 に つ い て も 0 . 5 を 足 す の が妥 当 で あ る こ と を例示す る こ と がで き る (YAMAMURA, 1999) 。 た だ し , 逆正弦変換の場合 な ど に は こ の方式 は使用 す る こ と は で き な い 。図-2 は Z の離散幅 の 半分 を 定 数 と し て 足 す べ き で あ る こ と を意味 し て い る 。 し た が っ て , 例 え ば も し 測定が 0 . 1 単位で行わ れた な ら ば, x に 0 . 1 の半分であ る 0 . 05 を足 し て か ら 変換 を 行 う 必要が あ る 。 平均値 に 関 し て 分 散分析 を 行 う 場合 に も , こ の 点で注意 し な ければな ら な い。 例 え ば, 表-1 の そ れ ぞ れ の ト ラ ッ プが 106m2 の 有 効誘引 面積 を持つ と 仮定 し よ う 。 「有効誘引面積 1 m2 当 た り の 個体数」 は 表 1 の 各 数値 を 106 で割 る こ と に よ り 与 え ら れ る 。 こ の 「有効誘 引 面積 1 m2 当 た り の個体
数」 の場合 は 離散幅が 10-6 で あ る た め , こ の 値 を 分散 2
200 1 00
変数変換前の平均
図 - 3 対 数 変 換 ln(x + c} に お り る 定 数 C の 効 果. 実 線 の 曲 線 は s2 = m2 の 関 係 に 従 う 負 の 二項 分 布 の 場 合. 破線 は 同 じ 関係 に 従 う ガ ン マ 分 布 の 場合. 曲 線の横の数値 は 計算 に 用 い ら れた c 値 を 示す.
1 50 50
。
。
o 2 3 0.5 1 .5 2.5 3.5
図 - 2 {O, l, 2, … } で定義 さ れた 雌散分布 を (0, ∞) で定義 さ れた 連続分布で近似す る 方 法. 左 図 : 何 も 足 き な い 例. 右 図 : 0 . 5 を 足 す こ と に よ り 近似 が 向 上 し た 例.
があ る 。 こ の た め , 相加性 を 満た す た め の変換 と 等分散 性 を 満 た す た め の 変換 は し ば し ば一致 す る と 期待 で き る 。 こ の現象 を 逆 に 利 用 し て , Box-Cox 変換で等分散 性 を 満 た す変換 を 見つ げ る こ と に よ り , そ の事象が発生 す る 仕組 み を 推論 す る こ と も で き る 。 例 え ば, 表-1 の 個体数の例の よ う に 対数変換が最適で あ る と 判定 さ れた 場合 に は, そ の事象 は生存率や増殖率 な ど の 要因 の か け 算の形で決定 さ れて い る と 大雑把 に は 予想す る こ と がで き る 。 ま た , 逆数変換 f(x) = x-1 が最 適 で あ る と 判 断 さ れた 場合 に は, 逆数値が事象の発生 を 決定 し て い る と 大雑把 に は 予想す る こ と がで き る 。 例 え ば工業製品が故 障す る ま での時聞 を解析 す る 際 に Box-Cox 変換 に よ り 逆数変換が選 ばれた場合 に は, 故障 ま での時間の逆数つ ま り 「単位時間 当 た り の故障確率」 に よ っ て 事象が決定 さ れて い る と 予想す る こ と がで き る 。
咽 変数変換 を 行 う べ き で な い場面 等分散性 を 満た す た め の変数変換 と 相加性 を 満た す た め の変数変換が一致 し な い と い う 場面 も 考 え ら れ る 。 こ の場合, 変数変換 を行 う 代わ り に 「一般化線型モ デル」
の枠組みで取 り 扱 う の が有効であ る 。 一般化線型モ デル では誤差成分 と 系統成分 を 別々 に モ デル化 し , パ ラ メ ー タ ー を 最尤推定 に よ り 求 め る (DOBSON, 2002) 。 例 え ば,
誤差成分 に は ポ ア ソ ン分布 を仮定 し , 系統成分 に は対数 レ ベ ル で線型モ デル を仮定す る , と い っ た 具合で あ る 。
ま た , 変数変換前の元の ス ケ ー ル で議論 を行わ な け れ ばな ら な い場面 も 考 え ら れ る 。 例 え ば収穫果数 を収益 に 換算 し た い場合 に は, た と え Box-Cox 変換 に よ り 対数 ス ケ ー ルが選 ばれた と し て も , 変換前の ス ケ ー ルで収益 に 換算す る 必要が あ る で あ ろ う 。 と こ ろ が変換後の ス ケ ー lレで求 め た 平均値 を逆変換 を 用 い て 元の ス ケ ー ル に戻 し で も , そ れ は元の ス ケ ー ル に お け る 平均値 と は異 な っ た も の と な っ て し ま い, そ の意味づ 砂 が不明瞭 と な る 。 逆変換 に 伴 う バ イ ア ス を 修正 す る こ と も 可能 で は あ る が, そ の場合 に も 依然 と し て 問題が残 る 。 こ の よ う に 変 数変換前の ス ケ ー ル で議論す る 必要があ る 場合 に も , 変 数変換 を 行わ ず に , 一般化線型モ デルの枠組みで推定検 定 を行 う の が よ い と 思わ れ る 。 誤差成分 と し て は , 分散 が平均 の 二乗 に 比例す る 場合 に は 変動係数 (CV) 一定 の ガ ン マ 分布, 分散が平均 と 等 し い場合 に は ポア ソ ン分 布 を仮定す る こ と がで き る 。 ま た , 比率の場合 に は二項 分布 を仮定す る こ と がで き る 。 た だ し , 二項分布や ポア
あ る ( 山 村, 1999 : HURLBERT, 1984) 。 一 般 化 線 型 モ デ ル を 用 い る 際 に は, SAS な ど の overdispersion に 対応 し た 統計解析 ソ フ ト ウ エ ア を 用 い る 方が よ い で あ ろ う 。
E ノ ンパ ラ メ ト リ ッ ク 検定法の誤用 本稿で は変数変換 に つ い て 解説 し て き た が, 変数変換 で頭 を悩 ま せ な く て も ノ ン パ ラ メ ト リ ッ ク 検定法 を 使 え ば片が付 い て し ま う の で は な い か , と 批判す る 人 も い る か も し れ な い 。 し か し , ノ ンパ ラ メ ト リ ッ ク 検定法が使 用 で き る 実験計画 は 主 と し て 一元配置 の 実験 に 限 ら れて い る 。 こ の た め , ノ ンパ ラ メ ト リ ッ ク 検定法 を使 う 場合 に は, 実験計画の も っ さ ま ざ ま な情報 を 有効利用 で き な い場合 も あ る 。 ま た , 最近 し ば し ば指摘 さ れて き た よ う に 「 ノ ン パ ラ メ ト リ ッ ク 検定 で は等分散性が成立 し て い な く て も よ い J と い う 考 え 方 も 正 し く な い (KASUYA,
2000) 。 例 え ば, 2 グ ル ー プ (A, B) か ら 4 サ ン プル を と っ て 平均値 を比較す る 場面 を 考 え て み よ う 。 両 グ ル ー プ と も に 真 の 平均値 は 5 と し , A グ ル ー プ は 分散 0, B グルー プ は 分散 l の正規分布 に 従 う と す る 。 乱数 を発生 さ せ る と 例 え ば次 の よ う な 結果が得 ら れ る 。
A グル ー プ 5 . 0 5 . 0 5 . 0 5 . 0 B グル ー プ 6 . 047 5 . 329 5 . 425 5 . 588
こ こ で ノ ンパ ラ メ ト リ ッ ク 検定 法 の 一種で あ る Wi1cox.
on の 順位 和 検 定 (Mann-Whitney の U 検 定) を 用 い る と , こ の よ う な デ ー タ が生 じ る 正確 な 有意確率 は P
= 0 . 0286 で あ り , 5%水準 で有意 と な っ て い る 。 と こ ろ が, 今の例の よ う に B グ ル ー プ の す べ て の観測値が A グルー プの そ れ ら よ り も 大 き い ( あ る い は小 さ い ) と い う 結果が得 ら れ る 確率 は (0 . 54)X 2 = 0 . 125 で あ る か ら , 実際に は 5% で は 有意差が 出 て は な ら な い の で あ る 。 も と も と ノ ンパ ラ メ ト リ ッ ク 検定 で有意差が出 た と き に 言 え る の は, 上の例で は 「二つ の グル ー プが同 じ母集団か ら 採 ら れた も の で は な い J と い う こ と であ る 。 し か し , 結果 を解釈す る と き に , そ の よ う に 解釈 さ れ る こ と は あ
ま り な い。 多 く の 場合 rs は A よ り も 有意 に 大 き い J と 解釈 し て し ま う 。 と こ ろ が, そ の よ う な解釈が成立す る た め に は 「二 つ の 集 団 の 分布のバ ラ ツ キ は 等 し い 」 と い っ た 前提 を 追加 し な け れ ばな ら な い の で あ る 。 そ の意 味で は, ノ ンパ ラ メ ト リ ッ ク 検定法 も し ば し ば誤用 さ れ て い る と い え る 。
お わ り に
ソ ン分布 を仮定 す る 場合 に は 先 述 の よ う に overdisper. 事前 に 等分散性の検定 を 行 っ て 等分散性が棄却 さ れた sion が生 じ る こ と が多 く , 不用意 に 用 い る と pseudore. 場合 に の み変数変換や ノ ン パ ラ メ ト リ ッ ク 検定法あ る い plication と 呼 ばれ る 誤 っ た 検定 法 に お ち い る 可能性が は rWe1ch ANOVAJ を 用 い る と い う 手順 を 推 薦 し て
一一一 26 一一一
い る 教科書があ る 。 し か し , こ の手順 に は大い に 問題が あ る よ う に 思わ れ る 。 統計的検定 に 一般 に 言 え る こ と で あ る が 「統計的 に有意であ る 」 と い う こ と と 「 そ れが有 意義な差であ る j と い う こ と は別 で あ る 。 統計的 に 分散 が有意 に 異 な っ て い た と し て も , そ の差が小 さ け れ ば等 分散性が満た さ れ て い る と 考 え る 必要が あ る 。 逆 に , 統 計的 に 有意差 が な か っ た と し て も , そ れ は 単 に サ ン プル 数が少 な い た め に検出 で き な か っ た だ け か も し れ な い。
し た が っ て , こ れ を 根拠 に 「等分散で あ る J と み な し て 分散分析 を始 め る わ け に も ゆ か な い。 結局, 事前 に 等分 散性の検定 を行 っ て 有意差が 出 た 場合 も 出 な か っ た 場合 も , い ず れ の場合 も 確実 な 判 断 を く だ す こ と は で き な い。 そ の意味で, 等分散性 の事前検定 は論理的 に か な り 混乱 し た 手順だ と い え る であ ろ う 。 こ の 問題 に 関連 し て Box (1953) は 次の よ う に述べて い る 。 iTo make the preliminary test on variances is rather like putting to sea in a rowing boat to find out whether conditions are su伍ciently calm for an ocean liner to leave port !J
デー タ が下限値や上限値 を 持つ場合 に は, そ の境界値 の付近では一般 に 分散が小 さ く な り や す い た め変数変換 が必要 と な る 。 し か し , 逆 に い え ば, 境界値か ら 離れた 領域 で比較的狭 い 範 囲 で デ ー タ が変動 し て い る 場合 に
A - F ・ ・‘ . 、 - E ' ' w
… ょ
…
… だ
…
… 央
… 一 中
…
0農薬登録保留基準の改正 に つ い て
環境省 は, 平成 14 年 8 月 29 日 付 け で 「農薬登録保留 基準」 を改正 し , 公布 日 か ら 適用 し た 。
1 . 作物残留 に 係 る 農薬登録保留基準
イ ン ド キ サ カ ル ブ MP 剤 (殺 虫 剤 : ト ル ネ ー ド ) い ち ご : 1 ppm, ピ ー マ ン : 1 ppm, ト マ ト : 0 . 5 ppm,
な す : 0 . 5 ppm, さ や 付未成熟豆類 : 1 ppm, 第一葉菜 類 : 1 ppm, だ い こ ん の葉 : 5 ppm, ブ ロ ッ コ リ ー : 0 . 2 ppm, レ タ ス : 1 ppm, ね ぎ : 2 ppm, 根 ・ 茎 類 : 0 . 1 ppm, い も 類 : 0 . 1 ppm, 大 豆 : 0 . 2 ppm, て ん さ い : 0 . 1 ppm に è9: め る 。
ク ロ マ フ ヱ ノ ジ ド 淘iJ (殺 虫剤 : マ ト リ ッ ク ) 米 : 0 . 2 ppm, 第一大粒果 実類 : 0 . 1 ppm, 第 二 大粒果実類 : 1 ppm, 小粒果実類 : 1 ppm, 第 一 果菜類 : 2 ppm, 第二 果菜類 : 1 ppm, さ や 付未成熟豆類 : 5 ppm, 第一葉菜 類 : 2 ppm, 第 二 葉 菜 類 : 5 ppm, 根 ・ 茎 類 : 0 . 1 ppm, 大 豆 : 0 . 5 ppm, て ん さ い : 0 . 1 ppm, 茶 : 20 ppm に 改 め る 。
ジ ノ テ フ ラ ン剤 (殺虫剤 : ス タ ー ク ル, ア ルパ リ ン ) 小麦以外の麦 ・ 雑穀類 : 0 . 1 ppm を追加。
ス ピ ノ サ ド 剤 (殺 虫 剤 : ス ピ ノ エ ー ス , カ リ プ ス タ ー) 米 : 0 . 1 ppm, 第一大粒果実類 : 0 . 2 ppm, 第二大 粒 果 実 類 : 0 . 5 ppm, 小 粒 果 実 類 : 1 ppm, 第 一 果 菜 類 : 2 ppm, 第 二 葉 菜 類 : 5 ppm, 根 ・ 茎 類 : 0 . 2 ppm
は, ほ ぽ等分散性が成立 し て い る た め 変数変換の必要 は な い と 期待す る こ と がで き る 。 例 え ば比率 の 場合 に は ρ が 0 . 3�0 . 7 の 範 囲 に 存在 す る な ら ば変数変換 の 必要性 は な い と さ れ る 。 分散分析 を 始 め る 前 に は , 最初 に 手持 ち の デー タ の分散の性質 に つ い て 十分 に 考 え て み る べ き だ と 思わ れ る 。 そ し て そ れ ぞれの デー タ の性質 に 合 っ た 適切 な変数変換法 を探索す る 必要 が あ る 。 本稿が そ の 際 の助 け に な れ ば幸 い で あ る 。
引 用 文 献
1 ) Bo
x,
G. E. P. (1953) : Biometrika 40: 3 18�335.2)
一一一一一一
and D. R. Cox ( 1964) : J. Roy. Stat. Soc. B Met.26 : 2 1 1 �252.
3) DOBSON, A. ]. (2002) : An introduction to generalized linear models. 2nd edn. Chapman & Hall/CRC, London. (第 l 版 の邦訳 は , ア ネ ッ ト J ド プ ソ ン著, 田 中 盤 ら 訳 (993) : 統計 モ デル入門, 共立出版 )
4) I WAo, S. (1968) : Res. Popul. Ecol. 10: 1�20.
5) KASUYA , E. (2001) : Anim. Behav. 61: 1247�1249 6) T A YLOR, L. R. ( 1961 ) :
N
ature 189: 732� 735.7) 山村光司 ( 1993 a) : 植物防疫 47: 370�375.
8) 一一一一一 0993 b) 同上 47 : 423�426.
9) 一一一一一 0993 c) 向上 47: 463�467.
10)
一一一一
(1998) ・ 日 本土壌肥料学雑誌 69 : 649�653 11)---
( 1999) : 向上 70 : 84�8912)
一一一一一
(2001) ・ 植物防疫 55: 389�393.13) Y AMAMURA, K (1999) : Res. Popul. Ecol. 41: 229�234.
14)
一一一一一
(2000) : Popul. Ecol. 42: 161 � 169.に 改め る 。
チ ア メ ト キ サ ム 剤 (殺虫剤 : ア ク タ ラ , ビ ー ト ル コ ッ プ) 米 : 0 . 1 ppm, み か ん : 0 . 5 ppm, み か ん 以 外 の か ん き つ 類 : 0 . 5 ppm, 第一大粒果 実 類 : 0 . 5 ppm, 第 二 大 粒 果 実 類 : 1 ppm, 小 粒 果 実 類 : 5 ppm, 第 一 果 菜 類 : 1 ppm, 第 二 果 菜 類 : 0 . 5 ppm, 第 一 葉 菜 類 : 1 ppm, 第二葉菜類 : 2 ppm, い も 類 : 0 . 5 ppm, て ん さ い : 0 . 1 ppm, 茶 : 15 ppm に 改 め る 。
フ ル フ ェ ノ ク ス ロ ン 剤 (殺虫剤 : カ ス ケ ー ド ) 第一大 粒果実類 : 0 . 2 ppm, 第二大粒果実類 : 1 ppm, 小粒果 実 類 : 2 ppm, 第 一 果 菜 類 : 2 ppm, 第 二 果 菜 類 : 2 ppm, さ や付未成熟豆類 : 1 ppm, 根 ・ 茎類 : 0 . 1 ppm,
大豆以外の豆類 : 0 . 2 ppm に 改 め る 。
ジ チ ア ノ ン 剤 (殺菌剤 : デ ラ ン ) み か ん : 0 . 5 ppm,
み か ん 以 外 の か ん き つ 類 : 5 ppm, 第 一 大 粒 果 実 類 : 0 . 2 ppm, 第二大粒果実類 : 0 . 5 ppm, 小粒果実類 : 0 . 5 ppm, 第二果菜類 : 0 . 5 ppm, 第一葉菜類 : 0 . 5 ppm に 改め る 。
シ モ キ サ ニ ル剤 (殺菌剤 カ ー ゼ ー ト PZ な ど の 一成 分) 第一大粒果実類 : 0 . 1 ppm, 小粒果実類 : 0 . 2 ppm,
第 二 果 菜 類 : 0 . 5 ppm, 第 一 葉 菜 類 : 0 . 2 ppm, 鱗 茎 類 : 0 . 1 ppm, い も 類 : 0 . 1 ppm, 大 豆 : 0 . 1 ppm に 改
め る 。
テ ブ コ ナ ゾー ル 剤 (殺菌剤 : シ ルパ キ ュ ア ) 第二葉菜 類 : 0 . 5 ppm, て ん さ い : 0 . 5 ppm, 茶 : 25 ppm に 改め る 。
(43 ペー ジ に 続 く )