比較・検定・多重補正
20130319 Kashiwa.R#7
東京理科大学野田キャンパス 薬学部校舎 (14 号館 1411 教室 )
なぜ、今日ここにいるか ?
それでも…
ネットがあればこれくらいできる
統計の専門家
解析の専門家
プログラマー
生物学の専門家
医学の専門家
× ×
× ×
×
なぜ、今日ここにいるか ?
R でデータの比較をする
R でデータの検定をする
これらを調べて行えるように
する
本日の紹介
この化合物の薬理作用の解析しておいて
ヨクキーク R
非投与群 d0 : 100, 94, 102, 97, 89, 101, 105, 98,
97 投与群 d1 : 93, 102, 87, 92, 90, 82, 92
じゃ、細胞にかけてみて
使える関数を調べる
ヘルプを参照
必要な引数
勝手に使ってくれ
る どれか選ぶ
がんばって英語読む
下に使用例、参考文献
統計学的仮説検定の考え方
帰無仮説: 2 群の平均値に差はない。
対立仮説: 2 群の平均値に差がある。
リサンプリング法
1 1
1
A B
C
1 1
1
A B
分布 D
帰無仮説群 1 と群 2 は同じ分布から得る
対立仮説群 1 と群 2 は違う分布から得る
分布 D0 分布 D1
D から得た
d0 D から得たd1
D0 から得た
d0 D1 から得たd1 ( リサンプリン実験
グ )
( リサンプリン実験 グ )
リサンプリング法
1 1
1
A B
C
分布 D
帰無仮説群 1 と群 2 は同じ分布から得る
D から得た
d0 D から得たd1 ( リサンプリン実験
グ )
分布の結合
c(d0, d1) リサンプリングsample(size = …) for()
偽サンプル平均がオリジナ ルの差より大きい確率
p = 0.02321
= オリジナルの差は、分布 が同一の場合、 2.3% の確 率で生じる。
マウス 1 : 80, 73, 80, 82, 74
マウス 2 : 73, 68, 81, 85
マウス 3 : 85, 93, 88
じゃ、マウスに投与してみて
何をどう比較する ?
(3 つのなかで少なくともひとつは差がありそ
う… )
対立仮説少なくとも 1 つは他と差がある 帰無仮説3 つのマウスには差がない
一元配置分散分析 (ANOVA)
( マウス 3 に対して 1 も 2 も差がありそう… )
対立仮説1 と 3 に差がある または 2 と 3 に差 がある
帰無仮説1 と 3 に差がない かつ 2 と 3 に差が ない
対比較 (t 検定 ) の繰り返し
対立仮説 A と B に差がある または A と C に差がある または B と C に
差がある
帰無仮説 A と B に差がない かつ A と C に差がない かつ B と C に差が
ない
U
1 回検定なら有意水準 α
3 回検定なら有意水準 α より集合が大 きい
多重補正は ? t 検定繰り返
し
後から補正 p.adjust
分散の均一性を仮定するパラメトリックな 検定
分散の均一性を仮定しないノンパラメトリック な検定
対比較を繰り返す検定
R は各種検定を取り揃えているが、
どんな検定を使えばいいかには答えてくれな
い !!
U
対立仮説 A と B に差がある かつ A と C に差がある かつ B と C に
差がある
帰無仮説 A と B に差がない または A と C に差がない または B と C
に差がない
1 回検定なら有意水準 α
3 回検定でも有意水準 α より集合が小 さい
多重補正は常に必要か
対立仮説
に応じて計算を変える。
リサンプリング法
分布 D
帰無仮説A と B と C には差がない 他
( リサンプリン実験 グ )
分布の結合
c(d0, d1) リサンプリングsample(size = …) for()
偽サンプルがオリジナルの 差より大きい確率
U
マウス 1 : 80, 73, 80, 82, 74
マウス 2 : 73, 68, 81, 85
マウス 3 : 85, 93, 88
じゃ、マウスに投与してみて
じゃ、薬物動態調べておいて
じゃ、実際に効くか調べておいて
まとめ
検定手法はほとんど準備されている。
調べてその手法にたどり着くか。
一般的な手法を使うのが理由付けが楽で手間も少ない。
R に使われるのではない。 R を使う。
仮説の設定は自分。
返ってくるのは数値だけ。解釈するのは自分。
R を使っている人を使う ( 統計も技能も ) 。
質問、 Rjpwiki 、ブログ、 etc…
拡散方程式と可視化 主成分分析 外れ値検出 形態素解析 ネットワーク分析
機械学習と予測 作図 シミュレーション 線形計画法
アニメーション 数理モデル