①正規分布モデルが利用できない時
データが少なくて分布が不明
データが離散的で分布を当てはめ難い、などの場合
→ ノンパラメトリック法を用いる
データの数値をそのまま使用せず、順位をつけて、順位数を用いた擬似的な正規分布に より検定する方法
比率の差のχ2検定
t検定 の代わりに Wilcoxsonの順位和検定・U検定 分散分析(ANOVA) の代わりに Kruskal-Wallis順位和検定
Pearson相関係数 の代わりに SpearmanまたはKendallの順位相関係数 パラメーター(平均、分散)で処理できるものをパラメトリック法として区別する
ブートストラップ法とジャックナイフ法について
標本から再サンプリングし、分布のパラメーターを推定する方法
ブートストラップ法は重複を許した同じケース数の復元サンプリングを繰り返す ジャックナイフ法はケースを除きながらサンプリングを繰り返す
②モデルの最適化(最尤推定法と情報量基準)
尤度:観測されたデータの確率モデルへの適合度 各観測データの確率モデルにおける確率の積で計算
最尤推定:尤度を最大にするようなモデル(確率分布)とそのパラメーターを求めること 尤度関数 𝐿 𝜃 = 𝑓 𝑥𝑖 𝜃 を最大にする𝜃を求めること(データ𝑥𝑖は定数扱い)
実際の計算では、両辺の自然対数をとって𝑙𝑛 𝐿 𝜃 = 𝑙𝑛 𝑓(𝑥𝑖|𝜃)
最尤推定は、対数尤度関数を最大(≦0)にする𝜃を求めることと等価 解析的には対数尤度関数を偏微分した式を0とおいて𝜃を求める
モデルが正規分布の場合(𝜃は2つ)、最尤推定値は観測データの平均と分散になる
数値計算的には、Newton-Raphson法、EMアルゴリズム、MCMC法など
参考)ベイズ推定は事前確率を尤度で補正して事後確率を求める
最適モデルの選択:
赤池の情報量基準𝐴𝐼𝐶 = −2 × (𝑙𝑛 𝐿 − 𝑝)、𝑙𝑛 𝐿は最大対数尤度、𝑝は自由パラメーターの数
(平均対数尤度の近似値、尤度とパラメーター数のトレードオフで最適なモデルを評価)
𝐴𝐼𝐶が小さい値を示すほうのモデルを選ぶ 応用例
重回帰式の変数選択、統計モデルの比較、など
③ベイズ推論による臨床診断
Bayesの公式の確率𝑝をオッズ 𝑜 = 𝑝 1−𝑝 にして式を書きかえると
例1:胸痛患者が心筋梗塞である確率
事前確率 0.1(胸痛患者における心筋梗塞の確率)の時、Odds ≒ 0.11
<事前確率の情報がなければ主観的確率でもよい>
所見 LR+
LR-男性 あり 1.3
60才以上 50才 0.8
刺すような痛み なし 1.3
胸壁の圧痛 なし 1.3
ニトログリセン効果 なし 1.1
発汗 なし 0.7
頸動脈の怒張 なし 0.9
第III音聴取 なし 0.9
ECG:ST上昇 なし 0.6
ECG:ST低下 あり 4.5
ECG:非特異的ST変化 なし 1.5
ECG:T波の逆転 あり 2.2
<各LR値はMcGee, Evidence-Based Physical Diagnosisによる>
事前Odds(=0.11)× ∏LR(=9.77) = 1.0747(事後オッズ)
事後確率は、Odds/(1+Odds) = 0.518となる 例2:意識障害が脳病変によるものかそれ以外(代謝性など)か
事前確率0.5とし、血圧が120以下の場合LR-は0.2なので、事後確率は0.17で脳病変は否定的