その他の知識 - PowerPoint プレゼンテーション

データが少なくて分布が不明

データが離散的で分布を当てはめ難い、などの場合

→ ノンパラメトリック法を用いる

データの数値をそのまま使用せず、順位をつけて、順位数を用いた擬似的な正規分布により検定する方法

比率の差のχ2検定

t検定の代わりに Wilcoxsonの順位和検定・U検定分散分析（ANOVA）の代わりに Kruskal-Wallis順位和検定

Pearson相関係数の代わりに SpearmanまたはKendallの順位相関係数パラメーター（平均、分散）で処理できるものをパラメトリック法として区別する

ブートストラップ法とジャックナイフ法について

標本から再サンプリングし、分布のパラメーターを推定する方法

ブートストラップ法は重複を許した同じケース数の復元サンプリングを繰り返すジャックナイフ法はケースを除きながらサンプリングを繰り返す

②モデルの最適化（最尤推定法と情報量基準）

尤度：観測されたデータの確率モデルへの適合度各観測データの確率モデルにおける確率の積で計算

最尤推定：尤度を最大にするようなモデル（確率分布）とそのパラメーターを求めること尤度関数 𝐿 𝜃 = 𝑓 𝑥_𝑖 𝜃 を最大にする𝜃を求めること（データ𝑥_𝑖は定数扱い）

実際の計算では、両辺の自然対数をとって𝑙𝑛 𝐿 𝜃 = 𝑙𝑛 𝑓(𝑥_𝑖|𝜃)

最尤推定は、対数尤度関数を最大（≦0）にする𝜃を求めることと等価解析的には対数尤度関数を偏微分した式を0とおいて𝜃を求める

モデルが正規分布の場合（𝜃は2つ）、最尤推定値は観測データの平均と分散になる

数値計算的には、Newton-Raphson法、EMアルゴリズム、MCMC法など

参考）ベイズ推定は事前確率を尤度で補正して事後確率を求める

最適モデルの選択：

赤池の情報量基準𝐴𝐼𝐶 = −2 × (𝑙𝑛 𝐿 − 𝑝)、𝑙𝑛 𝐿は最大対数尤度、𝑝は自由パラメーターの数

（平均対数尤度の近似値、尤度とパラメーター数のトレードオフで最適なモデルを評価）

𝐴𝐼𝐶が小さい値を示すほうのモデルを選ぶ応用例

重回帰式の変数選択、統計モデルの比較、など

③ベイズ推論による臨床診断

Bayesの公式の確率𝑝をオッズ 𝑜 = ^𝑝 _1−𝑝 にして式を書きかえると

例1：胸痛患者が心筋梗塞である確率

事前確率 0.1（胸痛患者における心筋梗塞の確率）の時、Odds ≒ 0.11

＜事前確率の情報がなければ主観的確率でもよい＞

所見 LR+

LR-男性あり 1.3

60才以上 50才 0.8

刺すような痛みなし 1.3

胸壁の圧痛なし 1.3

ニトログリセン効果なし 1.1

発汗なし 0.7

頸動脈の怒張なし 0.9

第III音聴取なし 0.9

ECG:ST上昇なし 0.6

ECG:ST低下あり 4.5

ECG:非特異的ST変化なし 1.5

ECG:T波の逆転あり 2.2

＜各LR値はMcGee, Evidence-Based Physical Diagnosisによる＞

事前Odds（=0.11）× ∏LR（=9.77） = 1.0747（事後オッズ）

事後確率は、Odds/(1+Odds) = 0.518となる例2：意識障害が脳病変によるものかそれ以外（代謝性など）か

事前確率0.5とし、血圧が120以下の場合LR-は0.2なので、事後確率は0.17で脳病変は否定的

ドキュメント内 PowerPoint プレゼンテーション (ページ 32-36)