• 検索結果がありません。

SNB(superposed naive Bayes)

ドキュメント内 JAIST Repository https://dspace.jaist.ac.jp/ (ページ 116-120)

第 6 章 予測精度と解釈可能性を両⽴した機械学習モデルの提案と評価

6.2. 予測精度と解釈可能性の両⽴

6.3.4. SNB(superposed naive Bayes)

前節のナイーブベイズ・アンサンブル(NBE)は、元のナイーブベイズと⽐較して 予測精度の向上が期待できる⼀⽅、そのトレードオフとして解釈可能性は低下する。

そこで、本博⼠論⽂では、NBEを線形近似して単⼀のナイーブベイズに変換する⽅法、

superposed naive Bayes(SNB)を提案する。すなわち、SNBの構築は、NBEを構築す

る第1のステップと、NBEを線形近似して単⼀のナイーブベイズに変換する第2のス テップからなる2段階アプローチとなる。第1のステップは主に予測精度の向上に寄 与し、第2のステップは主に解釈可能性の向上に寄与する。ナイーブベイズは⼀種の 線形加法モデルであるため、線形近似されたNBEからナイーブベイズへの変換はWoE

図 6.5:WoE の重ね合わせによる SNB の⽣成

(出典:Mori and Uchihira 2019 に加筆)

(weight of evidence)の重ね合わせとして表現できる。図 6.5に、WoEの重ね合わせ によるSNB⽣成のイメージを⽰す。

WoE の重ね合わせを⾏うには、まず、NBEの⾮線形項を線形近似する必要がある。

式(3)と式(4)から、NBEの予測結果は以下にように表される。

𝑃 𝑋 ∑ 𝛽 𝑃 𝑋

, 𝛽

∑ 𝛽 𝑠𝑖𝑔𝑚𝑜𝑖𝑑 𝑐 𝑐 𝑊 𝑋

, 𝛽

∑ 𝛽 𝑠𝑖𝑔𝑚𝑜𝑖𝑑 𝑐 𝑐 ∑ 𝑊 𝑋

∑ 𝛽 6

ここで、線形近似として 𝑠𝑖𝑔𝑚𝑜𝑖𝑑 𝑐 𝑐 𝑊 𝑋 ≅ 𝑎 𝑏 𝑊 𝑋 を仮定すると、

式(6)は SNB の予測結果を表す以下の式に変換できる。

𝑃 𝑋 𝑊 𝑊 7

6.3⾼精度かつ解釈容易な機械学習モデルの構築 117

ただし、

𝑊 ∑, 𝛽 𝑎 𝑏 𝑊 𝑋

∑ 𝛽 , 𝑊 ∑, 𝛽 𝑏 𝑊 𝑋

∑ 𝛽

上記シグモイド関数の線形近似においては、テイラー近似を使⽤する。すなわち、

𝑠𝑖𝑔𝑚𝑜𝑖𝑑 𝑐 𝑐 𝑊 𝑋 の1次近似は、𝑐 の周りのテイラー展開として以下のよ

うに導出される。

𝑠𝑖𝑔𝑚𝑜𝑖𝑑 𝑐 𝑐 𝑊 𝑋 𝑠𝑖𝑔𝑚𝑜𝑖𝑑 𝑐

𝑛! 𝑐 𝑊 𝑋 ≅ 𝑎 𝑏 𝑊 𝑋 8

ただし、

𝑎 1

1 𝑒𝑥𝑝 𝑐 , 𝑏 𝑐 𝑒𝑥𝑝 𝑐

1 𝑒𝑥𝑝 𝑐

式(3)と式(7)の⽐較からわかるように、SNBはナイーブベイズと同じ構造をもっ ている。すなわち、SNB は重ね合わせた WoE である𝑊 𝑖 1, 2, ⋯ , 𝑑 をもつ単⼀の ナイーブベイズとみなすことができる。ただし、SNB の WoE は元のナイーブベイズ のWoEよりもかなり複雑な形状をしており、その複雑さの中に NBEのモデル構造の 特徴が反映されていると考えられる。

図 6.6 は、ナイーブベイズのWoE(上側)と SNBのWoE(下側)を⽐較したもの で あ る 。 そ れ ぞ れ の グ ラ フ を 解 釈 す る と 、 ナ イ ー ブ ベ イ ズ ( 上 側 ) で は 、 LOC_EXECUTABLE < 70ではリスクを低減する⽅向(WoE = -0.5)に作⽤するが、70 付 近を上回ると⼀転、急激なリスク増加因⼦(WoE = 1.5)に切り換わる。⼀⽅、SNB(下 側)では、WoEの値の変化がスムージングされており、LOC_EXECUTABLE > 10辺り から徐々にリスクが上昇していく。そして、WoE = 0の直線と交差する値、すなわち、

LOC_EXECUTABLE = 40付近において、リスク低減傾向(WoE < 0)からリスク増加傾

向(WoE > 0)に緩やかに切り換わる。

図 6.6:ナイーブベイズの WoE と SNB の WoE の⽐較

提案⼿法(SNB)におけるナイーブベイズの集団学習モデルに対するテイラー近似 のアイデアは、Ridgeway et al.(1998)に触発されたものである。主な違いとして、

Ridgeway et al.(1998)はブースティングの結果を集約する結合関数に対してテイラー 近似を適⽤しているが、SNBでは個々のナイーブベイズの予測結果に対するシグモイ ド補正の部分にテイラー近似を適⽤している。また、Ridgeway et al.(1998)はオリジ

ナルの AdaBoost を使⽤しているが、SNB では確率的勾配降下法などを使⽤した拡張

AdaBoostを採⽤することで、さらなる予測精度の向上を実現している。

ドキュメント内 JAIST Repository https://dspace.jaist.ac.jp/ (ページ 116-120)