• 検索結果がありません。

モデルの選択と評価

N/A
N/A
Protected

Academic year: 2021

シェア "モデルの選択と評価"

Copied!
29
0
0

読み込み中.... (全文を見る)

全文

(1)

Lec12

モデルの選択と評価

(2)

過学習(再掲)

パラメータ数が多いと過学習が起こる

パラメータ数=1 パラメータ数=2

パラメータ数=4 パラメータ数=5

(3)

過学習(再掲)

パラメータ数が多いと過学習が起こる

パラメータ数=10 パラメータ数=20

パラメータ数=40 パラメータ数=50

(4)

過学習を抑制するためのアプローチ

アプローチ1:特徴選択

特徴数が少な過ぎる:未学習

特徴数が多過ぎる :過学習

モデル選択:適切な特徴数を選択する

アプローチ2:正則化

正則化パラメータが大き過ぎる:未学習

正則化パラメータが小さ過ぎる:過学習

モデル選択:適切な正則化パラメータを選択する

(5)

モデルの選択と評価

適切なモデル選択をするには適切なモデル評価の基準が必要

訓練データに対する誤差vs. 真の関数に対する誤差

−3 −2 −1 0 1 2 3

0.00.10.20.30.40.50.6

Model Complexity

Errors on Data / Truth

−3 −2 −1 0 1 2 3

0.00.10.20.30.40.50.6 Error on Data

Error on Truth

訓練データに対する誤差をモデルの選択や評価には使えない!

(6)

学習と理解・予測

母集団

旧データ(訓練) モデル 新データ

学習 予測

理解

(7)

旧データと新データ

旧(訓練)データ 新データ

−1.0 −0.5 0.0 0.5 1.0

−1.0−0.50.00.51.0

x

y

−1.0 −0.5 0.0 0.5 1.0

−1.0−0.50.00.51.0

True Old Data

−1.0 −0.5 0.0 0.5 1.0

−1.0−0.50.00.51.0

x

y

−1.0 −0.5 0.0 0.5 1.0

−1.0−0.50.00.51.0

True New Data

(8)

旧データと新データ

旧(訓練)データ 新データ

−1.0 −0.5 0.0 0.5 1.0

−1.0−0.50.00.51.0

x

y

−1.0 −0.5 0.0 0.5 1.0

−1.0−0.50.00.51.0

−1.0 −0.5 0.0 0.5 1.0

−1.0−0.50.00.51.0

True Old Data Estimated

−1.0 −0.5 0.0 0.5 1.0

−1.0−0.50.00.51.0

x

y

−1.0 −0.5 0.0 0.5 1.0

−1.0−0.50.00.51.0

−1.0 −0.5 0.0 0.5 1.0

−1.0−0.50.00.51.0

True New Data Estimated

(9)

訓練誤差と汎化誤差

旧(訓練)データに対する予測誤差:

訓練誤差(Training Error)

新データに対する予測誤差:

汎化誤差(Generalization Error)

(10)

特徴選択の場合

特徴数が少な過ぎる:未学習

特徴数が多過ぎる :過学習

0 20 40 60 80 100 120

0.00.10.20.30.40.50.6

Number of Selected Features

Training/Generalization Error

0 20 40 60 80 100 120

0.00.10.20.30.40.50.6 Error on Old Data Error on New Data

選択特徴数と訓練誤差・汎化誤差の推移

(11)

正則化の場合

正則化パラメータが大き過ぎる:未学習

正則化パラメータが小さ過ぎる:過学習

−3 −2 −1 0 1 2 3

0.00.10.20.30.40.50.6

Negative Log of Regularization Parameter

Training/Generalization Error

−3 −2 −1 0 1 2 3

0.00.10.20.30.40.50.6 Error on Old Data Error on New Data

選択特徴数と訓練誤差・汎化誤差の推移

(12)

演習問題1

以下のX yに対してλ= 1,2の場合のリッジ回帰分析を解き,

それぞれの場合の訓練誤差を比べよ X=[

1 2 ] ,y=[

5 ]

ヒント

XX= [ 1

2

] [ 1 1 ] +λ

[ 1 0 0 1

]

(13)

演習問題1の解答

(14)

データ分割

仮想的な新データを得るためデータをランダム分割する

訓練用

評価用

(15)

特徴選択の場合(再掲)

特徴数が少な過ぎる:未学習

特徴数が多過ぎる :過学習

0 20 40 60 80 100 120

0.00.10.20.30.40.50.6

Number of Selected Features

Training/Generalization Error

0 20 40 60 80 100 120

0.00.10.20.30.40.50.6 Error on Old Data Error on New Data

選択特徴数と訓練誤差・評価誤差の推移

(16)

正則化の場合(再掲)

正則化パラメータが大き過ぎる:未学習

正則化パラメータが小さ過ぎる:過学習

−3 −2 −1 0 1 2 3

0.00.10.20.30.40.50.6

Negative Log of Regularization Parameter

Training/Generalization Error

−3 −2 −1 0 1 2 3

0.00.10.20.30.40.50.6 Error on Old Data Error on New Data

選択特徴数と訓練誤差・評価誤差の推移

(17)

3つの機械学習タスクとデータ

タスク1:モデルの訓練

パラメータ最適化:モデルパラメータwの推定 訓練データ(training data)

タスク2:モデルの選択

複雑さの制御:特徴数kや正則化パラメータλの選択 評価データ(validation data

タスク3:モデルの評価

汎化性能推定:最終的なモデルの性能推定 テストデータ(test data)

(18)

訓練・選択・評価のためのデータ分割

訓練データ

(training data)

テストデータ

(test data) 評価データ

(validation data)

(19)

交差確認法( Cross Validation

学習データ 評価データ

1回目 2回目 3回目 4回目 5回目

5重交差確認法(5-fold cross-validation)

(20)

交差確認法の例

(21)

交差確認法の例

(22)

交差確認法の例

(23)

交差確認法の例

(24)

交差確認法の例

(25)

Leave-one-out Cross-Validation

1回目 2回目

n回目

n – 1 回目

学習データ 評価データ

1つ抜き交差確認法(leave-one-out cross-validation)

(26)

Nested Cross-Validation

1: for u= 1, . . . ,10do

2: 全データの1割をテストデータに,残りを訓練&評価データに 3: for t= 1, . . . ,10do

4: 訓練&評価データの1割を評価データに,残りを訓練データに 5: for k= 1, . . . , K do

6: 訓練データを用いてλkでモデルを学習 7: end for

8: 評価データを用いて最適なλを選択 9: end for

10: 最適なλのモデルをテストデータに対して評価 11: end for

(27)

演習問題2

訓練データ{(xi, yi)}ni=1による定数モデル yi=w0+εi

の最小二乗推定は ˆ

w0= arg min

w0∈R(yiw0)2= 1 n

n i=1

yi= ¯y

となる.

定数モデルの訓練誤差とLOOCV(Leave-One-Out Cross-Validation)誤差を,それ ぞれ

TrainEr :=

n i=1

(

yiarg min

w0∈R

n h=1

(yhw0)2 )

=

n i=1

(yiy)¯2

LoocvEr :=

n i=1

yiarg min

w0∈R

n h̸=i

(yhw0)2

=

n i=1

yi 1 n1

h̸=i

yh

2

とすると,両者の関係が

LoocvEr = ( n

n1 )2

TrainEr となることを示せ.

(28)

演習問題2の解答

(29)

演習問題3

事例数n >100,特徴数d >50のデータを準備せよ.以下のサイ

トを参考にしてもよい

https://archive.ics.uci.edu/ml/datasets.html

Rのプログラムの解説を参考に,準備したデータをリッジ回帰分 析により分析せよ.

データの概要(数行程度),最適な正則化パラメータ,及び,最適 なモデルの汎化誤差を報告せよ

参照

関連したドキュメント

同志社商学 第5 4巻 第4号(2 0 0 3年2月). 5

年1回程度 1点 1点 年1回程度 1点 年2回程度 2点 2点 年2回程度 2点 年3回程度 3点 3点 年3回程度 3点 年4回程度 4点 4点 年4回程度 4点 年6回程度

1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 JKOM.

in; Alfons Bora (Hrsg.), Rechtliches Risikomanagement: Form, Funktion und Leistungsfaehigkeit des Rechts in der Risikogesellschaft, Duncker & Humbolt, S.2 3 9- 2 5

資料2−1 既存の障害児支援サービスの第三者評価項目と特徴 資料2−2 既存の障害児支援サービスの第三者評価項目の構成と整理

ないことから、導入されたホルミル基を足掛かりとして生

8カウント 右足から 3拍子のステップ レッグカール4回 右足からボックス1回 右足マンボ2回 右回り1周(8歩)

6  5  4  3  2  1 .