• 検索結果がありません。

非線形 SVM による 2 次元特徴空間での分類

第 4 章 SVM によるグルーヴ感の解析 43

4.4 非線形 SVM による 2 次元特徴空間での分類

4SVMによるグルーヴ感の解析 4.4非線形SVMによる2次元特徴空間での分類

– 4拍目 – 4.5拍目

バスドラム – 1拍目 – 3拍目

スネアドラム – 2拍目 – 4拍目

なお,上記の「○○拍目」という表記は,各小節内での拍の位置を示す

また,データをSVMに入力する際に設定するクラスラベルyiについても4.2節・4.3節 と同様とし,グルーヴ感によって以下のような値に設定する.

ルースなグルーヴ感の演奏から得たデータ:yi=−1

タイトなグルーヴ感の演奏から得たデータ:yi= 1

4.4.2 入力データの次元について

ここで解析を行うデータは,各曲ごとに1データずつ,計17個のデータとする.4.2節で 行った実験の結果を踏まえ,各データは,各曲における以下の2種の特徴の値を持つ2次元 ベクトルとする.

打点時刻ずれの標準偏差

打点音量の平均

4.4.3 カーネル関数の選定

ここでの実験では非線形SVMによる分類を行うため,2.3.3節で述べたカーネルトリック の手法が必要となる.ここでは,4.3.3節と同様,カーネル関数として以下の式で表される

Radial Basis Function (RBF)を用いる.

K(x,z) = exp³−γkx−zk2´, γ >0 (4.3) RBF関数をカーネル関数として選定する理由は4.3.3節と同様である.クロスバリデーショ ンによるSVMパラメータの設定の際には,ソフトマージンアルゴリズムのパラメータC

加え,RBFの式(4.3)の中に現れる変数γについてもチューニングを行う必要がある.

4.4.4 実験結果

4.4.4.1 クロスバリデーションによるパラメータチューニングの結果

まず,4.2.3.1節・4.3.4.1節と同様に,過学習を避けるべくクロスバリデーションによる SVMのパラメータの設定を行った.ここでは,ソフトマージンアルゴリズムのパラメータ CおよびにRBFの式(4.3)の中に現れる変数γの2種類のパラメータついてチューニング を行った.それぞれのパラメータの値を,

C: 2−5,2−4,· · ·,215

γ : 2−15,2−14,· · ·,23

と等比数列的に変化させながら,各Cおよびγの値を用いて17分割クロスバリデーション を逐一行い,クロスバリデーションの平均分類正解率が最も高くなったCγの値の組み 合わせを採用した.

クロスバリデーションを用いて設定された各楽器・各打拍におけるCおよびγの値と,そ の際のクロスバリデーションの平均分類正解率を,表4.8に示す.以下のRBFカーネルに よる非線形分類実験では,ここで設定されたCおよびγの値を最適パラメータとして用い るものとする.

4.4.4.2 分離曲線の生成と分類正解率

表4.8のCおよびγの値を用いたRBFカーネルによる非線形SVMによって,ルースと タイトのグルーヴ感を分類する分離曲線を,各楽器・各打拍ごとに生成した.以下では,非

4SVMによるグルーヴ感の解析 4.4非線形SVMによる2次元特徴空間での分類

表4.8: 各楽器・各打拍における非線形SVMの最適パラメータ(2次元特徴空間)

楽器 小節内の打拍位置 C γ クロスバリデーションの 平均分類正解率(%)

1拍目 256.0 0.00048828125 82.3529

1.5拍目 4096.0 0.5 82.3529

2拍目 32.0 0.015625 76.4706

ハイハットシンバル 2.5拍目 1.0 4.0 70.5882

3拍目 32.0 0.015625 70.5882

3.5拍目 128.0 0.015625 76.4706

4拍目 8192.0 0.125 64.7059

4.5拍目 8.0 1.0 100.0000

バスドラム 1拍目 2048.0 0.001953125 58.8235

3拍目 8.0 2.0 76.4706

スネアドラム 2拍目 1024.0 0.5 52.9412

4拍目 256.0 0.0625 64.7059

生成した分離曲線によるグルーヴ感の分類正解率を,表4.9に示す.なお,具体的な分離 曲線の様子は図4.13〜図4.24にて後に示す.

表4.9を見ると,分類正解率が最も低かったのはハイハットシンバル3拍目の70.5882%で,

最も高かったのはハイハットシンバル1.5拍目・ハイハットシンバル4.5拍目のいずれも 100.0000%であった.ハイハットシンバル1.5拍目については表4.2で示した線形SVMの 分離超平面による分類正解率でも100.0000%となっており,グルーヴ感による演奏の差が顕 著に現れている楽器・打拍であると言える.また,その他の楽器・打拍については70%台後 半〜80%台後半の正解率となったものが多く,グルーヴ感によって演奏にある程度の差が生 じているということは確認できた.

しかし,これらは表4.2で示した線形SVMの分離超平面による分類正解率よりも低くなっ ているものが多い.つまり,線形から非線形に拡張したにもかかわらず次元数が削減された ことにより,結果としてSVMの分類能力が低下していることがわかる.このことより,非 線形SVMによる分類であっても2次元のみの特徴による分類はやや難しいということが示 されたと言える.また,グルーヴ感をより正確に分類するためにはより多くの演奏データサ

表4.9: 非線形SVMの分離曲線による分類正解率

楽器 小節内の打拍位置 分離曲線による 分類正解率(%)

1拍目 82.3529

1.5拍目 100.0000

2拍目 76.4706

ハイハットシンバル 2.5拍目 88.2353

3拍目 70.5882

3.5拍目 76.4706

4拍目 88.2353

4.5拍目 100.0000

バスドラム 1拍目 70.5882

3拍目 94.1176

スネアドラム 2拍目 88.2353

4拍目 82.3529

ンプルを用いて,より高次元のベクトルによる特徴空間での解析を行う必要があることを示 唆していると言うこともできる.

4.4.4.3 分離曲線とグルーヴ感の分類状況

ここで,各楽器・各打拍における各曲の演奏データの分布および分離曲線の様子を表した グラフを,図4.13〜図4.24に示す.図4.13〜図4.24において,グラフの縦軸は各曲におけ る打点音量の平均値,グラフの横軸は各曲における打点時刻ずれの標準偏差をそれぞれ表し ている.また,図4.13〜図4.24の中で用いている各種記号等の凡例は表4.10の通りである.

なお,図4.13〜図4.24において表示してある分離曲線の幅に偏りが生じているが,これ は,分離曲線をグラフ化する際に以下の手順によってグラフを作成しているためである.

1. 演奏データの値に応じてグラフの表示範囲を決定する.

2. グラフの表示範囲を1000×1000のピクセルに分割する.

関連したドキュメント