上半身検出の手法とその評価
2
0
0
全文
(2) 情報処理学会第 77 回全国大会. 畳み込みフィルタの数とそのサイズ,部分サンプリ ングによる縦・横方向への分割数を示す. 表 4 に学習率,一度の更新で使用する画像の枚数, 使用パラメータの更新回数(初期値),更新回数を 増加させる倍率,最大世代数を示す. 表 5 と表 6 に学習と性能テストに用いた画像の枚 数と,CNN の学習の経過をそれぞれ示す. 表 6 において,17 世代で誤識別率が最小,F 値 が最大となるが,最大適合率は 16 世代,最大再現 率は 8 世代である.適合率,もしくは再現率に応じ てパラメータ更新回数の増加を図ることで,どちら かに特化した識別器を構成できると考えられる. なお,今回は Python で実装された機械学習用ラ イブラリ Theano[5]を用いて CNN の構築を行った. 段数 1 2 3 4. 表 1 NN 構成 種類 畳み込み層 畳み込み層 隠れ層. 活性化関数 Tanh Tanh Tanh Softmax. ロジスティック回帰層. 𝑒𝑒 𝑊𝑊𝑖𝑖 𝑥𝑥+𝑏𝑏𝑖𝑖 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑖𝑖 (𝑊𝑊𝑊𝑊 + 𝑏𝑏) = ∑𝑗𝑗 𝑒𝑒 𝑊𝑊𝑗𝑗 𝑥𝑥+𝑏𝑏𝑗𝑗 式1. 層. 層. Softmax 関数. 64×64. 20. 2. 30×30. 50. 表 3 畳み込み層パラメータ 2 部分サンプリング フィルタサイズ(pix) 分割数. 1. 5×5. 2×2. 2. 5×5. 2×2. 表 4 学習パラメータ 学習率 1回の更新に用いる画像枚数 NN パラメータの更新回数(初期値) パラメータ更新回数増加倍率 最大世代数. 総数 100,000 40,000. 表 6 CNN 学習経過 世代 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 33. 誤識別率 適合率 再現率 14.96 0.818 0.220 8.01 0.679 0.594 6.59 0.545 0.789 5.27 0.610 0.826 4.06 0.666 0.839 3.78 0.663 0.854 3.50 0.682 0.863 3.39 0.701 0.872 2.73 0.757 0.849 2.87 2.53 0.814 0.834 2.4 0.841 0.822 2.53 2.17 0.874 0.817 2.21 2.14 0.892 0.803 1.98 0.871 0.831 2.00 Early Stopping により停止 表 7 識別性能 HOG・SVM 適合率 0.903 再現率 0.638 F値 0.748. 表 2 畳み込み層パラメータ 1 入力画像サイズ(pix) フィルタ数. 1. 表 5 画像データ枚数 正例 負例 学習画像 24,000 76,000 テストセット 4,000 36,000. F値 0.346 0.634 0.645 0.702 0.742 0.747 0.762 0.777 0.800 0.824 0.832 0.845 0.845 0.851. CNN 0.872 0.831 0.851. 5.今後の課題 今後の課題として,以下が挙げられる. ○交差検定による再評価 今回データセットの一部を分離したテストセット により評価を行ったが,それらを学習データに含め, 交差検定での性能向上を検証する必要がある. ○識別速度評価 最終的には最終的に実時間で上半身検出を行うこ とを目標としているため,それぞれの検出器の速度 評価と,必要ならば高速化の検討が必要である.. 0.1 100 10,000 2 200. 参考文献. [1] 藤井龍也, 他,“HOG と SVM による上半身検出器. 4.識別器の性能比較. の特徴の抽出位置に関する考察”, 第 10 回情報科. HOG 特徴量と線形 SVM による上半身検出器と, 学技術フォーラム(FIT2011),H-001,2011. [2] Lecun.Y, Bottou.L, Bengio.Y, Haffner.P,“GradientCNN による上半身検出器を,識別性能指標の1つ based learning applied to document recognition”, である適合率・再現率・F 値について比較を行った. Proceedings of the IEEE, Volume:86 Issue11, 線形 SVM の学習と評価には,CNN と同様に表 5 Page2278-2324, 1998. の画像データを用いた. [3] N.Dalal, et al.,“Histograms of Oriented Gradients for Human Detection”, Proc.CVPR, 表 7 にテストセットを用いて識別した結果を元に vol.1, pp.886-893,2005. 計算した性能指標の比較を示す. [4] S. Walk, N. Majer,K. Schindler,and B. Schiele, 適合率は SVM 識別器が約 0.03 だけ上回るが, “New features and insights for pedestrian detection”,pp.1030-1037,In CVPR,2010. 再現率は CNN 識別器が約 0.2 上回り,総合的な指 [5] Theano 標の F 値について 0.1 以上良い結果となった. http://deeplearning.net/software/theano/. 2-32. Copyright 2015 Information Processing Society of Japan. All Rights Reserved..
(3)
図
関連したドキュメント
CN 割り込みが発生した場合、ユーザーは CN ピンに対応する PORT レジスタを読み出す
出てくる、と思っていた。ところが、恐竜は喉のところに笛みたいな、管みた
このようなパヤタスゴミ処分場の歴史について説明を受けた後,パヤタスに 住む人の家庭を訪問した。そこでは 3 畳あるかないかほどの部屋に
では、シェイク奏法(手首を細やかに動かす)を音
・カメラには、日付 / 時刻などの設定を保持するためのリチ ウム充電池が内蔵されています。カメラにバッテリーを入
理由:ボイラー MCR範囲内の 定格出力超過出 力は技術評価に て問題なしと確 認 済 み で あ る が、複数の火力
職員参加の下、提供するサービスについて 自己評価は各自で取り組んだあと 定期的かつ継続的に自己点検(自己評価)
Dual I/O リードコマンドは、SI/SIO0、SO/SIO1 のピン機能が入出力に切り替わり、アドレス入力 とデータ出力の両方を x2