混合部分的正規分布の線形結合による手書き文字特徴量の分布推定に関する検討
2
0
0
全文
(2) 情報処理学会第 77 回全国大会. タから標本平均,不偏分散,不偏歪度を計算し,それ 表 1: 多峰性が検出される軸数 変数変換前 変数変換後. らを母数の推定量と考えて非線形連立方程式を解くこ とにより,パラメータを推定することができる.. 混合部分的正規. 本アルゴリズムを考慮したマハラノビス距離は式 (3). 分布あてはめ. によって与えられる.. → d(− x)=. 2 → → − ∑ {(− ∑ x −− m)t → ek } → + ϕk (− x) λk. k∈χ /. 部分的正規分布. (3). 軸番号の集合であり,ϕk は対象軸における距離である. ただし,対象軸 xk では確率密度が多峰性を示すため, 対象軸における学習データの平均を µk , 分散を σk2 とす るとき,
(3) ∫ x
(4)
(5)
(6)
(7) = ασk
(8) q (x)dx k
(9)
(10). (4). 計算量の削減方法. のうち 4714 軸が正規分布で近似可能であり,部分的 正規分布のあてはめに要する計算量は,約 36.42%を削 減できた.また,従来の手法での認識精度は 84.46%で えて,認識精度は 84.43%とわずかに低下した.以上の. 4. 一般に,数え上げによって得られる正数のみからな る特徴量の分布は,ガンマ分布で近似できることが多 いと言われている.この性質は,主成分分析や歪度成 分分析によって得られた軸に関しても同じである.こ のような分布を正規分布に近づける方法として,次の ような変数変換を行う方法が知られている.. (0 < β < 1). 27.67%を削減できた.同様に,多峰性のない 12943 軸. 保ったまま,計算量を大幅に削減できたといえる.. となる α を求め,α を距離として使用する.. まとめ 歪度成分分析および混合部分的正規分布のあてはめ. による低品質手書き文字の識別関数設計において,多 峰性を有する成分軸にあてはめる混合部分的正規分布 の計算は,多大な時間を要するため,実用化の観点か ら大幅な計算時間の削減が必要である.そのため本稿 では,歪度成分分析によって得られた各成分軸に対し. (5). そこで,歪度成分分析によって得られた各成分軸に対 し,もっとも正規分布に近くなるパラメータ β を求め, 変数変換後の分布が正規分布と見なせるかどうかを χ2 検定によって判定する.正規分布と見なせる成分軸に 混合部分的正規分布のあてはめを行わないことで,計 算量を大幅に削減することが可能となる.. 3. 8229 (52.15%). ことから,今回の検討により,認識精度をほぼ一定に. 2. y=x. 12943 (82.02%). あったのに対し,提案手法では誤認識文字が 6 文字増. µk. β. 2052 (13.00%). k∈χ. ここに,χ は x1 , . . . , xn のうち,本アルゴリズム適用. 2.2. あてはめ. 2837 (17.98%). て変数変換を行って正規分布への近似を試み,近似が 難しい成分軸に対してのみ混合部分的正規分布をあて はめる方法を検討した.その結果,認識精度をほとんど 低下させることなく,計算時間を大幅に削減すること を実験により確認することができた.尚,本研究の一部 は科学研究費補助金 (基盤研究 (C) 課題番号 22500170) の助成によるものである.. 参考文献. 性能評価実験 提案手法による効果を検証するために,平仮名およ. び教育漢字 1052 字種を対象とし,低品質文字データ. 200 セット (学習用データ 180 セット,認識用データ 20 セット) を用いて認識実験を行った.表 1 の実験結果に よると,歪度成分分析で得られた 15 軸に対して多峰性 を検知して混合部分的正規分布をあてはめた軸は 2837 軸 (17.98%),部分的正規分布をあてはめた軸は 12943 軸 (82.02%) であった.一方,式 (5) の β を 0.2 間隔で 変化させて変数変換を行い,正規分布の適合度を有意 水準 95%の χ2 検定で調査したところ,多峰性を有す る 2837 軸のうち 785 軸が正規分布で近似可能であり, 混合部分的正規分布のあてはめに要する計算量は,約. 2-44. [1] 鈴木,北越,松本,“歪度最大基準に基づく特徴選 択法による低品質手書き文字認識法の検討”, 信学 技報 PRMU2012-110, pp.251-256, Jan. 2013.. [2] 鈴木,北越,松本,“混合部分的正規分布による手 書き文字識別関数設計に関する検討”, 2014 年信学 全大,D-12-22, Mar, 2014. [3] M.E. Tipping, et.al. “Mixtures of probabilistic principal component analyzers”, Neural Computation, vol.11, no.2, pp.443-482, 1999. [4] Aapo Hyv¨arinen, “独立成分分析”, 東京電機大学出 版局,2005.. Copyright 2015 Information Processing Society of Japan. All Rights Reserved..
(11)
関連したドキュメント
例えば,立証責任分配問題については,配分的正義の概念説明,立証責任分配が原・被告 間での手続負担公正配分の問題であること,配分的正義に関する
例えば,立証責任分配問題については,配分的正義の概念説明,立証責任分配が原・被告 間での手続負担公正配分の問題であること,配分的正義に関する
Bでは両者はだいたい似ているが、Aではだいぶ違っているのが分かるだろう。写真の度数分布と考え
ためのものであり、単に 2030 年に温室効果ガスの排出量が半分になっているという目標に留
部分品の所属に関する一般的規定(16 部の総説参照)によりその所属を決定する場合を除くほ か、この項には、84.07 項又は
今回、新たな制度ができることをきっかけに、ステークホルダー別に寄せられている声を分析
これまで、実態が把握できていなかった都内市街地における BVOC の放出実態を成分別 に推計し、 人為起源 VOC に対する BVOC
千葉 春希 家賃分布の要因についての分析 冨田 祥吾 家賃分布の要因についての分析 村田 瑞希 家賃相場と生活環境の関係性 安部 俊貴