• 検索結果がありません。

5.1 まとめ

本稿では複数の楽器音からなるモノラル音響信号を入力とし,混在している各 楽器音に関する知識をほとんど持たない状況下での音源分離問題を扱った.楽器 毎の分離を目的とし,サブバンド信号振幅に関する制約を用いることで対象を楽 音に限定しない音源分離手法を提案した.評価実験では,従来手法であるNMFに よる音源分離手法よりも高い精度で音源分離を実現することができた.

5.2 今後の課題

5.2.1 重み行列 W の算出に関して

図4.9からも分かるように,分離後の楽器音において特定の帯域の振幅が抜け落 ちてしまう現象が多く見られた.これは最小二乗法に基づく重み算出のための式

(2.6)を解いた結果,wの値が0以下に算出されたケースが多かったためと考えら れる.楽器音の性質,提案手法で用いている定Qフィルタバンクの特性を考える と,このような分離結果は明らかに不自然なので,重み行列W の計算時にも周波 数的連続性等の制約を導入することにより改善する必要がある.

5.2.2 楽器音モデル初期化

各楽器音モデルの初期化は観測サブバンド信号振幅からそれぞれ1つの帯域を 選択することで行うが,その帯域の最適な選択方法は未だ明らかになっていない.

本稿の評価実験においては,楽器音モデルの初期化に知識を利用し,他の楽器音 との重なりが最も小さい帯域を選択した場合,高い精度で音源分離を実現できる

36

5.2 今後の課題 37

ことを示した.しかし,知識を用いずに,適切でない帯域を選択してしまうと各 楽器音が不自然に分離されることもあった.楽器音モデルの適切な初期化方法に 関して再考する必要がある.

5.2.3 3 楽器音以上からなる混合音の分離

本稿の評価実験では2楽器音からなる混合音の分離のみを扱ったが,提案手法 においては3楽器音以上からなる混合音の分離も理論的に可能である.3楽器音以 上からなる混合音に対して評価実験を行い,その結果を考察したい.

参考文献

[1] A.S. Bregman, “Auditory Scene Analysis,” MIT Press, Cambridge, 1990.

[2] 鵜木裕史, 赤木正人, “聴覚の情景解析に基づいた雑音下の調波複合音の一抽 出法,”電子情報通信学会論文誌, vol.J82-A, no.10, pp.1497-1507, Oct. 1999.

[3] 亀岡弘和, ルルー・ジョナトン, 小野順貴, 嵯峨山茂樹, “調波時間構造化クラ スタリングによるCASAへのアプローチ,” 日本音響学会聴覚研究会, vol.36, no.7, pp.575-580, 2006.

[4] M.A. Casey, and A. Westner, “Separation of mixed audio sources by indepen-dent subspace analysis,” Proc. International Computer Music Conference, Berlin, Germany, Aug. 2000.

[5] S. Dubnov, “Extracting sound objects by independent subspace analysis,”

Proc. 22nd International Conference on Virtual, Synthetic, and Entertain-ment Audio, Espoo, Finland, May. 2002.

[6] D.D. Lee, and H.S. Seung, “Algorithms for nonnegative matrix factorization,”

Advances in Neural Infomation Processing Systems, vo.13, pp.556-562, 2001.

[7] P. Smaragdis, and J.C. Brown, “Non-negative matrix factorization for poly-phonic music transcription,” 2003 IEEE Workshop on Applications of Signal Processing to Audio Acoustics, pp.177-180, Oct. 2003.

[8] T. Virtanen, “Monaural sound source separation by nonnegative matrix fac-torization with temporal continuity and sparseness criteria,” IEEE

Transac-38

5.2 今後の課題 39

tions on Audio, Speech, and Language Processing, vol.15, no.3, pp.1066-1073, Mar. 2007.

[9] 赤木正人, “聴覚フィルタとそのモデル,” 電子情報通信学会誌, vol.77, no.9, pp.948-956, Sep. 1994.

関連したドキュメント