JAIST Repository: MIDIデータからのクロマプロファイルの抽出と分析
全文
(2) 社団法人 情報処理学会 研究報告 IPSJ SIG Technical Report. 2003−MUS−51 (16) 2003/8/5. MIDIデータからのクロマプロファイルの抽出と分析 宮下芳明†. 西 本 一 志 †,. ††. この研究では、17 世紀から 20 世紀までの楽曲のMIDIデータをもとに、その音名(クロマ)の発音頻度を 求め、レーダーチャートとして表示し、分析を行った。その結果、楽曲における調判定が容易になるだけでな く、その楽曲における調性的特徴を視覚化し、相互比較することが可能になった。また作曲者ごとに平均され たクロマプロファイルは、その作曲者の個性を反映しており、作曲者の判別への応用も可能である。一方、ク ロマプロファイルにおける分散は、楽曲の調性感を示す有効な指標であると考えられるので、作曲年代による 関係をプロットした。これにより、音楽史全体における調性感の変遷を視覚化することができた。. Extraction and Analysis of Chroma-Profile from MIDI Data Homei MIYASHITA. †. and Kazushi NISHIMOTO. † , ††. In this research, we computed frequencies of chroma from MIDI data of famous classic songs, and illustrated them in radar chart representation, as "Chroma-Profile." From this representation, we succeeded not only in assuming key signatures in those songs, but also in visualisation of tonality ( or modality ) space of those songs. Additionally, it is also possible to represent Chroma-Profiles of specific composers by calculating average frequencies of chroma from their songs. Moreover, by calculating standard deviation in Chroma-Profile, we can compute and represent the magnitude of tonality, and finally we visualised relation between the magnitude of tonality and the year when the song was composed.. 1. はじめに 私たちはオクターブ隔てた音を原音に 類似した音(あるいは原音に同一の音) と し て 認 識 し て い る ( = オ ク タ ー ブ 等 価 )。 ま た 、 12 半 音 に 相 当 す る オ ク タ ー ブをはじめとして、完全 5 度、完全 4 度 や全音というように、離散的なカテゴリ ー(=クロマ)として音程を知覚してい る。このようにクロマがオクターブごと に循環する知覚は、しばしば図 1 のよう. 図 1. ピッチとクロマの3次元螺旋モデル. な三次元的な螺旋モデルとして表現され る [1]。. と こ ろ で 「 調 性 」( あ る い は 旋 法 性 ) とは、音楽におけるこうしたクロマが、 ひとつの音(主音)を中心としてこれに. † 北陸先端科学技術大学院大学 Japan Advanced Institute of Science and Technology, Hokuriku † † 科 学 技 術 振 興 事 業 団 さ き が け 研 究 21. 従属している現象をいう。この現象を整 理したものが「音階」であり、時代や民 族によって様々な音階が存在する。西洋. −97−.
(3) 音楽における音階は長音階と短音階に分. 3. 様々な調解釈モデル. 類 さ れ 、 一 般 的 に は あ わ せ て 24 の 短 調 ・ 音楽情報科学の分野では、様々な調解. 長調の「調名」を用いて楽曲の調性的側. 釈 モ デ ル が 提 案 さ れ て い る [2] 。 容 易 に 仮. 面を記述している。. 定しうるモデルとしては、メロディの第 1音目や最終音を主音とみなすモデル、. 2. クロマプロファイル. あるいは出現頻度が最も多いものを主音 本稿で提案するクロマプロファイルと. と解釈するモデルもあげられよう。しか. は、楽曲における各クロマの発音頻度を. し、どのモデルも実質的な正解率には到. 表したものである。つまり、オクターブ. 達せず、特に出現頻度を用いたモデルに. 隔てた音は同じクロマが発音されたとみ. 関 し て は 、 Youngblood [ 3 ] や 、 Knopoff ら [ 4 ]. なして発音回数をカウントし、レーダー. の統計分析により主音だけでなく属音の. チャートで表現したものである。本研究. 頻度も高いことが示されており、それは. では、MIDIデータからノートオン情. クロマプロファイルからも視覚的にみて. 報を抽出し、自動的にこのクロマプロフ. とれる。. ァイルを表示するシステムを作成した。. 一方、複雑な調解釈モデルも多く提案. 図2は、ベートーベンの「月光」第3. されており、代表的なものは全音階的枠. 楽章におけるクロマプロファイルである。. 組みの中でパターンマッチングと探索に. 形状を見やすくするために、軸の最大値. よ っ て シ ミ ュ レ ー シ ョ ン を 行 う. は 最 高 頻 度 の ク ロ マ ( こ の 場 合 は G# ) に. Longuet-Higgins と. 合わせている。この楽曲は嬰ハ短調であ. プロダクションシステムを用いた阿部の. り 、 主 音 で あ る C# と 属 音 で あ る G# が 飛 び. モ デ ル [6] 、 あ る い は 階 層 的 全 音 階 フ レ ー. 出た形となっている。様々な楽曲におけ. ム に よ る 重 み づ け を 用 い る 吉 野・阿部のモ. るクロマプロファイルを見ると、やはり. デ ル [ 7 ]、 Bharucha に よ る コ ネ ク シ ョ ニ ス ト モ デ. 同様に主音と属音に相当するクロマの出. ル[ 8 ]などがある。. Steddman の モ デ ル [ 5 ] や 、. 現頻度が高くなっており、まずこれを用. ま た Krumhansl に よ る 確 率 論 的 モ デ ル [ 9 ]. いることで調解釈ができるのではないか. は、典型的な和声進行の後にプローブ音. と考えた。. を提示し、その適合性評価を得る知覚実 験をまず行い、そのデータから習得性出 C B. 現 頻 度 パ タ ー ン を 作 成 し 、 24 種 類 の パ タ. C#. A#. ーンとの相関を計算することで判定を行 っ て い る 。( こ こ で の 出 現 頻 度 は 、 音 名. D. と持続時間に基づいており、クロマプロ A. D#. フ ァ イ ル に お け る 出 現 頻 度 と と は 異 な る 。). G#. E. これらの複雑なシステムに関しては、 それなりの正解率は望めるものの、人間. G. F F#. の調性認識にどれほど近いかははっきり していない。例えば、音数が多くなるほ どシステムに負荷がかかったり、認識が. 図 2. ベートーベン「月光」第3楽章におけ. 困難になるのは人間の場合はありえない。. るクロマプロファイル. おそらく、調性の認識には二つの段階が. −98−.
(4) あり、極めて情報の少ない単旋律から楽 主音. 典知識や過去の経験などを参照してその 導音. 音階を絞り込む高次処理と、ただなんと なく主音を直感する低次処理があるので. 第2音. はないかと考えられる。上述の調解釈モ デルが記述しようとしているものは、前 第6音. 者の高次処理であり、一方後者は、西洋 音 楽 に お け る 24 種 の 「 調 名 」 に 縛 ら れ な. 第3音. い単純なモデルとして存在するのではな いかと考えられる。. 属音. 図 3. 4. クロマプロファイルによる調の判定. 下属音. モーツァルト 「フィガロの結婚」序曲 に お け る ク ロ マ プ ロ フ ァ イ ル を 調 号( D. 楽曲における音名出現頻度において主. dur ) に 合 わ せ て 回 転 さ せ た も の. 音と属音の出現頻度は極めて高いが、ど ちらが最も高いかは楽曲によって異なる。. 楽 曲 デ ー タ は 、 18 世 紀 か ら 20 世 紀 ま で. しかし、前章のようにここから「音名出. の、一般的にクラシックの名曲とよばれ. 現頻度による単純な調解釈は不可能」と. る楽曲を選び、調性感があまりない現代. いう結論を導くのはいささか早計である。. 曲も入れた。その内訳は、バロック時代. クロマプロファイルを見てもわかるとお. の 楽 曲 を 11 曲 ( パ ッ ヘ ル ベ ル に よ る 「 カ. り 、属 音 は 主 音 の 完 全 な 反 対 側 で は な い 。. ノ ン 」 や J.S. バ ッ ハ に よ る 「 ト ッ カ ー タ と. 時 計 に お け る 12 時 と 7 時 の 関 係 の よ う. フ ー ガ 」 な ど )、 古 典 派 の 時 代 で は 17 曲. に 、 210 度 の 角 度 を 持 っ て い る 。 従 っ て 、. ( モ ー ツ ァ ル ト に よ る「 フ ィ ガ ロ の 結 婚 」. この角度を保ちつつ最大頻度をとる音名. 序曲やベートーベンによる「エリーゼの. のペアをみつければ、その後どちらが主. た め に 」 な ど )、 ロ マ ン 派 に よ る 楽 曲 は. 音でどちらが属音であるかを判定できる. 前 期 ・ 後 期 の 分 類 を せ ず に 合 わ せ れ ば 61. のである。ダイヤルを回転させるように. 曲(ショパンによる「幻想即興曲」やブ. このペアをみつける作業こそが、主音を. ラ ー ム ス に よ る 「 ハ ン ガ リ ー 舞 曲 第 5. 直感するための低次処理のひとつとして. 番 」、 ド ヴ ォ ル ザ ー ク に よ る 「 新 世 界 よ. 働いているのではないかと推測されるの. り 」 第 4 楽 章 な ど )、 そ し て 近 代 ・ 20 世. である。. 紀 の 楽 曲 と し て 11 曲 ( ド ビ ュ ッ シ ー に よ. そこで、MIDIによる楽曲データを. る「亜麻色の髪の乙女」やホルスト「組. 100 曲 用 意 し 、 ま ず そ れ ら の 楽 曲 の ク ロ マ. 曲 惑 星 よ り 木 星 」な ど )と な っ て い る 。. プロファイルを作成したのちに、楽譜に. その結果、バロック時代の楽曲におい. 記載されている調号に合わせた主音が一. て は 11 曲 中 10 曲 ( 91 % )、 古 典 派 の 楽 曲. 番上に来るようにすべて回転させた(図. に お い て は 17 曲 中 17 曲 ( 100 % )、 ロ マ. 3 )。 主 音 と 属 音 の 頻 度 合 計 が 他 に 考 え. ン 派 に よ る 楽 曲 に お い て は 61 曲 中 56 曲. 得 る 210 度 の 組 み 合 わ せ の 中 で 最 も 高 い. ( 92 % )、 そ し て 近 代 ・ 現 代 の 楽 曲 に お. 場合、この方法による調の判定が正解し. い て は 11 曲 中 7 曲 ( 64 % ) の 正 解 を 得 た 。. たことになる。. 興味深いのは、これらの楽曲のうち多く のものが楽曲内で転調を行っているにも かかわらず、その影響を受けずに高い正. −99−.
(5) 解率を出していることである。自然な転. ュッシーのクロマプロファイルにみるこ. 調先としての近親調を考えると、下属調. とができる。. に転調してもその属音は元の調の主音で. 主音. あり、属調に転調してもその主音は元の. 導音. 調の属音であることになり、結局元の調 第2音. の主音・属音の出現頻度が保たれるのだ ろう。 第6音. しかし、ここで強調すべきなのはその 正解率ではない。調判別モデルに関する. 第3音. 批 判 と し て 、 平 賀 [ 10 ] が 述 べ て い る よ う に、調決定は総体としての音楽認知の一. 属音. 下属音. 環を占めるにすぎず、極端な例として全 主音. 曲データへのアクセスを可能にしたモデ. 導音. ルを作成して正解率をあげたとしても、 第2音. それは目的を履き違えたシステムになっ てしまう。むしろこの実験結果により示 第6音. 唆されるのは、音の出現頻度という量的 な観点に基づいた、極めて単純なモデル. 第3音. によって調が推測できることであり、逆 にこうした低次処理が音楽認知において. 属音. 下属音. も行われている可能性があるということ である。この「量的調性認識」の存在を. 主音. 示すには、十分条件として心理実験など. 導音. を行う必要があるが、本稿における実験 第2 音. 結果は、少なくともその必要条件を示す ことができたのではないかと考えられる。 第6 音. 5. 作曲家ごとのクロマプロファイル 第3 音. 前章の実験で使用した楽曲において、 属音. 作曲者ごとにそのプロファイルを平均し. 下属音. たものが図4であるが、ここには作曲者 の個性が反映されているといえる。例え. 図 4 作曲家ごとの平均クロマプロファイル。. ば、ベートーベンとモーツァルトのクロ. ( 上 か ら モ ー ツ ァ ル ト 、ベ ー ト ー ベ ン 、. マプロファイルは類似しており、同時に. ド ビ ュ ッ シ ー )。 相 互 比 較 の た め 、 軸. 第3音の使用頻度に差異がみられる。こ. の 最 大 値 は 30 % に 統 一 し て い る 。. れはベートーベンがモーツァルトに影響 を受けていた音楽史上の事実や、長調と. 一般的に、作曲という作業の中では音. 短調の楽曲比においてモーツァルトの方. 名の使用頻度を調整する行為は行われな. が長調の楽曲が多いことと符合している。. い。したがって、作曲者ごとのプロファ. また、ロマン派以降にみられる遠隔調へ. イルというのは作曲者の無意識の傾向を. の転調や、和声の多様化の傾向を、ドビ. 表 し て い る と い え る 。こ れ を 応 用 す れ ば 、. −100−.
(6) 作曲者のクロマプロファイルに対する相. 7. おわりに. 関を見ることで、作曲者判別も可能であ ると考えられる。逆に、シェーンベルク. 「音名ごとに音を数えクロマという観点. ら の 提 唱 し た 12 音 技 法 ( オ ク タ ー ブ 内 に. のもとに視覚化する」という、単純な着. のクロマから作品ごとに特定の. 想によるクロマプロファイルだが、調判. 音列を定め、それを楽曲の基礎形態とす. 別モデルの枠組みを越えて、量的な調性. る方法)は、こうした傾向を意識的に消. 認識の存在を示唆し、また作曲者や時代. し去る作曲法ともいえよう。. の傾向を可視化し、その予測をも可能に. ある. 12. する特徴をもっている。また、楽譜に基 づ い て 音 を 数 え る 作 業 は 困 難 だ が 、 MIDI. 6. クロマプロファイルにおける分散の変遷. ファイルを用いればこの作業を自動化で ドビュッシーのクロマプロファイルに. き、数百曲といわず数万曲の分析すら可. も表れるとおり、和声や調性の多様化を. 能である。この点からみても、本稿にお. 経て無調化へと進んだ音楽史の流れから. ける分析法の新規性と応用の可能性をみ. みて、バロック時代・古典派時代には主. ることができるのではないだろうか。. 音・属音に支配されていた音名使用頻度 が、次第に均質になっていくという図式 が推察される。そこで、クロマプロファ イルにおける分散(標準偏差)を楽曲ご とに計算し、その楽曲の作曲年を横軸と し て プ ロ ッ ト し て み た ( 図 5 )。. [1] R.Shepard, R.N : Structural representation of musical pitch, In Deutsch, D.(ed.): The Psychology of Music, Academic Press, pp.343-390 (1982.)(寺西他(監訳) :音 楽の心理学[上,下], 西村書店(1987)) [2] 吉野巌・阿部純一: 調性認識 メロディの調を解釈 する計算モデル, 長嶋洋一, 橋本周司, 平賀譲, 平田圭二: bit 別冊 コンピュータと音楽の世界 基礎からフロンテ ィアまで, 共立出版 pp.117-131(1998). 15. 標準偏差. 参考文献. 10. [3] J.E.Youngblood: Style as information, Journal of Music Therapy, Vol. 2, pp.24-35(1958). 5. [4] L. Knopoff and W,Hutchinson: Entropy as measure of style: The infuluence of sample length, Journal of Music Therapy, Vol. 25, pp.75-97(1983). 0 1650. 1700. 1750. 1800. 1850. 1900. 1950. 作曲年代. 図 5. クロマプロファイルにおける分散の作 曲年代における変遷. このグラフにおいて、縦軸の標準偏差 が高いほど、一部のクロマ(おそらく主 音・属音)による寡占があり、調性感が 強く、逆に低い値は無調に近い楽曲であ るといえる。時代にそって分析すると、 音名使用頻度が次第に均質になっていく 全 体 的 傾 向 ( 無 調 化 の 傾 向 ) と 、 19 世 紀 に入ってから分散という観点からも多様. [ 5] H.C.Longuet-Higgins and M.J.Steedman: On interpreting Bach, In B.Meltzer and D.Michie(Eds.): Machine Intelligence, Vol.6, Edinburgh University Press, 1971 [6] 阿部純一:メロディの知覚と予測の過程:終始音 導出行為のシミュレーション , 心理学研究 , Vol.58, pp.275-281(1987) [7] I.Yoshino and J.Abe: Cognitive modeling of the process of tonal organization in melody perception, International Journal of Psychology, Vol.31, p.51(1996) [8] J.J.Bharucha: Music cognition and perceptual facilitation: A connectionist framework, Music Perception, VOl.5, pp.1-30(1987) [9] C.L.Krumhansl: Cognitive foundations of musical pitch, Oxford University Press(1990) [10] 平賀譲: 音楽認知への計算的アプローチとその課 題, 情報処理, Vol.35 No.9, pp822-829(1994). な楽曲が作られていることがわかる。. −101−.
(7)
関連したドキュメント
In [6], Chen and Saloff-Coste compare the total variation cutoffs between the continuous time chains and lazy discrete time chains, while the next proposition also provides a
The results carried in this article stem from the famous and fundamen- tal theorem of Beurling, [4], related to the characterization of the invariant subspaces of the operator
In this paper the joint probability function, moments, cumulants, covariance and coefficient of correlation of BCPD are obtained.. can be computed accurately from (15) and its
2, the distribution of roots of Ehrhart polynomials of edge polytopes is computed, and as a special case, that of complete multipartite graphs is studied.. We observed from
The general context for a symmetry- based analysis of pattern formation in equivariant dynamical systems is sym- metric (or equivariant) bifurcation theory.. This is surveyed
We use these to show that a segmentation approach to the EIT inverse problem has a unique solution in a suitable space using a fixed point
Furthermore, the upper semicontinuity of the global attractor for a singularly perturbed phase-field model is proved in [12] (see also [11] for a logarithmic nonlinearity) for two
In this work we give definitions of the notions of superior limit and inferior limit of a real distribution of n variables at a point of its domain and study some properties of