経済と経営 45−2(2015.3)
論 文>
不等間隔な時系列データの周期の最小二乗推定
ジャズのアドリブフレーズを対象に
駒 木
泰
1.はじめに 時間毎に得られるデータを時系列データと呼ぶが,ある時間についてデータが欠損値となる場合 がある。欠損値が多いと,データは時間によって並んではいるものの,時間の間隔は等間隔ではな く,不等間隔となる。 データに欠損値が生じて,不等間隔となる原因としては,観測不能によるところが大きい。多く の観測不能の状況はランダムに起きる。一方,観測範囲を超えた値を示したための切断(trunca-tion),消息不明のような打ち切り(sensor)などを欠損値として扱うこともある。欠損値の処理と しては,欠損値の数が少ない場合は,欠損値を除去する,あるいは,補間するなどの方法がある。 切断データや打ち切りデータを対象とした 析では,欠損値が生じるメカニズム自体をモデル化し ている。 時系列 析における自己回帰(AR)モデルやスペクトル 析などは,データが等間隔に得られて いなければならない。したがって欠損値については,データを補間する以外には 析が難しい。一 方,時間自体を説明変数として,時間の間隔を組み入れないように線形モデルや周期モデルを構築 すれば,不等間隔なデータでも,通常の回帰モデルとして係数の推定・検定が適用出来る。しかし, クロスセクションデータに対する 析方法として扱われるため,ダービン・ワトソン統計量などに よる回帰診断は行えない。 不等間隔な時系列データに対する周期を推定するモデルは,Lomb(1976),Scargle(1982)が代 表的である。これらは,最小二乗法を基に導出されている。Bos, Waele and Broersen(2002)で は,Burg アルゴリズムを解説し,また簡潔なサーベイもみられる。 本稿では,不等間隔な時系列データを対象として,最小二乗法による回帰モデルによる周期の推 定を行う。時系列データの欠損値が生じるメカニズムはランダムな場合を仮定する。 実証に先立ち,等間隔な場合に比較して,不等間隔な場合の推定の効率性を検討する。等間隔な データからランダムに取り除いたデータに最小二乗法を適用し,推定量の 布を吟味する。実証例 としては,音楽データの音高の並びに潜む周期を推定する。音楽データには休符が存在し,発音さ れている音高に対しては欠損値としてみなせる。休符には,演奏者や作曲者の意図が潜むので,観 測不能,切断,打ち切りには該当しない。しかし,本稿では,休符が生じるメカニズムは 慮せず, 単純にランダムに表れた結果と える。したがって,音高の並びを不等間隔な時系列データとみな ( ) 65 99して,周期の推定を行う。 2.周期モデルのシミュレーション 時間 t における時系列データ y の周期についての回帰モデルは,以下のようになる。ただし,単 純化のため周期成 数は1成 にしている。 y=β+ β+β cos ωt−θ+ε ここで,T :周期,ω=2π/T :角周波数,β:メサー, β+β :振幅,θ=tan β/β :位相 (β>0,β>0のとき),θ/ω:位相時間である。 データ発生モデルと推定モデルは,以下の通りである。 y=β+βcos ωt +βsin ωt +ε シミュレーションは,データ数 30(t=1,…,30),β=0,β=1,β=2,ε∼N 0,4 とした。 したがって,メサー:0,振幅: 5,位相:tan 2/1=0.96となる。周期 T は5と 10の二通り 設定した。不等間隔のデータは,30個のデータから一様に取り除くことで作成した。取り除いたデー タ数は 10個,20個の二通りとした。これは,回帰 析を 20個,10個のデータで行うことになる。 パラメータ数は3なので,β,β のt値はそれぞれ自由度 17,7のt 布に従う。 シミュレーションは 1000回行った。β−β,β−β のt値の 布を,理論値と共に表1に示した。 取り除いたデータ数によらず,これらのt値は,理論値に近く,一致性は失われていないといえる。 3.アドリブフレーズの周期の推定 ジャズのアドリブでは,8 音符を中心にフレーズが構成されるが,そこには周期が潜むと え られる。ジャズの一般的な楽曲は4 の4拍子だが,4 の3拍子の曲も見受けられる。この場合 は,4拍目がないため,アドリブには4 の4拍子の曲とは異なったノリ・アクセントを置く必要 がある。本稿では,4 の3拍子のジャズ曲を取り上げ,そのアドリブフレーズの音高に潜む周期 表1 最小二乗法によるt値の 布 β β 周期 自由度(除去数) 10%点 5%点 10%点 5%点 T =5 17(10) 1.66 2.00 1.67 1.99 7(20) 1.80 2.21 1.84 2.23 T =10 17(10) 1.53 1.94 1.96 2.44 7(20) 1.89 2.33 1.91 2.35 自由度 t値 17 1.74 2.11 1.74 2.11 7 1.89 2.36 1.89 2.36 注)除去前のデータ数は 30個。
を推定する。曲は Wes Montgomeryの Full Houseを対象とする。
Full Houseは,コード進行のパターンからみると AABA 形式となるが,A部 は 16小節,B部 は8小節あるので,1コーラス 56小節からなる。テーマのB部 のみにバンプ(Vamp)が入る。 アドリブは全部で3コーラス 行われ,表2のような構成からなる。それぞれにアドリブの特徴を 記した。特に,後半の演奏では繰り返しのフレーズが増えてきている。 データを作成するにあたり,8 音符の表拍,裏拍を最小単位とした。1拍目の表拍を t=1とし てスタートして,8 音符で数えた発音タイミングを t とした。そこでの音高が y となる。発音タ イミングの周期を 察するので,2 音符のようなロングトーンについては,音符の長さは 慮し ない。したがって,4 音符は8 音符+休符と える。その他,3連符は2番目を除いて8 音 符の表拍と裏拍,3拍4連符は2,4番目の音を除いて,1,3番目の音をそれぞれ1拍目の表拍, 2拍目の裏拍とした。アドリブは8 音符6個のアウフタクトから始まるが,1拍目から始めた8 小節毎の推定を行った。実際のフレーズと小節の区切りとは一致しない。フレーズの区切りが明確 であればフレーズ毎の推定が望ましいが,小節で区切っても,ある程度は位相で処理できると え る。データは,シンコーミュージック・エンタテイメント(1997)のコピー譜を参 に,Midi音階 の尺度で音高データを作成した。 係数 β,β,β と周期 T の同時推定は困難なため,周期 T を変化させ,推定モデルからの残差 平方和(SSR)を求めた。ジャズのアドリブなので,音高の最大周期はせいぜい4小節,すなわち 8 音符 24個 までと えられる。したがって推定では,3周期から 24周期まで変化させて,そ れぞれの残差平方和を求めた。 3コーラス 8小節毎に,周期 T を3から 24まで変化させたそれぞれの残差平方和を,図1∼図 6に示した。また,8小節毎のデータ数,および残差平方和が最小となる周期を,表3にまとめた。 以下,A1とはAの最初の8小節 ,A2とはAの次の8小節 を意味する。 図1∼図6を見ると,8小節内の周期に応じて残差平方和の谷がいくつかみられ,周期が合成さ れていることを示唆する。その中で最小となる周期が表3である。A2,A3,A4,A6は,コー ラスを跨って同様の周期が選ばれている。1拍半ごとの周期としての,3の倍数の周期もみられる。 また,3,7のような短い周期は,2コーラス目A2以降には表れない。アドリブの後半で繰り返 しのフレーズが増えることに関連している。 1コーラス目,1コーラス目のA1を除くと,周期は予想よりも長めである。周期が6で1小節 不等間隔な時系列データの周期の最小二乗推定 表2 アドリブの構成 コーラス A-16小節 A-16小節 B-8小節 A-16小節 1 単音のみ 短いオクターブ奏 法と単音 繰り返し多い 単音のみ 2 短いリフあり 繰り返し多い 繰り返し多い テーマの一部あり 3 単音+オクターブ 奏法,繰り返し多 い オクターブ奏法 繰り返し多い オクターブ奏法 繰り返し多い オクターブ奏法 繰り返し多い ( ) 67 101
図1 周期ごとの残差平方和(1コーラス目前半)
図4 周期ごとの残差平方和2コーラス目後半) 図3 周期ごとの残差平方和(2コーラス目前半)
( ) 69 103 不等間隔な時系列データの周期の最小二乗推定
図6 周期ごとの残差平方和(3コーラス目後半) 図5 周期ごとの残差平方和(3コーラス目前半)
なので,殆どが小節を超えた周期と推定されている。これは,モデルが滑らかな正弦波(sine wave) のみで構築されているためであり,三角波(triangle wave)や鋸波(saw tooth wave)のような 離散的なフレーズも近似されてしまい,周期が長めに推定されたと える。 4.おわりに 本稿での周期モデルについては,データに欠損値を含み不等間隔に並んでいても,推定された係 数の一致性は失われないことが,シミュレーションにより確認された。補間などで等間隔なデータ に変換出来ない場合は,推定方法としては最小二乗法が援用できる。 周期を推定する多くのモデルは,正弦波を基本としており,音楽データのような離散的データに は,ウォルシュ変換(駒木(2013))のような離散的な方法が適すると えられる。本稿では,時間 が不等間隔に得られる音楽データを対象にした。しかし,回帰モデルとしては,正弦波のみを推定 するよりも,三角波や鋸波を推定できるモデルの方が望ましいと思われる。フーリエ展開では,三 角波と鋸波は多くの正弦波から合成されるが,回帰モデルにおいて,正弦波を変数として多数並べ ることは,自由度からみて困難と える。 [参 文献]
[1]Bos,R,S.de Waele,P.M.T.Broersen, Autoregressive Spectral Estimation by Application of the Burg Algorithm to Irregularly Sampled Data , IEEE Transactions Instrument and Measure-ment, Vol.51, No.6, 2002, p.1289-1294.
[2]駒木泰 ウォルシュ変換によるリズムパターンの周期解析と生成 情報処理学会研究報告(音楽情報 科学),2013-MUS-98(1),2013,p.1-4。
[3]Lomb. N. R., Least-squares frequency analysis of unequally spaced data , Astrophysics and Space Science, Vol.39, 1976, p.447-462.
[4]Scargle, J. D., Studies in astronomical time series analysis. II -Statistical aspects of spectral analysis of unevenly spaced data, Astrophysical Journal, Part 1, Vol.263, 1982, p.835-853. [5]シンコーミュージック・エンタテイメント スーパーギタリスト ウェス・モンゴメリー ,1997, p.36-42。 表3 データ数および残差平方和が最小となる周期 A1 A2 A3 A4 B A5 A6 1コーラス目 データ数 27 26 32 41 43 39 36 周期 7 14 24 24 16 11 20 2コーラス目 データ数 29 34 35 36 39 32 30 周期 3 15 24 13 20 19 15 3コーラス目 データ数 27 27 25 27 27 29 33 周期 19 15 24 24 10 23 21 注)8小節 のデータは 48個である。 ( ) 71 105 不等間隔な時系列データの周期の最小二乗推定