3. セミトランスオーラルと音場模擬技術に基づく
3.2 高臨場感音場再現技術に関する先行研究
3.2.1 バイノーラルシステムと頭部伝達関数
バイノーラルシステム[89]はヘッドフォンを利用して厳密に原音場を再現する手 法である.図21に示されるように,原音場にダミーヘッド(またはHead and Torso
Simulator; HATS)と呼ばれる人間の頭部を模した収録装置を用いる.ダミーヘッド
には両耳鼓膜位置に収録用マイクロフォンが設置されており,人間の頭部近傍にお ける音響信号の伝播に対する影響まで含めて音響信号を収録する.ダミーヘッドを 用いて収録された音響信号を受聴者の両耳で提示することで収録された音場での受 聴を忠実に再現できるとされる.また対象の音源をインパルスとし,任意の音源位 置から両耳への頭部伝達関数(Head-related transfer function; HRTF)[90, 91]を計測す ることで,任意の音響信号に対して高臨場感音場再現を行うことができる.
しかしながらバイノーラルシステムでは頭部伝達関数に基づき両耳へのみ音を放 射するため,頭部の形状の違いによって性能が低下し,顔面の骨伝導などの影響も 再現できない.これらの原因から,音像定位の頭内定位[92]や定位の前後誤り[93]
などの問題が知られている.
Headphone Synthesis
Loudspeaker Sound image
図21 バイノーラルシステム
受聴者が両耳で受音する信号は次式で表せる.
Xn(ω) =Qn(ω)S(ω), (45)
ここで,nはLまたはRであり,Lは左チャネル,Rは右チャネル,ω は周波数,
Xn(ω)は受聴者の両耳位置の受音信号,Qn(ω)はHRTFを含む室内伝達関数,S(ω) は音源であるドライソースの信号である.バイノーラル方式は,式(45)における Qn(ω)を頭部形状を模擬したマイクロホンであるダミーヘッドを用いて実計測して,
それを適用した信号をヘッドホンにより受聴させることで3次元音場再現を実現し
ている[89].バイノーラル方式ではヘッドフォンの着用が不可欠であるため,ヘッ
ドホン着用の煩わしさが問題となる.
そのため,頭部伝達関数は音源の方向や室内環境など様々な条件に依存するため,
音源方向や室内環境を変えて音場再現を行うには条件を変えた計測が必要となる.
加えて,受聴者の頭部形状にも依存するため,再現する音場を自由に変えるために 必要な計測数は更に発散する問題がある[92, 94].
3.2.2 トランスオーラルシステム
バイノーラルシステムと同様の効果をヘッドフォンではなくスピーカを用いて制 御する手法がトランスオーラルシステム[95]である.基礎的なトランスオーラルシ ステムは図22に示される通りバイノーラルシステムによって収録された音源を,遠 隔にある受聴者の両耳付近にて再現する手法である.
左右に異なる信号を提示するため2機以上のスピーカを用いて遠方から音を放射 する場合,受聴者の両耳には伝播経路の特性やクロストークなどの特性を含めて音 が到来する.トランスオーラルシステムでは,これらの影響を逆系によって抑圧す ることにより,ヘッドフォンの着用なくバイノーラルシステムと同等の音場再現を 達成する[96, 97].
トランスオーラルシステムにおける受聴者が両耳で受音する信号は次式で表せる.
Y(ω) = G(ω)H(ω)X(ω). (46)
ここで,Y(ω) = [YL(ω), YR(ω)]T は受聴者の両耳位置の受音信号,G(ω)は遠隔 スピーカと受聴者の両耳位置までの伝達関数の行列,H(ω)はG(ω)に対する逆フィ ルタの行列,X(ω) = [XL(ω), XR(ω)]T は式(45)のバイノーラル方式における受音 信号である.また,[·]T は転置を表す.式(46)の通り,室内伝達関数とクロストー クの行列G(ω)に対する多チャンネル逆フィルタの設計が不可欠であるため,機器 の個数や計算量の点で非常に複雑かつ大規模なシステムとなる.
またMINT法(Multi-input/output INverse Theorem:多入出力系逆フィルタ)に基づ くトランスオーラルシステム[95, 98]では,提示用スピーカを増やすことで,スピー カ数-1の受聴点の音圧を制御する.
すなわちスピーカ数を増やし受聴者の正面や背面に対して音圧の制御を行うこと で,バイノーラルシステムで問題とされた頭内定位や定位の前後誤りを低減すること が期待される.一方で制御される受聴点に対して逆フィルタは一意に定まるため,受 聴者の移動などの系の変動には追従が必要となり,その品質が低下する問題がある.
Dummy head
Crosstalk signal
Direct signal Loudspeaker
図22 基礎的なトランスオーラルシステム
3.2.3 サラウンドシステム
スピーカの数を増やすことで音場を制御する手法の最たるものとしてサラウンド システムが挙げられる.サラウンドシステムは古くから用いられているスピーカを 用いたマルチチャネルな提示装置の体系であり,基本である5.1chサラウンド[99],
ドルビーデジタル⃝R6.1chサラウンド,ドルビーデジタル⃝RサラウンドEX(7.1ch),
NHK放送技術研究所の22.2chサラウンド方式[100]などがある.トランスオーラル システムのように受聴点に対する点制御は行わず,物理的に多方向に配置されたス ピーカに各音源を振り分けることでスピーカの配置に基づいた音像を構築する.
サラウンドシステムは受聴点の点制御を行わないことから,広範囲にスピーカを 配置することで多人数の受聴者に音場を共有させることができ,商業用娯楽施設な どで広く利用されている.特に5.1chサラウンドなど正面方向にスピーカを配置す る場合には,ステレオ信号で正面の音像を作るファンタムセンタ[101]と異なり,直 接的に正面の音像を作ることができる(ハードセンタ[101])で,バイノーラルシス テムやトランスオーラルシステムに勝る[102].
しかしスピーカの配置されない方向の音像に対しては音圧の強度差や時間差といっ た簡易な処理での制御しか行えず,直接音以外の音(反射音や残響音など)を適切に 各スピーカに振り分けることが困難となる.そのため音場の主観的属性を忠実に再 現することは困難であった.
3.2.4 空間の音圧分布を制御する手法
音場再現の一手法として,受聴者の存在を無視して空間の状態を再現する手法も 提案されている.これはホイヘンス=フレネル定理によれば,平面波は無限に並ん だ点音源からの拡散として扱えるため,例えば直線に並んだ複数のスピーカを順に 制御することで特定の方向に進行する平面波を構成と考えられた.特定の音場にお いて波面を多点のマイクロホンで切り出し別の環境に配置したスピーカから放射す る手法は古くCamrasの論文[88]で提案されているが,近年では数理的に波面の構 成を扱う手法が主流である.
時間(x, y, z)および空間tの音圧分布関数p(t, x, y, z)に対する波動方程式は次式 で与えられる.
1 c2
∂2
∂t2p = ∇2p, (47)
∇2 = ∂2
∂x2 + ∂2
∂y2 + ∂2
∂z2. (48)
なお,cは音速を示す.
波動方程式を時間の関数T (t)と空間の関数A(x, y, z)に分離すると,時間と空間 に対する偏微分方程式が得られる.
(∇2+k2)
A = 0, (49)
(d2
dt2 +k2c2 )
T = 0. (50)
ここで式(49)は時間に依存せず空間の状態を示すことができ,ヘルムホルツ方程 式と呼ばれる.
厚さが0で連続した境界Sで囲まれた領域V を想定した時,領域内xrの音圧と 境界S上の音圧xsはキルヒホッフ-ヘルムホルツ積分方程式として得られる.
p(xs) =
∫ ∫
S
G(xr|xr) ∂
∂⃗np(xr)−p(xr) ∂
∂⃗nG(xr|xs). (51) なお⃗nは境界Sの法線ベクトルを示し,G(xr|xs)はヘルムホルツ方程式に対する グリーン関数である.
G(xr|xs) = 1
4π|xr−xs|exp (−jk|xr−xs|). (52)
波面合成法や境界音場制御[88, 103, 104]はキルヒホッフ-ヘルムホルツ方程式に 基づき,境界線上のスピーカアレイを制御することで特定の閉空間における音場を 制御する.一般的に境界音場制御の制御領域に対してスピーカは,多数かつ遠方に 配置される.そのため,境界音場制御においてもスピーカと境界の間に生じる伝達 特性を打ち消す逆フィルタが用いられる.この点において,境界音場制御はトラン スオーラルシステムにおける制御“点”を,キルヒホッフ-ヘルムホルツ積分方程式 によって“領域”に拡張した手法であると言える.
境界音場制御では境界内の音を制御できる先鋭的な手法といえる.一方で,想定 する領域に受聴者の頭部がある場合などへの対応が難しく,境界上に無限の点音源 が存在すると仮定するため制御に膨大なスピーカが必要となる.すなわち図23のよ うな膨大な設備と,高次の逆フィルタ推定が必要となる問題がある.