• 検索結果がありません。

Abstract Based on the recent dramatic advancement of information technologies, computer-supported cooperative work has been attracting much interest f

N/A
N/A
Protected

Academic year: 2021

シェア "Abstract Based on the recent dramatic advancement of information technologies, computer-supported cooperative work has been attracting much interest f"

Copied!
27
0
0

読み込み中.... (全文を見る)

全文

(1)

修士論文

上下配置型音響反射板を用いる

音像生成方式における

音像定位精度の評価に関する研究

Sound-Localization-Test-Based Analysis of a

Sound Image Generating System using a Flat Display

and Horizontally Attached Acoustic Barriers

同志社大学大学院 理工学研究科 情報工学専攻

2014

年度

0123

熊谷 駿来

Shunki KUMAGAI

指導教員

共創情報学研究室

片桐 滋 教授

2016

1

21

(2)

Abstract

Based on the recent dramatic advancement of information technologies, computer-supported co-operative work has been attracting much interest from researchers. The ultimate goal of systems that support cooperative work is to provide users with a sense of being in the same room. t-Room studies have been conducted to realize that sense. Among them, we focus on a unique sound im-age generating system that adopts a triple-speaker unit covered by an acoustic barrier. This system has two versions: 1) one that places two speaker units on the left and right sides of the display (left-right model), and 2) another that places the units on the top and bottom sides of the display (top-bottom model). The effect of the left-right model in sound image localization accuracy was shown in both acoustic measurements and (perceptual) localization tests. However, the speaker units on the left and right sides of the display are visual obstacles, and complicate connecting the displays in the wide wall mode. On the other hand, the top-bottom model was only stud-ied in acoustic measurements, although its obtained results are promising for sound localization. The top-bottom model outperforms the left-right model for the visual obstacle problem. Focusing on these features for the top-bottom model, we evaluate its effects on a sound image generating system in sound localization test experiments. Our experimental results are three-fold. The tested top-bottom model achieves relatively high accuracy in the the horizontal direction localization, but not in the vertical direction localization. Most importantly, the results of the top-bottom model are almost the same as the left-right model. These results show the utility of a sound image generating system that places the speaker units on the top and bottom sides of a large display.

Keywards

(3)

目 次

1章 序 論 1 1.1 背景 . . . . 1 1.2 目的 . . . . 1 1.3 本論文の構成 . . . . 2 第2章 関連研究 3 2.1 遠隔コラボレーション支援システム「t-Room」1). . . . 3 2.2 音による空間知覚 . . . . 4 2.2.1 音による方向知覚. . . . 4 2.2.2 ステレオスピーカー方式での音像生成と先行音効果 . . . . 6 第3章 音響反射板を用いる音像生成方式 8 3.1 左右配置型音響反射板を用いる音像生成方式 . . . . 8 3.1.1 スピーカユニットの配置 . . . . 8 3.1.2 動作原理. . . . 9 3.2 上下配置型音響反射板を用いる音像生成方式 . . . . 10 3.2.1 スピーカユニットの配置 . . . . 10 3.2.2 動作原理. . . . 10 第4章 システムの構成 125章 受聴者実験による評価 14 5.1 実験条件 . . . . 14 5.2 実験結果と考察 . . . . 15 第6章 まとめ 21 6.1 まとめ . . . . 21 6.2 今後の課題 . . . . 21 参考文献 23 外部発表 24

(4)

1

章 序 論

1.1

背景

近年,情報通信技術の発展により,テレビ会議システムをはじめとする,遠隔地において映像や音 声を共有できるシステムが急速に普及してきており,その研究に関心が寄せられてる.遠隔コラボ レーション支援を目指すシステムの中には,例えば「t-Room」1)のように,遠隔地にいる利用者に同 じ部屋にいるような感覚,即ち同室感あるいは高い臨場感の提供を目指すものが多い.しかし,用い る機器の制約が原因となり,そうしたシステムにおいても,提供される視覚情報と聴覚情報とは必ず しも整合がとれず,この不一致が解決すべき問題として指摘されてきた. 不一致の例として,ディスプレイに映る発話者の口元と異なった位置から音声が聞こえる場面など がある.これは,発話者の視聴覚情報を受ける視聴者と発話者音声を再生するスピーカとの相対的な 位置関係に拠るものである.視覚情報と聴覚情報の不一致を解決すべく,多くの研究がなされてきて おり,青木ら2)が提案した6チャンネルステレオ再生方式では遅延と逆位相を制御することでスピー カ間の中央位置以外での音像定位精度が高まることが確認された.しかしながら,反射の影響が多い t-Roomのような環境ではこの技術の利用は困難である.またRodenasら3)は2chステレオに左右そ れぞれもう1chを加えた4chのステレオ再生に加え,信号処理を加えることで正確な音像定位ができ る領域の拡張ができることを確認した.この方式は受聴者がディスプレイの近くにいる場合対応でき ないことからt-Roomのような環境には不適であった.一方,Gabrielら4)は信号処理に加えスピーカ ユニットの構造に工夫をこらした反射板方式を提言した.この音響反射板を用いる音像生成方式にお いて,先行研究にて,小田らは受聴実験などを通して,音響反射板を用いる音像生成方式を用いるこ とでスピーカとスピーカの中央部以外でも従来のステレオ再生方式よりも,定位精度が改善されるこ とが明らかにした. 一方で,左右型音響反射板を用いる音像生成方式では,t-Roomのようにディスプレイを複数用い るシステムにおいて,スピーカが視覚の妨げとなる問題が存在し,その問題を解決すべく,山下ら6) が新形状の上下配置型音響反射板を用いる音像生成方式を提言し,数値シミュレーションや音響実測 を通して,その音響的な物理的特性が明らかになった.

(5)

置の音響反射板を用いる音像生成方式(左右型)での結果との比較を行うことで,上下型の音像生成 方式の性能を評価する.

1.3

本論文の構成

第2章では,関連研究として遠隔コラボレーション支援システム「t-Room」について述べる.そし て,音の方向知覚の原理について基本的な知識の説明を行い,ステレオスピーカ方式の原理と課題を 述べる.第3章では,本研究で用いる音像生成方法である,音響反射板を用いる音像生成法について 述べ,左右型,上下型についての差異を説明する.第4章では,大型ディスプレイとスピーカユニッ トからなる機器の構成と制御方式となるパニング法の説明をする.第5章では,上下型についての受 聴者実験を行った結果を提示し,その分析結果を述べる.第6章では本研究で明らかになったことに 加え,今後の展開について述べる.

(6)

2

章 関連研究

2.1

遠隔コラボレーション支援システム「

t-Room

1) 近年,ネットワーク通信技術の発展に伴い,テレビ会議システムをはじめとする,遠隔地にて映像, 音声を共有できるシステムが多く提案されている.遠隔コラボレーション支援システム「t-Room」は 複数のディスプレイ,カメラ,スピーカー,マイクを用い,遠隔地を同じ空間上に重ねあわせ,同一 の部屋いるようにすることが目的のシステムである.遠隔地点に同一形状の部屋を用意し,画像サー バ,音サーバを介してネットワークで接続し,他のt-Roomに送信する.この時,映像データや音声 データを保存して再生することにより,過去の会議に参加することもできる.複数のカメラで撮影さ れた片側の部屋にいる人をもう一方の部屋のディスプレイに表示ことにより,高い同室感が期待され ている.  一方で,問題点としては,映像が映し出されることに起因する光学的エコー,ネットワークの負 荷による遅延,多角形の構造に起因する反射による音響エコー,映しだされた発話者の位置から音声 が聞こえない,視覚情報と聴覚情報の不一致など多くの課題が残されている.本研究では,その中で 視覚情報と聴覚情報の不一致を解決することを目的とし,音響反射板を用いる音像生成方式4)を利用 し,ディスプレイ上において正確な音像の生成を目指す. Fig 2.1 t-Roomの概要(文献1)より引用).

(7)

2.2

音による空間知覚

人は頭部にある2つの耳で音情報を受け取り,音の到達方向や距離,広がりなどを知覚する.これ らの知覚が音像定位の手がかりとなり,その知覚に重要な役割を担う物理特性の一つに頭部伝達関数

(HRTF : head-related transfer function)がある.頭部伝達関数は音響信号が受聴者の頭部近傍から鼓

膜に到達するまでの間に畳み込まれる,頭部インパルス応答(HRIR : head-related impulse response) を周波数領域で記述したものである.この頭部インパルス応答の畳み込みを行うことで,空間知覚を 再現することが可能であるが,人の頭部の形状の特徴より,音の到達角度ごとに頭部伝達関数が変化 するため制御が難しいこと,人による頭部の形の違いにより,他人の頭部伝達関数では高い精度での 方向知覚が難しいことなどから,t-Roomのような遠隔コラボレーション支援システムで実現するの は困難である.この事から,本研究では音の空間知覚の中での方向知覚について焦点を当てていく.

2.2.1

音による方向知覚

人は頭部の左右に2つの耳が存在するため,左右間の入射音の差が生じやすい水平面方向の方向 知覚に優れており,差の生じにくい正中面方向の方向知覚の精度は良くない.はじめに,水平方向 の方向知覚について紹介する.水平面方向の方向知覚の手がかりとなっているのが頭部伝達関数に より生じる,両耳間時間差(ITD : interaural time difference)と両耳間レベル差(ILD : interaural level

difference)である. 両耳間時間差と左右音像方向の関係はBlauertらによって調べられている.Fig. 2.2に示す. Fig 2.2 左:両耳間時間差と音像方向の関係 右:インパルス応答による実測例(文献8)より引用) この図から,時間差0msで正面方向に知覚しているものが,約1msの時間差で側方に収束している ことが分かる.また,約-1msから約1msの間ではほぼ線形に推移している.ただし,この両耳間時 間差が左右方向の知覚の手がかりとなるのは約1600Hz以下のみであり,それ以上の周波数では,両 耳入力信号の包絡線を手がかりとしていることが明らかになっている. 両耳間レベル差に関してはBlauertらによって実験により明らかにされており,両耳間レベル差が 0dBの時に正面方向に知覚したものが,約±10dBで側方に知覚している.その図をFig. 2.3に示す.

(8)

Fig 2.3 左:両耳間レベル差と音像方向の関係 右:インパルス応答による実測例(文献8)より引用). また,両耳間レベル差の推移と知覚の位置は線形に推移していることが分かる.両耳間レベル差は 時間差と異なり,可聴周波数全域にわたって左右方向の知覚の手がかりとなっている. 次に,人の前後上下にあたる,正中面方向の方向知覚について紹介する.人の正中面方向の定位精 度は水平面方向と比べて悪く,方向知覚の手がかりも水平面方向のように正中面方向は単純ではない. 方向知覚の手がかりとされているのが,スペクトラルキューと呼ばれる,頭部伝達関数の振幅スペ クトルである.森野らによって調べられた結果ではスペクトラルキューは5kHz以上の周波数帯域に 存在しており,その中でも5kHz-10kHzの周波数成分が含まれていないと正中面方向全体にわたって 精度の高い音像定位の実現が難しいことが明らかとなっている.周波数ごとにおける定位精度をFig. 2.4示す.

(9)

Fig 2.4 正中面定位の精度に及ぼす刺激の周波数範囲の影響(文献8)より引用).

2.2.2

ステレオスピーカー方式での音像生成と先行音効果

前述した両耳間レベル差を応用したシステムがステレオスピーカ方式のシステムで,2つのスピー カの出力レベルの変化により,両耳に届く音圧レベル差を制御し,左右の方向感の制御を実現してい る.このシステムではスピーカからの距離が左右等しい位置で左右から両耳間時間差が0かつ両耳間 レベル差が0の時には2つのスピーカの中央位置に音像定位する.ここで,一方のスピーカに遅れを

(10)

加えると,遅らせなかったスピーカの方へ音像が移動していき,約1msを越すと遅らせなかったス ピーカに定位する.この効果を先行音効果と呼ぶ.また,遅れが約50msを超えるとそれらに知覚す る音像が分離したり,エコーとなって聞こえてしまう. Fig 2.5 ステレオスピーカ方式での方向知覚. Fig. 2.5ではステレオスピーカを利用した場面を想定しており,左側のスピーカSl,右側のSr,ど ちらのスピーカからも等しい音圧レベルで,遅延がないように制御すると,Cの位置で受聴した人は 前述と同様に2つのスピーカの中央位置に音像定位する.次にRの位置で受聴した場合,Slとの距 離はSrよりも遠くなり,それに伴い,Slから到達音の音圧レベルは減衰する.これにより,音圧レ ベル差が生じる.また,Srからの到達時間に比べ時間がかかるため,到達時間差も発生する.この結 果,Rの位置で受聴した場合近い方のスピーカであるSrが優位に働き,Srもしくは,Srに非常に近 い地点に音像定位する.この事から,受聴者が自由に空間内を移動できるt-Roomのような遠隔コラ ボレーション支援システムでは,正しい音像生成がされる範囲が限定的となってしまい,正しい音像 生成がされる受聴域の拡大が望まれていた.

(11)

3

章 音響反射板を用いる音像生成方式

Gabrielらは大型ディスプレイを用いる,t-Roomのような環境下にて,受聴位置にかかわらない音 像生成法4)を提案した.本方式では,左右配置型の音響反射板を用いて音像生成する方式の研究が行 われてきたが,音響反射板がディスプレイ面を遮蔽し,死角が出来る問題の解決策として,ディスプ レイ上下配置型6)も提案された.この章ではそれぞれに対し,スピーカユニットの配置,動作原理に ついて説明する.

3.1

左右配置型音響反射板を用いる音像生成方式

3.1.1

スピーカユニットの配置

左右配置型音響反射板を用いる音像生成方式(左右型)の実装例をFig. 3.1に示す.本方式では t-Roomにような遠隔コラボレーション支援システムでの利用を想定し,60インチなどの大型ディス プレイを縦向きにおいて使用している.構成はその大型ディスプレイの左右部にスピーカユニットを 3基ずつ向かい合うように立てに配置し,その背面と側面をL字型の剛体で覆ったものである. Fig 3.1 左右型音響反射板を用いる音像生成法(左図:文献4)より引用)

(12)

3.1.2

動作原理

ステレオスピーカ方式を用いるとスピーカ間の中央位置から外れて,受聴すると近い方のスピーカ に定位が寄ってしまうことは前章2.2.2で述べた.この問題に対し,本方式にてどのように解決して いるかをFig. 3.2で示す.中央位置Cで受聴した際に両耳間到達時間差,両耳間レベル差が0となる ように制御されているとする.この時中央位置Cで受聴者に到達する第一波面は両スピーカからの 直接音であり,ディスプレイ中央に音像を知覚する.一方で右位置Rで受聴した場合は,スピーカSl からは直接音が到達する,一方でスピーカSrからは音響反射板の影響を受け,直接音ではなく,回 折音が第一波面として到達する.この回折音では,通常の直接音と比べ到達に時間を要している事, 音圧レベルが低減していることから,先行音効果の抑制が出来る.結果,受聴位置Rにおいてもディ スプレイ中央付近に音像定位させることが可能となっている.また,中央付近以外に音像を生成する 場合,左右6基のスピーカユニットの音圧レベル差および音の到達時間差を用いて制御する.その際 の左右の相対するスピーカユニットのパニング法は,時間差制御など多くの手法が考えられるが,現 在は音圧レベル差のみで制御しており,タンゼント則を利用している.

(13)

3.2

上下配置型音響反射板を用いる音像生成方式

3.2.1

スピーカユニットの配置

上下配置型音響反射板(上下型)を用いる音像生成方式の実装例をFig. 3.3に示す.60インチの液 晶ディスプレイを用い,その上下にスピーカユニットを3基ずつ向かい合うように横に配置し,その 背面と側面をL字型の剛体で覆ったものである. Fig 3.3 上下型音響反射板を用いる音像生成法(左図:文献6)より引用).

3.2.2

動作原理

基本的原理は左右型と同じであるが,音像定位の原理についてFig. 3.4を用いて説明する.図中の 例では,スピーカ上段中央,上段右のみが音を発しており,そのスピーカの中央位置にあたる×の位 置が音像生成位置とする.また,両スピーカからは遅延なく同音圧にて音声が流れるとする.中央位 置Cで受聴した場合を想定する.この時,スピーカ上段中央からは回折音,スピーカ上段右からは直 接音が届き,先行音効果の抑制が期待できる.また,Rの位置にて受聴した場合,スピーカ上段中央 から直接音,スピーカ上段右から回折音が第一波面として到達する.この結果,受聴位置がスピーカ の中央位置から外れている場合も×の位置に音像定位することが期待できる.

(14)
(15)

4

章 システムの構成

音響反射板を用いた音像生成方式における,大型ディスプレイとスピーカユニットからなる機器の 構成をFig. 4.1に示す. Fig 4.1 音響反射板を用いる音像生成方式の構成図. 音響反射板を用いる音像生成方式の音像制御システムはクライアントとサーバから構成される.ま ず,クライアントは発話者の音情報と発話者の位置情報をサーバに送信する.サーバはこの位置座標 を受けて,各スピーカごとの音圧の重みを計算し,その重みを音情報に掛けあわせ,オーディオイン ターフェースに出力する.その入力を受けて,それぞれのチャンネルに対応した,音響反射板を用い る音像生成方式のスピーカユニットから音声を再生し,任意の位置に音像を生成する.音像の生成位 置はディスプレイのピクセル位置に対応しており,座標は以下の通りに定義されている. 05 x 5 1080 (4.1) 05 y 5 1920 (4.2) ディスプレイ正面から見て,左上端で座標(0, 0),右下端で座標(1080, 1920)となる.各スピーカの パニングには,ステレオスピーカ方式のパニング法に代表される,タンゼント則9)を用いて計算し た.タンゼント則ではFig. 4.2に示されるように,受聴者の正面と生成する仮想音像との角度をϕ, 正面から各スピーカまでの角度をϕ0として,式(4.3)にて音圧レベル比の重みを決めている.今回の

(16)

上下型では,上下方向に対するパニング法が先行研究などから明確に分かっていないため,一般的な ステレオスピーカ方式の音像生成としてタンゼント則を利用している. tanϕ tanϕ0 =WL−WR WL+WR (4.3) これらの重みの比により上下の音圧レベル比YLYRを算出する. Fig 4.2 ステレオスピーカ方式における仮想音源の生成(文献9)より引用). ここでタンゼント則で得られた重みに対し,上下にあるスピーカの左右間の音圧レベルを,距離減 衰の知見基づき計算し,先ほど求めたYLYRと乗算し,音圧制御を行う.式(4.3)は知見にもとづき シミュレーションによって近似的な値を設定したもので,x∗は式(4.4)によって求められ,各スピー カごとに計算される.

XLevel = a∗ exp(b ∗ x∗) + c∗ exp(d ∗ x∗) (4.4)

x∗=|x−各スピーカのx座標

(17)

5

章 受聴者実験による評価

5.1

実験条件

実験に使用した機器の概要を表5.1に示す.なお,本実験で生成する音像位置の制御は,6基のス ピーカの音圧レベルのみを用いて行った.相対するスピーカ組みのためのパニング法はタンゼント則 とした.受聴試験には,36人の健聴な実験参加者(18∼27歳)が参加し,実験は防音室内で行った. なお,24人の参加者はディスプレイから1mの着座位置で,残りの12人は2m(の着座位置で実験に 参加した.図5.1の左に示すように,本方式によって生成する音像位置は,上段と中段,下段のそれ ぞれに5箇所ずつ,合計で15箇所とした.また,図に示すように,受聴者の回答用に該当箇所に番 号を提示した.受聴者は,図中右に示すように,ディスプレイから1m(あるいは2m)の直線状の3 か所に着座して受聴した. 試験信号は,音像候補位置に関して無作為な順で提示し,また各スピーカの出力音が全て,それぞ れのスピーカ位置から5cmの位置で音圧レベルが80dBになるように設定した.受聴者は,3秒間隔 で提示される試験音を聴き,音像位置と判断した番号を回答した.尚,試験音は成人男性の音声を防 音室で録音したもので,「爆音が高原の銀世界に広がる」という一文を読み上げたものを利用した. Table 5.1 実験機器の仕様概要. 平面スピーカ ONKYO EP150402A04

増幅器 Behringer REFERENCE AMP. A500

オーディオインタフェース MOTU 828mk3 Hybrid

(18)

Fig 5.1 受聴試験の主な条件 (左:音像候補位置の設定, 右:受聴者の着座位置).

5.2

実験結果と考察

はじめに,本研究上下型での1mでの結果と2mでの結果を示す.次に本研究上下型1mでの実験 結果と先行研究における左右型5),ディスプレイ上にスピーカを並べたもの7)の結果の混同行列を示 し,それぞれと比較する. 尚,以下の結果は,水平方向と鉛直方向の結果を別々に集計しており,水平方向に関する定位精度 を観察する際,定位結果における鉛直方向の差異は無視した(例えば,正解「6」に対する回答が「1」 あるいは「11」であっても正解とした.)同様に,鉛直方向に関する定位精度の観察では,水平方向 の差異は無視している.(正解「1」に対する回答は「1-5」の回答であれば正解とした.)鉛直方向に おいて,上段は0,中段は1,下段は2として集計している.

(19)

Fig 5.3 左:水平方向の回答の平均値(2m)右:水平方向の回答の標準偏差(2m). 左図は各座席においての回答の平均値を示すもので,青線は座席Lにて受聴した結果であり,同様 に赤が座席C,緑が座席Rで,紫の直線は理想直線であり,この線に近い方が平均回答が正解に近い ことを示す.右図は標準偏差を示しており,この値が大きくなればなるほど音像がぼやけていること を示す. Fig. 5.2から受聴位置Lの時に4番に制御した音像がが5番方向による,受聴位置Rの時に2番に 制御した音像がが1番による傾向がみられるものの,どの座席位置においても,安定した音像定位が なされている事がわかる.先行研究5)でのステレオスピーカ方式と比較すると今回の上下型において も音響反射板の効果が生じているのは明らかであり,先行研究におけるシミュレーション結果が裏ず れられている. 次に,Fig. 5.2とFig. 5.3の比較を行う.先に行っていた1mの予備試験のアンケートの中に,下部 スピーカからの直接音が気になる,とういう受聴者の指摘があった,そのため1m以外での調査が行 われることとなった.その際,音圧分布のシミュレーション結果6)から,旧形状ではディスプレイか ら2m付近ではビームが発生しており特に1000Hzを超える周波数では正しい音像生成がなされない 可能性が指摘されていたが,本方式においては安定した音圧分布となっているため2mの距離を受聴 者実験に取り入れた.回答の平均値比較すると,両者共に一定の精度で音像定位がなされており,上 下型においては2m程度の距離は問題にならないことが明らかとなった.一方で,標準偏差を見ると 1mの時より2mの時の方がばらつきが大きい事がわかる.距離が離れることによって,音像がぼや ける事が明らかとなった. Fig 5.4 左:鉛直方向の回答の平均値(1m)右:鉛直方向の回答の標準偏差(1m).

(20)

Fig 5.5 左:鉛直方向の回答の平均値(2m)右:鉛直方向の回答の標準偏差(2m). 次に,鉛直方向の結果をFig. 5.4とFig. 5.5から確認する.どちらの平均値を確認しても,おおよ そ,中央位置付近が回答の平均値となり,標準偏差も高い値を示しており,鉛直方向の音像定位精度 があまり良くない事が理解できる.次に両者を比較してみると,2mの時の方が1mの時よりも平均 値が綺麗な直線となっていることがわかる.また,1mの受聴位置ではディスプレイ下側に音像定位 する事が多く,2mではこの点が生じていない.この原因として考えられるのが,1mの位置ではス ピーカから近い事もあり,直接音が若干漏れて下のスピーカが支配的になった事が一つ考えられる. 次に本研究「上下型でのディスプレイから1m位置での結果」と,先行研究の「左右型でのディス プレイ位置から1mの結果」5),及び先行研究の「ディスプレイ位置に薄型平面スピーカを設置して スピーカ上に音源を置いたディスプレイ位置から1mの結果」7)を比較し,上下型の有効性を検討す る.この先行研究における,ディスプレイ上にスピーカ音源を置いた実験結果は,大型ディスプレイ 上に音像を生成する方式の理想的状況であり,本研究での上下型においても,この音像定位精度が目 指せる上限となっている.尚,混同行列では水平方向の正解率が70 %以上で濃い青,70-50 %でやや 濃い青,50-30 %で薄い青で強調している.

(21)

Fig 5.7 受聴位置Cにおける水平方向の混同行列の比較(左:上下型,中央:左右型 ,右:ディスプレ イ上に音源). Fig 5.8 受聴位置Rにおける水平方向の混同行列の比較(左:上下型,中央:左右型 ,右:ディスプレ イ上に音源). Fig. 5.6∼Fig. 5.11のそれぞれにおいて,左図は上下型の,中央図は左右型の,右図はスピーカを パネル上においた場合の混同行列を示し,これらの水平方向の定位精度を比較し考察をする.受聴位 置L,C,R全てにおいて,上下型では1,3,5番の定位精度がスピーカ上に音源がある場合と比較して 同等であることが読み取れる.この理由として,1,3,5番の座標位置の制御が1,3,5の上下についてい るスピーカのみで制御可能であるため,音像があまりぼやけないことによると考えられる.次に上下 型の2,4と左右型2,4に注目する.座席位置L,C,Rいずれにおいてもほぼ同等の音像定位精度であ り,このことから,上下に配置しても左右に配置した場合と同様の精度が得られる事がわかる. 次に鉛直方向の音像定位精度を水平方向と同様に比較していく.本研究上下型では,1-5のように 5つのパターンで出題しておらず,およそ,先行研究の2,3,4番位置に0,1,2番が該当する.尚,混同 行列では鉛直方向の正解率が50 %以上で濃い青,50-30 %でやや濃い青,30-20 %で薄い青で強調し ている.

(22)

Fig 5.9 受聴位置Lにおける鉛直方向の混同行列の比較(左:上下型,中央:左右型 ,右:ディスプレ イ上に音源).

Fig 5.10 受聴位置Cにおける鉛直方向の混同行列の比較(左:上下型,中央:左右型 ,右:ディスプレ

(23)

カがあるが,左右型では鉛直方向に3つずつあることの差によるものと思われる.この事から,厳密 な比較とはなっていないが,上下型は左右型よりも鉛直方向の音像定位精度が悪く,制御が難しいと 思われる.しかしながら,どの実験結果においても50%以上を示す,濃い青の表示が少なく,ディス プレイ上に音源を生成した,音像がぼやけない状況においても音像定位精度が悪いことから,人の鉛 直方向の音像定位が苦手であり,音像生成手法が仮に正しく音像を作ったとしても,それが正しく定 位されるとは限らないことも分かる.

(24)

6

章 まとめ

6.1

まとめ

本研究では上下配置型音響反射板を用いた音像生成法の音像生成能力を,受聴者実験を通して評 価を行った.また,先行研究における左右型やディスプレイ面上に音源がある場合の音像定位精度と の比較を行った.水平方向においては1mの条件下でも2mの条件下でも音響反射板を用いる音像生 成方式においての一定の効果が確認できた.一方,鉛直方向においては,1mの距離では若干下のス ピーカに引き寄せられ下方向に音像定位する傾向がみられた.2mの距離においては,下方向へ引き 寄せられる傾向は出ておらず,距離が近い際に下側のスピーカからの直接音の影響を受けている事が 推測される.次に先行研究との比較では,水平方向において,従来の左右型よりも高い音像定位精度 を示していることが確認できた.一方,鉛直方向では,一定の音像定位精度はでるものの,従来の左 右型よりも音像がぼやける傾向を示しており,さらなる音像定位精度の向上が望まれる.これらの結 果より上下型において音響反射板の効果が確認でき,その有用性を示すことができた.

6.2

今後の課題

現段階では,上下型において,音声を利用しての受聴者実験のみであり,映像を含めた受聴者実験 などを通して,同室感の向上にどう影響するかを調査する必要がある.そのために口元音像生成など 「t-Room」に取り込むために必要なシステムの開発が必要となる.また,鉛直方向において音像がぼ やける傾向があり,この点に関して今後改良が必要となる.また,今回の制御はタンゼント則を用い た音圧制御のみで行ったが,より良いパニングや時間差制御など高い音像定位精度のために良い手法 をさらに検討する必要がある.

(25)

謝辞

本研究を進めるにあたって,たくさんのご指導,ご指摘を頂きました,同志社大学大学院の片桐滋 教授,大崎美穂准教授には心から感謝を申し上げます.本研究の実験の実施にあたり,土屋隆生教授 をはじめとする情報システムデザイン学科応用メディア情報研究室の方々には防音室利用の便宜を 図って頂きました.また,被験者実験においては多くの参加者の方に貴重なデータを収集させていた だきました.ご協力ありがとうございました.共に研究を行った,音響班の田中健太郎君,原 駿君 には貴重な意見を頂いたり,研究を進める上で支えていただきました,有意義な時間をありがとうご ざいました.最後にいつも支えてくださった家族や共創情報学研究室のメンバー皆様に心からの感謝 を持って謝辞とさせていただきます.

(26)

参考文献

1) Keiji Hirata, Yasunori Harada, Toshihiro Takada, Shigemi Aoyagi, Yoshinari Shirai, Naomi Yamashita, and Junji Yamato,“ The t-Room: toward the future phone ”, NTT Technical Review, vol.4, no.12, pp.26-33 (2006).

2) Shigeaki Aoki ,Nobuo Koizumi,“ Expansion of listening area with good localization in audio confer-encing ”, Proc. ICASSP ’87, pp.149-152, 1987.

3) Josep A. R ´odenas, Ronald M. Aarts, A. J. E. M. Janssen,“ Derivation of an optimal directivity pattern for sweet spot widening in stereo sound reproduction ”, J. Acoust. Soc. Am., 113(1), 267-278, 2003. 4) Gabriel Pablo Nava, Keiji Hirata, Masato Miyoshi,“A loudspeaker design for sound image localization

on large flatscreens,”Acous. Sci. & Tech. 31(4),278-287,2010.

5) 小田尚行,Gabriel Pablo Nava,萩巣晋平,柴田真尚,片桐滋,大崎美穂,“ 平面ディスプレイと 音響反射板を用いた音像生成システムの受聴実験評価 ”,日本音響学会秋季研究発表会,2011. 6) 山下春香, “音響反射板付きスピーカユニットをディスプレイ上下に配置する音像生成方式の提 案,”同志社大学大学院理工学研究科修士論文, 2015. 7) 松村友輔 ,“ 大型ディスプレイ上の音源位置に関する同定能力の分析:その1 ”,同志社大学理工 学部卒業論文,2015. 8) 飯田一博,森本政之,“ 空間音響学 ”,コロナ社,2011.

9) 安藤彰男,”高臨場感音響技術とその理論Theory of Three-Dimensional Sound Field Reproduction”,

(27)

外部発表

i) 熊谷駿来,田中健太郎,原 駿,片桐滋,大崎美穂,上下配置型音響反射板を用いる音像生成方

Fig 2.3 左:両耳間レベル差と音像方向の関係 右:インパルス応答による実測例 ( 文献 8) より引用 ) . また,両耳間レベル差の推移と知覚の位置は線形に推移していることが分かる.両耳間レベル差は 時間差と異なり,可聴周波数全域にわたって左右方向の知覚の手がかりとなっている. 次に,人の前後上下にあたる,正中面方向の方向知覚について紹介する.人の正中面方向の定位精 度は水平面方向と比べて悪く,方向知覚の手がかりも水平面方向のように正中面方向は単純ではない. 方向知覚の手がかりとされているのが,スペ
Fig 2.4 正中面定位の精度に及ぼす刺激の周波数範囲の影響 ( 文献 8) より引用 ) . 2.2.2 ステレオスピーカー方式での音像生成と先行音効果 前述した両耳間レベル差を応用したシステムがステレオスピーカ方式のシステムで, 2 つのスピー カの出力レベルの変化により,両耳に届く音圧レベル差を制御し,左右の方向感の制御を実現してい る.このシステムではスピーカからの距離が左右等しい位置で左右から両耳間時間差が 0 かつ両耳間 レベル差が 0 の時には 2 つのスピーカの中央位置に音像定位する.ここ
Fig 3.4 上下型の動作原理.
Fig 5.1 受聴試験の主な条件  ( 左 : 音像候補位置の設定, 右 : 受聴者の着座位置 ) . 5.2 実験結果と考察 はじめに,本研究上下型での 1m での結果と 2m での結果を示す.次に本研究上下型 1m での実験 結果と先行研究における左右型 5) ,ディスプレイ上にスピーカを並べたもの 7) の結果の混同行列を示 し,それぞれと比較する. 尚,以下の結果は,水平方向と鉛直方向の結果を別々に集計しており,水平方向に関する定位精度 を観察する際,定位結果における鉛直方向の差異は無視した(例え
+5

参照

関連したドキュメント

Many interesting graphs are obtained from combining pairs (or more) of graphs or operating on a single graph in some way. We now discuss a number of operations which are used

In light of his work extending Watson’s proof [85] of Ramanujan’s fifth order mock theta function identities [4] [5] [6], George eventually considered q- Appell series... I found

All (4 × 4) rank one solutions of the Yang equation with rational vacuum curve with ordinary double point are gauge equivalent to the Cherednik solution.. The Cherednik and the

Ulrich : Cycloaddition Reactions of Heterocumulenes 1967 Academic Press, New York, 84 J.L.. Prossel,

The focus has been on some of the connections between recent work on general state space Markov chains and results from mixing processes and the implica- tions for Markov chain

Some new oscillation and nonoscillation criteria are given for linear delay or advanced differential equations with variable coef- ficients and not (necessarily) constant delays

Classical definitions of locally complete intersection (l.c.i.) homomor- phisms of commutative rings are limited to maps that are essentially of finite type, or flat.. The

Yin, “Global existence and blow-up phenomena for an integrable two-component Camassa-Holm shallow water system,” Journal of Differential Equations, vol.. Yin, “Global weak