• 検索結果がありません。

音声圧縮データの特性調査

N/A
N/A
Protected

Academic year: 2021

シェア "音声圧縮データの特性調査"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

情報システム工学科 平成

18

年度後期 「自主課題研究」

研究テーマ

:

音声圧縮データの特性調査

名列番号 : 017 小林 幸司 平成19213

1

研究課題

音声圧縮には、人間の聴覚特性である「最小可聴限界」と

「マスキング効果」を利用し 、聞き取りづらい部分の情報を 減らすことで大幅にデータを小さくする非可逆圧縮を行う ものが広く用いられている。本課題では、MP3MPEG-1 Aoudio Layer-3)による非可逆圧縮によって、エンコード

/デコード 後のデータが元データと比較してにどのように 変化しているかを調査する。また、MP3のビットレート や音声データに含まれる音の種類によってどのような違い がでるかも調べる。

2

研究方法

音の種類の違うWAVEファイルをいくつか用意し 、ビッ トレート別(32、64、128)にエンコードしてMP3ファイ ルを作る。MP3ファイルをデコードしてWAVEファイル に戻し 、圧縮前のWAVEファイルと比較する。

<比較方法>

WAVEファイルの音声データ部分を読みとり、1024点毎 にフーリエ変換して振幅スペクトルを求めるプログラムを C言語で作成した。このプログラムによって得られる周波 数特性のグラフの見比べと、実際の耳での聞き比べによっ て比較を行う。

3

結果と考察

ビットレートを変化させたところ、32kbps、64kbps は人間の可聴範囲である1000Hz〜20kHzの周波数成分を 大幅に削っており、実際に耳で聞いて分かる程に音質は低

下していた。ビットレートによってかなり音質には差がで るため、MP3によるエンコードの際にはビットレートの設 定は重要である。音の種類による比較では、楽器の音のみ WAVEファイルより、楽器の音と歌声の入ったWAVE ファイルの方が圧縮前後の差が大きいことがグラフからわ かった。このことより、様々な種類の周波数成分を含む音 声データの方が圧縮による影響を受けやすいということが 言える。

4

今後の課題と感想

非可逆圧縮によって音声データの周波数成分が削られて いることがわかったが、実行結果のグラフを見る限りでは 人間がほとんど 聞き取れないはずの低周波成分、高周波成 分がほぼそのまま残っており、MP3の圧縮の原理である人 間の聴覚特性とは矛盾しているように見える。これについ てはプログラムの見直しやMP3の仕組みに関するさらに 深い調査が必要であると思われる。また、今回は3種類し か元データとなるWAVEファイルを用意していなかった ので、もっと様々な種類の音による比較ができればよかっ た。自分の情報通信やC言語に関する理解不足によって研 究の進行が遅れたために課題が多く残る結果となったが 、 今回の研究で理解を深めることができたので有意義だった と思う。

1

参照

関連したドキュメント

音節の外側に解放されることがない】)。ところがこ

どにより異なる値をとると思われる.ところで,かっ

 TV会議やハンズフリー電話においては、音声のスピーカからマイク

わからない その他 がん検診を受けても見落としがあると思っているから がん検診そのものを知らないから

巣造りから雛が生まれるころの大事な時 期は、深い雪に被われて人が入っていけ

今回、新たな制度ができることをきっかけに、ステークホルダー別に寄せられている声を分析

核種分析等によりデータの蓄積を行うが、 HP5-1

都調査において、稲わら等のバイオ燃焼については、検出された元素数が少なか