• 検索結果がありません。

画像音声伝送品質向上のための適応信号処理手法と

N/A
N/A
Protected

Academic year: 2021

シェア "画像音声伝送品質向上のための適応信号処理手法と"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

博 士 ( 情 報 科 学 ) 南    重 信

学 位 論 文 題 名

画像音声伝送品質向上のための適応信号処理手法と      その応用に関する研究

学位論文内容の要旨

    本論文は 適応信号処理を用いて,画 像・音声伝送の品質を向上する研究の成果をまとめたもの である.

    近年,テレビ電話・会議をど画像・音声を用いた通信が幅広く実用化されている,このよう毅通 信において, 画像・音声の伝送品質向上 は非常に重要であり,多くの研究開発が行われている.一 方,品質向上 の鍵と誼る信号処理では,LSIの高性能化をどにより,データの統計的性質や外部環境 の変化に柔軟に対応できる適応信号処理が,従来,実現困難であった画像分野にまでっその応用範囲 を広げている,

    本論文では,このようを背景から,適応信号処理を用いた画像・音声伝送品質向上に関する研究 成果を,ステレオ音声伝送品質向上を.目的とした第ーの研究と,離散コサイン変換を用いた画像符号 化のプロック境界歪みを軽減する第二の研究に大別してまとめる.

    まず,第一の研究である,ステレオ音声伝送の品質向上では,ステレオ音声符号化の品質向上と ステレオ音響 エコーキャンセラの打ち消 し性能向上を図る,前者に関しては,MPEGオーディオをど ステレオ楽音を対象とした符号化方式に関する研究が活発に行われている.しかしをがら,楽音の符 号化を第一の目的として開発されたものであるため,ステレオ音声伝送の観点からは,必ずしも最適 顔符号化とは 言え教い.また,後者のス テレオ音響エコーキャンセラでは,ステレオ音声伝送のよ うに左右の音声間に強い相関(チャンネル間相関)が存在する場合,多次元適応フィルタの収束速度 が大幅に劣化するといった課題がある.このため,従来方式として,左右に,独立した非線形歪みを 与えて相関を 弱める方式や,過去の複数 サンプルにおけるチャンネル間相関の揺らぎを利用して適 応フィルタの 係数修正をアフイン変換で 直交化する方式等が提案されている,しかしをがら,前者 は音声品質に劣化を与えるという課題があり,後者は,遠端発言者の変化に起因するチャンネル間相 関 の 大 き 顔 変 動 を 活 用 し よ う と す る と 逆 行 列 演 算 量 が 膨 大 に 教 る と い っ た 課 題 が あ る .     そこで,第ーの研究では,会話型のステレオ音声伝送を前提とし,その音声生成系に着目するこ とにより,上述の複数の課題を解決する,会話の大部分を占める単独発言時には,単一音源音声が左 右のマイクロフオンに入カすることにより,仮想的にチャンネル間の伝達関数を定義できる.本提案 方式では,こ のチャンネル間伝達関数を 適応信号処理の代表的教実現手法である適応フィルタを用 いて推定し, 活用する.まず,提案方式 の基本と謡る疑似ステレオ音声符号化方式では,単独発言 時のステレオ 音声を,片側チャンネルの 音声(主音声)とチャンネル間伝達関数で符号化する.通 常,発言者位置や室内音響特性の変動は音声そのものの変動より大幅に小さいため,他のチャンネル の音声GfIiJ音声)を,そのまま符号化するより,チャンネル間伝達関数を符号化する方が,より少額い

‑ 846 ‑

(2)

情報量で符号化できる.しかしをがら,この方式は,会話の大部分を占める単独発言では有効である が,複数同時発言のある,完全をステレオ音声に,そのまま適用できをい.そのため,提案方式ではっ 疑 似ステレオ音声符号化に, チャンネル間相関を除去した残差信号を符号化して追加することによ り ,完全をステレオ音声符号 化に拡張する.この原理を用 いたステレオADPCM方式では,さらに,

このチャンネル間伝達関数を別チャンネルで伝送すること教く,残差信号伝送のみで伝送する,この 方 式の実験では32kbpsを主チ ャンネル,16kbpsを副チャンネルに割り当て,チャンネル間相関除去 により6‑10dB程度セグメンタルSNRが改善することを確認した.

    次に,このチャンネル間伝達関数をステレオ音響エコーキャンセラに適用し,前述の課題である チ ャンネル間相関による収束 速度の劣化を改善する方式について説明する,基本方式である疑似ス テレオ音声用音響工コーキャンセラは,主音声のみを入カとするモノラル適応フィルタであり,副音 声 をチャンネル間伝達関数に 主音声を入カして得られる出力信号とみをすことにより,主音声のみ を入カする適応フィルタで音響エコーを抑圧できる.このエコーキャンセラは,発言者位置変化によ り,チャンネル聞伝達関数が変化すると,対応する複数の推定チャンネル聞伝達関数とともに方程式 を解くことにより,真のステレオ・工コーパス特性を推定できる,しかし教がら,この方式は,疑似 ス テレオ音声符号化同様,複 数同時発言時をどには適用でき教い,そこで,本研究では,多次元適 応 フィルタを用いたステレオ 音響エコーキャンセラをェコー抑圧に用い,疑似ステレオ音声エコー キ ャンセラは,チャンネル聞 伝達関数の変化を利用したステレオ・エコーパス特性の推定動作のみ に用いる.これにより,従来の最小二乗誤差やアフアン変換を用いたステレオ音響エコーキャンセラ の収束が.速端発言者の変化時点で飛躍的に改善する.

    次に,第二の研究では, 画像圧縮伸長処理の品質向上 を目的した研究成果について述べる.

JPEGやMPEGを ど国 際 標準 方式 に広 く採 用 され てい る離 散コ サ イン 変換 を用 い た画像符 号化方 式では,帯域圧縮が大きい場合,中間値を用いる従来の逆量子化手法では,直流近傍の誤差によるプ ロ ック歪みが顕著にをり画像 品質を劣化させる.このため,従来方式では,復号後の画像のプロツ ク 境界に低域フィルタを適用 することにより,ブロック境界の平坦化を図る,しかしをがら,この 場 合,低域フィルタにより高 域成分も損をわれるため,画像がばけるという問題がある.また,低 域 フィルタの特性を画像の局 所特性で変化させ,最適を高域抑圧を行う方式も最近提案されている が,処理が複雑にをるといった課題がある.本研究では,離散コサイン変換係数の逆量子化値をパラ メ タとする適応フィルタを想 定し,プロック境界の不連続 性の評価関数をMSDS(Mean Difference of Slope)として定義する.こ のMSDSを最小化する逆量子 化値を,上述の適応フィルタの最適化問 題 として解くことによルプロ ック歪みを抑圧する,この方式では,プロック歪みを引き起こす要因 と をる低域成分のみの離散コ サイン変換係数を対象に最適を逆量子化パラメタを求めるため,画像 が ばやける原因とをる高域成 分を保存でき,復号画像の品質を向上することができる,さらに,復 号側で処理するため,通信の互換性には影響を与え顔い.

    本論文では,第一章で, 研究の背景や基本とをる適応信号処理の概要を述べたのち,第二章で チャンネル聞伝達関数推定を用いたステレオ音声伝送方式を,第三章では,チヤンネル間伝達関数推 定 を用いたステレオ音響エコ ーキャンセラを提案する.第四章では,適応信号処理を用いた画像の プロック境界歪みを抑圧する方式を提案し,第五章で結びとする.

847

(3)

学位論文審査の要旨 主査    教授   長谷山美紀 副査    教授    山 本    強 副査    教授    荒 木健治

学 位 論 文 題 名

画像音声伝送品質向上のための適応信号処理手法と      その応用に関する研究

  本論文は適応信号処理を用いて,画像・音声伝送の品質を向上する研究の成果をまとめたもので ある,

  近年,テレビ電話・会議ナょど画像・音声を用いた通信が幅広く実用化されている.このようを通信 において,画像・音声の伝送品質向上は非常に重要であり,多くの研究開発が行われている,一方,品 質向上の鍵とをる信号処理では,LSIの高性能化をどにより,データの統計的性質や外部環境の変化 に柔軟に対応できる適応信号処理が,従来,実現困難であった画像分野にまで,その応用範囲を広げ ている,

  本論文では,このようを背景から,適応信号処理を用いた画像・音声伝送品質向上に関する研究成 果を,ステレオ音声伝送品質向上を目的とした第ーの研究と,離散コサイン変換を用いた画像符号化 のプロック境界歪みを軽減する第二の研究に大別してまとめる,

  まず,第ーの研究である,ステレオ音声伝送の品質向上では,ステレオ音声符号化の品質向上とス テレオ音響エコーキャンセラの打ち消し性能向上を図る,前者に関しては,MPEGオーディオをどス テレオ楽音を対象とした符号化方式に関する研究が活発に行われている.しかしをがら,楽音の符号 化を第一の目的として開発されたものであるため,ステレオ音声伝送の観点からは,必ずしも最適 を符号化とは言え教い.また,後者のステレオ音響エコーキャンセラでは,ステレオ音声伝送のよう に左右の音声間に強い相関(チャンネル間相関)が存在する場合,多次元適応フィルタの収束速度が 大幅に劣化するといった課題がある.このため,従来方式として,左右に,独立した非線形歪みを与 えて相関を弱める方式や,過去の複数サンプルにおけるチャンネル間相関の揺らぎを利用して適応 フィルタの係数修正をアフイン変換で直交化する方式等が提案されている.しかしをがら,前者は音 声品質に劣化を与えるという課題があり,後者は,遠端発言者の変化に起因するチャンネル間相関の 大 き 顔 変 動 を 活 用 し よ う と す る と 逆 行 列 演 算 量 が 膨 大 に を る と い っ た 課 題 が あ る .   そこで,第一の研究では,会話型のステレオ音声伝送を前提とし,その音声生成系に着目すること により,上述の複数の課題を解決する,会話の大部分を占める単独発言時には,単一音源音声が左右 のマイクロフオンに入カすることにより、仮想的にチャンネル問の伝達関数を定義できる,本提案方 式では,このチャンネル間伝達関数を適応信号処理の代表的を実現手法である適応フィルタを用い て推定し,活用する.まず,提案方式の基本とをる疑似ステレオ音声符号化方式では,単独発言時の ステレオ音声を,片側チャンネルの音声(主音声)とチャンネル間伝達関数で符号化する,通常,発言 者位置や室内音響特性の変動は音声そのものの変動より大幅に小さいため,他のチャンネルの音声

(副音声)を,そのまま符号化するより,チャンネル間伝達関数を符号化する方が,より少数い情報量

848

(4)

で符号化できる,しかし謡がら,この方式は,会話の大部分を占める単独発言では有効であるが.複 数同時発言のある,完全叔ステレオ音声に,そのまま適用でき誼い,そのため,提案方式では,疑似ス テレオ音声符号化に,チャンネル間相関を除去した残差信号を符号化して追加することによりっ完全 を ステレオ 音声符号化に拡張する,この原理を用いたステレオADPCM方式では,さらに,このチャ ンネル間伝達関数を別チャンネルで伝送することをく,残差信号伝送のみで伝送する.この方式の 実験では32kbpsを主チャンネル,16kbpsを副チャンネルに割り当て,チャンネル間相関除去により 6‑lOdB程度セグメンタルSNRが改善することを確認した,

  次に,このチャンネル間伝達関数をステレオ音響工コーキャンセラに適用し,前述の課題である チャンネル間相関による収束速度の劣化を改善する方式について説明する,基本方式である疑似ス テレオ音声用音響エコーキャンセラは,主音声のみを入カとするモノラル適応フィルタであり,副音 声をチャンネル間伝達関数に主音声を入カして得られる出力信号とみをすことにより,主音声のみ を入カする適応フィルタで音響エコーを抑圧できる.このエコーキャンセラは,発言者位置変化によ り,チャンネル間伝達関数が変化すると,対応する複数の推定チャンネル間伝達関数とともに方程式 を解くことにより,真のステレオ・エコーパス特性を推定できる,しかしをがら,この方式は,疑似ス テレオ音声符号化同様,複数同時発言時をどには適用できをい.そこで,本研究では,多次元適応フイ ルタを用いたステレオ音響エコーキャンセラをエコー抑圧に用い‐疑似ステレオ音声エコーキャン セラは,チャンネル聞伝達関数の変化を利用したステレオ・エコーパス特性の推定動作のみに用い る.これにより,従来の最小二乗誤差やアフイン変換を用いたステレオ音響エコーキャンセラの収束 が.遠端発言者の変化時点で飛躍的に改善する.

  次に,第二の研究では,画像圧縮伸長処理の品質向上を目的した研究成果について述べる.JPEGや MPEG顔 ど国際 標準方 式に広 く採用 されている離散コサイン変換を用いた画像符号化方式では,帯 域圧縮が大きい場合,中間値を用いる従来の逆量子化手法では,直流近傍の誤差によるプロック歪 みが顕著に顔り画像品質を劣化させる,このため,従来方式では,復号後の画像のプロック境界に 低域フィルタを適用することにより,プロック境界の平坦化を図る.しかしをがら,この場合,低域 フィルタにより高域成分も損をわれるため,画像がばけるという問題がある.また,低域フィルタの 特性を画像の局所特性で変化させっ最適を高域抑圧を行う方式も最近提案されているが,処理が複雑 に教るといった課題がある.本研究では,離散コサイン変換係数の逆量子化値をパラメタとする適応 フィルタを想定し,プロック境界の不連続性の評価関数をMSDS(Mean Difference of Slope)として 定 義する, このMSDSを最小 化する 逆量子化値を,上述の適応フィルタの最適化問題として解くこ とによルブロック歪みを抑圧する.この方式では,プロック歪みを引き起こす要因と抵る低域成分の みの離散コサイン変換係数を対象に最適顔逆量子化パラメタを求めるため,画像がばやける原因と をる高域成分を保存でき,復号画像の品質を向上することができる,さらに,復号側で処理するため,

通信の互換性には影響を与えない,

  これを要するに,著者は,適応信号処理を用いた画像・音声伝送品質向上を目的として,ステレオ 音声符号化品質とステレオ音響エコーキャンセラの打ち消し性能の向上を図り,さらに,画像符号化 のプロック境界ひずみの軽減を実現したものであり,情報処理工学に貢献するところ大をるものが あ る,よっ て著者 は,北 海道大 学博士 (情報科学)の学位を授与される資格あるものと認める,

849

参照

関連したドキュメント

そのため本研究では,数理的解析手法の一つである サポートベクタマシン 2) (Support Vector

機械物理研究室では,光などの自然現象を 活用した高速・知的情報処理の創成を目指 した研究に取り組んでいます。応用物理学 会の「光

以上,本研究で対象とする比較的空気を多く 含む湿り蒸気の熱・物質移動の促進において,こ

The goods and/or their replicas, the technology and/or software found in this catalog are subject to complementary export regulations by Foreign Exchange and Foreign Trade Law

実際, クラス C の多様体については, ここでは 詳細には述べないが, 代数 reduction をはじめ類似のいくつかの方法を 組み合わせてその構造を組織的に研究することができる

研究計画書(様式 2)の項目 27~29 の内容に沿って、個人情報や提供されたデータの「①利用 目的」

Instagram 等 Flickr 以外にも多くの画像共有サイトがあるにも 関わらず, Flickr を利用する研究が多いことには, 大きく分けて 2

①物流品質を向上させたい ②冷蔵・冷凍の温度管理を徹底したい ③低コストの物流センターを使用したい ④24時間365日対応の運用したい