• 検索結果がありません。

v.connect 開発当初 素片接続型合成器 入力 VSQファイル コーパス UTAU音源 分析合成 STRAIGHT Vocaloid2用 シーケンス UTAU用 ライブラリ v.connect STRAIGHT STRAIGHT版は 開発終了 合成音

N/A
N/A
Protected

Academic year: 2021

シェア "v.connect 開発当初 素片接続型合成器 入力 VSQファイル コーパス UTAU音源 分析合成 STRAIGHT Vocaloid2用 シーケンス UTAU用 ライブラリ v.connect STRAIGHT STRAIGHT版は 開発終了 合成音"

Copied!
49
0
0

読み込み中.... (全文を見る)

全文

(1)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

v.Connect

v.Connect

ユーザが声色操作を

ユーザが声色操作を

指定できる歌声合成器

指定できる歌声合成器

電気通信大学 情報工学科

電気通信大学 情報工学科

小川 真, 矢崎 俊志, 阿部 公輝

小川 真, 矢崎 俊志, 阿部 公輝

(

(

阿部公輝 研究室

阿部公輝 研究室

)

)

(2)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

v.Connect(開発当初)

素片接続型合成器

入力   :

VSQファイル

コーパス :

UTAU音源

分析合成:

STRAIGHT

STRAIGHT版は

開発終了

Vocaloid2用 シーケンス v.Connect UTAU用 ライブラリ STRAIGHT 合成音

(3)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

v.Connect(現在)

素片接続型合成器

GUI    :Cadencii

コーパス :

UTAU音源

分析合成:

WORLD

Cadencii Projectにて

現在も開発中

v.Connect UTAU用 ライブラリ WORLD 合成音 GUI Cadencii

(4)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

Cadencii

HN: kbinani 氏制作

GUI アプリケーション

歌声合成器向け

ピアノロール シーケンサ

様々な合成器に対し

統一的な操作が可能

v.Connect を

合成器として添付

(5)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

合成例

(1)

v.Connect デモンストレーション

Toss Up」

本発表の技術を使用

sm15561654

【歌声合成器デモ】Toss Up【波音リツコネクト】

(6)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

発表の流れ

v.Connect 開発の経緯

研究背景・動機・目的

提案法

課題点

研究成果

まとめ

(7)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

歌声合成ツール

UTAU

フリーの歌声合成器

HN : 飴屋/菖蒲氏開発

規格がオープン

– 自由にライブラリを作成可能 – 3,000 以上のライブラリ

(8)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

UTAU 向けライブラリ

アライメント情報つき波形データ

多くはキャラクタと共に配布

声色別の収録

波形データ アライメント 先行発音 300ms 固定長区間 600ms ファイル名 あえ.wav VCV音素名 a え

(9)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

UTAU 向けライブラリ例 (1)

櫻歌ミコ

2ch VIP 発

: HN: 赤ずきん氏

: HN: 縣氏

収録内容

– CV / VCV 音素片 – 「パワー」「ささやき」などの 声色別の収録 7 種類 – キャラクタイラスト ●

http://miko35.is-mine.net/

(10)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

UTAU 向けライブラリ例 (2)

歌う音ナミ

マレーシア発

声・絵

: HN: Nami-chan 氏

収録内容

– CV / VCV 音素片 – “Soft”, “Sweet” などの 声色別の収録 5 種類 – キャラクタイラスト ●

http://utaunenami.webs.com/

(11)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

UTAU 向けライブラリ例 (3)

龍音セイチ

アメリカ発

声:

HN: RyuuSeichi 氏

絵:

HN: 漆原 龍紅氏

録音

: HN: Yoru 氏

収録内容

– VCV 音素片 – “Normal”, “Whisper” の 声色別の収録 2 種類 – キャラクタイラスト

(12)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

問題点

1ライブラリに対し1合成器

フレーズ/音符毎に切り替えを行う

声色A ライブラリ 歌声合成器 楽譜情報 声色Aの歌声 声色B ライブラリ 歌声合成器 楽譜情報 声色Bの歌声 DAWなど 波形編集ソフト

(13)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

問題点

1ライブラリに対し1合成器

フレーズ/音符毎に切り替えを行う

声色A ライブラリ 歌声合成器 楽譜情報 声色Aの歌声 声色B ライブラリ 歌声合成器 楽譜情報 声色Bの歌声 DAWなど 波形編集ソフト ライブラリを同時に使いたい

(14)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

問題点

1ライブラリに対し1合成器

フレーズ/音符毎に切り替えを行う

声色A ライブラリ 歌声合成器 楽譜情報 声色Aの歌声 声色B ライブラリ 歌声合成器 楽譜情報 声色Bの歌声 DAWなど 波形編集ソフト ライブラリを同時に使いたい できれば滑らかに変化させたい

(15)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

目的

歌声合成器に声質モーフィング機能を追加

任意時刻での

モーフィング率指定を

可能にする

声色A 声色B

(16)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

提案法(概要)

F0生成モデル WORLD Synthesis Output: 合成歌唱 表情パラメータ 音高情報 歌詞 スペクトル・残差 F0 声色A ライブラリ 声色B ライブラリ 時間伸縮用 マッチング関数 接続モデル 時間伸縮モデル 統合された 声色ライブラリ Input: 演奏情報 GUI Cadencii

(17)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

課題点

(Webでの配布に向けて)

処理速度低下

モーフィングによる処理量の増大

⇒事前に合成しやすい形へ分析

ライブラリ容量の増大

処理速度とトレードオフ

⇒低次メルケプストラムと

Vorbis で圧縮

ライブラリ間での発音の違い

⇒素片ごとに時間の対応付けを行い補正

(18)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

課題点

処理速度低下

モーフィングによる処理量の増大

⇒事前に合成しやすい形へ分析

ライブラリ容量の増大

処理速度とトレードオフ

⇒低次メルケプストラムと

Vorbis で圧縮

ライブラリ間での発音の違い

⇒素片ごとに時間の対応付けを行い補正

(19)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

音声分析合成系

WORLD

音声信号 WORLD F0 列 STAR スペクトログラム 励起信号スペクトル DIO STAR PLATINUM ●

Vocoder ベースで高速・高品質

単純な分析・再合成だけなら同時に行なえる

– かかる時間は分析>再合成

(20)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

課題点

処理速度低下

モーフィングによる処理量の増大

⇒事前に合成しやすい形へ分析

ライブラリ容量の増大

処理速度とトレードオフ

⇒低次メルケプストラムと

Vorbis で圧縮

ライブラリ間での発音の違い

⇒素片ごとに時間の対応付けを行い補正

(21)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

WORLD のデータサイズ

標本化周波数

44,100[Hz] の場合

⇛分析シフト長

n[ms] 毎に約 3,000 点必要

 

n = 2 の時で波形の 約 30 倍のデータ量

音声信号 WORLD F0 列 STAR スペクトログラム 励起信号スペクトル DIO STAR PLATINUM 1025 次元 1 次元 2048 次元

(22)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

課題点

処理速度低下

モーフィングによる処理量の増大

⇒事前に合成しやすい形へ分析

ライブラリ容量の増大

処理速度とトレードオフ

⇒低次メルケプストラムと

Vorbis で圧縮

ライブラリ間での発音の違い

⇒素片ごとに時間の対応付けを行い補正

(23)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

課題点

処理速度低下

モーフィングによる処理量の増大

⇒事前に合成しやすい形へ分析

ライブラリ容量の増大

処理速度とトレードオフ

⇒低次メルケプストラムと

Vorbis で圧縮

ライブラリ間での発音の違い

⇒素片ごとに時間の対応付けを行い補正

(24)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

提案法(事前分析)

声色 A 波形 WORLD Analysis F0 Vorbis Encoder IFFT PLATINUM STAR OggVorbis 励起信号波形 励起信号波形 メル周波数変換 MelCepstrum 声色 B 波形 WORLD Analysis F0 Vorbis Encoder メル周波数変換 OggVorbis 励起信号波形 IFFT MelCepstrum 伸縮マッチング 時間伸縮関数 振幅包絡 振幅包絡 低次元化 IFFT IFFT DIO 対数化

(25)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

提案法(事前分析)

声色 A 波形 WORLD Analysis F0 Vorbis Encoder IFFT PLATINUM STAR OggVorbis 励起信号波形 励起信号波形 メル周波数変換 MelCepstrum 声色 B 波形 WORLD Analysis F0 Vorbis Encoder メル周波数変換 OggVorbis 励起信号波形 IFFT MelCepstrum 伸縮マッチング 時間伸縮関数 振幅包絡 振幅包絡 低次元化 IFFT IFFT DIO 対数化 ノイズ成分 声の特徴 発音の差

(26)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

提案法(事前分析)

声色 A 波形 WORLD Analysis F0 Vorbis Encoder IFFT PLATINUM STAR OggVorbis 励起信号波形 励起信号波形 メル周波数変換 MelCepstrum 声色 B 波形 WORLD Analysis F0 Vorbis Encoder メル周波数変換 OggVorbis 励起信号波形 IFFT MelCepstrum 伸縮マッチング 時間伸縮関数 振幅包絡 振幅包絡 低次元化 IFFT IFFT DIO 対数化

(27)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

提案法(事前分析)

声色 A 波形 WORLD Analysis F0 Vorbis Encoder IFFT PLATINUM STAR OggVorbis 励起信号波形 励起信号波形 メル周波数変換 MelCepstrum 声色 B 波形 WORLD Analysis F0 Vorbis Encoder メル周波数変換 OggVorbis 励起信号波形 IFFT MelCepstrum 伸縮マッチング 時間伸縮関数 振幅包絡 振幅包絡 低次元化 IFFT IFFT DIO 対数化

(28)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

励起信号抽出法

PLATINUM

実信号スペクトル     と,

パワースペクトルの最小位相スペクトル

から励起信号を以下の式で求める

位相を無視しない高品質な分析合成系

励起信号スペクトル

R(ω) は

パワースペクトル的な扱いに適さない.

X (ω)

H (ω)

R(ω)=

X (ω)

H (ω)

(29)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

励起信号の圧縮法

実信号スペクトル     と,

パワースペクトルの最小位相スペクトル

から励起信号を以下の式で求める

モーフィング時

R(ω) は線形補間

として

Vorbis 圧縮

X 

H 

R=

X 

H 

r t =IDFT [ R]

(30)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

提案法(事前分析)

声色 A 波形 WORLD Analysis F0 Vorbis Encoder IFFT PLATINUM STAR OggVorbis 励起信号波形 励起信号波形 メル周波数変換 MelCepstrum 声色 B 波形 WORLD Analysis F0 Vorbis Encoder メル周波数変換 OggVorbis 励起信号波形 IFFT MelCepstrum 伸縮マッチング 時間伸縮関数 振幅包絡 振幅包絡 低次元化 IFFT IFFT DIO 対数化 発音の差

(31)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

時間伸縮関数の設計

ライブラリ間の発音の差を補正

振幅包絡の差の積分を最小とする経路

対応する素片同士で

T(t)を記録

E t=

i=−m m

x t

i

f

s



2

, f

s

: 標本化周波数

t=0 lA

E

A

t −E

B

T t 

d

t

2

T

2

t  min , s.t.

dT t 

dt

0

(32)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

提案法(合成)

時間伸縮関数 OggVorbis 励起信号波形 MelCepstrum vorbis Decoder OggVorbis 励起信号波形 MelCepstrum 声色A 線形周波数化 声色B FFT FFT 線形周波数化 FFT vorbis Decoder FFT 重みつき和 重みつき和 WORLD Synthesis 音声波形 F0 generator F0 対数パワースペクトル 励起信号スペクトル 対応時刻

(33)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

波音リツコネクト

本技術によるライブラリ

波音リツ

Project と共同制作

– http://hal-the-cat.music. coocan.jp/ritsu.html – 上記で「波音リツコネクト」 として公開されています.

(34)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

波音リツコネクト収録内容

収録単位 VCV 収録語数 955語 マイク Audio-Technica AT-4040

Audio I/F Roland UA-25EX

収録場所 約60畳の業務用冷凍庫 MelCepstrum 32 次元 OggVorbis 44.1サンプルあたり 64kbit 声色指定 「強い」「中間」「弱い」 三種類

(35)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

合成速度

波形からの合成の約

2 倍高速

32 秒のシーケンスの合成時間(単位:秒)

CPU 波形から合成 提案手法 スレッド数 Celeron 1.73Ghz 89.1 40.4 1 Core2Quad 2.8Ghz 39.6 20.7 1 Core2Quad 2.8Ghz 22.3 10.5 2 Core i7 3.5Ghz 22.9 13.1 1 Core i7 3.5Ghz 11.6 6.6 2

(36)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

ライブラリ容量

波形 WORLD RAW 提案手法 元データ 176.4 - -スペクトル - 4096 128 励起信号 - 8192 約200 合計 176.4 12288 約330 ●

波形の約

2 倍

2[ms] あたりに必要なデータ量[bytes]

圧縮の条件は波音リツコネクトと同じ

(37)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

合成例

(2)

童謡「ふるさと」

– 声色指定パラメタのみ手作業で編集 ●

圧縮の影響の比較

– 波形から合成 – 提案法で合成 ●

操作パラメタの比較

– モーフィング率一定 – モーフィング率手動変更

(38)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

合成例

(2)

童謡「ふるさと」

– 声色指定パラメタのみ手作業で編集 ●

圧縮の影響の比較

– 波形から合成 – 提案法で合成 ●

操作パラメタの比較

– モーフィング率一定 – モーフィング率手動変更

(39)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

合成例

(2)

童謡「ふるさと」

– 声色指定パラメタのみ手作業で編集 ●

圧縮の影響の比較

– 波形から合成 – 提案法で合成 ●

操作パラメタの比較

– モーフィング率一定 – モーフィング率手動変更

(40)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

合成例

(2)

童謡「ふるさと」

– 声色指定パラメタのみ手作業で編集 ●

圧縮の影響の比較

– 波形から合成 – 提案法で合成 ●

操作パラメタの比較

– モーフィング率一定 – モーフィング率手動変更

(41)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

合成例

(2)

童謡「ふるさと」

– 声色指定パラメタのみ手作業で編集 ●

圧縮の影響の比較

– 波形から合成 – 提案法で合成 ●

操作パラメタの比較

– モーフィング率一定 – モーフィング率手動変更

(42)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

合成例

(3)

拙作「

Breathe -retrieval-」

声色指定パラメタ

音程遷移を付加

(手作業)

sm16309748

【波音リツコネクト】Breathe -retrieval-【オリジナル】

(43)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

変換ツール

インターネット上での

利用を前提

変換用の

GUI を配布

「波音リツコネクト」と

同じページで公開中

(44)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

変換ツール

インターネット上での

利用を前提

変換用の

GUI を配布

「波音リツコネクト」と

同じページで公開中

(45)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

まとめ

ユーザが声色操作可能な歌声合成器

v.Connect を作成した

任意時刻・任意強度でモーフィング率を指定可能

合成速度とライブラリ容量を改善

速度約

2 倍・ライブラリ容量は波形の約 2 倍

(46)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

今後の課題

品質についての定量的評価

モーフィング精度の向上

声色変化パラメタの自動生成

シーケンスの入力は手作業に依るところが大きい

(47)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

予稿訂正のお詫び

予稿中「

VocaListener2」の表記を

VocalListener2」と誤記しておりました.

大変失礼致しました.

ここに訂正するとともに

謹んでお詫び申し上げます.

(48)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project Cadencii Project

謝辞

開発にご助力いただいた

Cadencii 開発者の kbinani 様

音源の制作にご協力いただいた

波音リツ

Project のみなさま

WORLD 開発の立命館大学の森勢助教

UTAU 開発の飴屋/菖蒲様

この場をお借りして感謝申し上げます.

(49)

The University of Electro-Communications

The University of Electro-Communications

Cadencii Project

Cadencii Project

v.Connect

v.Connect

参照

関連したドキュメント

出力信号なし 運転状態信号出力 リモート状態信号出力 準備完了状態信号(TEMP READY)出力

地震の発生した午前 9 時 42 分以降に震源近傍の観測 点から順に津波の第一波と思われる長い周期の波が

東京工業大学 正会員 廣瀬壮一, 非会員 酒井綾子 ジャパンプローブ 非会員 小倉幸夫, 非会員

そこで本研究では, LTCR の発生領域を推定するた めに GEOTAIL に搭載されているプ ラズマ波動観測 装置( PWI : Plasma Wave Instrument )のサブシス テムである波形捕捉受信器(

19 荒 木 34 3 左望 上縁二突起形成 爾側氣管枝周防浸潤 20 山 元 30 ♂ 右v 扇孚開状 爾側上葉浸潤 21 津 川 20 ♀ 左V 扇孚開状

また,文献 [7] ではGDPの70%を占めるサービス業に おけるIT化を重点的に支援することについて提言して

This paper proposes a method of enlarging equivalent loss factor of a damping alloy spring by using a negative spring constant and it is confirmed that the equivalent loss factor of

5 On-axis sound pressure distribution compared by two different element diameters where the number of elements is fixed at 19... 4・2 素子間隔に関する検討 径の異なる