本研究ではカバー演奏を含む音響信号ストリー ムからのリアルタイム楽曲同定システムを提案,そ の評価実験を行ったその結果,精度はまだ十分 とは言えないが,ある程度の精度で即時的に楽曲 同定が可能であることが示された.
文 献
[l ] Bee e t a l.,
情処研報音楽情報科学,n o. 102, pp. 29‑ 34, 2007.
[2 ]
櫻 井 良 樹 他 , 第23
回人工知能学会全大,l FI ‑ 3, 2009.
[3 ]
後藤真孝,情処研報音楽情報科学,N o. 100, pp. 27‑ 34, 2002.
[4 ]
岡隆一,音響学音声研資,S78‑ 20, 1978.
[5 ] Y. Li n de, e t a l. I EEE Tran s. , COM ‑ 2 8 , 1 , pp. 84‑ 95 1980.
[6 ] D . P . W . El l i s, ht t p: / / l abrosa. ee. col um bi a. edu/ pr
oj ect s/ cover songs/ cover s80/ , 2007. ( 2009‑ 6‑ 30)
マ ン ガ 制 作 過 程 の 協 業 プ ロ セ ス モ デ ル 化 と そ れ に 基 づ く 制 作 支 援 *
1. は じ め に
近年、マンガは日本の文化・産業として世界 中で認知されている。また、高度情報化社会の 進展に伴って、ディジタルメディアを活用した マンガの新しい表現や形態が生まれつつある。
しかしながら従来のマンガ制作は作家と編集者 の暗黙のコンセンサス形成により行われるため、
制作の効率化や制作に関連するリソースの再利 用の促進が難しく、近年のマンガの質・量に対 する需要の増加に対応しかねている。
本研究では、マンガ制作における作品の評 価・分析や内容決定等の作業においてスタッフ の協働支援を実現することを目的として、マン ガ制作プロセスにおける中途制作物に記述され たマンガの内容や構造に関する情報を表現する モデルを提案した。さらにこのモデルを基礎と して、中途制作物を利用したマンガ制作プロセ スの効率化を進めるためにスタッフ間の協業を 支援するツールを構築した。
2 .
マ ン ガ 制 作 の プ ロ セ ス の 問 題 点 と 解 決 本研究ではまずマンガ制作の一般的なプロセ スとその過程で制作される中途制作物を明らか にした。特にマンガの内容に関するアイディア を練り上げ作品の構想を作り上げる段階と、構 想を基礎にしてコマ割を行う「ネーム作り」の 段 階 に つ い て 、 制 作 効 率 化 の 観 点 か ら の 問 題 点 の提起と解決方法の提案を行った。従来の制作プロセスでは、中途制作物を明示 的に決めていないため、中途制作物として表し、
決定すべき事項が明示的に与えられない。その ため、制作に参加するスタッフ間でのコンセン
* " A Model of Col l abor at i on Pr oduct i on Pr ocess of Ma ng a and Pr oduct i on Suppor t Tool " by Tet suya Mi har a
三 原 鉄 也 ( 学 籍 番 号 200821677) 研 究 指 導 教 員 : 杉 本 重 雄 副研究指導教員:鈴木誠一郎
サ ス 形 成 が 不 十 分 で あ っ た り 、 制 作 過 程 が 非 効 率であったりする。そのため、従来の制作プロ セ ス で は 暗 黙 的 に 共 有 さ れ て い た 情 報 を 明 示 化
して、第三者によるアクセスを可能にし、協業 を行いやすくすることが求められる。
そこで本研究では、マンガの内容及び構造を 中途制作物として明確に表現できるモデルの構 築 を 進 め た 。 こ れ に よ り 制 作 過 程 で 作 り 出 さ れ る情報の明示的表現が可能になり、協働におけ る情報共有の円滑化が可能になる。
3. 本 論 文 に 関 連 す る 研 究 及 び 取 組 み ソフトウェア開発の分野では、成果物間の関 連に着目したプロセスのモデル化方法である
「PReP( Pr oduc t Rel at i ons hi p Pr oc es s ) 」モデ ル[ ! ] が提案されている。また映像製作の分野で は、シナリオ制作のプロセスと分析による効率 化 の 手 法 で あ る シ ナ リ オ 分 析 手 法[ 2]がある。こ
うした研究に対し、本研究はマンガ制作におけ る中途制作物に着目してプロセスの外在化を図 るものである。
本 研 究 に お け る マ ン ガ の モ デ ル 化 に つ い て は 両角他[ 3] を参考にした。これはネットワーク上 の環境で提供されるマンガのメタデータに関す る要求要件を書誌情報と構造、知的内容という 3 つの観点から検討し、単一のフレームワーク として統合したメタデータのモデルを提案した ものである。
4 .
マ ン ガ 制 作 の プ ロ セ ス モ デ リ ン グ 本研究ではマンガ制作プロセスに決定される マンガに関する情報を 5つの層により表現したレイヤモデルを提案する。
このプロセスモデルでは中途制作物に示され た下層レイヤの情報を基に上層レイヤの情報が 決定される。
表
1
マ ン ガ 制 作 プ ロ セ ス の レ イ ヤ モ デ ルプ ロ セ ス レ ベ ル 構 成 要 素 内 容
Publ i s h 出 版 ・ 流 通 ・ 配 信 の 形 態 Ex pr es s i on
ページ,コマ,絵、
マ ン ガ の 内 容 の 平 面 表 現 フキダシ,オノマトペ
St or y シーン,出来事セリフ 描 写 さ れ る ス ト ー リ ー Set t i ng 登場人物,舞台,物品 作 中 に 登 場 す る 基 礎 設 定 Pol i cy
動機.読者層 I執筆時の動機やテーマ、
スケジュール 作 品 に 対 す る 商 業 的 な 制 約
5 .
ネ ー ム 制 作 支 援 シ ス テ ム本 研 究 で は 先 に 示 し た モ デ ル を 基 礎 と し て 開 発 し た マ ン ガ 制 作 支 援 ツ ー ル を 開 発 し た 。 こ のツールはWe b 上 で 制 作 物 の 内 容 と 関 係 性 を 示 す メ タ デ ー タ と ア ノ テ ー シ ョ ン を 付 加 し 、 そ れらを管理することで協業制作を仲介する。
5. 1. シ ス テ ム が 提 案 す る ロ ー ル と プ ロ セ ス
4 亘 う
..◎ 全 )
図
1
シ ス テ ム が 提 案 す る ロ ー ル と プ ロ セ ス こ の シ ス テ ム で は 、 中 途 制 作 物 を 作 成 し 、 シ ステムに保存するクリエイタ(作家)、システム を 通 じ て 中 途 制 作 物 を 閲 覧 し 、 そ の 感 想 を 付 加 するプロデューサ(編集者)、中途制作物に付加 さ れ た 情 報 を 分 析 し 、 改 善 指 示 や 更 な る 情 報 を 加 え る ア ド バ イ ザ の 3つ の 役 割 を 持 つ 参 加 者(ロール)を仮定した。また、このシステムは ア ノ テ ー シ ョ ン を 付 加 し た デ ィ ジ タ ル 形 式 の ネ ー ム と 、 入 力 さ れ た マ ン ガ に 関 す る 情 報 を 交 換 可 能 な 形 式 で 記 述 し た マ ン ガ 設 計 情 報 メ タ デ ー タを出力する。
5 . 2 .
提 案 シ ス テ ム の 機 能本 シ ス テ ム は 特 に ネ ー ム に ア ノ テ ー シ ョ ン を 付 与 す る 機 能 を 持 つ 。 ネ ー ム は 中 途 制 作 物 の 中 で も 最 後 に 制 作 さ れ る も の で 、 ア ノ テ ー シ ョ ン を 付 加 す る 対 象 と し て 適 す る と 考 え た 。 ア ノ テ ー シ ョ ン の 内 容 は4章 で 示 し た モ デ ル に 即 し て 表 現 さ れ た マ ン ガ の 内 容 と 構 造 に 関 す る 情 報 と
そ の 遷 移 に 関 す る 情 報 で あ る 。 そ の 他 、 ネ ー ム の 修 正 指 示 と そ の 提 案 、 以 前 作 ら れ た ネ ー ム の 部分または全体からの引用も含まれる。
図 2 ア ノ テ ー シ ョ ン の 表 示 例
6 .
お わ り に本 研 究 で は 、 マ ン ガ 制 作 過 程 に お け る ス タ ッ フ の 協 働 の 支 援 を 実 現 す る た め に 、 マ ン ガ 制 作 過 程 で 作 成 さ れ る 中 途 制 作 物 に 着 目 し た 、 レ イ ヤ モ デ ル を 提 案 し た 。 こ の モ デ ル を 基 礎 と し て We b上 で 成 果 物 の 内 容 と 関 係 性 を 示 す ア ノ テ ー
シ ョ ン の 付 加 と 管 理 の 機 能 を 持 つ マ ン ガ 制 作 支 援システムを構築した。
今 後 は マ ン ガ 制 作 で 用 い ら れ る 概 念 の 整 理 と 連 携 や 、 デ ィ ジ タ ル マ ン ガ の 表 現 へ の 本 格 的 な 対 応 や マ ン ガ の 出 版 流 通 プ ロ セ ス の モ デ ル 化 に よる効率化の対象の拡張を進める必要があると 考 え て い る 。 ツ ー ル の 実 装 と 実 際 の マ ン ガ 制 作 で の 適 用 を 通 し た モ デ ル 及 び ツ ー ル の よ り 詳 し い検討と評価も不可欠である。
文 献
[ l ] 田中康,飯田元,松本健一. 成果物間の 関連に着目した開発プロセスモデル:
PReP" 情 報 処 理 学 会 論 文 誌 no. 46 ( 5) pp, 1233‑ 1245, 2005.
[ 2 ]
金子満. シナリオライティングの黄金則 ー コ ン テ ン ツ を 面 白 く す る 一 . ボ ー ン デジタル, 2008.[ 3] Ay ako Mor oz umi , Sat omi Nomur a, Mi t s uhar u Nagamor i , Shi geo Sugi mot o. " Met adat a F r amewor k f or Manga: A Mul t i ‑ par adi gm Met adat a Des c r i pt i on F r amewor kf or Di gi t al Comi c s " .Pr oc eedi ngs of D C‑ 2009, pp. 61‑ 70, Seoul , 2009.
音 声 波 信 号 に 含 ま れ る 声 道 特 性 と 声 帯 波 特 性 の 話 者 認 識 へ の 有 効 性 に 関 す る 研 究 *
1 . はじめに
話者認識システムにおける重要課題として、音声 の登録時期からの長期時間経過に対する性能劣 化がある
[ 1‑ 3]
。一方、音声生成に関わる声帯と声 道特性は話者の個人性を表す有力な特徴である。話者認識における声道特性と声帯波特性に関して の有効性を調べた実験報告 [2]はあるが、これらの 要素を音声生成モデルに基づく信号処理分析とし て明示的に分離し、個別の効果を明らかにした研 究は見当たらない。
そこで本研究では、A R ‑ H MM分 析[ 4]を用いて 音声波を声帯波特性と声道共振特性に分離し、そ れぞれが収録時期差による性能劣化にどのような 影響を与えるかについて実験により検討する。
2 分 析 方 法
2 .1
手順の概要分 析 方 法 は 、 A R ‑ H MM ( Au t o Regr es s i ve
‑ Hi dden Ma r k ov Model ) 分 析 [4] により、まず音声 の声道特性を得て、これを利用して音声を声道特 性と声帯波特性に分離する。次に、それぞれのパ ワースペクトルからケプストラムを算出する。さらに、
両者のパワースペクトルを帯域分割したスペクトル についてもケプストラムを算出する。これらのケプス トラム時系列を特徴量として識別実験を行なう。な お 、 実 験 に 用 い た 音 声 信 号 波 形 は 標 本 化 周 波 数
16
k Hz、線形量子化16
bi t である。2. 2 声道特性と声帯波特性のケプストラム算出 A R ‑ H MM分析については、窓幅
32
ms、窓シフ ト16
ms、AR係 数 は20
項、HM Mは16
状態のリン グ状トポロジーとした。ケプストラムは、声道特性についてはAR係 数 か らパワースペクトルを経て算出、声帯波特性につい
*" A St udy on Ef f ect i veness of Vocal Tract and Vocal Cor d Charact eri st i cs in Aut omat i c Speaker Recogni t i on Consi der at i on" by Yumi no Y A MA D A
山 田 弓 乃 ( 学 籍 番 号
200821679) 研究指導教員:田中和世 副研究指導教員:三河正彦
ては、AR逆フィルタにより求めた声帯波形から F F T を利用して算出した。なお、使用したケプスト ラムの項数については、声帯波特性、声道特性と も
1 2 0
項を用いた。帯域分割に関しては、全体を 5 帯域に分割した。
低域側から概ね、帯域
1 ( 0 2
k Hz ) 、帯域2 ( 1. 5 3 . 5
k Hz ) 、帯域3( 3 5
k Hz )、帯域4 ( 4. 5 6. 5
k Hz )、帯域5 ( 6 8
k Hz )に対応している。帯域分割 した場合は、各帯域について、ケプストラムは 10 項 である。3.
音声データ収録時期差による影響を調べるため、 3ヵ月毎に
5
時期(時期1: 2008
年9
月,時期2 : 12
月,時期3 : 2009
年3
月,時期4: 6
月,時期5: 9
月)に渡って 収録した。ここでは、成人男性話者13
名,女性話 者1 1
名 の 計24
名の音声データを収録した。発話 サンプルは、単母音 5 音 節 の/a /, Ii/, /u /, /e l , l o !
を各 4 回発声したものである。実験においては、これらの他に、電子協共通音声データから男性
2 4
名,女性2 5
名 の 単 母 音 デ ー タ を 参 照 パ タ ー ン に 加えて 7 3カテゴリーの識別としている。4 識 別 方 法
識別は、ケプストラム係数を特徴ベクトルとして、
ユークリッド距離を基本として行った。単母音ごとの 識別では、未知話者入カサンプルと参照話者サン プルとの最短距離となる話者サンプルに対応する 話者を入力話者とした。(今回は、統計解析的処理 は使用してない。) 5 母音すべてを使用した場合は、
未知話者入カサンプルに対して、各話者について 母音ごとに最短距離を求め、その和(話者ごとの 値)が最小となる話者を入力話者とした。
5
識 別 実 験 と 結 果抽出したケプストラムを組合わせて特徴ベクトル