情報処理学会研究報告 IPSJ SIG Technical Report
1
paralinguistic 表現を用いた聴覚障害者向け
吹き出し型字幕提示方法
紺家 裕子
†1中谷 彰宏
†2佐藤 至
†2椎尾 一郎
†1 テレビ番組や映画などの映像コンテンツにおいて,聴覚障害者向け字幕付与は進んでいるが,情報保障として必須項 目のみであり,エンターテイメント性のある演出効果などを含めた表記の字幕はない.健常者は字幕で文字情報とし て表示される発話内容以外にも,音量や話すスピード,声色など様々な情報を総合してその発話を表現したり,理解 したりしており,既存の字幕ではその演出情報が欠如している.本論文では,字幕において文字情報のみでなく演出 情報を一緒に表現することでエンターテイメント性のある字幕を提供することを目的とし,多くの人が親しみ,直観 的に理解できるマンガ表記の文法を映像字幕に応用する方法を提案する.また,評価システムを実装し,インタビュ ー調査を実施した結果を述べるParalinguistic Caption Presentation method with Speech bubble for
hearing impaired person
YUKO KONYA
†1AKIHIRO NAKATANI
†2ITARU SATO
†2ITIRO SIIO
†1In a video content, such as TV shows and movies, captions for the hearing impaired person are proceeding. However, these captions are only mandatory fields as information support. There is no subtitle notation including directing effects for entertaining. Non-impaired persons feel and recognize scenes with synthesizing various information, for example, speaking speed, volume, and tone of voice. The existing caption is lacking directing effect information. In this paper, we describe a way to provide a caption with effect information not only text information. Many people are familiar with Manga comic grammar. We propose a caption presentation method to apply it. We implement a system of caption presentation over IPTV platform and conduct interviews.
1. はじめに
日本における聴覚障害者数は人口の約 0.22%[1]であるが, 加齢によっても聞こえは悪くなる[2].近年直面している高 齢社会[3]においても字幕等の映像のバリアフリー化は求 められている.字幕は外国語音声への翻訳表記や電車内な どの音を出しづらい場所においての情報提供としても活用 ができ,利用シーンが多い.情報保障としてのテレビへの 字幕付与は進んでおり,2012 年の調査によると地上波放送 の約 67%に字幕が付与されている[4].しかし,これらの字 幕は情報保障の域をでておらず,元の映像と重なるなど, 健常者が見た場合に邪魔に感じており[5],字幕付与が増え るにつれ聴覚障害者でも表示タイミングが気になるなどの 要望が増えている[6].また,表示される字幕情報はテキス ト情報であり,発話文言の情報しか提示されず,音響効果 や発話タイミングなど,楽しさや面白さを表現する演出効 果は字幕表記から除外されている.健常者は話の内容,ス ピード,音量,声色など装飾情報を総合して内容を表現し たり,把握したりしているが,字幕にはその情報が無い表 記となっている.この音量やスピード,声色などの効果が, †1 お茶の水女子大学 Ochanomizu University. †2 株式会社 アステム ASTEM Co., Ltd. 【 研究報告用原稿:上記*の文字書式「隠し文字」 】 発話者の表現となり,面白さや役者の味を出すものである が.字幕利用者はそれらの情報を得ることができないため, 発話者の表現をすべて理解できない.たとえば手話の場合, 感情を表情や動きの大きさなどに変えて表現することがで きる.しかし,手話の場合は通訳者と発話者の両方を見る ことになるため長時間の視聴には向かないと予想できる. テキストのみの表記に対して演出情報は話者の意図,態度, 感 情 を 表 す も の で あ り , 前 川 ら [ 7 ] は こ れ を パ ラ 言 語 (Paralanguage)と定義している.パラ言語とは音声言語に 含まれる言語情報以外の情報を意味し,語調,語勢,アク セント,イントネーションなどが含まれる.我々は,聴覚 障害者が演出情報を字幕から得ることにより,演出効果を 含めた情報を取得できる字幕を提案する.また,障害者の みで鑑賞することばかりではないため,健常者が一緒に見 ていても邪魔と感じない,皆が一緒に楽しめる字幕提示方 法を目標とする.なお,字幕にはニュースやスポーツのよ うにリアルタイムに付与されるリアルタイム字幕とドラマ やバラエティなど番組に合わせて事前に作りこまれている, 作りこみ字幕がある.本研究では,演出情報の有無が影響 を受けるであろうエンターテイメント性の高いコンテンツ であるドラマやバラエティなどの作りこみ字幕をターゲッ トにする.ⓒ 2013 Information Processing Society of Japan ⓒ 2013 Information Processing Society of Japan
Vol.2013-EC-29 No.4 2013/8/10
情報処理学会研究報告 IPSJ SIG Technical Report
2
2. 従来技術
放送字幕など実用化されている字幕提示方法及び,先行研 究について以下に述べる. 2.1 地上波放送の字幕の現状 地上デジタル放送の字幕は ARIB STD B37[8]に則り作成さ れている.図1に示すイメージ画像のように映像画面の下 部などにオーバーレイで 2 行程度のエリアを設け,黒い透 過の帯の上に文字の情報が表記される形式の字幕である. 発話者に合わせて,色の変更や座標指定で場所をずらして 表示することも可能である. 図 1 地上デジタル放送における字幕表示のイメージ図 Figure 1 Illustrative example of caption presentation onterrestrial digital broadcasting program
実際に放送にて運用されている字幕表記の傾向を把握する ため,東京で視聴できる地上デジタル放送に付与されてい る既存の字幕の表記方法について調査した.その結果を表 1に示す.調査対象番組は,リアルタイム字幕としてニュ ースとスポーツ,作りこみ字幕としてドラマ,アニメ,バ ラエティから 10 作品ずつを番組表から無作為に抽出した. 結果としては,リアルタイム字幕,作りこみ字幕それぞれ に傾向があり,どの番組もほぼ同様の表記方法を用いてい た.リアルタイム字幕は,タイムラグを短縮するために音 声を文字にすることに注力しており,改行や色替えなどは あまり利用されていなかった.リアルタイム字幕と比較し, 作りこみ字幕の方は文字色を変えたり,表示位置を発話者 近くに寄せたり,改行位置を工夫するなど,わかりやすく する工夫がされているが,音響効果,声色の違い,掛け合 いや話の結びにあたるいわゆる「落ち」となる言葉が同時 に表記されるなど演出面の表現が欠如している.そのため, 健常者の得ている情報と比較して,面白さの要素の一部が 不足している. 表 1 地上波デジタル放送の字幕表記 (リアルタイム字幕, 作りこみ字幕各 10 作品を調査)
Table 1 Caption presentation in Terrestrial digital broadcasting in Japan. Ten titles each of real-time caption and pre-prepared
caption 項目 リアルタイム字幕 作りこみ字幕 1 行の文字数 最大 15 文字 最大 15 文字 文字色数 1-2 色 1-4 色 文字サイズ 一定 一定 改行 文字数 文節 長文で続く場合は「→」 表記 遅延 作業時間分遅延 ほぼ一致 タイミング 考慮なし 考慮なし 語調 考慮なし 「!」「...」「~」等で表 現(一部番組) 音響効果 なし ♫,(鳥の声)等の記載 (一部番組) 表示場所 中央(スーパーインポ ーズのテロップや発話 者の顔に重なる場合あ り) 中央,または左右に分 け,発話者に近づくよう に工夫 2.2 吹き出し型字幕 テレビ会議等の映像に情報保障として字幕付与する研究が 進められている.藤井ら[9]は映像の上に画像認識にて吹き 出し型の字幕を表示したものと TV 映像のように下部に帯 状に表示したものを比較し,吹き出し型の方がより楽しさ, 親しみやすさ,臨場感があるという評価結果を提示してい る.ここでの臨場感は定義されていないが,楽しさや親し みやすさなど含め,吹き出し表示が有効であると想定でき る. 楠ら[10]は人形劇に吹き出し型字幕を付与して上演す ることで障害者と健常者が同様に楽しめること示している. 日本ではマンガ文化も浸透しており,吹き出し表示が発話 者方向を示していることは多くの人に認知されおり,親和 性が高いといえる.また,池谷ら[11]は,画像認識を用い て,発話者の近くに字幕を表示する方法を提案している. 発話者特定において,近くに字幕を表記することは有用で ある.しかし,上記吹き出し型字幕においても,演出効果 を可視化しているものではない. 2.3 パラ言語の表記 音声をモデル化して感情とマッピングさせる方法[12]があ る.これは音声データから感情要素を取り出すのに有効で あるが,取り出した感情を画面上に表現する方法を検討す る必要がある.音声のみでの評価ではあるが,発話者の印 右だよ,右 やったね
ⓒ 2013 Information Processing Society of Japan ⓒ 2013 Information Processing Society of Japan
Vol.2013-EC-29 No.4 2013/8/10
情報処理学会研究報告 IPSJ SIG Technical Report
3 象を可視化するものとして,「!」等の記号やフォントサイ ズを変化させることで,印象の変化を表現している研究が ある[13].記号については既存字幕でも活用されているが, フォントサイズの変化については,検討が必要である.サ イズが変化することで,文字数や表示場所が影響を受ける ため詳細に検討が必要である.また,音声を可視化するた めに,音声の共振周波数を用い,色や図形で表現する方法 もある[14].しかし,可視化された図形や色などに直観的 に理解できる意味付けがないため新たな学習が必要となる.
3. 課題
聴覚障害者が映像などのコンテンツを楽しむ場合には,ま ず,誰が何を話しているかを理解する必要がある.既存の 字幕では「何を」話しているのかは表示され,「誰が」話し ているのかは役名の表示や色分けによって伝えるようにな っている.「誰が」「何を」を理解したうえで,どのように 話しているのか,いわゆる感情や演出という箇所がさらに コンテンツの楽しむ要素となる.しかし,これらの情報に ついては既存の字幕では表現できていない.そのため,視 聴者は表情などで想像できる範囲でしか役者の感情を理解 できない.また,表示タイミングなどが一定で掛け合いの タイミングや話のオチが同時に表示されるなど面白さの要 素を欠いている.上記に述べたように既存の帯型字幕では, 演出などの楽しさを伝える情報が不足しており,発話者の 感情や意図が伝わっていない可能性がある.4. アプローチ
演出情報の表現方法として,マンガの文法を応用する.日 本では多くの人がマンガの表現に親しみがあり,吹き出し が台詞で,その形や文字の大きさが声の大きさや気持ちの 激しさなどの感情を表していることは学ばなくとも知って いる.そのマンガの文法を活用して,発話者の感情や演出 を字幕に表現することで,特別な学習をせずに演出効果を 伝えることができる.マンガでは,吹き出しの形で感情や 場所(対面なのか遠隔なのか)などを表し,文字のサイズ で声の大きさを表現している.その表記ルールを用いてテ レビ画面に字幕を表記する. 4.1 音声表現による演出の要素 音声言語による演出の表現の主要素は,声の大きさ(ボリ ューム),高さ(声色),間や速さ(スピード)である[15]. たとえば,多くの人に語るときは大きな声でゆっくり話し, 大切なことを言う前に少し間をあけるなどの音声表現があ る.また,物語であればその情景を表すために,緊迫して いるときは速く低い声で話したり,怒っているときは強く かたい声で話すなど感情も声色で表現する.お笑いであれ ば,軽快な掛け合いやわざと間を長くおいてタイミングを ずらし笑いを誘うなどの演出が行われている. 4.2 マンガの表現方法 マンガでは,会話の内容は吹き出しの中に表記され,その 吹き出し口が発話者の方を向く.これにより誰の発言かを 明確に示している.発話者の感情表現は吹き出しの枠の形 を用いたり,文字のフォントを変えたりする.声の大きさ は文字の大きさや太さなどで表現し,間は「...」等の記号 や行を変えたり,コマ割りにより時間経過を表したりなど することで表現している.高月[16]は,「文字そのものの工 夫」「吹き出し(風船)の工夫」によってマンガでは感情表 現を行っていることを示している.映像に付与する場合は, タイミングも重要なポイントなるため,間合いについても 考慮し,字幕表現に活用する.表 2 に音声表現と字幕表現 のマッピングを示す. 表 2 音声表現と字幕表現のマッピングTable 2 mapping from voice expression to caption description 音声表現 字幕表記 ボリューム 文字サイズ 声色・感情 吹き出し枠の型,文字の記号,フォント 間・スピード 改行やタイミング 次に,吹き出しの形と感情表現の対応付けについて整理す る.人間の感情として喜怒哀楽といわれるが,言葉に表さ れるときには,ポジティブな喜びと楽しさの表現に差があ まり出ない.そのため,怒りのような強い感情の高ぶりの 場合と,哀しみのように,弱いけどネガティブな感情と, 喜びや楽しさというポジティブな感情の 3 つのタイプに分 類した.感情表現と吹き出し型の対応付けについて表 3 に 示す. 表 3 感情表現と吹き出し型のマッピング Table 3 Mapping from emotion to bubble shape タイプ 意味づけ 形 Normal 通常状態 Emotional 感情の高ぶり Fun 楽しさ,うれしさ (ポジティブ) Sad 悲しさ,寂しさ (ネガティブ) また,映像の場合,発話者が常に画面上に存在するとは限 らない.そのため,ナレーションで声のみの場合などは, 吹き出しの口の向きがないタイプを表記する.映像上に出
ⓒ 2013 Information Processing Society of Japan ⓒ 2013 Information Processing Society of Japan
Vol.2013-EC-29 No.4 2013/8/10
ሗฎ⌮Ꮫ◊✲ሗ࿌ IPSJ SIG Technical Report
4 ࡚ࡃࡿࡀ㸪㏵୰୍࡛ᗘぢ࠼࡞ࡃ࡞ࡿሙྜ࡞ࡣ㸪྿ࡁฟࡋ ࡢཱྀࢆ⏬㠃እྥࡅࡿ࡞ࡢ⾲⌧ࢆ⏝࠸ࡿࡇࡋࡓ㸬 4.3 ྿྿ࡁฟࡋ⾲♧⨨ ᫎീࡢ୰ࡣ」ᩘࡢேࡀᏑᅾࡍࡿሙྜࡶ࠶ࡿࡓࡵ㸪྿ࡁฟ ࡋࡣ࡛ࡁࡿࡔࡅⓎヰ⪅ࡢ㏆ࡃ⾲♧ࡍࡿࡼ࠺ࡋࡓ㸬ࡓࡔ ࡋ㸪Ꮠᖥ⏝࣓ࢱࢹ࣮ࢱࡢసᡂࡢ↹㞧ࡉࡶ㚷ࡳ㸪ᅗ 3 ♧ࡍ ࡼ࠺㸪⏬㠃ࢆ༊ษࡾ㸪ࡑࡢ࢚ࣜࢆᣦᐃࡍࡿࡇ࡛⨨ ࢆ≉ᐃࡍࡿ㸬ᅗ 3 ࡛ࡣ⦪ᶓ 4 ➼ศ࡛ 16 ศࡋ࡚࠸ࡿ㸬ࡇࢀ ࡣᫎീࡢ✀㢮࡞ࡼࡗ࡚ࡶ㐺ṇ࡞ࢧࢬࡀ␗࡞ࡿ⪃࠼ ࡿ㸬⏬㠃ୖࡢᗙᶆᣦᐃ➼࡛ሙᡤࢆᣦᐃࡍࡿ᪉ἲࡶ࠶ࡿࡀ㸪 ᅗ 4 ♧ࡍࡼ࠺㸪࠶ࡿ⛬ᗘ㢦ࡢ㏆ࡃ⾲♧ࡉࢀࢀࡤ㸪 ࡢⓎヰ⪅ࡢⓎゝࢆㄆ㆑࡛ࡁࡿࡇࡽ㸪⏬㠃ࢆ」ᩘࡢ࢚ ࣜศࡍࡿ⡆᫆࡞ᡭἲࢆ⏝࠸ࡓ㸬 ᅗ 1 ࢚ࣜศ 16 ศ㸦44㸧
Figure 1 sample of aria division, sixteen̺division (4x4) 4.4 Ꮠᖥ࣓ࢱࢹ࣮ࢱ ୖグࡢ⾲⌧ࢆ⏬㠃⾲♧ࡍࡿࡓࡵᏐᖥ࣓ࢱࢹ࣮ࢱࢆసᡂ ࡍࡿ㸬⾲ 4 Ꮠᖥ࣓ࢱࢹ࣮ࢱグ㍕ࡍࡿ㡯┠ࡘ࠸࡚♧ࡍ㸬 ୗグࡢᩥᏐࣇ࢛ࣥࢺ࡞ࡢሗࢆᣢࡓࡏ࡚ࡶࡼ࠸ࡀ ࢸࣞࣅཷಙᶵ࡞ࡢࣈࣛ࢘ࢨ࡛ࡣࣇ࢛ࣥࢺࢆከ⏝࡛ࡁ࡞࠸ ሙྜࡶ࠶ࡿࡓࡵ㸪᪤Ꮡ࡛⏝࡛ࡁࡿせ௳ࡢࡳࢆ⏝ࡋࡓ㸬 ⾲ 4 Ꮠᖥ࣓ࢱࢹ࣮ࢱ㡯┠ Table 4 structure of subtitle metadata
࣓ࢱࢹ࣮ࢱせ⣲ タᐃᴫせ ID ㏻␒ Start time ⾲♧㛤ጞ้ End time ⾲♧⤊้ Position ⾲♧⨨ Oriented ྿ࡁฟࡋཱྀࡢྥࡁ Font size ᩥᏐࢧࢬ Paralinguistic ྿ࡁฟࡋࡢᙧ Name Ⓨヰ⪅ྡ Text Ꮠᖥࢸ࢟ࢫࢺ
5. ᐇ
ୖグࣉ࣮ࣟࢳᇶ࡙ࡁ㸪IPTV 㓄ಙࢩࢫࢸ࣒ࢆ⏝ࡋࡓࢩ ࢫࢸ࣒ࢆᐇࡋࡓ㸬ᫎീཷಙᶵࡋ࡚ IPTV ཷಙᶵ㸪Ꮠᖥ ⾲♧ࣈࣛ࢘ࢨࡋ࡚ LIME ࣈࣛ࢘ࢨ[17]㸪ᫎീ㓄ಙ⨨ ࡋ࡚㸪IPTV ⏝ Video Server ࢆ⏝࠸ࡓ㸬ᅗ 5 ࢩࢫࢸ࣒ᵓᡂ ᅗࢆ♧ࡍ㸬ࢸࣞࣅࡸ Set top box ࡛ᫎീࢆ Video Server ࡽ ཷಙࡋ㸪Ꮠᖥሗࡣ Lime Server ࡽྲྀᚓࡍࡿ㸬Ꮠᖥࢹ࣮ࢱ ࡘ࠸࡚ࡣ㸪᭱ึࡍ࡚ࡢࢹ࣮ࢱࢆ㏦ಙࡍࡿ᪉ᘧ㡰ḟ ㏦ಙࡍࡿ᪉ᘧࡀᐇ࡛ࡁࡿࡀ㸪ࡍ࡚ࡢࢹ࣮ࢱࢆྲྀᚓࡍࡿ ሙྜࡣ㸪᭱ึࡢࢹࢥ࣮ࢻฎ⌮㛫ࡀࡗ࡚ࡋࡲ࠺㸬㏲ ḟฎ⌮ࢆࡍࡿሙྜࡣ㸪㓄ಙࢱ࣑ࣥࢢࡼࡗ࡚Ꮠᖥᫎീ ࡢ㐜ᘏࡀⓎ⏕ࡍࡿྍ⬟ᛶࡀ࠶ࡿ㸬ᅇࡣࢱ࣑ࣥࢢࡀ㔜せ ࡛࠶ࡿࡇࡽ㸪ᚋ⪅ࡢ㏲ḟ㓄ಙ᪉ᘧࡋࡓ㸬 ᅗ 2 ࢩࢫࢸ࣒ᵓᡂᅗ Figure 2 System overviewᏐᖥ⨨ᣦᐃࡢࡓࡵࡢ⏬㠃ศࡣ⦪㸪ᶓ㸪ࡑࢀࡒࢀ 4 ศ ࡢ 16 ศࡋࡓ㸬࣓ࢱࢹ࣮ࢱࡣᖖ⪅ࡀᡭື࡛సᡂࡋ㸪ឤ 㒊ศࡣኌࡢࢺ࣮ࣥࡸ㡢ࡢ࣮࣒࣎ࣜࣗࢆ⪃៖ࡋ࡚ᣦᐃࡋࡓ㸬 ࣓ࢱࢹ࣮ࢱࡣ Tab-separated values㸦TSV㸧ᙧᘧࢆ⏝࠸㸪⾲ 4 ࡢ㡯┠ࢆグ㍕ࡋࡓ㸬ᅗ 7 ࡢࡼ࠺㸪Ꮠᖥࢹ࣮ࢱࡢ⾲グࡋ ࡚ W3C ࡢ TTML[18]ࢆᣑᙇࡋ㸪attribute ⾲ 4 ࡢྛせ⣲ࢆ ⾲グࡋ࡚ࡶࡼ࠸㸬
6. ホ౯
๓グࢩࢫࢸ࣒ࢆ⏝࠸㸪྿ࡁฟࡋᆺᏐᖥ㸪paralinguistic ⾲⌧ ࡢ᭷ຠᛶࢆ☜ㄆࡍࡿࡓࡵ㸪᪤ᏑࡢᖏᆺᏐᖥ⾲♧᪉ἲᮏ ࢩࢫࢸ࣒ࡢẚ㍑ホ౯ࢆ⾜ࡗࡓ㸬17 ྡࡢ⿕㦂⪅㸪2 ✀㢮ࡢ ᫎീࢆ㚷㈹ࡋ࡚ࡶࡽ࠸㸪ࣥࢱࣅ࣮ࣗㄪᰝࢆᐇࡋࡓ㸬⿕ 㦂⪅ࡣ20 ṓࡽ 60 ṓࡢ⏨ᛶ 8 ྡ㸪ዪᛶ 9 ྡ࡛㸪ࢁ࠺࠶⪅ 2 ྡ㸪 㞴⫈⪅ 1 ྡ㸪ᖖ⪅ 14 ྡ࡛࠶ࡿ㸬ࢁ࠺࠶⪅ࡢ⿕㦂⪅ࡣᡭヰࢆ ẕㄒࡍࡿ᪉࡛࠶ࡗࡓࡀ㸪♫άື✚ᴟཧຍࡉࢀࡿ࡞㸪 ᪥ᮏㄒࢆ⌮ゎࡋㄞゎຊࡢ࠶ࡿ᪉࡛࠶ࡗࡓ㸬ᖖ⪅ࡢ࠺ࡕ 4 ྡࡣᡭヰ㏻ヂ⪅࡛⫈ぬ㞀ᐖ⪅⌮ゎࡀ࠶ࡿே࡛࠶ࡿࡀ㸪 10 ྡࡣࢇࡀ㞀ᐖ⪅ࢃࡗࡓࡇࡀ࡞࠸᪉࡛ ࠶ࡗࡓ㸬 6.1 ᐇᴫせ ⾲ 5 ᮏホ౯ࡢᐇᴫせࢆᅗ 3 ホ౯⏬㠃ࡢࢫࢼࢵࣉࢩࣙ ࢵࢺࢆᥦ♧ࡍࡿ㸬 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16ⓒ 2013 Information Processing Society of Japan
Vol.2013-EC-29 No.4 2013/8/10
ሗฎ⌮Ꮫ◊✲ሗ࿌ IPSJ SIG Technical Report
5 ᅗ 3 ࢫࢡ࣮ࣜࣥࢩࣙࢵࢺ㸦ୖẁ㸸ᥦᆺ㸪ୗẁ㸸᪤Ꮡᆺ㸧
Figure 3 Snap shots of evaluation system. (Upper: propose system, bottom: existing system)
⾲ 5 ࣥࢱࣅ࣮ࣗ-ホ౯ᐇᴫせ Table 5 description of interview examine
ᐇᴫせ
ど⫈ᫎീ ࢩ࣏࣮ࣥ࢞ࣝほගᒁ
ࠕAn experience to call your ownࠖ ⣙ 3 ศ㛫 ⱥㄒ㡢ኌ ᪥ᮏㄒᏐᖥ 㐍⾜ᙺࡀ୍ே࡛ヰࡍᫎീ⣙ 2 ศ㸪ከࡃࡢ⾤୰ࡢ ேࣥࢱࣅ࣮ࣗࡍࡿᫎീ⣙ 1 ศ࡛ᵓᡂ ᐇ᪉ἲ 3 ศࡎࡘ 2 ✀㢮ࡢᏐᖥࣃࢱ࣮࡛ࣥど⫈ࡋࡓᚋ ࣥࢱࣅ࣮ࣗࢆᐇ㸬 Ꮠᖥ⾲グ 1㸬ᖏᆺᏐᖥ㸦᪤ᏑᏐᖥ┦ᙜ㸧 2㸬྿ࡁฟࡋᏐᖥ Ꮠᖥࡢࢱ࣑ࣥࢢ㸪ᨵ⾜࡞ࡣᡭື࡛సᡂ㸬 ㉁ၥෆᐜ Q1㸸ࡑࢀࡒࢀࡢᏐᖥ⾲グ᪉ἲࡘ࠸࡚㸪ࡼ࠸Ⅼ㸪 ᨵၿⅬࢆᩍ࠼࡚ࡃࡔࡉ࠸㸬 Q2㸸྿ࡁฟࡋᆺ࡛⾲ࡋ࡚࠸ࡿឤ⾲⌧ࡘ࠸࡚ ࠺ឤࡌࡲࡍ㸽 6.2 ⤖⤖ᯝ ௨ୗࣥࢱࣅ࣮ࣗࡢ⤖ᯝࢆ⟠᮲᭩ࡁ࡛♧ࡍ㸬 z 㢦ࡢ㏆ࡃᏐᖥࡀ⾲♧ࡉࢀࡿࡢ࡛㸪⾲୍⥴ࡳ࠼ ࡿⅬࡀࡼ࠸ z ୗ㒊⾲♧ࡉࢀࡿᖏᆺᏐᖥ࡛ࡣ㸪Ꮠᖥࢆㄞࡴᫎീࢆ ぢࡿࡢ୍᪉㞟୰ࡍࡿᙧ࡞ࡗ࡚ࡋࡲ࠺ࡓࡵ㸪ᫎീ ࢆぢ㏨ࡋࡀࡕ࡛࠶ࡿ z ୍ேࡢேࡀࢼ࣮ࣞࢩࣙࣥࡢࡼ࠺ヰࡋ࡚࠸ࡿࡁࡣ ྿ࡁฟࡋ࡛࡞ࡃ࡚ࡶࡼ࠸ࡀ㸪ࣥࢱࣅ࣮ࣗᙧᘧࡢࡁ ࡣ྿ࡁฟࡋࡢ࠺ࡀࡼ࠸ z ྿ࡁฟࡋࡀᫎീࡢୖࡿࡇ࡛㸪⫼ᬒࡀ㞃ࢀࡿࡇ ࡀ࠶ࡿࡓࡵ㸪ぢ࡙ࡽ࠸ z ⏬㠃ࡀኚࢃࡗࡓ㸪྿ࡁฟࡋࡢሙᡤࡀࡇ࠸ࡿࡢ ࡀࢃࡽ࡞࠸ࡢ࡛㸪୍▐᥈ࡉ࡞࠸࠸ࡅ࡞࠸ z ࡶࡗⓎヰ⪅㏆࠸ࡇࢁ྿ࡁฟࡋࢆࡔࡋ࡚ࡋ ࠸㸬ࡆࢼࡢᏐᖥ࡞ࡢ㸪ேࡢヰ࡞ࡢࡀࢃࡾ ࡃ࠸㸬࠼ࡤࢠࢱ࣮ࢆᣢࡗ࡚࠸ࡿேࡀ࠸ࡓሙྜ㸪ḷモ ࡞ࡢ㸪ヰࡋ࡚࠸ࡿෆᐜ࡞ࡢࡢ༊ูࡣ࠺࡞ࡿࡢ z 㢦ࡀᫎࡗ࡚࠸࡞࠸ࡁࡢሙᡤ㐪ឤࡀ࠶ࡿ z Ⓨヰ⪅ࡀே࡞ࡗࡓ㸪ヰࡋ࡚࠸࡞࠸Ⓨヰ⪅ࡢ㢦 ヰࡋ࡚࠸ࡿⓎヰ⪅ࡢ྿ࡁฟࡋࡀ㔜࡞ࡿࡇࡀ࠶ࡿ ࡼࡃ࡞࠸㸬 z ࡍ࡚ࢆ྿ࡁฟࡋࡍࡿࡢ࡛ࡣ࡞ࡃ㸪ࡋࡗࡾෆᐜ ࢆఏ࠼ࡿࡶࡢ㛵ࡋ࡚ࡣ㸪ᚑ᮶ࡢᏐᖥ࡛㸪ヰ࡞ࡀ 㣕ࡧ࠺ሙྜࡣ㸪྿ࡁฟࡋ࡞࠸ศࡅࡣ࡛ࡁ࡞࠸ z ྿ࡁฟࡋࡢⰍࡣ㸪⫼ᬒⰍ㸪ࡃⓎヰ⪅ࡢⰍࡢ㛵ಀ ࡛ࢃࡾࡸࡍࡃࡋ࡚ࡋ࠸ ឤ⾲⌧࡞ࡘ࠸࡚ࡣ௨ୗࡢ㏻ࡾࡢᅇ⟅ࡀ࠶ࡗࡓ㸬 z ࢟࢟ࡋࡓឤࡌࡀฟ࡚ࡼ࠸ z ⪺ࡇ࠼࡚ࡃࡿឤࡌ྿ࡁฟࡋᙧࡀ࣐ࢵࢳࡋ࡞࠸ࡁ ࡀ࠶ࡿ z ᯟពࡀ࠶ࡿࡇࡣࢃࡿࡀ㸪ᯟࡀ㏵୰࡛ኚࢃࡿ ࡕࡽࡕࡽࡍࡿ z ୍ேࡢேࡀヰࡋ࡚࠸ࡿ㏵୰྿ࡁฟࡋࡀኚࢃࡿ㐪 ឤࡀ࠶ࡿ z ぢ័ࢀ࡚࠸ࡿࡢ࡛ᖏᆺࡢ᪉ࡀⴠࡕ╔࠸࡚ឤࡌࡿࡀ㸪ឤ ⾲⌧ࡣ࠶ࡿ᪉ࡀᴦࡋࡃឤࡌࡿ
7. ⪃ᐹ
྿ࡁฟࡋ⾲グ㸪paralinguistic ⾲⌧㸪⾲♧ࢱ࣑ࣥࢢࡘ࠸ ࡚ホ౯⤖ᯝࢆࡶ⪃ᐹࡋ㸪ࢩࢫࢸ࣒㠃ࡘ࠸࡚ࡣᐇ ࡢ≧ἣࢆ㋃ࡲ࠼࡚⪃ᐹࡍࡿ㸬 7.1 ⾲⌧᪉ἲ㛵ࡍࡿ⪃ᐹ ྿ࡁฟࡋࡢ⨨ࡣ㏆࠸᪉ࡀⓎヰ⪅ࢆⓎぢࡋࡸࡍ࠸ࡀ㸪ࣅࢹ ࢜ᫎീࡢሙྜ㸪₇➼ẚ㍑ࡋ࣓࣮࢝ࣛ࣡ࢡࡸ⦅㞟ࡀ⾜ࢃ ࢀ࡚࠸ࡿࡇ࡛ேࡢ⨨ࡀ㢖⦾ື࠸࡚࠸ࡿ㸬ࡑࡢࡓࡵ㸪 ㏆ࡃฟࡍࡇ࡛㸪྿ࡁฟࡋ⨨ࡀ㢖⦾⛣ືࡍࡿ≧ἣ ࡞ࡾ㸪Ꮠᖥ⾲♧⨨ࡀࡕࡽࡕࡽኚࢃࡿࡇ࡛ぢ࡙ࡽࡃ࡞ࡗ ࡚࠸ࡓ㸬୍᪉࡛ே྿ࡁฟࡋࡢ⨨ࡀ㞳ࢀࡍࡂࡿㄡࡢⓎ ゝࢃࡾ࡙ࡽ࠸࠸࠺ពぢࡶ࠶ࡿ㸬ࡲࡓ㸪⫼ᬒࢆ㞃ࡋ࡚ ࡋࡲ࠺࡞ࡢពぢࡶ࠶ࡗࡓࡓࡵ㸪㓄⨨ࡸ྿ࡁฟࡋࡢࡁࡉ Ⰽ㸦༙㏱᫂࡞㸧ࡘ࠸࡚᭦࡞ࡿ᳨ウࡀᚲせ࡛࠶ࡿࡇ ࡀศࡗࡓ㸬 ࣐ࣥ࢞ᩥἲࡢά⏝ࡘ࠸࡚ࡣ㸪┤ほⓗ⌮ゎࡋ㐪ឤࡀ ࡞࠸ᵝᏊ࡛࠶ࡗࡓ㸬⿕㦂⪅ᖖ⪅ࡀከ࠸ࡇࡶ࠶ࡾ㸪ኌ Ⰽ࡞ࡣ⪺ࡅࡤศࡿࡓࡵᚲせᛶࡣㄆࡵࡽࢀ࡞ࡗࡓ㸬୍ ᪉㸪ᣄྰⓗ࡞ពぢࡶ࡞࠸ࡇࡽぢ័ࢀࡿࡇ࡞࡛ゎᾘⓒ 2013 Information Processing Society of Japan
Vol.2013-EC-29 No.4 2013/8/10
ሗฎ⌮Ꮫ◊✲ሗ࿌ IPSJ SIG Technical Report
6 ࡉࢀࡿྍ⬟ᛶࡶ࠶ࡿ㸬ࡇࢀࡣ㞀ᐖ⪅ࡢ᪉ࡶྵࡵ㸪ぢ័ࢀ࡚ ࠸ࡿࡢ࡛ᖏᆺࡢᏐᖥࡢ᪉ࡀぢࡸࡍ࠸࠸࠺ពぢࡶࡘ࡞ࡀ ࡿ࠸࠼ࡿ㸬ᅇࡢ⿕㦂⪅ࡢ⫈ぬ㞀ᐖ⪅ࡢ᪉ࡣᡭヰࢆẕㄒ ࡋ࡚࠸ࡿேࡀ 2 ྡ࠾ࡾ㸪Ꮠᖥࡼࡾᡭヰࡢ᪉ࡀㄞࡳࡸࡍ࠸ ࠸࠺ពぢࡶ࠶ࡗࡓ㸬ᡭヰࢆẕㄒࡍࡿே࡞㸪᪥ᮏㄒࡢ ㄞゎຊࡶᕪࡀ࠶ࡿࡓࡵ㸪ᘬࡁ⥆ࡁ⫈ぬ㞀ᐖ⪅ࣄࣜࣥ ࢢࢆ㐍ࡵࡓࡾ㸪ᡭヰࡼࡿ⾲⌧ࡢẚ㍑࡞᭦࡞ࡿ᳨ドࢆ ῝ࡵࡓ࠸㸬ࡲࡓ㸪྿ࡁฟࡋཱྀࡢᙧࡘ࠸࡚ࡶ paralinguistic ⾲⌧ࡢୖ࡛ࡣពࡀ࠶ࡿ㸬࣐ࣥ࢞⾲グ࡛ࡣᚰࡢኌࢆ⾲グࡍ ࡿࡁ࡞ࡣ㸪ࡀࡗࡓཱྀ࡛ࡣ࡞ࡃᅗ 4 ♧ࡍࡼ࠺࡞ࢆ ࡘ࡞ࡆཱྀ࡚ࢆసࡿࡇࡶ࠶ࡿ㸬ࡇࡢ㒊ศࡶឤࢆ⾲ࡍࡢ 㔜せ࡞࣏ࣥࢺ࡞ࡗ࡚࠸ࡿ㸬ᅇࡣࣥࢱࣅ࣮ࣗᫎീ࡛ ࠶ࡗࡓࡓࡵά⏝࡛ࡁ࡞ࡗࡓࡀᫎീࡢ✀㢮ࡶቑࡸࡋ᳨࡚ウ ࡍࡿᚲせࡀ࠶ࡿ⪃࠼ࡿ㸬 ᅗ 4 ྿ࡁฟࡋཱྀࡢ 㸦ᆺ㸧 Figure 4 Type of round bubble tail
7.2 ࢩࢩࢫࢸ࣒ᵓ⠏㛵ࡍࡿ⪃ᐹ ₇ฟሗࡢ୍ࡘࢱ࣑ࣥࢢࡀ࠶ࡿࡀ㸪IP ఏ㏦࠾ࡅࡿྠ ᮇ㸬ᨺ㏦㟁Ἴ࡛ࡣࡰྠᮇࡋࡓࡶࡢ㏦ಙ࡛ࡁࡿࡀ㸪ูࢫ ࢺ࣮࣒࡛ࣜ㏦ࡍࡿሙྜ㸪ྠᮇࡀ㞴ࡋ࠸࣏ࣥࢺ࡞ࡿ㸬 ࡲࡵ࡚㏦ࡍࡿ᪉ἲ࡛ࡣึᮇࣂࢵࣇࡀࡁࡃ࡞ࡿ㸬 ᚋࡢ᳨ウㄢ㢟ࡢ୍ࡘ࡛࠶ࡿ㸬ཷಙᶵഃ࡛ไᚚ࡛ࡁࡿࢱ࣑ ࣥࢢࡶ࠶ࡾ㸪྿ࡁฟࡋ⨨ᫎീࡀࡎࢀ࡚ࡋࡲࡗ࡚࠸ࡿཎ ᅉࡶ࡞ࡗ࡚࠸ࡓ㸬
8. ࡲࡵ
paralinguistic ⾲⌧ࢆ⏝࠸ࡓᏐᖥᥦ♧᪉ἲࢆᥦࡋ㸪ࢩࢫࢸ ࣒ࢆᐇࡋࡓ㸬ࡲࡓ㸪ࡑࡢࢩࢫࢸ࣒ࢆ⏝࠸࡚㸪ࣥࢱࣅࣗ ࣮ㄪᰝࢆᐇࡋࡓ㸬᪤ᏑࡢᏐᖥࡼࡾඃᛶࡀ࠶ࡿࡇࡀศ ࡗࡓࡀ㸪ࡲࡔᨵၿⅬࡶከ࠸㸬ሗಖ㞀ࡢࡓࡵࡢᏐᖥ⾲♧ ࡢࡳ࡛ࡣ㸪⫈ぬ㞀ᐖ⪅ࡣࡑࡢ₇ฟ࡞ࡿ㣭ሗࢆཷࡅ ࡿࡇࡀ࡛ࡁ࡞࠸ࡓࡵ㸪ᙺ⪅ࡢ⾲⌧ࡸࡑࢀࡽᚓࡽࢀࡿᴦ ࡋࡉ㸪㠃ⓑࡉ࠸࠺Ⅼ࠾࠸࡚ᖖ⪅ྠࡌሗࢆᚓࡿࡇ ࡀ࡛ࡁ࡞࠸㸬ࢸ࢟ࢫࢺሗࡋ࡚㏣グࡍࡿࡇࡶྍ⬟࡛ ࠶ ࡿ ࡀ 㸪 ୍ ᗘ ㄞ ࡵࡿ ศ 㔞ࡶ 㝈 ࡽ ࢀ ࡿ ࡓ ࡵ ᩥ Ꮠ௨ እ ࡢ paralinguistic ⾲⌧ࢆά⏝ࡍࡿࡇ࡛▷㛫ከࡃࡢሗࢆ ᥦ౪࡛ࡁࡿࡼ࠺࡞ࡿ㸬ከࡃࡢேࡀ័ࢀぶࡋࢇ࡛࠸ࡿ㸪࣐ ࣥ࢞⏝࠸ࡽࢀࡿᩥἲࢆᛂ⏝ࡍࡿࡇ࡛㸪᪂ࡓᏛ⩦ࡀࡋ ࡞ࡃࡶ┤ほⓗ paralinguistic ⾲⌧ࢆ⌮ゎ࡛ࡁࡿᐃࡋ ࡚㸪ᥦᐇࢆ⾜ࡗࡓ㸬ᖖ⪅ࡼࡿホ౯ࡣ㈶ྰ୧ㄽ࡛࠶ ࡗࡓࡀ㸪⫈ぬ㞀ᐖ⪅ࢆྵࡵ࡚ࡉࡽ࡞ࡿ᳨ドࢆ῝ࡵࡓ࠸㸬 ᮏ◊✲࡛ࡣ㸪ᫎീࡸ₇࠸ࡗࡓ㸪₇⪅ࡀゝⴥ࡛⾲⌧ࡍࡿ ࡼ࠺࡞ࢥࣥࢸࣥࢶ࠾࠸࡚㸪ࡼࡾ₇ᢏࢆᛅᐇᏐᖥ࡛ఏ࠼ ࡿࡇࡀ࡛ࡁࡿࡼ࠺࡞ࡾ㸪Ꮠᖥࡼࡿࢥࣥࢸࣥࢶ㚷㈹ ᴦࡋࡉ࡞ࢆᥦ౪ࡍࡿࡇࡀ࡛ࡁࡿࡼ࠺࡞ࡿࡇ࡛㸪㞀 ᐖ⪅ᩘࡢၥ㢟࡞ࡽᚋᅇࡋ࡞ࡾࡀࡕ࡞࢚ࣥࢱ࣮ࢸ࣓ ࣥࢺࢥࣥࢸࣥࢶࡢࣂࣜࣇ࣮ࣜ᥎㐍ά⏝࡛ࡁࡿ⪃࠼ࡿ㸬 ᅇࡢᐇ⤒㦂࠾ࡼࡧホ౯⤖ᯝࢆ㋃ࡲ࠼ࡓ࠺࠼࡛ࢩࢫࢸ࣒ 㠃㸪⾲⌧㠃ࡢ୧㠃ࡽ᭦࡞ࡿᕤኵࢆࡋࡓ࠸㸬 ᚋࡣ㸪⫈ぬ㞀ᐖ⪅ࡢࣥࢱࣅ࣮ࣗㄪᰝࡢᐇࡸ㸪ど⥺ ࡢືࡁࡸ⫼ᬒ➼ࢆ⪃៖ࡋ࡚ຠᯝⓗ࡞ሙᡤ྿ࡁฟࡋࢆ㓄⨨ ࡍࡿࡓࡵࡢ࣮࢜ࢧࣜࣥࢢࢶ࣮ࣝࢆ᳨ウࡋࡓ࠸㸬ཧ⪃ᩥ⊩
1) ཌ⏕ປാ┬, ᖹᡂ 18 ᖺ㌟య㞀ᐖඣ࣭⪅ᐇែㄪᰝ(2008), http://www.mhlw.go.jp/toukei/saikin/hw/shintai/06/index.html., 2008 2) Ỉ㔝 ᫎᏊ, ͆୰㧗ᖺᒙࡢ㞴⫈㛵ࡍࡿ⌧≧ព㆑͇, LifeDesign REPORT 2009 ᖺ.1-2 ᭶ྕ, 2009 3) ᖹᡂ 24 ᖺ∧㧗㱋♫ⓑ᭩,ෆ㛶ᗓ㸪 http://www8.cao.go.jp/kourei/whitepaper/w-2012/zenbun/24pdf_index.h tml, 2012 4) ᖹᡂ 23 ᖺᗘࡢᏐᖥᨺ㏦➼ࡢᐇ⦼,⥲ົ┬㸪 http://www.soumu.go.jp/menu_news/s-news/01ryutsu09_02000045.htm l, 2011 5) 㤶ྲྀ ῟Ꮚ,͆㧗㱋⪅ࡗ࡚ࡢ TV Ꮠᖥࡢ㐺ษᛶ㛵ࡍࡿ◊✲͇, ┴❧㛗ᓮࢩ࣮࣎ࣝࢺᏛᅜ㝿ሗᏛ㒊⣖せ (8), 65-79, 2007 6) ࢹࢪࢱࣝᨺ㏦௦ࡢど⫈ぬ㞀ᐖ⪅ྥࡅᨺ㏦ࡢᐇ㛵ࡍࡿ◊✲ , ⥲ົ┬, http://www.soumu.go.jp/menu_news/s-news/01ryutsu05_02000022.htm l, May. 2012. 7) ๓ᕝ႐ஂ㞝. ͆㡢ኌࡣࣃࣛゝㄒሗࢆ࠸ఏ࠼ࡿ͇ㄆ▱⛉ Ꮫ. Vol.9. No. 1. 46-66. 2002. 8) ♫ᅋἲே 㟁Ἴ⏘ᴗ, STD B37 ⿵ຓࢹ࣮ࢱࣃࢣࢵࢺᙧᘧ࡛ఏ㏦ ࡉࢀࡿࢹࢪࢱࣝᏐᖥࢹ࣮ࢱࡢᵓ㐀㐠⏝ 2.4 ∧, 2006 9) ⸨⤢Ꮚ㸪༡᮲ᾈ㍤㸪ྜྷぢẎᙪ, ͆㆟ࡢሗಖ㞀ࢆ┠ⓗࡋ ࡓ྿ࡁฟࡋᆺᏐᖥᥦ♧᪉ᘧࡢ᳨ウ(ࢩࢫࢸ࣒)͇, ฎᏛ◊ሗ SLP-75, No.14, pp75-82 , 2009 10) ᴋ ᡣᏊ,⏣ஂ⨾Ꮚ,Ụⲡ㑈ᖹ,ᚋ㛵 ᨻྐ,㊊❧ Ꮥஅ㸪⁁ཱྀ ༤, ⏕⏣┠⨾⣖,✄ᇉᡂဴ, ͆ࣥࢡ࣮ࣝࢩࣈࢹࢨࣥᇶ࡙࠸ࡓࣥ ࢱࣛࢡࢸࣈ࡞ேᙧࡢ㛤Ⓨᐇ㊶͇, ಙᏛㄽ㸦D㸧㸪Vol.J96-D No.1 pp.61-69, Jan. 2013. 11) ụ㇂⚽, ᯘ㈗ᏹ, ᑿෆ⌮⣖ኵ, ͆྿ࡁฟࡋᙧᘧࡢᏐᖥ⾲♧ࢩ ࢫࢸ࣒ : ࡞ࡌࡲࡃࢇ͇ ಙᏛᢏሗ. MVE, ࣐ࣝࢳ࣓ࢹ࣭௬ ⎔ቃᇶ♏ 107(130), 79-84, July, 2007 12) బ⸨Ᏻ㔛, ⳥ụⱥ᫂, ᕷᕝ⇘, "㡢ኌࡢⓎヰ⪅༳㇟ሗࡢ▱ ぬ࣭ㄆ▱ࣔࢹࣝᵓ⠏",ಙᏛᢏሗ, Vol.SP2011-171, pp.89-94, March, 2012. 13) ᭩ࡁ㉳ࡇࡋࡢࢆ┠ᣦࡋࡓ㡢ኌࢸ࢟ࢫࢺࢆᑐ㇟ࡋ ࡓⓎヰ༳㇟ࡢศᯒ㸪す⏣ᫀྐ㸪ᇼෆ㟹㞝㸪㯮ᒾ┾࿃㸪ᕷᕝ⇘㸪 ሗฎ⌮Ꮫㄽᩥㄅ㸪Vol.50㸪No.2㸪pp.460-468㸪2009.2 14) Ώ㎶ு, ⫈ぬ㞀ᐖ⪅ࡢࡓࡵࡢ㡢ኌᫎീ, ᪥ᮏ㡢㡪Ꮫㄅ 52(12), 979-984, 1996-12-01 15) 㣤ᓥᬗᏊ, ẖ᪥ 5 ศࡢᮁㄞࢺ࡛ࣞ㌟ࡘࡃ㸟 ఏࢃࡿኌࡢฟ ࡋ᪉࣭ヰࡋ᪉, ᪥ᮏᐇᴗฟ∧♫, ᮾி, 2008 16) 㧗᭶⩏↷, ࣐͆ࣥ࢞࠾ࡅࡿ⾲⌧ᢏἲࡢ㐍 -ఱࡀ࣐ࣥ࢞ࢆ ᩥⱁᡂ㛗ࡉࡏࡓࡢ͇ -ᮾᾏᏛ⣖せ. 㛤ⓎᕤᏛ㒊 20, 53-75, March. 2011.17) ITU-T, ITU-T Rec. H.762,"Lightweight interactive multimedia environment for IPTV services (LIME), 2009
18) W3C, Timed Text Markup Language (TTML) 1.0 (Second Edition), http://www.w3.org/TR/ttaf1-dfxp/, 2013
ⓒ 2013 Information Processing Society of Japan
Vol.2013-EC-29 No.4 2013/8/10