Top PDF 音声認識、音声合成による

目次 1. 音と音声 2. 音声研究 : 合成認識 3. 音声コーパスとは 4. 大規模コーパスから見えること 5. 音声コーパスの利用 6. 音声コーパス類似性の可視化 7. 音響データベース 8. まとめ市民講座

... 複数音声コーパス可視化法のまとめ n コーパス特徴によるコーパス間の類似性の可視化類似度の高いコーパス・特徴的な要素を持つコーパスの判断が容易 n 属性の値への重みづけ ...

60

2L3-5 行動識別，スロット抽出および音声認識の統合によるノイズに頑健な命令理解

... 関連研究として，構文解析による命令理解手法が提案されている [ 板谷 11][Tenorth 10][Thomas 12] ．しかし，未知語が存在する場合や音声認識結果が誤っている場合に命令文を理解することが困難な場合がある．一方，本稿では汎化性能により辞書に存在しない単語や音声認識誤りが多少起こったとしても言語理解をすることが可能である． ...

4

1 東京方言における意味的限定と非限定を区別する音声的基準短文読み上げ資料と合成音声聴取実験によるアクセント実現度の検討 Restrictive Modification and Realization of Lexical Accents in Tokyo Japanese: A Quantit

... 2.2.2 先行文節のアクセントが有核で，検討対象文節が無核の場合次に，有核文節が先行する場合の無核文節の状況について，先と同様ふたつの音響値について文ごとに各話者の平均値をプロットしたのが図10である。白抜き記号が「奈良のみやげを」のように検討対象文節（「みやげを」）が直前の文節から意味的限定を受けている場合，黒が「奈良でみやげを」のように意味的に限定を受けていない場合である。図を見ると，直前の文節か ...

23

情報処理学会研究報告 IPSJ SIG Technical Report 調音運動 HMM 音声合成における調音特徴 - 声道パラメータ変換と音源の改良小野田高幸桂田浩一新田恒雄音声認識と合成を同じ調音運動モデルを用いて実現するシステムの開発を行っている. 調音特徴を用いて HMM を設計す

... は，多数話者の音声コーパスが必要になる一方，HMM 音声合成では特定話者をターゲットにするため，認識と合成の双方を満足するには，話者不変の特徴量が必要になる．我々は先に，音声から話者不変な調音特徴を抽出し，調音運動を表現する AM を構成することで，高精度不特定話者音声認識が 1 名の話者データで達成可能なこと ...

6

時間周波数表現の標本化から音声の分析変換合成を考える

... 声が厳密には周期的ではないことによるスペクトルの広がりに対応する。また、 $\varphi_{2}$ は、時間窓を Fourier 変換して求められるスペクトルの平滑化関数と、調波構造を除去するための anti-aliasing フィルタの ( 周波数軸上での ) 応答関数の畳込に対応する。この anti-aliasing のための関数として、 legacy-STRAIGHT では、 2 次の cardinal- ...

14

ＤＳＰを用いた音声合成スペクトル・エディタ: University of the Ryukyus Repository

... 商良．山城：DSPを用いた音声合成スペクトル゛エディタ 222 音声波形には，音声データとして使用するときには不要となる部分が含まれている．音声波形編集では，音声波形から必要な部分を切り出したり，その結果を聴取して確認したりできる図４に，音声波形編集の画面を示す．画面の下部に示きれている各コマンドの機能を以下に示す． (1)横軸拡大：指定された音声区間を切り出[r] ...

12

アウトライン字幕付与と音声認識字幕作成システム音声認識の構成コーパス ( 主に言語モデルについて ) 自動整形コーパスシステムの利用例リアルタイムの字幕作成 2

... 放送講義における字幕作成 • 実際の講義音声で字幕作成の効率を測定 – 放送大学ラジオ講義（45分×計27回） – 教科書と台本（ただし完全ではない）が利用可能 – 字幕サーバ・エディタにより字幕を作成 ...

49

とは AITalk は従来の機械音ではなく人の声で合成する技術コーパスベース音声合成方式を採用しより人間らしく自然な音声で自由に音声合成をすることが可能な高品質音声合成エンジンです AITalk の特徴豊富な話者と言語日本語話者は大人から子供まで男女 17 種類関西弁にも対応言語の種類

... コーパスベース音声合成機能に加え、微妙なフレーズ（イントネーション）の調整やスピード調整、音声ファイルの作成などの役割をこなす、チューニングツールがもっと便利に使いやすくなりました。さらに、利用シーンや用途によって、標準語は女性7名、男性4名、女の子2名、男の子2名、関西弁風は女性1名、男性1名の中からお好きな音声を選ぶ事ができます。 ...

19

DSpace at My University: 音声認識アプリを活用した韓国語リーディング授業に関する研究

... 1　音声認識アプリによる発音練習音声認識アプリとして、iOS 端末は「メモ」、その他の端末は「Google 翻訳」を立ち上げ、韓国語キーボードにしてマイクボタンを押し端末に向かって話しかけると、話された言葉をテキスト化してくれる。学生は、このアプリを使い声に出して本文を読む練習をす ...

8

V6 音声入力機能

... 使用する音声認識エンジンに合わせて、専門のエンジニアがその入力用途ごとに専用の「音声認識辞書」帳票定義の作成と同時に音声認識エンジンに最適化された専用の「音声認識辞書」 ...

23

ドコモに見られる対話システムの典型各種デバイス 1 音声 ( ユーザ ) 音声認識 2 テキスト ( ユーザ ) 3 テキスト ( ユーザ ) 自然対話 PF 4 テキスト 5 タスク + クエリ意図解釈 8 テキスト ( システム ) ( 対話制御 ) シナリオ対話 6 タスク + クエリ 7

... チャットボットとは，主にメッセンジャーサービス（LINE ， Facebook Messenger ， Slack等）上でのエンドユーザからの自然言語による問いかけに対し，自動応答する技術．メッセンジャーサービスの利用率の高まりを背景に，企業側のメッセンジャーサービス上でのエンドユーザとのコミュニケーションの需要も高まってきている． ...

11

はじめに接続取り付け部品を確認するナビゲーション本体関係ナビゲーション本体 1 バインドネジ (M5) 8 皿ネジ (M5) 8 スペーサー 1 接続ケーブル関係電源コード 1 U エレメントコネクター 1 RCA 出力ケーブル 1 音声認識用マイク関係音声認識用マイク 1 マイククリップ

... －必ず車のバッテリーの⊖端子を外してから接続してください－接続のしかた 1 －必ず車のバッテリーの⊖端子を外してから接続してください－他のリード線の接続は（☞10∼11ページ）車速信号入力車の走った距離を検出するために使用します。必ず車の車速検出回路に接続してください。 (車の車速検出回路への接続が困難な場合は、車速パルス発生機「ND-PG1」(別売)[r] ...

36

音声情報処理

... Neural Machine Translation – LSTMによるEncoder と Decoderを組み合わせ、翻訳文を生成する Attention NMT – 原言語の単語列のEncoder出力に重みを加えてDecoderにいれることでアライメントをImplicitに学習する ...

50

(9) テキストデータとは音声データをテキスト化したものをいいます (10) 認識データとはテキストデータのうち特定のキーワードが登録された音声認識テーブルと照合し合致したデータをいいます (11) コンテンツとは文章テキスト音声画像動画その他の情報のことをいいます (12)

... 12. 当社は、本サービスが第三者の知的財産権およびその他の権利を侵害していないことを何ら保証するものではなく、申込者、利用者またはその他の第三者が本サービスに関連して直接的または間接的に被ったいかなる損害についても責任を負いません。 13. 第 3 条（本サービスの内容）に定める音声対話サービスを提供するにあたり、当社は、入力さ ...

11

トルコ語話者による日本語音読音声の分析－その2

... 18. 土屋順一（1992）「トルコ人学習者の日本語に見られるトルコ語の韻律の干渉」『日本語の韻律に見られる母語の干渉 (2) −音響音声学的対照研究−』（文部省重点領域研究「日本語音声における韻律的特徴の実態とその教育に関する総合的研究」、研究代表者：杉藤美代子 D1 班、平成 2 年度研究成果報告書）pp. 81-103。 19. ...

26

立石科学技術振興財団助成研究成果集(第27号) 2018 立石賞特別賞の受賞記念講演概要デジタル時代の音声符号化合成認識に関する音声分析根幹技術の発明名古屋大学名誉教授 1 音声情報処理のではないかと考えた 1. 1 わけであります歴史電話と蓄音機の発明板倉文忠電話は

... 当初私は，それをアナログ的なフィルターで実現しようとしたのですが，上手くいかないことが分かり，当時研究室に導入されたミニコン FACOM270-20 を使ってデジタル信号処理を意識した数理分析からスタートしました。その結果，音声の最適識別に必要な統計量は，初めの p 個の自己相関関数で抽出できることを明らかにし，これを使って音声の分析をスタートさせたわけであります。その研究をまとめた成 ...

5

システム / 制御 / 情報,Vol. 62, No. 2, pp , アイサイ研究者のための音声情報処理ソフトウェア入門特集号解説隠れマルコフモデルに基づく日本語音声合成ソフトウェア入門大浦圭一郎 * 橋本佳 * 南角吉彦 * 徳田恵一 * 1. はじめに音声合

... なん南かく角よし吉ひこ彦 1977 年 3 月 10 日生． 2004 年 3 月名古屋工業大学大学院工学研究科電気情報工学専攻博士後期課程修了．同年 4 月名古屋工業大学テクノイノベーションセンター大学院 VBL 部門中核的研究機関研究員， 2005 年 4 月名古屋工業大学大学院工学研究科助手， 2012 年 4 月名古屋工業大学大学院工学研究科准教授とな ...

6

音声認識、音声合成による