• 検索結果がありません。

音声認識、音声合成による

目次 1. 音と音声 2. 音声研究 : 合成 認識 3. 音声コーパスとは 4. 大規模コーパスから見えること 5. 音声コーパスの利用 6. 音声コーパス類似性の可視化 7. 音響データベース 8. まとめ 市民講座

目次 1. 音と音声 2. 音声研究 : 合成 認識 3. 音声コーパスとは 4. 大規模コーパスから見えること 5. 音声コーパスの利用 6. 音声コーパス類似性の可視化 7. 音響データベース 8. まとめ 市民講座

... 複数音声コーパス可視化法のまとめ n コーパス特徴によるコーパス間の類似性の可視化 類似度の高いコーパス・特徴的な要素を持つコーパスの判断が容易 n 属性の値への重みづけ ...

60

2L3-5 行動識別,スロット抽出および音声認識の統合によるノイズに頑健な命令理解

2L3-5 行動識別,スロット抽出および音声認識の統合によるノイズに頑健な命令理解

... 関連研究として,構文解析による命令理解手法が提案され ている [ 板谷 11][Tenorth 10][Thomas 12] .しかし,未知語が 存在する場合や音声認識結果が誤っている場合に命令文を理解 することが困難な場合がある.一方,本稿では汎化性能により 辞書に存在しない単語や音声認識誤りが多少起こったとしても 言語理解をすることが可能である. ...

4

1 東京方言における意味的限定と非限定を区別する音声的基準 短文読み上げ資料と合成音声聴取実験によるアクセント実現度の検討 Restrictive Modification and Realization of Lexical Accents in Tokyo Japanese: A Quantit

1 東京方言における意味的限定と非限定を区別する音声的基準 短文読み上げ資料と合成音声聴取実験によるアクセント実現度の検討 Restrictive Modification and Realization of Lexical Accents in Tokyo Japanese: A Quantit

... 2.2.2 先行文節のアクセントが有核で,検討対象文節が無核の場合 次に,有核文節が先行する場合の無核文節の状況について,先と同様ふたつの音響値につい て文ごとに各話者の平均値をプロットしたのが図10である。白抜き記号が「奈良のみやげを」 のように検討対象文節(「みやげを」)が直前の文節から意味的限定を受けている場合,黒が「奈 良でみやげを」のように意味的に限定を受けていない場合である。図を見ると,直前の文節か ...

23

情報処理学会研究報告 IPSJ SIG Technical Report 調音運動 HMM 音声合成における調音特徴 - 声道パラメータ変換と音源の改良 小野田高幸 桂田浩一 新田恒雄 音声認識と合成を同じ調音運動モデルを用いて実現するシステムの開発を行っている. 調音特徴を用いて HMM を設計す

情報処理学会研究報告 IPSJ SIG Technical Report 調音運動 HMM 音声合成における調音特徴 - 声道パラメータ変換と音源の改良 小野田高幸 桂田浩一 新田恒雄 音声認識と合成を同じ調音運動モデルを用いて実現するシステムの開発を行っている. 調音特徴を用いて HMM を設計す

... は,多数話者の音声コーパスが必要になる一方,HMM 音声合成では特定話者を ターゲットにするため,認識合成の双方を満足するには,話者不変の特徴量が必要 になる.我々は先に,音声から話者不変な調音特徴を抽出し,調音運動を表現する AM を構成することで,高精度不特定話者音声認識が 1 名の話者データで達成可能なこと ...

6

時間周波数表現の標本化から音声の分析変換合成を考える

時間周波数表現の標本化から音声の分析変換合成を考える

... 声が厳密には周期的ではないことによるスペクトルの広がりに対応する。 また、 $\varphi_{2}$ は、時間窓を Fourier 変換して求められるスペクトルの平滑化関数と、調波構造を除 去するための anti-aliasing フィルタの ( 周波数軸上での ) 応答関数の畳込に対応する。 この anti-aliasing のための関数として、 legacy-STRAIGHT では、 2 次の cardinal- ...

14

DSPを用いた音声合成スペクトル・エディタ: University of the Ryukyus Repository

DSPを用いた音声合成スペクトル・エディタ: University of the Ryukyus Repository

... 商良.山城:DSPを用いた音声合成スペクトル゛エディタ 222 音声波形には,音声データとして使用するときには不 要となる部分が含まれている.音声波形編集では,音 声波形から必要な部分を切り出したり,その結果を聴 取して確認したりできる図4に,音声波形編集の画 面を示す.画面の下部に示きれている各コマンドの機 能を以下に示す. (1)横軸拡大:指定された音声区間を切り出[r] ...

12

アウトライン 字幕付与と音声認識 字幕作成システム 音声認識の構成 コーパス ( 主に言語モデルについて ) 自動整形 コーパス システムの利用例 リアルタイムの字幕作成 2

アウトライン 字幕付与と音声認識 字幕作成システム 音声認識の構成 コーパス ( 主に言語モデルについて ) 自動整形 コーパス システムの利用例 リアルタイムの字幕作成 2

... 放送講義における字幕作成 • 実際の講義音声で字幕作成の効率を測定 – 放送大学ラジオ講義(45分×計27回) – 教科書と台本(ただし完全ではない)が利用可能 – 字幕サーバ・エディタにより字幕を作成 ...

49

とは AITalk は 従来の機械音ではなく 人の声で合成する技術 コーパスベース音声合成方式を採用し より人間らしく自然な音声で自由に音声合成をすることが可能な 高品質音声合成エンジンです AITalk の特徴 豊富な話者と言語日本語話者は大人から子供まで男女 17 種類関西弁にも対応 言語の種類

とは AITalk は 従来の機械音ではなく 人の声で合成する技術 コーパスベース音声合成方式を採用し より人間らしく自然な音声で自由に音声合成をすることが可能な 高品質音声合成エンジンです AITalk の特徴 豊富な話者と言語日本語話者は大人から子供まで男女 17 種類関西弁にも対応 言語の種類

... コーパスベース音声合成機能に加え、微妙なフレーズ(イントネーション)の調整やスピード調整、音声ファイルの作成 などの役割をこなす、チューニングツールがもっと便利に使いやすくなりました。 さらに、利用シーンや用途によって、 標準語は女性7名、男性4名、女の子2名、男の子2名、関西弁風は女性1名、男性1名の中からお好きな音声を選ぶ事がで きます。 ...

19

DSpace at My University: 音声認識アプリを活用した 韓国語リーディング授業に関する研究

DSpace at My University: 音声認識アプリを活用した 韓国語リーディング授業に関する研究

... 1 音声認識アプリによる発音練習 音声認識アプリとして、iOS 端末は「メモ」、その他の端末は「Google 翻訳」を立ち上 げ、韓国語キーボードにしてマイクボタンを押し端末に向かって話しかけると、話された 言葉をテキスト化してくれる。学生は、このアプリを使い声に出して本文を読む練習をす ...

8

V6 音声入力機能

V6 音声入力機能

... 使用する音声認識エンジンに合わせて、専門のエンジニアがその入力 用途ごとに専用の「音声認識辞書」 帳票定義の作成と同時に音声認識エンジンに最適化された専用の 「音声認識辞書」 ...

23

ドコモに見られる対話システムの典型 各種デバイス 1 音声 ( ユーザ ) 音声認識 2 テキスト ( ユーザ ) 3 テキスト ( ユーザ ) 自然対話 PF 4 テキスト 5 タスク + クエリ 意図解釈 8 テキスト ( システム ) ( 対話制御 ) シナリオ対話 6 タスク + クエリ 7

ドコモに見られる対話システムの典型 各種デバイス 1 音声 ( ユーザ ) 音声認識 2 テキスト ( ユーザ ) 3 テキスト ( ユーザ ) 自然対話 PF 4 テキスト 5 タスク + クエリ 意図解釈 8 テキスト ( システム ) ( 対話制御 ) シナリオ対話 6 タスク + クエリ 7

... チャットボットとは,主にメッセンジャーサービス(LINE , Facebook Messenger , Slack等)上 でのエンドユーザからの自然言語による問いかけに対し,自動応答する技術. メッセンジャーサービスの利用率の高まりを背景に,企業側のメッセンジャーサービス上でのエンドユーザと のコミュニケーションの需要も高まってきている. ...

11

はじめに接続 取り付け部品を確認する ナビゲーション本体関係 ナビゲーション本体 1 バインドネジ (M5) 8 皿ネジ (M5) 8 スペーサー 1 接続ケーブル関係 電源コード 1 U エレメントコネクター 1 RCA 出力ケーブル 1 音声認識用マイク関係 音声認識用マイク 1 マイククリップ

はじめに接続 取り付け部品を確認する ナビゲーション本体関係 ナビゲーション本体 1 バインドネジ (M5) 8 皿ネジ (M5) 8 スペーサー 1 接続ケーブル関係 電源コード 1 U エレメントコネクター 1 RCA 出力ケーブル 1 音声認識用マイク関係 音声認識用マイク 1 マイククリップ

... -必ず車のバッテリーの⊖端子を外してから接続してください- 接続のしかた 1 -必ず車のバッテリーの⊖端子を外してから接続してください- 他のリード線の接続は (☞10∼11ページ) 車速信号入力 車の走った距離を検出するために使用します。 必ず車の車速検出回路に接続してください。 (車の車速検出回路への接続が困難な場合は、 車速パルス発生機「ND-PG1」(別売)[r] ...

36

音声情報処理

音声情報処理

... Neural Machine Translation – LSTMによるEncoder と Decoderを組み合わせ、翻訳文を生成する Attention NMT – 原言語の単語列のEncoder出力に重みを加えてDecoderにいれることでア ライメントをImplicitに学習する ...

50

(9) テキストデータ とは 音声データをテキスト化したものをいいます (10) 認識データ とは テキストデータのうち 特定のキーワードが登録された音声認識テーブルと照合し 合致したデータをいいます (11) コンテンツ とは 文章 テキスト 音声 画像 動画その他の情報のことをいいます (12)

(9) テキストデータ とは 音声データをテキスト化したものをいいます (10) 認識データ とは テキストデータのうち 特定のキーワードが登録された音声認識テーブルと照合し 合致したデータをいいます (11) コンテンツ とは 文章 テキスト 音声 画像 動画その他の情報のことをいいます (12)

... 12. 当社は、本サービスが第三者の知的財産権およびその他の権利を侵害していないことを何ら保 証するものではなく、申込者、利用者またはその他の第三者が本サービスに関連して直接的ま たは間接的に被ったいかなる損害についても責任を負いません。 13. 第 3 条(本サービスの内容)に定める音声対話サービスを提供するにあたり、当社は、入力さ ...

11

トルコ語話者による日本語音読音声の分析-その2

トルコ語話者による日本語音読音声の分析-その2

... 18. 土屋順一(1992)「トルコ人学習者の日本語に見られるトルコ語の韻律の干渉」 『日本語の韻律に見られる母語の干渉 (2) −音響音声学的対照研究−』(文部省重 点領域研究「日本語音声における韻律的特徴の実態とその教育に関する総合的研 究」、研究代表者:杉藤美代子 D1 班、平成 2 年度研究成果報告書)pp. 81-103。 19. ...

26

立石科学技術振興財団 助成研究成果集(第27号) 2018 立石賞特別賞の受賞記念講演概要 デジタル時代の音声符号化 合成 認識に関する 音声分析根幹技術の発明 名古屋大学 名誉教授 1 音声情報処理 のではないかと考えた 1. 1 わけであります 歴史 電話と蓄音機の発明 板 倉 文 忠 電話は

立石科学技術振興財団 助成研究成果集(第27号) 2018 立石賞特別賞の受賞記念講演概要 デジタル時代の音声符号化 合成 認識に関する 音声分析根幹技術の発明 名古屋大学 名誉教授 1 音声情報処理 のではないかと考えた 1. 1 わけであります 歴史 電話と蓄音機の発明 板 倉 文 忠 電話は

... 当初私は,それをアナログ的なフィルターで 実現しようとしたのですが,上手くいかないこ とが分かり,当時研究室に導入されたミニコン FACOM270-20 を使ってデジタル信号処理を 意識した数理分析からスタートしました。その 結果,音声の最適識別に必要な統計量は,初め の p 個の自己相関関数で抽出できることを明 らかにし,これを使って音声の分析をスタート させたわけであります。その研究をまとめた成 ...

5

システム / 制御 / 情報,Vol. 62, No. 2, pp , アイサイ研究者のための音声情報処理ソフトウェア入門 特集号解説 隠れマルコフモデルに基づく日本語音声合成ソフトウェア入門 大浦圭一郎 * 橋本佳 * 南角吉彦 * 徳田恵一 * 1. はじめに 音声合

システム / 制御 / 情報,Vol. 62, No. 2, pp , アイサイ研究者のための音声情報処理ソフトウェア入門 特集号解説 隠れマルコフモデルに基づく日本語音声合成ソフトウェア入門 大浦圭一郎 * 橋本佳 * 南角吉彦 * 徳田恵一 * 1. はじめに 音声合

... なん 南 かく 角 よし 吉 ひこ 彦 1977 年 3 月 10 日生. 2004 年 3 月名古 屋工業大学大学院工学研究科電気情報工学 専攻博士後期課程修了.同年 4 月名古屋工 業大学テクノイノベーションセンター大学 院 VBL 部門中核的研究機関研究員, 2005 年 4 月名古屋工業大学大学院工学研究科助 手, 2012 年 4 月名古屋工業大学大学院工学研究科准教授とな ...

6

音声認識の基礎

音声認識の基礎

... 声帯振動数、声道形等の発声器官の構造差。 方言、発声習慣などの調音法の相違 発声器官の連続運動・変化による 音声生成(ディジタル音韻列→アナログ音声) 発声器官の生理変化、調音法の変化 ...

42

Guidance Book 多言語音声合成の利用方法

Guidance Book 多言語音声合成の利用方法

... Dojo のオプション機能である 多言語音声合成 とは、既にお持ちの英語や中国語などの音声ライブラリを、 Dojo 内に組み込み自動で音声を挿入、出力することができます。 32 ビット版 OS では、OS [スタート]-[Windows システムツール]-[コントロールパネル]-[音声認識]-[音声合成]- ...

17

音声認識

音声認識

... (指)キーボードから入力 ↓ (声)マイクから入力(「音声入力」あるいは「ディクテーション(聞き取り)」) • (ちょうどキーボードから文字列やショートカットを入力してアプリケー ションを操作できるように)音声認識でアプリケーションを操作すること も可能(「音声操作」) ...

20

Show all 10000 documents...

関連した話題