Top PDF 生成モデルに基づく音声認識

母音の音声生成の音響モデルに関する研究

... · モデルは一次元近似の一種であるため，声道がもつ複雑な三次元形状から生じる特徴を精度よく実現できない．そのため，近年は有限要素法を用いた音響シミュレーションが三次元声道形状に対して行われており，新しい知見が得られている．有限要素法において数値解析の精度を保つためには以下の条件を満たす必要がある．１．各々のブロックが同程度のサイズである．２．極端に潰れたブロックが存在しない．３．曲面を ...

146

ものづくりロボティクス分野交付決定事業者名アセントロボティクス株式会社 ( 川崎重工業株式会社 ) 物体認識ロボット動作生成用 AI 教育環境の開発中小企業三品産業をターゲットとして導入や設定変更が容易な Easy to use 型のロボットシステムの実現を目指し深層学習や生成モデルを

... バイオ研究開発を行うAIシステムの開発及び事業化バイオ産業で有益な酵素や化合物、ゲノム設計を行うＡＩシステムを開発し、設計物のウェット評価までを行う。さらに、再生医療の現場において産業利用性の高い細胞を決定する因子を自動的に発見するＡＩモデルの開発も行う。本事業では従来多大なコストや時間、専門家を要していた基礎研究の分野においてＡＩによ ...

5

システム / 制御 / 情報,Vol. 62, No. 2, pp , アイサイ研究者のための音声情報処理ソフトウェア入門特集号解説隠れマルコフモデルに基づく日本語音声合成ソフトウェア入門大浦圭一郎 * 橋本佳 * 南角吉彦 * 徳田恵一 * 1. はじめに音声合

... 実際に音声を合成する際は， emacs や vi などのエディタで編集したテキストファイルを読み込む場合と，標準入力から読み込む場合の二通りの使い方がある． “open jtalk” コマンドの必須オプションは “-x” オプションによる発音辞書ディレクトリの指定と， “-m” オプションによる音響モデルファイルの指定の二つである．実行する際のコマンドの例を第 4 図の 5, 6 ...

6

音声認識サーバのインストールと設定

... ステップ 2 ServerUpdatesWizard.exe を実行します。ステップ 3 画面の指示に従って、 Microsoft アップデートおよびオプションの Cisco Security Agent for Cisco Unity のインストールを完了します。（注）リモートデスクトップまたは VNC クライアントを使用してサーバにアクセスし、Cisco Security Agent for Cisco ...

10

人間の視覚的注意を予測するモデル～動的ベイジアンネットワークに基づく最新のアプローチ～

... 特徴統合理論 [Treisman et al. 1980] • いくつかの基本的な特徴量（輝度・色など）を抽出し処理することで、各々 feature map を生成。 • Feature map を統合することで、saliency map（SM）を生成。 • Saliency map内で最も輝度値が大きくなる箇所に ...

50

HiLシステムと計測データに基づくモデルを使用したコントロールユニットの適合

... データベースモデリングと実験計画法  適合で使用する際の要求  適格なグローバルエンジンモデルを生成するためのパラメータ同定が容易であること  多項式あるいはニューラルネットワークモデルはこれらの要求を満たさない  新しいモデリングアルゴリズムを開発し、 ASCMOに実装 ...

20

音響モデル triphone 入力音声音声分析デコーダ言語モデル N-gram bigram HMM の状態確率として利用出力層 triphone: 3003 ノードリスコア trigram 隠れ層 2048 ノード X7 層 1 Structure of recognition syst

... 教師なしのバッチ適応を行う場合，一般的に一度適応前 モデルで認識を行い，その後その認識結果を使用してパラメータの更新を行う．認識結果には誤りが含まれているため教師つき適応と比較して性能が劣化する．この問題に対する対応法の一つとしてクロス適応が提案されている [7] ．クロス適応の基本的な考えは誤り傾向の異なる認識システ ...

6

RIETI - "声"だけで、うつ病はどこまで診断可能か？～音声感情認識技術にアンサンブル型機械学習モデルを応用したうつ病スクリーニング機能に関する精度の検証

... うつ病の現行の診断システムでは、その成功の鍵は患者の外観と話される情報から得られる臨床家のスキルと経験に依存しているのが現実である。そのため、シンプルで低コスト、自動的で客観的な診断補助が、医療場面だけでなくストレスチェック精度が導入された企業も含めた多様な場面での高いニーズとなっている。そういったツールが登場すれば、 ...

24

VoiceMaker-1.1 ― HMM音声合成用音響モデルの構築

... 4 に，その結果の一例を示します．ここで求めた音素境界が大きく異なる場合，正しい音素モデルが学習できなくなる恐れがあるため，修正する必要があります．音素の境界情報のはテキスト形式で書かれているため，直接編集することもできますが，波形データの表示や再生などを備えたラベル修正ツールとして， HTK 付属のコマンド (HSLab) や wavesurfer ...

17

桐蔭法学 19 巻 2 号 (2013 年 ) 第五節裁判官の認識第一項リベラル派の裁判官の認識第二項中間派の裁判官の認識第三項保守派の裁判官の認識 ( 以上 19 巻 1 号 ) 第四章階層に基づく Affirmative Action は人種的多様性を維持するのか第一節階層に基づく Affirm

... 人の責任ではないという点で階層から生じる不利な状況と人種から生じる不利な状況は同じである。双方の違いは、人種が原因となり生じた不利な状況は差別という不合理な理由により生じたものであるが、社会・経済的な地位が原因となって生じた不利な状況は不合理な理由によって生じたものかについて疑問が残るところにある。しかし、人はどの人種に属するのであっても、生まれる環境を選べない。社会・経済的に不利な ...

45

2E1-3 Paragraph Vectorに基づく感情極性を用いたWeb検索スニペットの生成方法

... [3] は， Twitter におけるハッシュタグ呼ばれるメタデータを利用して，感情極性を利用した．ハッシュタグとは， Twitter の投稿内に含まれる，語頭に “#” のついた単語のことである．ハッシュタグは，特定の話題を示す．つまり，同じ単語のハッシュタグを含む投稿同士は，同じ話題の投稿同士であることを示す． Wang らは， Twitter の投稿内の複数のハッシュタグの共起 ...

4

DSpace at My University: 音声認識アプリを活用した韓国語リーディング授業に関する研究

... る、そのためにはどの程度努力するか、どの程度時間やエネルギーを費やすかということに関連する要因を表す概念」である。自己決定理論（self-determination theory）は Deci & Ryan（1985）、Ryan & Deci（2002）によって提唱された動機づけ理論で、本研究の理論的 ...

8

HOKUGA: 坑道実測図，地層断面図の３次元モデル生成法

... ル画面を表示する．カラーホイールで希望色を選択し，微調整はピッカーの右横欄にてRGB に切り換え実行，不透明度も指定しOKを押す．次画面で選択タグを押すと同図右下のマテリアル作成後画面が表示される．選択色を確認，faceを選択すると彩色，半透明化が完了する．なお，レベル表示のラベルは別途jpeg形式で作成し，シート四隅のいずれか１つに配置する． ...

13

米国におけるSTAMP（システム理論に基づく事故モデル）研究の最新の動向

... 6 STPA Step2：潜在原因（Causal factor）の識別最後のステップが、事故の要因となる潜在原因（Causal Factors）の特定であり、これをもって事故シナリオの作成が実現する。潜在原因と事故シナリオには大きく分けて、「UCA を引き起こす原因の特定」と「コントロールアクションが（次の動作に）正しく続いていない」の 2 種類がある。1 つ目の「UCA を引き起こす原因 ...

18

HOKUGA: 音声生成モデルの等価回路表現の拡張

... ６まとめ本稿では，音声生成過程の物理的な音響モデルについて等価回路表現とともに説明した．矩形音響管を用いた表現では，声道の横方向の共振の影響についても検討することができ，分岐がない構造であっても零点が生じることがある．また，声道形状の微小変形（各管の接続位置のずれなど）を与えると，高域の伝達特性に大きく影響が表れる．考慮するモードを平面波の ...

18

アウトライン字幕付与と音声認識字幕作成システム音声認識の構成コーパス ( 主に言語モデルについて ) 自動整形コーパスシステムの利用例リアルタイムの字幕作成 2

... • N‐gramと確率は大量の学習テキストから推定 – 話題やスタイルが認識対象と適合したテキストで学習しないと，適切な語彙や文脈を獲得できない – 話題に関する（少量の）テキストで適応を行う  ...

49

HOKUGA: 音声生成系の放射過程のモデルについて

... ２．放射過程のモデル 音声を空間に放射する部位は，口唇，鼻孔（以下ではこれらを開口端と呼ぶ）がえられる．実際には，声帯振動や声道壁の振動が体表まで伝わり，頚部などの皮膚からも音波が放射されるものの，これらの影響については十小さいとえて音声生成系のモデルでは慮しないのが普通である．放射過程は，共鳴器の一部から音波が洩れ出 ...

13

音声認識

... • 時間または早さの異なる2つの信号シーケンスの間の類似度を測るアルゴリズム • 例えば、人間の歩行のパターンは、素早く歩いても、ゆっくり歩いても、さらには歩行の画像を早送りしてもスロー再生しても一定のパターンが存在する。DTW は音声だけでなく動画などの任意の時系列のデータに適用可能である。 ...

20

音声認識技術

... 日本企業は、特許権を有効に活用する方策を検討したほうがよいのではないか。今回調査によると、1980 年代から 1990 年代前半に日本に出願された音声認識関連の特許のうち約半分は審査が未請求であった。 1995 年以降では 60％以上が審査請求されていない。有識者へのヒアリング調査によると、「日本企業の中には、 ...

30

音声認識の基礎

... 声帯振動数、声道形等の発声器官の構造差。方言、発声習慣などの調音法の相違発声器官の連続運動・変化による音声生成（ディジタル音韻列→アナログ音声）発声器官の生理変化、調音法の変化 ...

42

生成モデルに基づく音声認識

関連した話題