• 検索結果がありません。

生成モデルに基づく音声認識

母音の音声生成の音響モデルに関する研究

母音の音声生成の音響モデルに関する研究

... · モデルは一次元近似の一種であるため,声道がもつ複雑な三次元形状か ら生じる特徴を精度よく実現できない.そのため,近年は有限要素法を用いた音響シミュ レーションが三次元声道形状に対して行われており,新しい知見が得られている.有限要 素法において数値解析の精度を保つためは以下の条件を満たす必要がある.1.各々の ブロックが同程度のサイズである.2.極端潰れたブロックが存在しない.3.曲面を ...

146

ものづくり ロボティクス分野交付決定事業者名 アセントロボティクス株式会社 ( 川崎重工業株式会社 ) 物体認識 ロボット動作生成用 AI 教育環境の開発 中小企業 三品産業をターゲットとして 導入や設定変更が容易な Easy to use 型のロボットシステムの実現を目指し 深層学習や生成モデルを

ものづくり ロボティクス分野交付決定事業者名 アセントロボティクス株式会社 ( 川崎重工業株式会社 ) 物体認識 ロボット動作生成用 AI 教育環境の開発 中小企業 三品産業をターゲットとして 導入や設定変更が容易な Easy to use 型のロボットシステムの実現を目指し 深層学習や生成モデルを

... バイオ研究開発を行うAIシステムの開発及び事業化 バイオ産業で有益な酵素や化合物、ゲノム設計を行うAIシステムを開発し、設計 物のウェット評価までを行う。さらに、再生医療の現場において産業利用性の高 い細胞を決定する因子を自動的発見するAIモデルの開発も行う。本事業では 従来多大なコストや時間、専門家を要していた基礎研究の分野においてAIよ ...

5

システム / 制御 / 情報,Vol. 62, No. 2, pp , アイサイ研究者のための音声情報処理ソフトウェア入門 特集号解説 隠れマルコフモデルに基づく日本語音声合成ソフトウェア入門 大浦圭一郎 * 橋本佳 * 南角吉彦 * 徳田恵一 * 1. はじめに 音声合

システム / 制御 / 情報,Vol. 62, No. 2, pp , アイサイ研究者のための音声情報処理ソフトウェア入門 特集号解説 隠れマルコフモデルに基づく日本語音声合成ソフトウェア入門 大浦圭一郎 * 橋本佳 * 南角吉彦 * 徳田恵一 * 1. はじめに 音声合

... 実際音声を合成する際は, emacs や vi などのエ ディタで編集したテキストファイルを読み込む場合と, 標準入力から読み込む場合の二通りの使い方がある. “open jtalk” コマンドの必須オプションは “-x” オプショ ンによる発音辞書ディレクトリの指定と, “-m” オプショ ンによる音響モデルファイルの指定の二つである.実 行する際のコマンドの例を第 4 図の 5, 6 ...

6

音声認識サーバのインストールと設定

音声認識サーバのインストールと設定

... ステップ 2 ServerUpdatesWizard.exe を実行します。 ステップ 3 画面の指示に従って、 Microsoft アップデートおよびオプションの Cisco Security Agent for Cisco Unity のインストールを完了します。 (注) リモート デスクトップまたは VNC クライアントを使用してサーバアクセスし、Cisco Security Agent for Cisco ...

10

人間の視覚的注意を予測するモデル ~ 動的ベイジアンネットワークに基づく 最新のアプローチ ~

人間の視覚的注意を予測するモデル ~ 動的ベイジアンネットワークに基づく 最新のアプローチ ~

... 特徴統合理論 [Treisman et al. 1980] • いくつかの基本的な特徴量(輝度・色など)を抽出し 処理することで、各々 feature map を生成。 • Feature map を統合することで、saliency map(SM) を生成。 • Saliency map内で最も輝度値が大きくなる箇所 ...

50

HiLシステムと計測データに基づくモデルを使用したコントロールユニットの適合

HiLシステムと計測データに基づくモデルを使用したコントロールユニットの適合

... データベースモデリングと実験計画法  適合で使用する際の要求  適格なグローバルエンジンモデル生成するためのパラメータ同定が容易であること  多項式 あるいは ニューラルネットワークモデルはこれらの要求を満たさない  新しいモデリングアルゴリズムを開発し、 ASCMO実装 ...

20

音響モデル triphone 入力音声 音声分析 デコーダ 言語モデル N-gram bigram HMM の状態確率として利用 出力層 triphone: 3003 ノード リスコア trigram 隠れ層 2048 ノード X7 層 1 Structure of recognition syst

音響モデル triphone 入力音声 音声分析 デコーダ 言語モデル N-gram bigram HMM の状態確率として利用 出力層 triphone: 3003 ノード リスコア trigram 隠れ層 2048 ノード X7 層 1 Structure of recognition syst

... 教師なしのバッチ適応を行う場合,一般的一度適応前 モデル認識を行い,その後その認識結果を使用してパラ メータの更新を行う.認識結果は誤りが含まれているた め教師つき適応と比較して性能が劣化する.この問題対 する対応法の一つとしてクロス適応が提案されている [7] . クロス適応の基本的な考えは誤り傾向の異なる認識システ ...

6

RIETI - "声"だけで、うつ病はどこまで診断可能か? ~音声感情認識技術にアンサンブル型機械学習モデルを応用したうつ病スクリーニング機能に関する精度の検証

RIETI - "声"だけで、うつ病はどこまで診断可能か? ~音声感情認識技術にアンサンブル型機械学習モデルを応用したうつ病スクリーニング機能に関する精度の検証

... うつ病の現行の診断システムでは、その成功の鍵は患者の外観と話される情報から得ら れる臨床家のスキルと経験依存しているのが現実である。そのため、シンプルで低コス ト、自動的で客観的な診断補助が、医療場面だけでなくストレスチェック精度が導入され た企業も含めた多様な場面での高いニーズとなっている。そういったツールが登場すれば、 ...

24

VoiceMaker-1.1 ― HMM音声合成用音響モデルの構築

VoiceMaker-1.1 ― HMM音声合成用音響モデルの構築

... 4 ,その結果の一例を示します.こ こで求めた音素境界が大きく異なる場合,正しい音素モデルが学習できなくなる恐れがあるため,修正する必要があ ります.音素の境界情報のはテキスト形式で書かれているため,直接編集することもできますが,波形データの表示 や再生などを備えたラベル修正ツールとして, HTK 付属のコマンド (HSLab) や wavesurfer ...

17

桐蔭法学 19 巻 2 号 (2013 年 ) 第五節裁判官の認識第一項リベラル派の裁判官の認識第二項中間派の裁判官の認識第三項保守派の裁判官の認識 ( 以上 19 巻 1 号 ) 第四章階層に基づく Affirmative Action は人種的多様性を維持するのか第一節階層に基づく Affirm

桐蔭法学 19 巻 2 号 (2013 年 ) 第五節裁判官の認識第一項リベラル派の裁判官の認識第二項中間派の裁判官の認識第三項保守派の裁判官の認識 ( 以上 19 巻 1 号 ) 第四章階層に基づく Affirmative Action は人種的多様性を維持するのか第一節階層に基づく Affirm

... 人の責任ではないという点で階層から生じる不利な状況と人種から生じ る不利な状況は同じである。双方の違いは、人種が原因となり生じた不利 な状況は差別という不合理な理由により生じたものであるが、社会・経 済的な地位が原因となって生じた不利な状況は不合理な理由によって生 じたものかについて疑問が残るところある。しかし、人はどの人種 属するのであっても、生まれる環境を選べない。社会・経済的不利な ...

45

2E1-3 Paragraph Vectorに基づく感情極性を用いたWeb検索スニペットの生成方法

2E1-3 Paragraph Vectorに基づく感情極性を用いたWeb検索スニペットの生成方法

... [3] は, Twitter におけるハッシュタグ呼ばれるメタデータを利 用して,感情極性を利用した.ハッシュタグとは, Twitter の投 稿内含まれる,語頭 “#” のついた単語のことである.ハッ シュタグは,特定の話題を示す.つまり,同じ単語のハッシュ タグを含む投稿同士は,同じ話題の投稿同士であることを示 す. Wang らは, Twitter の投稿内の複数のハッシュタグの共起 ...

4

DSpace at My University: 音声認識アプリを活用した 韓国語リーディング授業に関する研究

DSpace at My University: 音声認識アプリを活用した 韓国語リーディング授業に関する研究

... る、そのためはどの程度努力するか、どの程度時間やエネルギーを費やすかということ 関連する要因を表す概念」である。自己決定理論(self-determination theory)は Deci & Ryan(1985)、Ryan & Deci(2002)によって提唱された動機づけ理論で、本研究の理論的 ...

8

HOKUGA: 坑道実測図,地層断面図の3次元モデル生成法

HOKUGA: 坑道実測図,地層断面図の3次元モデル生成法

... ル画面を表示する.カラーホイールで希望色を選択し,微調整はピッカーの右横欄にてRGB 切り換え実行,不透明度も指定しOKを押す.次画面で選択タグを押すと同図右下のマテリ アル作成後画面が表示される.選択色を確認,faceを選択すると彩色,半透明化が完了する. なお,レベル表示のラベルは別途jpeg形式で作成し,シート四隅のいずれか1つ配置する. ...

13

米国におけるSTAMP(システム理論に基づく事故モデル)研究の最新の動向

米国におけるSTAMP(システム理論に基づく事故モデル)研究の最新の動向

... 6 STPA Step2: 潜在原因(Causal factor)の識別 最後のステップが、事故の要因となる潜在原因(Causal Factors)の特定であり、これをもって事故シナリオ の作成が実現する。潜在原因と事故シナリオは大きく分けて、「UCA を引き起こす原因の特定」と「コント ロールアクションが(次の動作)正しく続いていない」の 2 種類がある。1 つ目の「UCA を引き起こす原因 ...

18

HOKUGA: 音声生成モデルの等価回路表現の拡張

HOKUGA: 音声生成モデルの等価回路表現の拡張

... 6 まとめ 本稿では,音声生成過程の物理的な音響モデルについて等価回路表現とともに説明した.矩 形音響管を用いた表現では,声道の横方向の共振の影響についても検討することができ,分岐 がない構造であっても零点が生じることがある.また,声道形状の微小変形(各管の接続位置 のずれなど)を与えると,高域の伝達特性大きく影響が表れる.考慮するモードを平面波の ...

18

アウトライン 字幕付与と音声認識 字幕作成システム 音声認識の構成 コーパス ( 主に言語モデルについて ) 自動整形 コーパス システムの利用例 リアルタイムの字幕作成 2

アウトライン 字幕付与と音声認識 字幕作成システム 音声認識の構成 コーパス ( 主に言語モデルについて ) 自動整形 コーパス システムの利用例 リアルタイムの字幕作成 2

... • N‐gramと確率は大量の学習テキストから推定 – 話題やスタイルが認識対象と適合したテキストで 学習しないと,適切な語彙や文脈を獲得できない – 話題に関する(少量の)テキストで適応を行う  ...

49

HOKUGA: 音声生成系の放射過程のモデルについて

HOKUGA: 音声生成系の放射過程のモデルについて

... 2.放射過程のモデル 音声を空間放射する部位は,口唇,鼻孔(以 下ではこれらを開口端と呼ぶ)が えられる.実 際は,声帯振動や声道壁の振動が体表まで伝わ り,頚部などの皮膚からも音波が放射されるもの の,これらの影響については十 小さいと えて 音声生成系のモデルでは 慮しないのが普通であ る.放射過程は,共鳴器の一部から音波が洩れ出 ...

13

音声認識

音声認識

... • 時間または早さの異なる2つの信号シーケンスの間の類似 度を測るアルゴリズム • 例えば、人間の歩行のパターンは、素早く歩いても、ゆっくり歩い ても、さらには歩行の画像を早送りしてもスロー再生しても一定の パターンが存在する。DTW は音声だけでなく動画などの任意の時 系列のデータ適用可能である。 ...

20

音声認識技術

音声認識技術

... 日本企業は、特許権を有効活用する方策を検討したほうがよいのではないか。今回調査 よると、1980 年代から 1990 年代前半日本出願された音声認識関連の特許のうち約半 分は審査が未請求であった。 1995 年以降では 60%以上が審査請求されていない。 有識者への ヒアリング調査よると、 「日本企業の中は、 ...

30

音声認識の基礎

音声認識の基礎

... 声帯振動数、声道形等の発声器官の構造差。 方言、発声習慣などの調音法の相違 発声器官の連続運動・変化による 音声生成(ディジタル音韻列→アナログ音声) 発声器官の生理変化、調音法の変化 ...

42

Show all 10000 documents...

関連した話題