• 検索結果がありません。

音声認識の技術

N/A
N/A
Protected

Academic year: 2021

シェア "音声認識の技術"

Copied!
12
0
0

読み込み中.... (全文を見る)

全文

(1)

パーソナル音声会話ロボット

1.音声認識とは

人間の会話の音声を認識、それをテキストに変換する技術 2.音声合成とは

機械に発話させる技術 3.音声会話ロボットとは

人間とロボットがシナリオに従って会話

4.パーソナル音声会話ロボットとは(最終の目的)

特定の人とロボットがシナリオなしで会話

1

(2)

1.言語モデル(書き言葉、話し言葉

/

自由発話)

2.隠れマルコフモデル

3.デクテーション(文章型)

4.ナビゲーション(コマンド&コントロール)

5.騒音除去技術(特許)

6.相異度法(言葉の距離計測、江袋林蔵博士論文)

7.ハイブリッド音声認識エンジン(ジュリアス;

IPA

8.ワードスポッティング(複数)

9.音声会話ロボットプラットフォーム

(5.~9.独自技術)

2

音声認識の技術

(3)

音声認識マーケットとソリューション

1.市場

/

マーケット

/

音声の特徴

・どちらかというとニッチ(隙間)

・基本はデータ入力

・伝統的なマーケットが昔から存在する(と畜、物流、検査)

・音声システムの運用が難しい(声を出し続けられない、生理的な問題)

・認識率96%以上、94%以下は実用化は難しい

業種

/

業務の専門知識が必要(運用に大きく影響)

・技術の発達が早い(例えば特定話者、ビームサーチ、言語モデルなど)

・ハンズ(手)、アイズフリー(眼)を活かす ・ビジネスとしては難しい

3

(4)

音声認識マーケットとソリューション

2.音声認識

/

応答の応用分野

・コマンド制御(カーナビゲーション、情報家電、ロボット)

・口述筆記(デクテーション、音声からテキスト、電子カルテ)

・データ入力(業務系機器への音声によるデータ入力)

・介護

/

福祉(介護

/

福祉機器への音声による指示)

・コールセンター(ユーザーからの問い合わせや予約などのオペレータ業務)

・書き起こし(講演音声のテキスト書き起こし)

・放送(

NHK

の字幕スーパー)

・最高裁判所(音声議事録、速記から音声)

・自動翻訳(ポケトーク自動翻訳端末)

4

(5)

1. L&H 社倒産(音声事業の難しさ / スキャンソフトに身売り)

2.応用はシンプル(米国、その範囲で使い、日本は複雑)

3.米国はデクテーション応用(弁護士、医師のカルテ)

4.空港での忘れ物・荷物追跡(米国、日本は皆無)

5.音声だけの大掛かりな事業は日米とも成り立たない 6.期待される分野

・高齢化の影響にかかわる事業(介護 / 福祉事業)

・教育

・コミュニケーション分野

米国など海外の音声先進国の現状

(音声の対する考え方の違い

/

日米間)

5

(6)

1.群馬県食肉センター(豚の格付け)

2.鹿児島県食肉検査所(豚の病名入力)

3.知多農協花市場(電照菊の格付け)

4.三菱重工長崎造船所(自動操船、米国で発表)

5.佐川急便横浜物流センター(到着仕分け)

6.足利工業大学(構内情報案内、休講案内)

7.清水建設(現場データー、ビル構築・補正データ)

8.八ヶ所村原子力記念館(弥生人と会話)

9.ナムコ・ナンジャタウン(駅名アナウンス)

音声認識システムの実績

6

(7)

1.日本の超高齢化社会

・2025年人口の25%が65歳以上の超高齢化 ・一人暮らしの高齢者の増加

・コミュニケーションがなくなり認知症増加 ・少しでも健康寿命を延ばし、医療の削減 ・日本は超高齢化社会のトップランナー

・世界が日本の超高齢化社会に注目(課題先進国)

 パーソナル音声会話ロボット

~高齢者の話し相手、癒しロボット“ピコちゃん”~

7

(8)

1.シナリオに従ってロボットと自由発話で会話

2.健常者の場合は、自由発話の中に「キーワード」を データに登録、シナリオに従って自由発話の中で、

そのキーワードが発声されたら、ロボットが認識し、

準備された言葉で応答する

3.高齢者の場合は、健常者と違って脳の働きが低下、

人間が会話をリードすることは難しいのでろロボット 会話をリードする

音声会話ロボット“ピコちゃん”の機能と仕組み

8

(9)

1.健常者と高齢者向けにシナリオの作り方は大きく異なる。健常者の 場合は、「シーン」と「具体的場面」が決まれば自由にシナリオ作 る事が出来る。

2.高齢者の場合は、頭に深く残っている個人の情報を引き出すことが 必要なので、あらかじめ基本的な個人情報、例えば生まれた年、産 まれた所、そして生い立ち、人生の中で華やかしころの思い出、自 慢となる思い出のできごとなど、はっきりと脳裡に残っている内容 をまとめてシナリオを作る。

「シナリオ」は、どのようにして作るか

9

(10)

1.牛乳パックリサイクル 子供エコ教室プロジェクト ~タンバリン作りのお話し~

(参考資料5参照、デモ)

2.お話とチャリティーコンサート「だいじょうぶ!東北」

プロジェクト

~司会者とコンサートの出演者を紹介~

(参考資料6参照)

今までの実績

10

(11)

生活シーンの中で、一日の始まりの“おはよう”の挨拶から、

一日の終わりの“おやすみ”で人間は一生このパターンで動

く。大世帯の家族であれば、朝は学校やら職場に行く準備で 大童、しかし、現在は、核家族化して、朝の賑わいは見られ なくなった。昔は、二世帯、三世帯は珍しくなかった。しか し、今は、夫婦と子供一人か二人、そして高齢化の波は、独 居老人、ひとり世帯と昔の面影はない。

(参考資料3参照)

“おしゃべりQちゃん”の機能と会フォーム

~生活密着型~

11

(12)

ロボット“ピコちゃん”のロボットが主体とした音声会話が高齢者に受け容 れられるかを第一の検証事項、そのポイントとなるシナリオ(会話内容)

のフレームをどうゆうものにすればいいのか、これを実験しながら検証し て行く。人間が孤独になった時、又は、そうゆう環境になったとき、会話 が人の心を癒してくれるのか、そして生理学的に脳を活性化されるのか、

それを確認したい。少なくとも高齢者が人形や動物ペットで癒されている 現状から判断すると、彼らは意味のある言葉を発する事は出来ないが、ロ ボット“ピコちゃん”は、人間の言葉を理解して、意味のある応答をして彼 等より、人間を癒してくれるのではないか。この事は寿命の最後の5年~

10年、病で床につく時間(期間)を短縮できるかもしれない。これを最 終の目的とする。(参考資料4参照)

パーソナル音声会話ロボット“ピコちゃん”プロジェクト計画

~ロボット” ピコちゃん“会話実証に向けての~

12

参照

関連したドキュメント

・総務部は、漏洩した個人情報の本人、取引先 などへの通知、スポーツ庁、警察、 IPA などへの届 出、ホームページ、

 高齢者の外科手術では手術適応や術式の選択を

仏像に対する知識は、これまでの学校教育では必

名刺の裏面に、個人用携帯電話番号、会社ロゴなどの重要な情

当社は、お客様が本サイトを通じて取得された個人情報(個人情報とは、個人に関する情報

ヒュームがこのような表現をとるのは当然の ことながら、「人間は理性によって感情を支配

の総体と言える。事例の客観的な情報とは、事例に関わる人の感性によって多様な色付けが行われ

当社は「世界を変える、新しい流れを。」というミッションの下、インターネットを通じて、法人・個人の垣根 を 壊 し 、 誰 もが 多様 な 専門性 を 生 かすことで 今 まで