パーソナル音声会話ロボット
1.音声認識とは
人間の会話の音声を認識、それをテキストに変換する技術 2.音声合成とは
機械に発話させる技術 3.音声会話ロボットとは
人間とロボットがシナリオに従って会話
4.パーソナル音声会話ロボットとは(最終の目的)
特定の人とロボットがシナリオなしで会話
1
1.言語モデル(書き言葉、話し言葉
/
自由発話)2.隠れマルコフモデル
3.デクテーション(文章型)
4.ナビゲーション(コマンド&コントロール)
5.騒音除去技術(特許)
6.相異度法(言葉の距離計測、江袋林蔵博士論文)
7.ハイブリッド音声認識エンジン(ジュリアス;
IPA
) 8.ワードスポッティング(複数)9.音声会話ロボットプラットフォーム
(5.~9.独自技術)
2
音声認識の技術
音声認識マーケットとソリューション
1.市場
/
マーケット/
音声の特徴・どちらかというとニッチ(隙間)
・基本はデータ入力
・伝統的なマーケットが昔から存在する(と畜、物流、検査)
・音声システムの運用が難しい(声を出し続けられない、生理的な問題)
・認識率96%以上、94%以下は実用化は難しい
・業種
/
業務の専門知識が必要(運用に大きく影響)・技術の発達が早い(例えば特定話者、ビームサーチ、言語モデルなど)
・ハンズ(手)、アイズフリー(眼)を活かす ・ビジネスとしては難しい
・
3
音声認識マーケットとソリューション
2.音声認識
/
応答の応用分野・コマンド制御(カーナビゲーション、情報家電、ロボット)
・口述筆記(デクテーション、音声からテキスト、電子カルテ)
・データ入力(業務系機器への音声によるデータ入力)
・介護
/
福祉(介護/
福祉機器への音声による指示)・コールセンター(ユーザーからの問い合わせや予約などのオペレータ業務)
・書き起こし(講演音声のテキスト書き起こし)
・放送(
NHK
の字幕スーパー)・最高裁判所(音声議事録、速記から音声)
・自動翻訳(ポケトーク自動翻訳端末)
4
1. L&H 社倒産(音声事業の難しさ / スキャンソフトに身売り)
2.応用はシンプル(米国、その範囲で使い、日本は複雑)
3.米国はデクテーション応用(弁護士、医師のカルテ)
4.空港での忘れ物・荷物追跡(米国、日本は皆無)
5.音声だけの大掛かりな事業は日米とも成り立たない 6.期待される分野
・高齢化の影響にかかわる事業(介護 / 福祉事業)
・教育
・コミュニケーション分野
米国など海外の音声先進国の現状
(音声の対する考え方の違い/
日米間)5
1.群馬県食肉センター(豚の格付け)
2.鹿児島県食肉検査所(豚の病名入力)
3.知多農協花市場(電照菊の格付け)
4.三菱重工長崎造船所(自動操船、米国で発表)
5.佐川急便横浜物流センター(到着仕分け)
6.足利工業大学(構内情報案内、休講案内)
7.清水建設(現場データー、ビル構築・補正データ)
8.八ヶ所村原子力記念館(弥生人と会話)
9.ナムコ・ナンジャタウン(駅名アナウンス)
音声認識システムの実績6
1.日本の超高齢化社会
・2025年人口の25%が65歳以上の超高齢化 ・一人暮らしの高齢者の増加
・コミュニケーションがなくなり認知症増加 ・少しでも健康寿命を延ばし、医療の削減 ・日本は超高齢化社会のトップランナー
・世界が日本の超高齢化社会に注目(課題先進国)
パーソナル音声会話ロボット
~高齢者の話し相手、癒しロボット“ピコちゃん”~7
1.シナリオに従ってロボットと自由発話で会話
2.健常者の場合は、自由発話の中に「キーワード」を データに登録、シナリオに従って自由発話の中で、
そのキーワードが発声されたら、ロボットが認識し、
準備された言葉で応答する
3.高齢者の場合は、健常者と違って脳の働きが低下、
人間が会話をリードすることは難しいのでろロボット が会話をリードする
音声会話ロボット“ピコちゃん”の機能と仕組み8
1.健常者と高齢者向けにシナリオの作り方は大きく異なる。健常者の 場合は、「シーン」と「具体的場面」が決まれば自由にシナリオ作 る事が出来る。
2.高齢者の場合は、頭に深く残っている個人の情報を引き出すことが 必要なので、あらかじめ基本的な個人情報、例えば生まれた年、産 まれた所、そして生い立ち、人生の中で華やかしころの思い出、自 慢となる思い出のできごとなど、はっきりと脳裡に残っている内容 をまとめてシナリオを作る。
「シナリオ」は、どのようにして作るか9
1.牛乳パックリサイクル 子供エコ教室プロジェクト ~タンバリン作りのお話し~
(参考資料5参照、デモ)
2.お話とチャリティーコンサート「だいじょうぶ!東北」
プロジェクト
~司会者とコンサートの出演者を紹介~
(参考資料6参照)
今までの実績10
生活シーンの中で、一日の始まりの“おはよう”の挨拶から、
一日の終わりの“おやすみ”で人間は一生このパターンで動
く。大世帯の家族であれば、朝は学校やら職場に行く準備で 大童、しかし、現在は、核家族化して、朝の賑わいは見られ なくなった。昔は、二世帯、三世帯は珍しくなかった。しか し、今は、夫婦と子供一人か二人、そして高齢化の波は、独 居老人、ひとり世帯と昔の面影はない。
(参考資料3参照)
“おしゃべりQちゃん”の機能と会フォーム
~生活密着型~11
ロボット“ピコちゃん”のロボットが主体とした音声会話が高齢者に受け容 れられるかを第一の検証事項、そのポイントとなるシナリオ(会話内容)
のフレームをどうゆうものにすればいいのか、これを実験しながら検証し て行く。人間が孤独になった時、又は、そうゆう環境になったとき、会話 が人の心を癒してくれるのか、そして生理学的に脳を活性化されるのか、
それを確認したい。少なくとも高齢者が人形や動物ペットで癒されている 現状から判断すると、彼らは意味のある言葉を発する事は出来ないが、ロ ボット“ピコちゃん”は、人間の言葉を理解して、意味のある応答をして彼 等より、人間を癒してくれるのではないか。この事は寿命の最後の5年~
10年、病で床につく時間(期間)を短縮できるかもしれない。これを最 終の目的とする。(参考資料4参照)
パーソナル音声会話ロボット“ピコちゃん”プロジェクト計画~ロボット” ピコちゃん“会話実証に向けての~