• 検索結果がありません。

2. 雑音ロバスト音声認識システム

N/A
N/A
Protected

Academic year: 2021

シェア "2. 雑音ロバスト音声認識システム"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

自立支援向けコミュニケーションロボット Chapit

1. はじめに

 近年,日本では急速に高齢化社会が 進 み,2010 年 か ら 2025 年 ま で の 15 年間で,65 歳以上の高齢者は約 709 万人増加し,社会全体の高齢化率は 23% から 30% に大幅上昇すると予測 されている(1).介護職員の数も 2025 年には 400 万人が必要と言われ,特別 世論調査でも介護ロボットに期待が寄 せられている.

 本稿では,高齢者の自立を促し,介 護負担の軽減を可能とする音声認識を 搭載した対話型のコミュニケーション ロボットの概要を紹介する.

2. 雑音ロバスト音声認識システム

 音声認識は,機器の音声制御,ハン ズフリー操作などの実現に役立つ有用 なヒューマンインターフェースであ る.近年,音声認識を搭載したスマー トフォン等が商品化され,音声制御の 可能な製品が開発されつつある.

 一般的に,スマートフォン等に搭載 されているクラウド型の音声認識は,

連続音声認識方式(2)が採用されてい る.これらの手法は,大語の音声認 識が可能であるが,生活雑音環境下で,

マイクから 15cm 以上離れて音声認識 するには不向きである.さらに認識ト リガとなるスイッチを押してから音声 認識を開始するように設計されてい る.一方で機器制御等を行う音声認識 には,より耐雑音性能を向上させた特 定単語等を認識するようなフレーズ音 声認識方式(3)が有利である.

 北海道大学大学院宮永研究室との共 同研究で開発した音声認識エンジン Voice Magic は,フレーズ音声認識方 式で,認識対象フレーズ数が数百程度 と制限はあるが,雑音環境下でのロバ ストな音声認識を実現でき,認識トリ ガを用いない場合でも,マイクから 2

~3m 離れたところからの音声認識が 可能となる.実用性を考慮する場合に は,雑音環境下で,かつ,マイクから 離れたところからでも高認識率を維持 する(たとえば,SNR 10 dB の環境 でも,90% 以上の音声認識率)こと が必要であるため,このようなシステ ムが研究されている.

3. 自立支援向けコミュニケー ションロボット Chapit

 コミュニケーションロボットに音声 認識エンジン Voice Magic を搭載す ることで,生活雑音環境下でもロボッ トを制御することが可能になった.

 ロボットを音声認識により制御する 場合には,マイクをロボット側に取り 付けるため,離れたところからの発話 が必須となる.また,ロボットに触れ ることが困難である場合を想定する必 要 が あ る た め,Always Listening 機 能を開発することで,認識トリガとな るスイッチは押さずに,自然に話しか けるだけで音声認識することができる 自然発話での対話を可能とした.

 図 1に自立支援向けコミュニケー ションロボット Chapit(チャピット)

を示す.Chapit が音声を認識すると,

5 歳の男の子を想定した音声再生によ り癒しを与える.タイムサポート機能 では,食事や入浴,服薬の時間を設定 することができるとともに,戸締まり 確認等,健康的な生活リズムを構築で きる.ブレイントレーニング機能では,

都道府県クイズや四則演算,暗記ゲー ムにより,音声認識でレクリエーショ ン を 楽 し む こ と が で き る. ま た,

Chapit には,赤外線の学習リモコン が搭載されており,200 種類のリモコ ンコードを記憶し,テレビやハード ディスクレコーダ,照明,扇風機等の 家電製品を音声で操作することができ る.これにより,快適な住環境を構築 することができ,バリアフリーなユー ザーインターフェースを提供可能とし た.

4. 音声認識によるロボット制御

 雑音環境下で音声認識ができること

で,ロボット制御の範囲を大幅に広げ るとともに,現在,機械学習による高 精度画像認識モジュールを開発してい る.これを Chapit に搭載することで,

周囲の環境や状況を判断し,Chapit から人へのアクションを可能にするこ とを目指している.周囲の状況を判断 することで音声認識精度を向上させる ことを可能とし,さらにユーザーへ情 報をフィードバックすることができれ ば人をアシストする項目が増え,さま ざまなアプリケーションを創造するこ とができる.

5. おわりに

 Chapit は,2016 年 4 月に発売予定 である.本製品は使用環境を限定せず,

介護施設等の各種公共施設,居宅など 幅広い環境での使用が可能で,高齢者 のコミュニケーションを活性化するこ とにより認知症の予防に対しても,今 後,効果が期待できると考えている.

「音声・映像・無線通信」の要素技術 により,高齢者や障害者等の不安や不 満を解決し,安心・安全・健康・環境 分野でバリアフリー・ユニバーサルデ ザイン社会への貢献を目指していく.

(原稿受付 2016 年 1 月 14 日)

〔宮﨑善行 (株)レイトロン〕

●文 献

( 1 )公益財団法人テクノエイド協会,ロボット 介護推進プロジェクト,(2014-6)

http://www.techno-aids.or.jp/robocare/

techno_doc.pdf

( 2 )Knill, K.M., ほか , Use of Gaussian Selec- tion in Large Vocabulary Continuous Speech Recognition Using HMMs, Proc.

ICSLP96, (1996-10),470-473.

( 3 )早坂 昇・和田直哉・宮永喜一・畑岡信夫,

ランニングスペクトルフィルタを用いた雑 音にロバストな音声認識,電子情報通信学 会 技 術 研 究 報 告 CAS 回 路 と シ ス テ ム,

103-142(2003),31-36.

図1 自立支援向けコミュニケーションロボット Chapit(チャピット)

MEMS マイク

音声認識モジュール

赤外線センサ

LED バッテリー スピーカー

うん。

わかった!

テレビ見ようか 明るくして

照明

テレビ

ビデオ

<特許取得済・商標登緑済>

─ 42 ─

日本機械学会誌 2016. 3 Vol. 119 No.1168 162

責_P042_14_宮崎氏.indd 42 2016/02/25 23:53:51

参照

関連したドキュメント

Classroom 上で PowerPoint をプレビューした状態だと音声は再生されません。一旦、自分の PC

(4) 現地参加者からの質問は、従来通り講演会場内設置のマイクを使用した音声による質問となり ます。WEB 参加者からの質問は、Zoom

( 同様に、行為者には、一つの生命侵害の認識しか認められないため、一つの故意犯しか認められないことになると思われる。

    pr¯ am¯ an.ya    pram¯ an.abh¯uta. 結果的にジネーンドラブッディの解釈は,

具体音出現パターン パターン パターンからみた パターン からみた からみた音声置換 からみた 音声置換 音声置換の 音声置換 の の考察

今回、新たな制度ができることをきっかけに、ステークホルダー別に寄せられている声を分析

安全性は日々 向上すべきもの との認識不足 安全性は日々 向上すべきもの との認識不足 安全性は日々 向上すべきもの との認識不足 他社の運転.

By the method I, emotional recognition rate is 60% for close data, and 50% for open data(8 sentence speech of another speaker).The method II improves drastically the recognition