- 409 -
画像認識技術を用いた情報検索システムに関する研究
教科・領域教育専攻
生活・健康系コース(技術・工業・情報)
馬 文 鵬
1.はじめに
本論文では、画像認識技術を活用した新たな情
報検索システム「リアリティ検索システム」を提
案し、その一部の機能を実装・評価する。提案し
たシステムはモパイルデバイスの最大の利点(モ
パイル環境とWebカメラ)を利用し、眼の前のオ
ブジェクトを認識し、翻訳・顔認識・2次元コード
による情報検索などを実現するクラウド技術を通
して、その対象の情報を検索したり、問題を解決
したりする特徴がある。
本研究では、 3つの評価実験(瞬時翻訳、顔認
識、 2次元コード)を通して、既存の情報検索モ
ード(文字あるいは音声)の限界を超え、新た
な入力モードの変革の可能性を示唆する。
2
.
リアリティ検索システムの提案
リアリティ検索システムの構造は、
i
画像認識技
術(アルゴ、リズム、パターン認識、計算)をベー
スにし、サーチ、解決、サーチ&解決、拡張性の4
つの部分を構成している(図 1)。
一一一
図1 リアリティ検索システムの構造
各部分に対しては、複数の機能があり、例えば
「サーチ&解決Jには瞬時翻訳機能、自動要約機
能などの複数の機能を有するシステムとして概念
設計した。
指 導 教 員 林 秀 彦
3
.
評 価 実 験
提案システムは、3つの機能(瞬時翻訳、顔認識、
2次元コードによる情報検索)を実装し、評価した。
以下に、評価実験について述べる。
3.1 [実験1] 瞬時翻訳
瞬時翻訳機能は、デバイスのカメラで文字を読
み取って、クラウド翻訳サービスを通して日本語
に翻訳する機能である。実装した機能が正しく動
作することを確認する性能評価実験と実装した機
能が既存の情報検索モードと比較して、ユーザに
とってどのような有用性を見出すかを評価するユ
ーザピリティ評価実験を実施した。
3.1.1 性能評価実験
(1) 目的
性能評価実験は、英語(単語またはフレーズ)
の認識率、翻訳の成功率、認識してから翻訳する
までの平均処理時間について性能を評価した。
(2)方法
評価対象は、 Web上のgoo辞書に提供される検
索ランキングとして表示された60個の英語(単語
またはフレーズ)を6グルーフ。に分け、性能を評価
した。
(3)結果
以下の
4
点が明らかになった。
-各グノレーフ。の認識率は80%.100%となった。
-認識率はカメラの撮影条件(文字のサイズ、ユ
ーザの姿勢等)による影響を受けた。
-認識された文字はすべて正しく翻訳され、翻訳
の成功率は100%となった。
・平均処理時間は1秒以内であった。
- 410 -
(4)考察 電子辞書の場合、検索時間は文字数の違いによ
実験結果より、実装したシステムによる情報検 って1秒から10数秒のばらつきが生じる結果とな
索モードは、カメラの撮影条件、フレーズの取り ったが、瞬時翻訳の場合は1秒以内でばらつきが少
扱い等に今後の課題があるが、
1
秒以内の処理時間 ない。英語のフレーズを検索するとき、電子辞書
であり、正しく機能すると考察している。 と瞬時翻訳のどちらも認識ができない場合があっ
3.1.2 ユーザピリティ評価実験 たが、瞬時翻訳は認識できない単語を追加リスト
(1)目的 に加え、認識できるようにする機能を備えている
ユーザピリティ評価実験の第1目的は、既存の情 利点がある。また、提案した瞬時翻訳機能は単語
報検索モードに比較して、提案システムによる情 の文字数と関係なく翻訳できるため、本実験より
報検索モード「リアリテ,ィ検索モードjは検索時 も単語の文字数を多くした場合、電子辞書に比べ
間が短いとしづ仮説を検証することにある。また、 てさらに時間効率が高まることが期待できる。
今後のシステム改良のためのユーザビリティ評価 3.2 実験2]顔認識
データを収集することを第2の目的とした。 この実験は、デバイスで被験者の顔を撮り、実
(2)方法 装したシステムを通して、顔の特徴位置を検出し、
この実験では、 2人の被験者が60fl日の英語(単 その顔がクラウドを通してどのような結果を返す
語またはフレーズ)を電子辞書 (CASIOEx.word か評価実験した。
XD-SF4800)に入力し、翻訳情報が表示されるま 3.3 実験3] 2次元コードによる情報検索
での時間(総時間)を計算する。また、電子辞書 この実験は、 2次元コードの情報を読み取り、
による入力と瞬時翻訳機能の時間効率を比較する 使用者の複数の使用状況の違いによって、この機
ため、 1つの単語あたりの時間(平均時間)を計算 能にどのような影響を及ぼすのかを評価実験したれ
する。時間の測定は、 60個の英語(単語またはフ 実験 1と同様に、実験 2・実験 3は、提案シス
レーズ)を 6つのグループ。に分けて行った。 テムに実装した機能についての性能を評価し、そ
(3)結果 れらの特徴と今後の課題を明らかにした。
電子辞書と提案システムの瞬時翻訳機能による
4
.
まとめ
実験結果は、以下の表に示す。 提案した情報検索システムの一部の機能を実装
表1 電子辞書と提案システムによる実験結果 し、そして評価実験を行った。提案システムは、
総時間
電子辞書 278.98 s
瞬時翻訳 61.05 s
平均時間
4.65s
1.02 s
実験1では、Webカメラを用いた入力インターフ
ェースから獲得した情報を画像認識し、文字情報
をカメラで、読み取って瞬時翻訳できる結果が得ら
( (平均時間)
=
(総時間) / (60個) , s:秒) れた。実験2と実験 3は文字と音声に限らない情
実験結果により、瞬時翻訳は60個の英語に対し 報でも検索できることを示し、提案システムの特
て約218秒分の短い時間で検索できることを示し 徴と今後の課題を明らかにした。これらを通して、
たc また、これは時間効率に換算し、約4.56倍の 提案したリアリティ検索システムは、画像認識技
高い効率であることを示した。 術による入力モードの変革を示唆する可能性を示
(4)考察 したc今後は、これを革新技術へと発展させたいc