• 検索結果がありません。

創立50周年記念特集:情報処理技術の未来地図 9.パターン認識・マルチメディア技術-今後の技術と新たな産業創出-

N/A
N/A
Protected

Academic year: 2021

シェア "創立50周年記念特集:情報処理技術の未来地図 9.パターン認識・マルチメディア技術-今後の技術と新たな産業創出-"

Copied!
3
0
0

読み込み中.... (全文を見る)

全文

(1)パターン認識・マルチメディア技術 ―今後の技術と新たな産業創出―. 9. 村上篤道・石川 泰●三菱電機(株). はじめに. 節ではパターン認識技術のこれまでの歴史を概観する. 個別の技術の詳細は優れた解説 1)∼ 3)に譲り,ここでは, 今後の技術を論じるため,大局的な視点で,変化と動向.  パターン認識の研究開発は古い歴史を有し,文字認識,. の把握を試みることとする.. 画像認識,音声認識などで実用化例も多くみられるよう になった.本稿では,パターン認識技術を中心にマルチ メディア技術のこれまでの発展を概観し,実用化例とそ. ■パターン認識アルゴリズムの研究.  パターン認識の初期,70 年代から 80 年代の研究では,. の背景となるコンピューティング環境の変化の考察から,. 対象とするパターンは,枠内に書かれた文字,スイッチ. 今後の方向性を論ずる.さらには,新たな産業創出の方. を押した後に発声された単語音声,対象物だけが撮影さ. 向性を検討する.. れた映像など,認識を目的として加工,あるいは,作成 されたパターンに限定することが多かった.扱う意味も, 簡単な言語情報,あるいは製品の欠陥の有無など,あい. パターン認識技術の歴史. まい性が少ない少数の意味カテゴリを対象とした.研究 の主なテーマは,規定した意味と対応性の高い特徴量の 抽出方法(特徴ベクトルの縮退),距離尺度,また,ヒュ. ■パターン認識マルチメディア技術とは. ーリスティクスに基づく識別方法にあった..  パターン認識は,画像,文字,音声などを人間が理解.  90 年代になると,大規模なデータが扱えるようにな. する過程への興味,その工学的利用への期待から,長い. るとともに高速な演算処理が可能となった.これにより,. 研究の歴史を有する技術分野である.70 年代に本格化. パターン認識アルゴリズムに大きな変化が生じた.パタ. し,その困難性から現在でも情報処理の主要課題であ. ーンに意味を付与した学習データを用い,数理モデルの. り,将来への期待も依然として大きい.パターン認識. 識別性能を最大化する学習を行う方法,すなわち統計的. は,一般に,観測されるパターンから,その利用上規定. な手法が基本的な方法となった.これにより,認識性能. された意味 (概念) を抽出・分類する技術である.したが. が向上するとともに,複雑なパターン,意味が扱えるよ. って,パターン認識は,1)扱うパターン,2)扱う意味. うになった.対象物を含む画像や,連続音声などからの. あるいは分類,3)識別のための表現,特徴ベクトル抽. 対象パターン抽出も,主要な研究課題のひとつとなった.. 出,データの構造化,4) 意味,分類カテゴリを表すモデ.  初期のヒューリスティックな方法では,特徴量はなる. ル,5) モデルと入力パターンを照合・識別するための評. べく意味との対応がよいベクトル量に縮退することが重. 価尺度と識別方式,を課題として論じる必要がある.. 要であったが,統計的学習手法を用いる場合は,適切な.  またマルチメディア技術は映像と音声など,複数のパ. モデルを仮定すれば,扱う特徴量はなるべく豊富である. ターンを扱う技術であり,伝送・蓄積・活用など多様な. 必要がある.意味の文脈依存性を解消するためのサイド. 応用を目的とする広い技術領域である.それぞれに個別. インフォメーションを含めた豊富な情報量の活用が行わ. の技術課題もあるが,効率的な表現方法,人間の知覚や. れるようになった.. 理解のレベルでの評価など,パターン認識の技術課題.  統計的な手法では,一般に,モデルの学習のためのデ. が主要な課題をカバーする.したがって,パターン認識. ータが大量であればあるほど,よりよい結果が得られる. を論ずることで,マルチメディア技術も考察可能である.. ため,学習データの構築方法,意味情報の付与方法の研 情報処理 Vol.51 No.5 May 2010. 509. ものづくり産業と企業経営. そこで,本稿では,パターン認識を論ずることとし,次.

(2) 50. th Anniversary Information Processing Society of Japan 1970. 技術. 1980. 1990. 2000. 古典的手法. 数理モデル・統計的手法. 基本的分析手法. 統計的モデル   文脈利用 . 発見的手法. 実用化. 製品 検査. 文字. 郵便番号 読み取り. ものづくり産業と企業経営. 環境. 小語彙 電話系. メディア統合・自動認識 高度文脈利用 . 機械学習. 個別パターン. 映像 画像. 音声. 2010. メディア統合  センサ統合. パターンの抽出. 意味理解. 生体認証 指紋・掌紋・網膜 印刷文字OCR 手書き文字OCR 大語彙 電話系. 人物検知 顔認識. 知識発見. Web画像検索 マルチメディア ディジタルアーカイブ. ナンバー 読み取り. メディア横断検索 言語理解・知識検索. ディクテーション.   Web音声検索.    カーナビ音声操作  . Host. WS. PC. Computing. Client-Server. Internet. Mobile PC Cloud. Sensor Unification Ubiquitous. 図 -1 パターン認識の研究と実用化,その歴史と今後. 究も精力的に行われるようになった (図 -1) .. ト,あるいは,画像に作成者が付与したアノテート情報 のみを用いて認識したと解釈できる.技術視点では, 「パ. ■実用化の動向. ターン認識」の実用化成功事例というには抵抗を感じる.  前述のように,初期のパターン認識では,入力のため. 読者も多いかもしれないが,今後の実用化を考察する上. に作成あるいは事前処理されたパターンを対象とし,あ. では重要な事例であろう.. いまい性のない少数の意味を扱うものであった.郵便番 号の認識,製品や農作物の形状の検査システム,数字だ けを対象とする電話系音声認識などが主な実用化成功例 である.これらは,コンピュータがデータを扱う際の人. パターン認識の今後の展開. 手による入力の代替手段を目的とするものであった.産 業上の成功の鍵は,技術的な制約の上で,省力化による 利益が大きい対象を選択することにあった.. ■パターン認識とコンピューティングの進化.  前章に述べたように,技術視点では,統計手法,大量.  統計的な手法が用いられるようになると,人間のパタ. データの活用という大きな発展があり,実用的な成功は. ーン処理の代替ではなく,より複雑で人間では扱いにく. それに対応し. いパターンの利用や,自然界の映像や音から,対象パタ. 1)明確な入力用データから明確な少数のカテゴリを識. ーン自体の抽出が可能となり,その実用化が進展した.. 別する,人間のパターン認識の代替,省力化. 前者の事例としては指紋,掌紋,網膜などのパターンを. 2)統計的な手法,高速演算で可能となった人間が扱う. 用いる個人認証があり,後者の事例としては,走行車輌. ことが困難なパターンの認識,対象パターンの抽出. のナンバー読み取り,デジタルカメラの顔検出,さらに. 3 )文 脈 や イ ン タ ー ネ ッ ト 上 の 大 量 な 情 報 の 活 用 と. は,音声認識を用いた用件抽出によるコールセンタの回. 時代を追って大別することができる. 線振り分けシステムなどが挙げられる.. これは,規定された目的のために設計されたデータ処理.  文脈の利用,さらに複雑な対象・意味を扱う実用化例. 系,ネットワークコンピューティング,さらにはクラウ. も増えている.カーナビにおける音声認識は,対話の枠. ドコンピューティングに対応付けて考えることが可能で. 組みの中で,文脈情報を規定することで実用化したと考. ある(図 -2).このことは,今後の真の意味のユビキタ. えられる.さらに,最近の音声による Web 情報検索は,. スコンピューティングに,次の時代のパターン認識の方. Web 上に存在する莫大な言語資源を,統計言語モデルと. 法論,実用化成功の鍵があることを示唆する.. して音声理解におけるサイドインフォメーションとして 活用しているのみならず,目的とする検索自体が,Web 情報を音声の認識の意味的制約として利用したと解釈で. ■ パターン認識アルゴリズムの深化.  パターン認識を人間の認識過程の実現と考えると,現. き,今後のパターン認識技術を考える上で興味深い.. 状においても,技術課題は山積している.統計的数理モ.  同様に,Web 上の画像検索は,画像というパターン. デルとその学習手法については,継続して,モデリング,. から得られる特徴量ではなく,同一のページ内のテキス. 学習,探索手法をさらに深化させる必要がある.利用可. 510. 情報処理 Vol.51 No.5 May 2010.

(3) 9. パターン認識・マルチメディア技術 間ができるパターン認識の実現は,ロボットなどで重要. 過去: Host Computing 意味:活用のために設計 目的:データ入力の省力化. Computer. ではあるが,情報産業としての価値は見出しにくい.  今後のコンピューティングで扱うことができる,社会 現象,経済活動,自然現象など,複雑で多様な意味が内 在するデータを対象とし,パターン認識技術でその意味. Pattern. パターン:入力のために作成・加工. を抽出・発見できたとき,大きな産業的価値を創造でき る.ユーザの生活から得られるパターンの中から意味,. 現在: Cloud Computing. 莫大なネットワーク情報から抽出,支援できて初めてユ ビキタスコンピューティングは,価値を持つだろう.パ ターン認識こそが新たなコンピューティングのキー技術. パターン:抽出 文脈情報活用. Pattern. 行動目的や価値基準を抽出,その意味に適合する情報を. と言っても過言ではないだろう.. おわりに. 将来: Ubiquitous Computing Pattern. 意味:利用者の意味づけ 利用者行動からの意味抽出 目的:利用者の行動支援. 意味←目的→文脈. パターン:ユーザを取り巻く 社会現象などからパターンの発見 文脈情報の高度活用. 図 -2  パターン認識とコンピューティング.  パターン認識の基盤技術を進歩させるには,解明され ない人間のパターン認識などを対象に地道なチャレンジ が必要である.学際領域であり,研究者が相互に意見交 換ができるコミュニティとして学会の意義も,産学連携 の重要性も高まるだろう.一方で,その技術を,社会現 象などの複雑なデータから意味を抽出する技術として捕 らえたとき,新たな実用化展開と産業創出の可能性が生. 能な情報量は今後さらに大量になり,センサ情報などを. じる.情報を,事前にその意味や価値を規定できるもの. 含め,パターンの文脈として活用できる情報量もますま. とするとき,Web の情報量の爆発を危惧しなくてはな. す増大する.有効なモデリング,効率的な探索,適応化,. らないが,多くの意味と価値が内在するパターン認識の. 適応学習などに進歩を期待したい.. 対象として考えたときは,さらに多くの情報が蓄積利用.  また,統計手法で問題となる,学習データの取得方法,. できることに可能性と期待を感じるのである.. より根源的な問題である意味の表現についての研究の重 要度はさらに増すだろう.意味を言語情報として与える 上では,そのあいまい性,文脈依存性をどのように解消 するかが重要である.オントロジーなどの意味知識の表 現と活用,Web 上の大量の言語資源から言語知識を構 築する方法など,自然言語研究との連携のもと,意味モ デルの研究がパターン認識の深化をもたらすだろう.. 参考文献 1) 日浦,他:パターン認識・メディア理解 15 年の進歩,信学会誌, Vol.92, No.8, pp.647-655 (2008). 2) 柳井: 一 般 物 体 認 識 の 現 状 と 今 後, 情 処 論 文 誌,Vol. 48, No. (SIG_16 (CVIM_19)), pp.1-24 (2007). 3) 古井:音声認識の動向 [I];話ことば認識,信学会誌 , Vol.89, No.8, pp.746-751 (2006). 4) 馬場口,他:今なぜグランドチャレンジか,信学会誌,Vol.92, No.8,. pp. 640-642 (2008).  人間の行動・動作認識,医療画像の認識,マルチメデ ィアコンテンツの関連付け,検索など,高い目標をか かげ,技術的なチャレンジを地道に続ける必要がある 4). 従来の手法に加え,認知科学,脳科学の進展が,物理モ デルや心理尺度などに新たな方法論を提供する可能性も あり,学際的取り組みが必要である.. ■実用化・産業創出の新たな展開.  一方,産業上の成功を考える上では,再度,1) 扱うパ ターン,2) 扱う意味あるいは分類,を今後の真のユビキ タスコンピューティング環境で考察する必要がある.人. (平成 21 年 12 月 26 日受付). 村上篤道(正会員) [email protected]  1971 年東北大学・通信工学科卒.同年,三菱電機(株)入社.情報, 通信, マルチメディア技術の研究・開発に従事.ITU,ISO/MPEG 等の国際標 準策定に貢献.現在,開発本部役員技監.博士(情報科学).IEEE 論文 賞 , 米国 R&D100 賞,映像情報メディア学会功績賞 , 電子情報通信学会 業績賞等を受賞.IEEE Fellow.映像情報メディア学会フェロー,本会 フェロー&副会長&評議員.日本工学アカデミー会員. 石川 泰(正会員) [email protected]  1982 年東京工業大学・物理情報工学専攻修了.同年三菱電機(株)入 社.音声処理,HMI の研究開発に従事.工学博士.. 情報処理 Vol.51 No.5 May 2010. 511. ものづくり産業と企業経営. Internet 大量な情報 多くのセンサ活用. 意味:複雑な意味,多様性 目的:大量のパターンの活用.

(4)

参照

関連したドキュメント

大学設置基準の大綱化以来,大学における教育 研究水準の維持向上のため,各大学の自己点検評

工学部80周年記念式典で,畑朋延工学部長が,大正9年の

北陸 3 県の実験動物研究者,技術者,実験動物取り扱い企業の情報交換の場として年 2〜3 回開

大きな要因として働いていることが見えてくるように思われるので 1はじめに 大江健三郎とテクノロジー

情報理工学研究科 情報・通信工学専攻. 2012/7/12

未上場|消費者製品サービス - 自動車 通称 PERODUA

関東総合通信局 東京電機大学 工学部電気電子工学科 電気通信システム 昭和62年3月以降

充電器内のAC系統部と高電圧部を共通設計,車両とのイ