「画像認識分野における効果的な産学連携」

(1)

１．はじめに 昨今のデジタルカメラには顔認識技術が搭載されており，画像認識技術の中で最も一般に知られた技術となった。このような画像認識技術は，デジタルカメラの画質改善等の楽しい生活のアシストだけでなく，映像監視セキュリティや車の夜間歩行者検知等の安心安全社会の実現にも利用され始めている。このような背景下において，次世代の画像認識技術に関する研究開発競争は企業間でより一層激しくなり，多くの大学研究機関においては先進的な画像認識に関する研究が盛んに行われている。このような状況下において，企業と大学における共同研究は実用化を効率良く進める解決策の一つであり，産学連携の取り組みは年々増加傾向にある。本稿では，筆者の経験から画像認識分野における産学連携の実情とあり方について述べる。第２章では，画像認識技術の発展と実用化例を挙げ，画像認識分野の背景について述べる。第３章では，研究室における画像認識技術と製品化例について紹介する。第４章では，前章における経験をもとに産学連携とその実情について述べ，今後の産学連携のあり方について提示する。 ２．画像認識の発展と実用化 画像認識は，画像から顔や人等の対象となる物体を検出し，それが何であるかを認識する技術である。画像認識技術は，デジタルカメラの顔検出機能に代表されるように画

画像認識分野における効果的な産学連携

An Effective Approach of University-Industry Research Collaboration

on Computer Vision

藤吉弘亘 Hironobu FUJIYOSHI 鈴木正慶 Masayoshi SUZUKI

(2)

像生成への利用や，監視セキュリティなどの安全・安心システムへ利用されている。本章では，この二つの用途に対して画像認識技術がどのように発展し，実社会で利用されてきたかについて述べる。 ２.１画像認識技術の画像生成への利用 現在発売されているデジタルカメラには，低価格機から一眼カメラまで殆どの機種に，顔検出機能が搭載されている。この顔検出機能は，画像認識技術の中で最も一般に知られた技術の一つである。デジタルカメラで撮影した画像から顔を検出することにより，自動的に顔に焦点を合わせた撮影が可能であり，画像処理によって顔をきれいに補正することもできる。最新の顔認識技術では，笑顔を認識したり，特定人物の顔を認識して撮影する技術も実用化されている。これらの顔認識技術は，目，鼻，口などの顔の部位を認識しているのではなく，図１のように顔の部分的な領域の明暗差を特徴としており，2002年にViola等１）_{によって提案された。メモリー量が少なく小型化が可能で} あることから，大きなブレークスルーとなり顔認識技術の実用化が大きく進展した。 2005年に初めてデジタルカメラに搭載されて以降，消費者からの支持を得て売り上げを大幅に伸ばし，現在では殆どの機種に搭載されるまで普及した。 図１：顔の部分的な明暗差による特徴量 ２.２画像認識技術の安全・安心への利用 学校や商店街などの公共の場において，犯罪の増加に伴い監視セキュリティ用のカメラが普及しつつある２）_{。監視カメラの普及に伴い，監視する人員等のコストや負担を低} 減するために，自動的にカメラから動体を検知する画像認識技術の監視カメラへの応用が期待されている。

(3)

米国カーネギーメロン大学では，1997年からビデオ監視システムに関する研究である VSAM（Video Surveillance and Monitoring）プロジェクトが取り組まれ，動体検知，物体識別，追跡等の動画像理解技術を横断的に開発し，ネットワーク化された10数台のカメラが協調して動作するシステムを構築した３）_{。一台のカメラでは許容できない広範} 囲における侵入物体の行動軌跡を知ることが可能となり，図２に示すように広域な範囲における人や車の流れを地図上にリアルタイムで可視化することが可能となった。 VSAMシステムは，その後，多くの企業における画像認識技術を用いたビデオ監視システムの研究開発に大きな影響を与えた。これらの技術は，2002年頃からエレベータなどの限られた空間において徐々に製品化され始めた４）_{が，一般に認知されるほどは実利用化されていない。要求される認識性能} が高く実環境下における認識性能が不十分であるため，誤報，失報につながり人件費コストを抑えることができない等の問題があるからである。監視セキュリティなどの安心・安全という分野では失敗が許されない状況下が多く，画像認識技術は一部の監視カメラに組み込まれているのみであり，デジタルカメラほど普及には至っていないのが現状である。 図２：動画像理解技術を用いた自動ビデオ監視システム（VSAM） ２.３映像監視分野におけるダーウィンの海 基礎研究から事業成功に至るまでには，魔の川，死の谷，ダーウィンの海の三つの難関があると例えられている。魔の川はアイディアシーズが応用研究に至るまでの難関・

(4)

障壁を，死の谷は研究成果が製品化に至るまでの難関・障壁を表している。死の谷を乗り越えると製品化という形にはなるが，事業として成功するためには最後の難関・障壁であるダーウィンの海を泳ぎきらなければならない。図３は，２.２で述べた映像監視分野における動向とネットワークカメラの出荷台数を，魔の川，死の谷，ダーウィンの海に重ねて表示したグラフである。90年代後半に始まった映像監視分野における画像認識技術の基礎研究は魔の川・死の谷を越え，企業により一部製品化された。現在は，事業として成功する手前であるダーウィンの海を泳いでいる状況である。このダーウィンの海を泳ぎきるためには，２.３で述べた実環境下の高精度化という問題を解決するだけでなく，マーケットの大きさである市場性も重要である。2009年時におけるネットワークカメラの出荷台数は成長率149％と市場性が見込まれ５）_{，ダーウィンの海を泳ぎ} きるためにはこれらネットワークカメラと連動した高精度な画像認識技術の実現が鍵となっており，各企業で激しい技術開発が展開されている。現在では，画像認識技術の高精度化と高速化の研究が急速に発展しており，また防犯意識の高まりによりカメラの需要も急速に高まっている状況にある。 ３．藤吉研究室の画像認識技術とその製品化 藤吉研究室では，2000年より画像認識技術の基礎研究に取り組み企業との共同研究を行ってきた。本章では，研究室における画像認識技術と共同研究事例，製品化について紹介する。 図３：映像監視分野における魔の川，死の谷，ダーウィンの海

(5)

３.１人を観る技術 藤吉研究室では，人間の生活をサポートする環境ロボット（インビジブルロボット）６）における視覚機能の実現を目標に，画像認識技術の基礎研究と応用研究に取り組んでいる。特に，人を観る技術７）_{については，人・胴体・顔の検出，人の軌跡・動き・姿} 勢・視線の解析，ジェスチャ認識，異常行動検知等，重点的に幅広く研究に取り組んでいる（図４）。この人を観る技術は映像監視セキュリティ等の安心安全社会の実現に，また一方では，画像の画質改善や映像自動編集再生等の楽しい生活のアシストとして応用が可能である。次節では，人を観る技術の基礎研究について述べる。 図４：人を観る技術 ３.１.１人検出 物体検出は画像中より予め定義した検出対象を探索する技術である。物体検出の中でも，人は姿勢変化に伴う形状変化が大きいため，画像から人を検出する事は非常に難しい問題である。藤吉研究室では人検出法の一つとして，人が歩く際の動きに着目した方法を提案した８）_{。人が歩行している場合には，軸足である片方の足が静止してお} り，もう一方の足は前に出す動きが観測できる。この様な人の独特な動きと人の形状の特徴を同時に観測する事により，高精度な人検出を実現した（図５参照）。高精度な人検出技術は，ドライバーのサポートを目的としたＩＴＳ（高度交通システム）や不審者の検出等のセキュリティ分野での利用が期待されている。

(6)

図５：人検出例 ３.１.２特定物体認識 特定物体認識として，交通道路標識の自動認識手法の開発に取り組んでいる。我々の手法９）_{では，予め用意したイラストパターンの道路標識と実画像のマッチングによ} り，交通道路標識を認識する（図６参照）。本技術は，標識以外にも，ロゴやマーカーの認識にそのまま利用できるため汎用性が高く，他分野での利用が期待されている。 図６：標識認識の例 ３.１.３異常行動検知 異常行動検知とは入力映像内で起きている定常行動から逸脱した行動を検出する技術である。エスカレータシーンにおける異常行動検知では，常に背景が動いていると対象物の認識が困難であったが，動きと形状を同時に捉える特徴から定常状態をモデル化することにより，モデルから逸脱した転倒等の動作を検出可能にした（図７）10）_。このような行動検知技術は，原子力発電所等の入退出管理を必要とする重要施設から空港などの公共施設での利用が期待されている。

(7)

図７：異常行動検知の例 ３.２共同研究の推移 藤吉研究室では，研究成果をより多くの人や企業等にアピールするために，学会だけでなく多くの展示会等で研究発表を精力的に行ってきた。図８に年度毎における共同研究企業数と研究費の推移を示す。2007年度以降に企業数が増加しているのは，３.１で述べた技術を発表したのが2005∼2006年度であり，その結果，企業からの依頼が増えたものと推測できる。図３で示したネットワークカメラの出荷台数のカーブと図８の企業数の増加が似ていることからも，この時期にネットワークカメラなど市場が急速に拡大し，企業間における製品の差別化を図るため，画像認識技術に多くの企業が注目し始めたと推測される。 図８：共同研究企業数と研究費の推移

(8)

３.３研究成果の事業化 これまで藤吉研究室の画像認識技術は，眼球回旋計測装置，講師追尾型講義映像編集ソフトウェア，人検出評価モジュールの三つの製品化に貢献した。本節では，製品化例として講師追尾型講義映像編集ソフトウェアと製品化までの流れについて述べる。 ３.３.１講師追尾型講義映像編集ソフトウェア 藤吉研究室の画像認識技術を利用した講師追尾型講義映像編集ソフトウェア「i− Collabo．AutoRec」が日本電気（株）より製品化されている。家庭用ハイビジョンカメラで黒板全体が映るように撮影し，ソフトウェアに取り込み，開始ボタンを押すと画像認識技術により配信に適した講義映像が自動生成される。講義映像から講師や板書等の注目領域に対してトリミングを自動的に行い，不用な映像区間をカットすることで，配信に適したファイルサイズの講義映像を自動生成することが可能となる。さらに，トリミングを行う際に，放送カメラマンのカメラワーク特徴を模倣することにより，学習者が見やすくかつ臨場感あふれる映像を生成することが可能となる。公開者は生成した講義映像をwebサーバ上にアップロードし，学習者はポッドキャスティングにより最新の講義映像を自動でダウンロートすることが可能となる（図９参照）。 図９：講師追尾型講義映像編集ソフトウェア：i-Collabo. AutoRec ３.３.２製品化までの流れ 講義映像の自動編集は，教員業務の負担軽減の必要性から，画像認識の研究成果を講義映像の自動編集に利用できないかと考えたのをきっかけとして，2004年から研究を開始した。筆者が教員であったことから問題設定とニーズが明確であったため，応用を想定した研究を進めることができた。発表・展示会を通じ，e-learningシステムを開発販売している企業の目に留まり，共同開発が始まった。問題意識とニーズが共有されており研究成果の応用が明確であるため，製品化発売まで連携が円滑に進み，多くの大

(9)

学教育機関等で講義映像の公開が始まったこと等からも，本ソフトウェアは大学や塾などで利用され始めている。 ４．産学連携とその実情 市場と実用化に向けた問題意識を持つ産（企業）と，科学技術の基盤と優秀な人材を持つ学（大学）が，両者の強みを連携することによる相乗効果の結果，研究成果が事業化に結びつくことが理想的な連携である（図10参照）。しかしながら，相互の意識の違いから理想的な産学連携が多く行われているとは言い難い。以下に，産学連携がうまくなされなかった筆者の例をいくつか挙げ，失敗例から学んだ効果的な取り組みについて述べる。 図10：理想的な産学連携とギャップ ４.１産学連携におけるギャップ 筆者が研究を始めた当初は，共同研究の契約を結ぶが本来の産学連携に至らないケースは多々あった。産学連携における失敗例のケースとその理由を述べる。 Ａ社：システム開発会社（中小企業） Ａ社はシステム開発を業務としており，顧客から新しいサービスの開発の打診を受けた。Ａ社は画像認識技術に着目し，研究室を訪問したが基礎知識を持つ技術者の不足から，画像認識技術を使えば何でもできるという誤解が根底にあり，製品化の実現性にほど遠く，産学連携に至らなかった。

(10)

Ｂ社：システム開発会社（中小企業） Ｂ社の場合も，専門性を持つ技術者がいなかったが，顧客の強い希望のため共同研究に至った。しかし，研究開発は研究室のみで進めざるを得ず，Ｂ社は最終的に研究成果である技術を理解し自社で応用することができず，実用化されなかった。 Ｃ社：大手電機メーカー 筆者が研究を始めた頃は共同研究の経験がなかったために，技術シーズ（具体的にはソースコード）を企業に渡すだけで，最終的に企業が問題を解決できたかわからないまま終了したケースがあった。筆者が問題設定を把握しておらず問題の共有ができなかったため，次につながる連携は続かなかった。産学連携がうまくいかない大きな理由は，産学間に大きなギャップが存在することである。企業は，必要なものを大学等から外部調達すれば良いという姿勢で共同研究を進め，大学はそのまま実用化に貢献できるシーズがないのにも関わらず，シーズを企業に委ね製品化に対する問題意識が欠如している。このようなギャップが大きく存在すると，企業側は持続的な研究開発能力が低下し，大学側は技術シーズが活かされる事はなく，結果として製品化に至る前にその後の連携が終焉する場合が殆どである。この場合，研究成果である貴重な技術シーズが埋もれてしまい，産学両者にとって負の遺産を残すことになる。また，たとえ製品化に至ったとしても，大学の研究シーズを企業がそのまま使用するだけでは，製品の改良等に迅速に対応できない等，事業成功に向けてダーウィンの海を泳ぎきることは困難である。 ４.２ギャップを埋める産学連携の進め方 ４.１で述べたギャップを埋めるには，企業には資金提供の対価として100％の解決策を求めるのではなく，研究活動を誘発するようにイニシアチブを取る姿勢を持つことが求められる11）_{。そのためには，学に対して物が言える産側の技術者の育成も重要である。} 大学は，教育・研究機関であるため，企業の技術者を育成目的で受け入れることも可能である。企業側の人材が育つと，企業と大学間において対等なディスカッションが可能となり，次の一手となるアイディアを創出することが期待できる。また，大学が持つシーズをより的確に理解し拾い上げ，自社の持つ問題に活用することができる。一方，学においては，産側で必要とされている技術を正確に知る必要があり，市場のニーズに合わせ研究方針を柔軟に変えて行く姿勢も必要とされる。その上で，さらに明確な成果物を提示することを心掛けねばならない。産学連携は人と人との連携であり，技術は人を介して移転する。コンセンサスの取れた研究シナリオを産学の両者で如何に共有でき

(11)

るかが産学連携の成功への鍵であると考えられる。現在，藤吉研究室で取り組んでいる産学連携において，実用化に近いフェーズの共同研究成果としては，３.１.２で述べた自動車部品関連企業との交通道路標識の認識と，３.１.３で述べた大手電機メーカとのエスカレータにおける異常動作認識が挙げられる。これら二つの共同研究における共通点は，企業側に研究者として対等にディスカッション可能な人材が存在していること，事業化に向けての研究の方向性が明確であることであり，理想的な産学連携が進んでいるといえる。 ４.３オープン・イノベーションと産学連携 昨今では，産学連携推進に「オープン・イノベーション」という考え方が注目されている。オープン・イノベーションとは，企業側の既存のネットワークだけでは解決できない，リソース的に手が回らない技術課題に関して，オープンにグローバルに広く技術を求めることである12）_。４.２では産学連携におけるギャップを埋めるには，人と人の連携が重要であるということを述べたが，人と人の連携には出会いが必要である。人と人の連携を助長するアプローチの一つにオープン・イノベーションが取り入れられつつある。企業の研究開発の効率化が求められる現在，このようなオープン・イノベーションという考え方は，今後さらに浸透していくものと思われる。 まとめ 本稿では，画像認識分野における筆者の企業との共同研究の経験から産学連携の実情と産学連携のあり方について研究ノートとしてまとめた。今後，より良い産学連携が進むことによって，さらなる技術開発が発展することを望む。

(12)

（謝辞）本稿は，第15回画像センシングシンポジウムのオーガナイズドセッション「オープンイノベーションへの挑戦」を企画開催するにあたり，中京大学橋本教授，オムロン（株）諏訪様，三菱電機（株）羽下様，（株）ナインシグマ・ジャパン諏訪様，名城大学山田准教授，（株）サムスン横浜研究所数井様とのディスカッションを参考にさせて頂いた。ここに記し感謝の意を表する次第である。 参考文献

１） P. Viola and M. Jones, : “Robust Real-time Object Detection”, International Journal of

Computer Vision, Vol. 57, No. 2, pp. 137-154, 2001.

２）毎日新聞「東京・新宿広場に防犯カメラ設置計画」2002年３月６日。

３）数井誠人『映像監視システムのディジタルＩＰ化への取り組み∼研究開発サイドの取り組み』「第15回画像センシングシンポジウム，OS１−02」，2009。

４） R. Collins, A. Lipton, H. Fujiyoshi and T. Kanade, : “Algorithms for Cooperative Multi-sensor Surveillance”, Proc. of IEEE Special Issue on Video Communications, Processing

and Understanding for Third Generation Surveillance Systems, Vol. 89, No. 1, pp.

1456-1477, 2001.

５）藤吉弘亘，金出武雄，『人を観る技術 PIA:People Image Analysis』映像情報メディア学会誌「映像情報メディア，Vol. 60，No. 10」，pp.1542−1546，2006。６）井上博允，金出武雄，安西祐一郎，瀬名秀明，『岩波講座ロボット学１ロボット学創成』， pp. 49−65，2004。７）関真規人，林健太郎，谷口博康，橋本学，笹川耕一，『リアルタイム人物暴れ検出システム』，「第10回画像センシングシンポジウム」，2004。８）藤吉弘亘，『局所特徴量の関連性に着目した Joint特徴による物体検出』，「情報処理学会研究報告 CVIM」，pp. 43−54，2009。９）高木雅成，藤吉弘亘，『SIFT特徴量を用いた交通道路標識認識』，「電気学会論文誌，Vol. 129-C，No. 5」，pp. 824−831，2009。 10）村井泰裕，藤吉弘亘，数井誠人,『時空間特徴に基づくエスカレータシーンにおける人の異常行動検知』，「電子情報通信学会パターン認識・メディア理解研究会（PRMU）」，pp. 247−254， 2008。 11）山田宗男,『産学連携におけるシナリオづくりのすすめ∼大学からみた産学連携への期待∼』，「第15回画像センシングシンポジウム，OS２−04」，2009。

(13)

12）諏訪暁彦，『実用化に繋がるオープン∼イノベーション∼成否を左右する協業の設計∼』，「第 15回画像センシングシンポジウム，OS２−02」，2009。