1.はじめに 昨今のデジタルカメラには顔認識技術が搭載されており,画像認識技術の中で最も一 般に知られた技術となった。このような画像認識技術は,デジタルカメラの画質改善等 の楽しい生活のアシストだけでなく,映像監視セキュリティや車の夜間歩行者検知等の 安心安全社会の実現にも利用され始めている。このような背景下において,次世代の画 像認識技術に関する研究開発競争は企業間でより一層激しくなり,多くの大学研究機 関においては先進的な画像認識に関する研究が盛んに行われている。このような状況下 において,企業と大学における共同研究は実用化を効率良く進める解決策の一つであ り,産学連携の取り組みは年々増加傾向にある。 本稿では,筆者の経験から画像認識分野における産学連携の実情とあり方について 述べる。第2章では,画像認識技術の発展と実用化例を挙げ,画像認識分野の背景に ついて述べる。第3章では,研究室における画像認識技術と製品化例について紹介す る。第4章では,前章における経験をもとに産学連携とその実情について述べ,今後の 産学連携のあり方について提示する。 2.画像認識の発展と実用化 画像認識は,画像から顔や人等の対象となる物体を検出し,それが何であるかを認識 する技術である。画像認識技術は,デジタルカメラの顔検出機能に代表されるように画
画像認識分野における効果的な産学連携
An Effective Approach of University-Industry Research Collaboration
on Computer Vision
藤 吉 弘 亘 Hironobu FUJIYOSHI 鈴 木 正 慶 Masayoshi SUZUKI
像生成への利用や,監視セキュリティなどの安全・安心システムへ利用されている。本 章では,この二つの用途に対して画像認識技術がどのように発展し,実社会で利用され てきたかについて述べる。 2.1 画像認識技術の画像生成への利用 現在発売されているデジタルカメラには,低価格機から一眼カメラまで殆どの機種 に,顔検出機能が搭載されている。この顔検出機能は,画像認識技術の中で最も一般 に知られた技術の一つである。デジタルカメラで撮影した画像から顔を検出することに より,自動的に顔に焦点を合わせた撮影が可能であり,画像処理によって顔をきれいに 補正することもできる。最新の顔認識技術では,笑顔を認識したり,特定人物の顔を認 識して撮影する技術も実用化されている。これらの顔認識技術は,目,鼻,口などの顔 の部位を認識しているのではなく,図1のように顔の部分的な領域の明暗差を特徴とし ており,2002年にViola等1)によって提案された。メモリー量が少なく小型化が可能で あることから,大きなブレークスルーとなり顔認識技術の実用化が大きく進展した。 2005年に初めてデジタルカメラに搭載されて以降,消費者からの支持を得て売り上げを 大幅に伸ばし,現在では殆どの機種に搭載されるまで普及した。 図1:顔の部分的な明暗差による特徴量 2.2 画像認識技術の安全・安心への利用 学校や商店街などの公共の場において,犯罪の増加に伴い監視セキュリティ用のカメ ラが普及しつつある2)。監視カメラの普及に伴い,監視する人員等のコストや負担を低 減するために,自動的にカメラから動体を検知する画像認識技術の監視カメラへの応用 が期待されている。
米国カーネギーメロン大学では,1997年からビデオ監視システムに関する研究である VSAM(Video Surveillance and Monitoring)プロジェクトが取り組まれ,動体検知,物 体識別,追跡等の動画像理解技術を横断的に開発し,ネットワーク化された10数台の カメラが協調して動作するシステムを構築した3)。一台のカメラでは許容できない広範 囲における侵入物体の行動軌跡を知ることが可能となり,図2に示すように広域な範囲 における人や車の流れを地図上にリアルタイムで可視化することが可能となった。 VSAMシステムは,その後,多くの企業における画像認識技術を用いたビデオ監視シス テムの研究開発に大きな影響を与えた。 これらの技術は,2002年頃からエレベータなどの限られた空間において徐々に製品化 され始めた4)が,一般に認知されるほどは実利用化されていない。要求される認識性能 が高く実環境下における認識性能が不十分であるため,誤報,失報につながり人件費 コストを抑えることができない等の問題があるからである。監視セキュリティなどの安 心・安全という分野では失敗が許されない状況下が多く,画像認識技術は一部の監視 カメラに組み込まれているのみであり,デジタルカメラほど普及には至っていないのが 現状である。 図2:動画像理解技術を用いた自動ビデオ監視システム(VSAM) 2.3 映像監視分野におけるダーウィンの海 基礎研究から事業成功に至るまでには,魔の川,死の谷,ダーウィンの海の三つの難 関があると例えられている。魔の川はアイディアシーズが応用研究に至るまでの難関・
障壁を,死の谷は研究成果が製品化に至るまでの難関・障壁を表している。死の谷を 乗り越えると製品化という形にはなるが,事業として成功するためには最後の難関・障 壁であるダーウィンの海を泳ぎきらなければならない。図3は,2.2で述べた映像監 視分野における動向とネットワークカメラの出荷台数を,魔の川,死の谷,ダーウィン の海に重ねて表示したグラフである。90年代後半に始まった映像監視分野における画像 認識技術の基礎研究は魔の川・死の谷を越え,企業により一部製品化された。現在は, 事業として成功する手前であるダーウィンの海を泳いでいる状況である。このダーウィ ンの海を泳ぎきるためには,2.3で述べた実環境下の高精度化という問題を解決する だけでなく,マーケットの大きさである市場性も重要である。2009年時におけるネット ワークカメラの出荷台数は成長率149%と市場性が見込まれ5),ダーウィンの海を泳ぎ きるためにはこれらネットワークカメラと連動した高精度な画像認識技術の実現が鍵と なっており,各企業で激しい技術開発が展開されている。現在では,画像認識技術の高 精度化と高速化の研究が急速に発展しており,また防犯意識の高まりによりカメラの需 要も急速に高まっている状況にある。 3.藤吉研究室の画像認識技術とその製品化 藤吉研究室では,2000年より画像認識技術の基礎研究に取り組み企業との共同研究 を行ってきた。本章では,研究室における画像認識技術と共同研究事例,製品化につ いて紹介する。 図3:映像監視分野における魔の川,死の谷,ダーウィンの海
3.1 人を観る技術 藤吉研究室では,人間の生活をサポートする環境ロボット(インビジブルロボット)6) における視覚機能の実現を目標に,画像認識技術の基礎研究と応用研究に取り組んで いる。特に,人を観る技術7)については,人・胴体・顔の検出,人の軌跡・動き・姿 勢・視線の解析,ジェスチャ認識,異常行動検知等,重点的に幅広く研究に取り組ん でいる(図4)。この人を観る技術は映像監視セキュリティ等の安心安全社会の実現に, また一方では,画像の画質改善や映像自動編集再生等の楽しい生活のアシストとして 応用が可能である。次節では,人を観る技術の基礎研究について述べる。 図4:人を観る技術 3.1.1 人検出 物体検出は画像中より予め定義した検出対象を探索する技術である。物体検出の中 でも,人は姿勢変化に伴う形状変化が大きいため,画像から人を検出する事は非常に 難しい問題である。藤吉研究室では人検出法の一つとして,人が歩く際の動きに着目 した方法を提案した8)。人が歩行している場合には,軸足である片方の足が静止してお り,もう一方の足は前に出す動きが観測できる。この様な人の独特な動きと人の形状の 特徴を同時に観測する事により,高精度な人検出を実現した(図5参照)。高精度な人 検出技術は,ドライバーのサポートを目的としたITS(高度交通システム)や不審者 の検出等のセキュリティ分野での利用が期待されている。
図5:人検出例 3.1.2 特定物体認識 特定物体認識として,交通道路標識の自動認識手法の開発に取り組んでいる。我々 の手法9)では,予め用意したイラストパターンの道路標識と実画像のマッチングによ り,交通道路標識を認識する(図6参照)。本技術は,標識以外にも,ロゴやマーカー の認識にそのまま利用できるため汎用性が高く,他分野での利用が期待されている。 図6:標識認識の例 3.1.3 異常行動検知 異常行動検知とは入力映像内で起きている定常行動から逸脱した行動を検出する技 術である。エスカレータシーンにおける異常行動検知では,常に背景が動いていると対 象物の認識が困難であったが,動きと形状を同時に捉える特徴から定常状態をモデル化 することにより,モデルから逸脱した転倒等の動作を検出可能にした(図7)10)。この ような行動検知技術は,原子力発電所等の入退出管理を必要とする重要施設から空港 などの公共施設での利用が期待されている。
図7:異常行動検知の例 3.2 共同研究の推移 藤吉研究室では,研究成果をより多くの人や企業等にアピールするために,学会だけ でなく多くの展示会等で研究発表を精力的に行ってきた。図8に年度毎における共同 研究企業数と研究費の推移を示す。2007年度以降に企業数が増加しているのは,3.1 で述べた技術を発表したのが2005∼2006年度であり,その結果,企業からの依頼が増 えたものと推測できる。図3で示したネットワークカメラの出荷台数のカーブと図8の 企業数の増加が似ていることからも,この時期にネットワークカメラなど市場が急速に 拡大し,企業間における製品の差別化を図るため,画像認識技術に多くの企業が注目 し始めたと推測される。 図8:共同研究企業数と研究費の推移
3.3 研究成果の事業化 これまで藤吉研究室の画像認識技術は,眼球回旋計測装置,講師追尾型講義映像編 集ソフトウェア,人検出評価モジュールの三つの製品化に貢献した。本節では,製品化 例として講師追尾型講義映像編集ソフトウェアと製品化までの流れについて述べる。 3.3.1 講師追尾型講義映像編集ソフトウェア 藤吉研究室の画像認識技術を利用した講師追尾型講義映像編集ソフトウェア「i− Collabo.AutoRec」が日本電気(株)より製品化されている。家庭用ハイビジョンカメ ラで黒板全体が映るように撮影し,ソフトウェアに取り込み,開始ボタンを押すと画像 認識技術により配信に適した講義映像が自動生成される。講義映像から講師や板書等 の注目領域に対してトリミングを自動的に行い,不用な映像区間をカットすることで, 配信に適したファイルサイズの講義映像を自動生成することが可能となる。さらに,ト リミングを行う際に,放送カメラマンのカメラワーク特徴を模倣することにより,学習 者が見やすくかつ臨場感あふれる映像を生成することが可能となる。公開者は生成した 講義映像をwebサーバ上にアップロードし,学習者はポッドキャスティングにより最新 の講義映像を自動でダウンロートすることが可能となる(図9参照)。 図9:講師追尾型講義映像編集ソフトウェア:i-Collabo. AutoRec 3.3.2製品化までの流れ 講義映像の自動編集は,教員業務の負担軽減の必要性から,画像認識の研究成果を 講義映像の自動編集に利用できないかと考えたのをきっかけとして,2004年から研究を 開始した。筆者が教員であったことから問題設定とニーズが明確であったため,応用を 想定した研究を進めることができた。発表・展示会を通じ,e-learningシステムを開発 販売している企業の目に留まり,共同開発が始まった。問題意識とニーズが共有されて おり研究成果の応用が明確であるため,製品化発売まで連携が円滑に進み,多くの大
学教育機関等で講義映像の公開が始まったこと等からも,本ソフトウェアは大学や塾な どで利用され始めている。 4.産学連携とその実情 市場と実用化に向けた問題意識を持つ産(企業)と,科学技術の基盤と優秀な人材を 持つ学(大学)が,両者の強みを連携することによる相乗効果の結果,研究成果が事業 化に結びつくことが理想的な連携である(図10参照)。しかしながら,相互の意識の違 いから理想的な産学連携が多く行われているとは言い難い。以下に,産学連携がうまく なされなかった筆者の例をいくつか挙げ,失敗例から学んだ効果的な取り組みについて 述べる。 図10:理想的な産学連携とギャップ 4.1産学連携におけるギャップ 筆者が研究を始めた当初は,共同研究の契約を結ぶが本来の産学連携に至らない ケースは多々あった。産学連携における失敗例のケースとその理由を述べる。 A社:システム開発会社(中小企業) A社はシステム開発を業務としており,顧客から新しいサービスの開発の打診を受 けた。A社は画像認識技術に着目し,研究室を訪問したが基礎知識を持つ技術者の 不足から,画像認識技術を使えば何でもできるという誤解が根底にあり,製品化の実 現性にほど遠く,産学連携に至らなかった。
B社:システム開発会社(中小企業) B社の場合も,専門性を持つ技術者がいなかったが,顧客の強い希望のため共同 研究に至った。しかし,研究開発は研究室のみで進めざるを得ず,B社は最終的に研 究成果である技術を理解し自社で応用することができず,実用化されなかった。 C社:大手電機メーカー 筆者が研究を始めた頃は共同研究の経験がなかったために,技術シーズ(具体的に はソースコード)を企業に渡すだけで,最終的に企業が問題を解決できたかわからな いまま終了したケースがあった。筆者が問題設定を把握しておらず問題の共有ができ なかったため,次につながる連携は続かなかった。 産学連携がうまくいかない大きな理由は,産学間に大きなギャップが存在することで ある。企業は,必要なものを大学等から外部調達すれば良いという姿勢で共同研究を進 め,大学はそのまま実用化に貢献できるシーズがないのにも関わらず,シーズを企業に 委ね製品化に対する問題意識が欠如している。このようなギャップが大きく存在する と,企業側は持続的な研究開発能力が低下し,大学側は技術シーズが活かされる事は なく,結果として製品化に至る前にその後の連携が終焉する場合が殆どである。この場 合,研究成果である貴重な技術シーズが埋もれてしまい,産学両者にとって負の遺産を 残すことになる。また,たとえ製品化に至ったとしても,大学の研究シーズを企業がそ のまま使用するだけでは,製品の改良等に迅速に対応できない等,事業成功に向けて ダーウィンの海を泳ぎきることは困難である。 4.2ギャップを埋める産学連携の進め方 4.1で述べたギャップを埋めるには,企業には資金提供の対価として100%の解決策 を求めるのではなく,研究活動を誘発するようにイニシアチブを取る姿勢を持つことが 求められる11)。そのためには,学に対して物が言える産側の技術者の育成も重要である。 大学は,教育・研究機関であるため,企業の技術者を育成目的で受け入れることも可 能である。企業側の人材が育つと,企業と大学間において対等なディスカッションが可 能となり,次の一手となるアイディアを創出することが期待できる。また,大学が持つ シーズをより的確に理解し拾い上げ,自社の持つ問題に活用することができる。一方, 学においては,産側で必要とされている技術を正確に知る必要があり,市場のニーズに 合わせ研究方針を柔軟に変えて行く姿勢も必要とされる。その上で,さらに明確な成果 物を提示することを心掛けねばならない。産学連携は人と人との連携であり,技術は人 を介して移転する。コンセンサスの取れた研究シナリオを産学の両者で如何に共有でき
るかが産学連携の成功への鍵であると考えられる。 現在,藤吉研究室で取り組んでいる産学連携において,実用化に近いフェーズの共 同研究成果としては,3.1.2で述べた自動車部品関連企業との交通道路標識の認識 と,3.1.3で述べた大手電機メーカとのエスカレータにおける異常動作認識が挙げら れる。これら二つの共同研究における共通点は,企業側に研究者として対等にディスカ ッション可能な人材が存在していること,事業化に向けての研究の方向性が明確である ことであり,理想的な産学連携が進んでいるといえる。 4.3 オープン・イノベーションと産学連携 昨今では,産学連携推進に「オープン・イノベーション」という考え方が注目されて いる。オープン・イノベーションとは,企業側の既存のネットワークだけでは解決でき ない,リソース的に手が回らない技術課題に関して,オープンにグローバルに広く技術 を求めることである12)。 4.2では産学連携におけるギャップを埋めるには,人と人の連携が重要であるとい うことを述べたが,人と人の連携には出会いが必要である。人と人の連携を助長するア プローチの一つにオープン・イノベーションが取り入れられつつある。企業の研究開発 の効率化が求められる現在,このようなオープン・イノベーションという考え方は,今 後さらに浸透していくものと思われる。 まとめ 本稿では,画像認識分野における筆者の企業との共同研究の経験から産学連携の実 情と産学連携のあり方について研究ノートとしてまとめた。今後,より良い産学連携が 進むことによって,さらなる技術開発が発展することを望む。
(謝 辞) 本稿は,第15回画像センシングシンポジウムのオーガナイズドセッション「オープンイノベー ションへの挑戦」を企画開催するにあたり,中京大学橋本教授,オムロン(株)諏訪様,三菱電 機(株)羽下様,(株)ナインシグマ・ジャパン諏訪様,名城大学山田准教授,(株)サムスン横浜 研究所数井様とのディスカッションを参考にさせて頂いた。ここに記し感謝の意を表する次第で ある。 参考文献
1) P. Viola and M. Jones, : “Robust Real-time Object Detection”, International Journal of
Computer Vision, Vol. 57, No. 2, pp. 137-154, 2001.
2) 毎日新聞「東京・新宿広場に防犯カメラ設置計画」2002年3月6日。
3) 数井誠人『映像監視システムのディジタルIP化への取り組み∼研究開発サイドの取り組み』 「第15回画像センシングシンポジウム,OS1−02」,2009。
4) R. Collins, A. Lipton, H. Fujiyoshi and T. Kanade, : “Algorithms for Cooperative Multi-sensor Surveillance”, Proc. of IEEE Special Issue on Video Communications, Processing
and Understanding for Third Generation Surveillance Systems, Vol. 89, No. 1, pp.
1456-1477, 2001.
5) 藤吉弘亘,金出武雄,『人を観る技術 PIA:People Image Analysis』映像情報メディア学会誌 「映像情報メディア,Vol. 60,No. 10」,pp.1542−1546,2006。 6) 井上博允,金出武雄,安西祐一郎,瀬名秀明,『岩波講座ロボット学1 ロボット学創成』, pp. 49−65,2004。 7) 関真規人,林健太郎,谷口博康,橋本学,笹川耕一,『リアルタイム人物暴れ検出システム』, 「第10回画像センシングシンポジウム」,2004。 8) 藤吉弘亘,『局所特徴量の関連性に着目した Joint特徴による物体検出』,「情報処理学会研 究報告 CVIM」,pp. 43−54,2009。 9) 高木雅成,藤吉弘亘,『SIFT特徴量を用いた交通道路標識認識』,「電気学会論文誌,Vol. 129-C,No. 5」,pp. 824−831,2009。 10) 村井泰裕,藤吉弘亘,数井誠人,『時空間特徴に基づくエスカレータシーンにおける人の異常 行動検知』,「電子情報通信学会パターン認識・メディア理解研究会(PRMU)」,pp. 247−254, 2008。 11) 山田宗男,『産学連携におけるシナリオづくりのすすめ∼大学からみた産学連携への期待∼』, 「第15回画像センシングシンポジウム,OS2−04」,2009。
12) 諏訪暁彦,『実用化に繋がるオープン∼イノベーション∼成否を左右する協業の設計∼』,「第 15回画像センシングシンポジウム,OS2−02」,2009。