AI研究としての画像情報処理(<特集>編集委員会企画-社会とAIの羅針盤2015-)

(1)

21 人工知能 30 巻 1 号（2015 年 1 月）「編集委員会企画─社会と AI の羅針盤 2015 ─」計算機処理による人の視覚機能の実現は，人工知能システムの入力部として，あるいは視覚情報に基づく知的情報処理そのものの重要性により，AI 分野における主要な研究課題の一つであった．この課題には，より詳細な個別の問題設定ごとに，画像処理や画像認識，コンピュータビジョンや物体認識など，さまざまな呼び名が存在するが，ここでは画像情報処理と総称する．これに関する話題は本学会でもたびたび取り上げられていたが，その目的が人の視覚機能の実現に留まらず，人への情報提示などにも広がり，CG や VR などとも関わりをもつ独立した分野に成長していくにつれて，これを AI 研究の一課題として位置付ける議論は減り，本学会での発表も少なくなった．この間，AI 研究としての画像情報処理は，どのような課題がどのような形で解決される一方，どのような課題がいかなる理由で残されているのであろうか？コンピュータビジョンでは，物体の二次元画像から三次元形状の復元を目指す際に，三次元から二次元への投影過程で失われた奥行きの一次元分を復元する逆問題の不良設定性が問題となってきたが，多眼ステレオや視体積交差法に代表されるように同一物体を多数のカメラで冗長に撮影することで不良設定性を回避するとともに，エピポーラ幾何やレーザ光・赤外光などの能動照明によって画像間の対応関係を求めることで問題の解決が図られ，最近普及のめざましい RGB-D カメラなどの出現を見た．このような三次元形状の復元よりもむしろ画像中の対象物体の記号化に重点を置く画像認識では，観測方向などによる見え方の多様性への対応や，その際の対象物体に適した特徴量の設定などが問題であったが，HOG や SIFT などに代表される汎用的な特徴量で記述された画像を，多数の事例からの学習などによって見え方の多様性も含めて一括してモデル化して記号に対応付けることにより，多様な画像の認識が可能となり，特に顔画像に関してはディジタルカメラの自動焦点調節などに利用されるまでになった．画像情報処理は，分野自体の重要性は漠然と理解されているものの，技術の向上の程度をわかりやすく伝える成果を分野の進歩に応じて段階的に示していくことがなかなかできていなかったが，これらはその点で大きな成果といえる．しかし，よく一般に“人の得る情報の 8 割は視覚による”といわれるだけあって，人が画像から得る情報の多彩さはこれらの比ではない．例えば街角を歩いている人を写した画像に対し，上のような成果によって人の位置や向き，“人”や“歩行”などの記号を付与できたとしても，人間ならば，さらに写っている人の身なりや姿勢，光の加減や周囲の風景などをもとに，その人の社会的立場や気分，天候や季節，国や地域，場の性格や雰囲気，これから予測される事態など，無数の意味をくみ取ることができる．もし画像情報処理が AI 研究として真にセマンティックギャップを乗り越え，画像からこのような多彩な意味を導き出すことを目指すのであれば，やはりそのための革新的なアプローチが必要なように思う．画像情報処理が AI の一課題として議論されていた時代には，コンピュータビジョンや画像認識の次の段階として，“画像理解”というものが提唱されていたが，最近の画像情報処理の分野では，おそらくは実用性を考えた際の具体的な問題設定の不明確さや，何よりも問題自体の難しさからか，この言葉を耳にすることは少ない．画像が人にとって多彩な意味を示し得るのは，大雑把にいえば，記号のような意味との直接的結び付きをもたない画素値を表現単位として，その配列の中に多様な粒度で暗黙に含まれる，さまざまな部分特徴間のさまざまな関係性によって，意味が多重に表現されるとともに，その部分特徴や関係性の種類に，組み合わせ爆発的な可能性が存在するためであろう．このため，適切な部分特徴や関係性を，それに基づいて導き出し得る意味内容に応じて相補的に定めるといった，この問題に対する汎用的なアプローチが議論されていた時代もあり，コンピュータビジョンでは，光学投影の逆問題として，同一の二次元画像を生成し得る無数の三次元形状の中から，何らかの物体と認識し得る特徴をもつものを絞り込む手法などが，また画像認識では，画像から何らかの意味に結び付く部分特徴を抽出し，それらの関係性によって画像全体の意味を解釈する手法などが試みられていた．これに対して先述のような成果では，三次元形状復元を能動照明なども活用した純粋に幾何学的な計測処理に帰着させたり，比較的汎用性の高い特定の部分特徴の有無のみで一律に記述された画像全体を直接記号に対応付けるなど，どちらかといえば目標となる課題への指向性の強い割り切ったアプローチが多いように思う．このため，それに引き続く三次元形状や文脈状況の認識など，根底にある問題点は共通していても，部分特徴が不明確で，それらの関係性が意味付けに重要となるような処理の実現には直ちに結び付いていないように思う．こう考えると，AI 研究としての画像情報処理にはやはりまだ何か根本的なブレークスルーが不足しているように感じられるが，これが AI 分野で期待されているシンギュラリティにおいて具体的にどのようなアプローチとなって現れてくるのか，今後の展開に注目したい．

AI 研究としての画像情報処理

角所　　考

関西学院大学

AI研究としての画像情報処理(<特集>編集委員会企画-社会とAIの羅針盤2015-)

AI 研究としての画像情報処理

角所 考

角所　　考