21 人 工 知 能 30 巻 1 号(2015 年 1 月) 「編集委員会企画─社会と AI の羅針盤 2015 ─」 計算機処理による人の視覚機能の実現は,人工知能シ ステムの入力部として,あるいは視覚情報に基づく知的 情報処理そのものの重要性により,AI 分野における主要 な研究課題の一つであった.この課題には,より詳細な 個別の問題設定ごとに,画像処理や画像認識,コンピュー タビジョンや物体認識など,さまざまな呼び名が存在す るが,ここでは画像情報処理と総称する.これに関する 話題は本学会でもたびたび取り上げられていたが,その 目的が人の視覚機能の実現に留まらず,人への情報提示 などにも広がり,CG や VR などとも関わりをもつ独立し た分野に成長していくにつれて,これを AI 研究の一課題 として位置付ける議論は減り,本学会での発表も少なく なった.この間,AI 研究としての画像情報処理は,どの ような課題がどのような形で解決される一方,どのよう な課題がいかなる理由で残されているのであろうか? コンピュータビジョンでは,物体の二次元画像から三次 元形状の復元を目指す際に,三次元から二次元への投影過 程で失われた奥行きの一次元分を復元する逆問題の不良設 定性が問題となってきたが,多眼ステレオや視体積交差法 に代表されるように同一物体を多数のカメラで冗長に撮影 することで不良設定性を回避するとともに,エピポーラ幾 何やレーザ光・赤外光などの能動照明によって画像間の対 応関係を求めることで問題の解決が図られ,最近普及のめ ざましい RGB-D カメラなどの出現を見た.このような三 次元形状の復元よりもむしろ画像中の対象物体の記号化に 重点を置く画像認識では,観測方向などによる見え方の多 様性への対応や,その際の対象物体に適した特徴量の設定 などが問題であったが,HOG や SIFT などに代表される 汎用的な特徴量で記述された画像を,多数の事例からの学 習などによって見え方の多様性も含めて一括してモデル化 して記号に対応付けることにより,多様な画像の認識が可 能となり,特に顔画像に関してはディジタルカメラの自動 焦点調節などに利用されるまでになった. 画像情報処理は,分野自体の重要性は漠然と理解され ているものの,技術の向上の程度をわかりやすく伝える 成果を分野の進歩に応じて段階的に示していくことがな かなかできていなかったが,これらはその点で大きな成 果といえる.しかし,よく一般に“人の得る情報の 8 割 は視覚による”といわれるだけあって,人が画像から得 る情報の多彩さはこれらの比ではない.例えば街角を歩 いている人を写した画像に対し,上のような成果によっ て人の位置や向き,“人”や“歩行”などの記号を付与で きたとしても,人間ならば,さらに写っている人の身な りや姿勢,光の加減や周囲の風景などをもとに,その人 の社会的立場や気分,天候や季節,国や地域,場の性格 や雰囲気,これから予測される事態など,無数の意味を くみ取ることができる.もし画像情報処理が AI 研究とし て真にセマンティックギャップを乗り越え,画像からこ のような多彩な意味を導き出すことを目指すのであれば, やはりそのための革新的なアプローチが必要なように思 う.画像情報処理が AI の一課題として議論されていた時 代には,コンピュータビジョンや画像認識の次の段階と して,“画像理解”というものが提唱されていたが,最近 の画像情報処理の分野では,おそらくは実用性を考えた 際の具体的な問題設定の不明確さや,何よりも問題自体 の難しさからか,この言葉を耳にすることは少ない. 画像が人にとって多彩な意味を示し得るのは,大雑把 にいえば,記号のような意味との直接的結び付きをもたな い画素値を表現単位として,その配列の中に多様な粒度で 暗黙に含まれる,さまざまな部分特徴間のさまざまな関係 性によって,意味が多重に表現されるとともに,その部分 特徴や関係性の種類に,組み合わせ爆発的な可能性が存在 するためであろう.このため,適切な部分特徴や関係性を, それに基づいて導き出し得る意味内容に応じて相補的に定 めるといった,この問題に対する汎用的なアプローチが議 論されていた時代もあり,コンピュータビジョンでは,光 学投影の逆問題として,同一の二次元画像を生成し得る無 数の三次元形状の中から,何らかの物体と認識し得る特徴 をもつものを絞り込む手法などが,また画像認識では,画 像から何らかの意味に結び付く部分特徴を抽出し,それら の関係性によって画像全体の意味を解釈する手法などが試 みられていた.これに対して先述のような成果では,三次 元形状復元を能動照明なども活用した純粋に幾何学的な計 測処理に帰着させたり,比較的汎用性の高い特定の部分特 徴の有無のみで一律に記述された画像全体を直接記号に対 応付けるなど,どちらかといえば目標となる課題への指向 性の強い割り切ったアプローチが多いように思う.このた め,それに引き続く三次元形状や文脈状況の認識など,根 底にある問題点は共通していても,部分特徴が不明確で, それらの関係性が意味付けに重要となるような処理の実現 には直ちに結び付いていないように思う. こう考えると,AI 研究としての画像情報処理にはや はりまだ何か根本的なブレークスルーが不足しているよ うに感じられるが,これが AI 分野で期待されているシ ンギュラリティにおいて具体的にどのようなアプローチ となって現れてくるのか,今後の展開に注目したい.
AI研究としての画像情報処理(<特集>編集委員会企画-社会とAIの羅針盤2015-)
1
0
0
全文
関連したドキュメント
はじめに
会計方針の変更として、「収益認識に関する会計基準」(企業会計基準第29号
会長企画シンポジウム 3-1 「JSCO 2022 “Frontier” 1」下部消化管癌 会長企画シンポジウム 3-2「JSCO 2022 “Frontier” 2」婦人科癌
原子力規制委員会(以下「当委員会」という。)は、平成24年10月16日に東京電力株式会社
二月八日に運営委員会と人権小委員会の会合にかけられたが︑両者の間に基本的な見解の対立がある
社会学研究科は、社会学および社会心理学の先端的研究を推進するとともに、博士課
(企業会計基準第13号 平成19年3月30 日改正)及び「リース取引に関する会計 基準の適用指針」(企業会計基準適用指 針第16号
継続 平成29年度新潟県の地域づくりに関する意見交換会 新潟県総務管理部地域政策課 委員 石本 継続 ファンドレイジング福祉にいがた管理委員会