— 81 —
そもそも視覚の研究はなぜ必要か
西田
眞也
京都大学 情報学研究科 質問:そもそも視覚の研究はなぜ必要なのか 答え:映像技術の革新のため 言うまでもないことだが,視覚の研究は知的 好奇心を満たすために必要である.視覚研究の どこに惹かれるかに関しては人それぞれであろ う.哲学的に今日的な視点で認識論を極めた い,脳の主要な機能である視覚を科学的に理解 したい,といったハードな理由から,錯視が面 白いとか,映像芸術が好きだとか,ファッショ ンに興味があるとか,といったソフトな理由も あるように思う.いずれにしろ,視覚は多くの 研究者を惹きつけてきた研究分野である. しかし,多額の研究資金や,大学の貴重な人 事ポストなどのリソースを割いて視覚の研究を する必要がなぜあるのか,そんなことをして何 の役に立つのかと,世間や他分野の研究者に迫 られれば,視覚研究を正当化する論理は必要に なる. 電気通信会社の研究所に長らくお世話になっ たこともあって,私のこの質問に対するデフォ ルトの答えは,視覚の研究は映像技術の革新の ため,というものである.人間のような視覚能 力をもつ機械を作ったり,人間が満足できるよ うな映像体験を実現したりするため,視覚研究 は必要である. 近年,機械の視覚は飛躍的に進歩し,人間に 匹敵するような認識パフォーマンスを示し,そ の一部はスマートフォンなどにも実装されてわ れわれの生活を豊かにするに至っている.その 驚くべき進歩に,実際人間の視覚研究は大きく 貢献してきた.と言いたいところだが,残念な がらそうとは言えない. 近年の進歩に大きく貢献した人工神経回路を 使った深層学習に関しても,開発の当初におい て福島邦彦先生のネオコグニトロン1)が一次 視覚野の単純細胞と複雑細胞の働きをヒントに 作られたという逸話は語られるものの,最近の 急激な性能の向上は,計算機パワーの向上と か,巨大なデータベースの出現とか,アルゴリ ズムの改良とか,人間の脳とは必ずしも関係な い要因によるところが大きい. むしろ,近年の機械認識技術の発展は,新し い人間の視覚情報処理のモデルを提供するとい う形で,科学的な人間視覚研究に大きく貢献し ている2).もっと長いスパンで考えてみても, 視覚科学は人工知能研究からいろいろアイデア をもらってきたが,J. J. Gibson3)のような思想 的先駆者を除けば,視覚研究が機械認識(人工 知能)研究を牽引したと言えるような例はあま りないように思える.1980年代以来,人間視 覚研究に大きく影響を与えたD. Marr4)の考え も,当時の機械認識技術のアイデアを下敷きに したものであった. 機械の視覚能力をこれ以上向上させるのに人 間の視覚に学ぶべき点は残っていないのではな いかという意見すら耳にする今日この頃である が,まだまだ視覚研究の役割は残っていると私 は考えている. ものの認識において人間の知識を集約した ビックデータを深層学習で訓練した人工神経回 路が人間に匹敵するパフォーマンスを示したと 言っても,中身として人間と同じように情報処 理しているわけではない.人間が使わないよう な些末な画像特徴を利用することにより,人間 にはできないような弁別はできても,人間なら 絶対しない間違いをしたりする.人間に気づか ない形で画像操作して機械の認識を騙す方法も■ 視覚にまつわるFAQ
(VISION Vol. 33, No. 2, 81–82, 2021) DOI: https://doi.org/10.24636/vision.33.2_81— 82 — 知られているし,それを防ぐための方法が盛ん に研究されている.しかし,介護ロボットなど, 機械が人間と適切にコミュニケーションするた めには,それでは困るだろう.機械と人間が同 じような認識能力を共有するために,人間の視 覚を科学的に理解し,何が技術的に実現されて いて,何がされていないかを明らかにすること は,視覚研究の重要な役割だと思っている. また,もう一つの,人間が満足できる映像体 験を提供する,という目的に関しては,視覚研 究が果たせる役割は多く残されている.VR
(Virtual Reality), AR (Augmented Reality) と いった技術では,視覚体験を再現することが求 められるが,物理的に正確な再現は簡単では無 い.2次元平面のディスプレイにきれいな画を 出すだけではなく,あらゆる方向から両方の目 に入力される光線パターンを,眼球の位置,方 向,調節,瞳孔の状態を考慮して再現すること は,技術的に難しいし,コストもかかる.そう いうときに,人間の視覚研究の成果を活かし て,人間が気づかないところでうまく手を抜い て,比較的簡単な方法で人間が満足できる映像 を提示することができる. さらに,物理的には実現不可能な映像提示も 視覚特性を利用することが可能になる.手前味 噌 に な る が,数 年 前 に わ れ わ れ が 開 発 し た Hidden Stereo5) は,視覚研究の成果がうまく 活かされた例だと思っている. 3D表示では,右眼と左眼に異なる(奥行き に応じた両眼視差がある)映像を表示する必要 がある.左右の画像を同じディスプレイに提示 して,時間ずれや偏光を使って眼前の3Dメガ ネで別々の眼に振り分ける.このメガネがない と,左右の画像が重なって,幾何学的に正しい 両眼視差をもった左右画像の場合は,ボケが生 じる.しかし,Hidden Stereoの場合は,メガ ネをかけると3Dが見えるのに,メガネをはず したときはボケない. これは,人間の両眼視差検出メカニズムが空 間周波数のサブバンドごとに空間位相を検出し ていることを利用している.その視差情報を維 持しながら,左右画像を重畳したときにボケの ない1枚の画像になるように画像が作ってあ る.2枚の画は幾何学的には正しくないが,知 覚的には問題がない.つまり,人間の視覚をう まく騙している. 視覚研究の理解に基づいてこういった技術を どんどん開発していけば,そもそも視覚の研究 はなぜ必要か,などという質問をだれからも言 われないような状況になるだろう.そういう日 が来るように,視覚研究者の皆さん,頑張りま しょう. 文 献
1) K. Fukushima, S. Miyake and T. Ito: Neocognitron: A neural network model for a mechanism of visual pattern recognition. IEEE Transactions on Systems, Man, and Cybernetics SMC-13, 826–834 (1983).
2) D. L. K. Yamins and J. J. DiCarlo: Using goal-driven deep learning models to understand sensory cortex. Nature Neuroscience, 19, 356–365 (2016).
3) J. J. Gibson: The ecological approach to visual perception. Psychology Press, 1979. (生 態 学 的 視覚論―ヒトの知覚世界を探る,古崎 敬, 古 崎 愛 子,辻敬一郎,村瀬 旻(訳)サイ エンス社,1986).
4) D. Marr: Vision: A computational investigation into the human representation and processing of visual information. W. H. Freeman and Company. 1982. (ビジョン―視覚の計算理論 と脳内表現,乾 敏郎,安藤広志(訳)産業 図書,1987).
5) T. Fukiage, T. Kawabe and S. Nishida: Hiding of phase-based stereo disparity for ghost-free viewing without glasses. ACM Transactions on Graphics, 36, 1–17 (2017). http://doi.org/10.1145/3072959.3073672