No.9　そもそも視覚の研究はなぜ必要か

(1)

—₈₁—

そもそも視覚の研究はなぜ必要か

西田

眞也

京都大学情報学研究科質問：そもそも視覚の研究はなぜ必要なのか答え：映像技術の革新のため言うまでもないことだが，視覚の研究は知的好奇心を満たすために必要である．視覚研究のどこに惹かれるかに関しては人それぞれであろう．哲学的に今日的な視点で認識論を極めたい，脳の主要な機能である視覚を科学的に理解したい，といったハードな理由から，錯視が面白いとか，映像芸術が好きだとか，ファッションに興味があるとか，といったソフトな理由もあるように思う．いずれにしろ，視覚は多くの研究者を惹きつけてきた研究分野である．しかし，多額の研究資金や，大学の貴重な人事ポストなどのリソースを割いて視覚の研究をする必要がなぜあるのか，そんなことをして何の役に立つのかと，世間や他分野の研究者に迫られれば，視覚研究を正当化する論理は必要になる．電気通信会社の研究所に長らくお世話になったこともあって，私のこの質問に対するデフォルトの答えは，視覚の研究は映像技術の革新のため，というものである．人間のような視覚能力をもつ機械を作ったり，人間が満足できるような映像体験を実現したりするため，視覚研究は必要である．近年，機械の視覚は飛躍的に進歩し，人間に匹敵するような認識パフォーマンスを示し，その一部はスマートフォンなどにも実装されてわれわれの生活を豊かにするに至っている．その驚くべき進歩に，実際人間の視覚研究は大きく貢献してきた．と言いたいところだが，残念ながらそうとは言えない．近年の進歩に大きく貢献した人工神経回路を使った深層学習に関しても，開発の当初において福島邦彦先生のネオコグニトロン1）が一次視覚野の単純細胞と複雑細胞の働きをヒントに作られたという逸話は語られるものの，最近の急激な性能の向上は，計算機パワーの向上とか，巨大なデータベースの出現とか，アルゴリズムの改良とか，人間の脳とは必ずしも関係ない要因によるところが大きい．むしろ，近年の機械認識技術の発展は，新しい人間の視覚情報処理のモデルを提供するという形で，科学的な人間視覚研究に大きく貢献している2）．もっと長いスパンで考えてみても，視覚科学は人工知能研究からいろいろアイデアをもらってきたが，J. J. Gibson3）のような思想的先駆者を除けば，視覚研究が機械認識（人工知能）研究を牽引したと言えるような例はあまりないように思える．1980年代以来，人間視覚研究に大きく影響を与えたD. Marr4）の考えも，当時の機械認識技術のアイデアを下敷きにしたものであった．機械の視覚能力をこれ以上向上させるのに人間の視覚に学ぶべき点は残っていないのではないかという意見すら耳にする今日この頃であるが，まだまだ視覚研究の役割は残っていると私は考えている．ものの認識において人間の知識を集約したビックデータを深層学習で訓練した人工神経回路が人間に匹敵するパフォーマンスを示したと言っても，中身として人間と同じように情報処理しているわけではない．人間が使わないような些末な画像特徴を利用することにより，人間にはできないような弁別はできても，人間なら絶対しない間違いをしたりする．人間に気づかない形で画像操作して機械の認識を騙す方法も

■ 視覚にまつわるFAQ

（VISION Vol. 33, No. 2, 81–82, 2021） DOI: https://doi.org/10.24636/vision.33.2_81

(2)

—₈₂— 知られているし，それを防ぐための方法が盛んに研究されている．しかし，介護ロボットなど，機械が人間と適切にコミュニケーションするためには，それでは困るだろう．機械と人間が同じような認識能力を共有するために，人間の視覚を科学的に理解し，何が技術的に実現されていて，何がされていないかを明らかにすることは，視覚研究の重要な役割だと思っている．また，もう一つの，人間が満足できる映像体験を提供する，という目的に関しては，視覚研究が果たせる役割は多く残されている．VR

(Virtual Reality), AR (Augmented Reality) といった技術では，視覚体験を再現することが求められるが，物理的に正確な再現は簡単では無い．２次元平面のディスプレイにきれいな画を出すだけではなく，あらゆる方向から両方の目に入力される光線パターンを，眼球の位置，方向，調節，瞳孔の状態を考慮して再現することは，技術的に難しいし，コストもかかる．そういうときに，人間の視覚研究の成果を活かして，人間が気づかないところでうまく手を抜いて，比較的簡単な方法で人間が満足できる映像を提示することができる．さらに，物理的には実現不可能な映像提示も視覚特性を利用することが可能になる．手前味噌になるが，数年前にわれわれが開発した Hidden Stereo5）は，視覚研究の成果がうまく活かされた例だと思っている． 3D表示では，右眼と左眼に異なる（奥行きに応じた両眼視差がある）映像を表示する必要がある．左右の画像を同じディスプレイに提示して，時間ずれや偏光を使って眼前の3Dメガネで別々の眼に振り分ける．このメガネがないと，左右の画像が重なって，幾何学的に正しい両眼視差をもった左右画像の場合は，ボケが生じる．しかし，Hidden Stereoの場合は，メガネをかけると3Dが見えるのに，メガネをはずしたときはボケない．これは，人間の両眼視差検出メカニズムが空間周波数のサブバンドごとに空間位相を検出していることを利用している．その視差情報を維持しながら，左右画像を重畳したときにボケのない1枚の画像になるように画像が作ってある．2枚の画は幾何学的には正しくないが，知覚的には問題がない．つまり，人間の視覚をうまく騙している．視覚研究の理解に基づいてこういった技術をどんどん開発していけば，そもそも視覚の研究はなぜ必要か，などという質問をだれからも言われないような状況になるだろう．そういう日が来るように，視覚研究者の皆さん，頑張りましょう．文献

1) K. Fukushima, S. Miyake and T. Ito: Neocognitron: A neural network model for a mechanism of visual pattern recognition. IEEE Transactions on Systems, Man, and Cybernetics SMC-13, 826–834 (1983).

2) D. L. K. Yamins and J. J. DiCarlo: Using goal-driven deep learning models to understand sensory cortex. Nature Neuroscience, 19, 356–_{365 (2016).}

3) J. J. Gibson: The ecological approach to visual perception. Psychology Press, 1979. （生態学的視覚論―ヒトの知覚世界を探る，古崎　敬，古崎愛子，辻敬一郎，村瀬　旻（訳）サイエンス社，₁₉₈₆）．

4) D. Marr: Vision: A computational investigation into the human representation and processing of visual information. W. H. Freeman and Company. 1982. （ビジョン―視覚の計算理論と脳内表現，乾　敏郎，安藤広志（訳）産業図書，1987）．

5) T. Fukiage, T. Kawabe and S. Nishida: Hiding of phase-based stereo disparity for ghost-free viewing without glasses. ACM Transactions on Graphics, 36, 1–_{17 (2017).} http://doi.org/10.1145/3072959.3073672

No.9 そもそも視覚の研究はなぜ必要か

そもそも視覚の研究はなぜ必要か

西田

眞也

■ 視覚にまつわるFAQ

No.9　そもそも視覚の研究はなぜ必要か