質感認知研究のための実験手法：テクスチャ合成による3次元形状の生成

(1)

DOI: http://doi.org/10.14947/psychono.36.6

質感認知研究のための実験手法：テクスチャ合成による3次元形状の生成

1

澤山正貴

a,

*・岡部誠

b

_{・西田眞也}

a

_{・土橋宜典}

c, d a_{日本電信電話株式会社 NTTコミュニケーション科学基礎研究所} b_{静岡大学工学部} c_{北海道大学大学院情報科学研究科} d_{ドワンゴ株式会社 UEIリサーチ}

Generating three-dimensional shapes by using texture synthesis

Masataka Sawayama

a,

_{*, Makoto Okabe}

b

_{, Shin’}

_{ya Nishida}

a

_{, and Yoshinori Dobashi}

c, d a_{NTT Communication Science Laboratories, Nippon Telegraph and Telephone Corporation}

b_{Faculty of Engineering, Shizuoka University}

c_{Graduate School of Information Science and Technology, Hokkaido University} d_{UEI Research, DWANGO Co., Ltd.}

This research note reviews experimental methods to elucidate the visual processing underlying material per-ception, and considers how to generate experimental stimuli of three-dimensional shapes for the experiments. For generation of a computer graphics image of a three-dimensional object, it has been widely known that its shape fea-tures can affect the material appearance of the object. However, it is not established how to systematically control the shape features to investigate the effect. Here we suggest to utilize texture synthesis algorithms. Specifically, we used a height map of a three-dimensional object as a source image, and synthesized a novel height map by using a texture synthesis algorithm. We tested three algorithms to generate the height maps; i） synthesis based on image statistics, ii） example-based synthesis, and iii） synthesis using a convolutional neural network. We discuss how effective the texture synthesis algorithms are to investigate the effect of the shape features on the material perception.

Keywords: material perception, three-dimensional shape, texture synthesis 1. 質感認知研究における実験手法 ヒトは，物体について，それがどのような物性を持っているのか（ツルツルしている・柔らかい），どういう状態にあるのか（乾燥している・濡れている・新鮮である），あるいは，どのような材質でできた物体なのか（金属・プラスチック）などといった性質を，見ることだけからある程度認知することができる。これを視覚的質感認知と呼ぶ。古典的な実験心理学研究においては，単純な幾何学刺激や縞刺激が実験刺激として用いられてきたために，単純な刺激では表現できない質感認知の情報処理過程については見落とされてきた。近年，こうした問題意識のもと，質感認知情報処理に関する研究が世界的に進められている（reviewed by Adelson, 2001; Fleming, 2014; 小松，2016）。質感認知を実験的に研究することのひとつの難しさは，リッチな質感を感じることができる複雑な対象を実験刺激として扱わなければならないことにある。複雑な刺激対象を観察する場合にのみ質感を感じる場合も多く，心理学実験で扱いやすいように刺激の次元を落とす操作をすることが（例えば，物体画像の色の分布を単一の平均色度に置き換える操作など），対象の質感そのものを失わせてしまうこともある。質感認知研究では，実験刺激の生成方法や実験パラダイムについてもまだ模索的であり，先行研究では様々な手法が試されている。

Laboratories, Nippon Telegraph and Telephone Corporation, 3–1 Morinosato Wakamiya, Atsugi, 243– 0198, Japan

E-mail: [email protected]

1 _{本研究は JSPS科研費JP15H05915, JP15H05924の助成} を受けたものです。

(2)

これまでの質感認知研究における実験刺激の生成方法として，広く用いられているのが，コンピュータ・グラ

フィックス（CG）を用いた画像生成である（Fleming,

Dror, & Adelson, 2003; Kim, Marlow, & Anderson, 2012; Motoyoshi, 2010; Nagai et al., 2013; Nishida & Shinya, 1998; Paulun, Schmidt, van Assen, & Fleming, 2017; Sawayama, Nishida, & Shinya, 2017; Schmidt, Paulun, van Assen, & Fleming, 2017; Toscani, Valsecchi, & Gegenfurtner, 2013; van Assen & Fleming, 2016; Vangorp, Barla, & Fleming, 2017; Xiao et al., 2014）。CGを用いると，複雑な物理パラメータを定量的に扱うことができるため，定量的な刺激パラメータの操作を望む心理学実験と相性が良い。古くは， CG特有の非現実的な印象がCGを用いたアプローチの欠点として挙げられることもあったが，近年のCG分野の発展により，最新のCG技術では現実を眼にするのとほぼ色ない刺激画像を作ることも可能になってきている。また，自然物の写真画像を用いた研究（Kawabe, Maruya, & Nishida, 2015; Motoyoshi et al., 2007; Sawayama, Adelson, & Nishida, 2017; Sawayama & Kimura, 2015; Sharan, Liu, Rosenholtz, & Adelson, 2013; Wiebel, Valsecchi, & Gegenfurtner, 2013; Zhang, de Ridder, Fleming, & Pont, 2016）や，初期視覚系が扱う画像特徴をもとに生成したテクスチャ動画像を用いた研究（Freeman & Simoncelli, 2011; Freeman, Ziemba, Heeger, Simoncelli, & Movshon, 2013; Inagaki, Sasaki, Hashimoto, & Ohzawa, 2016; Okazawa, Tajima, & Komatsu, 2015）も行われている。

視覚的な質感，特に反射特性や光沢感，透明度といった物体表面の光学的な特性に由来する質感の認知を研究する際には，物体画像の生成に関わる3つの情報を制御する必要がある。物体の材質特性，物体を照射する照明，そして，物体の形状である。3つの情報が複雑な相互作用をした結果として，質感を生み出す画像が生成される。CG技術を用いた検討のひとつの利点は，これらの情報を独立に操作しながら質感認知実験を行うことができることにある。各情報の操作方法についてはいくつかの文献によって基礎的な解説がなされている（e.g., 向川，2010; 日浦・佐藤，2016）。ここでは物体の形状が及ぼす影響について考える。物体の質感認知がその物体の形状情報によって大きく変化することはいくつかの研究で示されている（Nishida & Shinya, 1998; Ramanarayanan, Ferwerda, Walter, & Bala, 2007; Vangorp, Laurijssen, & Dutré, 2007）。例えば，Nishida & Shinya （1998）では，同じ物理的な光沢性を持つ表面画像の見かけの質感が物理的な形状変動によって大きく変わることを示した。しかし，形状の影響を検討した

研究のほとんどは，単純な周波数ノイズの空間周波数と振幅を操作したものである（Nishida & Shinya, 1998; Ramanarayanan et al., 2007）。自然物体に現れる複雑な形状特徴には，こうした単純なノイズパターンからは生成できないものも多い。そうした複雑な形状特徴は，特に半透明物体や布のような質感をCGで生成する際に見かけの質感に大きく影響することが経験的に知られているが（e.g., Gkioulekas et al., 2013），系統的な検討はされていない。自然物に近い形状モデルを用いた質感認識研究の場合でも，任意に選ばれた数個の形状モデルを用いている（Motoyoshi, 2010; Nagai et al., 2013）。こうした選定によって刺激の多様性を確保することには限界があり，形状特徴のパラメトリックな操作ができないという問題が残る。上述した問題意識のもと，本研究では質感認知への形状情報の影響を調べるために有効な3次元形状の生成手法の可能性を紹介する。以下の項で示すように，テクスチャ合成を利用した3次元形状の生成を行う。生成した 3次元形状に対して，任意の材質を付与して任意の照明下に配置してCG画像を生成することで，様々な質感認知の研究を行うことが可能になる。さらに，形状情報の操作を必要とする様々な心理学実験に有効な手法となりうる可能性を総合考察にて議論する。 2. テクスチャ合成を用いた3次元形状の生成 本研究では，物体画像における形状情報を系統的に操作するために，テクスチャ合成を利用した手法を考察する。テクスチャ合成とは，1枚の元のテクスチャ画像が持つ様々な画像特徴をもとに，その元画像と性質が類似した別のテクスチャ画像を新規に合成する画像処理手法である（Figure 1）。通常，テクスチャ合成は画像を生成するための手法であるが，3次元形状モデルの高低マップを利用することで，形状生成に利用することができる。高低マップとは，ある視点から形状モデルを観察した際の，視点から形状表面までの距離を画像強度の濃淡として示した画像である（e.g., Figure 2左上）。3次元形状モデルの高低マップが得られれば，形状を画像として扱うことができるため，高低マップを入力としてテクスチャ合成をし，新規の形状を得ることができる。画像強度マップを高低マップに対応させるのではなく，勾配のようなほかの形状次元のマップに対応させることも考えられるが，その可能性はここでは検討しない。テクスチャ合成で形状を生成することの利点として，現実に存在する自然な形状特徴の影響を検討することがある程度可能となることが挙げられる。特に，半透明物

(3)

体や布のように，光学的に複雑な材質の質感をCGで生成する際，自然物体に現れるような複雑な形状特徴が見かけの質感に影響することは経験的に知られているが

（e.g., Gkioulekas et al., 2013），具体的に何の形状特徴が質感認知に決定的であるかはいまだ不明瞭である。特定の質感に対して，リッチな質感を表現することができる形 Figure 1. Synthesized images for a pebble image. The original image （top left） was synthesized by using the algorithms of

Heeger & Bergen （1995）（top center） and Portilla & Simoncelli （2000）（top right）. The power spectra of each image were shown as in the legend （bottom）.

Figure 2. Synthesized images for a height map （top）, and rendered images based on the original and synthesized height maps （bottom）. The two algorithms of Heeger & Bergen （1995）（top center） and Portilla & Simoncelli （2000）（top right） were applied to the original height map which consisted of scattered coffee beans （top left）. The rendered images were gen-erated with a glass material implemeted in the mitsuba renderer （Jakob, 2010）. The entire structure of the geometry model is shown in Figure 3a.

(4)

状モデルがすでにある場合，その形状特徴を部分的に再現するテクスチャ合成手法を利用することで，どのような形状特徴が見かけの質感に重要かを探ることができる。高低マップを用いたテクスチャの合成は，元の形状と特定の幾何学的な特徴を共有した形状を系統的に生成することができる。どのような特徴を共有するのかは，合成法に依存する。できあがった形状は，もとの形状や，同じ方法で生成された形状と，知覚的に区別できない刺激（いわゆるメタマー）になっているわけではない。しかし，物理的な形状特徴の合わせ込みがある種の知覚的な類似性を生むことは期待できる。既存の形状生成手法に対するテクスチャ合成法のひとつのメリットは，単純な周波数ノイズによる形状生成手法で表現できない形状特徴を系統的に生成できることにある。一方，考察で詳しく議論するように，生成した形状を複雑な環境下で CG画像生成をする場合に，テクスチャ合成アルゴリズムで制御していない変数による意図しない知覚的な形状変化が結果に大きく影響する可能性がある。そのため，操作した形状特徴が質感認知に重要かを知るためには多数の刺激を生成して，実験することが必要となる。以下では，画像の強度値を入力値としたテクスチャ合成手法についての先行研究の歴史を解説し，その手法を高低マップに適用した例を示している。また，各手法を用いた際の著者らの環境での実行速度を参考として Table 1に載せている。 2.1 画像統計量に基づく合成手法を利用した形状生成 ヒトのテクスチャ知覚の研究とテクスチャ合成手法の研究は相補的に発展している。ヒトはある種のテクスチャの等質性を判断する際，それほど複雑な画像特徴に頼っていないことが示されており（e.g., Julesz, 1962），その人間の特性をうまく利用して元画像の画像統計量を部分的に保ったテクスチャ合成手法が考案されてきた。例

えば，Heeger & Bergen （1995）の手法では，様々な方位・周波数をもつ周波数フィルタによって元画像を分解し，各サブバンド成分のヒストグラムと同じ統計量を持つテクスチャを新規ノイズから生成する。均質な石膏表面のようなテクスチャを生成するうえでは，この手法は有効であるが，空間的に規則的なパターンを持つものをこの手法で合成することはできない（Figure 1, 中央上）。一方で，Portilla & Simoncelli （2000）によるテクスチャ合成の手法では，Heeger & Bergen （1995）の手法と同様に周波数フィルタによって元画像を分解するが，より元画像に近い特徴を保持している。具体的には，各サブバンド成分のヒストグラム統計量を保つだけでなく，近傍の周波数成分や近傍の方位成分との相関などの統計量を保った合成を行う。これらの統計量を保持することで，Heeger & Bergen （1995）の手法よりも複雑なパターンの合成を行うことができる。さらに，これらの統計量は視覚情報処理系におけるV2野で処理され得ることが示されている（Freeman et al., 2013）。Portilla & Simoncelliの手法で合成をした場合，より複雑なパターンの合成ができるものの，中心視で観察すると元画像とは異なるテクスチャであることは判断できる場合が多い（Freeman & Simoncelli, 2011）（Figure 1, 右上）。どちらの手法で合成したとしても，画像のパワースペクトルは元画像と同様となる（Figure 1, 下）。Portilla & Simoncelli （2000）のテクスチャ合成手法に関しては，手法を考案した著者の Webページにてソースコードが公開されている（http://www.cns. nyu.edu/~lcv/texture/）。

Figure 2では，画像統計量に基づくテクスチャ合成手法を用いて，高低マップを元画像に新規の形状を生成し，CG画像を生成した例を示している。Heeger & Bergen （1995）では，画像を入力とした場合と同様に，周波数

フィルタによる各サブバンド成分の係数ヒストグラムを制約に用いるが，高低マップを用いた場合，この制約は幾何学的には形状の曲率分布を制約していることを意味 Table 1.

(5)

する。さらに，Portilla & Simoncelli （2000）では，曲率の周波数間での相関や空間的な相関など，より幾何学的に強い制約を与えている。この手法で失われる幾何学的な情報については，空間位置・周波数・方位で隣り合っていない成分の相互作用，3項以上の高次の相互作用が挙げられる。これらの手法を用いることで，単純な周波数ノイズから生成した形状を用いる場合よりも形状の構造が保たれた刺激を用いた検討が可能になるというメリットがある。しかし，Portilla & Simoncelliの手法でも，元の自然画像の局所的な特徴を完全に再現できるわけではなく，高低マップに適用した場合に，元形状と大きく異なるものが生成されやすいというデメリットがある。 2.2 例示に基づく合成手法（example-based synthesis） を利用した形状生成ノイズ画像の画像統計量を元画像のものと部分的にえることでテクスチャを合成する手法が開発される一方で，元画像内のピクセル，もしくは局所的なパッチ領域を，直接的に合成に用いる手法も考案されている（Efros & Freeman, 2001; Efros & Leung, 1999）。例えば，Efros & Leung （1999）では，元画像から無作為に抽出した局所領域を合成画像の初期値とし，合成画像の各ピクセルについて，そのピクセルの近傍パターン（関心領域）と類似した領域を元画像内で探索する。そして，元画像内で発見された領域の中でひとつの類似領域の中心ピクセルを合成画像へ新規に配置することで，徐々に領域を空間的に広げることを行う。重要な特色として，画像統計量に基づく合成とは異なり，元画像に存在する点を例示として合成画像に用いるので，局所的には元画像と同じパターンが合成画像に現れることになる。Efros & Leung （1999）の手法では，ピクセルごとに計算を行うために

計算負荷が大きくなる。一方，Efros & Freeman （2001）では，同じく例示に基づくテクスチャ合成の考えに基づくが，ピクセルごとの計算ではなく，元画像から局所的に切り出したパッチ領域を，空間的な輝度分布の連続性を保つように合成画像に配置することでテクスチャ合成を行う。

Figure 3には，Efros & Freeman （2001）の手法で合成した高低マップの例を示している。

画像統計量に基づく合成手法とは異なり，合成画像には元画像の局所的なパーツがそのまま現れる。そのため，Portilla & Simoncelliの手法では捉えきれない特定の局所的な形状特徴が質感認知に及ぼす影響を検討するうえでこの手法は有効となる。一方で，Figure 3（b）の Buddhaの高低マップのように，パターンの繰り返しが少ない元画像に対しては，元形状とは大きく異なる形状が生成される。また，例示に基づく合成手法のひとつとして，Kwatra,

Essa, Bobick, & Kwatra （2005）では，合成画像内の各ピクセルの近傍パターンと，元画像内のあるピクセルの近傍パターンとの相違が最小となるような最適化問題を解く。この最適化手法で設定するパラメータは 2種類あり，ひとつは画像ピラミッドの段数で，もうひとつはパッチサイズである。最適化手法では，合成画像と元画像との相違を複数の画像スケールで最小化する。画像ピラミッドの段数パラメータは画像スケールに関係するもので，どのくらい縮小した画像から合成を始めるかを意味している。つまり，段数パラメータが4ならば，初めに元画像の1/8の画像サイズで合成を行い，そのスケールでの合成が完了したのち，画像を1/4にアップサンプリングして再度そのスケールで合成を行い，この手順を 1/1 スケールになるまで繰り返す。パッチサイズパラメータは，各スケールで最適化をする際の局所的な関心領域のサイズを意味する。つまり，合成画像内の各点の近傍パターンをどれくらい広い範囲に設定するかを決めるパラメータである。 Figure 4には，様々なパラメータの最適化手法で入力画像を合成した結果を示す。広い関心領域で，ピラミッドの段数が大きい場合には，複雑な形状であっても元画像の高低マップの持つ構造が十分に保たれて，空間的な輝度分布に不自然さのない合成画像が生成される。パラメータ設定によって，元画像の局所的な形状構造をどの程度のサイズで保持するかを調整できるため，質感認知に形状情報が及ぼす影響を系統的に検討することができる。1枚の元形状から多様な形状を多数生成することが可能であるため，機械学習を利用した質感認知研究のように，大規模な学習刺激を必要とするアプローチと相性が良いだろう。以上のように，Figure 3と4の例示的な合成手法を高低マップに適用した特性しては，パッチ単位で幾何学的な特徴をなるべくそのまま再現しようとしていることが挙げられる。また，この手法によって失われる幾何学的特徴としては，パッチサイズを超えたスケールの構造が挙げられる。 2.3 畳み込みニューラルネット（CNN）を用いたテク スチャ合成手法による形状生成画像統計量に基づくテクスチャ合成では，Portilla & Simoncelli （2000）の手法であっても，中心視で観察すると合成画像は元画像とは明らかに異なるテクスチャであ

(6)

Figure 3. Synthesized images for height maps. The algorithm of Efros & Freeman （2001） was applied to the two original im-ages: （a） Coffee beans and （b） Happy Buddha （http://graphics.stanford.edu/data/3Dscanrep/）. The entire structure of each geometry model is shown in the right side.

ることが容易に判断できる。しかし，近年報告されている畳み込みニューラルネット（CNN）を用いたテクスチャ合成手法（Gatys, Ecker, & Bethge, 2015）を用いると，画像統計量に基づくテクスチャ合成であっても複雑なパターンの生成が可能となる。この手法では，一般物体認識を学習したニューラルネットを利用してテクスチャ合成を行う。学習済みネットワークに元画像を認識させた際の各層のユニットの応答と同じ応答が得られる合成画像を，ノイズ画像から生成する。ニューラルネット内のどの層の特徴と合わせるかによって仕上がる合成画像の質は変わる。例えば，一般物体認識を学習したネットワークであるVGG-19における浅い層（conv1_1）の応答だけを合わせると（Figure 5, 上中央），元画像の空間的な構造はあまり保たれない出力となる。一方で，より深い層（pool 4）のユニットの応答まで元画像と合わせると（Figure 5, 上右），元画像の複雑な空間特徴が保たれた画像が生成される。Figure 5では，これらの複雑性の異なる形状を用いて，布素材のレンダリングを行った。浅い層の応答だけ合わせて生成した形状の布の質感は元の質感と大きく異なるが（Figure 5, 下中央），深い層の

(7)

応答まで合わせて生成した形状の布の質感は元の質感と類似していることが見て取れる（Figure 5, 下右）。元の物体が持つ形状特徴が質感認知に及ぼす影響を段階的に検討することが可能になるというメリットがこの手法にはある。一方で，CNNの第1層のユニットは様々な周波数の方位フィルタのような応答を示すものが多いとは言え，各層で保持している幾何学的な特徴が何かは不明瞭なので，段階的に操作した途中の層で何の情報量を保持したことになるのかがわからないというデメリットもある。そのため，何の形状特徴が質感認知に重要かを解析的に調べるアプローチよりは，この手法を用いて大規模な数の刺激を作成して観察者データを測定し，データ駆動的に質感認知を調べる方法がこの手法では有効であろう。また，他の合成手法と比較して一枚の合成画像を生成するのにある程度時間がかかるというデメリットもある。Gatys et al. （2015）のテクスチャ合成の手法のソースコードは，手法を提案した著者の Github ページで公開されている（https://github.com/leongatys/ DeepTextures）。

Figure 4. Synthesized images for a height map. The algorithm of Kwatra et al. （2005） was applied to the original images. Several parameters were used as shown in the legend.

Figure 5. Synthesized images for a height map by using the algorithm of Gatys et al. （2015）. Different processing stages in the VGG-19 network were utilized when synthesizing the original height map. These height maps were rendered with a fab-ric material （charmeuse） by using a method of Irawan & Marschner （2012）.

(8)

3. 考 察

本研究では，様々なテクスチャ合成手法を用いた3次元形状の生成手法について検討した。画像統計量に基づく合成手法では，同じ元画像であっても用いる合成手法によって合成画像で保持される画像統計量は異なる。 Heeger & Bergen （1995）の手法と Portilla & Simoncelli （2000）の手法との比較（Figure 2）や，CNNの手法における層間の比較（Figure 5）のように，保持する統計量が異なる形状を用いることで，詳細に複雑性を操作した実験が可能となると考えられる。中間層で何の特徴が処理されているかが不明瞭な CNNを用いた手法の場合には特に，少ない数の刺激だけでは何の形状特徴が質感認知に寄与しているかを特定することが難しくなる。しかし，テクスチャ合成による形状生成は多様な形状を大量に生成することが可能であるため，大規模な形状刺激を用いた刺激駆動型のアプローチを行うことがその問題の対策となるだろう。特筆すべき点として，Figures 2, 5で示したように，見かけの質感は複雑な形状情報によって大きく影響を受けていることが見て取れ，この方向の検討が質感認知機構の理解を進めることに貢献することが期待される。例示に基づく合成手法については，合成画像内の局所的な関心領域が元画像のものと同様になるように合成するため，局所的には元画像と同じパターンが合成画像に現れる。そのため，心理学実験で検討したい形状特徴を含んだ高低マップをあらかじめ系統的に用意することで，質感認知に対する形状情報の影響を実験的に調べることができるだろう。例えば，元画像として形状表面に付与する傷の画像を用意することで，その傷を3次元形状変調として任意の形状モデルに与えることもできるため，形状表面の微細な傷が見かけの質感に及ぼす影響を検討することも可能である。形状生成にテクスチャ合成を用いることの利点として，物体カテゴリのような物体の意味情報と切り離した質感認知の検討が可能となることが挙げられる。近年の CNNを用いた手法であっても，テクスチャ合成をすると，元画像の意味的な情報が失われた画像（つまり，合成画像が“ブッダ”であるということを認識できない画像）が生成される（Figure 5, 右上）。自然物体の意味カテゴリは，質感を一意に定めてしまう場合もある。テクスチャ合成を用いることで，自然物体のような複雑な形状を用いつつ，意味情報の影響を排除することが可能となる。次に，高低マップを入力値としてテクスチャ合成を行った場合に，元形状と生成形状との間で何の特徴の等価性が満たされているかを考察する。画像を入力とする場合でも高低マップを入力とする場合でも，テクスチャ合成が目指すのは何らかの特徴を共有した刺激セットを作ることにある。本手法においては，元形状の幾何学的な特徴を保持した生成を行っており，制御している幾何学的特徴については元形状と生成形状間の幾何学的な等価性が満たされている。一方で，元形状と生成した形状との知覚的な等価性や生成した形状間の知覚的等価性については，現状では不明な点が多い。従来手法のように，画像の強度値を入力値としてテクスチャ合成をした画像が，ヒトにとってどの程度元画像と等価であるかは，近年いくつかの研究で議論されている（Freeman &

Simoncelli, 2011; Freeman et al., 2013）。本手法においても，生成した形状の反射特性を完全拡散反射とし，無限遠光源によって照らし，元形状の場合と同じ位置から観察する場合には，画像の強度値を入力値としてテクスチャ合成をする際と同様に知覚的な等価性が決まることが考えられる。しかし，反射特性や照明特性が複雑な場合，生成された形状が元の形状と同様の相互作用を引き起こす保証はない。複雑な条件下でどのような知覚的な等価性が満たされるかについては，個々の手法で詳細な実験的検討が必要となるだろう。また，テクスチャ合成で制御していない特徴の変動による，意図しない確率的な知覚特徴の類似性変化も生じ得るので，その問題を無視して結果を解釈してはいけない点にも留意しなければならない。この問題のために，出来るだけ多くの刺激バリエーションを作って制御していない成分の効果を打ち消すような努力をし，個別の刺激の分析をすることが重要となるだろう。本研究では主に，視覚心理学実験において，CG画像をモニタ提示する実験状況を想定した手法の提案を行った。しかし，CG画像で3次元形状のモデルを作るということは，3Dプリンタを用いることで，その形状モデルの実物体が出力可能となる。そのため，様々な形状刺激を用いた触覚心理学実験を行う場合にも，この形状生成法は有効だろう。さらに，近年は心理学実験における視覚刺激の操作も，モニタや印刷物を用いたものだけでなく，実物体に対してプロジェクタによる光投影をすることで刺激操作をする実験も行われている（Ho, Iwai, Yoshikawa, Watanabe, & Nishida, 2014; Kawabe, Fukiage, Sawayama, & Nishida, 2016）。テクスチャ合成で生成した実物体形状に対して，プロジェクタによる光投影をすることで，今後，より幅広い心理学実験が可能となるだろう。

(9)

4. まとめ 本研究では，質感認知研究のための実験手法として，テクスチャ合成による3次元形状の生成について考察した。具体的には，画像統計量に基づく合成手法，例示に基づく合成手法，CNNを用いた合成手法による3次元形状の生成例を示した。質感認知のような複雑な認知過程を明らかにするためには，多様な研究分野を融合した包括的なアプローチが有効となる。コンピュータ・グラフィックス分野やコンピュータ・ビジョン分野の研究手法を取り入れた心理学実験が，複雑な認知過程を読み解くために今後さらに必要とされるだろう。引用文献

Adelson, E. H. (2001). On seeing stuff: The perception of materials by humans and machines. In B. E. Rogowitz & T. N. Pappas (Eds.), Proceedings of the SPIE. Volume 4299: Human vision and electronic imaging VI (pp. 1–12). Belling-ham, WA: SPIE.

Efros, A. A., & Freeman, W. T. (2001). Image quilting for tex-ture synthesis and transfer. Proceedings of ACM SIGGRAPH, 341–346.

Efros, A. A., & Leung, T. K. (1999). Texture synthesis by non-parametric sampling. Proceedings of International Confer-ence on Computer Vision (ICCV 99), 2, 1033–1038. Fleming, R. W. (2014). Visual perception of materials and

their properties. Vision Research, 94, 62–75.

Fleming, R. W., Dror, R. O., & Adelson, E. H. (2003). Real-world illumination and the perception of surface reflectance properties. Journal of Vision, 3, 347–368.

Freeman, J., & Simoncelli, E. P. (2011). Metamers of the ven-tral stream. Nature Neuroscience, 14, 1195–1201.

Freeman, J., Ziemba, C. M., Heeger, D. J., Simoncelli, E. P., & Movshon, J. A. (2013). A functional and perceptual signa-ture of the second visual area in primates. Nasigna-ture Neurosci-ence, 16, 974–981.

Gatys, L., Ecker, A. S., & Bethge, M. (2015). Texture synthesis using convolutional neural networks. Advances in Neural Information Processing Systems, 28, 1–9.

Gkioulekas, I., Xiao, B., Zhao, S., Adelson, E. H., Zickler, T., & Bala, K. (2013). Understanding the role of phase function in translucent appearance. ACM Transactions on Graphics (TOG), 32, 147:1–147:19.

Heeger, D. J., & Bergen, J. R. (1995). Pyramid-based texture analysis/synthesis. Proceedings of The 22nd Annual Confer-ence on Computer Graphics and Interactive Techniques, 229– 238, New York: ACM.

日浦慎作・佐藤いまり（2016）．質感を生み出す光と物の性質小松英彦（編）質感の科学知覚・認知メカニズムと分析・表現の技術朝倉書店（出版社） Ho, H. N., Iwai, D., Yoshikawa, Y., Watanabe, J., & Nishida, S.

Y. (2014). Combining colour and temperature: A blue object

is more likely to be judged as warm than a red object. Scien-tific Reports, 4, 5527.

Inagaki, M., Sasaki, K. S., Hashimoto, H., & Ohzawa, I. (2016). Subspace mapping of the three-dimensional spectral recep-tive field of macaque MT neurons. Journal of Neurophysiolo-gy, 116, 784–795.

Irawan, P., & Marschner, S. (2012). Specular reflection from woven cloth. ACM Transactions on Graphics (TOG), 31, 11:1–11:20.

Jakob, W. (2010). Mitsuba physically based renderer. mitsuba-renderer.org.

Julesz, B. (1962). Visual pattern discrimination. IRE Transac-tions on Information Theory, 8, 84–92.

Kawabe, T., Fukiage, T., Sawayama, M., & Nishida, S. Y. (2016). Deformation lamps: a projection technique to make static objects perceptually dynamic. ACM Transactions on Applied Perception (TAP), 13, 10:1–10:17.

Kawabe, T., Maruya, K., & Nishida, S. Y. (2015). Perceptual transparency from image deformation. Proceedings of the National Academy of Sciences, 112, E4620–E4627.

Kim, J., Marlow, P. J., & Anderson, B. L. (2012). The dark side of gloss. Nature Neuroscience, 15, 1590–1595.

Kopf, J., Fu, C.-W., Cohen-Or, D., Deussen, O., Lischinski, D., & Wong, T.-T. (2007). Solid texture synthesis from 2d exem-plars. ACM Transactions on Graphics, 26, 2:1–2:9

Kwatra, V., Essa, I., Bobick, A., & Kwatra, N. (2005). Texture optimization for example-based synthesis. ACM Transac-tions on Graphics (ToG), 24, 795–802.

小松英彦（編）（2016）．質感の科学知覚・認知メカニズムと分析・表現の技術朝倉書店（出版社） Mooney, S. W., & Anderson, B. L. (2014). Specular image

structure modulates the perception of three-dimensional shape. Current Biology, 24, 2737–2742.

Motoyoshi, I. (2010). Highlight-shading relationship as a cue for the perception of translucent and transparent materials. Journal of Vision, 10: 1–11.

Motoyoshi, I., Nishida, S., Sharan, L., & Adelson, E. H. (2007). Image statistics and the perception of surface qualities. Nature, 447, 206–209.

向川康博（2010）．反射・散乱の計測とモデル化情処研報CVIM 172–35.

Nagai, T., Ono, Y., Tani, Y., Koida, K., Kitazaki, M., & Na-kauchi, S. (2013). Image regions contributing to perceptual translucency: A psychophysical reverse-correlation study. i-Perception, 4, 407–428.

Nishida, S., & Shinya, M. (1998). Use of image-based informa-tion in judgments of surface-reflectance properties. Journal of the Optical Society of America A, 15, 2951–2965. Okazawa, G., Tajima, S., & Komatsu, H. (2015). Image

statis-tics underlying natural texture selectivity of neurons in ma-caque V4. Proceedings of the National Academy of Sciences, 112, E351–360.

Paulun, V. C., Schmidt, F., van Assen, J. J. R., & Fleming, R. W. (2017). Shape, motion, and optical cues to stiffness of elastic objects. Journal of Vision, 17, 1–22.

(10)

model based on joint statistics of complex wavelet coeffi-cients. International Journal of Computer Vision, 40, 49–70. Ramanarayanan, G., Ferwerda, J., Walter, B., & Bala, K. (2007).

Visual equivalence: towards a new standard for image fideli-ty. ACM Transactions on Graphics (TOG), 26, 76:1–76:11 Sawayama, M., Adelson, E. H., & Nishida, S. (2017). Visual

wetness perception based on image color statistics. Journal of Vision, 17, 1–24.

Sawayama, M., & Kimura, E. (2015). Stain on texture: Percep-tion of a dark spot having a blurred edge on textured back-grounds. Vision Research, 109, 209–220.

Sawayama, M., Nishida, S., & Shinya, M. (2017). Human per-ception of subresolution fineness of dense textures based on image intensity statistics. Journal of Vision, 17, 1–18. Schmidt, F., Paulun, V. C., van Assen, J. J. R., & Fleming, R. W.

(2017). Inferring the stiffness of unfamiliar objects from op-tical, shape, and motion cues. Journal of Vision, 17, 1–17. Sharan, L., Liu, C., Rosenholtz, R., & Adelson, E. H. (2013).

Recognizing materials using perceptually inspired features. International Journal of Computer Vision, 103, 348–371. Toscani, M., Valsecchi, M., & Gegenfurtner, K. R. (2013).

Optimal sampling of visual information for lightness

judg-ments. Proceedings of the National Academy of Sciences, 110, 11163–11168.

van Assen, J. J. R., & Fleming, R. W. (2016). Influence of opti-cal material properties on the perception of liquids. Journal of Vision, 16, 1–20.

Vangorp, P., Barla, P., & Fleming, R. W. (2017). The perception of hazy gloss. Journal of Vision, 17, 1–17.

Vangorp, P., Laurijssen, J., & Dutré, P. (2007). The influence of shape on the perception of material reflectance. ACM Transactions on Graphics (TOG), 26, 77:1–77:9

Wiebel, C. B., Valsecchi, M., & Gegenfurtner, K. R. (2013). The speed and accuracy of material recognition in natural images. Attention, Perception & Psychophysics, 75, 954–966. Xiao, B., Walter, B., Gkioulekas, I., Zickler, T., Adelson, E., &

Bala, K. (2014). Looking against the light: How perception of translucency depends on lighting direction. Journal of Vi-sion, 14, 1–22.

Zhang, F., de Ridder, H., Fleming, R. W., & Pont, S. (2016). MatMix 1.0: Using optical mixing to probe visual material perception. Journal of Vision, 16, 1–18.

質感認知研究のための実験手法：テクスチャ合成による3次元形状の生成