視線情報と美的評価則に基づく画像系列要約に関する研究利用統計を見る

(1)

氏名澤田友哉博士の専攻分野の名称博士（情報科学）学位記番号医工博甲第３１５号学位授与年月日平成２７年３月１８日学位授与の要件学位規則第４条第１項該当専攻名人間環境医工学専攻学位論文題目視線情報と美的評価則に基づく画像系列要約に関する研究論文審査委員主査教授茅暁陽教授岩沼宏治教授大渕竜太郎准教授小俣昌樹准教授木下雄一朗早稲田大学教授森島繁生

学位論文内容の要旨

近年，スマートフォンに代表されるディジタルデバイスの普及とソフトウェアの充実によって，エンドユーザが多量のデータを使用する場面が増えている．例えば，インターネット上の映像コンテンツの視聴や日常的に撮影する写真を考えてみても，解像度はますます上がり，利便性が日増しに高まってきている．一方で，高解像度のデータを利用する環境が整いこれが広まったことは，社会におけるデータ量が爆発することを意味する．すなわち，今後も増加し続ける映像や写真などのマルチメディアコンテンツに対して，重要な情報を要約する手段が求められている．特に，近年のインターネットショッピングにおける利用者の購買履歴に基づく購買予測・促進に代表されるように，利用者個々の興味・嗜好を把握し，利用者の感性を反映させるような要約技術を創造できれば，個々のニーズに即した多岐に渡るサービスが実現される．本研究では，映像や画像などのコンテンツにおける要約のための手法を提案する．要約技術は，データ中のどこが重要かを定める“情報の抽出”という意味合いだけでなく，それを適切に加工して利用者に提供する“要約結果の提示”という意味合いまで含めることができる．これを踏まえて，重要情報の抽出から加工結果の提示までを一貫して行うシステムを提案する．特に，本研究において着目したのは人の興味を要約結果にいかにして反映させるかという点である．要約技術の実現のためには時間的・空間的・時空間的な重要箇所を推定することが必要であるが，本研究では“視線”を用いてこの解決を図る．まず，映像コンテン

(2)

ツの要約に関しては鑑賞者と映像内のシーンとのインタラクションに着目し，鑑賞者の視線情報から特異なパターンを抽出しこれを鑑賞者の興味の変化ととらえて自動でコミック調の編集を行う．また，静止画の要約に関しては写真撮影を対象として，構図を決める際の撮影者と撮影シーンとのインタラクションに注目し，その過程から撮影者の意図を推定することにより自動でベストショットを撮影する．こうした人の自然な振る舞いから意味のある情報を抽出し，またそれを適切に整形して提示することで，情報の抽出から要約結果の提示まで一貫して提供するシステムの開発を目指す．はじめに，映像コンテンツから鑑賞者の視線情報を利用して自動でコミック調画像に合成する技術を提案する．フィルムコミックとは，映像コンテンツをコミック調画像に変換したものである．従来，フィルムコミックの作成のためには，専門家が人手で以下の処理を行っていた．重要フレームの選出は絵コンテに示されることが多いようにシーンの内容をよく描画するように選ばなくてはならず，またフレーム画像の加工やセリフの配置は画像内における重要箇所を切り取ったり隠したりしてしまわないようにして実現しなくてはならない．さらに，レイアウト設計はシーンの内容をよりわかりやすく整形する必要がある．しかし，重要フレームや重要箇所の検出には，映像作品そのものの理解が不可欠であり，画像処理技術のみからこれを実現することは難しい．そこで本研究では，人の興味を時空間的に抽出することで，以下の処理の自動化を実現した．1)映像コンテンツから人の興味を引くような，重要なフレーム画像の選出．2)見栄えの良さだけでなく，内容が把握しやすいレイアウト設計．3)重要箇所を切り取らず，元の構図を維持したトリミング．4) 重要箇所を隠さず，読みやすく加工したセリフ配置．人の興味を捉えるための手段として，本研究では視線情報を利用した．これによって，実際の人の興味を直接反映するようなコミックの自動生成を実現した．次に，撮影時におけるユーザのカメラ移動から最適構図を探索し，オートフレーミングを実現する手法を提案する．オートフレーミングとは，被写体を発見し被写体位置が最適な位置となる構図を求めて自動で撮影する技術のことを指す．一般的に写真の構図を体得するには，長い経験とセンスが必要であり素人にとっては構図の良い写真を撮ることは難しい．本研究ではシステム側が自動で良い構図で切り取ることで素人でも構図の良い写真が撮れることを目指し，オートフレーミングの実現に際して以下の手法を提案する．まず，予備実験の結果，撮影者は写真を撮る前に構図を決めかねてカメラを移動させることがわかった．そこで，1)このときのカメラ移動から，撮影者が何を撮ろうとしているのか，その主観的な被写体の推定を行う．そして，2)被写体位置が構図として良いかを調べるために三分割法というカメラ撮影におけるヒューリスティックなルールを用いて客観的に美観評価を行う．撮影者が何を撮りたいのかを知るには撮影者の興味の推定に踏み込む必要がある．撮影者の興味を捉えるための手段として，本研究ではユーザのカメラ移動を利用した．これによって，撮影者の意図を反映した被写体が美しい構図でオートフレーミングされるようにした．最後に，静止画や動画において人の目を引く箇所を画像処理的に求める顕著性マップの要素として，特に写真工学で用いられるリーディングライン効果を付与した顕著性マップの作成技術を提案する．リーディングライン効果とは，空間上に直線成分や線群が一点に収束するように構成された場面では，人の目はリーディングラインの収束先に引かれやすいという経験則である．本研究では，検証実験により視線はリーディングラインの収束先

(3)

に誘導されることが示されたため，リーディングラインを含む画像において既存の顕著性マップとリーディングラインの重みとを視線情報を用いて学習して求め，リーディングラインを付与した顕著性マップの実現に成功した．以上のように，本研究では映像コンテンツおよび写真における要約技術に関するプロセスを確立し，人の興味を反映した要約技法を提案した．人の興味の推定は，実際のコンテンツを視聴中の鑑賞者の視線や，撮影中のユーザのカメラ移動に基づくものであり，こうした人の自然な振る舞いからユーザに負荷なく，意味のある情報を抽出でき，かつそれを整形して提示することで，情報の抽出から要約結果の提示まで一貫して提供するシステムの開発に成功した．今後もますます増大するコンテンツに対して，人の興味や意図を反映した要約技術は近い将来必ず必要となってくる．その時，本研究で提案した人の自然な振る舞いから内容理解に踏み込む研究が大きく貢献するものであると確信する．

論文審査結果の要旨

本論文は，人間の内在する興味を取り入れながら映像における時間的・空間的・時空間的に重要箇所を定め，要約結果として適切に加工して提示するシステムの開発を行ったものである．3 つの異なる要約形式を取るアプリケーションは，一見すると異なる研究に思われるが，共通して“視線”という概念を取り入れることで，人の興味や意図を反映する要約技術をまとめている．研究背景として述べられているように，近年の情報社会の発展は目覚ましく，世の中に存在する動画や静止画は高画質の一途をたどっている．そこで，要約技術による重要箇所の推定が社会的に重要な課題となりつつある．これまでの研究では，画像処理技術のみで自動的な要約技術を成功させたものがあるが，本研究のように，人の生体情報を利用しつつ要約技術を行う研究は少なく，人の興味をいかにして推定するかという点およびそれをいかにして要約技術に結び付けるかという2 点において，新規性が認められる．まず，フィルムコミックの自動生成に関する研究では，生体情報として鑑賞者の視線を用いることで鑑賞者の時空間的な興味の抽出手法および要約結果としてコミック形式での提示方法を提案している．鑑賞者の興味を視線から推定するために，事前実験として映像コンテンツを鑑賞者に見せたときの振る舞いと視線の関係を調査している．その結果，実際のコミックで重要視されるシーンにおける複数人の鑑賞者の視線移動のパターンを抽出することに成功している．また，鑑賞者の視線が置かれている位置を空間的重要箇所として利用することで，適切なコミック調での整形を実現した．この研究における提案手法の有効性は，評価実験によって十分に検証されている．次に，オートレイアウトに関する研究では，カメラのファインダーを覗いているユーザの視線をその瞬間の撮像画像で代用することにより，ユーザのカメラ移動中の動画からユーザの時空間的な興味の抽出手法および要約結果として最適構図での自動撮影技術を提案している．ユーザの主観的な興味対象である被写体を推定するために，事前実験としてユーザが撮影するときのカメラ移動の振る舞いと被写体の関係を調査している．また，良い構図で自動撮影するために，ユーザの主観性だけでなく客観的な美観を考慮して最適位置

(4)

の探索を試みている．様々なシチュエーションにおいて実験された結果，いずれもユーザの意図する被写体対象を高い精度で推定できていることが示されている．最後に，リーディングラインを付与した顕著性マップの作成に関する研究では，これまでに認知科学的には知られていたリーディングライン効果を新たな空間バイアスとして顕著性マップに組み込む手法を提案している．この研究では，統合の際に鑑賞者の実際の視線情報を利用して顕著性マップに統合する手法が述べられている．交差検定の結果，いずれもリーディングラインの収束先に重みが置かれる結果となり，新たな顕著性マップとして意義が認められる．また，ベンチマークテストの結果も既存手法に比べて改善が見られ提案手法の優位性を十分に示している．本論文による研究に関し，博士論文審査要綱に基づき最終試験を実施した．提出された博士論文および公聴会における研究論文発表の内容に関連し，研究背景，概念規定，評価実験の妥当性と信頼性，論文構成，情報学的価値などに関する質疑を行い，論文提出者の見識を問うた．その結果，試問の内容において妥当な解答が得られたこと，並びに発表論文の基準を満たすものであったことから，博士論文審査委員会は博士に相応しい学力と見識を有するものとして認め，最終試験を合格とした．

視線情報と美的評価則に基づく画像系列要約に関する研究 利用統計を見る

学位論文内容の要旨

論文審査結果の要旨

視線情報と美的評価則に基づく画像系列要約に関する研究利用統計を見る