• 検索結果がありません。

統計的な特徴量に基づく動画像検索手法

N/A
N/A
Protected

Academic year: 2021

シェア "統計的な特徴量に基づく動画像検索手法"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

統計的な特徴量に基づく動画像検索手法

精廬幹人 精廬幹人 精廬幹人 精廬幹人 精廬幹人 橋本周司橋本周司橋本周司橋本周司橋本周司 早稲田大学理工学部 応用物理学科 {mit,shuji}@shalab.phys.waseda.ac.jp

The search method of moving image based on statistical feature.

Mikito Toguro and Shuji Hashimoto

Department of Applied Physics,Waseda University

55N4-10 3-4-1 Ohkubo Shinjuku-ku Tokyo 169-8555 , Japan

1. はじめに

近年、MPEG/JPEG などの規格化やネットワーク技 術の発達や計算機の高速化に伴い大量の画像コンテ ンツが容易に取得できるようになってきた。それに 伴い動画像を対象とした画像検索の重要性が高まっ ている[1] これまでに提案されている動画像検索はシーン チェンジの検出から得られたキーフレームの静止画 検索を基本とするものが多い[2]。これに対しここで は、動画像の持つ統計的な特徴量に基づいて、動画 像をキーとして大量の動画像群から目的のシーンを 検索する新しい動画像検索手法を提案する。

2. 手法

まずここでは動画像全体のことをストリームと呼 び動画像中の一部分をクリップとして呼ぶことにす る。 動画像の情報量は非常に大きなものになるため、 検索の際には情報量をいかに削減した特徴量を得る かが重要である。本手法は情報量の削減のために動 画像が時系列に沿ったデータであることに着目しス トリームの各フレームを粗く分類し、クリップ中の クラス間の遷移の統計的性質を特徴量としている。 具体的には、各フレーム間の画像の差分の総和を 量子化によりクラス分けし、クリップの特徴量はこ のクラス間の時間遷移を有向グラフにしたものを利 用する。クラスの数を とすれば、この有向グラ フは × の隣接行列で表すことができる。そ してクリップ間の類似度を計算するために、この隣 接行列をベクトル表記し、特徴ベクトルとする。ク リップの類似度は検索対象の動画像のストリーム中 のクリップの特徴ベクトルとキークリップの特徴ベ クトルの内積をとって正規化したものを用いた。 2.1 ストリームのクラス列 まず、ストリームのクラス列を得るために動画像 の各フレーム間の差分値を用いてクラス分けする。 このとき時刻 のフレームが属するクラスタ 次の ようにして求めるまず

(

)

∑∑∑

= = −

=

RGB h y w x y x t RGB y x t RGB t

I

I

c

0 0 , , 1 }, { , , }, { :画像の高さ :画像の幅 :時刻 t の の画素値 (1) ただし、 はクリップ中でクラス から への遷 移の回数である。 例えばクラス列が{0,1,2,1,2,1,0} の場合 に は次のようになる。 0 0 .1 0 .2 0 .3 0 .4 0 .5 0 .6 0 .7 0 .8 0 .9 1 0 1 0 0 0 2 0 0 0 3 0 0 0 4 0 0 0 5 0 0 0 6 0 0 0 7 0 0 0 8 0 0 0 9 0 0 0 1 0 0 0 0 図 1 予備実験結果 (3) 0 0 00           = jj j j m m m m M L M O M L として、 を線形量子化し、 個のクラスに分類 する。このクラス分類を順次行いストリームをクラ ス列にする。 2.2 特徴ベクトルの作成 次にクラス列から遷移の有向グラフを表現する隣 接行列 を作成する。 この隣接行列をクリップ毎に作成しクリップ間の 類似度を計算するためにベクトル表記する。これを 特徴ベクトル と呼ぶことにする。 フレーム番号 類似度 (4)           = 0 2 0 2 0 1 0 1 0 M (5) ,…, , ,… ,… ,…, (6) ・ ・ ・ ・ ・ 検索対象の動画像から、先頭を フレームにして、 キーストリーム長分切り出したサンプルクリップの 特徴量ベクトルを キーストリームの特徴量ベク トルを としたときのクリップ間の類似度 をベ クトルの内積を正規化したもの(6)で定義する。 検索では、動画像長を , キーストリーム長を と したときクリップ間の類似度 を から まで シフトしながら計算する。ただし、 である。 検索結果はこの類似度の中で最大の値をとる から 始まるクリップである。

3 実験

3.1 予備実験 まず最初に、以上のような手法が有効に動画像検 索を行えることを確かめるためにランダムに生成し た 10000 フレーム分のクラスタ点列から、5000 フ レーム目から 30 フレームのクラス列をキーとして

3−33

4E-1

情報処理学会第65回全国大会

(2)

図 3. 類似度の高いフレーム 検索実験を行った。この結果を図 1 に示す。ただし とした。 この結果では切り出したクリップ 部以外の部分では類似度が低いことがわかる。 3.2 実際の動画像を用いての検索実験 実際に放送されたニュース番組を利用して、検索 実験を行った。ニュース番組は、ニュース素材とし て、さまざまな場面が映し出されているため、素材 として適切であると考えられる。今回の実験では、 NHK の 7 時のニュースを約 20 分録画しこれに対して 処理を行った。処理の条件を表 1 に示す。 各処理では表 2 の環境を用いた。 MPEG エンコード処理用ハードウェアが搭載され ている Sony VAIO S550 で作成した MPEG ファイルを 特徴量抽出処理機で特徴量抽出処理をした後、検索 処理機においてニュースキャスタが画面に現れてい る 11317 フレーム目から 230 フレームの部分をキー クリップとして切り出し検索処理を行った。 このニュース番組中の類似度の変化を図 2 に示す。 ただしキークリップの位置に縦線を引いてある。 表 2. 処理環境 機 ダ ー コ ン エ SonyVAIOS550 理 処 出 抽 量 徴 特 T A M B I 互換機 , z H M 0 3 3 n o r e l e C メモリ128Mbyte x u n i L : S O 機 理 処 索 検 2 2 X d a p k n i h T M B I m u i t n e P Ⅲ700MHz,メモリ386Mbyte s w o d n i W : S O 3.3 類似度の高いクリップ 次に、類似度の高いクリップがどのようなクリッ プであるかを調べた。 図 3 は図 2 のグラフのうち、類似度が 0.9 以上の ピークを示している部分に関して、初めのフレーム の画像を切り出して並べたものである。各ピークか ら線で示されている画像がそのクリップの先頭の画 像である。 この実験では、ニュースキャスターの上半身が映 し出されているクリップをキーにして検索したわけ であるが、この結果を見る限り、人の上半身が映し 出されているクリップが多く検出されていることが わかる。 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 5000 10000 15000 20000 25000 30000 図 2. ニュース番組中の類似度の変化 フレーム番号 類似度 表 1. 処理の条件 ズ イ サ 像 画 352x240(VideoCD規格) 数 ム ー レ フ 38000[frame](21分6秒) 数 ス ラ ク 10 0 .9 0 .9 2 0 .9 4 0 .9 6 0 .9 8 1 0 5 0 0 0 1 0 0 0 0 1 5 0 0 0 2 0 0 0 0 2 5 0 0 0 3 0 0 0 0 3 5 0 0 0 キークリップ 今回の手法では、フレーム間の画素の差分値でク ラスタリング処理を行い検索しているため、明示的 に画像同士の相関を見ているわけではないが、画像 的に類似したクリップで類似度が高いという結果が 得られた。 3. 4 処理時間 最後に処理時間を表 3 示す。検索のプログラムの 処理の都合上、MPEG ファイルを一度 PNM フォーマッ トに変換をかけているが、処理時間の 88% はこの処 理にかかった時間である。 以上から特徴量抽出処理および検索時間について は実用的な時間内で行うことができることが判る。

4 まとめ

統計的な特徴量に基づいた動画像検索手法を提案 し実際に放送されたニュース画像を用いて有効性を 検討した。類似度の高いクリップの内容から、本手 法の有効性が確認できた。 今回は各フレームの分 類にフレーム間の差分を利用したが、この分類を行 う方法については議論の余地がある。 たとえば MPEG のストリームでは、動き予測ベクトルが得ら れるが、これを利用して動的特徴の分類を行う、ま たは MPEG ストリームのビットレートの変化を元に、 目的とする動画を検索する手法などが考えられてお り、現在検討中である。 参考文献参考文献参考文献参考文献参考文献 [1] “大規模自動装填ロボットによるペタバイト級映像アーカイ ブシステム”, 丹野 義和 , 前原 文雄 , 関谷 里美 , 伊藤 学 , 露峰 浩 , 長谷川 文雄 , 電子情報通信学会誌 Vol.J84-D2 No.6 pp.1102-1111,2001 [2]”動きベクトルと色情報を用いた階層的 MPEG 画像検索”, 大 野 剛宏,青木工太,吉田 俊之,酒井 善則 ,2000 年度映像メディ ア処理シンポジウム講演論文集,2000 表 3. 処理時間 間 時 理 処 2時間1分 (内MPEGデコード処理) 1時間4 分7 (内特徴量抽出処理) 1 分 14 3 秒 ズ イ サ ル イ ァ フ 量 徴 特 75998[Byte] 間 時 索 検 約4秒

3−34

図 3. 類似度の高いフレーム検索実験を行った。この結果を図 1 に示す。ただしとした。 この結果では切り出したクリップ部以外の部分では類似度が低いことがわかる。3.2 実際の動画像を用いての検索実験 実際に放送されたニュース番組を利用して、検索実験を行った。ニュース番組は、ニュース素材として、さまざまな場面が映し出されているため、素材として適切であると考えられる。今回の実験では、NHK の 7 時のニュースを約 20 分録画しこれに対して処理を行った。処理の条件を表 1 に示す。  各処理では表 2 の環

参照

関連したドキュメント

あれば、その逸脱に対しては N400 が惹起され、 ELAN や P600 は惹起しないと 考えられる。もし、シカの認可処理に統語的処理と意味的処理の両方が関わっ

撮影画像(4月12日18時頃撮影) 画像処理後画像 モックアップ試験による映像 CRDレール

竣工予定 2020 年度 処理方法 焼却処理 炉型 キルンストーカ式 処理容量 95t/日(24 時間運転).

震災発生時のがれき処理に関

の会計処理に関する当面の取扱い 第1四半期連結会計期間より,「連結 財務諸表作成における在外子会社の会計

処理処分の流れ図(図 1-1 及び図 1-2)の各項目の処理量は、産業廃棄物・特別管理産業廃 棄物処理計画実施状況報告書(平成

 (所)   1,051     53   4,605     251    5,523    2,197    4,733  機器個数 ..  (個)   3,747    107   11,879     373   15,288    4,120 

都が策定する東京都廃棄物処理計画においても、東京都環境基本計画で掲げる理念 を踏まえ、おおむね 2030(平成