考察 - 画像認識の適用性向上のための自動知識獲得と並列化に関する研究

性能評価実験の結果からは

，データ転送の性能は十分であるが，データ処理の性能はま

だ必ずしも十分ではないことが分かつた

.

しかしながら

，階層的粗精サーチや階層

的処理，

前フレームの処理結果を利用した処理範囲の限定など

，処理量を削減するための戦略を利

用すれば，モーションキャプチャシステムのような実用的な実時間画像処理アプリケーショ

ンを構築することが可能であることも判明した

.

さらに，近年の

CPU

の性能向上はめざしく

，データ処理の性能は急速に改善されることが期待される

3 特に，性能評価実験の結

3実際，すでに800MHzのPentiumIIIが発表されており，実験時よりも CPUの速度は約2的になっている

果から分かるようにマルチメディア用拡張命令セットを利用することで大幅な高速化が実現されており，このような拡張命令セットを利用することによってもデータ処理の性能は大幅に改善されると見込まれる4 また，多視点画像処理での PCクラスタの優位性は，現在のデータ処理性能でも揺らぐものではなく，木システムの有効性は今後ますます高まっていくと考えられる.

今後の課題としては，

1

台の PCに複数の CPUを塔載していることを利用したデータ処理性能の向上が挙げられる.本システムでは 1台の PCに塔載された 2個の CPUのうち 1 個だけをデータ処理に利用し，もう 1個の CPUはデータ送信にのみ利用している. しか

し

，

4 . 6 . 1

節の性能評価実験からデータ処理能力よりもデータ送信能力に余裕があり，データ送信を行う CPUは休止している時間が長いことが分かった

.そこで，以下の 2

通りの方法によって，両方の CPUをデータ処理に利用し，データ処理性能を向上させることが考えられる

.

1.パイプライン並列処理方式による利用

2

個のCPUを利用してパイプライン並列処理を行う.パイプラインの

2

段目の CPU はデータ処理とデータ送信の両方を行う.データ送信のみを行っていた

2

段目の CPU でデータ処理も行うことになるので，データ処理能力を向上させることができる

2.データ並列処理方式または機能並列処理方式による利用

2個のCPUで同じフレームのデータに対する処理を並列に行い，データ処理時間を短縮する

.データ送信用の

CPUがないため，1個の CPUを塔載した PCを利用す

るときと同様に

(データ処理時間)

+

(データ送信時間)豆

( 1

フレーム時間)

を満たす必要があるが，データ送信時間が短い場合は処理能力を向上させることがでる

.

ただし，パイプライン並列処理方式ではレイテンシが増加するので注意が必要である.方法

1

では，PC内のパイプライン

1

段につき

1

フレーム時間のレイテンシが生じるのでレイテンシは2フレーム時間となり本論文で述べた実装方式と変わらないが，方法 2では， 1

4 P e n t i u m I I I

から導入されたストリーム

SIMD

拡張命令セットを利JrJするようになれば3 さらにデータ処用性能，特に3次元座標計算のような浮動小数点演算性能が大1''日にIt]lj二すると考えられる

フレーム時間内に処理と送信が終了するのでレイテンシを 1フレーム時間に抑えることができる

.1

台の

PC

に

3

個以上の

CPU

を塔載した場合も上記の方法によってデータ処理性能を向上させることができるが，方法

1

では

CPU

の数に比例してレイテンシが大きくなることに注意しなければならない

.

第 5 章

フログラミングツール RPV

5 . 1 目的

一章で述べるプログラミングツーノレ

RPV[40

，

4 1

，

4 2 ]

は分散型並ヂIJ計算機の一種である

PC

クラスタ上の実時間画像処理プログラミングツールで、ある.分散型並列計算機上の汎用的なプログラミングツールとしては，

PVM[30]

と

MP I [ 3 1 ]

がよく知られている.さらに，

分散型並列計算機上の画像処理プログラミンク、、ツールとしては，谷口らの

PRIME[43 ]

，松尼らの

VI08‑III [ 4 4 ]

，

Lucke

凶

a u s

らの研究

[ 4 5 ]

，

Kim

らの研究

[ 4 6 ]

，

Rodin

らの

i R o s [ 4 7 ]

，

8quyres

らの研究

[ 4 8 ]

，

Gennart

らの

C AP[49 ]

など数多く行われている.しかし，これらは実時間画像処理のためのツールで、はないので，第 4章で述べた実時間データ転送機構，同期機構，エラー処理機構が実現されていない.そのため，アプリケーションプログラマがこれらの機能を実現しなければならないが，これはハードウェア

08

ネットワークなど

σ

システムの詳細まで熟知している必要があり非常に困難な作業である.また，

MPl j R T [ 5 0 ]

は

MPI

を基にした実時間並列処理プログラミングツールであるしかし，これは通信の

Qo8(Quality o f 8 e r v i c e )

を確保することに主眼がおかれており，データ処理同期やそのエラー処理は考慮されていない.この点については

I EEE1394

規格

[ 5 1 ]

を利用した実時開通信も同様である.したがって，やはりアプリケーションプログラマが実時間画像処理に必要な機能を実現しなければならないことになる.これに対して，本研究では実時間画像処理に必要な機能をアプリケーションプログラマから隠蔽し，

PC

クラスタ上で実時間画像処理プログラミングを簡便に記述することができるような環境を開発することを目指す.

5 . 2 RPV の概要

RPV

は実時間並列画像処理アプリケーション構築のためのプログラミングツールであり，実時間並列画像処理に必要なデータ転送機構，同期機構，エラー処理機構といった機能を提供するものである.そのため，

RPV

を利用することにより，アプリケーションプログラマは容易に実時間画像処理アプリケーションを構築することができる.このとき，アプリケーションプログラマが記述するのは，

PC

聞のデータフロー情報と各

PC

上で実行れるデータ処理タスクのみである.

RPV

は

C +

十上のクラスライブラリとして実装されており，アプリケーションプログラマは

RPV

が提供するクラス

R P V ̲ C o n n e c t i o n

と関数

R PV ̲ I n v o k e

を利用してそれらを記述する

.

各

PC

ではその

PC

で行うデータ処理タスクに合わせて関数

R P V ̲ I n v o k e

を起動しなければならないので，

M u l t i p l e P r o g r a m s M u l t i p l e Data(MPMD)

モデルによるプログラミングを行うことになる. しかし，

RPV

では

PC

にごとに起動する関数

R P V ̲ I n v o k e

を切り思えることもできるので

( 5 . 4

節参照)，

S i n g l e Program M u l t i p l e Data(SPMD)

モデルによるプログラミングも可能である.

SPMD

モデ、ルによるプログラミングは一つの実行ファイノレしか必要としないので，大規模なシステムになっても実行ファイルの管理が容易であるという不Ij点がある

.

この

RPV

では，以下の手順でモジューノレの生成と初期化が行われる

.

1.クラス

R P V ̲ C o n n e c t i o n

にデータフロー情報を設定する.

2 .

関数

R P V ̲ I n v o k e

が起動される

.

3 .

関数

RPV ̲ I n v o k e

の中でフォークが実行され，

DRM

，

D PM

，

DSM

，

FSM

の各モジュールが生成される

.

各モジュールのデータフローに関する設定を

RPV ̲ Connection

によって初期化する

5 .

データ転送を行う

D SM

と

DRM

の問で必要な情報を交換し，データ転送の準備を行う.

6 . D PM

は前処理関数

p r e ̲ f u n c ( 5 . 4

節参照)を実行する

.

すべての

PC

でこれらの初期化が終了したのち，データ処理が開始される

.以下の節では

クラス

R P V ̲ C o n n e c t i o n

によるデータフロー情報の記述法と関数

R P V ̲ I n v o k e

によるデー

class RPV̲Connection{ int myPC̲no;

char* keyword;

in七 inputYC̲num;

in七*inpu七一PC;

int* inpu七̲da七a̲size;

int inpu七̲fr百四̲num;

ri PC揺:ザ

データ処:Ð t~のキーワード

入力|百JJ~Jデータの数

人ノJr日

J J

別データのl伝送ノ己 PC寄りー

人ノJl ，ïlj~Jデータの人ーきさ

1 1

^口

I

の処既に使川する入ノ

J

[II]月

l

データフレーム数 in七 ou七putYC̲num; 11~1 ノ〕同月!データの数

int* output̲PC;

1 1

¹，ノJ同月

l

データのl伝注先PC寄り‑

in七*outpu七一da七a̲size; ，II~I，ノ7 同月lデータの人-きさ

int ainpl比一PC̲num; 人力非同期データの数

int* ainputYC; 入力非同月

l

データのl伝送冗PCf許庁 int* ainpu七̲da七a̲size; 人ノj非同期データの大きさ

int ainpu七一da七a̲num; 1 rrl[の処sP:に使JlJする人ノJ

J

: f:rJÍ]J~Jデータフレーム数

ln七 connec七YC̲num; 使用する PCの数 int* connec七一PC; 使川する PC若手

U

文I5.

1 :

クラス RPV̲Connection

タ処理タスクの記述法について述べる

.

ドキュメント内画像認識の適用性向上のための自動知識獲得と並列化に関する研究 (ページ 76-81)

考察

，データ転送の性能は十分であるが ，データ処理の性能はま

.

，階層的粗精サーチや階層

，処理量を削減するための戦略を利

.

CPU

，データ処理の性能は急速に改善されることが期待される

1

4 . 6 . 1

.そこで，以下の 2

.

2

2

2

.データ送信用の

+

( 1

.

1

1

1

4 P e n t i u m I I I

SIMD

.1

PC

3

CPU

1

CPU

.

第 5 章

フログラミングツール RPV

5 . 1 目的

RPV[40

4 1

4 2 ]

PC

PVM[30]

MP I [ 3 1 ]

PRIME[43 ]

VI08‑III [ 4 4 ]

Lucke

a u s

[ 4 5 ]

Kim

[ 4 6 ]

Rodin

i R o s [ 4 7 ]

8quyres

[ 4 8 ]

Gennart

C AP[49 ]

08

σ

MPl j R T [ 5 0 ]

MPI

Qo8(Quality o f 8 e r v i c e )

I EEE1394

[ 5 1 ]

PC

5 . 2 RPV の概要

RPV

RPV

PC

PC

RPV

C +

RPV

R P V ̲ C o n n e c t i o n

R PV ̲ I n v o k e

.

PC

PC

R P V ̲ I n v o k e

M u l t i p l e P r o g r a m s M u l t i p l e Data(MPMD)

RPV

PC

R P V ̲ I n v o k e

( 5 . 4

，データ転送の性能は十分であるが，データ処理の性能はま