第 4 章 集合演算プロセッサ 41
4.7 AI としての活用
プロセッサがASIC化された場合,システムクロックが33MHzと低速であっても,前述した通り 約1万倍もの高速化が見込まれる.比較するCPUが10倍の演算速度であっても約千倍の性能と なり,システムの最適化を図る事によりシステムクロックに比例して性能向上が見込まれる.従っ てこの手法は2次元データのパターンマッチングを高速化するハードウェアとして最適な手段と 考えられる.
表 4.5: ASIC実装による画像パターンマッチング演算性能評価.
方法 文献[104] 文献[105] 本研究
比較対象CPU Intel Core i7 860 ARM Cortex-A9 Intel Core i5-3317U コア 4コア8スレッド 2コア 2コア4スレッド
TDP(参考) 95 W 1.9 W 17 W
最大動作クロック 2.8 GHz 2.0 GHz 1.76 GHz
処理時間 81.676 m秒 2.01 秒 22 m秒
提案ハードウエア Xilinx Virtex-6 FPGA Xilinx Zynq-7000 FPGA ASIC システムクロック 280.004 MHz 25 MHz 33 MHz
処理時間 0.234 m秒 約 0.43 秒 2.10 µ秒
速度倍率 約349倍 約5倍 約10,476倍
この処理をハードウェア化する事により1/10,000(1µ秒)に短縮出来れば,10万回で10秒程 度で最適化テンプレートパターンを求める事が出来る.得られた最適化テンプレートパターンを 利用する場合,回転とスケーリングに関して考慮する必要がある.多少の回転やスケーリングで あれば,位置に領域を持たせた曖昧なテンプレートで吸収出来るが,曖昧許容範囲を超えた回転 やスケーリングが見込まれる場合には,回転やスケーリングに対応したテンプレートパターンを 複数用意し繰り返しパターンマッチングをする必要がある.
ルールベースのパターンマッチングの問題点は人間の関与の度合いが高い事であるが,認識精 度の高いテンプレートが一度完成すれば,集合演算プロセッサとこれを駆動するCPUのみの単純 なシステムが超高速化される.以上が新しいルールベースによる「テンプレートパターンマッチ ング」である.
4.7.2 網羅的テンプレートパターンマッチング
以上説明のようにルールベースのパターンマッチングは課題が少なくない.以下に現在研究中 の新しい考え方のパターンマッチングについて説明する.動画を含む画像認識技術の最も困難な ところは新しい画像,与えられた画像の中に何が存在するかコンピュータには全く分からない事 である.以下に集合演算の高速性を利用した,新しい考えのパターンマッチングについて示す.
図4.27は画像の色彩の特徴を検出する網羅的パターンを示す.図4.26に示す局部のテンプレー トパターンのE1,E2,E3,E4の4つのポイントに,図4.4で説明の「黒っぽい」,「赤っぽい」な ど8種類の網羅的な色を与えた場合の組み合わせは,8×8×8×8=4,096(4K)通りである.
図 4.27: 網羅的色彩パターン.
図4.28は画像の領域の特徴を検出する網羅的パターンを示す.図に示すように,画像の中には 特定の領域(セグメント)を持つものが多い.この性質を利用したのが領域パターンである.
本例では,カラー画像の色128種類と16種類の領域形状の組み合わせ2K種類の網羅的なパター ンとなっている.
図 4.28: 網羅的領域パターン.
図4.29は画像の形状の特徴を検出する網羅的パターンを示す.図に示すように,画像の中には 特定の形状を持つものが多い.この性質を利用したのが形状パターンである.本例では,グレー スケール画像の諧調4種類と128種類の形状と4種類のサイズの組み合わせ2K種類の網羅的なパ ターンとなっている.
図 4.29: 網羅的形状パターン.
このテンプレートパターンは人間がいちいち決めたパターンではなく,機械的に作成する事が 出来るテンプレートパターンである.これらの網羅的なパターンの1回のパターンマッチングを 数µ秒で実行する事により,動画1フレーム期間にすべての網羅的テンプレートパターンマッチ ングを実行し, 1枚の画像が有す多様な画像的な特徴を自動的に検出する事が出来る.検出した特 徴をデータベース化する事により,汎用の物体認識に応用する事が考えられる.
またこれらの網羅的なパターンマッチングは,画像の中に存在する特徴を検出するためのフィ ルタ機能として利用する事が出来る. 例えば動画の中から赤いリンゴが存在する画像フレームを探 す場合,ある一定以上の赤の領域を持った画像フレームでなければリンゴの対象外の画像フレー ムであり,ある一定の赤の領域を検出出来れば,より詳しく認識させるためのパターンを与えて 精度の高い認識を行う事が出来る. 以上説明の網羅的なパターンマッチングは,集合演算プロセッ サの応用の一例を示すものであり,新しいAI技術として利用される事が期待される.
4.8 2 次元以外の集合演算
2次元情報(画像)を対象としたデータの位置を含んだ集合演算並びにそのプロセッサを中心に 紹介してきたが,データの位置を含んだ集合演算は図4.3のC例に示す通り,様々な次元配列の データ検索,解析に応用が可能である.
4.8.1 1 次元情報の集合演算
1次元配列の場合,FG位置並列変換器に使用するシフトレジスタは一般的な1次元配列のシフ トレジスタでよいので回路構成が単純である.1次元配列の集合演算の場合,テキストの正規表 現などのパターンマッチングや株価や気象などの時系列データに応用が可能である.ストリーム データのテキストマイニングなど,超リアルタイム性が必要な処理に最適である.
4.8.2 3 次元情報の集合演算
3次元配列の場合,FG位置並列変換器に使用するシフトレジスタは3次元配列のシフトレジス タとなるので回路構成が複雑になる.従って3次元配列の場合には,シフトレジスタによる位置 のマッチングを別の手法に変更する必要がある.詳細は割愛するが,位置の演算をALUによる数 値演算マッチングとするなどの方法が有効である.3次元配列の集合演算の場合,立体物の解析に 応用が可能である.分子構造の解析や宇宙空間の解析に好都合である.
第 5 章 結論
表5.1は従来型プロセッサであるCPUやGPUと,これまで説明の3つのメモリ一体型プロセッ サの相違点をまとめたものである.
現在我々が日常利用するコンピュータはノイマン型コンピュータである.ノイマン型コンピュー ティングの基本は,演算装置(CPU)と記憶装置(メモリ)による逐次処理コンピューティング である.このタイプ以外の演算体系のコンピューティングを,一律に非ノイマン型コンピューティ ングと呼ぶ傾向がある.メモリ一体型プロセッサは,演算装置と記憶装置が分離されている事に 起因する弊害を解決するためにそれらを同一の半導体チップ上に実装し,ノイマン型演算装置で あるCPUやGPUの苦手な処理である情報の検出処理を代行するものである.従ってメモリ一体 型プロセッサは補ノイマン型プロセッサと考えるのが相応しい.