第 4 章 集合演算プロセッサ 41
5.2 メモリ一体型プロセッサのまとめ.
以上のような背景から,DRAM内部に新しく演算器を組み込む事を避け,DRAMメモリセル のアナログ特性を利用して論理演算を行う研究が多数提案されている.つまりDRAMのメモリセ ルやセンサーアンプの構成を変更する事なく,DRAM内部にメモリセルの読み出し方法を変える 機能を追加する事によってコンピューティングを実現する提案が一般的である.
これまで一般のDRAMではインメモリコンピューティングを実現する事は出来ないものと考え られていた.
文献[111]は,汎用DRAMでAND演算とOR演算を実現させるものである.すなわち汎用の
DRAMチップに一切手を加える事なく,汎用のDRAMの使い方,つまりDRAMの制御を通常の 方法から変更する事で,DRAMメモリ内でインメモリコンピューティングを実現するものである.
まだ理論の検証段階であり実用化するまでには多少の時間がかかると思われるものの汎用品を利 用出来るので実用化の可能性が高い.本文献による方式でデータベースプロセッサを構成した場 合の例を紹介する.汎用DDR3の2Gビット,4GビットのDRAMでの演算手法と演算結果が示 されている.このチップの演算サイクルを400MHzで制御した場合,8ビットのAND演算とOR 演算が1,376サイクルで実現出来る事が示されており,8ビットのAND/OR演算が2.5n秒×1,376
サイクル=3.440μ秒で実現され,1ビット(1アドレス演算)に換算すれば430n秒になる.この
演算速度は,これまでFPGAで研究してきた演算スピード,例えば5n秒や10n秒に比較して著し く低速であるものの,FPGA方式の容量不足を解消するための外部メモリのデータバッチ処理の 必要がなく,しかも消費電力が一般的なDDR3のチップの消費電力0.5W程度であるので,電力 性能が大幅に改善される事になる.この演算方式ではAND演算,OR演算のみしか実現出来ない が,正理論データと不理論データを一対にしてDRAM内のメモリセルに記憶する事により,疑似 的にNOT演算やXOR演算を実現する事が示されている.このようなコンピューティングの有効 性が示される事により,DRAM型式のインメモリコンピューティングの需要が見込まれるものと 考えられる.
データクラス分け演算プロセッサのASIC化について説明をする.半導体は2020年現在数十億 トランジスタが1チップに搭載出来る.もう間もなく100億トランジスタが実装出来る見通しで ある.データクラス分け演算プロセッサの1つのAPは500トランジスタ(100ゲート)程度で実 現する事が可能であり,16M個のGAPの場合8G個(80億個)トランジスタ数になり,残り20 億のスペースをメモリ並びに周辺回路に利用する事が出来る.ちなみに4MBのメモリを1セル当 たり6トランジスタのSRAMで構成する場合,4M×8×6≈2億トランジスタ程度である.10億個 のトランジスタを使えば40MBのメモリを搭載する事が出来る.必要に応じ更にメモリを増設す る事により,高度な演算効果を得る事が出来る.
以上のような構成のASICを5n秒クロックで64アドレス演算を行った場合,320n秒で実現出 来る事になる.16M個の演算器が並列に演算を行い演算結果を出力する事になるので,ラッシュ 電流を考慮した設計をする必要がある.また演算器(AP)の集積度が特に高いので,マッチアド レス出力の構成と出力インターフェースを充分に考慮する必要がある.
5.2.1 自己完結型情報処理
CPUは,データベースプロセッサ,データクラス分け演算プロセッサ並びに集合演算プロセッ サにコマンドを与えるだけで,それぞれのプロセッサは所定の演算をデバイス内部で実行し,そ の結果をCPUに返す.3つのデバイスともCPUの力を借りずにデバイス内部で所定の処理を完 結出来る.また自己完結型情報処理の速度が速いので,後述するプロセッサ間対話型情報処理が 可能になる.
5.2.2 情報処理効率(電力性能)
データベースプロセッサの一例としてFPGAタイプのデータベースプロセッサを紹介した.こ のデータベースプロセッサの消費電力は約15Wである.このプロセッサは利用方法が単純であり,
CPUからデータベースプロセッサにコマンドを与え,CPUはその演算結果を受け取るだけでよ い.従ってCPUは省電力タイプのCPUで充分である.また,通常のデータベースで利用される インデックス作成やメンテナンスにかかる電力も不要となる事も大きなメリットである.ASIC化 した集合演算プロセッサは,通常のCPUによるパターンマッチング処理に比較して超高速であり,
しかも大幅な低電力が期待出来る事を説明した.メモリ一体型プロセッサは,CPUやGPUの苦 手な処理を超高速に処理するのみならず,システム全体を大幅に省電力化するデバイスと判断出 来る.
5.2.3 汎用性
メモリ一体型プロセッサは,複雑なソフトウェアアルゴリズムに頼らなくてはならない情報処 理を代行する事を目的としたプロセッサである.データベースプロセッサやデータクラス分け演 算プロセッサは,様々な汎用データベースの検索や照合に利用出来るプロセッサであり,PCから サーバさらにはクラウドやウェブ検索のような大規模システムなどに利用可能である.集合演算 プロセッサは,スマホからPCさらには監視カメラなどの専門機器の製品やシステムはもとより,
画像ウェブ検索の分野にも利用出来る.また,データベースプロセッサと集合演算プロセッサを 組み合わせしたシステムは,生体認証や新しいタイプの人工知能システムに応用可能である.複 雑なソフトウェアアルゴリズムに頼らなくてはならない情報の検出処理は顕在化しているものだ けでも膨大である.
5.3 新たな情報処理の実現に向けて(ソフトウェア)
5.3.1 情報探し処理の前処理が不要な情報処理
前処理に関して,データベースプロセッサはデータベース検索や照合に供するデータテーブル を用意するだけで利用出来る.このデータテーブルはデータベースプロセッサ内部で行列変換さ れ記憶されるので,B-TREE,HASH-TABLEなどのインデックスを作成する必要がない.従来こ れらのインデックスは,基データが変更される度にデータメンテナンス(更新処理)が必要であっ たが,本方式であればデータベースプロセッサのメモリの一部を最新データに書き換えるだけで よい.画像処理用集合演算プロセッサは,画像生データを前処理なしに記憶し,記憶したデータ を一切加工編集する事なしに様々なパターンマッチング演算を実現する.以上の通りメモリ一体
型プロセッサを使用した情報処理は,情報検出インデックスやメタデータなどのアルゴリズムが 要らなくなるのでソフトウェア開発が容易になる.
5.3.2 プロセッサ間対話型情報処理
例えば人間の会話を例にして考える.相手が何を考えているかを正確に知るためには,幾つか の質問を繰り返す事が必要である.メモリ一体型プロセッサを積極的に利用する例の1つとして,
画像認識の一例を挙げれば,例えば赤色のピクセルが全くない画像空間で赤いリンゴを探すのは 意味を持たない.集合演算プロセッサにより対象画像の中に一定の赤の領域特徴があるのかない のかをCPUに知らせ,ある場合にはリンゴ特有の丸い輪郭特徴があるかないかを再度集合演算 プロセッサにより検出させる.必要に応じ検出された位置周辺をリンゴであるかどうかをCPUで 詳しく調査する.以上のような概念のCPUと集合演算プロセッサの会話式パターン認識が実現出 来る.
CPUはメモリ一体型プロセッサに質問を与えると,メモリ一体型プロセッサが所定の情報処理 を自己完結型に行い,その結果をCPUに回答する.そのレスポンスが速い事が特徴である.CPU は集合演算プロセッサが検出した位置周辺のみを限定的に処理出来るので,CPUの負担を大幅に 軽減する事が出来る.CPUにとって,データベースプロセッサ,データクラス分け演算プロセッ サそして集合演算プロセッサなどのメモリ一体型プロセッサは,特徴のフィルタであると同時に 知識の宝庫のような存在である.
5.3.3 IoT 情報処理分野への応用
IoT情報処理の一例として,集合演算プロセッサの天気予報への活用について説明する.これま での天気予報は,多数の観測地点の気圧,気温,風力や風向きなど多くの気象情報をもとにして 物理的な算術演算シミュレーションを行い予測する方法であったため,大型のコンピュータやス パコンを利用する必要があった.最近は局部地域の降雨量の予測など大型のコンピュータやスパ コンを利用する事なくAI手法を用いて予報する事が行われている.このAI手法の1つは,過去 の気象データと現在の気象データの比較である.膨大な過去の気象情報パターンとの類似性を見 つける事により,類似する過去の気象データから,1時間後,12時間後,24時間後の予測を行う ものである.当然の事ながら,多くのデータを高速にパターンマッチング検索出来る事が必要で,
限られた時間の中で出来るだけ多くの過去データとパターンマッチング演算出来るかが鍵になる.
このようなパターンの類似性の検出に,集合演算プロセッサやデータクラス分け演算プロセッ サが利用出来る.超省電力化が可能であるので,IoT端末でのエッジ処理に適している.
5.3.4 人工知能( AI )の進化
人工知能の最大のニーズは,認識型AIと自然言語AIの2つであろう.認識型AIについては,
集合演算プロセッサのパターン認識能力が人工知能を新しく進化させる事が期待出来るのは先に 示した通りである.一方自然言語AIは,多種類のデータベースのプロセッサ間対話型情報処理で 示したような高速な繰り返し検索が鍵になる.インデックスなしで高速検索を可能にするデータ ベースプロセッサやデータクラス分け演算プロセッサの検索能力は,自然言語処理の進化に期待 出来る.