メモリ一体型プロセッサのまとめ．

第 4 章集合演算プロセッサ 41

5.2 メモリ一体型プロセッサのまとめ．

以上のような背景から，DRAM内部に新しく演算器を組み込む事を避け，DRAMメモリセルのアナログ特性を利用して論理演算を行う研究が多数提案されている．つまりDRAMのメモリセルやセンサーアンプの構成を変更する事なく，DRAM内部にメモリセルの読み出し方法を変える機能を追加する事によってコンピューティングを実現する提案が一般的である．

これまで一般のDRAMではインメモリコンピューティングを実現する事は出来ないものと考えられていた．

文献[111]は，汎用DRAMでAND演算とOR演算を実現させるものである．すなわち汎用の

DRAMチップに一切手を加える事なく，汎用のDRAMの使い方，つまりDRAMの制御を通常の方法から変更する事で，DRAMメモリ内でインメモリコンピューティングを実現するものである．

まだ理論の検証段階であり実用化するまでには多少の時間がかかると思われるものの汎用品を利用出来るので実用化の可能性が高い．本文献による方式でデータベースプロセッサを構成した場合の例を紹介する．汎用DDR3の2Gビット，4GビットのDRAMでの演算手法と演算結果が示されている．このチップの演算サイクルを400MHzで制御した場合，8ビットのAND演算とOR 演算が1,376サイクルで実現出来る事が示されており，8ビットのAND/OR演算が2.5n秒×1,376

サイクル=3.440μ秒で実現され，1ビット（1アドレス演算）に換算すれば430n秒になる．この

演算速度は，これまでFPGAで研究してきた演算スピード，例えば5n秒や10n秒に比較して著しく低速であるものの，FPGA方式の容量不足を解消するための外部メモリのデータバッチ処理の必要がなく，しかも消費電力が一般的なDDR3のチップの消費電力0.5Ｗ程度であるので，電力性能が大幅に改善される事になる．この演算方式ではAND演算，OR演算のみしか実現出来ないが，正理論データと不理論データを一対にしてDRAM内のメモリセルに記憶する事により，疑似的にNOT演算やXOR演算を実現する事が示されている．このようなコンピューティングの有効性が示される事により，DRAM型式のインメモリコンピューティングの需要が見込まれるものと考えられる．

データクラス分け演算プロセッサのASIC化について説明をする．半導体は2020年現在数十億トランジスタが1チップに搭載出来る．もう間もなく100億トランジスタが実装出来る見通しである．データクラス分け演算プロセッサの1つのAPは500トランジスタ（100ゲート）程度で実現する事が可能であり，16M個のGAPの場合8G個（80億個）トランジスタ数になり，残り20 億のスペースをメモリ並びに周辺回路に利用する事が出来る．ちなみに4MBのメモリを1セル当たり6トランジスタのSRAMで構成する場合，4M×8×6≈2億トランジスタ程度である．10億個のトランジスタを使えば40MBのメモリを搭載する事が出来る．必要に応じ更にメモリを増設する事により，高度な演算効果を得る事が出来る．

以上のような構成のASICを5n秒クロックで64アドレス演算を行った場合，320n秒で実現出来る事になる．16M個の演算器が並列に演算を行い演算結果を出力する事になるので，ラッシュ電流を考慮した設計をする必要がある．また演算器（AP）の集積度が特に高いので，マッチアドレス出力の構成と出力インターフェースを充分に考慮する必要がある．

5.2.1 自己完結型情報処理

CPUは，データベースプロセッサ，データクラス分け演算プロセッサ並びに集合演算プロセッサにコマンドを与えるだけで，それぞれのプロセッサは所定の演算をデバイス内部で実行し，その結果をCPUに返す．3つのデバイスともCPUの力を借りずにデバイス内部で所定の処理を完結出来る．また自己完結型情報処理の速度が速いので，後述するプロセッサ間対話型情報処理が可能になる．

5.2.2 情報処理効率（電力性能）

データベースプロセッサの一例としてFPGAタイプのデータベースプロセッサを紹介した．このデータベースプロセッサの消費電力は約15Wである．このプロセッサは利用方法が単純であり，

CPUからデータベースプロセッサにコマンドを与え，CPUはその演算結果を受け取るだけでよい．従ってCPUは省電力タイプのCPUで充分である．また，通常のデータベースで利用されるインデックス作成やメンテナンスにかかる電力も不要となる事も大きなメリットである．ASIC化した集合演算プロセッサは，通常のCPUによるパターンマッチング処理に比較して超高速であり，

しかも大幅な低電力が期待出来る事を説明した．メモリ一体型プロセッサは，CPUやGPUの苦手な処理を超高速に処理するのみならず，システム全体を大幅に省電力化するデバイスと判断出来る．

5.2.3 ^汎用性

メモリ一体型プロセッサは，複雑なソフトウェアアルゴリズムに頼らなくてはならない情報処理を代行する事を目的としたプロセッサである．データベースプロセッサやデータクラス分け演算プロセッサは，様々な汎用データベースの検索や照合に利用出来るプロセッサであり，PCからサーバさらにはクラウドやウェブ検索のような大規模システムなどに利用可能である．集合演算プロセッサは，スマホからPCさらには監視カメラなどの専門機器の製品やシステムはもとより，

画像ウェブ検索の分野にも利用出来る．また，データベースプロセッサと集合演算プロセッサを組み合わせしたシステムは，生体認証や新しいタイプの人工知能システムに応用可能である．複雑なソフトウェアアルゴリズムに頼らなくてはならない情報の検出処理は顕在化しているものだけでも膨大である．

5.3 新たな情報処理の実現に向けて（ソフトウェア）

5.3.1 情報探し処理の前処理が不要な情報処理

前処理に関して，データベースプロセッサはデータベース検索や照合に供するデータテーブルを用意するだけで利用出来る．このデータテーブルはデータベースプロセッサ内部で行列変換され記憶されるので，B-TREE，HASH-TABLEなどのインデックスを作成する必要がない．従来これらのインデックスは，基データが変更される度にデータメンテナンス（更新処理）が必要であったが，本方式であればデータベースプロセッサのメモリの一部を最新データに書き換えるだけでよい．画像処理用集合演算プロセッサは，画像生データを前処理なしに記憶し，記憶したデータを一切加工編集する事なしに様々なパターンマッチング演算を実現する．以上の通りメモリ一体

型プロセッサを使用した情報処理は，情報検出インデックスやメタデータなどのアルゴリズムが要らなくなるのでソフトウェア開発が容易になる．

5.3.2 プロセッサ間対話型情報処理

例えば人間の会話を例にして考える．相手が何を考えているかを正確に知るためには，幾つかの質問を繰り返す事が必要である．メモリ一体型プロセッサを積極的に利用する例の1つとして，

画像認識の一例を挙げれば，例えば赤色のピクセルが全くない画像空間で赤いリンゴを探すのは意味を持たない．集合演算プロセッサにより対象画像の中に一定の赤の領域特徴があるのかないのかをCPUに知らせ，ある場合にはリンゴ特有の丸い輪郭特徴があるかないかを再度集合演算プロセッサにより検出させる．必要に応じ検出された位置周辺をリンゴであるかどうかをCPUで詳しく調査する．以上のような概念のCPUと集合演算プロセッサの会話式パターン認識が実現出来る．

CPUはメモリ一体型プロセッサに質問を与えると，メモリ一体型プロセッサが所定の情報処理を自己完結型に行い，その結果をCPUに回答する．そのレスポンスが速い事が特徴である．CPU は集合演算プロセッサが検出した位置周辺のみを限定的に処理出来るので，CPUの負担を大幅に軽減する事が出来る．CPUにとって，データベースプロセッサ，データクラス分け演算プロセッサそして集合演算プロセッサなどのメモリ一体型プロセッサは，特徴のフィルタであると同時に知識の宝庫のような存在である．

5.3.3 IoT 情報処理分野への応用

IoT情報処理の一例として，集合演算プロセッサの天気予報への活用について説明する．これまでの天気予報は，多数の観測地点の気圧，気温，風力や風向きなど多くの気象情報をもとにして物理的な算術演算シミュレーションを行い予測する方法であったため，大型のコンピュータやスパコンを利用する必要があった．最近は局部地域の降雨量の予測など大型のコンピュータやスパコンを利用する事なくAI手法を用いて予報する事が行われている．このAI手法の1つは，過去の気象データと現在の気象データの比較である．膨大な過去の気象情報パターンとの類似性を見つける事により，類似する過去の気象データから，1時間後，12時間後，24時間後の予測を行うものである．当然の事ながら，多くのデータを高速にパターンマッチング検索出来る事が必要で，

限られた時間の中で出来るだけ多くの過去データとパターンマッチング演算出来るかが鍵になる．

このようなパターンの類似性の検出に，集合演算プロセッサやデータクラス分け演算プロセッサが利用出来る．超省電力化が可能であるので，IoT端末でのエッジ処理に適している．

5.3.4 人工知能（ AI ）の進化

人工知能の最大のニーズは，認識型AIと自然言語AIの2つであろう．認識型AIについては，

集合演算プロセッサのパターン認識能力が人工知能を新しく進化させる事が期待出来るのは先に示した通りである．一方自然言語AIは，多種類のデータベースのプロセッサ間対話型情報処理で示したような高速な繰り返し検索が鍵になる．インデックスなしで高速検索を可能にするデータベースプロセッサやデータクラス分け演算プロセッサの検索能力は，自然言語処理の進化に期待出来る．

ドキュメント内電気通信大学大学院情報理工学研究科 (ページ 105-124)

第 4 章 集合演算プロセッサ 41