並列計算機を用いたVLSI path delay解析に関する基礎研究
2
0
0
全文
(2) 情報処理学会第 76 回全国大会. (3) critical path 上にある prelayout interconnect net 毎の処理 も独立して行える(ただし、各 goal への visit 回数 booking のみ)。そこで、独立に計算ができる部分は Fig.3 のように並列処理化することにした。. 4 評価結果 前 章 で の 実 験 結 果 よ り 、 nb=4, ns=1,024 と し 、 Fig.3 に示す clock tree 回路を用いて、開発手法によ る評価を行った。goal への visit 回数を booking する 処理つまり第 2 章(S1)で説明した処理に関して、 serial に実行した場合と、parallel に実行した場合と の 処 理 速 度 の 比 較 を 行 っ た 。 3 種 類 の evaluation circuit を用いた評価結果を Table.1 に示す。平均 7.3 倍の高速化である。 念のため、並列処理による goal visit 回数 booking 処 理 degradation 有 無 の 確 認 を 行 っ た 。 例 え ば evaluation circuit 1 では、Fig.5 のように対 Spice®誤 差は平均 2(%),50%遅延時 1.3(%)であり、booking 処 理は正しく行われている。 実 験 環 境 と し て 、 parallel に は Kepler GeForce GTX650 1.1(GHz)を用いており、serial には Mac OS X Intel core i5 1.6(GHz)を使用した。 Table.1 Acceleration Parallel RW vs. Serial RW. Fig.3 How to use parallel processing. Evaluation circuit 1. 9x. Evaluation circuit 2. 6x. Evaluation circuit 3. 7x. この並列化は、NVIDIA 社 Kepler[3]を用いて実現 した。Kepler は SMX, block, warp という 3 つの概念 で並列性を制御しているが、実際にはユーザが与え た次の 2 つの情報によって並列性を決定している。 2 つの情報とは、”block 数 nb”および”block あたり に実行できる thread 数 ns”である。nb, ns をどのよう に与えれば最適な並列性が実現できるか実験で調べ た。結果、 nb =4 および ns =1,024 で最適な並列性つ まり 4,096 並列が実現できる事が分った。実験結果 を Fig.4 に示すが、これは nb, ns 2 つの要因に関す るベクトル内積処理時間依存性を表している。 Fig.5 Prelayout interconnect net output wave 5 まとめ Random Walk 法による波形解析の前準備[2]であ る、各 goal への visit 回数[2]の booking に関して、 並列処理による高速化の検討を行った。並列処理を 用いらなかった場合と比べ、約 7 倍の高速化を図る 事ができた。 [1] 鈴木五郎,”システム LSI 設計入門”,コロナ社,2003. [2] 竹田隆太郎,鈴木五郎,”QTAT Timing Analysis for ECO with Random Walk”,情報処理学会第 75 回全国大会,4A-6,2013 [3] Jason Sanders,Edward Kandrot,”CUDA By Example 汎用 GPU プ ログラミング入門”,インプレスジャパン,2011. Fig.4 CPU by nb and ns. 1-22. Copyright 2014 Information Processing Society of Japan. All Rights Reserved..
(3)
関連したドキュメント
ロボットは「心」を持つことができるのか 、 という問いに対する柴 しば 田 た 先生の考え方を
「私は,ベッサラビアとブコヴィナからすべてのユダヤ人を強制移住させること
前章 / 節からの流れで、計算可能な関数のもつ性質を抽象的に捉えることから始めよう。話を 単純にするために、以下では次のような型のプログラム を考える。 は部分関数 (
が前スライドの (i)-(iii) を満たすとする.このとき,以下の3つの公理を 満たす整数を に対する degree ( 次数 ) といい, と書く..
テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。
線遷移をおこすだけでなく、中性子を一つ放出する場合がある。この中性子が遅発中性子で ある。励起状態の Kr-87
本手順書は複数拠点をアグレッシブモードの IPsec-VPN を用いて FortiGate を VPN
、肩 かた 深 ふかさ を掛け合わせて、ある定数で 割り、積石数を算出する近似計算法が 使われるようになりました。この定数は船