大規模計算クラスタにおけるArmプロセッサ利用のための性能評価
2
0
0
全文
(2) 情報処理学会第 82 回全国大会. 3.2. Arm サーバ・Intel サーバの計算性能の比較 (図 2) 1 スレッドの場合、Arm サーバのスループットは Intel Xeon Gold サーバの約 3 分の 1 である。しか し 512 スレッドの時、約 1.2 倍になるという結果が 得られた。. 6000. 5000. 4000. event/sec. に SMT が 2, 4 の場合に比べて、1 に設定した時は 物理コア数までリニアに性能が向上する。また、 SMT を 4 に設定した時は 128 スレッドでスループッ トが落ちることを確認した。. 3000. 2000. 1000. Intel Xeon Gold. ThunderX2. Intel Xeon E5. 0 0. 32. 64. 96. 128. 160. 192. 224. 256. 288. 320. 352. 384. 416. 448. 480. 512. # threads. 3.3. Arm サーバ・Intel サーバの電力効率の比較 図 2 測定結果. 各サーバの 1kWh あたりの処理イベント数の比較 を表 2 に示す。. 計算性能の比較. 4. まとめと今後の展望 表 2 各サーバの 1kWh あたりのイベント数 Xeon E5 7. 1.761×10. Xeon Gold. ThunderX2. 7. 3.591×107. 4.500×10. 本稿では、KEK の大規模 Linux クラスタへの Arm プロセッサの適応性評価として、Arm サーバと Intel サーバとでベンチマークテストを行い、計算 性能と電力効率を比較した。. Arm サーバと比較して、Intel Xeon Gold は約 1.25 倍の電力効率という結果が得られた。測定し た 256 スレッドでは 3.2 の結果よりスループットは Arm サーバが最も良い。Arm サーバの電力効率を悪 くしている原因として、待機電力が大きいことが分 かった(表 3)。. 3.4. 測定結果まとめ 各サーバの特徴と、Intel Xeon Gold を基準とし た測定結果を表 3 にまとめた。. 表 3 各サーバの特徴・測定結果 26. ,. 26. 95 $. E W. $ 3 4. .0 E. $ 3 4. 07 56 2$ $ $ 3 4. $ 817. W. $. X. T S. GM. 5. 参考文献. 7000. [1] Geant4 http://geant4.web.cern.ch/ [2] G4bench https://github.com/koichimurakami/g4bench [3] Recommended Customer Price on https://ark.intel.com/ [4] https://www.cavium.com/news/caviumannounces-thunderx2-general-availability. 6000 5000. event/sec. ・計算性能の面では、Arm プロセッサはスレッド数 を上げた時、ピーク計算性能については有利である ことが分かった。これはコア数が多いことと、SMT 機能で 1 コアあたり 4 スレッド実行可能のためであ ると考えられる。 ・消費電力あたりの計算性能の面では、Intel Xeon Gold サーバの消費電力は Intel Xeon E5 より大幅 に改善されている。Arm サーバは Intel Xeon Gold より劣っている結果となった。原因の 1 つとして、 Arm サーバのファンの消費電力が高いことが考えら れる。 今回用いた G4Bench は高エネルギー実験のシミュ レーションで使われるものであり、本システムにお いても多く利用されるため、測定に用いた。今後は、 他の計算プログラムやメモリ負荷がかかるプログラ ムにおいても性能測定を行う必要があると考える。 また、128 スレッドでスループットが落ちる原因に ついても調査する予定である。. 4000 3000 2000 1000. 4SMT. 2SMT. 1SMT. 1SMT ideal. 0 0. 32. 64. 96. 128. 160. 192. 224. 256. 288. 320. 352. 384. 416. 448. 480. 512. # threads. 図 1 測定結果. SMT 性能の比較. 1-36. Copyright 2020 Information Processing Society of Japan. All Rights Reserved..
(3)
図
関連したドキュメント
そればかりか,チューリング機械の能力を超える現実的な計算の仕組は,今日に至るま
前章 / 節からの流れで、計算可能な関数のもつ性質を抽象的に捉えることから始めよう。話を 単純にするために、以下では次のような型のプログラム を考える。 は部分関数 (
テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。
チューリング機械の原論文 [14]
(問5-3)検体検査管理加算に係る機能評価係数Ⅰは検体検査を実施していない月も医療機関別係数に合算することができる か。
および皮膚性状の変化がみられる患者においては,コ.. 動性クリーゼ補助診断に利用できると述べている。本 症 例 に お け る ChE/Alb 比 は 入 院 時 に 2.4 と 低 値
これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,
定可能性は大前提とした上で、どの程度の時間で、どの程度のメモリを用いれば計