• 検索結果がありません。

地球シミュレータ上でのXcalableMP語の通信性能評価

N/A
N/A
Protected

Academic year: 2021

シェア "地球シミュレータ上でのXcalableMP語の通信性能評価"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)HPCS2017 2017/6/5. 2017年ハイパフォーマンスコンピューティングと計算科学シンポジウム High Performance Computing Symposium 2017. 地球シミュレータ上でのXcalableMP⾔語の通信性能評価 上原均(海洋研究開発機構)、村井均(理化学研究所)、横川三津夫(神⼾⼤学). 背景と⽬的. 近年の計算機の著しい計算性能向上に従い、その並列度も急激に上昇しており、3〜5年後に登場すると予測されるポストペタスケール級計 算機では100万並列に達すると推定される。しかし⼀⽅で、そのような⾼並列な計算機を存分に活⽤するための⾼並列プログラムの開発は⾮ 常に難しい事が専⾨家から指摘されている。 そこで海洋研究開発機構と理化学研究所、神⼾⼤学では、共同研究「ポストペタスケールシステム向けの並列計算モデルの開発と評価」を 締結し、ペタスケール級および将来のポストペタスケール級のスーパーコンピュータにおいてアプリケーションプログラムを容易に⾼性能化 するための並列計算モデル(プログラミング⾔語処理系)として、Partitioned Global Address Spaceモデルに基づいた並列プログラミング ⾔語XcalableMP [1] (以下、XMP)について調査検討を⾏った。XMP⾔語は指⽰⾏ベースでFORTRAN⾔語あるいはC⾔語を拡張しており、 ⽣産性の⾼さが特に評価されている。上記の共同研究の⼀環として、本研究では、海洋研究開発機構が所有するスーパーコンピュータ「地球 シミュレータ」上でXMP⾔語の利⽤可能性、特に⾼並列・⼤規模計算において性能⾯での影響が⼤きい通信性能について評価検討を⾏う。評 価環境として Omni XcalableMP Compiler Stable Version 1.1.0[2]を⽤いた。. 研究内容 (I) Shift通信、Bcast通信での評価. 実アプリケーションで頻繁に⽤いられるShift通信とBroadcast(以下、Bcast)通信について、従来使われてきたMessage Passing Interface (MPI)での実装と、XMP⾔語での実装を⽐較する。XMP⾔語では各ノードで共有して利⽤するデータを各ノードに分散配置するGlobal View⽅ 式と、各ノードが持つローカルデータに対して通信を⾏うLocal View⽅式がある。本研究では両⽅での実装を⾏って⽐較検討する。Bcast通 信では地球シミュレータの特徴である拡張クラスタ(2048ノード)での⾼並列時の性能評価も⾏う。なお以下の計測は各ノード1プロセスで 実⾏しており、計測区間前後ではバリア同期を⾏っている。性能値は100回試⾏での平均値である。. (a) Shift通信. (b) Bcast通信. MPIプログラムでのメモリ領域設定イメージ. Bcast通信のイメージ 送信配列. 受信配列. rootランク. 受信配列. 受信配列. rootランク以外の全ランク. XMP Global Viewへの書換え.  データ分割は指⽰⾏で指定  MPI_Send等をreflect構⽂で書換え  通信区間をサブルーチン化 (※プログラムの仕様上、reflectされる データ⻑が動的に変わるため). XMP Local Viewへの書換え  MPI_Send等をCAFの⽚側通信に書換 例:buf(1:len,4)=buf(1:len,2)[rank+1] ※rank+1のプロセスのbuf(1:len,2)を ⾃分のbuf(1:len,4)にコピー. XMP Global Viewへの書換え  MPI_Bcast関数はBCAST指⽰⽂で書換  XMPのBCAST指⽰⽂は指定した配列の 全要素を送信するため、動的に通信 バッファを確保する⽅式に変更. 短メッセージ時:MPIが良好な性能 ⻑メッセージ時:XMP Global View記述が良好な性能. ※XMPの内部実装でMPI_Send_Init関数等を利⽤. XMP Local Viewへの書換え.  MPI_Bcast関数はCo-array Fortran (CAF)のCO_BROADCAST関数に書換  CO_BROADCAST関数は指定した配列 の全要素を送信するため、動的に通信 バッファを確保する⽅式に変更. Bcast通信ではMPIとXMPは⾼並列でもほぼ互⾓の性能. 研究内容 (II) NICAM-DC-mini XMP版での評価. 理化学研究所計算科学研究機構が公開しているFiber[3]に含まれるNICAM-DC-miniのMPI版とXMP⾔語版[4]について、地球シミュレータで の実⾏性能、特に通信性能に着⽬して⽐較評価する。評価にはjablonowski (GLevel05,RLevel00,40層,10並列)を⽤いた。NICAM-DC-mini の通信処理は1)隣接間1対1通信、2)ブロードキャスト通信、3)リダクション演算を伴う集団通信、に⼤別される。XMP⾔語版はCoarrayによるLocal View⽅式で記述されている。. 隣接間通信部分の性能評価例. XMP実装でのオーバヘッドの問題. まとめと今後の課題. ブロードキャスト通信部分の性能評価. ⻑メッセージのShift通信ではMPI版よりXMP(Global View)版が性能的に優位 Bcast通信ではMPI版とXMP(Global View)版は性能的にほぼ互⾓ XMP(Local View)版は性能的にはやや不利だがCAF記法の可読性は⾼い NICAM-DC-mini XMP版は通信時間が増加傾向 ⇒ オーバーヘッドについてXMP⾔語の実装に改善の余地あり  今後の課題:より本格的なコードや周辺プログラム(例:可視化処理)等への適⽤.    . ⓒ 2017 Information Processing Society of Japan. リダクション演算を伴う集合通信部分の性能評価例. XMP実装でのオーバヘッドおよび演算負荷の不均衡 謝辞. 本研究の⼀部は、⽂部科学省フラッグシップ2020プロジェクト(ポスト「京」の開発)「ポス ト「京」で重点的に取り組むべき社会的・科学的課題」における重点課題④「観測ビッグデー タを活⽤した気象と地球環境予測の⾼度化」として実施されました。また、本研究の実施では NECソリューションイノベータ株式会社 ⼭⼝健太⽒と関係各位の協⼒を得ました。ここに記し て感謝の意を表します。. 参考⽂献 [1] [2] [3] [4]. XcalableMP, http://www.xcalablemp.org/ Omni Compiler, http://omni-compiler.org/ Fiber, http://fiber-miniapp.github.io/ PGAS⾔語XcalableMPによるFIberミニアプリ集の実装と評価、村井均、 2016年ハイパフォーマンスコンピューティングと計算科学シンポジウム (HPCS2016). 13.

(2)

参照

関連したドキュメント

はじめに

継続企業の前提に関する注記に記載されているとおり、会社は、×年4月1日から×年3月 31

燃料・火力事業等では、JERA の企業価値向上に向け株主としてのガバナンスをよ り一層効果的なものとするとともに、2023 年度に年間 1,000 億円以上の

当初申請時において計画されている(又は基準年度より後の年度において既に実施さ

越欠損金額を合併法人の所得の金額の計算上︑損金の額に算入

1に、直接応募の比率がほぼ一貫して上昇してい る。6 0年代から7 0年代後半にかけて比率が上昇

性能  機能確認  容量確認  容量及び所定の動作について確 認する。 .

性能  機能確認  容量確認  容量及び所定の動作について確 認する。 .