• 検索結果がありません。

GPGPUフレームワークMESI-CUDAのマルチGPU環境への対応

N/A
N/A
Protected

Academic year: 2021

シェア "GPGPUフレームワークMESI-CUDAのマルチGPU環境への対応"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会論文誌. プログラミング. Vol.9 No.1 12 (Feb. 2016). 発表概要. GPGPU フレームワーク MESI-CUDA の マルチ GPU 環境への対応 山本 怜1,a). 大野 和彦1. 2015年8月5日発表. GPGPU の分野において,複数の GPU を搭載したマルチ GPU 環境を用いてより高い計算性能を実現 する試みがなされている.現在主流の開発環境である CUDA はマルチ GPU に対応しているが,個々の GPU を明示的に操作する必要があり,プログラムの記述が煩雑になる.さらに,1 台のホスト上に搭載で きる GPU の個数が限られているため,より多くの GPU を利用する大規模な環境は分散型マルチ GPU 環 境となる.この場合,同一ホスト上の GPU か否かで通信オーバヘッドを考慮するなど,プログラムの記 述やチューニングはさらに難易度が高くなる.我々は CUDA よりプログラム記述が容易なフレームワー ク MESI-CUDA を開発している.MESI-CUDA は CPU・GPU コアが単一の仮想共有メモリにアクセス するプログラミングモデルを採用している.処理系はホストメモリ・デバイスメモリの確保・解放やデー タ転送などのコードを自動生成することで,このモデルで記述されたプログラムを CUDA コードに変換す る.本提案では,このモデルをそのままマルチ GPU 環境に拡張することで,低レベルな各 GPU への操 作の記述を不要にする.また,論理的なスレッド生成方式を導入し,ユーザが生成を指示したスレッド群 は実行時スケジューラにより適切な GPU へ自動的に割り当てる.コンパイラは各スレッドのデータアク セス範囲などを静的解析し,実行時スケジューラはデータ転送量の最小化などの自動最適化を実現する.. A GPGPU Framework MESI-CUDA for Multi-GPU Environment Rei Yamamoto1,a). Kazuhiko Ohno1. Presented: August 5, 2015. Recently, GPGPU is used for high performance computing. Although multi-GPU is expected as the platform for higher performance, current standard programming environment CUDA requires explicit operation on the individual GPUs. Furthermore, hand-tuning is necessary to use all GPUs efficiently. Because only a few GPUs can be physically installed on a single host, a large-scale multi-GPU environment will be a cluster of hosts connected by the network. On such a environment, the user must specify inter/intra-host communication considering the difference of the overhead. Thus the programming and tuning will be more difficult. We are developing a new programming framework named MESI-CUDA which enables easier GPU programming than CUDA. In this paper, we propose an extension of MESI-CUDA to support multi-GPU environments. Current MESI-CUDA provides a simple programming model that every CPU/GPU cores accesses a single virtual shared memory. The compiler translates a MESI-CUDA program to CUDA program automatically generating memory management and data transfer code. We extend this model to support multi-GPU environments, hiding the individual GPUs from the user and eliminating low-level specifications. We introduce a new logical thread creation scheme; the user creates GPU threads without specifying the target GPU and the runtime thread scheduler automatically invokes physical threads on the available GPUs. The MESI-CUDA compiler makes static analysis to obtain the data access range of each thread. Using the analysis result, the runtime scheduler performs automatic optimization such as minimizing data transfer.. 1 a). 三重大学大学院工学研究科 Graduate School of Engineering, Mie University [email protected]. c 2016 Information Processing Society of Japan . 12.

(2)

参照

関連したドキュメント

In this paper we develop a general decomposition theory (Section 5) for submonoids and subgroups of rings under ◦, in terms of semidirect, reverse semidirect and general

The first case is the Whitham equation, where numerical evidence points to the conclusion that the main bifurcation branch features three distinct points of interest, namely a

So far as we know, there were no results on random attractors for stochastic p-Laplacian equation with multiplicative noise on unbounded domains.. The second aim of this paper is

Then the center-valued Atiyah conjecture is true for all elementary amenable extensions of pure braid groups, of right-angled Artin groups, of prim- itive link groups, of

The CS short−to−ground is also detected as follows: whenever the input voltage is higher than the brown−out threshold and no I CS current higher than I in− rush is detected at

CSPF︓Cooling Seasonal Performance Factor(冷房期間エネルギー消費効率).. 個々のお客様ニーズへの

The CS/ZCD multi-functional pin is designed to monitor the primary peak current for protection and light control and the auxiliary winding voltage for zero current detection..

At the beginning of the soft start the peak current variation is not linear due to the Discontinuous Mode Current (DCM) operation of the forward at low peak current and low voltage