• 検索結果がありません。

LAPIを用いたIBM SP2への分散共有メモリの実装と性能調査

N/A
N/A
Protected

Academic year: 2021

シェア "LAPIを用いたIBM SP2への分散共有メモリの実装と性能調査"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

『マルチメディア通信と分散処理ワークショップJ 平成11年12月

LAPI

を用いた

IBMSP2

への分散共有メモリの実装と性能調査

下 野 靖 史

Bernady O

.

Apduhan

浅 図 達 也 有国五次郎 九州工業大学知能情報工学科 干 82仏8502飯塚市川津680・4 概 要

IBM RS/6000 SP2システムで利用可能な LAPI(Low-Ievel Application Programming Interface)は、低 いレベルで High-PerformanceSwitchを利用した、最適な単方向データ転送を提供する APIであるoLAPI

は基本的に、ライブラリの開発や可搬性よりも性能を重視したプログラマに利用されるよう設計されている。 本稿では、 HPSwitchの高い通信性能を利用する LAPIを用いた分散共有メモリ (DSM)の実装について 述べる。その後に、性能調査の為に今回行なった予備実験の結果について報告する。

Implementing a

Distributed Shared Memory on LAPI

f

o

r

IBM

SP2 - Early Experiences

Y

a

s

u

s

h

i

Shimono Bernady O

.

Apduhan T

a

t

s

u

y

a

Asazu I

t

s

u

j

i

r

o

A

r

i

t

a

Dept. of Artificial Intelligence

Kyushu Institute of Technology 680-4 Kawazu

Iizuka 820・8502

Abstract

The Low-level Application Programming Interface (LAPI), available in ffiM RS/6000 SP2 System, is a low-level

high-performance one sided communication API designed色oprovide optimal communication performance on the IBM HP Switch. LAPI is primarily designed for use by 1ibraries and power program -mers where performance is a priority than code portability.

This paper discusses the implementation of a distributed shared memory on top of LAPI to exploit the high communication performance of the HP Switch. We describe the implementation method and some promising preliminary experiment results. 1 はじめに 現在LAN環境を利用したクラスタコンピューテイ ングの研究が盛んに行なわれている。我々の研究室に おいても、分散共有メモリモデルに基づく並列処理環 境である分散スーパーコンピューテイング環境 (Dis -tributed Supercomputing Environment

DSE)が 研 究・開発されてきた[2]。一方、専用のネットワークを もっ並列処理環境としてクラスタマシンというものが あるが、その 1つにIBMRS/6000 SP2システムがあ る[1]0SP2システムは、各ノードがロ}カルなメモリ を持つスケーラプルな分散メモリ型の並列処理システ ムであり、各ノードは POWER2RISC System/6000

プロセッサを搭載し、その 05はAIXであるo また ノード聞はHigh-PerformanceSwitch (HPS)と呼ば れる高速なネットワークスイッチで接続されており、 これを利用することで効率的で高速なノード開通信 を行なうことができる [8][11]0 SP2システムにおいてHPSを効率的に利用できる 通信ライブラリとして LAPI(Low-level Application Programming Interfaω)がある [4][510LAPIは細粒 度の通信に適した設言十がされており、これを分散共有 メモリモデルに適用することで、細粒度の通信が頻発 するような状態にも耐え得る並列処理環境が構築でき ると考えられる。今回はそのための基礎調査として、 LAPIを用いて SP2システム上に分散共有メモリを 構築した。さらに、将来的に LAPIを用いて SP2シ ステム上に分散共有メモリ型の並列処理環境を実装 するために必要な点についての考察を行なった。 以下本稿では、第2章で LAPIの概要について簡 単に述べ、 3章で我々の提案する分散共有メモリモデ ルの実装について述べる。そして 4章では、今回実 装した分散共有メモリモデルの基本的な性能を実験に より評価し、 5章において関連研究について述べるo 最後に 6章で、本稿についてのまとめと今後の課題 について述べるo

(2)

2 LAPI

の概要

LAPIは、 HPSを用いて効率的で高速なノード開 通信を提供するよう設計されたAPIであるo LAPIはユーザに対し柔軟な並列プログラムの記述 を提供するために、 3つの大きな特徴を持つ。まず 第 1に、 LAPIはHPS上で高効率な通信を提供す る。例えば、 LAPIでは UNIXのシステムコールに みられるような高価な通信インターフェースによる オーバーヘッドを極力排除したため、細粒度の通信 においても低いレイテンシを実現している。第2に、 LAPIは共有メモリ型プログラミングモデルにおける load/storeのような、リモートメモリに対する一方的 で柔軟なアクセスを許す。これはメッセージパッシン グモデルにおける send/receiveよりも扱いが容易で あるoまたLAPIはHPS上で、標準的なメッセージ パッシングモデルの APIである MPI[61やMPL[71 と比べて、よりプリミテイプなインターフェースを提 供するo第 3に、 LAPIはユーザにアクテイプメッ セージ [9]形式のインターフェースを提供する。これ は、他ノードにメッセージが到着した時に、その場で ユーザが定義したハンドラを呼び出すことができると いう機能であるoこれにより、様々なアプリケーショ ンや環境において、ユーザは自分の望むようにアプ リケーシヨンの通信機能をカスタマイズすることがで きるo 以下本章では、 LAPIのアクテイプメッセージとリ モートメモリコピー (RemoteMemory Copy

RMC) について説明するo 2.1 アクティブメッセージ LAPIにおけるアクテイプメッセージの実行イメー ジ図1に示す

[

5

]

0

origin Node origin task udaCA 巴...~....ñ'ZZ'I 出ii. cmpl_c芭 org_cr白 'l'arget &ode target task buffer tgt_cntr o

図1:アクテイプメッセージの実行イメージ ロセッサからアクテイプメッセージの依頼があると、 まずそのノード (Originノード)からユーザ定義の ヘッダとデ}タが相手ノード (Targetノード)に送 られる(ステップ 1)。ヘッダには処理すべきデータ の他に相手ノードで呼び出されるハンドラの情報等 が含まれる。 Targetノードでは、送られて来たヘッ ダとデータを受け取った後にLAPIdispatcherが呼 ばれ、ヘッダは HeaderHandlerに渡される(ステッ プ2)0Header Handlerはヘッダをユーザ定義に従っ て処理すると、データを LAPIdispatcherを通して Completion Handlerに渡す(ステップ 3

4)。最後に LAPI dispatcherによって CompletionHandlerカ叩乎 ばれ(ステップ5)、アクテイプメッセージ処理は終了 するo Originノードと Targetノード上の処理は非同期 に行われるが、各々の終了を知りたいときは、 LAPI に標準で用意されている各種カウンタを用いる。カウ ンタは、それぞれに対応する処理が終了した時点で インクリメントされるように設計されている。例え ば図1において、 org_cntrカウンタはOriginノード 上の処理(ここではアクテイプメッセージ処理)の終 了を示し、 tgt..cntrカウンタは Targetノード上の処 理の終了を示し、 cmpLcntrカウンタは Completion Handlerの終了を示す。特に cmpLcntrカウンタは Originノードのプロセスから Completion Handler の終了を調べたいときに用いられ、これにより二つ の処理の終了同期をとることが可能となるo 2.2 リモートメモリコピー RMCでは、 Originノードが自ノ}ド上の変数と Targe七ノード上の変数を指定し、それに対して指定の 処理を行う。処理の終了同期は、アクテイプメッセー ジと同じく各種カウンタを調べることで可能となるo RMCには2種類の処理があり、ひとつはTargeもノー ドにデータを送る PUTオペレーションであり、もう ひとつは Targetノードからデータを取ってくる GET オペレーションである。 PUTは、 Originノードがデー タを送信し資源の再利用が可能になると Targetノー ド上で受信データに対してなんらかの処理を行う前に すぐに次の処理に移ることができるoGETは、 Target ノードから受信したデータがOriginノード上の指定 した変数上に完全に安定するまで次の処理を行うこ とができない。いわばPUTは非同期的処理であり、 GETは同期的処理である。ただし、 PUTオペレーショ ンにおいて cmpLcntrカウンタを参照すれば、処理 の同期をとることが可能である。 その他のLAPIのプリミテイプを表1に示す[3)0 アクテイプメッセージ処理の流れを図に従って説明

3 分散共有メモリの実装

する。アクテイプメッセージの使用において、ユーザ は 二 つ の ハ ン ド ラ -Header HandlerとCompletion 今回、分散共有メモリの実装を IBMRS/6000 SP Handlerーを自由に定義することができるoあるプ Thin-66-2上で行なった。以下に実装したDSMの構

(3)

表 1:LAPI functionalities Operations Initialize Terminate Active Message Data Transfer Functions LAPLInit LAPLTerm LAPLAmsend LAPLPut Data Transfer I LAPLGet Mutual Exclusion I LAPLRmw Set the counter I LAPI..Setcntr Wait the counter I LAPL Waitcntr Get the counter I LAPI_Getcntr

Ordering I LAPL.Fence. LAPI_Gfence Address Exchange I LAPLAddressjnit Environment Query I LAPLQenv Environment Setup I LAPLsenv

成とそのアクセス手法について説明する。 3.1 分散共有メモリの構成 DSMの構成について説明する。まずクラスタ内の 利用される各ノード上に任意の量のメモリ空間を確 保し、それらを仮想的な共有メモリと見なして利用 する。つまり DSMのメモリ空間は、各ノードで確 保されたメモリ空間の総和となるoDSMのアドレス は、 LAPIのタスク ID(ノード番号に対応)とその ノード上に確保されたメモリ内アドレスを組み合わ せて、 2次元的に表されるo また DSMへのアクセス

は、 LAPIの

PUT

GET

オペレーションを用いるこ とで、利用するどのノードからでも自由に行なうこ とができるo メモリへのアクセスについては次に詳 しく述べる。 3.2 分散共有メモリへのアクセス DSM へ の ア ク セ ス は 、 READ、WRITE、 WRITE.J3の 3種類のオペレーションを用意し ているo ただし、 WRITEは nonblocking write であり、 WRITE..Bは blocking writeであるo WRITE.J3は、データが完全に書き込まれるのを 待って処理を続けたいときに用いられる。 DSMへのアクセスのそれぞれの処理は、 READ

GET

オペレーション、 WRITEは

PUT

オペレー ションを用いて実現される。 WRITE..Bは、 LAPI

が提供するカウンタのーつである completioncounter

を利用した

PUT

オペレーションによって実現される。

それぞれの処理は以下の様な形式で呼び出されるo

void READ(node

mem_addr

data

lerigth)

《 if(メモリ保護違反発生日 エラー処理; 終了; } else{ LAPI_GetO; } 〉 LAPI_Waitcntr(origin_cntr);

void WRITE(node

mem_addr

data

leng七h)

f if(メモリ保護違反発生日 エラー処理; 終了; } else{ } 〉 LAPI_Pu七0; LAPI_Waitcntr(origin_cntr);

void WRITE_B(node

m細 _addr

data

length)

f if(メモリ保護違反発生日 エラー処理; 終了; } else{ } } LAPI_PutO; LAPI_Waitcntr(origin_cntr); LAPI_Waitcntr(co~pletion由cntr); 引数nodeは LAPIで提供されるタスク IDと l 対 1対応しており、メモリが存在するノードを指定 するo 引数mem..addrには指定するノード上に確保 されたメモリ内のアドレスを指定する。引数dataは DSMに書き込むまたは DSMから読み出すデータを 保持する変数であり、 READではDSMから読み出 すデータを保持するための変数として使われる。ま た、引数lengthは扱うデータの長さを Byte単位で 指定するo なおWRITE、WRITE-Bにおいても呼び出し の形式は同様であり、 dataが読み出しの為に使われ るか書き込みの為に使われるかで異なる。またどの 処理においても、カウンタは必要最小限のものだけ を使用する。 次に、 DSMへのアクセス手順について説明する。 まず最初に、 DSMとして確保された各ノードのメ モリの先頭アドレスを LAPIのプリミテイプである LAPLAddressJnitを用いて調べ、アドレスパッファ に保存する。この情報は全ノードが持つことになる ので、これにより、 DSMを持つどのノードのメモ リでも参照することが可能となる。次にこの情報と、

(4)

READ、WRITE、WRITE-Bの呼出しで得られ るノード番号、メモリ内アドレス、データ長の情報 を用いて、 PUTまたは GETオペレーションを呼び 出す。このとき、ターゲットノ}ド番号として node を、ターゲットアドレスとしてアドレスバッファの 情報と mem..addrを加えたものを、また扱うデータ 長としてlengthを、それぞれLAPIのオペレーショ ンに与えるoこれによりユーザの希望する処理を行な うことができる。処理要求がWRITE_Bの場合は、 LAPIの提供するカウンタである completioncounter を利用するoつまり、書き込み処理がTぽ getノード で終了してから completioncounterがインクリメン トされるので、このカウンタがインクリメントされ るのを待つことでWRITE-Bの処理を実現するこ とができるo 今回の実装では、 DSMの同一アドレスに対して複 数のアクセスが同時に行なわれた場合、競合解消は全 て LAPIに依存している。しかしデータ入力の順番 がLAPIによる競合解消に影響を与えるので、ユー ザは DSMにデ}タを格納する順番を意識してアプ リケ}ションをプログラムしなければならない。

4

実験と評価 今 回 構 築 し た DSMの性能を評価するために、 TCP/IPとUDP/.IPを用いて同様に DSMを構築 し、それらの通信速度を比較する実験を行なった。実 験内容は、 READ、WRITE、WRITE_Bをそれ ぞれ 1000回試行し、その実行時間を比較した。その 結果を以下に示す。 なお、本実験では IBM社のクラスタマシンである RSj6000 SP Thin-66・2を2ノード使用した。また ネットワークには、 RSj6000に実装されている SP スイッチを使用したo 4.1 実験結果と考察 4.1.1 READオペレーション READオペレーションにおいては、 LAPIを用い た場合の処理速度は、 TCPまたは UDP用いた場 合の処理速度よりも、データサイズが小さい場合は 8倍程度、データサイズが大きい場合は 4倍程度速 かった。 READオペレーションは、処理要求の送受信とそ れに対するデータの送受信という 2回の通信を行な わなければならない。そのため TCPや UDPでは メッセージの送受信毎に sendとrecvのような高価 なシステムコールを呼ばなければならない。しかし LAPIは、カーネルを介すことなく他ノードのプロセ スと通信を行なうことができるoまた TCPや UDP でばREADを呼び出す毎に処理要求の解析とデータ tlmo(sec) s 白Sr.t刷.,L A P I = DSr.to噛,TCPII同 = DSr.t田町uo州開園・・・・ 25ト・・・・H・H・...・H・H・...・・・H・H.・・..H・...・"・-...-..・・・・・・H・H・...._... dlltos回(byt同} 図2:READオベレーションにおける実験結果 の転送を行なわなければならないが、 LAPIは1命令 で処理の要求とデータの転送を行なうことができるo さらに LAPIは SPスイッチ専用のライブラリな ので、 SPスイッチ上で非常に高速かつ効率的な通信 を行なうことができるo これらが、 LAPIを用いた方がTCPや UDPを用 いるよりも高速な処理を行なうことができた理由で ある。 4.1.2 WRITEオペレーション tlmo(80C) 3 r--DSMo,抽LAPI巴 = OSM 刷町 TCP河~ DSM 刷町 UDP.~同・圃・・・ U~ ・・・・・・・・・・・・ー・・・ー一..._...一一...

O

'

l

J

J

:

:

:

:

i

A

-

j

i

l

l

i

E

i

i

i

f

i

d

i

i

i

date slze(by回 } 図3:WRITEオペレーションにおける実験結果 WRITEオペレーションにおいては、 LAPIを用 いた場合と TCPまたは UDPを用いた場合とで、 READオベレーション程の処理速度の差は無かっ た。 LAPIを用いた場合の処理速度は TCPや UDP と比べて 3-5倍程度速かった。 WRITE.ォ・ペレ}ションを連続して行なった場合三 受信側のソケットバッファがあふれ、送信されたデ} タの一部が消失する可能性がある。その時TCPでは 再送処理を行なうが、これが全体の処理に対して大き なオ}パーヘッドとなる。実際デ}タサイズが大きい

(5)

時、バッファあふれによるデータの消失が起こった可 能性があり、処理時聞が LAPIやUDPよりも 3倍 程度長くなっている。 またコネクションレスである UDPは、 TCPのよ うな通信の信頼性は無い。図 3ではデータサイズが 大きくなると LAPIを用いた場合と比べて遜色無い 処理速度があるように見えるo じかし実際は、受信側 のソケットバッファの容量に限界があるため、受信側 が送信された全てのデータを受け取っているとは限 らない。この実験では、連続した書き込み要求によっ て受信バッファがあふれたため、多くのデータが消失 した可能性が高い。よって、データサイズが大きい時 の処理速度は LAPIを用いた場合と同程度であるが、 データ消失率が高いので、信頼性のある通信とは言 えない。これを解決するためにはデータの再送処理 などを行ない通信に信頼性を持たせる必要があるが、 そのためにパフォーマンスが低下することは避けられ ない。 LAPIは通信に信頼性があり、かつ高速なデータ転 送が可能である。 TCPの再送処理のオーパーヘッド やUDPの通信におけるデータ消失率を考慮すると、 本実験の環境では LAPIを用いる方が有利であると 言える。 4.1.3 WRITE-Bオペレーション tlme(制槌} DSIA副首lATI=コ OSMo帽rTCpnl'CZl:l!::C OSM尉.rUllP百四国圃・・ 25~ ・・・...・・・・・・ 6・・・・・・・一一一一一一一一--...・・・・・・・H・・...一一一一一一 m

ssagollzo(b向的 図4:WRITE-Bオペレーションにおける実験結果 WRITE-Bオペレーションは、 READオペレー ションのように処理要求の送受信とデータの送受信 という 2回の通信を行なうo処理速度の差は、 TCP やUDPを用いた場合よりも LAPIを用いた場合の 方が、データサイズが小さい場合は 7倍程度、デー タサイズが大きい場合は 4倍程度速かった。 これは READの場合と同様に、システムコール の回数やメッセージ解析の処理などが原因と考えら れるo また TCPやUDPではデータの書き込み確認処理 は確認メッセージの送受信とその解析により行なうが、 LAPIを用いた場合はカウンタ (completioncounter) を利用することで簡単に実現することができる。 4.2 評価 本実験の環境では、 LANにおいて標準的に使用さ れる TCPやUDPを用いて DSMを実装するより も、今回実装した DSMの方がどのオペレーション においても処理速度が速いことがわかったo この理由としては、第 1に使用したネットワーク にあるo 今回使用したネットワークは SPスイッチ であり、 LAPIはSPスイッチ専用のライブラリなの で、 TCPやUDPよりも効率良く処理が行うことが できるからである。 第2に、 TCPやUDPでは通信処理とメモリアクセ スの処理は別々に行なわなければならなが、 LAPIは その2つの処理を 1命令で行なうことができる。よっ てLAPIの方が効率のよい分散共有メモリへのアク セス処理を実現することができる。またWRITE-B オペレーションにおける書き込み確認処理も、 TCP や UDPではメッセージの送受信とその解析を行な わなければならないが、 LAPIを用いるとカウンタを 利用するだけで簡単に実現できるという利点がある。 第3に、ソケットを使用する場合は sendやl'ecv などの高価なシステムコールを使用するので、カー ネルを介すこと無く通信を行なうことができる LAPI の方が、本実験の環境では有利だからであるo これらから、 LAPIはSPスイッチ上で、 TCPの 様に通信の信頼性が高く、かつUDPのように高速な 通信を行なうことができることが分かつた。さらに PUT、GETオペレーションを用いて、リモートなメ モリへのアクセスを簡単に行なうことができるので、 今回構築した DSMへのアクセス機能は比較的容易 に実装することができた。 5 関連研究 現在、 SP2システム上で LAPIの性能を利用した 研究がいくつか行なわれているo Pacific Northwest National Laboratory (PNNL) では GlobalArray(GA)[5Jのパフォーマンスを最適 化するために LAPIを用いたGAの実装を行なって いるoGAとは、科学技術計算アプリケーショシの並 列化による高速化を目的として開発された、可搬性 のある分散共有メモリ型の並列プログラミングモデ ルである。 また、オハイオ州立大学では MPIをLAPIを用 いて実装する研究が行なわれている

[

1

0

]

0

SP2シス テム上の MPIでは HPSを利用した高速な通信が可 能だが、通信のときにユーザインターフェース部分 とHPSの間で余分なバッファコピーが起こるoこの ユーザインターフェースと HPSの聞を LAPIを用 いて実装することで、バッファコピーのオーバーヘッ

(6)

ドを回避している。どちらの研究においても、 LAPI の高い通信能力が示されている。 今後我々は、我々の研究室で研究、開発されている 分散並列処理環境であるDSE[2]をLAPIの上に実装 する研究を行なう予定である。 DSEは分散共有メモリ型の並列プログラミング環 境であり、可搬性を考慮してマルチプラットフォーム で実装されている。 GAとは異なり、並列処理を行な う場合の問題点を調べたり、並列処理動作をモニタリ ングすることによって問題の分析に必要なデータの収 集を行なうことができる。

現在 DSEはLAN上に TCP/IPを用いて実装さ れている。しかしノード問で通信するたびにsendや recvなどの高価なシステムコールを使用するため、こ れらが処理のネックになっている。これを解決するた めに、 DSEの並列処理機能をLAPIを用いて実現す る予定である。 例えば、 DSEでは複数のノードでプロセスを並列 に実行させることで並列処理を行なうが、この機能 をLAPIのアクテイプメッセージの機能を利用する ことで実現することができるoまた分散共有メモリの 実現とそのアクセス機能は、今回実装した DSMを 利用して実現することができる。

6 まとめと今後の課題

本稿では、将来的にクラスタマシン上に分散共有メ モリ型並列処理環境を実装するための予備調査とし て、 LAPIを用いて SP2システム上へのDSMの実 装を行なったoそして実装した DSMの性能を調査す るために、 TCPとUDPを用いて同様に実装を行な い、それらの通信速度を比較する実験を行なったoそ の結果、 LAPIを用いて実装した DSMの方がTCP や UDPを用いたものよりも通信性能において優れ ていることが分かった。また今回は、 LAPIを利用 する上での制約や、 SPスイッチ上でのLAPIの高い 通信性能を確認することもできたo 今回の実験結果から、 SPスイッチ用に LAPIを用 いて DSEを実装すると、ノード開通信のオーバ} ヘッドが削減されて DSEの処理能力が向上する見込 みが得られたo今後は、今回の実験を基に DSEを構 築し、 DSEの並列処理能力の向上を目指す予定であ る。またその他に、 DSEの基本機能である可変ネッ トワークトポロジーの実現や並列処理動作のモニタ リング機能なども実現しなければならない。さらにそ の後には、不規則な通信パターンを持つアプリケー ションを作成して再度システムの評価を行なう必要が あると思われる。 参考文献 [1] T. Agerwala

J.L. Martin

J.H. Mirza

D.C. Sadler

D .M. Di

M. Snir

SP2 System Archi -tecture

IBM Systems Journal

34(2)

pp.152岬 184

1995. [2] Tatsuya As錨 u

Bernady O. Apduhan

Itsujiro Arita

Towards a Portable Cluster Computing Enyironment Supporting Single System Ima岳町 In Proc. ICPP'99・MMNSWorkshop,.pp. Sept. 1999.

[3] IBM.PSSP for AIX : Commα叫 αn吋dTechn

i4

c α1 References, rel 2.4, document GC23・3900・ 05

IBM Corporation

1998. μ]ffiM..PSSP for AIX " Adminis.tration Guide: The Communicαtions Low-Level Application Programming lnterface

rel 2.4

document GC23-3897・05

IBM Corporation

1998.

[5] Gautam Shah

et al

Performance and Expe・

rienc.e with LAPI -A New High-Performance Communica.七ionLibrary for the IBM RS/6000 SP

In Proc. of the InteT'・nationalPara"el Pro -cessing Symposium

pp..~60・267,March 1998. [6] Message Passing II山rface Forum. MPI: A Message-Passing lnterface Standαrd

March 1994. [7] M. S

P.Hochschild

D.D.Fryre

K.J. Gildea

The Communication Software and Parallel En -vironment of theIBM SP2

IBM Systems Jour -nal

34(2)

pp.205・221

1995. [8] C.B. Stunkel

et al

The SP2 High-Performance Switch

IBM Systems Journal

34(2)

pp. 185・ 204

1995. [9] T. von Eiken"D.E. Culler

S.C. Goldstein

K.E. Schauser

Active Messages: A Mechanism for Integrated Communication and Computation

In Proc. lntemαtional Symposium on Computer A rchitecture

pp. 256・266

1992.

[10] Moh組 問ad B叩 ikazemi

Rama K. Govin

-daraju

Robert Blackmore叩 dDhabaleswar K.

Panda

Implementing Efficient MPI on LAPI for IBM RSj6000 SP System: Experiences and Performance Evaluation

In Proc. Intema -tional Pαrallel Process仇,9Symposium

pp.183画 190

1998.

[

l

1

J JoseMiguel

Agustin Arruabarrena

Ramon Beivide and Jose Angel Gregorio

Assessing the Performance of the New IBM SP2 Communi-cation Subsystem

IEEE Pαrallel & Distributed

表 1 :LAPI f u n c t i o n a l i t i e s   Operations  I n i t i a l i z e  Terminate  Active Message  Data T r a n s f e r   Functions LAPLInit LAPLTerm LAPLAmsend LAPLPut  Data T r a n s f e r  I  LAPLGet  Mutual E x c l u s i o n   I  LAPLRmw  S e t  the

参照

関連したドキュメント

また自分で育てようとした母親達にとっても、女性が働く職場が限られていた当時の

親子で美容院にい くことが念願の夢 だった母。スタッフ とのふれあいや、心 遣いが嬉しくて、涙 が溢れて止まらな

* 広告や機能は条件によってはご利用いただけない場合があります。

彼らの九十パーセントが日本で生まれ育った二世三世であるということである︒このように長期間にわたって外国に

に至ったことである︒

津波到達直前の 11 日 15 時 25 分に RCIC は原子炉水位高により自動停止して いたが、 3 号機は直流電源が使用可能であったため、 16 時 03

荷台へは養生がされて おり、扱いも慎重であっ た為、積込み時のポリ エチレン容器及びビ ニール袋の破損の可能

 2014年夏にあったイスラエルによるガザへの軍事侵