• 検索結果がありません。

相互結合網の転送パターンと定常・非定常性能について

N/A
N/A
Protected

Academic year: 2021

シェア "相互結合網の転送パターンと定常・非定常性能について"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)Vol.2010-ARC-190 No.18 2010/8/4. 情報処理学会研究報告 IPSJ SIG Technical Report. 1. は じ め に. 相互結合網の転送パターンと 定常・非定常性能について 横. 田. 隆. 史†1. 大. 津. 金. 光†1. 馬. 場 敬. 並列計算機の規模は拡大の一途を辿っており,その通信を司る相互結合網に関する研究の 重要性は依然として高い.こうした相互結合網については,物理メディアからトポロジ,ス イッチング方式,ルーティングアルゴリズムなど様々な階層において盛んに検討が加えられ 続けている.. 信†1. 言うまでもなく相互結合網方式の選定にあたっては,現実性を備えることを大前提としな がらコストおよび効果(性能)を客観的に評価しなければならない.これまで行われてきた. ルーティングアルゴリズムはトポロジの制約内で通信性能を改善するための手法と して多くの検討が行われ,多くの場合,一定の通信パターンでの定常状態における性 能が議論されてきた.しかし実際のアプリケーションでは,大多数の局面において, 通信パターンには従うが定常状態とならない通信が行われると考えられる.このため 相互結合網方式の評価について定常性能の議論だけでは十分でなく,実践に即した非 定常性能について議論をすることが求められる.本稿では,議論のための初期的な評 価として,いくつかの転送パターンでの一斉同期通信を仮定し,定常性能と比較する ことにより非定常通信の性能について予備的な評価を行った結果を報告する.. ほとんどの評価では,人為的な通信パターンを仮定した下での定常性能か,あるいは実際の 並列アプリケーションでの通信をエミュレートしたアプリケーション性能が使われている. 前者の評価手法では,送信先をランダムに選択する等の適当な通信パターンを設定したう えで連続的に転送を行い,与えた投入転送負荷に対する定常状態での評価値の統計量を求め る方法が多く用いられている1),2) .通常,定常状態に達するまでの挙動性能は無視され,評 価値として単位時間あたりの転送量(スループット)や相互結合網での転送遅延の平均(平 均レイテンシ)が用いられる. また後者に属する評価手法では,NAS Parallel Benchmarks (NPB) 等の広く流通してい. Preliminary Study on Steady/Unsteady Performance of Interconnection Network in Some Traffic Petterns. るベンチマークプログラムを用い,その通信をシミュレータ上で模擬することで性能を測定 している.ベンチマークプログラムのいくつかは通信インテンシブな特徴を持つため,相互. Takashi. Yokota,†1. Kanemitsu and Takanobu Baba†1. Ootsu†1. 結合網の性能が並列プログラムの実行性能に直結することになる. 前者の評価手法は,現実のシステムで行われるさまざまな通信を特定の通信パターンに代 表させ,その通信パターンにおける通信特性(入力負荷に対する性能)を表すものであり,. Many routing algorithms are discussed for improving communication performance of interconnection networks under certain constraints of topology. Most researches evaluate steady-state performance under some communication patterns. Most parallel applications employ such communication patterns, but their comunications are unsteady in most cases. Thus, steady-state performance is not always appropriate for realistic evaluation of network methods. We intend to introduce unsteady performance evaluation, and this paper presents some preliminary results of our experiments.. 相応の妥当性をもって理解されている.一方,後者の評価手法は,前者の手法で測りきれな い正味の性能を表すものとして,その妥当性を理解されている.こうした理由により多くの 評価では,前者のみあるいは両者の組合せを用いている.しかし,この 2 種の評価手法だけ で相互結合網の性能を表現できているのであろうか.また評価の客観性が保たれているだろ うか.この疑問が我々の一連の研究の源泉となっている. たとえば,前者の評価手法においては,転送負荷量をパラメータとして,負荷に対するス ループットや平均レイテンシの評価値をシミュレータ等により測定し,2 次元グラフの形式 で性能特性を表現する.このため,相互結合網方式の間の比較は,すなわち,特性グラフの 形状を比較することになる.しかし 2 次元グラフの形状の比較では,方式間の優劣を定量的. †1 宇都宮大学 Utsunomiya University. に表すのが困難である.我々は,まずこの点に着目し,定量的評価手法を提案した4)–6) .. 1. c 2010 Information Processing Society of Japan .

(2) Vol.2010-ARC-190 No.18 2010/8/4. 情報処理学会研究報告 IPSJ SIG Technical Report. そのつぎに我々が疑問を呈し本稿での主題とするのは,特定の人為的通信パターンでの連 続転送性能をもって「相互結合網の性能」を代表させることの妥当性である.現実のアプリ ケーションでは,特定の通信パターンが最初から最後まで同じペースで連続していくケー スはまれであろう.様々な通信パターンが,1回あたりの通信量の多寡とともに,さまざま. 内容. trns shfl. 転置.(x, y) −→ (y, x) シャッフル.(xn−1 , xn−2 , ..., x1 , 0) −→ (0, xn−1 , xn−2 , ..., x1 ), (xn−1 , xn−2 , ..., x1 , 1) −→ (1, xn−1 , xn−2 , ..., x1 ) ビット反転.(xn−1 , xn−2 , ..., x1 , x0 ) −→ (xn−1 , xn−2 , ..., x1 , x0 ) ビット逆順.(xn−1 , xn−2 , ..., x1 , x0 ) −→(x0 , x1 , ..., xn−2 , xn−1 ) ビット回転.(xn−1 , xn−2 , ..., x1 , x0 ) −→(x0 , xn−1 , xn−2 , ..., x1 ) 一様ランダム. (比較用) ランダム・ペア(ランダムに選んだ 2 つのノードの組で通信する). ランダム選択(ランダムに選択.必ずしもペアにならない).. bcmp brev brot rand rpar rsel. なバリエーションを持って出現するものと考えるほうが自然と考えられる.こうしたアプリ ケーションの自然な特性に対して,評価手法が適合しているといえるのか,さらには適切な 評価指標になっているのか.これらの課題を本稿の主題とする. 相互結合網方式の現実的な性能評価を考えるには,現実的なアプリケーションの下での実. 表 1 本稿で用いる転送パターン. 記号. 効的な性能を考えねばならない.ここで連続的な通信による定常性能と,特定のアプリケー. . ションの仮定の下での性能のみを用いるのは適当とは言えまい.一過性の通信による非定常. rmax. NP M =. 性能を考えるべきではないか.このような考えのもとに本稿では,いくつかの典型的な通信. fq (r)dr. (1). rmin. パターンについて,定常性能が非定常状態での性能を反映するのか,非定常性能をうまく表. fq (r) = θ(r)/τ (r). (2). すための手法は考えられないのか,非定常性能の評価手法を体系化できないのか,さらに,. である.臨界転送負荷はスループットが飽和するまでの投入転送負荷の上限を示し,NPM. 評価指標として定量化できないのか,基礎的な議論・評価を行う.. はスループットを平均レイテンシで割ることで得られる性能指数 (figure of merit) を表す. 臨界転送負荷 rc は,たとえば文献 5) に N × N の 2 次元トーラス網について近似解. 2. 定量的評価手法による定常性能評価. Rc (N ) = 8/N [flits/cycle] が求められている.シミュレータによる実験においても,ラン. 2.1 定量的評価手法. ダム転送パターンにおいて,結合網のサイズ N の増加に伴い臨界転送負荷が 8/N に漸近し. まず,非定常性能の検討に先立って,定常性能について整理しておく.本稿では文献 5). ていくことが確認されている.本稿においては,転送負荷を上記の臨界転送負荷 Rc に対す. で提案した定量的評価手法を用いて表現する.これは,投入転送負荷 r に対するスループッ. る割合で表記する.. 2.2 定常性能評価. ト θ(r) と平均レイテンシ τ (r) のグラフをもとに,臨界転送負荷 rc ,網性能指標 (NPM) の. 表 1 に本稿で用いた通信パターンの一覧を,また表 2 にルーティングアルゴリズムの一. 2 つの指標に射影することより定量的な性能評価を可能にするものである. 投入転送負荷 r が小さいとき,これにほぼ比例したスループット θ(r) が得られる(θ(r) ∝. 覧を示す.相互結合網は,N × N の 2 次元トーラス網(トポロジ)であり,各ルーティン. r ).しかし,r が大きくなると比例関係が崩れ遂には飽和する.臨界転送負荷 rc は,投入. グアルゴリズムに必要な数の仮想チャネルを設ける.また,8 × 8 の 2 次元トーラス網上で. 転送負荷に対しスループットが降伏する点により定義される.現実にはバラつき等の理由に. 次元順ルーティングにより表 1 の各パターンでの通信を行ったときのパケットの全経路を. より正確な降伏点を求めるのが困難であるから,文献 5) では,rc を,r に対する θ(r) の傾. 図 1 に示す.図中,矢印の色は当該パケットが使用する仮想チャネルを示している.ここで. きが,r が十分に小さいとき (r  0) の傾きの 50%になるときの r の値と規定している.. はパケット生成時の仮想チャネル番号を 0 とし,パケットが 2 次元トーラスでのラップア. 網性能指標 NPM (Network Performance Measure) は,スループットを平均レイテンシで割っ. ラウンドに設定した date-line を越えるたびに仮想チャネル番号を 1 増すものとした.赤色 がチャネル 0,緑色が 1,青色が 2 である.. たものを特徴量 (ferature quantity) とし,その特徴量を投入転送負荷の特定の区間で積分し たものと定義される.文献 5) では,rmin = 0 から rmax = Rc (ただし Rc は理論臨界転. 定常性能は,投入転送負荷に対するスループットと平均レイテンシが求められればよいた め,様々な通信パターンで求めることができる.各通信パターンでのスループットの評価結. 送負荷:後述)の区間で定義している.すなわち,. 果を,ルーティングアルゴリズムごとに図 2 に示す.32 × 32 の 2 次元トーラス網での結果. 2. c 2010 Information Processing Society of Japan .

(3) Vol.2010-ARC-190 No.18 2010/8/4. 情報処理学会研究報告 IPSJ SIG Technical Report 2500. 次元順. (x 軸 rightarrow y 軸の順にルーティング). Duato’s Protocol(1 本の仮想チャネルによる最短経路適応ルーティングと 3 本の仮想チャ ネルによる次元順ルーティング). Duato’s Protocol(1 本の仮想チャネルによる非最短経路適応ルーティングと 3 本の仮想チャ ネルによる次元順ルーティング). Cross-Line ルーティング(仮想チャネル 6 本による最短経路適応ルーティング.準広域情報 を使用5) ).. df cl ※. 2000 1500 1000 500. 0 0.0Rc. パケットは 8 フリット(固定)により構成され,ルータの各入力ポートに仮想チャネルごとに 2 パケット分(16 フリット)のバッファを備えてるものとした.. 0 1 2 3 4 5 6 7. 0 1 2 3 4 5 6 7. 0 1 2 3 4 5 6 7 (a) trns 0 1 2 3 4 5 6 7. 0 1 2 3 4 5 6 7 (d) brev. 0 1 2 3 4 5 6 7. 0 1 2 3 4 5 6 7. 0 1 2 3 4 5 6 7 (b) shfl 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7. 0 1 2 3 4 5 6 7. 0 1 2 3 4 5 6 7 (e) brot. 0 1 2 3 4 5 6 7. 1800 1600 1400 1200 1000. 2000 1500. trns shfl bcmp brev brot rand rpar rsel. 1000 500 0 0.0Rc. 1.0Rc. 0.2Rc. 600 400 200 0.2Rc. 0.4Rc. 0.4Rc 0.6Rc offered load. 0.8Rc. 1.0Rc. 0.8Rc. 1.0Rc. (b) dp 2500. 800. 0 0.0Rc. 0.6Rc. 0.8Rc. 1.0Rc. 2000 1500. trns shfl bcmp brev brot rand rpar rsel. 1000 500 0 0.0Rc. 0.2Rc. offered load. 0.4Rc. 0.6Rc. offered load. (c) df. (d) cl 図 2 定常性能評価の例:スループット. フの形状ではなく),(rc , N P M ) の 2 つの数値の組で表すことができる.相互結合網方式. 0 1 2 3 4 5 6 7. 0 1 2 3 4 5 6 7. 0.8Rc. trns shfl bcmp brev brot rand rpar rsel. 0 1 2 3 4 5 6 7 (c) bcmp 0 1 2 3 4 5 6 7. 0 1 2 3 4 5 6 7. 0 1 2 3 4 5 6 7. throughput [pakcets/100 cycles]. 0 1 2 3 4 5 6 7. 0 1 2 3 4 5 6 7. 0 1 2 3 4 5 6 7. 0.4Rc 0.6Rc offered load. 2500. (a) do 2000. 0 1 2 3 4 5 6 7. 0.2Rc. throughput [pakcets/100 cycles]. do dp. 3000. trns shfl bcmp brev brot rand rpar rsel. throughput [pakcets/100 cycles]. 本稿で用いるルーティングアルゴリズム. 内容. throughput [pakcets/100 cycles]. 表2. 記号. ごとにこれら 2 つの指標の組合せで示したグラフ(性能マップ)を図 3 に示す.図中,同一 の通信パターンのものが,次元順 (do)– Duato’s Protocol(最短経路) (dp)– Duato’s Protocol (非最短経路) (df)– Cross-Line (cl) の順に直線で結んで示している.性能指標は転送パターン. により値が大きくばらつくものの,多くの通信パターンで同様の傾向があることがわかる.. 3. 非定常性能. 0 1 2 3 4 5 6 7 (f) rpar. 本稿では,ノード間での通信方法として,ある時点で全ノード一斉に通信パターンに従っ. 図 1 通信パターン(次元順ルーティングでの転送経路). た所定の送信先に一定量のパケットを送出開始し,その後,全ノードでそれらのパケットを である. (以降,特に記載のない場合は 32 × 322 次元トーラス網での結果である).いずれも. すべて受信し終えるまで同期することを仮定する(一斉同期通信と呼ぶ).多くの並列アプ. 横軸は投入転送負荷 r (理論臨界転送負荷 Rc に対する相対値)であり,縦軸はスループッ. リケーションではこうした転送が行われるものと想定される.ここでは,通信を開始してか. トとして 100 サイクルごとの受信パケット数を示している.各曲線に付けられている短い. ら全ノードの全パケットを配送し終えるまでの時間 (duration) を性能指標として用いる.こ. 縦線は,それぞれの方式・通信パターンで測定された臨界転送負荷 rc の位置を示している.. うした非定常通信の性能が定常性能評価の結果(図 3)から外挿されるものかを実験的に検. 上述の定量的評価手法を用いることにより,相互結合網方式の性能は, (図 2 のようなグラ. 証する.. 3. c 2010 Information Processing Society of Japan .

(4) Vol.2010-ARC-190 No.18 2010/8/4. 情報処理学会研究報告 IPSJ SIG Technical Report. 3.5 3. trns shfl bcmp brev brot rpar rsel. 2.5 2. 10000. do dp df cl. duration [cycles]. 4. duration [cycles]. 1000. 10000. do dp df cl. 1000. 1.5 1. 100. 0.5 0.2. 図3. 0.3. 0.4 0.5 0.6 critical load ratio [Rc]. 0.7. 100 1. 0.8. 10 message size [packets]. 100. 1. (a) trns. 定量的評価手法に基づく性能マップ. duration [cycles]. 3.1 メッセージ量と同期時間 まず,同期 1 回あたりに転送されるメッセージの量に着目する.これは,連続転送を前提 とする定常性能の評価では存在しないパラメータである.. 10000. 10 message size [packets]. 100. (b) shfl. do dp df cl. duration [cycles]. Network Performance Measure. 4.5. 1000. 10000. do dp df cl. 1000. 各ノードは一定数 (l 個) のパケットを連続的に結合網に一斉に投入する.メッセージ量 が少ない場合には,各ルータに散在するバッファの緩衝効果により輻輳が大幅に緩和され. 100. 100 1. る(ないしは発生しない)ために性能差が大きく表れないものと予想されるが,逆に,メッ. 10 message size [packets]. 100. 1. (c) bcmp. duration [cycles]. のと期待される. さらに本稿では背景通信の有無による性能差をも検討する.実際の使用状況では,一斉同 期通信の前後に他の通信が行われている可能性がある.このため,一様ランダム通信パター ンによる背景通信(負荷率 rb )を仮定し,rb の有無による一斉同期通信の性能の差も測定 した.図 4 に,各通信パターンにおいて背景通信 rb = 0.2Rc のときの通信量と一斉同期. 10000. do dp df cl. 1000. 100. 10000. do dp df cl. 1000. 100 1. 時間との関係を示す.横軸がメッセージ量(パケット数:1 パケットは 8 フリットにより構. 10 message size [packets]. 100. 1. (e) brot. 成),縦軸が同期完了までの時間(クロックサイクル数)を示している.両軸とも対数で表. 100. (d) brev. duration [cycles]. セージ量が多い場合は結合網が著しく輻輳するため,アルゴリズムによる差が顕著になるも. 10 message size [packets]. 10 message size [packets]. 100. (f) rpar 図 4 通信量と同期時間の関係. 示していることに留意されたい.同期性能は,メッセージ量 10 [packets] 以上でほぼ線形に 増加することがわかる.ただし,非適応ルーティング (do) と適応ルーティング(do 以外) では,shfl, brot において同期時間の増加の傾きが明らかに異なっている.また,背景通信. 数:1 パケットは 8 フリットにより構成)である.ここでの通信パターンは shfl である.さ. の有無(rb = 0 および rb = 0.2Rc )で比較すると,メッセージ量によらずほぼ一定の係数. らにここでは,背景通信 rb = 0.2Rc を仮定しており,グラフ中の受信パケット数(縦軸). で同期時間が増加することもわかる.. には背景通信分は含んでいない.また,これらの時間経過波形は一斉同期通信 100 回の試 行の平均である1 .. 次に,一斉同期通信の開始から終了までの間,一定時間あたりに受信されたパケットの数 を記録した.図 5 に,同期通信パケットのウインドウ時間あたりの受信数の経過を,ルー. 1 100 回の試行を行ったのは,同期時間が相当にばらついたためである.たとえば図 5(d)(cl)の l = 100 のグ ラフの t = 1600 ∼ 2000 の区間において,ノイズのような波形形状が記録されているが,これは,ばらつきが. ティングアルゴリズムごとに示す.l が一斉同期通信 1 回あたりのメッセージ量(パケット. 4. c 2010 Information Processing Society of Japan .

(5) Vol.2010-ARC-190 No.18 2010/8/4. 情報処理学会研究報告 IPSJ SIG Technical Report. throuhput [packets/10 cycles]. 100. わかる.当初,大きな l では過渡状態ののち同じ調子で転送が行われる(定常状態に近くな る)ものと推測したが,ほとんどのルーティングアルゴリズムでは,そうなっていないこと が判明した.たとえば,l = 100 の波形は l = 50 でのそれを時間軸方向に引き伸ばした形 状になっている.また,時間経過波形は,ルーティングアルゴリズムにより大きく異なるこ ともわかる.. 140. l=1 l=2 l=5 l=10 l=20 l=50 l=100. 90 80 70 60. throuhput [packets/10 cycles]. いずれのルーティングアルゴリズムにおいても,l ≥ 10 で同様の時間経過をとることが. 50 40 30 20 10. 100 80 60 40 20. 0. 時間経過波形がルーティングアルゴリズムごとに特異な形状となっており1 ,さらに,メッ. 0 0. 5000 10000 15000 20000 25000 30000 35000 40000 time [cycles]. 0. (a) do throuhput [packets/10 cycles]. るのか.たとえば,図 5(b), (c) の l = 50, 100 に着目しよう.これらの時間経過波形では, いったんスループットが低下した後,再び上昇してピークとなり終息する傾向が顕著に現れ ている.輻輳は各ノードから出されたパケットの相互の干渉により発生する.こうしたス ループットの変化は,結合網内部での輻輳の状況が変化していることを表していると考える べきであり,通信パターン・ルーティングアルゴリズムにより輻輳状況に変化(フェース) が発生しているものと考えられる.. 100 80 60 40 20. 20000. 25000. l=1 l=2 l=5 l=10 l=20 l=50 l=100. 120 100 80 60 40 20 0. 0. 5000. 10000. 15000. 20000. 25000. time [cycles]. 図5. 0. 2000 4000 6000 800010000 12000 14000 16000 18000 20000 time [cycles]. (c) df. 前節の評価では所定のサイズのメッセージを連続的に投入することを前提としたが,本節. 10000 15000 time [cycles]. 140. l=1 l=2 l=5 l=10 l=20 l=50 l=100. 0. 3.2 メッセージ生成頻度と同期時間. 5000. (b) dp. 120. throuhput [packets/10 cycles]. セージ量によって時間軸方向に対してほぼ相似になっている.これらの結果は何を意味す. l=1 l=2 l=5 l=10 l=20 l=50 l=100. 120. (d) cl 一斉同期通信における時間経過特性(通信パターン:shfl). では演算と通信を並行して行う状況を考える.つまり,演算を行いながら他ノードに送るべ きデータが生成できたら順次送信する,そのため個々のノードからのパケット送出は連続で. 異なる.たとえば,図 2(c) では臨界転送負荷以上においてスループットの大幅な降伏があ. はなく疎になる,との考えに基づいた通信設定である.この問題を定式化するため,一斉同. るが,図 6(c) では大きな降伏は認められず,転送負荷に対してなだらかに変化している.. 期通信のしかたは 3.1 節と同様とするが,ただし個々のパケットの投入を連続的でなく,所. では,ルーティングアルゴリズムによる差はどうか.図 7 に通信パターン trns, shfl, brot,. rpar のときの過渡特性(図 5 と同様のスループットの時間経過)のグラフを示す.ここでも. 定転送負荷率 (r) による Bernoulli プロセスに従い行うものとした. 図 6 に投入転送負荷に対する一斉同期通信性能(過渡特性)のグラフを示す.この図では,. 同期通信 1 回あたりのメッセージ量は 10 パケットである.trns や rpar 等ではどのルーティ. 2. 定常性能との比較を容易にするためにスループットに相当する性能を同期時間の逆数 によ. ングアルゴリズムも類似した波形形状で推移している一方で,shfl, brot では大きく異なっ. り求めている.同期通信 1 回あたりのメッセージ量は 10 パケットである.. ていることがわかる.また,同期時間について,後者 2 つの通信パターンで,適応・非適応. これらの結果を図 2 に示されている定常性能と比較する.まず,転送負荷が低い段階では. ルーティングの差異が著しく大きいことがわかる.すなわち,適応ルーティングの効果は, 通信パターンにより大きく異なることがわかる.. 通信パターンによらず負荷に比例したスループット性能が得られていることがわかる.この 点は定常性能と同様である.また,一定の転送負荷以降で性能が飽和することも定常性能と. 図 8 に背景通信 rb = 0.2Rc での一斉同期通信の平均時間を示す.同期通信 1 回あたりの. 同様であるが,図 2 と比較すると飽和のポイント(臨界転送負荷に相当)やカーブの形状が. メッセージ量は 10 パケットである.ルーティングアルゴリズム間の性能順位は,定常性能 によるもの(図 2 や図 3)と必ずしも符合していないことがわかる.また,通信パターン. 反映されたものである. 1 本稿では記載を省略しているが,通信パターンによっても異なっている. 2 1,000 サイクルあたりの平均同期回数. によって,ルーティングアルゴリズム間の差異の傾向が大きく異なる.たとえば,trns や. rpar, rsel ではルーティングアルゴリズム間の差がさほど大きくないが,その一方で,brev,. 5. c 2010 Information Processing Society of Japan .

(6) Vol.2010-ARC-190 No.18 2010/8/4. 情報処理学会研究報告 IPSJ SIG Technical Report. 0.2 0 0.0 Rc. 0.2 Rc. 0.4 Rc 0.6 Rc 0.8 Rc offered load [xRc]. 1 0.8 0.6 0.4 0.2. 0 0.0 Rc. 1.0 Rc. 1 0.8 0.6 0.4 0.2. 0 0.0 Rc. 0.2 Rc. 0.4 Rc. 120 100 80 60 40 20. 0.4 Rc 0.6 Rc 0.8 Rc offered load [xRc]. 1.0 Rc. 0.6 Rc. 0.8 Rc. 1.0 Rc. 1.4 1.2 1. 0.6 0.4 0.2 0.6 Rc. 0.8 Rc. offered load [xRc]. offered load [xRc]. (c) df. (d) cl 図6. 60 50 40 30 20 10 0. 5000 10000 15000 20000 25000 30000 35000 40000 time [clock]. (b) shfl 250. do dp df cl. 160 140 120 100 80 60 40 20 0. 0.4 Rc. 70. (a) trns. 0.8. 0.2 Rc. 80. 2000 4000 6000 800010000 12000 14000 16000 18000 20000 time [clock]. 180. trns shfl bcmp brev brot rpar rsel. 0 0.0 Rc. do dp df cl. 90. 0 0. (b) dp 1.6. trns shfl bcmp brev brot rpar rsel. throughput [times/1000 cycles]. throughput [times/1000 cycles]. 1.2. 140. 0 0.2 Rc. (a) do 1.4. 100. do dp df cl. 160. throuhput [packets/10 cycles]. 0.4. 1.2. 180. trns shfl bcmp brev brot rpar rsel. throuhput [packets/10 cycles]. 0.6. 1.4. throuhput [packets/10 cycles]. 0.8. 1.6. trns shfl bcmp brev brot rpar rsel. throuhput [packets/10 cycles]. 1. throughput [times/1000 cycles]. throughput [times/1000 cycles]. 1.2. 1.0 Rc. do dp df cl. 200 150 100 50 0. 0. 5000 10000 15000 20000 25000 30000 35000. 0. 5000. time [clock]. 10000. 15000. 20000. 25000. time [clock]. (c) brot. (d) rpar. 図 7 一斉同期通信における転送特性(通信量:100 パケット). 一斉同期通信における転送負荷と性能. duration [cycles]. brot 等では do が他の倍近くの同期時間を要している. 3.3 定常性能と非定常性能との関係 ここで,前節までに得られた結果をもとに,定常性能と非定常性能との関係を調べよう. 連続通信性能(定常性能)のグラフ(図 2)から,ルーティングアルゴリズムごと,通信 パターンごとの臨界転送負荷 rc が求められる.また,一斉同期通信についても,図 6 にお. 3000 2500 2000 1500 1000 500 0. do dp df cl. trns. いて投入転送負荷率に対する同期通信性能(1000 サイクルあたりの同期回数の平均値=同. shfl. bcmp brev. brot. rpar. rsel. 図 8 rb = 0.2Rc での平均同期時間. 期時間の逆数の 1000 倍)が与えられていることから,図 2 と同様に臨界転送負荷を求める ことができる1 .こうして求めた,定常・非定常状態それぞれの臨界転送負荷の値の相関を. せた結果を示している.. 求める.その結果を図 9(a) に示す.図中,横軸が定常性能での臨界転送負荷,縦軸が非定. 次に,定常性能(連続通信性能の臨界転送負荷:図 9(a) と同じ)と,図 4 から求められ. 常状態(一斉同期通信)での臨界転送負荷を示す.相関係数は 0.91 であり,両者に強い相. る非定常性能(一斉同期性能)との関係を図 9(b) に示す.図の横軸は図 9(a) と同じであり,. 関があることがわかる.図中の直線は,評価結果をもとに最小二乗法により一次式に近似さ. 縦軸は同期時間の逆数に 1000 を乗じたものであり,1000 サイクルでの同期回数の平均値 となる.同期通信 1 回あたりのメッセージ量は 10 パケットである.ここでも,両者に強い 相関が認められる(相関係数 0.93).. 1 ただし,図 6 では 0.1Rc 刻みでしか測定していないため,ここで得られる臨界転送負荷の精度は 1 桁しかない ことに留意されたい.. このような統計処理によれば,定常性能と非定常性能の間にきわめて強い相関があること. 6. c 2010 Information Processing Society of Japan .

(7) Vol.2010-ARC-190 No.18 2010/8/4. 0.9 0.8 0.7 0.6 0.5 0.4. 1.2 1 0.8 0.6. 0.3 0.4 0.5 0.6 rc (continuous) [flits/cyc/node]. 0.7. 6000 5000 4000 3000 2000. 0.3 0.4 0.5 0.6 rc (continuous) [flits/cyc./node]. の関係(相関係数:0.91). 6000 5000 4000 3000 1000 0. 0. 0.7. 7000. 2000. 20. 40. 60 80 network size. 100. 120. 140. 0. 20. (a) trns. (a) 連続転送性能,一斉同期通信における臨界転送負荷 (b) 連続転送での臨界転送負荷と一斉同期通信性能の関 図9. 8000. 0. 0.2. do dp df cl. 9000. 1000. 0.4 0.2. 10000. do dp df cl. 7000 duration [cycles]. 1. 8000. do dp df cl. 1.4. duration [cycles]. do dp df cl. 1.1. throughput [num. synch./1000 cycles]. rc (synchronous) [flits/cyc/node]. 情報処理学会研究報告 IPSJ SIG Technical Report. 40. 60 80 network size. 100. 120. 140. (b) brev 図 10 一斉同期通信時間のサイズ依存性. 係(相関係数:0.93). 連続通信性能と一斉同期通信性能との関係. テップとして,一斉同期通信をとりあげ,連続転送性能(定常性能)との比較の観点から が導かれる.しかし,相関係数 0.91 ないし 0.93 の値をもって,定常性能から非定常性能を. 種々の評価を行った.. 推定ことが妥当であるとは言えない.たとえば,図 9(b) において,横軸(連続転送での臨. 全体的な傾向としては,図 9(a), (b) に示したように,定常性能と非定常性能との間に強. 界転送負荷 rc )0.2∼0.3,同 0.4∼0.5 の区間では大きく分散しており,明確な相関を認め. い相関が認められる.しかし詳細に見ると,通信パターンごとのバラツキが大きいために,. ることができない.すなわち,連続転送性能はマクロ的な目安として使うことはできるが,. 必ずしも定常性能が非定常性能を代表するとまでは言えない.非定常性能においては,全般. 非定常性能を表すには精度が低く十分とは言えない.. 的に適応ルーティングが非適応ルーティングを上回っているが,適応ルーティング間の比較. 3.4 結合網サイズとの関係. においては,通信パターンごとの差異が大きく,定量的な評価手法を導出するまでには至っ. つぎに,相互結合網の規模と非定常通信性能との関係を評価した.N × N の 2 次元トー. ていない.. ラス網(N = 32, 64, 128)における,1 回あたりのメッセージ量 10 パケットでの一斉同期. 本稿で用いた通信パターンでは,図 1 に示したように転送が行われる.この図ではすべ. 時間を図 10 に示す.図 10(a) が通信パターン trns の場合であり,(b) が brev の場合であ. ての発信・受信ノードの組合せの経路を矢印で表している.このため,同じリンクを通過す. る.グラフは測定点の間を結んだものではなく,ルーティングアルゴリズムごとに得られた. る矢印の本数から,そのリンクでの通信負荷を推測することができる1 .これから,通信パ. 3 点の測定結果をもとに,最小二乗法により一次式に近似させた直線である(このため図中. ターンごとにリンク通信量に大きな偏りがあり,このために,連続通信性能が一様ランダム. には直線上に乗っていないプロットがある).. 通信より劣るものと説明できる.さらに,輻輳の迂回能力が高いルーティングアルゴリズム. いずれの場合も,非適応ルーティング(do)では規模の増加に伴い著しく同期時間が増加. では,特定のリンクに通信が集中するのを緩和することで結果的に性能が向上するものと期. している(同期性能が悪化している).また,trns では適応ルーティングはいずれも同様の. 待されるのだが,図 8 の結果は,輻輳回避能力の高低がそのまま同期通信性能を表すもので. 傾向であるのに対して,brev ではアルゴリズムごとの差異が大きく,一定の傾向は認めら. はないことを示している. 大規模な並列システムを構築するにあたっては,非定常性能などの実効的な性能をあらか. れない.. じめ正確に把握しておく必要があろう.今後は,collective 通信など他の非定常通信に拡大. 4. お わ り に. 1 ただし,各パケットがそのリンクを通過する時間が違う可能性があるために,あくまで目安と考えるべきである.. 本稿では,相互結合網の非定常状態での性能(非定常性能)を議論するための最初のス. 7. c 2010 Information Processing Society of Japan .

(8) Vol.2010-ARC-190 No.18 2010/8/4. 情報処理学会研究報告 IPSJ SIG Technical Report. し,評価手法の検討を進める方針である.また,本稿では十分に評価しきれなかった相互結 合網規模と定常・非定常通信特性との関係についても評価を進めてゆく. 謝 辞 本 研 究 は 一 部 日 本 学 術 振 興 会 科 学 研 究 費 補 助 金( 基 盤 研 究 (C)21500050,. (C)21500049, (C)20500047)の援助による.. 参 考. 文. 献. 1) J. Duato, S. Yalamanchili, L. Ni, “Interconnection Networks: An Engineering Approach,” Morgan Kaufmann Pub., 2003. 2) W. J. Dally, B. Towles, “Principles and Practices of Interconnection Networks,” Morgan Kaufmann Pub., 2004. 3) 横田 隆史,西谷 雅史,大津 金光,古川 文人,馬場 敬信,“大域的な情報を用いる相互 結合網方式 Cross-Line”,情報処理学会論文誌:コンピューティングシステム,Vol.46, No.SIG 16(ACS-12), pp.28–42, 2005 年 12 月. 4) Takashi Yokota, Kanemitsu Ootsu, Takanobu Baba, “Adaptation Level and Injection Control in a Quasi-Globally Adaptive Routing,” Proc. 20th IASTED International Conference on Parallel and Distributed Computing Systems (PDCS2008), pp.112–117, Nov. 2009. 5) Takashi Yokota, Kanemitsu Ootsu, Takanobu Baba, “A Quantitative Evaluation Methodology of Interconnection Networks,” 情報処理学会論文誌:コンピューティン グシステム,Vol.2, No.3, pp.58–70, Sep. 2009. 6) 横田 隆史,大津 金光,馬場 敬信,“準広域情報を用いるルーティングアルゴリズムの 改善検討” 情処研報,Vol.2009-ARC-184, No.30, pp.1–8, 2009. 7) 横田 隆史,大津 金光,馬場 敬信,“相互結合網の非定常性能 —予備評価—”,SACSIS 2010 論文集,情報処理学会シンポジウムシリーズ,Vol.2010,No.5,pp.105–106, 2010 年 5 月.. 8. c 2010 Information Processing Society of Japan .

(9)

参照

関連したドキュメント

環境基準値を超過した測定局の状況をみると、区部南西部に位置する東糀谷局では一般局では最も早く 12 時から二酸化窒素が上昇し始め 24 時まで 0.06ppm

• 使用済燃料プール壁 ※1 は、非常に厚いうえに、プール全体は、非常に厚い壁 ※2

自動 手動 01 月01日 12:00.

(募集予定人員 介護職員常勤 42 名、非常勤を常勤換算 18 名、介護支援専門員 常勤 3 名、看護職員常勤 3 名、非常勤を常勤換算 3.5 名、機能訓練指導員

2013(平成 25)年度から全局で測定開始したが、2017(平成 29)年度の全局の月平均濃度 は 10.9~16.2μg/m 3 であり、一般局と同様に 2013(平成

二酸化窒素は 2 時に 0.06ppm を超えたが、10 時までは 0.06ppm を超えなかった。11 時から上昇が始まり 15 時に最高 0.103ppm に達した後、24

二酸化窒素の月変動幅は、10 年前の 2006(平成 18)年度から同程度で推移しており、2016. (平成 28)年度の 12 月(最高)と 8

機器名称 状態の変化 操作場所 操作方法 非常用ガス処理系湿分除去装置(A) 停止→起動 中央制御室 スイッチ操作 非常用ガス処理系湿分除去装置(B) 停止→起動