• 検索結果がありません。

JAIST Repository: 分散メモリ型ネットワークインタフェースの提案と評価

N/A
N/A
Protected

Academic year: 2021

シェア "JAIST Repository: 分散メモリ型ネットワークインタフェースの提案と評価"

Copied!
16
0
0

読み込み中.... (全文を見る)

全文

(1)

JAIST Repository

https://dspace.jaist.ac.jp/

Title

分散メモリ型ネットワークインタフェースの提案と評

Author(s)

奥野, 弘之; 井口, 寧; 堀口, 進

Citation

Research report (School of Information Science,

Japan Advanced Institute of Science and

Technology), IS-RR-2001-017: 1-13

Issue Date

2001-08-02

Type

Technical Report

Text version

publisher

URL

http://hdl.handle.net/10119/8390

Rights

Description

リサーチレポート(北陸先端科学技術大学院大学情報

(2)

分 散 メ モ リ型 ネ ッ トワ ー ク イ ン タ フ ェ ー ス の

提 案 と評 価

†奥 野 弘 之 ,‡ 井 口 寧,† 堀 口 進 2001年8月2日 IS-RR-2001-017 北 陸 先 端 科 学 技 術 大 学 院 大 学 †情 報 科 学 研 究 科 ‡情 報 科 学 セ ン タ ー 〒923-1292石 川 県 能 美 郡 辰 口 町 旭 台1-1 [email protected],[email protected],[email protected]

OH.Okuno,Y.Inoguchi,S.Horiguchi2001

ISSNO918-7553

(3)

一"'7

要 旨

WSやPCを ネ ッ トワ ー ク で 接 続 し た ク ラ ス タ に よ る 並 列 処 理 が 盛 ん に 研 究 さ れ て い る. ギ ガ ビ ッ ト レ ベ ル の ネ ッ トワ ー ク の 登 場 に よ り,こ の 様 な ク ラ ス タ で ボ トル ネ ッ ク と な っ て い た ノ ー ド間 の メ ッ セ ー ジ 通 信 性 能 が 向 上 す る 一 方,メ ッ セ ー ジ 通 信 時 の ノ ー ド内 デ ー タ 転 送 速 度 が 新 た な ボ トル ネ ッ ク と し て 挙 げ ら れ る よ う に な っ て き た.こ の 問 題 を 解 決 す る た め,本 論 文 で は ネ ッ トワ ー ク イ ン タ フ ェ ー ス 上 に メ モ リ を 搭 載 し,主 記 憶 の 一 部 と す る 分 散 メ モ リ型 ネ ッ トワ ー ク イ ン タ フ ェ ー ス を 提 案 し,そ の 概 要 と 予 備 評 価 に つ い て 述 べ る.性 能 評 価 の た め シ ミ ュ レ ー シ ョ ン に よ る 行 列 演 算 を 行 っ た 結 果,分 散 メ モ リ型 ネ ッ ト ワ ー ク イ ン タ フ ェ ー ス は メ ッ セ ー ジ 通 信 時 の バ ス ボ トル ネ ッ ク を 削 減 で き る こ と が 分 か っ た.

(4)

1は

じ め に

計 算 機 の 処 理 能 力 向 上 や ネ ッ トワ ー ク 速 度 の 向 上 に よ っ て,WSやPCを ネ ッ ト ワ ー ク で 結 合 し,ク ラ ス タ計 算 機 を 構 成 す る 研 究 が 盛 ん に 行 わ れ て い る 国 図.し か し こ の 様 な ク ラ ス タ 計 算 機 で は,計 算 機 間 の デ ー タ の 送 受 信 を行 う メ ッ セ ー ジ 通 信 が 性 能 向 上 を 阻 む 大 き な 要 因 と な っ て い た. 10Base-T,100Base-Tと い っ た 低 速 な ネ ッ ト ワ ー ク で は,ク ラ ス タ ノ ー ド間 の デ ー タ転 送 に 大 き な 時 間 を 費 や し,実 行 規 模 に 見 合 う性 能 向 上 を得 る こ と は 不 可 能 で あ っ た[3].近 年 のMyrinetやGigabitEthernetと い っ た,ギ ガ ビ ッ ト レ ベ ル の ネ ッ ト ワ ー ク の 登 場 に よ っ て,メ ッ セ ー ジ 通 信 に お け る ボ トル ネ ッ ク の 大 き な 要 因 で あ る ク ラ ス タ ノ ー ド間 の デ ー タ転 送 速 度 は 飛 躍 的 に 向 上 した が,逆 に 計 算 機 内 部 の バ ス 速 度 が こ れ ら ネ ッ ト ワ ー ク やCPU処 理 速 度 の 向 上 に 追 従 で き て い な い こ と が 問 題 と し て 挙 げ ら れ る よ う に な っ て き た[4][5]. そ こ で 本 研 究 で は,主 記 憶 の 一 部 と し て 扱 う こ と の で き る メ モ リ を 搭 載 した,分 散 メ モ リ型 ネ ッ トワ ー ク イ ン タ フ ェ ー ス(NIC)を 提 案 す る.NIC上 に メ モ リ を 搭 載 し主 記 憶 の 一 部 と して 扱 う こ と に よ っ て ,NICが メ ッセ ー ジ 通 信 の た め の デ ー タ を 持 つ こ と が 可 能 と な る.そ れ に よ っ て メ ッ セ ー ジ 通 信 時 に ボ トル ネ ッ ク と な る 主 記 憶 とNIC問 の デ ー タ 転 送 を 削 減 で き,ク ラ ス タ 計 算 機 の 性 能 を 改 善 す る こ と が 期 待 で き る. 本 論 文 の 構 成 は 以 下 の 通 りで あ る 。2章 に お い て 関 連 研 究 に つ い て の 議 論 を 行 い,3章 で 提 案 す る 分 散 メ モ リ 型NICの 概 要 と そ の 仕 様 に つ い て 述 べ る.4章 で は,性 能 評 価 の た め に 行 っ た シ ミュ レ ー シ ョ ン と そ の 結 果 に つ い て 議 論 す る.最 後 に5章 で 結 論 と今 後 の 課 題 を 述 べ る.

2関

連研 究

ク ラ ス タ 計 算 機 で の メ ッ セ ー ジ 通 信 時 に お け る ノ ー ド内 の バ ス ボ トル ネ ッ ク を 解 消 す る 研 究 と し て は,主 に 以 下 の よ う な 研 究 が 行 わ れ て い る.

MINI[6]で は,ATMネ ッ トワ ー ク イ ン タ フ ェ ー ス を1/0バ ス で は な くSIMMの メ モ リ ス ロ ッ トに 組 み 込 む 提 案 が さ れ て い る,こ の ネ ッ トワ ー ク イ ン タ フ ェ ー ス を 用 い た ク ラ ス タ を 構 築 し,約1Gbitの ス ル ー プ ッ トを 達 成 し た が,SIMMの 衰 退 に よ っ て 一 般 的 な も の と は な ら な か っ た. MemoryChannel[7],MemoryChannel2[8]は,PCIカ ー一 ドのNICに,共 有 メ モ リ シ ス テ ム の た め の ア ド レ ス 変 換 機 構 と デ ー タ 送 受 信 用 の バ ッ フ ァ と コ ン トロ ー ラ を 搭 載 し,低 レ イ テ ン シ と 高 い バ ン ド幅 を得 た.し か し,ノ ー ド間 の 接 続 に 専 用 の ス イ ッ チ が 必 要 で,

(5)

大 規 模 な 構 成 を 取 る こ と が で き な い.

MEMOnet[4]は,前 述 し たMINIと 同 様 に メ モ リ ス ロ ッ トに ネ ッ ト ワ ー一ク イ ン タ フ ェ ー ス を 搭 載 す る 手 法 を提 案 した.SIMMソ ケ ッ トだ っ たMINIに 対 し て,DIMMソ ケ ッ ト利 用 し たDIMMnet-1[9]に よ っ て,低 レ ン テ ン シ,高 帯 域 幅 を 達 成 し て い る.一 方,MINI

と 同 様 に 本 来 メ モ リ用 の ス ロ ッ トにNICを 搭 載 し て い る た め,メ モ リ ス ロ ッ トの 規 格 に 左 右 さ れ や す い,ス ロ ッ ト数 が 制 限 さ れ る な ど の 問 題 が 残 さ れ て い る.

ま た,SCIMA[5]で は,メ モ リ の 一 部 をCPUと 同 一 の チ ッ プ 上 に 搭 載 し,CPUと メ モ リ 間 の 高 速 な デ ー タ 転 送 を 実 現 し て い る.CPUと メ モ リ 間 の デ ー タ 転 送 に 注 力 して い る た め ノ ー ド内 部 の バ ス ボ トル ネ ッ ク を 更 に 削 減 さ せ る 方 法 と し て 注 目 で き る が,ノ ー ド間 通 信 な ど の よ う なCPUチ ッ プ 外 へ の デ ー タ 転 送 性 能 は 十 分 と は 言 え な い. い ず れ の 研 究 も計 算 機 内 の バ ス ボ トル ネ ッ ク を 解 消 す る 手 法 に つ い て 提 案 し て い る が, 本 研 究 はNIC上 に メ モ リ を 搭 載 し,主 記 憶 の 一 部 と して 扱 う ア プ ロ ー チ で こ の 問 題 に 取 り組 む.PCIバ ス を 使 用 す る こ と に よ り高 い 汎 用 性 を 得 ら れ,メ ッ セ ー ジ 通 信 で はNIC メ モ リ 上 か ら デ ー タ 送 受 信 が 行 わ れ る た め,主 記 憶 か ら デ ー タ を 読 み 出 して 送 信/受 信 し て デ ー タ を 主 記1意 に 書 き込 む,従 来 型 の メ ッ セ ー ジ 通 信 に 比 べ て 高 速 な メ ッセ ー ジ 通 信 が 行 え る と考 え ら れ る.

3分

散 メ モ リ型 ネ ッ トワ ー ク イ ン タ フ ェ ー ス

3.1ネ ッ ト ワ ー ク イ ン タ フ ェ ー ス の 概 要 本 研 究 で 提 案 す る,分 散 メ モ リ ネ ッ トワ ー ク イ ン タ フ ェ ー ス(NIC)の 概 要 に つ い て 述 べ る.1に そ の 概 念 図 を 示 す.提 案 す るNICはPCIバ ス 上 に 搭 載 さ れ る.こ のNIC上 に メ モ リ を搭 載 し,主 記 憶 と同 じ メ モ リ ア ド レ ス 空 間 を 与 え る.以 降,NIC上 に 搭 載 し た メ モ リ の こ と をNICメ モ リ と称 す る.NICに 搭 載 す る メ モ リ 容 量 は 数MByte∼ 数 十MByteを 検 討 し て お り,現 在 の メ モ リ集 積 技 術 か ら見 れ ば 妥 当 な 量 と考 え ら れ る.今 回 は8MByte と し て 評 価 を 行 う.こ のNICメ モ リ に,メ ッ セ ー ジ 通 信 さ れ る デ ー タ が 主 記 憶 か ら 転 送 さ れ て 配 置 さ れ る.転 送 さ れ た デ ー タ は 再 び 主 記 憶 へ 戻 す こ と も 可 能 で あ る.現 段 階 で は,こ れ ら の 処 理 は ソ フ ト ウ ェ ア で 行 わ れ る. NIC上 の メ モ リ は 主 記 憶 の 一 部 と し て 扱 う の で,同 じ デ ー タ が 主 記 憶,NICメ モ リ 上 共 に 存 在 す る こ と は 無 い.つ ま り主 記 憶 とNICメ モ リ 間 の デ ー タ の コ ヒ ー レ ン シ に 関 す る 問 題 を 考 慮 し な くて 済 む.ま た,主 記 憶 とNICメ モ リ 間 の デ ー タ転 送 処 理 が 行 わ れ な い 限 り,デ0タ はNICメ モ リ上 に 存 在 で き る た め,バ ッ フ ァ を搭 載 し て い るNICの よ う に メ ッ セ ー ジ 通 信 の た び に 主 記 憶 か ら デ ー タ を コ ピ ー す る 必 要 も な い.

(6)

-OxOOOOOOOOOxO7FFFFFF MainMemory ReadlWrite CPU ReadバWrite Network ・・・・・・… 癒 。87FFFFF NIC 図1:分 散 メ モ リ 型 ネ ッ ト ワ ー一ク イ ン タ フ ェ ー ス の 概 念 図 3.2デ ー タ 転 送 プ ロ ト コ ル 提 案 し たNICを 実 現 す る た め,必 要 に 応 じ て 主 記 憶 上 か ら デ ー タ をNICメ モ リ へ 転 送 し,メ ッ セ ー ジ 通 信 に お け る セ ッ トア ッ プ 時 間 を 減 少 さ せ る 機 能 が 必 要 と な っ て く る.こ の た め の 主 記 憶 とNICメ モ リ 間 の デ ー タ 転 送 を 行 うPut,Backに つ い て 本 節 で は 述 べ る. Put,Back操 作 の 概 念 を2に 示 す.

Put:主 記 憶 か らNICメ モ リへ の 転 送Putは,主 記 憶 上 に あ る デ ー タ をNICメ モ リへ 転 送 す る 機 能 で あ る.メ ッ セ ー ジ 通 信 処 理 に お い て,参 照 す る デ ー タ がNICメ モ リ 上 に 存 在 し な い 場 合,自 動 的 に 実 行 さ れ る. Putの 処 理 手 順 の 詳 細 を3に 示 す.メ ッセ ー ジ 通 信 時 に デ ー タ が 主 記 憶 上 に あ る 場 合 (B1),処 理 を 中 断 し,主 記 憶 か ら デ ー タ を 読 み 出 し(B2),NICへ 転 送 し(B3), NICメ モ リヘ デ ー タ を 書 き 込 み(B4),メ ッ セ ー ジ 通 信 処 理 を 再 開 し,NICメ モ リ か ら デ ー タ を 読 み 出 し メ ッ セ ー ジ の 送 信(B5),或 はNICメ モ リ ヘ デ ー タ を 書 き込 み 受 信(B5)を 行 う. デ ー タ がNICメ モ リ上 に あ る 場 合(A1)は,NICメ モ リ か ら デ ー タ を 読 み 出 し て 送 信(A2),或 はNICメ モ リヘ デ ー タ を 書 き込 ん で 受 信 を行 う(A2).

Back:NICメ モ リ か ら主 記 憶 へ の 転 送Backは 上 に 述 べ たPutの 逆 に,NICメ モ リ上 に あ る デ ー タ を 主 記 憶 へ 転 送 す る.ノ ー ド内 で の 演 算 時 に デ ー タ が 主 記 憶 上 に 存 在 し な い 場 合,Putと 同 様,自 動 的 に 実 行 さ れ る.

(7)

MainMemory NIC

Back

Put

、 理

・<← 一一 Recv Network 図2:Put,Back操 作 の 概 念 図 ork 図3:Put操 作 に お け る デ ー タ の 流 れ

(8)

ork 図4:Back操 作 に お け る デ ー タ の 流 れ す る 読 み 出 し,書 き込 み を 一一且 中 断 して,NICメ モ リ か ら デ ー タ を 読 み 出 し(D2), 主 記 憶 へ 転 送 し(D3),主 記 憶 ヘ デ ー タ を 書 き 込 み(D4),読 み 出 し,書 き込 み が 再 開 さ れ,デ ー タ の 読 み 出 し/書 き込 み が 行 わ れ る. 主 記 憶 上 に デ ー タが 存 在 す る 場 合(C1)は,通 常 の 計 算 機 で 行 わ れ る 読 み 出 し/書 き 込 み が 行 わ れ る(C2). 処 理 中 で …度 だ け メ ッセ ー ジ 通 信 さ れ る よ う な デ ー タ をPutし た 場 合 に対 して,こ の Backを 使 用 し 主 記 憶 へ 書 き戻 せ ば,無 駄 なNICメ モ リ ア ク セ ス を 削 減 可 能 で あ る. Put,Backの い ず れ も,主 記 憶,NICメ モ リ容 量 の 不 足 に よ っ て 実 行 で き な く な る 事 が 起 こ り得 る.こ の よ う な 場 合 に は,LRUな ど の メ モ リ 置 き換 え ア ル ゴ リ ズ ム を利 用 して 転 送 先 の メ モ リ容 量 確 保 を 行 い,Put,Backを 実 行 可 能 に す る こ とが 考 え ら れ る.但 し今 回 は,Put,Backを 実 行 す る 際 の,主 記 憶 とNICメ モ リ 問 の デ ー タ 転 送 に つ い て 議 論 す る た め,詳 細 な 仕 様 も含 め た こ の 点 に 関 す る 議 論 は 今 後 の 課 題 と す る. こ の よ う に,メ ッセ ー ジ 通 信 を行 う デ ー タ をNICメ モ リ 上 に 集 め る こ と に よ っ て,メ ッ セ ー ジ 通 信 時 にNICメ モ リ か ら 直 接 デ ー タ を 送 信/受 信 し,主 記 憶 とNIC間 の デ ー タ転 送 を 不 要 に す る こ と が で き る と 考 え ら れ る.し か し,主 記 憶 とNICの,物 理 的 に 異 な る 場 所 に デ ー タが 存 在 す る た め,以 下 の ト レ ー ドオ フ に つ い て 議 論 す る 必 要 が あ る. ●CPUと 主 記 憶 間 の ア ク セ ス は 速 い ⇔CPUとNICメ モ リ 間 の ア ク セ ス は 遅 い

(9)

, node=16,size=128 . llOQ2

一 一 一

Φ N H の 0 4 8 12 1 5 9 B ) 2 6 10 14 3 7 11 15

size/node

図5:16ノ ー ドに よ る サ イ ズ128x128行 列 演 算 時 の 計 算 領 域 割 り 当 て ・NICメ モ リ か ら の メ ッセ ー ジ 通 信 は 速 い H主 記 憶 か ら の メ ッセ ー ジ 通 信 は 遅 い 次 章 で は,提 案 し た 分 散 メ モ リ 型NICを て シ ミュ レ ー シ ョ ン に よ る 性 能 評 価 実 験 を 行 い, 上 記 の ト レ ー ド オ フ の 効 果 を 評 価,議 論 す る.

4シ

ミ ュ レ ー シ ョ ン に よ るNICメ

モ リの 評 価

4.1シ ミ ュ レ ー シ ョ ン 条 件 提 案 した 分 散 メ モ リ 型NICの 性 能 を 評 価 す る た め,サ イ ズ128×128及 び256×256の 行 列 の 乗 算(A×B=0)に つ い て,4,16,64ノ ー ドに よ る 実 行 を シ ミュ レ ー シ ョ ン で 行 っ た.A,B,C各 行 列 の 計 算 領 域 は5の よ う に 各 ノ ー ドへ 割 り当 て ら れ る.サ イ ズ:sizeの 行 列 は,ノ ー ド数:nodeの 領 域 に 分 割 さ れ る.こ れ よ り1ノ ー ドあ た りが 担 当 す る 行 列 の 大 き さ は,size/〉/node×size〈/nodeと な る.5の 場 合,ノ ー ド数16で 行 列 サ イ ズ128×128 な の で,1ノ ー ドあ た りが 担 当 す る 行 列 の 大 き さ は,128/>-6×128/>-6;32×32と な る.行 列 の 乗 算 は,ま ず こ の 担 当 領 域 の 乗 算 を 行 い,終 了 す る と,上 下 左 右 の ノ ー ド と担 当 領 域 の 交 換 を 行 い 乗 算 を 続 け る.こ の 交 換 は,node-1回 行 わ れ る. シ ミ ュ レ ー シ ョ ン で は,ク ラ ス タ 内 の1ノ ー ド に お け る 行 列 演 算 実 行 時 の デ ー タ メ モ リ参 照 履 歴 を 取 る.主 記1意,NICメ モ リ の 読 み 出 し/書 き込 み 状 況 に つ い て,Putの み と, Backも 併 用 し た 場 合 そ れ ぞ れ に つ い て 計 測 し た.行 列 演 算 実 行 時 の み の デ ー タ メ モ リ 参 照 履 歴 を取 っ て い る の で,演 算 に 至 る ま で の,各 種 変 数 初 期 化 時 な ど に 発 生 し て い る 参 照 履 歴 は 計 測 し て い な い.Putの み に つ い て の 計 測 は,Back併 用 時 に 対 す る 比 較 の た め に

(10)

行 っ た.ま た シ ミュ レ ー シ ョ ン で は,主 記 憶 は 十 分 な 大 き さ を 持 つ も の と し,主 記 憶 か ら の デ ィ ス ク な ど へ の ペ ー ジ ア ウ ト に つ い て は 考 慮 し な い. 4.2主 記 憶,NICメ モ リの 参 照 状 態 シ ミ ュ レ ー シ ョ ン で 計 測 す る 主 記 憶,NICメ モ リ の 参 照 状 態 に つ い て 述 べ る.主 記 憶, NICメ モ リ に 対 す る ア ク セ ス は 次 の4種 類 に 分 類 す る こ と が で き る.

● 主記憶 に対 す るア クセス

一 内 部 読 み 出 し 時 に デ ー タ が 主 記 憶 上 に 存 在 す る(rmh)/し な い(rmf) 一 内 部 書 き込 み 時 に デ ー タ が 主 記 憶 上 に 存 在 す る(wmh)/し な い(wmf) こ の 時,デ ー タ が 主 記 憶 上 に 存 在 せ ず,NICメ モ リ上 に あ る 場 合 はBackが 実 行 さ れ,主 記 憶 上 に デ ー タ が 転 送 さ れ た 後,改 め て 読 み 出 し/書 き込 み が 行 わ れ る.Back の 実 行 はwmfと し て 扱 い,そ の 直 後 の 読 み 出 し/書 き 込 み は そ れ ぞ れrmh/wmhと し て 扱 う も の と す る. ●NIメ モ リ に対 す る ア ク セ ス 一 メ ッ セ ー ジ 送 信 時 に デ ー タがNICメ モ リ上 に 存 在 す る(rnh)/し な い(rnf) 一 メ ッ セ ー ジ 受 信 時 に デ ー タ がNICメ モ リ上 に 存 在 す る(wnh)/し な い(wnf) こ の 時,デ ー タ がNICメ モ リ 上 に 存 在 せ ず,主 記 憶 上 に あ る 場 合 は,Putが 実 行 さ れ,NICメ モ リ上 に デ ー タが 転 送 さ れ た 後,改 め て 送 信/受 信 が 行 わ れ る.Backと 同 様 に,Putの 実 行 はwnfと し て 扱 い,そ の 直 後 の 送 信/受 信 は そ れ ぞ れrnh/wnh と して 扱 う も の と す る. 前 章 で 挙 げ た ト レ ー ドオ フ に つ い て 議 論 す る た め に は,主 記 憶,NICメ モ リが ど の よ う に 参 照 さ れ て い る か を 明 ら か に す る 必 要 が あ る.

4.3主

記憶 に対 す る参照 結果

前 節 で 定 義 した メ モ リ 参 照 に 対 す る 結 果 と し て,行 列 サ イ ズ256×256実 行 時 の 主 記 憶/NICメ モ リ の ヒ ッ ト/ミ ス 比 率 を 示 す. 6に,主 記 憶 に 対 す る 参 照 の 結 果 を 示 す. 6よ り,Putの み を 実 行 し た 場 合 は,主 記 憶 に 対 す るrmf(主 記 憶 上 に デ ー タ が 存 在 し な い)の 比 率 が50%以 上 と い う 結 果 が 得 ら れ た.実 行 し た 行 列 乗 算 は,各 ノ ー ドが 行 列 の 一 部 の み を所 持 し て い る た め ,メ ッ セ ー ジ 通 信 で 各 ノ ー ドが 所 持 し て い る 行 列 を 送 受 信 し

(11)

100°lo 90% 80% 70%n 60% c r50%n 40%n 30% ?0%n 10% o%

謡畿 ぜ

極/

ド〆

試〆

團 ㎜h rmf 口wmh Qwmf Numofnodes

図6:行

列 乗算 時の 主記憶 参照 にお け る ヒ ッ ト/ミス率

合 う 必 要 が あ る.そ の た め,乗 算 に 用 い る 行 列AとBが メ ッ セ ー ジ 通 信 時Putに よ っ て 全 てNICメ モ リ」二に 移 動 して し ま い,演 算 時 にAとBを 全 てNICメ モ リ か ら 読 み 出 さ な け れ ば な ら な く な っ た こ と が 大 き な ミ ス 率 の 原 因 で あ る.こ の こ と か ら,Putの み を 使 用 し た 場 合 は,ア ク セ ス の 遅 いCPUとNICメ モ リ 間 の デ ー タ参 照 が 発 生 し て い る こ と が 分 か る.ま た,ノ ー ド数 が 多 い ほ どrmfの 比 率 が 高 くな る 理 由 は,ノ ー ド数 の 増 加 に よ っ て 1ノ ー ドあ た りが 繰 り返 す 部 分 行 列 の 乗 算 回 数 が 増 え た た め で あ る. 一方Backも 使 用 し た 場 合 は ,6か ら 分 か る 通 り,主 記 憶 へ の ア ク セ ス の ほ ぼ 全 て がrmh で 占 め ら れ る よ う に な っ た.こ れ は,演 算 時 に デ ー タ がNICメ モ リ 上 に 存 在 し て い る 行 列A,Bに 対 し てBackが 実 行 さ れ,デ ー タ が 主 記 憶 へ 書 き 戻 さ れ る た め,演 算 を 実 行 す る 時 点 で はA,Bの デ ー タ読 み 出 しが 全 てrmhと な る た め で あ る. こ れ ら の 結 果 よ り,PutとBackを 併 用 す る こ と で 速 度 の 遅 いGPUとNICメ モ リ 間 の ア ク セ ス を,速 度 の 速 いCPUと 主 記 憶 間 の ア ク セ ス に 変 え,処 理 速 度 を 高 め ら れ る こ と が 分 か っ た. 4.4NICメ モ リ に 対 す る 参 照 の 結 果 NICメ モ リ に 対 す る 参 照 結 果 を7に 示 す.Putの み で は,送 受 信 さ れ る 全 て の デ ー タ が NICメ モ リ 上 に 存 在 す る た め,rnh,wnh(NICメ モ リ 上 に デ ー タ が 存 在 す る)の 比 率 が ノ ー ド数 の 増 加 に つ れ て 大 き くな る 結 果 と な っ た.こ の 比 率 の 増 加 は,ノ ー ド数 の 増 加 に

(12)

-1009を 90% soy 70% 609乏 」 罵50% 40呪 30(そ 209を 10% 09を

]

が ぜ

レ/ rnh ■mf wnh 口wnf

ド〆

評!

Numofnodes 図7:行 列 乗 算 時 のNICメ モ リ 参 照 に お け る ヒ ッ ト/ミ ス 率 よ っ て1ノ ー ドあ た りが 行 う メ ソセ ー ジ 通 信 回 数 が 増 加 す る た め で あ る . 一方Backを 併 用 し た 場 合 は ,7よ り,逆 にWllfが 増 加 す る 結 果 と な っ た 。 こ れ は,各 ノ ー ドが 担 当 領 域 の 乗 算 が 終 る 度 に メ ッセ ー ジ 通 信 で 新 た な 計 算 領 域 を 得 る た め ,Plltと Backが メ ッセ ー ジ 通 信 と行 列 演 算 の た び に 行 わ れ る た め で あ る .つ ま り,Backさ れ た デ ー タ が 再 び メ ッ セ ー ジ 通 信 さ れ る た め,速 度 の 遅 い 主 記 憶 か ら の メ ッ セ ー ジ 通 信 が ,Ba(・k が 行 わ れ た 分 だ け 発 生 して い る こ と が 分 か る. 以Lの こ と か ら,Backは,メ ッ セ ー ジ 通 信 と ノ ー ド内 部 で の 計 算 を 同 じだ け 行 う処 理 の 場 合,ノ ー ド数 の 増 加 に 伴 っ て,ア ク セ ス 速 度 の 遅 いWIlfの 比 率 を 高 め て し ま う 事 が 分 か る.こ の 点 に つ い て の 考 察 を行 う. 4.5Backの 有 効 性 に 関 す る 考 察 Backを 行 う こ と に よ っ て,PutでNICメ モ リへ 移 動 し て し ま っ た ノ ー ド内 で 読 み 書 き す る デ ー タ を,再 び 主 記 憶 か ら ア ク セ ス す る こ とが 可 能 に な る.し か し,前 述 した よ う に,メ モ リ リ ー ド/ラ イ ト と メ ッ セ ー ジ 通 信 を 交 互 に 行 う よ う な 処 理 で は,Put,Backが 交 互 に 実 行 さ れ,そ の 結 果 速 度 の 遅 い 主 記 憶 か ら の メ ッ セ ー ジ 通 信 や,CPUとNICメ モ リ 問 の ア ク セ ス に よ る,主 記 憶 とNIメ モ リ 間 の デ ー タ 転 送 が ボ トル ネ ッ ク に な り,逆 に 性 能 低 下 を 招 く 可 能 性 が 考 え ら れ る.こ の 点 に つ い て 考 察 を 行 う. 4.5は,Putの み 利 用 した 結 果 に 対 して,行 列 サ イ ズ1280256時 に お け るBack利 用 時

(13)

100% 90% 80% 70%n 60°lo O ._y50% 40% 30% 20% 10% 0%

ぶ ぜ

脳/

評メ

評〆

Numofnodes 團rmh rmf Qwmh 口wmf rnh 麗rnf wnh Qwnf 図8:行 列 乗 算 時 の 主 記 憶/NICメ モ リ参 照 に お け る 合 計 ヒ ッ ト/ミ ス 率 のPut,Back,ReadHitの 増 加 数 を,各 実 行 ノ ー ド数 毎 に 計 測 し た も の を 示 す.ま た,6 及 び7を 合 計 し た も の を8に 示 す. 5及 び4.1節 に お い て 述 べ た 行 列 演 算 の 手 順 よ り,PutやBackの 元 と な る メ ッ セ ー ジ 通 信 は,ノ ー ド数 に よ っ て の み 変 わ る の で,各 実 行 ノ ー ド数 の,行 列 サ イ ズ128か ら256へ の 変 化 に よ るPut,Back回 数 の 増 加 は 無 い.ま た,ノ ー ド数 の 増 加 に 伴 っ てrmhの 増 加 が い ず れ も 小 さ く な っ て い る が,こ れ は1ノ ー ド当 た りが 担 当 す る 行 列 の サ イ ズ がrmh を 決 め る た め で あ る.例 え ば サ イ ズ256の 行 列 に お い て4ノ ー ドで は 担 当 行 列 サ イ ズ は 128×128=16384要 素 と な る が,64ノ ー ドで は32×32=1024要 素 と な る.こ の た め, ノ ー ド数 が 多 い ほ どrmhの 増 加 が 少 な い 値 と な っ て い る. ノ ー ド数 が 増 加 す る に 従 い,Put,Backの 実 行 数 も増 加 し て い る.こ れ に よ っ て 主 記 憶 表1:行 列 演 算 に お け るBack実 行 時 のPut,Back,ReadHitの 増 加 数 ノ ー ド数 Put数 Back数 rmh(size128) rmh(size256) 4 16 64 十1十5十13 十3十7十15 十i90528十230400十61696 十6307840十1839104十492544

(14)

r 表2:Put,Back増 加 分 に よ っ て 移 動 し た デ ー タ 量(単 位:Byte)

ノー ド数

担 当行 列 要素数

Put分 Back分 合 計

ペ ー ジ数換 算

4 16,384 16 4,096 64 1,024 65,53681,92053,248 196,608114,68861,440 262,144196,608114,688 64ペ ー ジ48ペ ー ジ28ペ ー ジ とNICメ モ リ 問 で 新 た な デ ー タ の 送 受 信 が 発 生 す る こ と と な る.こ れ が ど の 程 度 の 影 響 を 及 ぼ す か 評 価 す る.計 算 す る デ ー タ 型 を 単 精 度 浮 動 小 数 点(float)と し,ペ ー ジ サ イ ズ を4KBと す る と,Put,Backの 増 加 分 に よ っ て 移 動 さ れ た デ ー タ 量 を2に 示 す.2よ り, 増 加 分 は 最 大 で も4ノ ー ドの256KByteで,64ノ ー ドで は112KByteし か な い. 一方 ,乗 算 の 計 算 で は,行 列 の 要 素 単 位 で 数 え る と,(size/>noe)3×>noe回 の 読 み 出 しが,行 列A,Bそ れ ぞ れ に 発 生 す る.こ れ は 最 も少 な い64ノ ー ド時 で も2MB分 の デ ー タ が 読 み 出 さ れ る こ と に 相 当 す る.更 に,A,Bは 担 当 領 域 を 計 算 し終 る 度 に メ ッ セ ー ジ 通 信 を行 い,計 算 す る 部 分 行 列A,Bの 内 容 が 変 わ る た め,A,Bは 読 み 込 み 直 す 必 要 が あ る.そ の 為,64ノ ー ド時 の よ う に キ ャッ シ ュ に 入 り切 る 様 な デ ー タ サ イ ズ で あ っ た と し て もPut,Backを 行 う の と 同 様 で あ る.ま た,8か ら分 か る よ う に,新 た なPut,Backの た め に 発 生 す るwnfやwmfは,こ れ で 得 ら れ るrmhの 増 加 に 対 し て 非 常 に 小 さ な 割 合 と な っ て い る.こ の こ と か ら もBackに よ る 性 能 低 下 の 影 響 は ほ と ん ど無 い と い え る. 以 上 の 結 果 か ら,今 回 の 行 列 演 算 の よ う な,メ ッセ ー ジ 通 信 し,か つ ノ ー ド内 で も 頻 繁 に 参 照 さ れ る デ ー一タ が 存 在 す る 場 合 は,Backを 利 用 し て 事 前 に デ ー タ を 主 記 憶 へ 戻 す 事 で,性 能 を 低 下 す る こ と 無 く無 駄 なNIメ モ リ 参 照 を 削 減 す る こ と が 可 能 で あ る. 4.6NICメ モ リ に 関 す る 考 察 今 回 の シ ミ ュ レ ー シ ョ ンで は,NICメ モ リ容 量 を8MByteと した.こ の 容 量 の 妥 当 性 に つ い て 議 論 す る.実 行 し た 行 列 演 算 に お い て 各 ノ ー ドがNICメ モ リ に 転 送 す る デ ー タ は, 行 列A,Bの そ れ ぞ れ 担 当 す る 領 域 で あ る.演 算 に 用 い る デ ー タ 型 を 単 精 度 浮 動 小 数 点 と す る と,こ の 各 ノ ー ドに 割 り 当 て ら れ る 行 列A,Bの 担 当 領 域 に 使 用 さ れ る 合 計 メ モ リ量 は,"担 当 す る 領 域 の 要 素 数 × デ ー タ 型 サ イ ズ ×2(A,Bの 二 つ)"で 求 め ら れ る.こ れ に よ り,ノ ー ド数,行 列 サ イ ズ を 変 化 さ せ た 場 合 の メ モ リ 量 を 示 す9が 得 ら れ る. 9よ り,4ノ ー ド構 成 で もサ イ ズ2048×2048ま で の 行 列 乗 算 が,NICメ モ リ 容 量 を オ ー

(15)

T 128MB 32M8 .. .. 岳2MB

ll蓑i

O E 4node-■ ト 16node-(〉-64node十 256node一 米 一 128 256 51210242048 Matixsize 4096 8192 図9:ノ ー ド数,行 列 サ イ ズ の 変 化 に 対 す る 行 列A,Bの メ モ リ使 用 量 バ ー さ せ る こ と 無 く実 行 可 能 で あ る こ とが 分 か る.ま た,256ノ ー ド使 用 時 で は,16384× 16384ま で の 規 模 の 乗 算 がNICメ モ リ8MByteで 計 算 で き る こ と が 分 か る. 以 上 か ら,メ モ リ容 量8MByteで も大 規 模 な 行 列 乗 算 を行 う た め に 十 分 な 容 量 で あ る と 考 え ら れ る.

5お

わ りに

本 研 究 で は メ モ リ搭 載 型 ネ ッ トワ ー ク イ ン タ フ ェ ー ス に つ い て 提 案 し,シ ミ ュ レ ー シ ョ ン に よ る 実 験 で 評 価 を 行 っ た.主 記 憶 の 一 部 をNIC上 に 搭 載 し,Put,Backに よ っ て 主 記 憶 とNICメ モ リ 間 の デ ー タ転 送 を 行 い,メ ッ セ ー ジ 通 信 時 に お け る 主 記 憶 とNIC間 の デ ー タ転 送 を 削 減 す る 手 法 を 提 案 し た.シ ミュ レ ー シ ョ ン に よ る 実 験 で は,行 列 演 算 を 行 い,Put,Backを そ れ ぞ れ を導 入 し た 場 合 に お け る 主 記 憶,NICメ モ リ の 参 照 状 態 を計 測 し た.そ の 結 果 か らNICメ モ リ の 有 効 性 に つ い て 評 価 し,本 手 法 が ア ク セ ス 速 度 の 遅 い 主 記 憶 とNICメ モ リ 間 の デ ー タ 転 送 を 削 減 す る こ と が 可 能 で あ る と い う 結 果 を 得 た. 主 記 憶 の 一 部 をNIC上 と い う 離 れ た 場 所 に 配 置 し,状 況 に よ っ て そ れ ぞ れ の メ モ リ に デ ー タ を 転 送 す る 手 法 は,デ ー タ転 送 に 関 す る ペ ナ ル テ ィが 逆 に 性 能 の 低 下 を 招 く こ と も 懸 念 さ れ る 点 だ っ た が,シ ミ ュ レ ー シ ョ ン の 結 果 に よ っ て そ の 影 響 は 大 き な も の で は な い こ とが 分 か っ た. 今 後 の 課 題 と し て は,NICメ モ リ容 量 オ ー バ0時 の 性 能 評 価 や,詳 細 な 数 値 に よ るNIC

(16)

よ りクラス タ計算 機 の性 能 向上 を得 られ るNICメ

モ リの仕様 を決定 す る こ とが 可能 で あ

る と考 え られ る。

参考文献

[1]http://now.cs.berkeley.edu/ [2]http://www.11nl.gov/asci/ [3]奥 野 弘 之,堀 口 進:ワ ー ク ス テ ー シ ョ ン ク ラ ス タ に お け る ネ ッ ト ワ ー ク 通 信 性 能 の 評 価,情 報 処 理 学 会 研 究 報 告,HPC-68,pp.21-26(Oct.1997) [4]田 邊 昇,山 本 淳 二,工 藤 知 宏:メ モ リ ス ロ ッ ト に 搭 載 さ れ る ネ ッ ト ワ ー ク イ ン タ フ ェ ー スMEMnet,情 報 処 理 学 会 研 究 報 告,ARC-134,pp.73-78(Aug.1999) [5]中 村 宏,近 藤 正 章,大 河 原 英 喜,朴 泰 祐:ハ イ パ フ ォ ー マ ン ス コ ン ピ ュ ー テ イ ン グ 向 け ア ー キ テ ク チ ャSCIMA,情 報 処 理 学 会 論 文 誌,Vol.41,No.SIG5(HPS1),pp.15-27(2000). [6]RonMinnick,DanBurnsandFrankHady:TheMemoryIntegratedNetworkInter-face,IEEEMicro,Vo1.15,No.1,(1995.2) [7]JamesV.Lawton,JohnJ.Brosnan,MorganP.Doyle,SeosamhD.ORiordain,Timo-thyG.Reddin:BuildingaHigh-performanceMessage-passingSystemforMEMORY CHANNELCIusters,DigitalTechnicaljournalVo1.8,No.2(1996) [8]M.Fillo,R.B.Gillett:ArchitectureandImplementationofMEMORYCHANNEL 2,DigitalTechnicalJourna,Vol.9,No.1(1997) [9]田 邊 昇,山 本 淳 二,工 藤 知 宏:メ モ リ ス ロ ッ ト 搭 載 型 ネ ッ ト ワ ー ク イ ン タ フ ェ ー スDIMMnet-1に お け る 細 粒 度 通 信 機 構,情 報 処 理 学 会 研 究 報 告,ARC-137,pp.65-70(Mar.2000)

参照

関連したドキュメント

Keywords: Learning Process, Instructional Design, Learning Analytics, Time-Series Clustering, Dynamic Time

Causation and effectuation processes: A validation study , Journal of Business Venturing, 26, pp.375-390. [4] McKelvie, Alexander &amp; Chandler, Gaylen &amp; Detienne, Dawn

Previous studies have reported phase separation of phospholipid membranes containing charged lipids by the addition of metal ions and phase separation induced by osmotic application

It is separated into several subsections, including introduction, research and development, open innovation, international R&amp;D management, cross-cultural collaboration,

UBICOMM2008 BEST PAPER AWARD 丹   康 雄 情報科学研究科 教 授 平成20年11月. マルチメディア・仮想環境基礎研究会MVE賞

To investigate the synthesizability, we have performed electronic structure simulations based on density functional theory (DFT) and phonon simulations combined with DFT for the

During the implementation stage, we explored appropriate creative pedagogy in foreign language classrooms We conducted practical lectures using the creative teaching method

講演 1 「多様性の尊重とわたしたちにできること:LGBTQ+と無意識の 偏見」 (北陸先端科学技術大学院大学グローバルコミュニケーションセンター 講師 元山