• 検索結果がありません。

メニーコアプロセッサの空間冗長性を利用するTMRの提案

N/A
N/A
Protected

Academic year: 2021

シェア "メニーコアプロセッサの空間冗長性を利用するTMRの提案"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会第 73 回全国大会. 3A-4. メニーコアプロセッサの空間冗長性を利用する TMR の提案 佐藤 真平 †. ‡. 吉瀬 謙二 †. 東京工業大学 大学院情報理工学研究科 † 1. はじめに. LSI の一層の微細化により,ソフトエラー率およびば らつきが増加し,信頼性の低下が深刻化している [1].マ ルチコアやメニーコアプロセッサにおいては,プロセス の微細化と共に集積するトランジスタ数が増加するため, ソフトエラー率のさらなる増加が懸念される.同時に, 電源,温度の不均一などに起因するチップ内のランダム なばらつきが信頼性の低下を招いている [2]. 我々はメニーコアプロセッサの空間冗長性を利用し, NoC(Network on Chip) ルータを高機能化することで複 数コアの多重実行をサポートし,信頼性もしくは性能の向 上を達成する SmartCore システムという枠組みを提案し ている [3].文献 [3] では,信頼性向上を目的として 2 コア を利用した DMR(Dual Modular Redundancy) を実現す る手法を提案している.本稿では,この仕組みを拡張し 3 コアを利用した TMR(Triple Modular Redundancy) を実現する SmartCore システムを提案する. 2. メニーコアアーキテクチャのモデル Off chip memory modules and switch. chip. Memory. Memory. Memory. Memory. Node (0, 0). Node (1, 0). Node (2, 0). Node (n, 0). Node (0, 1). Node (1, 1). Node (2, 1). Node (n, 1). Node (0, m). Node (1, m). Node (2, m). Node (n, m). 日本学術振興会 特別研究員 DC2 ‡ Controller),ルータで構成される.チップ外のメイン メモリは複数のバンクに分けられ,チップ上にあるいく つかのコントローラによって接続する. 各ノードは 2 次元メッシュにより接続される.各ノー ドには X 座標と Y 座標の組み合わせで表現するノード ID を割り当てる.これは,ノード間で通信する際に指 定する.ノード ID は各ノードに割り当てられる物理的 な ID と,アプリケーションが知る仮想的な ID があり, 仮想と物理の変換は INCC によっておこなわれる.ノー ド間およびチップ外のメインメモリとのデータ送受信は DMA によりおこなわれる. SmartCore システムによる TMR SmartCore システムは,メニーコアプロセッサの空間 冗長性を利用し,NoC(Network on Chip) ルータを高機 能化することで複数コアの多重実行をサポートし,信頼 性もしくは性能の向上を達成する枠組みである.文献 [3] において提案している DMR を実現する高機能ルータで は,2 つのコアによる冗長実行を維持するために,ルータ でパケットを複製し同じパケットをそれぞれのコアに送 信する.また,2 つのコアから送信されるパケットを比較 し,パケットレベルでエラー検出をおこなう.ルータに パケットを操作する仕組みを追加し,プロセッサの他の 要素を変更することなく DMR を実現している.本稿で は,この仕組みを拡張し 3 コアを利用した TMR(Triple Modular Redundancy) を実現する SmartCore システム を提案する. 3. Core (1, 1) Node (1, 1). Core (2, 1) Router (1, 1). Core (1, 2). Core Cache or Memory Node (0, 0). Core Cache or Memory. INCC Router. Node(0, 1). Node (1, 2). Node(2, 1). Core (3, 1) Router (2, 1). Core (2, 2) Router (1, 2). Node (2, 2). Node(3, 1). Core (4, 1) Router (3, 1). Core (3, 2) Router (2, 2). logical (3, 2). Node (3, 2). Router (3, 2). Node(4, 1). Core (4, 1) Router (4, 1). Node(4, 1). Router (5, 1). Core (4, 2). Core (4, 2). logical (3, 2). logical (3, 2). Node (4, 2). Router (4, 2). Node (5, 2). Router (5, 2). 同じバイナリを実行. INCC Router. 図 2: SmartCore システムによる TMR の概要.. 図 1: メニーコアプロセッサアーキテクチャのモデル.. 図 1 に想定するメニーコアアーキテクチャを示す.想定 するメニーコアアーキテクチャは多数のノードをタイル上 に配置する.各ノードは,コア,キャッシュもしくはスクラ ッチパッドメモリ,INCC (Inter Node Communication A Proposal of TMR on Many-core Processors Shimpei SATO† ‡ , and Kenji KISE† †Graduate School of Information Science and Engineering, Tokyo Institute of Technology ‡JSPS Research Fellow DC2. 1-7. 図 2 を用いて,SmartCore システムを利用した TMR の概要を述べる.ここでは,Node(3, 2),Node(4, 2), Node(5, 2) の 3 ノードを冗長実行のために割り当てる. これらのノードに同じ実行ファイルをロードし,仮想 ID を Node(3, 2) に設定する.これにより,それぞれのノー ドが同じパケットを受信していればプログラムの振る舞 いは等しいものになる.プログラムの振る舞いが等しけ れば,これらのノードは同じパケットを送信する.3 つ のノードから送信されるパケットを高機能ルータで多数 決することで TMR を実現する.. Copyright 2011 Information Processing Society of Japan. All Rights Reserved..

(2) 情報処理学会第 73 回全国大会. マスター. 準マスター(ミラーかつマスター). ミラー. Core(3, 2) (3, 2). Core(4, 2) (3, 2). Core(5, 2) (3, 2). 仮想 P. 仮想. (4). (1). Router (3, 2). (4). (2). Router (4, 2). 仮想. (4). (3). Router (5, 2). 図 3: 3 つのノードが同じパケットを受信する仕組み.. 図 3 を用いて,3 つのノードが同じパケットを受信す る仕組みを述べる.文献 [3] において,DMR を実現す るために 2 つのノードをマスターとミラーに区別し,マ スターのルータが受信パケットを複製しミラーに送信 する仕組みを提案した.3 つのノードが同じパケットを 受信するために,新たに準マスターというノードを設 ける.このノードはマスターとミラー両方の役割をも つ.図 3 の場合では,Node(3, 2) と Node(4, 2) および Node(4, 2) と Node(5, 2) がマスターとミラーに関係に ある.Node(4, 2) は,Node(3, 2) のミラーかつ Node(5, 2) のマスターであり,このノードが準マスターとなる. パケット受信の流れを述べる.まず,Node(3, 2) のルー タに自ノード宛のパケットが届く (図 3 (1)).Node(3, 2) はマスターなので,ルータはパケットを複製しミラーで ある Node(4, 2) に送信する (図 3 (2)).Node(4, 2) はマ スターなので,ルータは Node(3, 2) から送信された自 ノード宛てのパケットを複製し,Node(5, 2) に送信する (図 3 (3)).各ノードのコアが同じパケットを受信する (図 3 (4)). 3 つのノードが同じパケットを受信する方法として, それぞれのノードを独立して動作させ,それぞれがアプ リケーションにより指定された通信相手とデータの送受 信をおこなう方法が考えられる.この場合,並列実行さ れるすべてのノードについて 3 重冗長化をする必要があ り,多重化のレベルを選択できるという SmartCore シ ステムの柔軟性が失われる.また,1 つのマスターが 2 つのミラーに対して複製を 2 回おこなう方法が考えられ る.この方法は,DMR を実現する高機能ルータからの 変更点が多くなるため,先に述べた方法を選択している. マスター. 準マスター(ミラーかつマスター). ミラー. Core(3, 2) (3, 2). Core(4, 2) (3, 2). Core(5, 2) (3, 2). 仮想 P. (1) (4). Router (3, 2). 仮想. (1) (3). Router (4, 2). 仮想. 表 1: 2 回のパケット比較結果から判明する故障箇所とマスター のノードが送信するべき正しいパケット. Node(4, 2) の Node(3, 2) の 正しいパケ 故障箇所 比較結果 比較結果 ット OK OK なし 両方 OK NG Node(3, 2) Node(4, 2) NG OK Node(5, 2) 両方 NG Node(4, 2) Node(3, 2) NG Node(4, 2)(準マスター) のルータは自ノードから送信 するパケットにミラーから送信されたパケットとの比較 結果を付加し Node(3, 2)(マスター) に送信する.表 1 に, Node(4, 2) における比較結果と Node(3, 2) における比 較結果から判明する故障箇所および Node(3, 2) が送信 するべき正しいパケットの送信元をまとめる.この表の ように,マスターのルータは準マスターから送信された パケットと 2 回の比較結果から常に正しいパケットを送 信することができる. 4. まとめと今後の課題. メニーコアプロセッサの信頼性向上を目的として,こ れまでに提案してきた DMR を実現する SmartCore シ ステムを拡張し,TMR を実現するする手法を提案した. 今後の課題として,ソフトウェアシミュレータに実装し 評価をおこなう,故障箇所が判明した後の処理について 検討する,などが挙げられる. 謝辞. (1) (2). で多数決を実現できる. パケット送信の流れを述べる.各コアからパケットが 送信される (図 4 (1)).Node(5, 2) はミラーなので,ルー タはパケットの送信先をマスターである Node(4, 2) に 変更し送信する (図 4 (2)).Node(4, 2) は準マスターな ので,ルータは Node(5, 2) と自ノードのコアからのパ ケットを待ち合わせ,比較する.また,パケットの送信 先を Node(3, 2) に変更し,比較結果をパケットに付加 し送信する (図 4 (3)).Node(3, 2) はマスターなので, ルータは Nore(4, 2) と自ノードのコアからのパケットを 待ち合わせ,比較する.準マスターにおける比較結果を 考慮し,正しいパケットを送信する (図 4 (4)).. Router (5, 2). 図 4: 3 つのノードが送信するパケットを比較し多数決を実現 する仕組み.. 図 4 を用いて,3 つのノードが送信するパケットを比 較し,多数決する仕組みを述べる.文献 [3] において, DMR を実現するために 2 つのノードが送信するパケッ トをマスターのルータにおいて比較しエラー検出をおこ なう仕組みを提案した.TMR の場合は,まず準マスター で 2 つのパケット比較を行う,次にマスターのルータで 2 つのパケット比較と準マスターでの比較の結果から送 信するパケットを決定する.単一故障を想定し,ルータ 内のパケット比較に関わる箇所に故障が発生しないこと を仮定すると,2 つのパケット比較を 2 度おこなうこと. 1-8. 本研究の一部は,科学技術振興機構・戦略的創造研究 推進事業 (CREST) 「アーキテクチャと形式的検証の協 調による超ディペンダブル VLSI」の支援による. 参考文献 [1] 佐藤寿倫,他. 舟木敏正:マルチコアプロセッサのた めの電力・性能間トレードオフを考慮したディペンダビ リティ選択法, 情報処理学会論文誌, Vol.49, No.6, pp.2005.2015(2008). [2] 入江英嗣,他.動的タイミング・エラー検出のための「書き 込み保証バッファ」の評価,情報処理学会研究報告, ARC173 [3] 佐藤真平,他.SmartCore システムによるメニーコアプロ セッサの信頼性向上手法,情報処理学会研究報告,ARC187.. Copyright 2011 Information Processing Society of Japan. All Rights Reserved..

(3)

参照

関連したドキュメント

の多くの場合に腺腫を認め組織学的にはエオヂ ン嗜好性細胞よりなることが多い.叉性機能減

化し、次期の需給関係が逆転する。 宇野学派の 「労働力価値上昇による利潤率低下」

算処理の効率化のliM点において従来よりも優れたモデリング手法について提案した.lMil9f

に関して言 えば, は つのリー群の組 によって等質空間として表すこと はできないが, つのリー群の組 を用いればクリフォード・クラ イン形

青色域までの波長域拡大は,GaN 基板の利用し,ELOG によって欠陥密度を低減化すること で達成された.しかしながら,波長 470

※ 硬化時 間につ いては 使用材 料によ って異 なるの で使用 材料の 特性を 十分熟 知する こと

および皮膚性状の変化がみられる患者においては,コ.. 動性クリーゼ補助診断に利用できると述べている。本 症 例 に お け る ChE/Alb 比 は 入 院 時 に 2.4 と 低 値

このように、このWの姿を捉えることを通して、「子どもが生き、自ら願いを形成し実現しよう