新世代マイクロプロセッサアーキテクチャ(前編):1.アーキテクチャ基盤技術 1.新世代プロセッサアーキテクチャの展開
5
0
0
全文
(2) 1. アーキテクチャ基盤技術 1. 新世代プロセッサアーキテクチャの展開 のは間違いないが,その前にも,プロセッサの複雑さの 点から,高速大容量 LSI の設計は途方もないコストがか. ■アウトオブオーダ処理とリネーミング. かるようになっており,また,電力消費と発熱,信頼性. 現在のマイクロプロセッサでは,パイプライン処理や. や安全性などの問題も見過ごせなくなっている.. 並列処理の効率をあげるために,ハードウェアが動的に 命令順序を入れ替えたり,レジスタ番号のつけかえを行. アーキテクチャによる高性能化技術の展開. ったりしている.前者をアウトオブオーダ処理,後者を リネーミングと呼ぶ.これらは,もともとは 1960 年代 のスーパーコンピュータの技術であった.. 性能に関するアーキテクチャ技術について簡単にまと めておこう.. ■キャッシュ 今のプロセッサでは,高速で小容量のメモリをプロセ. ■パイプライン処理. ッサチップ内に搭載し,ふだんは主にこれを使ってデー. パイプラインとは,全体の作業を多数のステージ(工. タへの高速アクセスを実現している.これをキャッシュ. 程)に分割し,各ステージを並列に処理することで,ス. と呼ぶ.キャッシュはプログラマの目からは見えず,ハ. ループット(単位時間の処理量)を飛躍的に向上させる. ードウェアが主メモリとキャッシュのデータの整合性を. 流れ作業のことである.プロセッサのパイプラインは,. とっている.. 命令フェッチ,命令デコード,演算実行,結果の格納の 4 ステージを基本とするが,ステージ数が多いほどスル. ■投機処理. ープットが高くなることから,現在では 20 ステージを. 一般に,依存関係のある前の命令の実行結果を待たず. 超えるパイプラインが普通になっている.ただし,ステ. に次の命令を実行することを投機処理と呼ぶ.分岐予測. ージ数はむやみに増やせばよいというものではない.パ. は,制御ハザードを緩和するための投機処理の一種であ. イプラインレジスタによる遅延,分岐命令やデータ依存. る.分岐予測以外にも,両方の分岐方向の命令列を同時. によるハザードなどによって,ステージ数の上限が決ま. に投機実行するマルチパス投機がある.. ってくる.. データハザードに関する投機として,命令の実行結果 をあらかじめ予測して,計算を先に進める投機のやりか. ■命令レベル並列処理. たがあり,これを値投機と呼ぶ.. 命令レベル並列処理は,1 つのプロセッサの中で複数 の演算装置を同時に稼働させることで行われる.命令. ■スレッド並列処理:SMT. レベル並列処理には,あらかじめ 1 つの命令語中に複. 命令よりも大きな単位(ループや関数など)で並列処. 数 の 演 算 を 入 れ て お く VLIW(Very Large Instruction. 理を行うのがスレッド並列処理である.これには,1 プ. Word)方式と,逐次型のプログラムからハードウェア. ロセッサ内で行う SMT(Synchronous Multithreading). が並列化可能な命令を選んでこれを並列実行するスー. と,複数のプロセッサに分配して行うマルチプロセッシ. パースカラ(superscalar)方式(図 -1)に分けられる.. ングがある.. VLIW は過去のプログラムと互換性がなく,並列度もあ らかじめ決められたものだけという欠点があるが,ハー. ■チップマルチプロセッサ(マルチコア). ドウェアが単純でクロックが速くなる利点がある.スー. LSI のチップ内に複数のプロセッサを設け,マルチプ. パースカラはハードウェアが複雑だが,過去のプログラ. ロセッシングを行うのが,チップマルチプロセッサ(マ. ムとの互換性がよく,並列性の抽出も柔軟といえる.現. ルチコア) (図 -2)である.チップマルチプロセッシン. 行では,パソコン用などの汎用プロセッサは多くがスー. グには,まったく同じプロセッサを複数個チップに搭載. パースカラであり,組み込み用などに VLIW が多く見. するもの,規模や性質の異なるプロセッサを混載するも. られるが,Intel 社の IA64(サーバ用 VLIW プロセッサ). のがある.. などの例もあり,どのような用途にどちらが有利という 結論はまだ得られていない.. ■ SoC. 近年では,タイルプロセッサに見られるような,チッ. 汎用プロセッサ以外に,暗号処理やストリーム処理の. プ内超並列処理アーキテクチャが考えられるようになった.. 専用ハードウェアを同一チップに混載することで特定の 処理を高速化したり,実時間性を高めたり,機能を高め たりするのが SoC(System on Chip)である. IPSJ Magazine Vol.46 No.10 Oct. 2005. 1101.
(3) 特集 新世代マイクロプロセッサアーキテクチャ(前編). パイプラインステージ フィッチ. 命令レジスタ. PC. add r10, r4, r11. マッピング テーブル. リネーム. リネーム後の命令. add R10, R15, R11. add R12, R11, R13. レジスタ読み出し. デコード1 集中型 命令ウィンドウ. デコード2. 実行. 命令キャッシュ. add r12, r11, r13. 演算器群. タグ. 演算器. ×. ALU. add R1, 3, wait(R14). ○. MUL. mul R4, 2, -1. ×. MUL. mul R7, wait(R15),2. ○. ALU. sub R10, 4, 23. ○. メモリ. lw R13, 4(0xFFF1). レジスタファイル. 命令. ALU. MUL. フォワー ディング. Load/Store. データキャッシュ. 結果格納. 図-1 スーパースカラプロセッサの基本構成. 3). ■リコンフィギャラブルアーキテクチャ. IT 社会の主役となった.と同時に,情報機器のさらな. リコンフィギャラブルアーキテクチャは,動的にアー. る小型化が進み,組み込み型マイクロプロセッサの市場. キテクチャを変更することで,高性能化や高機能化を狙. が急速に拡大した.. ったもので,開発コストの低減にもつながり,注目され. 科学技術計算などいわゆる HPC(High Performance. ている.. Computing)では無限の性能が要求されるし,サーバ やデスクトップ PC でも性能への要求は根強くある.ア. 新しいデザインバランス 4). ーキテクチャ側のシーズとしては,タイルプロセッサや 超並列マルチコアがこれに応えるであろう.一方,通常 の個人ユースでは,性能は最も重要な要求ではなくなり. 高性能で廉価なマイクロプロセッサができたことで,. つつある.. PC が爆発的に普及し,インターネットの発展とともに,. 性能以上に大切になっているのが,省電力とディペン. 1102. 46 巻 10 号 情報処理 2005 年 10 月.
(4) 1. アーキテクチャ基盤技術 1. 新世代プロセッサアーキテクチャの展開. 図-2 チップマルチプロセッサ. ダビリティである.. 代替機能の提供,高信頼化コードへの自動変換などの技. 省電力は,組み込み型プロセッサではバッテリ使用時. 術が必要となっている.また,安全性については細やか. 間の問題から,デスクトップやサーバでは発熱の問題か. な認証を行うセキュアプロセッサの研究が盛んになって. ら重要となっている.素子からソフトウェアまでさまざ. きた.. まなレベルで省電力化技術の開発が課題となる.低電圧. 性能・規模から省電力・ディペンダビリティへのバラ. 動作,使わない機能ブロックへのクロックの供給停止,. ンスのシフトがあり,この傾向はますます大きくなって. 状況に応じたクロック周波数の低減,並列処理や投機処. いくであろう.. 理の抑制など,さまざまな手法が提案されている. IT 社会で最重要となるのが情報インフラのディペン ダビリティ向上であろう.宇宙船から自家用車までの乗 り物,電子政府,銀行など金融,医療,防災といった信 頼性・安全性に対する要求がきわめて高い応用分野に対 して,マイクロプロセッサは十分なディペンダビリティ を提供しなければならない.. 参考文献 1)Hennessy, J. L. and Patterson, D. A.: Computer Architecture, A Quantitative Approach, 3rd Edition, Morgan Kaufmann (2003). 2)Moore, G. : Cramming More Components onto Integrated Circuits, Electronics, Vol.38, No.8 (Apr. 19, 1965). 3)坂井修一:コンピュータアーキテクチャ,コロナ社 (2004). 4)坂井修一:スピードからディペンダビリティへ:プロセッサのこ れから,情報処理学会開催支部大会(招待講演) ,Vol.H16, No.S-07, pp.143-148 (Oct. 2004). (平成 17 年 8 月 20 日受付). ここでディペンダビリティは,主に信頼性と安全性の 複合的な性質と考える.信頼性の実現のためには,従来 からの多重系の利用のほか,再構成可能デバイスによる IPSJ Magazine Vol.46 No.10 Oct. 2005. 1103.
(5) 訂 正 3). 本誌 46 巻 10 号(2005 年 10 月号)p.1102 の図 -1「スーパースカラプロセッサの基本構成 」内に誤りがありました. お詫びして以下の通り訂正いたします. (誤)フィッチ (正)フェッチ.
(6)
関連したドキュメント
高齢者の性腺機能低下は,その症状が特異的で
を高値で売り抜けたいというAの思惑に合致するものであり、B社にとって
彼の語る所によると,この商会に入社する時,経歴
編﹁新しき命﹂の最後の一節である︒この作品は弥生子が次男︵茂吉
耐震性及び津波対策 作業性を確保するうえで必要な耐震機能を有するとともに,津波の遡上高さを
高(法 のり 肩と法 のり 尻との高低差をいい、擁壁を設置する場合は、法 のり 高と擁壁の高さとを合
モノづくり,特に機械を設計して製作するためには時
・分速 13km で飛ぶ飛行機について、飛んだ時間を x 分、飛んだ道のりを ykm として、道のりを求め