コンピュータアーキテクチャ

(1)

コンピュータアーキテクチャ

第15週入出力アーキテクチャ・まとめ

2014年1月17日金岡晃

(2)

授業計画

第1週 (9/25)

授業概要・２進数表現・論理回路の復習

第2週 (10/2)

２進演算（数の表現）

第3週 (10/9)

演算アーキテクチャ（演算アルゴリズムと回路）

第4週 (10/16)

休講第5週

(10/23)

休講第6週

(10/30)

ノイマン型コンピュータ・命令とは・命令の使い方

第7週 (11/6)

命令セットアーキテクチャ（命令の表現・命令の実行の仕組）

第8週 (11/13)

中間試験第9週

(11/20)

休講第10週

(11/27)

ハーバードアーキテク

チャ・RISCとCISC・制御アーキテクチャ

第11週 (12/4)

メモリの仕組第12週

(12/11)

キャッシュメモリと仮想メモリ

第13週 (12/18)

割込みアーキテクチャ第14週

(1/8)

パイプライン第15週

(1/17)

入出力アーキテクチャ・まとめ

(3)

試験について

•

日時

– 2014

年

1

月

29

日（水）

2

限

•

形式

–

筆記試験

•

持ち込み不可

• III

号館

305

教室で実施

•

時間

– 10:40-11:40

の

60

分

•

試験範囲

–

初回から今回までの配布資料

–

教科書内の該当する箇所

–

教科書内の該当する箇所

•

第

2

章、第

3

章、第

5

章

•

第

4

章、第

6

章、第

7

章、第

8

章、第

9

章、第

10

章

(4)

実験協力の依頼

金岡研究室ではさまざまな研究テーマで研究を行っています

• ネットワークセキュリティ

• 暗号技術の応用

• セキュリティのユーザビリティネットワークセキュリティ：

ネットワークからのさまざま攻撃を検知するシステムセキュリティのユーザビリティ：

ユーザの「慣れ」によるセキュリティ効果の減少について

ユーザの実際の

アクションをみることで効果を測定したい

(5)

【復習】第 14 週

パイプライン

コンピュータアーキテクチャ

(6)

ワイヤードロジック制御の事例

デコード情報を配線によって直接的にALUや PC、汎用レジスタなどに与える方法

入力出力

S1 S0 Y

0 0 レジスタA

0 1 オールゼロ 1 0 入力ポート 1 1 オールゼロセレクタの動作

制御信号

動作

0 ロード

（データを読み取る）

1 • PCは、＋１

（カウントアップ）

• A、出力は、ラッチレジスタの動作

フェッチ

デコード

実行

(7)

パイプラインとは

各命令の段階（ステージ）を他の命令と並行して行う

(8)

パイプライン処理が停滞する可能性

もっとも有効にパイプライン処理が行われている場合

パイプラインの流れが乱れると処理の効率が低下する

(9)

ハザード

ハザード（Hazard）：パイプラインの効率を低下させる要因

構造ハザード（Structural Hazard）

データハザード（Data Hazard）

制御ハザード（Control Hazard）

(10)

構造ハザードと制御ハザード

構造ハザード（Structural Hazard）

制御ハザード（Control Hazard）

メモリやレジスタなどの機能を同時にアクセスしようとした際に発生するハザード。

同時アクセスを回避するためにストールを挿入する

分岐命令実行時は、結果により次の実行命令が異なる。分岐しない場合にはハザードは起こらないが、分岐する場合は分岐先にある新しい命令をフェッチする必要が生じる

割り込みやキャッシュミス、ページフォルトなどによっても発生する

インタロック（Interlock）：

(11)

データハザード

データをアクセスする際に発生するハザード

RAW（Read After Write）

先行命令がレジスタなどに処理結果を書き込んでいないのに後続命令がそのレジスタを読み込もうとした状態

WAR（Write After Read）

先行命令がレジスタなどからデータを読み取る前に後続命令がそのレジスタにデータを書き込もうとした状態

WAW（Write After Write）

先行命令がレジスタなどへデータを書き込む前に、後続命令が同じレジスタにデータを書き込もうとした状態

(12)

分岐命令におけるハザード対策（１）：

遅延分岐

レジスタAの値が負であるときにラベルLOOPへ分岐するものとする

命令実行フロー

(13)

分岐命令におけるハザード対策（１）：

遅延分岐

分岐命令前のロード命令をほかの場所に移動してもプログラムの実行に影響がない場合は変更してロード命令を実行する

(14)

分岐命令におけるハザード対策（２）：

分岐予測

繰り返し文による条件分岐ではほぼ毎回分岐する分岐予測

分岐命令の実行結果を予想しハザードを減らす手法

近年は分岐予測のためにブランチターゲットバッファ（BTB）とブランチヒストリーテーブル（BHT）を備えたCPUが多い

1つの分岐情報によって予測が成功する確率は80～90%、さらに1つ前の分岐情報を用いればこれ以上になる

(15)

他の高速化技術：スーパーパイプライン

各ステージの実行速度の高速化によるパイプライン処理の動作速度向上従来ステージをさらに分割

(16)

他の高速化技術：スーパースカラ

各ステージで複数命令に対するフェッチやデコードを行うこと

各ステージで1つの命令に対するフェッチやデコードを行うことをシングルスカラ方式という

(17)

• 非常に長い命令語長

• 一般には256ビット以上の命令語長

他の高速化技術： VLIW

VLIW（Very Long Instruction Word）

スロットと呼ばれる領域で構成スロットはCPU機能と対応

→複数の機能を同時動作させることが可能

(18)

他の高速化技術：ベクトルコンピュータ

科学技術計算ではベクトル演算が多い

CPU内にベクトル専用のデータレジスタを搭載して処理速度を高めたのがベクトルコンピュータ

(19)

複数のCPUで同一メインメモリを共有するシステム

他の高速化技術：マルチプロセッサ

複数のCPUを用いて並列処理を行うことで処理速度の向上を実現

密結合システム（Tightly Coupled System）

個別のメインメモリを使用した各 CPUを共有バスによって接続する疎結合システム（Loosely Coupled System）

(20)

第 15 週

入出力アーキテクチャ・まとめ

コンピュータアーキテクチャ

(21)

本日の到達目標と概要

•

到達目標

–

入出力装置の制御の概要と、これまでの内容を概観する

•

概要

–

入出力装置とは

–

入出力装置の制御

•

直接制御方式

•

間接制御方式

–

これまでの内容

(22)

入出力アーキテクチャ

キーボード、マウス、ディスプレイ、プリンタ入出力装置

入出力装置の制御

CPUが直接的に入出力装置の制御に関与する直接制御方式

間接制御方式

(23)

入出力装置の制御：直接制御方式

メインメモリ（主記憶装置）のアドレスに、入出力装置用のレジスタを割り当てておき、通常の転送命令によって入出力を行う方式

メモリマップトI/O（Memory Mapped Input/Output）

IN命令やOUT命令などの入出力専用命令を用いて直接的に入出力装置にアクセスする方式

I/OマップトI/O（Input/Output Mapped Input/Output）

(24)

入出力装置の制御：間接制御の方式

• 入出力装置とメインメモリ間で直接的にデータの転送を行う方式

• 制御はCPUではなくDMAコントローラが行う DMA（Direct Memory Access）

• 入出力装置を制御するための専用回路を用意することで、CPUの負担をさらに軽減することを目的とした方法

入出力チャネル（Input/Output Channel）

(25)

これまでのまとめ

(26)

2 進数と 10 進数と 16 進数

2進数 10進数 ^16進数

0 0 0

1 1 1

10 2 2

11 3 3

100 4 4

101 5 5

110 6 6

111 7 7

1000 8 8

1001 9 9

2進数 10進数 ^16進数

1010 10 A

1011 11 B

1100 12 C

1101 13 D

1110 14 E

1111 15 F

10000 16 10

10001 17 11

10010 18 12

10011 19 13

2進数 10進数 ^16進数

10100 20 14

10101 21 15

10110 22 16

10111 23 17

11000 24 18

11001 25 19

11010 26 1A

11011 27 1B

11100 28 1C

11101 29 1D

n進数であることを明示する場合は

(0000111) のように（）と右下に基数を記載する

(27)

2 の補数

•

負の数を表現する場合は、

2

の補数と呼ばれる表現が使われる

• n

ビット表現のデータの場合、

n+1

ビット目が

1

となる値から負として表現したい数値を引くことで求められる

16ビット表現データの場合で (-11010)2 を表す：

10000000000000000-11010=1111111111000110

簡単なやり方：値を反転（逆）にして、その値に1を加える 2の補数表現を利用する理由

演算が容易になる。

減算（引き算）が2の補数の加算（足し算）で行うことが可能。

(28)

実数の表現：浮動小数点数

ビット番号：

0 1 0 0 0 0 0 0 1 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

31 30 29 28 27 2625 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0

実数を2進数で表現する (5.625)¹⁰ (101.101)²

整数部を0以外の１桁（つまり2進数の場合 1）に調整（正規化、normalize）する。

1.01101 × 2² 仮数部指数部

32ビット

（単精度）の場合

• MSB：仮数の符号

• 8ビット：指数部

• 23ビット：仮数部

バイアス表現：

-127乗から128乗まで表すために、127を加算して2進表現するけち表現（Economized Representation）

2進数を正規化すると必ず1になるため、1を省略して1ビット省略する方法

(29)

論理回路

論理回路とは

演算回路の組み合わせによりさまざまな論理演算を実現する回路演算回路

論理演算を実現する回路：AND回路、OR回路、NOR回路など

代表例：加算器（半加算器、全加算器）

複数の桁の2つのデータを入力し、その加算の結果を出力する回路

(30)

加減算アルゴリズム

• 加算

– 全加算器をビット数分並べる

• 減算

– 2の補数表現にして加算にする

• これらを合わせると加減算を両方演算可能な回路を構成できる

𝑦𝑥

𝑐_𝑜𝑢𝑡 𝑠

FA

𝑋

𝑌 𝐶₀

FA

𝑋 𝑌 𝐶₁

𝐶₀ 𝑆

FA

𝑋 𝑌 𝐶₁

𝐶₀ 𝑆

FA

𝑋 𝑌 𝐶₁

𝐶₀

𝑆 𝑆₃

𝐶_O

𝑆₂

𝑆₁

𝑌₀ 𝑆 𝑋₀

𝑌₁ 𝑋₁ 𝑌₂ 𝑋₂ 𝑌₃ 𝑋₃

全加算器（FA）

加減算器の例

𝐶_𝑆𝐺𝑁：制御信号

𝑋 + 𝑌 𝑖𝑓 𝐶_𝑆𝐺𝑁 = 0 𝑋 − 𝑌 𝑖𝑓 𝐶_𝑆𝐺𝑁 = 1

(31)

乗算アルゴリズム

ブース法

（Booth Altorithm）前提

𝑃 = 𝑋 ⋅ 𝑌を求める。

このとき𝑋を被乗数、𝑌を乗数と呼ぶ。

また𝑋を2進数表現した際の各ビットを𝑥_𝑖で表す。

𝑖 (0,1, … )は下位から数えて何ビット目かを示す。

• 負の乗算にも対応した広く利用されている方式。

• 負の数は2の補数で表現される

• 乗数を2進展開し、各ビットについてシフトと加算を行っていく

• 各ビットとその前のビットの値の組み合わせによりシフトと加算の動作が異なる

• 𝑖ビット目の動作では𝑦_𝑖と𝑦_𝑖−1の組み合わせを見る

• 組合せは以下の3種類：00または11、10、01

• 動作は加算の位置が変化する方法と加算の位置を変化させない方法で異なる

(32)

除算アルゴリズム

引き戻し法 (Restoring Division)

引き放し法

(Nonrestoring Division) 前提

𝑋と𝑌の商𝑄と剰余𝑅求める。

このとき𝑋を被除数、𝑌を除数と呼ぶ。

また𝑋を2進数表現した際の各ビットを𝑥_𝑖で表す。

𝑖 (0,1, … )は下位から数えて何ビット目かを示す。

𝑋は2𝑛ビット、 𝑌は𝑛ビットとする。

また𝑋の上位𝑛ビットを𝑋1、下位𝑛ビットを𝑋2とする

𝑋の上位𝑛ビットから𝑌を引いていく。筆算では𝑋の上位𝑛ビットと𝑌の大小を比較し、大きければその桁の商を1、小さければ0としているが、引き戻し法ではまず減算を行い、その結果の正負を判定する。負である場合、同じものを加算することで元に戻す。

(33)

ノイマン型コンピュータの特徴

プログラム可変内蔵方式

逐次処理方式

単一メモリ方式

• プログラムを内部のメモリに記憶させることで、プログラムの入力や変更が簡単に行える

• プログラム記憶方式とも

• 命令は、原則として実行順にメモリに格納されており、この命令を順次取り出しながら処理を進める。

• 取り出す命令のアドレスは、プログラムカウンタに従って指示する

• プログラムとデータは、同じメモリ内に格納され、メモリにはアドレスが割り振られている。

• 一時的なデータ格納領域として、高速に動作する小容量メモリであるレジスタを備えている。

• レジスタとメモリ間のデータ転送は、プログラムで指示できるため、メモリの効果的な利用が可能となる。

(34)

基本動作

命令

プログラムカウンタ PC

命令レジスタ IR

デコーダ DEC

制御信号 OP opr

メモリアドレスレジスタMAR

アドレス

メモリ ALU

汎用レジスタGR

フラグレジスタFR アドレスバス

制御装置主記憶装置演算装置

(35)

命令の形式

命令コード

（OP）

オペランド

（opr）基本形式

操作命令を示す命令コード（Operation Code）と

操作対象のデータを示すオペランド（Operand）からなる

分類

3オペランド命令 2オペランド命令 1オペランド命令 0オペランド命令

(36)

命令セット

CPUが備えているすべての命令の集まりを命令セット（Instruction Set）という

COMET IIで実行される

アセンブラ言語CASL IIの命令セットロード、ストア、

ロードアドレス命令算術、論理演算命令

比較演算命令シフト演算命令

分岐命令

スタック操作命令コール、リターン命令

その他

(37)

RISC と CISC

RISC

（Reduced Instruction Set Computer)

CISC

（Complex Instruction Set Computer) 縮小命令セットコンピュータ。

簡単な命令セットだけを用意することでコンピュータの構成を簡単化し、

高速化は開発期間の短縮を実現。

複雑な処理では多くの命令を組み合わせる必要が生じる。

RISCが提案された後、これまでの命令セットコンピュータを複雑命令セットコンピュータ（CISC）と呼ぶようになった。

(38)

アドレッシング

OP opr

アドレスメモリ

XXX a

操作

メモリには格納領域ごとにアドレス（番地）と呼ばれる値が割り振られている命令のオペランドにアドレスを記述すれば

その値に対応する格納領域を特定できるコンピュータでは各種のアドレスの指定法が用いられている

有効アドレス（Effective Address）：

最終的に参照されるアドレスアドレッシング：

処理対象となるデータを決める操作

アドレッシング有効アドレス

(39)

ハーバードアーキテクチャ

• ハーバードアーキテクチャの特徴

– 命令とデータを格納するメモリを個別に用意 – 非ノイマン型コンピュータ

• 広義のノイマン型コンピュータとも

– プログラム可変内蔵方式、逐次処理

CPU メイン

メモリ CPU

命令メモリ

データメモリ命令用

キャッシュメモリデータ用

キャッシュメモリ

CPU メイン

メモリノイマン型

アーキテクチャハーバードアーキテクチャ

現在のコンピュータ

(40)

コンピュータの制御

制御の流れ • メインメモリ（主記憶装置）に格納されている命令を CPU内の命令レジスタに取り出した後、デコーダで解読する

• デコーダから出力されるデコード情報は、ALU(算術論理演算装置）やPC（プログラムカウンタ）、汎用レジスタなどに与えられる

デコード情報をどのようにして処理して制御を実現するか制御アーキテクチャ

• ワイヤードロジック制御（Wired Logic Control）

• 布線論理制御方式、または配線論理制御方式とも

• マイクロプログラム制御（Micro-programmed Control）

(41)

ワイヤードロジック制御の事例

デコード情報を配線によって直接的にALUや PC、汎用レジスタなどに与える方法

入力出力

S1 S0 Y

0 0 レジスタA

0 1 オールゼロ 1 0 入力ポート 1 1 オールゼロセレクタの動作

モデル

制御信号

動作

0 ロード

（データを読み取る）

1 • PCは、＋１

（カウントアップ）

• A、出力は、ラッチ

• （データの保持）

レジスタの動作フェッチ

デコード

実行

(42)

メモリ装置の機能と分類

メモリ装置の機能

• データをメモリ媒体に格納して保持する（書き込む、Write）機能

• メモリ媒体に格納されているデータを取り出す（読み取る：Read）機能メモリ装置にアクセス（Access）する：

メモリ装置を用いてデータの書き込みや読み取り操作を行うこと

メモリ装置の分類

• 主記憶装置/補助記憶装置

• メモリ媒体の種類

• 半導体、磁性材料

• 揮発性/不揮発性

• 可搬性

• RAM（Random Access Memory）/ROM

（Read Only Memory）

• アクセス方式

• シーケンシャル（順次）アクセス

（Sequential Access）

• ランダム（直接）アクセス（Random

(43)

一度アクセスされたアドレスに近いアドレスは、近い時間内にアクセスされる可能性が高い

参照局所性

実行中のプログラムが主記憶装置にアクセスする場合には、空間的・

時間的な参照局所性（Referential Locality）があるメモリの空間的参照局所性

一度アクセスされたアドレスは、近い時間内に再びアクセスされる可能性が高い

メモリの時間的参照局所性

アドレス付近の格納データをブロック単位でキャッシュメモリに転送

参照局所性により、効率的なメモリアクセスが可能になる

(44)

仮想メモリ

• マルチタスクと主記憶装置

– コンピュータでソフトウェアを実行する場合にはそのプログラムを主記憶装置に格納しておくことが必要条件

– マルチタスクで複数プログラム＋プログラムの高度化によりプログラムのサイズは増加傾向

• 仮想メモリ

– 主記憶装置を仮想的に増大させる技術

– 補助記憶装置（一般的にはハードディスク装置）上に構成された空間

– 実メモリへは参照局所性を活用してアクセス可能性の高い仮想アドレス付近のブロック領域を割り当てる

比較項目 仮想メモリ キャッシュメモリ

目的主記憶領域の増大化（空間的）アクセスの高速化（時間的）

ブロックサイズ大きい（512～8192B程度）小さい（4～128B程度）

主記憶装置との転送速度対象が補助記憶装置であるため低速

対象がキャッシュメモリであるため高速

制御方法主体ハードウェア主体

(45)

割り込みとは

• 通常ルーチンを処理しているときに割り込みが発生すると、実行していた通常ルーチンを中断して割り込みルーチンへ分岐する。

• 割り込みルーチンの実行が終了した後にもとの通常ルーチンへ復帰する。

– 通常ルーチンは中断するものの、結果としては通常ルーチンと割り込みルーチンが平行して実行されたように見える

実行中の処理を一度停止して、他の処理を行った後に再開する機能

コンピュータアーキテクチャ

コンピュータアーキテクチャ

授業計画

試験について

日時

年

月

日（水）

限

形式

筆記試験

持ち込み不可

号館

教室で実施

時間

の

分

試験範囲

初回から今回までの配布資料

教科書内の該当する箇所

教科書内の該当する箇所

第

章、第

章、第

章

第

章、第

章、第

章、第

章、第

章、第

章

実験協力の依頼

【復習】第 14 週

パイプライン

コンピュータアーキテクチャ

ワイヤードロジック制御の事例

パイプラインとは

パイプライン処理が停滞する可能性

ハザード

構造ハザードと制御ハザード

データハザード

分岐命令におけるハザード対策（１）：

遅延分岐

分岐命令におけるハザード対策（１）：

遅延分岐

分岐命令におけるハザード対策（２）：

分岐予測

他の高速化技術：スーパーパイプライン

他の高速化技術：スーパースカラ

他の高速化技術： VLIW

他の高速化技術：ベクトルコンピュータ

他の高速化技術：マルチプロセッサ

第 15 週

入出力アーキテクチャ・まとめ

コンピュータアーキテクチャ

本日の到達目標と概要

到達目標

入出力装置の制御の概要と、これまでの内容を概観する

概要

入出力装置とは

入出力装置の制御

直接制御方式

間接制御方式

これまでの内容

入出力アーキテクチャ

入出力装置の制御：直接制御方式

入出力装置の制御：間接制御の方式

これまでのまとめ

2 進数と 10 進数と 16 進数

2 の補数

負の数を表現する場合は、

の補数と呼ばれる表現が使われる

ビット表現のデータの場合、

ビット目が

となる値から負とし て表現したい数値を引くことで求められる

実数の表現：浮動小数点数

論理回路

加減算アルゴリズム

乗算アルゴリズム

となる値から負として表現したい数値を引くことで求められる