浮動小数点数について

(1)

浮動小数点数について

木村巌

^∗ 2004

年

7

月

7

日

1 浮動小数点数

1.1

浮動小数点数表示の一般論

浮動小数点数とは、実数

x

を計算機の上で近似するための方法である．自然数

b

を固定し、これを基数とよぶ．実数

x

を、符号部、指数部、仮数部に分けて考える．

符号部は

+

または

−

のみ．指数部というのは、1

≤ b

^−e

|x| < b

となるように

e

を取った時の

b

^e

, e

を指数という．仮数部というのは

b

^−e

|x|

のことをいう．

仮数部を

b

進表記して、xの仮数部

= f

₀

b

⁰

+ f

₁

b

⁻¹

+ · · · + f

_p

b

^−p

, 0 ≤ f

_i

< b

と書いた時、pを桁数という．

例

1:

基数

10

について、10進の

−123.45

を表現すると、

−123.45 = −1 × 10

²

× (1 + 2 × 10

⁻¹

+ 3 × 10

⁻²

+ 4 × 10

⁻³

+ 5 × 10

⁻⁴

).

これを、「-1｜2｜12345」のように表すと、指数部に

10

進

1

桁、仮数部に

10

進

5

桁を用いた浮動小数点数表示となる．

例

2:

基数

10

について、10進の

+0.000987

を表現すると、

+0.000987 = +1 × 10

⁻⁴

× (9 × 10

⁻¹

+ 8 × 10

⁻²

+ 7 × 10

⁻³

).

これを、「1｜-4｜987」のように表すと、仮数部に

10

進

5

桁を用いた浮動小数点数表示となる．

例

2

では、指数部に負の数が現れているが、このような状況に対応するために、指数部に一定の数を足し（バイアスという）、常に正にとることがおおい．

例えば今の場合、バイアスを

4

とすれば、指数部を

10

進

1

桁の範囲で

0.000987

が、「1｜0｜987」のように表現できる．

∗

2004

年度前期・プログラミング演習

I

資料

(2)

一般に、基数

b

に関する浮動小数点数表示は、

x = s × b

^e

× X

p

k=0

f

_k

b

^−k

,

s

が符号（+または

−）、b

は基数で（2,

8, 10, 16

のいずれかであることが多い）、

e

が指数、pは桁数、f_kはそれぞれ各桁を表す数字（0

≤ f

_k

< b）、という形に

なる．

したがって、基数、指数の桁数、仮数部の桁数によって、一つの浮動小数点数表示が表現できる数の範囲と、その精度が定まる．

例

3:

基数

10,

指数の桁数

1,

バイアス

4,

仮数部の桁数

5

とすると、この浮動小数点数表示で表現できる最大の値は、「1｜9｜99999」、即ち

+1 × 10

⁹⁻⁴

× (9 × 10

⁰

+ 9 × 10

⁻¹

+ 9 × 10

⁻²

+ 9 × 10

⁻³

+ 9 × 10

⁻⁴

)

= 10

⁵

× (9.9999) = 99990.

問

1:

上の例

3

の浮動小数点表示で表現できる最小の正の値、ならびに最小の値を求めよ．

次に、浮動小数点数表示の精度について考えよう．上記の例のように、基数

10,

指数の桁数

1,

バイアス

4,

仮数部の桁数

5、の浮動小数点数表示で、

「1｜9｜

99999」は 999990

であった．同様の計算で、「1｜9｜99998」は

999980

であることがわかる．つまり、仮数部の最後の

1

桁を

1

減らすと、実数としては

10

の差が出る．

「1｜

8

｜

99999」と「1

｜

8

｜

99998」とについて同じことを考える．

「1｜

8

｜

99999」

は

99999

であり、「1｜8｜99998」は

99998

である．つまり、指数が

8（バイアス 4

があることに注意）のときは、仮数部の最後の

1

桁の

1

の差が、実数としても

1

の差となる．

更に、「1｜7｜99999」と「1｜7｜99998」とについて同じことを考える．「1｜7

｜99999」は

9999.9

であり、「1｜7｜99998」は

9999.8

である．つまり、指数が

7

のときは、仮数部の最後の

1

桁の

1

の差が、実数としては

0.1

の差となる．

まとめると、二つの浮動小数点数

a, b

があり、その指数部は等しいとする．指数が大きい場合は、

a, b

の仮数部の差は、

a, b

の大きな差となる．また、指数が小さい場合は、a, bの仮数部の差は、

a, b

の小さな差となる、ということがわかる．

1.2

基数が

2

の場合の浮動小数点数表示：

IEEE754

基数を

2,

符号に

1bit,

指数に

m bit,

仮数に

n bit

使うとすると、全体の幅は

1 + m + n bit

になる．最初の

1

は常にあるように指数部を調節するのだから、

記憶する必要がない事に注意する（ケチ表現）．

(3)

更に、基数

2

に関する浮動小数点数表示に関しては、IEEE754という国際規格が存在し、現在のほとんどのコンピュータで採用されている．

例えば、基数

b = 2

で全体の幅が

32bit（=8bytes）の浮動小数点数が、指数

部に

8bit,

仮数部に

23bit

用いるものとすると、

x = (−1)

^s

× 2

^e

× Ã

1 + X

23

k=1

f

_k

2

^−k

! ,

s = 0, 1, e

は

−126 ≤ e ≤ +127

を満たす自然数¹

.

指数のバイアスは

127. C

言語の

float

はこのようになっている．

同様に、基数

b = 2

で全体の幅が

64bit

の浮動小数点数が、指数部に

11bit,

仮

数部に

52bit

用いるものとすると、

x = (−1)

^s

× 2

^e

× Ã

1 + X

52

k=1

f

_k

2

^−k

! ,

s = 0, 1, e

は

−1022 ≤ e ≤ +1023

を満たす自然数²

.

指数のバイアスは

1023. C

言語の

double

はこのようになっている．

例

4: float

型で

0.5

がどのように表示されるのか考えてみよう．

0.5 = (−1)

⁰

× 2

⁰

× 1 × 2

⁻¹

= (+1) × (2

⁻¹

) × (1 + 0 × 2

⁻¹

+ · · · + 0 × 2

⁻²⁴

).

バイアスは

127

であるから、指数は

126 = (01111110)

₂である．また、ケチ表現（仮数部の

2

⁰の桁は必ず

1

なので記録する必要がない）を考えれば、0.5 =

「0|01111110|000000000000000000000000」である．

例

5:

同様に、float型で

1.75

がどのように表示されるのか考えてみよう．

1.75 = (−1)

⁰

× 2

⁰

× (1 × 2

⁰

+ 1 × 2

⁻¹

+ 1 × 2

⁻²

)

= (+1) × (2

⁰

) × (1 + 1 × 2

⁻¹

+ 1 × 2

⁻²

+ 0 × 2

⁻³

+ · · · + 0 × 2

⁻²⁴

).

バイアスは

127

であるから、指数は

127 = (01111111)

2である．また、ケチ表現（仮数部の

2

⁰の桁は必ず

1

なので記録する必要がない）を考えれば、1.75 =

「0|01111111|110000000000000000000000」である．

例

6:

逆に、ビット列で表された

float

型の浮動小数点数を、10進表記にすることを考える．例えば「1|1000 0001|010

. . . 0」の符号は −,

指数は

129

であるか

1上限が

128

でないのは、バイアアス

127

を足した値

128 + 127 = 255 = (1111 1111)

2が、

別の特定の状況を表すために予約されているからである：仮数部のすべての

bit

が

0

のとき、無限大．そうでない時

NaN（not a number）とされている．

また、下限が

−127

でないのは、バイアス

127

を足した値

−127 + 127 = 0 = (0000 0000)

2

が、別の状況を表すために予約されているからである．仮数部のすべての

bit

が

0

の時、浮動小数点数表示された

0

を表し、そうでない時非正規化数を表す．

2上限、下限の値については、float型の場合同様に、特定の状況を表すために予約されている場合を除外している．

(4)

ら、バイアスが

127

であることから

129 − 127 = 2,

仮数部は

2

⁻²

= 0.25

であることが読みとれる．よって、上の値は、

(−1)

¹

× 2

²

× (1 + 0 × 2

⁻¹

+ 1 × 2

⁻²

+ 0 × 2

⁻³

+ . . . 0 × 2

²³

) = −5.0

問

2: float

型のビット列「0|1111 1101|10110

. . . 0」を 10

進表記にせよ．

2 浮動小数点数の加算

再び

10

進の場合を例にとって、浮動小数点数同士の加算について考える．仮数には

4

桁、指数には

2

桁（ともに

10

進で）しか保存できないものとする．

例

7:

9.999 × 10

¹

+ 1.610 × 10

⁻¹

=?.

まず、指数を調節することで、両方の小数点の位置を合わせる．

1.610 × 10

⁻¹

= 0.01610 × 10

¹

∼ 0.016 × 10

¹

仮数部に

4

桁しか保持できないので、最後のようになる．

ついで、仮数部の和を計算する：

9.999 + 0.016 = 10.015.

よって、全体の値は、10.015

× 10

¹である．

更に、浮動小数点数表示を正規化（小数点の左が

1

桁になるよう調整）すると、

10.015 × 10

¹

= 1.0015 × 10

²

.

しかし、仮数部は

4

桁しか保持できないので、最後の桁の

5

を丸めなければならない．ここでは、四捨五入をとることにする（丸めの方法はいろいろある）．

したがって、

10.015 × 10

¹

= 1.0015 × 10

²

∼ 1.002 × 10

²

.

として最終結果

1.002 × 10

²を得る．

計算の各過程で、桁溢れが発生する可能性がある．例えば、

•

指数を調整して仮数部の小数点の位置を合わせる際に、指数が

2

桁に収まらなくなる

(5)

•

丸めを行なうと、浮動小数点表示が正規型（小数点の左に

1

桁しかない状態）ではなくなることがある．例えば、仮数部が

9.999

のとき、1/10,

000

の桁で繰り上げると、10.000となる．これを再び正規化すると、指数が

1

増えるが、すでに指数が

99

だった場合、1加えると

100

になってしまい、

指数に

2

桁しか保持できないという状況に反する．つまり、丸めによる桁溢れの可能性もある

例

8: 10

進の

0.5

と

−0.4375

の加算を、それぞれ

2

進の浮動小数点数表示に直してから行なう．

まず、

0.5 = 2

⁻¹

= (1.000)

₂

× 2

⁻¹

−0.4375 = −7/16 = −7 × 2

⁻⁴

= −(0.0111)

₂

= −(1.110)

₂

× 2

⁻²

.

指数が小さな方（−1.110

× 2

⁻²）の仮数を右にシフトして、大きい方と指数が合うようにする：

−(1.110)

₂

× 2

⁻²

= −(0.111)

₂

× 2

⁻¹

.

仮数部の和を計算：

(1.000)

₂

+ (−0.111)

₂

= (0.001)

₂

.

和を正規化する：

(0.001)

₂

× 2

⁻¹

= (1.000)

₂

× 2

⁻⁴

.

指数の

−4

は、−126と

127

の間にあるので、桁溢れはない．（バイアス

127

を足すと、指数は

−4 + 127 = 3

である）．

また、仮数部が

4bit

に収まっているので丸めは必要ない．この値を

10

進に直すと、

(1.000)

₂

× 2

⁻⁴

= (0.0001000)

₂

= (0.0001)

₂

= 2

⁻⁴

= 1/16 = 0.0625.

10

進で計算した結果と等しい．

さらに、浮動小数点数の乗除算、丸め誤差を低減する工夫（ガード桁、丸め桁）についても考えられるが、この授業ではここまでとする．より詳しくは、任意の数値解析の教科書を参考のこと．この文書は、パターソン・ヘネシー

[P-H]

の

4

章を参考にした．

問

3:

1. double

型の浮動小数点数で表せる、最小の正の値

a

を

10

進表記で求めよ．

2. 1/n! < a

となる自然数

n

を求めよ．

(6)

参考文献

[P-H]

パターソン＆ヘネシー著、コンピュータの構成と設計、第

2

版、日経

BP

社（ISBN 408333-8056-X）．