• 検索結果がありません。

一般化逆行列と

N/A
N/A
Protected

Academic year: 2021

シェア "一般化逆行列と"

Copied!
63
0
0

読み込み中.... (全文を見る)

全文

(1)

第 9 回

一般化逆行列と

特異値分解

(2)

はじめに (1)

連立一次方程式

Ax = b

の解は,

A

が正則で あれば,

A

の逆行列

A −1

を用いることによ り,

x = A 1 b

と書ける.

A

が正則でない

(あ

るいは正方行列でない)場合にこの考え方を 拡張したものが一般化逆行列である.

固有値を正方でない行列に適用できるように 拡張したものが特異値である.

(3)

工学では連立一次方程式は応用上解くべき問 題を数式で表現することで得られるが,数式 表現を作る際に,変数の数と方程式の数が合 わないということがよく起こる. したがって, 正方行列を前提とした数学的手法は不自由で あって,一般化逆行列や特異値といった考え 方が必要になる.

(4)

一般化逆行列 (1)

一般化逆行列の考え方を理解するために,

A

m

n

列の行列とし,連立一次方程式

Ax = b

を解く問題を考える.

行列

A

のランクを

r

とする

(r ≤ min { m, n } ).

• A

を基本変形によって階段行列に変形すると

(空白の部分は零, ∗

の部分は任意)・・・

(5)

.. . 1 ∗ · · ·

.. . · · ·

r) 1 ∗

r + 1) ...

n)

(6)

一般化逆行列 (3)

• A

の行基本変形は,基本行列を

A

に左から掛 けることに相当する.

U L · · · U 1 A

が上記の 階段行列になったものとし,

U = U L · · · U 1

と定義する.

• β = U b

と定義する.

(7)

• { j 1 , . . . , j n r } = { 1, . . . , n } \ { i 1 , . . . , i r }

とす る. たたし,

j 1 < · · · < j r

とする.

• x

の添字を

( i 1 , . . . , i r , j 1 , . . . , j n r )

の順に並 べかえると, 次ページのようになる.

(8)

1 ∗ · · · ∗

. .. ... .. .

1 ∗ · · · ∗

 x 1

.. . x i

r

x j

1

.. . x j

n−r

=

 β 1

.. . β r β r+1

.. . β m

(9)

• x B = (x i

1

, . . . , x i

r

) T , x N = (x j

1

, . . . , x j

n

−r

) T , β 1 = (β 1 , . . . , β r ) T , β 2 = (β r+1 , . . . , β m ) T

と おく. また,

A B =

1 ∗

. ..

1

を前ページ の行列の左上のブロックとし,その右のブロッ クを

A N

とおく.

(10)

一般化逆行列 (7)

以上の定義を使うと, 先ほどの連立一次方程 式は, 次のように書ける.

A B x B + A N x N = β 1 0 = β 2

数学的には, 解が存在するための必要十分条 件は

β 2 = 0

である. 当面はこれを仮定する.

(11)

• A B

は正則だから, 連立一次方程式

A B x B + A N x N = β 1

は解を持ち, その解は

x B =

− A B 1 A N x N + A B 1 β 1

である.

x N

はフリー パラメータである.

解をまとめて書くと・・・

x

B

x

N

!

= − A

−1B

A

N

I

n−r

!

x

N

+ A

B1

I

r

0

r×(m−r)

U 0

(n−r)×m

!

b

(12)

一般化逆行列 (9)

次に,

x N

b

から決めることを考える.

x N

は任意だから,

K

を任意の

n − r

m

列の行 列とし,

x N = Kb

とすればよい. すると

x

B

x

N

!

= − A

−1B

A

N

K + A

−1B

I

r

0

(m−r)

U K

! b

これは,

A

が正則な場合の解の表現

x = A 1 b

と似た形になっている.

(13)

• x B = A B 1 β 1

以外の解を探す理由は・・・

たとえば,

x B

の各成分に消費エネルギーとい う物理的な意味がある場合には,フリーパラ メータをうまく調整して, 消費エネルギー最 小の解を求めることが望ましい.

次ページの例を考える.

(14)

一般化逆行列 (11)

• 10 1 0 1

0 1 0

!

 x 1 x 2 x 3

 = 1 1

!

• x 1 + x 2 + x 3

が小さい解が望ましいものとする

• x 2 = 1

は一意的.

x 1

x 3

は一意的ではなく,

10 3 x 1 + x 3 = 1

を満たせばよい.

(15)

• (x 1 , x 3 ) = (10 3 , 0)

は解だが, (x

1 , x 3 ) = (0, 1)

も解. 後者の方が

x 1 + x 3

が小さい

(この例で

( x 1 , x 3 ) = (0 , 1)

x 1 + x 2 + x 3

を最小に する解になっている)

このように, 何らかの目的でフリーパラメー タを調整する可能性があるため,その調整の 余地を残しておきたい

(16)

一般化逆行列 (13)

• A

が正則なら連立一次方程式

Ax = b

の解 が

x = A 1 b

であることを踏まえ, 上記の例 のように, うまく「逆行列のような行列」A

を取って,どのような

b

に対しても,

Ax = b

が解を持つのであれば,

x = A b

が解を与え るようにしたい

( A

には調整の余地がある)

(17)

このような条件を満たす行列

A

を,

A

の一 般化逆行列

(あるいは一般逆行列)

という.

この定義でまず問題となるのは,一般化逆行 列が存在するか否かであるが, 我々はすでに ある種の一般化逆行列を構成している.

(18)

一般化逆行列 (15)

• x = V (x T B , x T N ) T

とすると

(V

は成分の並べ かえに対応する行列), 先に述べた結果から,

V − A −1 B A N K + A −1 B

I r 0 r × (m − r)

U K

!

が 一般化逆行列になる.

K

はフリーパラメータ から成る行列である.

(19)

• A

m

n

列の行列とする. このとき,

n

m

列の行列

A

A

の一般化逆行列であるた めの必要十分条件は,

AA A = A

となるこ

とである

(証明は次ページ)

したがって, 一般化逆行列をひとつ決めると いうことは,

AA A = A

を満たす

A

をひと つ決める, ということである.

(20)

• rank( A, b ) = rank A

であるということは,ある

n

次のベクトル

z

が存在し,

b = Az

となるということである. この性質を使って 先に述べた等価性を示す.

• A

b

が任意の

b = Az

に対して

Ax = b

の解になっているという ことは,

∀ z, AA

Az = Aζ ,

すなわち

AA

A = A

を意味する.

逆に,

AA

A = A

とすると,

b = Az

に対し,

x = A

b = A

Az

とおくと,

Ax = AA

Az = Az = b

だから,

x = A

b

Ax = b

の解である. よって,

A

A

の一般化逆行列である.

(21)

次に, 一般化逆行列を完全に特徴付ける. ま ず第一に,

A b

Ax = b

の解だから,

A

n

m

列の行列でなければならない.

• U AV = A B A N

0 0

!

に列基本変形を施して

A B

を単位行列に変え,

A N

を消去する. 対応 する基本行列を

V

とすると・・・

(22)

一般化逆行列 (19)

• U AV V = I r 0 r × (n − r)

0 (m − r)× r 0 (m − r)×(n − r)

!

• V V = W

と定義し, 上式に左から

U 1 ,

右 から

W −1

を掛けると・・・

A = U 1 I r 0 r ×(n − r)

0 (m − r) × r 0 (m − r) × (n − r)

!

W 1

(23)

• A = W D 1 D 2 D 3 D 4

!

U

とおき,

D 1

から

D 4

までが満たすべき条件を求める. ただし

D 1

r

次の正方行列である.

D 2

等の行と列の 大きさは, ここから自動的に決まる.

• AA A = A

にこれらを代入すると・・・

(24)

一般化逆行列 (21)

U −1

D 1 0 r

× (n − r)

0 (m

− r) × r 0 (m

− r) × (n − r)

W −1 = U −1

I r 0 r

×(n − r)

0 (m

− r) × r 0 (m

− r) × (n − r)

W −1

したがって,

D 1 = I r

で,

D 2 , D 3 , D 4

は任意.

U

W

は正則行列だが,一意的ではない.

(25)

一般化逆行列が持つ自由度を利用して,何ら かの意味

(後述)

で都合が良い一般化逆行列 を構成する, ということがおこなわれる.

上記に関する議論に先立って, まず

QR

分解 について説明する.

(26)

QR 分解 (1)

• A

m

n

列で階数

r

の実あるいは複素行 列とする.

• A

の列をならべかえることで,

A

の左側の

r

個の列ベクトルが線形独立であるようにでき る. このような列の並べかえに対応する行列 を

P

とし,

AP = (α 1 , . . . , α r , α r+1 , . . . , α n )

とする. (

α 1 , . . . , α r )

は線形独立である.

(27)

• (α 1 , . . . , α r )

から

Gram-Schmidt

の直交化法 によって作った正規直交系を

(v 1 , . . . , v r )

(実あるいは複素内積を使う),

これらを含

む正規直交基底

(v 1 , . . . , v r , v r+1 , . . . , v m )

を 構成する. このとき,

α i (1 ≤ i ≤ r)

( v 1 , . . . , v r )

の線形結合である.

(28)

QR 分解 (3)

• (α r+1 , . . . , α n )

(α 1 , . . . , α r )

に線形従属だ

から, これらは

( v 1 , . . . , v r )

の線形結合とな

る.

以下しばらく,標準基底を固定し,ベクトルを 標準基底に関する数ベクトルと同一視する.

• Q = (v 1 , . . . , v m )

とする.

(29)

• A

が実行列の場合には,

Q

は直交行列で,次 式が成り立つ.

Q

T

(AP ) =

1

· · · ⌣

r r+1

⌣ · · · ⌣

n

1) ∗ · · · ∗ · · · · ∗

... . .. ... ...

r) ∗ · · · · ∗

r + 1) .. . m )

(30)

QR 分解 (5)

• A

が複素行列の場合には,

Q

はユニタリ行列 で, 次式が成り立つ.

Q

(AP ) =

1

· · · ⌣

r r+1

⌣ · · · ⌣

n

1) ∗ · · · ∗ · · · · ∗

... . .. ... ...

r) ∗ · · · · ∗

r + 1) .. . m )

(31)

いずれの場合も, 右辺の行列を

R

とすると,

AP = QR

となる. このような行列の分解 表現を

QR

分解という.

以上で見たように, 任意の実あるいは複素行 列は,適切に列をならべかえることで, QR分 解できる.

(32)

QR 分解 (7)

• QR

分解で

R = R 1 R 2

0 (m − r) × r 0 (m − r) × (n − r)

!

とおくと,

R

の右下がりの対角線より下の要 素はすべて零で

(このような行列を上三角行

列などという),

Q

AP

の左側の

r

列から

Gram-Schmidt

の直交化法により構成されて

いることから,

R 1

は正則である.

(33)

• Ax = b

を満たす解が複数あるとき, その解 の中でノルムが最小のものを与える一般化逆 行列を最小ノルム型一般化逆行列といい,

A

であらわす.

以下の議論では, 重複を避けるため,

A

が複 素行列の場合のみを考える. 実行列では,

T

に置き換えればよい.

(34)

最小ノルム型一般化逆行列 (2)

• A P

QR

分解できるような置換行列

P

を 取り,

AP = QR

とする.

Q AP = R

だか ら,

P AQ = R = R 1 0

R 2 0

!

である.

上記の右辺が階段行列となるように行基本変 形を施す.

(35)

• T

をこれに対応する基本行列の積とし,

S = T P

と定義すると,

SAQ = I r 0

0 0

!

上記が一般化逆行列の「一般形」と異なるの は,

Q

がユニタリ行列に限定されていること である. このようにするのは,ベクトルの直 交性を議論に組み込むため.

(36)

最小ノルム型一般化逆行列 (4)

• z = Qx

とおくと, 解くべき連立一次方程式 は

SAQz = Sb

となる.

Sb

の第

1

要素から 第

r

要素までをならべたベクトルを

β 1 ,

残り を

β 2

とする.

• β 2 = 0

のとき,

I r 0 0 0

!

z = β 1 β 2

!

のノル ム最小の解は・・・

(37)

• z = I r D 2 0 D 4

! β 1 β 2

!

がノルム最小の解で,

β 2 = 0

を仮定するから,

D 2

D 4

は任意.

もとの座標系では

x = Q I r D 2 0 D 4

!

Sb

(38)

最小ノルム型一般化逆行列 (6)

以上により, 最小ノルム型一般化逆行列の一 般形は次の通り:

A = Q I r D 2 0 D 4

!

S .

これも一意的ではな く,

D 2

D 4

は任意である.

(39)

最小ノルム型一般化逆行列では,

Ax = b

の 解の中から, ノルムが最小のものを求めた.

工学的な応用問題では, 誤差などのために,

Ax = b

が厳密解を持たないことがあり得る.

このような状況で,

k Ax − b k

を最小にする 近似解を求める問題を考える.

(40)

最小二乗型一般化逆行列 (2)

最小ノルム型一般化逆行列で

A

に左からユ ニタリ行列

(直交行列)

を掛けたことと比較 すると,

A

に右からユニタリ行列

(直交行列)

を掛け,先と類似した計算をおこなうことで, 近似解が構成できると考えられる. これに対 応する一般化逆行列を最小二乗型一般化逆行 列といい,

A

であらわす.

(41)

• A

を複素行列とする. 実行列では,

T

に置き換えればよい.

• A

m

n

列とし,

AP

QR

分解できるよ うな置換行列

P

を取る.

AP = QR, R =

R 1 R 2 0 0

!

とする.

R 1

は正則な上三角行列 である.

(42)

最小二乗型一般化逆行列 (4)

• Q AP = R

であるが, この両辺に列基本変 形を施して,

R 1

を単位行列に変形する. これ に対応する基本行列の積を

V

とし,

P V = T

とおくと,

Q AT = I r 0

0 0

!

である.

• x = T z

とおき,

Ax = b

の両辺に

Q

を左か ら掛けると,

Q AT z = Q b .

(43)

• z 1 = (z 1 , . . . , z r ) T , z 2 = (z r+1 , . . . , z n ) T

と すると, 解を最小二乗近似するには,

z 1 = (I r , 0)Q b

とすればよく,

z 2

は任意である.

よって,解の一般形は,

z = I r 0 D 3 D 4

!

Q b.

(44)

最小二乗型一般化逆行列 (6)

もとの座標系では,

x = T I r 0 D 3 D 4

! Q b,

よって

A = T I r 0

D 3 D 4

!

Q

であり,

D 3

D 4

は任意である.

(45)

• Moore-Penrose

の一般化逆行列

(A +

と書く) は, 最小ノルム型と最小二乗型の一般化逆行 列の特徴を併せ持つ一般化逆行列である. そ の導出には, 一般化逆行列のフリーパラメー タをすべて使う.

• A

を複素行列とする. 実行列では,

T

に置き換えればよい.

(46)

Moore-Penrose の一般化逆行列 (2)

• A P

QR

分解できるような置換行列

P

を 取り, 対応する

QR

分解を

A P = Q 1 R

と する.

R = R 1 R 2

0 0

!

で,

R 1

は上三角な正 方行列,

Q 1

はユニタリ行列である.

P

は置 換行列だからユニタリ行列であることに注意 する.

(47)

• P AQ 1 = R

であるが, 更に

R

QR

分 解する.

R

の最初の

r

個の列ベクトルは線形 独立なので,

R

は置換なしで

QR

分解でき,

R = Q 2 R r 0

0 0

!

という形になる

(後半の

零のみから成る列は

QR

分解で形を変えない ことに注意).

(48)

Moore-Penrose の一般化逆行列 (4)

• Q 3 = P Q 2

とおくと,

Q 3 AQ = R r 0 0 0

!

で ある.

x = Q 1 z

とおくと,

Q 3 AQ 1 z = Q 3 b

であり,したがって,

Ax = b

のノルムが最小 の最小二乗解は

z = R r 1 0

0 0

!

Q 3 b

である.

(49)

もとの座標系では,

x = Q 1 R −1 r 0 0 0

! Q 3 b ,

よって

A + = Q 1 R −1 r 0 0 0

!

Q 3

A

Moore-

Penrose

の一般化逆行列である. これはフ

リーパラメータを持たない.

(50)

計算例

A =

2 1 0 0 0 0 3 0 0 0 0 0 0 0 0

とおき,

A

+を求める.

Q

3

AQ

1

= R

r

0 0 0

!

となる

Q

3

Q

1を求める必要があるが,

A

ははじめから求める形に なっているので,

Q

3

= I , Q

1

= I

としてよい. よって,

A

+

=

1 2

16

0 0

13

0

0 0 0

0 0 0

0 0 0

. A

+の左上のブロックが

2 1 0 3

!

の逆行列になって

いることに注意.

(51)

固有値は, 行列に対応する線型写像の作用の

「倍率」を測る尺度のひとつであるが,正方行 列に対してしか定義できない.

正方でない行列に対して固有値と似た性質を 持つ量が定義できると便利.

この役割を果たすのが特異値である.

(52)

特異値分解 (2)

特異値は, 正方とは限らない実行列あるいは 複素行列に対して定義される

(関数行列に拡

張されることもある)

以下では, 議論の重複を避けるために,

A

m

n

列の複素行列とする. 実行列について は,

T

で読み換えればよい.

(53)

• A A

の正の固有値の平方根を

A

の特異値と

いう

(零固有値を無視することに注意).

• A A

Hermite

行列であるから,ユニタリ行 列によって対角化され, また

A A

の固有値 はすべて非負なので, その特異値は曖昧さな く定まる.

(54)

特異値分解 (4)

• A A

r

個の正の固有値を持つものとし,こ れらを大きい順に並べたものを

λ 1 , . . . , λ r

と する. 特異値は

1 , . . . , σ r ) = ( √

λ 1 , . . . , √ λ r )

である.

• (λ 1 , . . . , λ r )

に対応する固有ベクトルを

{ v 1 , . . . , v r }

とする. また,

{ v r+1 , . . . , v n }

を, 零固有値に対応する固有ベクトルとする.

(55)

• A A

Hermite

行列なので,

{ v 1 , . . . , v r }

を 正規直交系にすることができる.

標準基底を取り,

v i

を, それを標準基底によ り成分表示した列ベクトルと同一視する.

• 1 ≤ i ≤ r

に対し,

u i = 1

σ i Av i

と定義する.

(56)

特異値分解 (6)

• u i u j = σ 1

i

σ

j

v i A Av j = δ ij

である

(δ ij

Kronecker

のデルタ). よって,

{ u 1 , . . . , u r }

は正規直交系である. これを含む正規直交基 底

{ u 1 , . . . , u r , u r+1 , . . . , u m }

を作る.

• 1 ≤ i, j ≤ r

に対し,

u i Av j = σ 1

i

v i A Av j =

λ

j

σ

i

v i v j = σ i δ ij

であることに注意

(57)

• ker A = { x : Ax = 0 }

とおく. ker

A =

ker A A

であることを示す.

Ax = 0

なら

A Ax = 0

だから, ker

A ⊂ ker A A.

逆 に,

x ∈ ker A A

であれば,

A Ax = 0

より,

x A Ax = 0.

よって,

Ax = 0.

したがって,

x ∈ ker A.

ゆえに

ker A A ⊂ ker A.

(58)

特異値分解 (8)

• v r+1 , . . . , v n

A A

の零固有値に対応する固

有ベクトルだから,

A Av j = 0 (j ≥ r + 1).

したがって, 先に述べた結果より,

Av j = 0 ( j ≥ r + 1)

である.

• r + 1 ≤ i ≤ m, 1 ≤ j ≤ r

に対し,

u i Av j =

u i σ j u j = 0

である

(正規直交基底だから).

(59)

• V = (v 1 , . . . , v r , v r+1 , . . . , v n ),

U = ( u 1 , . . . , u r , u r+1 , . . . , u m )

とおき, 以上 の結果をまとめると,

U AV = diag( σ 1 , . . . , σ r ) 0

0 0

!

となる.

(60)

特異値分解 (10)

• A = U diag(σ 1 , . . . , σ r ) 0

0 0

!

V

を,

A

の特 異値分解という.

特異値分解は, 最小二乗問題の解法, 伝達関 数のノルムの定義などに使われる. Moore-

Penrose

の一般化逆行列もここから得られる.

(61)

1. A = 

 1 1 1 1 0 0

とする.

A

T

A = 2 2

2 2 , det λ − 2 −2

−2 λ − 2 =

λ

2

−4 λ

より,

A

T

A

の固有値は

0

4

である

(実行列なので

Tに変わっていることに注意).

2.

標準基底を固定し,ベクトルを数ベクトルと同一視する.

3. A

T

A

の固有値

4

0

に対応する

(正規化された)

固有ベクトルは それぞれ

v

1

=

12

1

1

!

, v

2

=

12

1

−1

!

である.

A

の特異値は 唯一で,その値は

σ

1

= √

4 = 2

である.

(62)

計算例

(2)

4. u

1

=

σ1

1

Av

1

=

12

 1 1 0

である.

u

2

=

12

 1

−1 0

 , u

3

=

 0 0 1

おくと,

{ u

1

, u

2

, u

3

}

u

1を含む正規直交基底である.

5. U = (u

1

, u

2

, u

3

), V = (v

1

, v

2

)

とおく.

6. U

T

AV =

 2 0 0 0 0 0

となる. よって,

A = U

 2 0 0 0 0 0

 V

T

A

特異値分解である.

(63)

伊理

,

,

線形代数

,

教育出版

, 1977

伊理

,

線形代数汎論

,

朝倉書店

, 2009

• D. S. Bernstein, Matrix Mathematics, 2/e, Princeton University Press, 2009

室田

,

杉原

,

線形代数

I,

丸善

, 2015

室田

,

杉原

,

線形代数

II,

丸善

, 2015

太田

,

システム制御のための数学

(1)

線形代数編

,

コロ ナ社

, 2000

参照

関連したドキュメント

日頃から製造室内で行っていることを一般衛生管理計画 ①~⑩と重点 管理計画

これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,

ヒュームがこのような表現をとるのは当然の ことながら、「人間は理性によって感情を支配

自閉症の人達は、「~かもしれ ない 」という予測を立てて行動 することが難しく、これから起 こる事も予測出来ず 不安で混乱

本プログラム受講生が新しい価値観を持つことができ、自身の今後進むべき道の一助になることを心から願って

対象期間を越えて行われる同一事業についても申請することができます。た

の繰返しになるのでここでは省略する︒ 列記されている

と判示している︒更に︑最後に︑﹁本件が同法の範囲内にないとすれば︑