a ijを2 × 2行列、xiを2 × 1行列、biを2 × 1行列の成分とみれば ( a 11 a 12

(1)

行列式

行列式の関係を求めていきます。

大文字のローマ文字は行列、小文字とギリシャ文字はスカラー、太字はベクトルとしています。

行列式が出てくる理由を見るために、2つの式による連立方程式

a 11 x 1 + a 12 x 2 = b 1

a 21 x 1 + a 22 x 2 = b 2

を持ち出します。これは

a ij

を

2 × 2

行列、x

i

を

2 × 1

行列、b

i

を

2 × 1

行列の成分とみれば

( a 11 a 12

a 21 a 22

) ( x 1

x 2

)

=

( a 11 x 1 + a 12 x 2

a 21 x 1 + a 22 x 2

)

= ( b 1

b 2

)

⇔ ∑ 2

j=1 a ij x j = b i

と書けます。これだとただの表記ですが、x

1 , x ₂

が解を持つかを行列の成分から判別できます。x

1 , x ₂

を普通に求めると

x 1 = − a 12 b 2 − a 22 b 1

a ₁₁ a ₂₂ − a ₁₂ a ₂₁ , x 2 = a 11 b 2 − a 21 b 1

a ₁₁ a ₂₂ − a ₁₂ a ₂₁

このとき、分母が

0

でなければ解を持ちます。で、分母の形は行列の対角成分同士と非対角成分同士の積による形になっています。これを行列式

(determinant)

と呼びます。行列式は

det A

や

| A |

と表記され、2

× 2

行列の場合では

det A = a ₁₁ a ₂₂ − a ₁₂ a ₂₁

となります。行列の形で書けば

det A =

a ₁₁ a ₁₂ a 21 a 22

と表記されます。

3

つの連立でも同様にできます。面倒なので結果だけ示せば、3

× 3

行列の行列式は

det A = a ₁₁ a ₂₂ a ₃₃ + a ₁₂ a ₂₃ a ₃₁ + a ₁₃ a ₂₁ a ₃₂ − a ₁₁ a ₂₃ a ₃₂ − a ₁₂ a ₂₁ a ₃₃ − a ₁₃ a ₂₂ a ₃₁

となります。

この手続きは

n × n

行列に一般化されます。3

× 3

行列での行列式には

6

個の項があり、その符号がプラスなのは

a 11 a 22 a 33 , a 12 a 23 a 31 , a 13 a 21 a 32

マイナスなのは

a ₁₁ a ₂₃ a ₃₂ , a ₁₂ a ₂₁ a ₃₃ , a ₁₃ a ₂₂ a ₃₁

(2)

各項での添え字の左側は

a _1i a _2j a _3k

のように

1, 2, 3

の並びになるようにしています。このように並べた時の

i, j, k

の並びに法則性があります。

(i, j, k)

の並びは、プラスではそれぞれ

(1, 2, 3)、 (2, 3, 1)、 (3, 1, 2) (a ₁₁ a ₂₂ a ₃₃

、

a ₁₂ a ₂₃ a ₃₁

、

a ₁₃ a ₂₁ a ₃₂ )、マイナスではそれぞれ (1, 3, 2)、(2, 1, 3)、(3, 2, 1)

となっています。つまり、プラスでは

(1, 2, 3)

の並びに対して偶数回の入れ替え

(偶置換)

が行われ、マイナスでは奇数回の入れ替え

(奇置換)

が行われています。ここで言っている入れ替えは

(1, 2, 3) ⇒ (2, 1, 3) ⇒ (2, 3, 1) (1, 2, 3) ⇒ (1, 3, 2) ⇒ (3, 1, 2)

といったもので、これらは偶置換です。

というわけで、3

× 3

行列の行列式は、a

1i a 2j a 3k

としたとき、i

= 1, j = 2, k = 3

の偶置換ではプラス、奇置換ではマイナスとして全て足したものになっています。具体的に行えば、a

11 a ₂₂ a ₃₃

から始めて、2,

3

を交換した

a ₁₁ a ₂₃ a ₃₂

ではマイナス、これから

1, 3

を交換した

a ₁₃ a ₂₁ a ₃₂

ではプラス、さらに

1, 2

を交換した

a ₁₃ a ₂₂ a ₃₁

ではマイナス、さらに

2, 3

を交換した

a ₁₂ a ₂₃ a ₃₁

ではプラス、そして

1, 3

を交換した

a ₁₂ a ₂₁ a ₃₃

ではマイナスとなり、

これらを足した

a 11 a 22 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 − a 11 a 23 a 32 − a 12 a 21 a 33 − a 13 a 22 a 31

が行列式となります。1,

2, 3

の並びの組み合わせは

3! = 6

個なので

6

個の項になります。

この結果をそのまま一般化することで

n × n

行列の行列式は

det A = ∑

perm

( − 1) ^σ a 1k

₁

a 2k

₂

· · · a nk

_n

となります。k

i

は

1

から

n

の整数で、σは

(k ₁ , k ₂ , . . . , k _n )

の並びが

(1, 2, . . . , n)

に対して偶置換なら

0、奇置換な

ら

+1

にし、和の記号はその並びによる全ての項の和を取ることを意味します。n個の数字の並びの組み合わせから、n!個の項の和になります。

もしくはレヴィ・チビタ記号

ϵ _k

₁

_k

₂

_...k

_nによって

det A =

∑ n k

₁

,k

₂

,...,k

_n

=1

ϵ _k

₁

_k

₂

_...k

_n

a _1k

₁

a _2k

₂

· · · a _nk

_n

(1)

とも書かれます。和の記号は

∑ n k

1

=1

∑ n k

1

=2

· · ·

∑ n k

n

=1

を略して書いているだけです。レヴィ・チビタ記号は例えば、ϵ

123

では

ϵ ₁₂₃ = ϵ ₂₃₁ = ϵ ₃₁₂ = +1 ϵ 132 = ϵ 213 = ϵ 321 = − 1

ϵ ₁₁₁ = ϵ ₁₁₂ = ϵ ₁₁₃ = ϵ ₂₁₁ = · · · = 0

となる記号です。つまり、ϵ

12...n = +1

の添え字に対して偶置換なら

+1、奇置換なら − 1、同じ数字の添え字が複

数あるときは

0

になる記号です。なので、(1)は普通に和を取っていけばいいだけです。例えば、3

× 3

行列では

(3)

det A =

∑ 3 k

₁

,k

₂

,k

₃

=1

ϵ _k

₁

_k

₂

_k

₃

a _1k

₁

a _2k

₂

a _3k

₃

= ϵ ₁₂₃ a ₁₁ a ₂₂ a ₃₃ + ϵ ₂₃₁ a ₁₂ a ₂₃ a ₃₁ + ϵ ₃₁₂ a ₁₃ a ₂₁ a ₃₂ + ϵ 132 a 11 a 23 a 32 + ϵ 213 a 12 a 21 a 33 + ϵ 321 a 13 a 22 a 31

= a 11 a 22 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 − a 11 a 23 a 32 − a 12 a 21 a 33 − a 13 a 22 a 31

となります。

列で和を取るようにしましたが、行で和を取っても同じことなので、行列式は

det A = ∑

perm

( − 1) ^σ a _k

₁

₁ a _k

₂

₂ · · · a _k

_n

det A =

∑ n k

1

,k

2

,...,k

n

=1

ϵ k

₁

k

₂

...k

_n

a k

₁

1 a k

₂

2 · · · a k

_n

n

と定義できます。雑に言えば、(

− 1) ^σ a 1k

₁

a 2k

₂

· · · a nk

_nと

( − 1) ^σ a k

₁

1 a k

₂

2 · · · a k

_n

n

の入れ替えによる組み合わせは同じというだけです。

n × n

行列の行列式を

(n − 1) × (n − 1)

行列から求める方法を導出します。n

× n

行列

A

があり、それの

i

行と

j

列を抜いた行列の行列式を

M ^(ij)

とします。M

^(ij)

は小行列式

(minor)、i

行と

j

列を抜いた

(n − 1) × (n − 1)

行列は小行列

(submatrix)

と言います。小行列を

A

とすれば小行列式は

M ^(ij) = det A

です。例えば、3

× 3

行列での

M ⁽²³⁾

は

A =



 a 11 a 12 a 13

a 21 a 22 a 23

a 31 a 32 a 33



 ⇒ M ⁽²³⁾ =

a 11 a 12

a 31 a 32

となります。元の行列の

2

行目と

3

列目

(a 21 , a 22 , a 23 , a 13 , a 23 , a 33 )

に注目して、そこの成分を行列

A

から抜き取っています。

n × n

行列

A

の小行列式

M ^(ij)

を使って

∆ _ij = ( − 1) ^i+j M ^(ij)

としたものを行列

A

の余因子

(cofactor)

と言います。余因子

∆ ij

を成分に持つ行列を余因子行列と言います。

ただし、余因子行列の定義のされ方が

2

通りあり、∆

ij

をそのまま

i

行

j

列とする場合と、転置して

j

行

i

列にする場合があります。英語だとこの

2

つは区別されていて、∆

ij

をそのまま

i

行

j

列としたものを

cofactor matrix (matrix of cofactor)、∆ ij

を

j

行

i

列としたものを

adjugate matrix (adjoint matrix)

としています。行列

A

の

adjugate matrix

は

AdjA、その成分は (AdjA) ij

のように表記されます

((AdjA) ij = ∆ ji )。

日本語では

adjugate matrix

を余因子行列と言うことが多いです。おそらく、cofactor matrixはほとんど出てこないので

adjugate matrix

を余因子行列と呼ぶことにしているのだと思います。ここでも

adjugate matrix

を余因子行列と言っていきます。

例として

3 × 3

行列

A =



 a 11 a 12 a 13

a 21 a 22 a 23

a 31 a 32 a 33





を使ってみます。このときの小行列式

M ⁽¹¹⁾

は

(4)

M ⁽¹¹⁾ =

a 22 a 23

a 32 a 33

= a 22 a 33 − a 23 a 32

なので、余因子

∆ 11

は

∆ ₁₁ = ( − 1) ¹⁺¹ M ⁽¹¹⁾ = M ⁽¹¹⁾ M ⁽¹²⁾

でも同様に

∆ 12 = ( − 1) ¹⁺² M ⁽¹²⁾ = − M ⁽¹²⁾ = −

a 21 a 23

a 31 a 33

同様のことを残った成分でも行い、成分を

˜ a _ij = ∆ _ji

とすることで余因子行列

A(= AdjA) ˜

は

A ˜ =



 ∆ 11 ∆ 21 ∆ 31

∆ 12 ∆ 22 ∆ 32

∆ 13 ∆ 23 ∆ 33



 =



 



a 22 a 23

a 32 a 33

−

a 12 a 13

a 32 a 33

a 12 a 13

a 22 a 23

−

a 21 a 23

a 31 a 33

a 11 a 13

a 31 a 33

−

a 11 a 13

a 21 a 23

a 21 a 22

a 31 a 32

−

a 11 a 12

a 31 a 32

a 11 a 12

a 21 a 22



 



( − 1) ^i+j

から当たり前ですが、成分の符号は交互に変わります。

余因子を使って行列式を求められます。n

× n

行列でも分かりにくくなるだけで同じことをするので、3

× 3

行列を使います。3

× 3

行列

A

の行列式が、何かしらの係数

C ik

によって

det A =

∑ 3 k=1

a _ik C _ik (2)

という形で書けるとします。iは

1

から

3

のどれでもいいです。i

= 1

を使うことにして

det A =

∑ 3 k=1

a 1k C 1k = a 11 C 11 + a 12 C 12 + a 13 C 13

3 × 3

行列の行列式において

a ₁₁

は

det A =

∑ 3 k

₁

,k

₂

,k

₃

=1

ϵ k

₁

k

₂

k

₃

a 1k

₁

a 2k

₂

a 3k

₃

=

∑ 3 k

₂

,k

₃

=1

ϵ _1k

₂

_k

₃

a ₁₁ a _2k

₂

a _3k

₃

+

∑ 3 k

₁

̸ =1,k

₂

,k

₃

=1

ϵ _k

₁

_k

₂

_k

₃

a _1k

₁

a _2k

₂

a _3k

₃

として出てきます。二行目の第一項は

k ₁

は

k ₁ = 1

に固定しているので

k ₂ , k ₃

の和となり、第二項は

k ₁ = 1

でない残りの項による和になります。これと

(2)

の

a 11

の項を取り出せば

a 11 C 11 =

∑ 3 k

2

,k

3

=1

ϵ 1k

₂

k

₃

a 11 a 2k

₂

a 3k

₃

= a 11 (a 22 a 33 − a 23 a 32 )

C 11 = a 22 a 33 − a 23 a 32

(5)

となることが分かり、係数

C ₁₁

は余因子

∆ ₁₁

になっています。

これは他の成分でも同じ結果になり、n

× n

行列でも同様に成立するので、行列

A

の行列式は

A

の余因子によって

det A =

∑ n k=1

a _ik ∆ _ik

と書けます。これを余因子展開

(cofactor expansion)

と言います。今は

i = 1

として行いましたが、他の場合でも同様に示せます。また、行でなく列で展開しても同じことが言えて

det A =

∑ n k=1

a ki ∆ ki

となります。

行列式と余因子行列から逆行列を求めることもできます。行列

A

の余因子行列を

A ˜

とします。行列

A

とその逆行列

B

は定義から、単位行列

I

によって

AB = I

左辺は成分で書けば

(AB) ij =

∑ n k=1

a ik b kj

なので、AB

= I

は成分で書くと

∑ n k=1

a _ik b _kj = δ _ij

となります。この

b kj

が分かれば行列

A

の逆行列が求められたことになります。

ここで行列

A

の余因子

∆ jk

による余因子展開

∑ n k=1

a ik ∆ jk = δ ij det A

を持ち出します。余因子展開は

i = j

のときなので、右辺にクロネッカーデルタを入れて

i = j

のときに

det A

になるようにしています。変形すれば

1 det A

∑ n k=1

a _ik ∆ _jk = δ _ij

これと

AB = I

の形を比較すると

b _kj = ∆ _jk det A

( (B) _kj = ∆ _jk det A

)

のとき

(6)

∑ n k=1

a ik b kj = δ ij

となるのが分かります。よって、余因子

∆ _ij

の転置を成分とする行列は余因子行列

A ˜ (( ˜ A) _ij = ∆ _ji )

なので、行列

A

の逆行列

B = A ⁻ ¹

は

A ⁻ ¹ = A ˜ det A

となります。当然、det

A ̸ = 0

である必要があり、det

A ̸ = 0

は逆行列があるための条件になっています。

連立方程式の解と行列式の関係についてまとめておきます。連立方程式は、n

× n

行列

A、n

次元ベクトル

x, b

によって

Ax = b (3)

と書けます。なので、逆行列

A ⁻ ¹

から

A ⁻ ¹ Ax = A ⁻ ¹ b Ix = A ⁻ ¹ b x = A ⁻ ¹ b

このため、連立方程式が解を持つためには逆行列

A ⁻ ¹

が存在している必要があります。そして、逆行列が存在するためには

det A ̸ = 0

である必要があり、det

A ̸ = 0

なら

A

の余因子行列

A ˜

から

x = A ˜

det A b (x i = 1 det A

∑ n k=1

˜

a ik b k , a ˜ ik = ∆ ki )

として求まります。一方で、b

= 0 (b

の成分が全て

0)

の場合

x = A ⁻ ¹ b = 0

このため、b

= 0

では

det A ̸ = 0

のとき

x = 0

が解になり（自明な解,trivial solution）、det

A = 0

のときに

x ̸ = 0

の解を持つことになります。あまり意味のない単純な例として

( α α α α

) ( x ₁ x ₂

)

= 0

という場合では、行列式は

0

になり、x

1 + x 2 = 0

を満たすものが解になります。

n × n

行列

A

の固有値

λ

とその固有ベクトル

v

は

Av = λv λv

を左辺に持っていき単位行列をつけて

(A − λI)v = 0

この式の形は連立方程式

(3)

での

b = 0

の場合なので、v

= 0

以外の解があるための条件

(7)

det[A − λI] = 0

が出てきます。これを固有方程式

(characteristic equation)、det[A − λI ]

を固有多項式

(characteristic polynomial)

と言います。固有方程式を解けば

λ

を求められます。

多項式とついているのは、行列式の定義から、n

× n

行列のとき

det[A − λI] = ( − 1) ⁿ λ ⁿ + c n − 1 λ ⁿ ⁻ ¹ + · · · + c 0

という形になるからです。c

i

はスカラーです。もしくは、(λI

− A)v = 0

とすれば

det[λI − A]

になるので、−

1

を省けて

det[λI − A] = λ ⁿ + c ^′ _n ₋ ₁ λ ⁿ ⁻ ¹ + · · · + c ^′ ₀

とすることもできます。

行列式の性質は

(i) n × n

行列のスカラー倍

αA

では

det[αA] = α ⁿ det A.

(ii) det A = det A ^t . (iii) det A ^∗ = (det A) ^∗ . (iv) det A ^† = det A ^∗ . (v) det[AB] = det A det B.

(i)

は行列式の各項は

n

個の積で、それら全てが

α

倍されるために

α ⁿ

倍になります。(ii)は行列式の定義そのままです。実際に、3

× 3

行列では、転置

A ^t

では成分を

b _ij

として

det A ^t =

∑ 3 k

1

,k

2

,k

3

=1

ϵ k

₁

k

₂

k

₃

b 1k

₁

b 2k

₂

b 3k

₃

= b 11 b 22 b 33 + b 12 b 23 b 31 + b 13 b 21 b 32 − b 11 b 23 b 32 − b 12 b 21 b 33 − b 13 b 22 b 31

a _ij = b _ji

なので、

det A

と一致します。

(iii)

は、レヴィ・チビタ記号は実数であることと、複素数の

a ^∗ b ^∗ = (ab) ^∗ , a ^∗ + b ^∗ = (a + b) ^∗

からです。(iv)は

(ii),(iii)

から

det A ^† = (det A ^t ) ^∗ = (det A) ^∗ = det A ^∗

(v)

を示すために別の行列式の性質を出します。1列目に和を含むみ

T =



 

 

a 11 + b 11 a 12 · · · a 1n

a 21 + b 21 a 22 · · · a 2n

.. . .. . .. . .. . a _n1 + b _n1 a _n2 · · · a _nn



 

 

となっている行列の行列式は

(8)

det T = ∑

k

₁

,...,k

_n

ϵ _k

₁

_k

₂

_...k

_n

(a _k

₁

₁ + b _k

₁

₁ )a _k

₂

₂ · · · a _k

_n

= ∑

k

₁

,...,k

_n

ϵ _k

₁

_k

₂

_...k

_n

a _k

₁

₁ a _k

₂

₂ · · · a _k

_n

_n + ∑

k

₁

,...,k

_n

ϵ _k

₁

_k

₂

_...k

_n

b _k

₁

₁ a _k

₂

₂ · · · a _k

_n

=

a ₁₁ a ₁₂ · · · a _1n a ₂₁ a ₂₂ · · · a _2n .. . .. . .. . .. . a n1 a n2 · · · a nn

+

b ₁₁ a ₁₂ · · · a _1n b ₂₁ a ₂₂ · · · a _2n .. . .. . .. . .. . b n1 a n2 · · · a nn

と分解できます。i列目に足されていても同様です。これを利用します。また、k

1 , . . . , k _n

の和の範囲は省いていきます。

まず、2

× 2

行列とします。このときの

det[AB]

は

det[AB] =

a 11 b 11 + a 12 b 21 a 11 b 12 + a 12 b 22

a 21 b 11 + a 22 b 21 a 21 b 12 + a 22 b 22

=

a 11 b 11 a 11 b 12 + a 12 b 22

a 21 b 11 a 21 b 12 + a 22 b 22

+

a 12 b 21 a 11 b 12 + a 12 b 22

a 22 b 21 a 21 b 12 + a 22 b 22

= b 11

a 11 a 11 b 12 + a 12 b 22

a 21 a 21 b 12 + a 22 b 22

+ b 21

a 12 a 11 b 12 + a 12 b 22

a 22 a 21 b 12 + a 22 b 22

= ∑

k

1

b k

₁

1

a _1k

₁

a ₁₁ b ₁₂ + a ₁₂ b ₂₂ a _2k

₁

a ₂₁ b ₁₂ + a ₂₂ b ₂₂

= ∑

k

₁

b k

₁

1

( a 1k

₁

a 11 b 12

a 2k

₁

a 21 b 12

+

a 1k

₁

a 12 b 22

a 2k

₁

a 22 b 22

)

= ∑

k

1

b k

₁

1

( b 12

a 1k

1

a 11

a _2k

₁

a ₂₁ + b 22

a 1k

1

a 12

a _2k

₁

a ₂₂ )

= ∑

k

₁

∑

k

₂

b _k

₁

₁ b _k

₂

a 1k

₁

a 1k

₂

a 2k

₁

a 2k

₂

行列式は

Σϵ _st a _1s a _2t

なので、k

1 = k ₂

なら

0、k 1 = 1, k ₂ = 2

の並びなら

+ det A

です。そして、k

1 = 2, k ₂ = 1

と並びを

1

回変えると

− det A

です。よって

det A ∑

k

₁

,k

₂

ϵ k

₁

k

₂

b k

₁

1 b k

₂

2 = det A det B

となり、det[AB] = det

A det B

です。

この手順を

n × n

行列で行えば

(9)

a ₁₁ b ₁₁ + a ₁₂ b ₂₁ · · · + a _1n b _n1 · · · a ₁₁ b _1n + a ₁₂ b _2n · · · + a _1n b _nn

.. . .. . .. .

a _n1 b ₁₁ + a _n2 b ₂₁ · · · + a _nn b _n1 · · · a _n1 b _nn + a _n2 b _2n · · · + a _nn b _nn

= ∑

k

₁

b k

₁

1

a 1k

₁

a 11 b 12 + a 12 b 22 · · · + a 1n b n2 · · · a 11 b 1n + a 12 b 2n · · · + a 1n b nn

.. . .. . .. . .. .

a nk

₁

a n1 b 12 + a n2 b 22 · · · + a nn b n2 · · · a n1 b n2 + a n2 b 22 · · · + a nn b nn

= ∑

k

1

b k

₁

1 b k

₂

2

a 1k

₁

a 1k

₂

a 11 b 13 + a 12 b 23 · · · + a 1n b n3 · · · a 11 b 1n + a 12 b 2n · · · + a 1n b nn

.. . .. . .. . .. . .. .

a _nk

₁

a _nk

₂

a _n1 b ₁₃ + a _n2 b ₂₃ · · · + a _nn b _n3 · · · a _n1 b _n2 + a _n2 b ₂₂ · · · + a _nn b _nn

= ∑

k

₁

,...,k

_n

b _k

₁

₁ b _k

₂

₂ · · · b _k

_n

a _1k

₁

a _1k

₂

· · · a _1k

_n

.. . .. . .. . .. . a nk

₁

a nk

₂

· · · a nk

_n

このときも行列式の定義から、複数の

k _i

が同じだと

0

になり、k

i

が

i = 1, 2, . . . , n

と並んでいれば

+ det A、1

回の並びの入れ替えで

− det A

です。よって、n

× n

行列の積

AB

の行列式は

det[AB] = det A ∑

k

₁

,...,k

_n

ϵ _k

₁

_k

₂

_··· _k

_n

b _k

₁

₁ b _k

₂

₂ · · · b _k

_n

_n = det A det B

となります。

固有値の積は行列式、固有値の和はトレースと等しいことを示します。

まず、固有値の積は行列式になることを示します。固有多項式を

ρ(λ) = det(λI − A)

とします。n

× n

行列

A

の固有値は

ρ(λ) = 0

の解であり、ρ(λ)は

n

次の多項式です。このため、解は一般的に

n

個あって、それを

λ = s ₁ , s ₂ , . . . , s _n

とします。そうすると

ρ(λ) = 0

は

ρ(λ) = (λ − s ₁ )(λ − s ₂ ) · · · (λ − s _n ) = 0

と書けます

((λ − s i ) ^m

の場合もありますが今は関係ないので無視します)。λ

= 0

では

ρ(0) = ( − 1) ⁿ s 1 s 2 · · · s n

となり、det[λI

− A]

で

λ = 0

とすれば

ρ(0) = det[ − A]

なので

( − 1) ⁿ s 1 s 2 · · · s n = ( − 1) ⁿ det A s 1 s 2 · · · s n = det A

よって、Aの行列式は固有値の積と一致するのが分かります。

固有値の和とトレースが一致することを示すために、det[λI

− A]

をさらに見ていきます。n

× n

行列で行いますが、4

× 4

行列あたりを使うと分かりやすいです。D

= λI − A

は

D = λI − A =



 

 

λ − a 11 − a 12 · · · − a 1n

− a 21 λ − a nn · · · − a 2n

.. . .. . · · · .. .

− a _n1 − a _n2 · · · λ − a _nn



 

 

(10)

D = λI − A

の成分を

d _ij

と書くことにします。これの行列式での

λ ⁿ ⁻ ¹

の項がどうなるのかを求めます。そのために、d

nn = λ − a _nn

を含む項を取り出します。行列

D

とその行列式

det D =

∑ n k

₁

,k

₂

,...,k

_n

=1

ϵ _k

₁

_k

₂

_...k

_n−1

_n d _1k

₁

d _2k

₂

· · · d _nk

_n

を見ると、d

nn

のときに

λ ⁿ ⁻ ¹

が出てくるのが分かります。これは

n

行と

n

列では

d _nn

のみが

λ

を含んでいるためです。例えば、k

n = 1

とした

∑ n k

₁

,k

₂

,...,k

_n−1

=1

ϵ _k

₁

_k

₂

_...k

_n−1

₁ d _1k

₁

d _2k

₂

· · · d _(n ₋ _1)k

_n−1

d _n1

では、k

1 = 1

のとき

0

なので

d ₁₁

が使えないために

λ

が

1

つ減り、d

n1

にも

λ

はいないので

λ ⁿ ⁻ ²

までしか作れないからです

(d nn

以外を使うと

2

つ

λ

が使えなくなる)。

d nn

の項は

∑ n k

₁

,k

₂

,...,k

_n−1

=1

ϵ k

₁

k

₂

...k

_n−1

n d 1k

₁

d 2k

₂

· · · d _(n ₋ _1)k

_n₋₁

d nn

となっていて、k

1 , k ₂ , . . . , k _n ₋ ₁

が

n

の項は

0

になります。そうすると

d nn

n − 1

∑

k

1

,k

2

,...,k

_n−1

=1

ϵ k

₁

k

₂

...k

_n−1

d 1k

₁

d 2k

₂

· · · d (n − 1)k

_n−1

と書けます。和の部分は、n

× n

行列

D

から

n

行と

n

列を抜いた

(n − 1) × (n − 1)

行列

D _(n ₋ ₁₎

の行列式になっていることが分かります。D

(n − 1)

は

A

から

n

行と

n

列をを抜いた

A _(n ₋ ₁₎

と

(n − 1) × (n − 1)

単位行列

I _(n ₋ ₁₎

によって

D (n − 1) = λI (n − 1) − A (n − 1)

なので、これの行列式を使うことで

det[λI − A] = d _nn det[D _(n ₋ ₁₎ ] + · · · = (λ − a _nn ) det[λI _(n ₋ ₁₎ − A _(n ₋ ₁₎ ] + · · ·

「· · ·」部分は

λ ⁿ ⁻ ²

までしか出てこない項です。

今の話を繰り返すことで

det[λI (n − 1) − A (n − 1) ] = (λ − a (n − 1)(n − 1) ) det[λI (n − 2) − A (n − 2) ]

= (λ − a _(n ₋ _1)(n ₋ ₁₎ )(λ − a _(n ₋ _2)(n ₋ ₂₎ ) · · · (λ − a 11 )

となります。よって、λ

ⁿ ⁻ ¹

までを書くと

det[λI − A] = (λ − a nn )(λ − a (n − 1)(n − 1) )(λ − a (n − 2)(n − 2) ) · · · (λ − a 11 ) + · · ·

= λ ⁿ − (a 11 + a 22 + · · · + a nn )λ ⁿ ⁻ ¹ + · · ·

(11)

そして、Aの固有値

s ₁ , . . . , s _n

から

det[λI − A] = (λ − s ₁ )(λ − s ₂ ) · · · (λ − s _n ) = λ ⁿ − (s ₁ + s ₂ + · · · + s _n )λ ⁿ ⁻ ¹ + · · ·

なので、λ

ⁿ ⁻ ¹

の係数の比較から

s 1 + s 2 + · · · + s n = a 11 + a 22 + · · · + a nn = trA

となり、行列

A

の固有値の和は行列

A

のトレースに等しいことが分かります。例えば、A

² = AA

の固有値は

λ ²

なので

trA ² = s ² ₁ + s ² ₂ + · · · + s ² _n

これは

k

乗の場合で成立します

(trA ^k = s ^k ₁ + s ^k ₂ + · · · + s ^k _n )。

最後にヤコビアンと関数の逆変換に触れておきます。微分可能な

x _i = f _i (y ₁ , y ₂ , . . . , y _n ) (i = 1, 2, . . . , n)

があり、行列式

det J (n) =

∂x 1

∂y ₁

∂x 1

∂y ₂ · · · · ∂x 1

∂y _n

∂x 2

∂y 1

∂x 2

∂y 2 · · · · ∂x 2

∂y n

.. . .. . .. . .. . .. .

∂x n − 1

∂y ₁

∂x n − 1

∂y ₂ · · · · ∂x n − 1

∂y _n

∂x n

∂y 1

∂x n

∂y 2 · · · · ∂x n

∂y n

が

0

でなければ、逆変換となる

y i = g i (x 1 , x 2 , . . . , x n )

が一意的に存在します。

J _(n)

はヤコビ行列

(Jacobian matrix)、

det J _(n)

はヤコビアン

(Jacobian)

やヤコビ行列式と呼ばれます。簡単に帰納法による証明を示しておきます。

F i (x i , y 1 , y 2 , . . . , y n ) = f i (y 1 , y 2 , . . . , y n ) − x i = 0

とします。n

= 1

のときは偏微分が存在すればいいので成立します。nの場合

F 1 (x 1 , y 1 , y 2 , . . . , y n ) = 0 F 2 (x 2 , y 1 , y 2 , . . . , y n ) = 0

.. .

F n (x n , y 1 , y 2 , . . . , y n ) = 0

という

n

個の方程式があります。y

n − 1

までは

det J _(n ₋ ₁₎ ̸ = 0

なら逆変換が存在すると仮定しています。このため、

y k (k = 1, 2, . . . , n − 1)

は

x 1 , . . . , x n

の関数として書けるので、F

1

から

F n − 1

では

y k

に関して解くことができて、

それらを

y 1 = ϕ 1 (x 1 , . . . , x n , y n ), . . . , y n − 1 = ϕ n − 1 (x 1 , . . . , x n , y n )

とします。そうすると、残っている

F _n

は

F _n (x _n , ϕ ₁ (x, y _n ), . . . , ϕ _n ₋ ₁ (x, y _n ), y _n ) = G(x, y _n ) = 0

(12)

x ₁ , . . . , x _n

は略して

x

と書いています

(y

でも同様に書きます)。y

n = ϕ _n (x)

になるには

G(x, y _n )

を

y _n

で微分したとき

0

でなければいいです

(G(x, y _n )

が

y _n

を含んでいる必要がある)。

なので、y

n

の微分を見ると多変数での連鎖則から

∂G(x, y n )

∂y _n = ∂F n

∂ϕ ₁

∂ϕ 1

∂y _n + · · · + ∂F n

∂ϕ _n ₋ ₁

∂ϕ n − 1

∂y _n + ∂F n

∂y _n n = 3

としてみます。n

= 3

では

∂G(x, y 3 )

∂y ₃ = ∂F 3

∂y ₁

∂ϕ 1

∂y ₃ + ∂F 3

∂y ₂

∂ϕ 2

∂y ₃ + ∂F 3

∂y ₃ F 1 , F 2

を

y 3

で偏微分したものは

∂F ₁

∂y 3

= ∂F ₁

∂y 1

∂ϕ ₁

∂y 3

+ ∂F ₁

∂y 2

∂ϕ ₂

∂y 3

+ ∂F ₁

∂y 3

= 0

∂F 2

∂y ₃ = ∂F 2

∂y ₁

∂ϕ 1

y ₃ + ∂F 2

∂y ₂

∂ϕ 2

y ₃ + ∂F 2

∂y ₃ = 0

これは

A ₍₂₎ =



 

∂F 1

∂y ₁

∂F 1

∂y ₂

∂F 2

∂y 1

∂F 2

∂y 2



 

とすれば

a 11 x 1 + a 12 x 2 = b 1

a 21 x 1 + a 22 x 2 = b 2

の連立方程式なので

x 1 = ∂ϕ 1

∂y 3

= 1

det A ₍₂₎ ( ∂F 1

∂y 2

∂F 2

∂y 3 − ∂F 2

∂y 2

∂F 1

∂y 3

)

x 2 = ∂ϕ 2

y 3

= − 1 det A ₍₂₎ ( ∂F 1

∂y 1

∂F 2

∂y 3 − ∂F 2

∂y 1

∂F 1

∂y 3

)

F i = g i (y) − x i = 0

から、A

(2)

での

F i

は全て

x i = g i (y)

に置き換わるので、A

(2)

は

J ₍₂₎

と同じです。これらを入れて

∂G(x, y 3 )

∂y ₃ = 1 det A ₍₂₎

( ∂F 3

∂y ₁ ( ∂F 1

∂y ₂

∂F 2

∂y ₃ − ∂F 2

∂y ₂

∂F 1

∂y ₃ ) − ∂F 3

∂y ₂ ( ∂F 1

∂y ₁

∂F 2

∂y ₃ − ∂F 2

∂y ₁

∂F 1

∂y ₃ ) + det A ₍₂₎ ∂F 3

∂y ₃ )

= 1

det A ₍₂₎ ( ∂F 1

∂y ₂

∂F 2

∂y ₃

∂F 3

∂y ₁ − ∂F 1

∂y ₃

∂F 2

∂y ₂

∂F 3

∂y ₁ − ∂F 1

∂y ₁

∂F 2

∂y ₃

∂F 3

∂y ₂ + ∂F 1

∂y ₃

∂F 2

∂y ₁

∂F 3

∂y ₂ + det A ₍₂₎ ∂F 3

∂y ₃ )

行列

A ₍₂₎

を

3 × 3

行列に拡張した行列

A ₍₃₎

を

(13)

A (3) =



 

 

∂F 1

∂y 1

∂F 1

∂y 2

∂F 1

∂y 3

∂F ₂

∂y 1

∂F ₂

∂y 2

∂F ₂

∂y 3

∂F 3

∂y ₁

∂F 3

∂y ₂

∂F 3

∂y ₃



 

 

とすれば

∂G(x, y 3 )

∂y ₃ = 1

det A ₍₂₎ (a 12 a 23 a 31 − a 13 a 22 a 31 − a 11 a 23 a 32 + a 13 a 21 a 32 + (a 11 a 22 − a 12 a 21 )a 33 )

= 1

det A ₍₂₎ (a ₁₁ a ₂₂ a ₃₃ + a ₁₂ a ₂₃ a ₃₁ + a ₁₃ a ₂₁ a ₃₂ − a ₁₁ a ₂₃ a ₃₂ − a ₁₃ a ₂₂ a ₃₁ − a ₁₂ a ₂₁ a ₃₃ )

= det A ₍₃₎ det A ₍₂₎

det A ₍₂₎ ̸ = 0

なので、det

A ₍₃₎ ̸ = 0

なら微分は

0

になりません。これは

n

の場合でも同じことが言えます

(一般的

にしたいならクラメルの定理なんかを使えばいい)。

これから、det

J (n) ̸ = 0 (J (n) = A (n) )

なら

y n = ϕ n (x)

になります。なので、k

= 1, 2, . . . , n − 1

において

y k = ϕ k (x, ϕ n (x)) = f k (x)

となり、nでは

y n = f n (x)

となります。

よって、n

− 1

のとき

det J _(n ₋ ₁₎ ̸ = 0

なら

x _i = g _i (y) (i = 1, . . . , n − 1)

の逆変換

y _i = f _i (x)

が存在するとしたとき、y

n = f _n (x)

となるためには

det J ̸ = 0

が要求されるので帰納法から証明されたことになります。

a ijを2 × 2行列、xiを2 × 1行列、biを2 × 1行列の成分とみれば ( a 11 a 12

a 11 x 1 + a 12 x 2 = b 1

a 21 x 1 + a 22 x 2 = b 2

a ij

2 × 2

i

2 × 1

i

2 × 1

( a 11 a 12

a 21 a 22

) ( x 1

x 2

)

=

( a 11 x 1 + a 12 x 2

a 21 x 1 + a 22 x 2

)

= ( b 1

b 2

)

⇔ ∑ 2

j=1 a ij x j = b i

1 , x 2

1 , x 2

x 1 = − a 12 b 2 − a 22 b 1

a 11 a 22 − a 12 a 21 , x 2 = a 11 b 2 − a 21 b 1

a 11 a 22 − a 12 a 21

0

(determinant)

det A

| A |

× 2

det A = a 11 a 22 − a 12 a 21

det A =

a 11 a 12 a 21 a 22

3

× 3

det A = a 11 a 22 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 − a 11 a 23 a 32 − a 12 a 21 a 33 − a 13 a 22 a 31

n × n

× 3

6

a 11 a 22 a 33 , a 12 a 23 a 31 , a 13 a 21 a 32

a 11 a 23 a 32 , a 12 a 21 a 33 , a 13 a 22 a 31

a 1i a 2j a 3k

1, 2, 3

i, j, k

(i, j, k)

(1, 2, 3)、 (2, 3, 1)、 (3, 1, 2) (a 11 a 22 a 33

a 12 a 23 a 31

a 13 a 21 a 32 )、マイナスではそれぞれ (1, 3, 2)、(2, 1, 3)、(3, 2, 1)

(1, 2, 3)

(偶置換)

(奇置換)

(1, 2, 3) ⇒ (2, 1, 3) ⇒ (2, 3, 1) (1, 2, 3) ⇒ (1, 3, 2) ⇒ (3, 1, 2)

× 3

1i a 2j a 3k

= 1, j = 2, k = 3

11 a 22 a 33

3

a 11 a 23 a 32

1, 3

a 13 a 21 a 32

1, 2

a 13 a 22 a 31

2, 3

a 12 a 23 a 31

1, 3

a 12 a 21 a 33

a 11 a 22 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 − a 11 a 23 a 32 − a 12 a 21 a 33 − a 13 a 22 a 31

2, 3

3! = 6

6

n × n

det A = ∑

perm

( − 1) σ a 1k

a 2k

· · · a nk

i

1 , x ₂

1 , x ₂

a ₁₁ a ₂₂ − a ₁₂ a ₂₁ , x 2 = a 11 b 2 − a 21 b 1

a ₁₁ a ₂₂ − a ₁₂ a ₂₁

det A = a ₁₁ a ₂₂ − a ₁₂ a ₂₁

a ₁₁ a ₁₂ a 21 a 22

det A = a ₁₁ a ₂₂ a ₃₃ + a ₁₂ a ₂₃ a ₃₁ + a ₁₃ a ₂₁ a ₃₂ − a ₁₁ a ₂₃ a ₃₂ − a ₁₂ a ₂₁ a ₃₃ − a ₁₃ a ₂₂ a ₃₁

a ₁₁ a ₂₃ a ₃₂ , a ₁₂ a ₂₁ a ₃₃ , a ₁₃ a ₂₂ a ₃₁

a _1i a _2j a _3k

(1, 2, 3)、 (2, 3, 1)、 (3, 1, 2) (a ₁₁ a ₂₂ a ₃₃

a ₁₂ a ₂₃ a ₃₁

a ₁₃ a ₂₁ a ₃₂ )、マイナスではそれぞれ (1, 3, 2)、(2, 1, 3)、(3, 2, 1)

11 a ₂₂ a ₃₃

a ₁₁ a ₂₃ a ₃₂

a ₁₃ a ₂₁ a ₃₂

a ₁₃ a ₂₂ a ₃₁

a ₁₂ a ₂₃ a ₃₁

a ₁₂ a ₂₁ a ₃₃

( − 1) ^σ a 1k

(k ₁ , k ₂ , . . . , k _n )

ϵ _k

_k

_...k

ϵ _k

_k

_...k

a _1k

a _2k

· · · a _nk

ϵ ₁₂₃ = ϵ ₂₃₁ = ϵ ₃₁₂ = +1 ϵ 132 = ϵ 213 = ϵ 321 = − 1

ϵ ₁₁₁ = ϵ ₁₁₂ = ϵ ₁₁₃ = ϵ ₂₁₁ = · · · = 0

ϵ _k

_k

_k

a _1k

a _2k

a _3k

= ϵ ₁₂₃ a ₁₁ a ₂₂ a ₃₃ + ϵ ₂₃₁ a ₁₂ a ₂₃ a ₃₁ + ϵ ₃₁₂ a ₁₃ a ₂₁ a ₃₂ + ϵ 132 a 11 a 23 a 32 + ϵ 213 a 12 a 21 a 33 + ϵ 321 a 13 a 22 a 31

( − 1) ^σ a _k

₁ a _k

₂ · · · a _k

_n

− 1) ^σ a 1k