行列式
行列式の関係を求めていきます。
大文字のローマ文字は行列、小文字とギリシャ文字はスカラー、太字はベクトルとしています。
行列式が出てくる理由を見るために、2つの式による連立方程式
a 11 x 1 + a 12 x 2 = b 1
a 21 x 1 + a 22 x 2 = b 2
を持ち出します。これは
a ijを2 × 2
行列、xi
を2 × 1
行列、bi
を2 × 1
行列の成分とみれば
( a 11 a 12
a 21 a 22
) ( x 1
x 2
)
=
( a 11 x 1 + a 12 x 2
a 21 x 1 + a 22 x 2
)
= ( b 1
b 2
)
⇔ ∑ 2
j=1 a ij x j = b i
と書けます。これだとただの表記ですが、x
1 , x 2
が解を持つかを行列の成分から判別できます。x1 , x 2
を普通に求 めるとx 1 = − a 12 b 2 − a 22 b 1
a 11 a 22 − a 12 a 21 , x 2 = a 11 b 2 − a 21 b 1
a 11 a 22 − a 12 a 21
このとき、分母が
0
でなければ解を持ちます。で、分母の形は行列の対角成分同士と非対角成分同士の積による 形になっています。これを行列式(determinant)
と呼びます。行列式はdet A
や| A |
と表記され、2× 2
行列の場 合ではdet A = a 11 a 22 − a 12 a 21
となります。行列の形で書けば
det A =
a 11 a 12 a 21 a 22
と表記されます。
3
つの連立でも同様にできます。面倒なので結果だけ示せば、3× 3
行列の行列式はdet A = a 11 a 22 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 − a 11 a 23 a 32 − a 12 a 21 a 33 − a 13 a 22 a 31
となります。
この手続きは
n × n
行列に一般化されます。3× 3
行列での行列式には6
個の項があり、その符号がプラスなのはa 11 a 22 a 33 , a 12 a 23 a 31 , a 13 a 21 a 32
マイナスなのは
a 11 a 23 a 32 , a 12 a 21 a 33 , a 13 a 22 a 31
各項での添え字の左側は
a 1i a 2j a 3kのように1, 2, 3
の並びになるようにしています。このように並べた時のi, j, k
の
並びに法則性があります。(i, j, k)
の並びは、プラスではそれぞれ(1, 2, 3)、 (2, 3, 1)、 (3, 1, 2) (a 11 a 22 a 33、a 12 a 23 a 31、
a 13 a 21 a 32 )、マイナスではそれぞれ (1, 3, 2)、(2, 1, 3)、(3, 2, 1)
となっています。つまり、プラスでは(1, 2, 3)
の並
びに対して偶数回の入れ替え(偶置換)
が行われ、マイナスでは奇数回の入れ替え(奇置換)
が行われています。こ
こで言っている入れ替えは
a 12 a 23 a 31、
a 13 a 21 a 32 )、マイナスではそれぞれ (1, 3, 2)、(2, 1, 3)、(3, 2, 1)
となっています。つまり、プラスでは(1, 2, 3)
の並
びに対して偶数回の入れ替え(偶置換)
が行われ、マイナスでは奇数回の入れ替え(奇置換)
が行われています。こ
こで言っている入れ替えは
(1, 2, 3) ⇒ (2, 1, 3) ⇒ (2, 3, 1) (1, 2, 3) ⇒ (1, 3, 2) ⇒ (3, 1, 2)
といったもので、これらは偶置換です。
というわけで、3
× 3
行列の行列式は、a1i a 2j a 3k
としたとき、i= 1, j = 2, k = 3
の偶置換ではプラス、奇置 換ではマイナスとして全て足したものになっています。具体的に行えば、a11 a 22 a 33
から始めて、2,3
を交換したa 11 a 23 a 32ではマイナス、これから1, 3
を交換したa 13 a 21 a 32ではプラス、さらに1, 2
を交換したa 13 a 22 a 31では
マイナス、さらに2, 3
を交換したa 12 a 23 a 31ではプラス、そして1, 3
を交換したa 12 a 21 a 33ではマイナスとなり、
1, 2
を交換したa 13 a 22 a 31では
マイナス、さらに2, 3
を交換したa 12 a 23 a 31ではプラス、そして1, 3
を交換したa 12 a 21 a 33ではマイナスとなり、
1, 3
を交換したa 12 a 21 a 33ではマイナスとなり、
これらを足した
a 11 a 22 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 − a 11 a 23 a 32 − a 12 a 21 a 33 − a 13 a 22 a 31
が行列式となります。1,
2, 3
の並びの組み合わせは3! = 6
個なので6
個の項になります。この結果をそのまま一般化することで
n × n
行列の行列式はdet A = ∑
perm
( − 1) σ a 1k1a 2k2· · · a nkn
· · · a nkn
となります。k
i
は1
からn
の整数で、σは(k 1 , k 2 , . . . , k n )
の並びが(1, 2, . . . , n)
に対して偶置換なら0、奇置換な
ら+1
にし、和の記号はその並びによる全ての項の和を取ることを意味します。n個の数字の並びの組み合わせか ら、n!個の項の和になります。もしくはレヴィ・チビタ記号
ϵ k1k
2...k
nによって
det A =
∑ n k1,k
2,...,k
n=1
ϵ k1k
2...k
na 1k1a 2k2· · · a nkn (1)
a 2k2· · · a nkn (1)
(1)
とも書かれます。和の記号は
∑ n k1=1
∑ n k1=2
· · ·
∑ n kn=1
を略して書いているだけです。レヴィ・チビタ記号は例えば、ϵ
123
ではϵ 123 = ϵ 231 = ϵ 312 = +1 ϵ 132 = ϵ 213 = ϵ 321 = − 1
ϵ 111 = ϵ 112 = ϵ 113 = ϵ 211 = · · · = 0
となる記号です。つまり、ϵ
12...n = +1の添え字に対して偶置換なら+1、奇置換なら − 1、同じ数字の添え字が複
数あるときは0
になる記号です。なので、(1)は普通に和を取っていけばいいだけです。例えば、3× 3
行列では
det A =
∑ 3 k1,k
2,k
3=1
ϵ k1k
2k
3a 1k1a 2k2a 3k3
a 2k2a 3k3
= ϵ 123 a 11 a 22 a 33 + ϵ 231 a 12 a 23 a 31 + ϵ 312 a 13 a 21 a 32 + ϵ 132 a 11 a 23 a 32 + ϵ 213 a 12 a 21 a 33 + ϵ 321 a 13 a 22 a 31
= a 11 a 22 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 − a 11 a 23 a 32 − a 12 a 21 a 33 − a 13 a 22 a 31
となります。
列で和を取るようにしましたが、行で和を取っても同じことなので、行列式は
det A = ∑
perm
( − 1) σ a k11 a k
22 · · · a k
nn
det A =
∑ n k1,k
2,...,k
n=1
ϵ k1k
2...k
na k11 a k
22 · · · a k
nn
1 a k
22 · · · a k
nn
と定義できます。雑に言えば、(
− 1) σ a 1k1a 2k2· · · a nknと( − 1) σ a k11 a k
22 · · · a k
nn
の入れ替えによる組み合わせは同
じというだけです。
· · · a nknと( − 1) σ a k11 a k
22 · · · a k
nn
の入れ替えによる組み合わせは同
じというだけです。
1 a k
22 · · · a k
nn
の入れ替えによる組み合わせは同 じというだけです。
n × n
行列の行列式を(n − 1) × (n − 1)
行列から求める方法を導出します。n× n
行列A
があり、それのi
行とj
列を抜いた行列の行列式をM (ij)とします。M(ij)
は小行列式(minor)、i
行とj
列を抜いた(n − 1) × (n − 1)
行
列は小行列(submatrix)
と言います。小行列をA
とすれば小行列式はM (ij) = det A
です。例えば、3× 3
行列で
のM (23)は
A =
a 11 a 12 a 13
a 21 a 22 a 23
a 31 a 32 a 33
⇒ M (23) =
a 11 a 12
a 31 a 32
となります。元の行列の
2
行目と3
列目(a 21 , a 22 , a 23 , a 13 , a 23 , a 33 )
に注目して、そこの成分を行列A
から抜き取っ ています。
n × n
行列A
の小行列式M (ij)を使って
∆ ij = ( − 1) i+j M (ij)
としたものを行列
A
の余因子(cofactor)
と言います。余因子∆ ij を成分に持つ行列を余因子行列と言います。
ただし、余因子行列の定義のされ方が
2
通りあり、∆ij
をそのままi
行j
列とする場合と、転置してj
行i
列に する場合があります。英語だとこの2
つは区別されていて、∆ij
をそのままi
行j
列としたものをcofactor matrix (matrix of cofactor)、∆ ij をj
行i
列としたものをadjugate matrix (adjoint matrix)
としています。行列A
の
adjugate matrix
はAdjA、その成分は (AdjA) ijのように表記されます((AdjA) ij = ∆ ji )。
((AdjA) ij = ∆ ji )。
日本語では
adjugate matrix
を余因子行列と言うことが多いです。おそらく、cofactor matrixはほとんど出て こないのでadjugate matrix
を余因子行列と呼ぶことにしているのだと思います。ここでもadjugate matrix
を余 因子行列と言っていきます。例として
3 × 3
行列A =
a 11 a 12 a 13
a 21 a 22 a 23
a 31 a 32 a 33
を使ってみます。このときの小行列式
M (11)は
M (11) =
a 22 a 23
a 32 a 33
= a 22 a 33 − a 23 a 32
なので、余因子
∆ 11は
∆ 11 = ( − 1) 1+1 M (11) = M (11) M (12)でも同様に
∆ 12 = ( − 1) 1+2 M (12) = − M (12) = −
a 21 a 23
a 31 a 33
同様のことを残った成分でも行い、成分を
˜ a ij = ∆ jiとすることで余因子行列A(= AdjA) ˜
は
A ˜ =
∆ 11 ∆ 21 ∆ 31
∆ 12 ∆ 22 ∆ 32
∆ 13 ∆ 23 ∆ 33
=
a 22 a 23
a 32 a 33
−
a 12 a 13
a 32 a 33
a 12 a 13
a 22 a 23
−
a 21 a 23
a 31 a 33
a 11 a 13
a 31 a 33
−
a 11 a 13
a 21 a 23
a 21 a 22
a 31 a 32
−
a 11 a 12
a 31 a 32
a 11 a 12
a 21 a 22
( − 1) i+jから当たり前ですが、成分の符号は交互に変わります。
余因子を使って行列式を求められます。n
× n
行列でも分かりにくくなるだけで同じことをするので、3× 3
行 列を使います。3× 3
行列A
の行列式が、何かしらの係数C ikによって
det A =
∑ 3 k=1
a ik C ik (2)
という形で書けるとします。iは
1
から3
のどれでもいいです。i= 1
を使うことにしてdet A =
∑ 3 k=1
a 1k C 1k = a 11 C 11 + a 12 C 12 + a 13 C 13
3 × 3
行列の行列式においてa 11は
det A =
∑ 3 k1,k
2,k
3=1
ϵ k1k
2k
3a 1k1a 2k2a 3k3
a 2k2a 3k3
=
∑ 3 k2,k
3=1
ϵ 1k2k
3a 11 a 2k2a 3k3+
a 3k3+
∑ 3 k1̸ =1,k
2,k
3=1
ϵ k1k
2k
3a 1k1a 2k2a 3k3
a 2k2a 3k3
として出てきます。二行目の第一項は
k 1はk 1 = 1
に固定しているのでk 2 , k 3の和となり、第二項はk 1 = 1
でな
い残りの項による和になります。これと(2)
のa 11の項を取り出せば
k 1 = 1
でな い残りの項による和になります。これと(2)
のa 11の項を取り出せば
a 11 C 11 =
∑ 3 k2,k
3=1
ϵ 1k2k
3a 11 a 2k2a 3k3
a 3k3
= a 11 (a 22 a 33 − a 23 a 32 )
C 11 = a 22 a 33 − a 23 a 32
となることが分かり、係数
C 11は余因子∆ 11になっています。
これは他の成分でも同じ結果になり、n
× n
行列でも同様に成立するので、行列A
の行列式はA
の余因子に よってdet A =
∑ n k=1
a ik ∆ ik
と書けます。これを余因子展開
(cofactor expansion)
と言います。今はi = 1
として行いましたが、他の場合でも 同様に示せます。また、行でなく列で展開しても同じことが言えてdet A =
∑ n k=1
a ki ∆ ki
となります。
行列式と余因子行列から逆行列を求めることもできます。行列
A
の余因子行列をA ˜
とします。行列A
とその逆 行列B
は定義から、単位行列I
によってAB = I
左辺は成分で書けば
(AB) ij =
∑ n k=1
a ik b kj
なので、AB
= I
は成分で書くと∑ n k=1
a ik b kj = δ ij
となります。この
b kjが分かれば行列A
の逆行列が求められたことになります。
ここで行列
A
の余因子∆ jkによる余因子展開
∑ n k=1
a ik ∆ jk = δ ij det A
を持ち出します。余因子展開は
i = j
のときなので、右辺にクロネッカーデルタを入れてi = j
のときにdet A
に なるようにしています。変形すれば1 det A
∑ n k=1
a ik ∆ jk = δ ij
これと
AB = I
の形を比較するとb kj = ∆ jk det A
( (B) kj = ∆ jk det A
)
のとき
∑ n k=1
a ik b kj = δ ij
となるのが分かります。よって、余因子
∆ ijの転置を成分とする行列は余因子行列A ˜ (( ˜ A) ij = ∆ ji )
なので、行列
A
の逆行列B = A − 1は
A − 1 = A ˜ det A
となります。当然、det
A ̸ = 0
である必要があり、detA ̸ = 0
は逆行列があるための条件になっています。連立方程式の解と行列式の関係についてまとめておきます。連立方程式は、n
× n
行列A、n
次元ベクトルx, b
によってAx = b (3)
と書けます。なので、逆行列
A − 1から
A − 1 Ax = A − 1 b Ix = A − 1 b x = A − 1 b
このため、連立方程式が解を持つためには逆行列
A − 1が存在している必要があります。そして、逆行列が存在す
るためにはdet A ̸ = 0
である必要があり、detA ̸ = 0
ならA
の余因子行列A ˜
から
x = A ˜
det A b (x i = 1 det A
∑ n k=1
˜
a ik b k , a ˜ ik = ∆ ki )
として求まります。一方で、b
= 0 (b
の成分が全て0)
の場合x = A − 1 b = 0
このため、b
= 0
ではdet A ̸ = 0
のときx = 0
が解になり(自明な解,trivial solution)、detA = 0
のときにx ̸ = 0
の解を持つことになります。あまり意味のない単純な例として( α α α α
) ( x 1 x 2
)
= 0
という場合では、行列式は
0
になり、x1 + x 2 = 0を満たすものが解になります。
n × n
行列A
の固有値λ
とその固有ベクトルv
はAv = λv λv
を左辺に持っていき単位行列をつけて(A − λI)v = 0
この式の形は連立方程式
(3)
でのb = 0
の場合なので、v= 0
以外の解があるための条件det[A − λI] = 0
が出てきます。これを固有方程式
(characteristic equation)、det[A − λI ]
を固有多項式(characteristic polynomial)
と言います。固有方程式を解けばλ
を求められます。多項式とついているのは、行列式の定義から、n
× n
行列のときdet[A − λI] = ( − 1) n λ n + c n − 1 λ n − 1 + · · · + c 0
という形になるからです。c
i
はスカラーです。もしくは、(λI− A)v = 0
とすればdet[λI − A]
になるので、−1
を 省けてdet[λI − A] = λ n + c ′ n − 1 λ n − 1 + · · · + c ′ 0
とすることもできます。
行列式の性質は
(i) n × n
行列のスカラー倍αA
ではdet[αA] = α n det A.
(ii) det A = det A t . (iii) det A ∗ = (det A) ∗ . (iv) det A † = det A ∗ . (v) det[AB] = det A det B.
(i)
は行列式の各項はn
個の積で、それら全てがα
倍されるためにα n倍になります。(ii)は行列式の定義そのま
まです。実際に、3× 3
行列では、転置A tでは成分をb ijとして
b ijとして
det A t =
∑ 3 k1,k
2,k
3=1
ϵ k1k
2k
3b 1k1b 2k2b 3k3
b 2k2b 3k3
= b 11 b 22 b 33 + b 12 b 23 b 31 + b 13 b 21 b 32 − b 11 b 23 b 32 − b 12 b 21 b 33 − b 13 b 22 b 31
a ij = b jiなので、det A
と一致します。(iii)
は、レヴィ・チビタ記号は実数であることと、複素数のa ∗ b ∗ = (ab) ∗ , a ∗ + b ∗ = (a + b) ∗からです。(iv)は(ii),(iii)
から
(ii),(iii)
からdet A † = (det A t ) ∗ = (det A) ∗ = det A ∗
(v)
を示すために別の行列式の性質を出します。1列目に和を含むみT =
a 11 + b 11 a 12 · · · a 1n
a 21 + b 21 a 22 · · · a 2n
.. . .. . .. . .. . a n1 + b n1 a n2 · · · a nn
となっている行列の行列式は
det T = ∑
k
1,...,k
nϵ k1k
2...k
n(a k11 + b k
11 )a k
22 · · · a k
nn
1 + b k
11 )a k
22 · · · a k
nn
= ∑
k
1,...,k
nϵ k1k
2...k
na k11 a k
22 · · · a k
nn + ∑
1 a k
22 · · · a k
nn + ∑
k
1,...,k
nϵ k1k
2...k
nb k11 a k
22 · · · a k
nn
1 a k
22 · · · a k
nn
=
a 11 a 12 · · · a 1n a 21 a 22 · · · a 2n .. . .. . .. . .. . a n1 a n2 · · · a nn
+
b 11 a 12 · · · a 1n b 21 a 22 · · · a 2n .. . .. . .. . .. . b n1 a n2 · · · a nn
と分解できます。i列目に足されていても同様です。これを利用します。また、k
1 , . . . , k n
の和の範囲は省いてい きます。まず、2
× 2
行列とします。このときのdet[AB]
はdet[AB] =
a 11 b 11 + a 12 b 21 a 11 b 12 + a 12 b 22
a 21 b 11 + a 22 b 21 a 21 b 12 + a 22 b 22
=
a 11 b 11 a 11 b 12 + a 12 b 22
a 21 b 11 a 21 b 12 + a 22 b 22
+
a 12 b 21 a 11 b 12 + a 12 b 22
a 22 b 21 a 21 b 12 + a 22 b 22
= b 11
a 11 a 11 b 12 + a 12 b 22
a 21 a 21 b 12 + a 22 b 22
+ b 21
a 12 a 11 b 12 + a 12 b 22
a 22 a 21 b 12 + a 22 b 22
= ∑
k
1b k11
a 1k1 a 11 b 12 + a 12 b 22 a 2k1 a 21 b 12 + a 22 b 22
a 21 b 12 + a 22 b 22
= ∑
k
1b k11
( a 1k1 a 11 b 12
a 2k1 a 21 b 12
+
a 1k1 a 12 b 22
a 2k1 a 22 b 22
)
= ∑
k
1b k11
( b 12
a 1k1 a 11
a 2k1 a 21 + b 22
a 1k1 a 12
a 2k1 a 22 )
= ∑
k
1∑
k
2b k11 b k
22
a 1k1 a 1k2
a 2k1 a 2k2
行列式は
Σϵ st a 1s a 2tなので、k1 = k 2
なら0、k 1 = 1, k 2 = 2
の並びなら+ det A
です。そして、k1 = 2, k 2 = 1
と
並びを1
回変えると− det A
です。よってdet A ∑
k
1,k
2ϵ k1k
2b k11 b k
22 = det A det B
1 b k
22 = det A det B
となり、det[AB] = det
A det B
です。この手順を
n × n
行列で行えばa 11 b 11 + a 12 b 21 · · · + a 1n b n1 · · · a 11 b 1n + a 12 b 2n · · · + a 1n b nn
.. . .. . .. .
a n1 b 11 + a n2 b 21 · · · + a nn b n1 · · · a n1 b nn + a n2 b 2n · · · + a nn b nn
= ∑
k
1b k11
a 1k1 a 11 b 12 + a 12 b 22 · · · + a 1n b n2 · · · a 11 b 1n + a 12 b 2n · · · + a 1n b nn
.. . .. . .. . .. .
a nk1 a n1 b 12 + a n2 b 22 · · · + a nn b n2 · · · a n1 b n2 + a n2 b 22 · · · + a nn b nn
= ∑
k
1b k11 b k
22
a 1k1 a 1k2 a 11 b 13 + a 12 b 23 · · · + a 1n b n3 · · · a 11 b 1n + a 12 b 2n · · · + a 1n b nn
a 11 b 13 + a 12 b 23 · · · + a 1n b n3 · · · a 11 b 1n + a 12 b 2n · · · + a 1n b nn
.. . .. . .. . .. . .. .
a nk1 a nk2 a n1 b 13 + a n2 b 23 · · · + a nn b n3 · · · a n1 b n2 + a n2 b 22 · · · + a nn b nn
a n1 b 13 + a n2 b 23 · · · + a nn b n3 · · · a n1 b n2 + a n2 b 22 · · · + a nn b nn
= ∑
k
1,...,k
nb k11 b k
22 · · · b k
nn
a 1k1 a 1k2 · · · a 1kn
.. . .. . .. . .. . a nk1 a nk2 · · · a nkn
· · · a 1kn
.. . .. . .. . .. . a nk1 a nk2 · · · a nkn
a nk2 · · · a nkn
このときも行列式の定義から、複数の
k iが同じだと0
になり、ki
がi = 1, 2, . . . , n
と並んでいれば+ det A、1
回
の並びの入れ替えで− det A
です。よって、n× n
行列の積AB
の行列式は
det[AB] = det A ∑
k
1,...,k
nϵ k1k
2··· k
nb k11 b k
22 · · · b k
nn = det A det B
1 b k
22 · · · b k
nn = det A det B
となります。
固有値の積は行列式、固有値の和はトレースと等しいことを示します。
まず、固有値の積は行列式になることを示します。固有多項式を
ρ(λ) = det(λI − A)
とします。n× n
行列A
の固有値はρ(λ) = 0
の解であり、ρ(λ)はn
次の多項式です。このため、解は一般的にn
個あって、それをλ = s 1 , s 2 , . . . , s nとします。そうするとρ(λ) = 0
は
ρ(λ) = (λ − s 1 )(λ − s 2 ) · · · (λ − s n ) = 0
と書けます
((λ − s i ) mの場合もありますが今は関係ないので無視します)。λ= 0
では
ρ(0) = ( − 1) n s 1 s 2 · · · s n
となり、det[λI
− A]
でλ = 0
とすればρ(0) = det[ − A]
なので( − 1) n s 1 s 2 · · · s n = ( − 1) n det A s 1 s 2 · · · s n = det A
よって、Aの行列式は固有値の積と一致するのが分かります。
固有値の和とトレースが一致することを示すために、det[λI
− A]
をさらに見ていきます。n× n
行列で行いま すが、4× 4
行列あたりを使うと分かりやすいです。D= λI − A
はD = λI − A =
λ − a 11 − a 12 · · · − a 1n
− a 21 λ − a nn · · · − a 2n
.. . .. . · · · .. .
− a n1 − a n2 · · · λ − a nn
D = λI − A
の成分をd ijと書くことにします。これの行列式でのλ n − 1の項がどうなるのかを求めます。そのた
めに、dnn = λ − a nn
を含む項を取り出します。行列D
とその行列式
nn = λ − a nn
を含む項を取り出します。行列D
とその行列式det D =
∑ n k1,k
2,...,k
n=1
ϵ k1k
2...k
n−1n d 1k
1d 2k2· · · d nkn
· · · d nkn
を見ると、d
nn
のときにλ n − 1が出てくるのが分かります。これはn
行とn
列ではd nnのみがλ
を含んでいるた
めです。例えば、kn = 1
とした
λ
を含んでいるた めです。例えば、kn = 1
∑ n k1,k
2,...,k
n−1=1
ϵ k1k
2...k
n−11 d 1k
1d 2k2· · · d (n − 1)kn−1d n1
· · · d (n − 1)kn−1d n1
では、k
1 = 1のとき0
なのでd 11
が使えないためにλ
が1
つ減り、dn1
にもλ
はいないのでλ n − 2までしか作れな
いからです(d nn以外を使うと2
つλ
が使えなくなる)。
2
つλ
が使えなくなる)。
d nnの項は
∑ n k1,k
2,...,k
n−1=1
ϵ k1k
2...k
n−1n d 1k
1d 2k2· · · d (n − 1)kn−1d nn
· · · d (n − 1)kn−1d nn
となっていて、k
1 , k 2 , . . . , k n − 1
がn
の項は0
になります。そうするとd nn
n − 1
∑
k
1,k
2,...,k
n−1=1
ϵ k1k
2...k
n−1d 1k1d 2k2· · · d (n − 1)kn−1
d 2k2· · · d (n − 1)kn−1
と書けます。和の部分は、n
× n
行列D
からn
行とn
列を抜いた(n − 1) × (n − 1)
行列D (n − 1)の行列式になっ
ていることが分かります。D(n − 1)
はA
からn
行とn
列をを抜いたA (n − 1)と(n − 1) × (n − 1)
単位行列I (n − 1)に
よって
(n − 1) × (n − 1)
単位行列I (n − 1)に よって
D (n − 1) = λI (n − 1) − A (n − 1)
なので、これの行列式を使うことで
det[λI − A] = d nn det[D (n − 1) ] + · · · = (λ − a nn ) det[λI (n − 1) − A (n − 1) ] + · · ·
「· · ·」部分は
λ n − 2までしか出てこない項です。
今の話を繰り返すことで
det[λI (n − 1) − A (n − 1) ] = (λ − a (n − 1)(n − 1) ) det[λI (n − 2) − A (n − 2) ]
= (λ − a (n − 1)(n − 1) )(λ − a (n − 2)(n − 2) ) · · · (λ − a 11 )
となります。よって、λ
n − 1
までを書くとdet[λI − A] = (λ − a nn )(λ − a (n − 1)(n − 1) )(λ − a (n − 2)(n − 2) ) · · · (λ − a 11 ) + · · ·
= λ n − (a 11 + a 22 + · · · + a nn )λ n − 1 + · · ·
そして、Aの固有値
s 1 , . . . , s nから
det[λI − A] = (λ − s 1 )(λ − s 2 ) · · · (λ − s n ) = λ n − (s 1 + s 2 + · · · + s n )λ n − 1 + · · ·
なので、λ
n − 1
の係数の比較からs 1 + s 2 + · · · + s n = a 11 + a 22 + · · · + a nn = trA
となり、行列
A
の固有値の和は行列A
のトレースに等しいことが分かります。例えば、A2 = AAの固有値はλ 2
なので
trA 2 = s 2 1 + s 2 2 + · · · + s 2 n
これは
k
乗の場合で成立します(trA k = s k 1 + s k 2 + · · · + s k n )。
最後にヤコビアンと関数の逆変換に触れておきます。微分可能な
x i = f i (y 1 , y 2 , . . . , y n ) (i = 1, 2, . . . , n)
があ り、行列式det J (n) =
∂x 1
∂y 1
∂x 1
∂y 2 · · · · ∂x 1
∂y n
∂x 2
∂y 1
∂x 2
∂y 2 · · · · ∂x 2
∂y n
.. . .. . .. . .. . .. .
∂x n − 1
∂y 1
∂x n − 1
∂y 2 · · · · ∂x n − 1
∂y n
∂x n
∂y 1
∂x n
∂y 2 · · · · ∂x n
∂y n
が
0
でなければ、逆変換となるy i = g i (x 1 , x 2 , . . . , x n )
が一意的に存在します。J (n)はヤコビ行列(Jacobian matrix)、
det J (n)はヤコビアン(Jacobian)
やヤコビ行列式と呼ばれます。簡単に帰納法による証明を示しておきます。
F i (x i , y 1 , y 2 , . . . , y n ) = f i (y 1 , y 2 , . . . , y n ) − x i = 0
とします。n= 1
のときは偏微分が存在すればいいので成立 します。nの場合F 1 (x 1 , y 1 , y 2 , . . . , y n ) = 0 F 2 (x 2 , y 1 , y 2 , . . . , y n ) = 0
.. .
F n (x n , y 1 , y 2 , . . . , y n ) = 0
という
n
個の方程式があります。yn − 1
まではdet J (n − 1) ̸ = 0
なら逆変換が存在すると仮定しています。このため、y k (k = 1, 2, . . . , n − 1)
はx 1 , . . . , x nの関数として書けるので、F1
からF n − 1ではy kに関して解くことができて、
y kに関して解くことができて、
それらを
y 1 = ϕ 1 (x 1 , . . . , x n , y n ), . . . , y n − 1 = ϕ n − 1 (x 1 , . . . , x n , y n )
とします。そうすると、残っている
F nは
F n (x n , ϕ 1 (x, y n ), . . . , ϕ n − 1 (x, y n ), y n ) = G(x, y n ) = 0
x 1 , . . . , x nは略してx
と書いています(y
でも同様に書きます)。yn = ϕ n (x)
になるにはG(x, y n )
をy nで微分し
たとき0
でなければいいです(G(x, y n )
がy nを含んでいる必要がある)。
なので、y
n
の微分を見ると多変数での連鎖則から∂G(x, y n )
∂y n = ∂F n
∂ϕ 1
∂ϕ 1
∂y n + · · · + ∂F n
∂ϕ n − 1
∂ϕ n − 1
∂y n + ∂F n
∂y n n = 3
としてみます。n= 3
では∂G(x, y 3 )
∂y 3 = ∂F 3
∂y 1
∂ϕ 1
∂y 3 + ∂F 3
∂y 2
∂ϕ 2
∂y 3 + ∂F 3
∂y 3 F 1 , F 2をy 3で偏微分したものは
∂F 1
∂y 3
= ∂F 1
∂y 1
∂ϕ 1
∂y 3
+ ∂F 1
∂y 2
∂ϕ 2
∂y 3
+ ∂F 1
∂y 3
= 0
∂F 2
∂y 3 = ∂F 2
∂y 1
∂ϕ 1
y 3 + ∂F 2
∂y 2
∂ϕ 2
y 3 + ∂F 2
∂y 3 = 0
これは
A (2) =
∂F 1
∂y 1
∂F 1
∂y 2
∂F 2
∂y 1
∂F 2
∂y 2
とすれば
a 11 x 1 + a 12 x 2 = b 1
a 21 x 1 + a 22 x 2 = b 2
の連立方程式なので
x 1 = ∂ϕ 1
∂y 3
= 1
det A (2) ( ∂F 1
∂y 2
∂F 2
∂y 3 − ∂F 2
∂y 2
∂F 1
∂y 3
)
x 2 = ∂ϕ 2
y 3
= − 1 det A (2) ( ∂F 1
∂y 1
∂F 2
∂y 3 − ∂F 2
∂y 1
∂F 1
∂y 3
)
F i = g i (y) − x i = 0
から、A(2)
でのF iは全てx i = g i (y)
に置き換わるので、A(2)
はJ (2)と同じです。これらを
入れて
∂G(x, y 3 )
∂y 3 = 1 det A (2)
( ∂F 3
∂y 1 ( ∂F 1
∂y 2
∂F 2
∂y 3 − ∂F 2
∂y 2
∂F 1
∂y 3 ) − ∂F 3
∂y 2 ( ∂F 1
∂y 1
∂F 2
∂y 3 − ∂F 2
∂y 1
∂F 1
∂y 3 ) + det A (2) ∂F 3
∂y 3 )
= 1
det A (2) ( ∂F 1
∂y 2
∂F 2
∂y 3
∂F 3
∂y 1 − ∂F 1
∂y 3
∂F 2
∂y 2
∂F 3
∂y 1 − ∂F 1
∂y 1
∂F 2
∂y 3
∂F 3
∂y 2 + ∂F 1
∂y 3
∂F 2
∂y 1
∂F 3
∂y 2 + det A (2) ∂F 3
∂y 3 )
行列
A (2)を3 × 3
行列に拡張した行列A (3)を
A (3) =
∂F 1
∂y 1
∂F 1
∂y 2
∂F 1
∂y 3
∂F 2
∂y 1
∂F 2
∂y 2
∂F 2
∂y 3
∂F 3
∂y 1
∂F 3
∂y 2
∂F 3
∂y 3
とすれば
∂G(x, y 3 )
∂y 3 = 1
det A (2) (a 12 a 23 a 31 − a 13 a 22 a 31 − a 11 a 23 a 32 + a 13 a 21 a 32 + (a 11 a 22 − a 12 a 21 )a 33 )
= 1
det A (2) (a 11 a 22 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 − a 11 a 23 a 32 − a 13 a 22 a 31 − a 12 a 21 a 33 )
= det A (3) det A (2)
det A (2) ̸ = 0
なので、detA (3) ̸ = 0
なら微分は0
になりません。これはn
の場合でも同じことが言えます(一般的
にしたいならクラメルの定理なんかを使えばいい)。これから、det
J (n) ̸ = 0 (J (n) = A (n) )
ならy n = ϕ n (x)
になります。なので、k= 1, 2, . . . , n − 1
においてy k = ϕ k (x, ϕ n (x)) = f k (x)
となり、nではy n = f n (x)
となります。よって、n