多変数解析への誘い―デカルトの葉線と陰関数定理
上野孝司
2017
年
8
月
10
日
概要 多変数解析への誘い―デカルトの葉線と陰関数定理 1.多変数解析への第一歩―写像の微分 高校までの解析学は、通常の微分積分学として実一変数の解析、すなわち、f : R → Rを扱う。f(x) = xn+ xn−1+ 1, f(x) = sin1 x, log xなどなど。。。微分積分学は実一変数の関数だけでも実に様々な問題を提起 し、その歴史も長い。これに対して、大学での解析学(複素解析を除く)は、多変数の写像、n変数からm変 数への関数(写像):f : Rn → Rmを扱い一気に複雑化して表記だけでも混乱してしまう。だから、大学初年 級では、z = f(x, y)などR2からRなどに限定して議論する方が望ましいとの見方もある。実際、『解析概 論』(高木貞治)では、R2→ R, R3→ Rなどで具体的記述が展開されており、その内容とともに教育的配慮 などから不朽の名著と言われる所以である。これに対して、『解析入門』(杉浦光夫)はRn→ Rmの一般論が 完結的に展開されており、これもまた定評がある。ただ、表記がやや煩雑であり教育効果から考えると大学の 教養学部や大学1、2年までの解析学としてはやや敷居が高いように筆者は思っている(この書物は東京大学 教養学部、駒場での授業に基づいている)。Rn → Rmの一般論を終始貫くことは、ブルバキなどの構造主義 の潮流が一時流行したことなどを背景としながら全盛期を極めたものの、一見して無味乾燥な様相を呈すると の見方もあるだろう。 だが、Rn → Rmと一般化して初めて見えてくるものがある。例えば、f : R → Rの実一変数関数の微分は、 f´(x) = lim h→0 f(x + h) − f(x) h と解析的に定義されるが、“微分係数”との表記が示唆するように、f : Rn → Rmの微分は、m × n行列M で定義され、Jacobi(ヤコービ)行列と呼ばれる。つまり、 微分係数↔m×n行列 という対応が導かれ、ここに解析学と線形代数が一体化する。これも一見、単なる構造的な表現のみとの見 方をする学習者もおられるかも知れないが、多次元化して初めて本質が見えてくるものがある。それを示す 具体的事例が、Jacobian(ヤコビアン、M の行列式detM)であり、その威力はすさまじいものがある。実 際、det M = Jを考えることで初めて構造的に導出される代表的事例が多重積分の変数変換の応用であり、 ∫+∞ −∞ e−x 2 dx(ガウス積分)やn次元球の体積の導出などであり、J の導入で一気に解決されるのである(別稿『恐るべし、数学技術―ガウス積分とバーゼル問題』、『N次元超球体積はヤコビアン、曲面積は平行四辺形』 参照)。 2.デカルトの葉線 話しが抽象化したので、具体的事例をあげて述べよう。 f : R2 → R、f(x, y) = x3 + y3 − 3axy はどのような形をしているのだ ろうか。f = 0, つまり、 x3+ y3− 3axy = 0の解の集合(零点集合)は、下図のような形をしており、デカルトの葉線と呼ばれている。
x
3+y
3-3axy=0
x
y
o
直線x+y+a=0に漸近し、
原点で交叉する美しい形をしている。
X+Y+a=0
(注)デカルトの葉線は、tを媒介変数として、 x = 3at 1 + t3, y = 3at2 1 + t3(a > 0) で表すことができる。本稿では、多変数の一般論の初歩を展開してそれに基づいて、f(x, y) = x3+y3−3axy の極値(点)や特異点などを示そう。 3.多変数解析学の初歩 いま、n次元空間Rnの開集合Sからm次元空間Rmへの写像 f(x) = (f1(x), f2(x), · · · , fm(x))(x = (x1, x2, · · · , xn)) が与えられたとする。各関数fk(x)が集合Sで微分可能なとき、写像f は集合Sで微分可能であるという。 f : S ⊂ Rn――――>Rm (x1, · · · , xn)――>(y1, · · · , ym) また、各関数fk(x)が集合S でC1−関数(導関数が連続)であるとき、写像f を集合S上のC1−写像 (C1級の写像)という。微分可能な写像f(x) = (f1(x), f2(x), · · · , fm(x))が与えられたとき、n × m個の偏 導関数∂fk ∂xj(1 5 k 5 m, 1 5 j 5 n) がつくられる。このn × m個の偏導関数を組み合わせて、(m, n)行列 Df = ∂f1 ∂x1 ∂f1 ∂x2 · · · ∂f1 ∂xn ∂f2 ∂x1 ∂f2 ∂x2 · · · ∂f2 ∂xn · · · · · · · · · · · · ∂fm ∂x1 ∂fm ∂x2 · · · ∂fm ∂xn をつくり、この行列を写像f のJacobi(ヤコービ)行列という。 写像f のJacobi行列Df の各成分の点a ∈ Sにおいて取る値を考える。この行列を M = Df(a) = (∂f∂xk j(a)) = (αkj) とすると、微分可能な写像f のk番目の成分fk(x)に対して fk(a + h) − fk(a) = n ∑ j=1 αkjhj+ ηk とかける。ただし、lim|ηk| ||h|| = 0である。したがって f(a + h) − f(a) = Mh + η と表せる。ただし、η =t(η1, η2,· · · , ηm)であり、 lim||h||→0||η||||h|| = 0 である。
特に、n = mのときは、Jacobi行列Df = Mはn次正方行列であるが、その行列式detM = det(Df)が 考えられる。この行列式 detM = ¯¯ ¯¯ ¯¯ ¯¯ ∂f1 ∂x1 · · · ∂f1 ∂xn · · · · · · · · · ∂fn ∂x1 · · · ∂fn ∂xn ¯¯ ¯¯ ¯¯ ¯¯= ∂(f1, · · · , fn) ∂(x1, · · · , xn) を写像fのヤコビアン(Jacobian)という。 [例1]平面極座標 直交座標を持つx − y平面R2において、点P=(x, y)を表すのに、原点Oと点P の間の距離r = OP と 線分{ OP とx軸のなす角θが与えられると、 x = r cos θ y = r sin θ と表せる。ここで、r = 0, 0 5 θ < 2πである。この式は、R2の部分集合 [0、+∞)×[0、2π) ={(r, θ) ∈ R2:: 0 5 r, 0 5 r < 2π}から平面R2への写像gと考えられる。このと き、Jacobi行列は Dg = [ cos θ − r sin θ sin θ r cos θ ]
である。したがって、ヤコビアンは、 J(g) =∂(x, y)∂(r, θ) = r [例2]立体極座標 直交座標を持つ空間R3において、点P = (x, y, z)と原点Oの間の距離r = OP と、線分OP とz軸のなす 角度θ,および点Pの(x, y)平面への正射影をP ´とするとき線分OP ´とx軸のなす角度ϕが与えられると、 x = r sin θ cos ϕ y = r sin θ sin ϕ z = r cos θ により、点P = (x, y, z)は表される。
x
y
z
p
P’
o
θ
φ
立体極座標
これをr − θ − ϕ空間からx − y − z空間への写像gと考えると、 Dg = sin θ cos ϕ r cos θ cos ϕ −r sin θ sin ϕ sin θ sin ϕ r cos θ sin ϕ r sin θ cos ϕ
cos θ −r sin θ 0 ヤコビアンに関しては、
J(g) =∂(x, y, z)∂(r, θ, ϕ) = sin θ cos ϕ(r2sin2θ cos ϕ) + sin θ sin ϕ(r2sin2θ sin ϕ)
+cos θ(r2sin θ cos θ cos2ϕ + r2sin θ cos θ sin2ϕ)
= r2sin θ *極値 次に写像f = f(x, y)の極値を考えよう。 f(x) = k−1 ∑ ν=0 f(ν)(0) ν! xν+ R (R = 1 k!f(k)(θx)xk)(θ ∈ (0, 1)
なるマクローリン展開を前提として、多変数関数のテイラー展開 を考える。2変数関数の場合を考える。平 面R2の開部分集合S上のCn−関数f(x, y)を考える。(a, b) ∈ Sとする。(a + h, b + k) ∈ Sとなるとき、 値f(a + h, b + k)を考えるのが問題である。t ∈ [0, 1]に対して Φ(t) = f(a + th, b + tk) とおくと、Φは区間[0,1]上のCn−関数であり、Φ(0) = f(a, b), Φ(1) = f(a + h, b + k)となる。 dΦ dt = fx(a + th, b + tk)h + fy(a + th, b + tk)k であるから、 d2Φ dt2 = fxx・h2+ 2fxy・hk + fyy・k2 を得る。以下、帰納的に dνΦ dtν = (h ∂ ∂x + k ∂ ∂y)νf・・・(*) が成立することがわかる。ただし右辺は、 (h∂x∂ + k∂y∂ )ν =∑ν j=0 ( ν j ) hν−jkj ∂ν (∂x)ν−j(∂y)j と形式的に分解する。上記マクローリン展開により、 Φ(t) =∑n−1ν=1 ν!1 ddtνΦν (0)tν+ R この式に(*)を代入してt = 1とおくと、 f(a + h, b + k) =∑n−1ν=0 ν!1 [ (h∂x∂ + k∂y∂ )νf ] (a, b) + R この式を第3項まで具体的に書くと
f(a + h, b + k) = f(a, b) + (fx(a, b)h + fy(a, b)k)
+2!1 {fxx(a, b)h2+ 2fxy(a, b)hk + fyy(a, b)k2}+ · · · + R
となっている。この式をgrad f = (fx, fy)およびHesse行列Hf を使って書くと、 Hf = [ fxx fxy fyx fyy ] であり、 f(x + h, y + k) = f(x, y) + (grad f) ( h k ) +1 2(h, k)Hf ( h k ) + · · · + R・・・(*) となる。線型代数の表記により、 (h, k)Hf ( h k ) = (h, k) [ fxx fxy fyx fyy ] ( h k ) であることに注意。なお、Rは||h||が十分小さいとき、前の3項と比較すると無視できるほど小さい。 なお、上記(*)をn変数関数の場合に拡張しておこう。 fを開集合S ⊂ Rn上のC3関数とする。 x ∈ (x1, · · · , xn) ∈ Sおよびh = (h1, · · · , hn) ∈ Rnとするとき、 f(x + h) = f(x) + (grad f, h) +12Hf[h] + R
ここで、(grad f, h)は通常の内積を表し、 Hf[h] =thHfh =∑nj=1 ∑n i=1fxjxihjhi = [h1h2 hn] f11 f12 · · · f1n f21 f22 · · · f2n · · · · · · · · · · · · fn1 fn2 · · · fnn h1 h2 ... hn 点aが微分可能な関数f の極大値点あるいは極小値点ならば、
grad f(a) = (fx(a, b), fy(a, b)) = 0
である。これは極値点であることの必要条件である。 さて、関数f はC3級であるとすると、grad(a) = 0のとき、 B = Hf(a)とおくと、 f(a + h) = f(a) +12B [h] + R ただし、B [h] =thHfh = fxxh2+ 2fxyhk + fyyk2 である。このとき (a) grad(a) = 0であり、任意のh ̸= 0に対して B [h] > 0 ならば、点aは関数f の極小値である。 (b) grad(a) = 0であり、任意のh ̸= 0に対して B [h] < 0 ならば、点aは関数f の極大値である。 という判定法が成立する。 *特異点、通常点 f : R2→ R に対して
(1)f(a, b) = 0, grad f(a, b) = (fx(a, b), fy(a, b)) ̸= (0, 0)
となるような点(a, b)を零点集合f(x, y) = 0の通常点という。
(2)f(a, b) = 0, grad f(a, b) = (fx(a, b), fy(a, b)) = (0, 0)
となるような点(a, b)を零点集合f(x, y) = 0の特異点という。 特異点(a, b)の近傍におけるf(x, y) = 0の様子はそれぞれの場合に応じて調べなければならない。特異点 の近傍におけるf(x, y) = 0の様子でいろいろな名前がつけられている(孤立点、交叉点等)。 4.再びデカルト葉線 3の内容をf(x, y) = x3+ y3− 3axy(a > 0)に適用してみよう。 (1)極値
であるから、grad f = 0より、(x, y) = (0, 0)または(a, a)を得る。 Hesse行列Bは、 B = [ fxx fxy fyx fyy ] であり、 fxx= ∂x∂ (3x2− 3ay) = 6x
fxy= ∂y∂ (3x2− 3ay) = −3a
fyx= −3a fyy = 6y であるから B = [ 6x −3a −3a 6y ] となる。これより、 *x = y = 0のとき、 B = [ 0 −3a −3a 0 ] であるから、 (h, k)B ( h k ) = fxxh2+ 2fxyhk + fyyk2 = −6ahk となり、(h, k)の取り方により、B [h]は正にも負にもなる。したがって、(0, 0)は極値点ではない。 *x = y = aのとき B = [ 6a −3a −3a 6a ] であるから (h, k)B ( h k )
= 6ah2+ 2(−3a)hk + 6ak2
= 6a(h2− hk + k2) であり、(h, k) ̸= (0, 0)ならば、B ( h k ) > 0である。 すなわち、点(a, a)はf の極小値点であり、f(a, a) = −a2はfの極小値である。 (2)特異点 fx= 3x2− 3ay fy = 3y2− 3ax 条件(fx,fy) = (0, 0)より、 x = y = 0またはx = y = aを得る。 f(0, 0) = 0であるから点(0, 0)はf(x, y) = 0の特異点である。一方、f(a, a) = −a2だから、 f(x, y) = 0の特異点は、(0, 0)のみである。 (3)デカルト葉線で囲まれる面積 次に、少々、多変数関数論の趣旨とは異なるが、デカルトの葉線で囲まれる図の面積をみてみよう。以下の 2つの図の面積を考えてみる。 (1).第1象限の部分の図の面積
(2).第2象限、第4象限とx + y + a = 0で囲まれる部分の面積 興味深いことに、(1)と(2)の面積は等しいことが知られている。以下、これを証明しよう。 一般に極座標で、曲線r = f(θ)と2直線θ = α, θ = β(α 5 β)で囲まれた図形の面積Sは、 S =12 ∫ β α r 2dr =1 2 ∫ β α {f(θ)} 2dθ となることが成り立つ。 (1)の面積 x = r cos θ, y = r sin θとおくと r3cos3θ + r3sin3θ − 3ar2cos θ sin θ = 0
r = 3a sin θ cos θ cos3θ + sin3θ より、 S =12 ∫ π/2 0 ( 3a sin θ cos θ cos3θ + sin3θ)2dθ =3a2 2 ∫ π/2 0 (1 + tan3θ)´ (1 + tan3θ)2dθ =3a22 [ − 1 1 + tan3θ ]π/2 0 =3a22(θ → π2 のとき、 1 1 + tan3θ → 0) (d tan θ dθ = sec2θ = 1 cos2θ に注意せよ) (2)の面積 S = 2 × ∫ π 3 4π { 1 2( −a cos θ + sin θ)2− 1 2( 3a sin θ cos θ cos3θ + sin3θ)2 } dθ + a22 = a2∫ π 3 4π {
(cos θ + sin θ1 )2− ( 9 sin θ cos θ
cos3θ + sin3θ)2 } dθ +a22 = a2 ∫ π 3 4π { 1 (cos θ + sin θ)2− 9 sin2θ cos2θ (cos3θ + sin3θ)2 } dθ +a22 = a2 ∫ π 3 4π { 1 cos2θ(1 + tan θ)2 − 9 sin2θ cos2θ cos6θ(1 + tan3θ)2 } dθ +a22 ここで、t = tan θ とおくと、dt dθ = 1 cos2θ より、
= a2∫ π 3 4π { 1 cos2θ(1 + tan θ)2 − 9 sin2θ cos2θ cos6θ(1 + tan3θ)2 } cos2θdt +a2 2 = a2∫ 0 −1 { 1 (1 + tan θ)2 − 9 tan2θ (1 + tan3θ)2 } dt +a22 = a2∫ 0 −1 { 1 (1 + t)2− 9t2 (1 + t3)2 } dt +a2 2 = a2 [ − 1 1 + t+ 3 1 + t3 ]0 −1 +a2 2 = a2 [ −(1 + t)(1 − t + t(t + 1)(t − 2)2) ]0 −1+ a2 2 =32a2 よって、図形(1)と(2)の面積は等しい。 5.陰関数定理 次に多変数解析の初歩としてよく出てくる陰関数定理について述べる。まず、R2→ Rについて述べたあと Rn→ Rmに一般化する。 【陰関数定理】開集合S ⊂ R2上のC1−関数f が与えられたとする。f(a, b) = 0であるとする。このと き、fy(a, b) ̸= 0ならば、点a ∈ Rの近傍Gで定義された関数ϕ(x)で、次の条件を満たすものが存在する。 (1)ϕ(a) = b (2)点(a, b) ∈ Sの近傍U を適当にとると、任意のx ∈ Gに対して、f(x, ϕ(x)) = 0である。 (3)ϕ(x)はC1−関数であり、導関数に関して、x ∈ Gのとき dϕ dx = −fx/fy= −fx(x, ϕ(x))/fy(x, ϕ(x)) [証明]fy(a, b) > 0であると仮定する。偏導関数fyの連続性より、点(a, b)の近傍U(⊂ S)があり、任意の (x, y) ∈ Uに対して、 fy(x, y) > 0 となる。このことは、xを固定すると、関数f はyの関数として狭義単調増大であることを示している。
特に、f(a, b) = 0であるから、x = aと固定して考えると、f(a, c) < 0およびf(a, d) > 0となるような点
(a, c) ∈ Uおよび(a, d) ∈ Uが存在する。関数f(x, c)およびf(x, d)は、xの関数として連続関数であるか ら、点a ∈ Rの近傍G = (a1, a2)が存在して、x ∈ Gのとき、f(x, c) < 0, f(x, d) > 0となる。x ∈ Gを固 定すると、f(x, y)はyに関して単調増大な連続関数だから、中間値の定理より、f(x, y) = 0となるような 点y ∈ (c, d)がただ一つ存在する。この点yをy = ϕ(x)と書くと、明らかに、f(x, ϕ(x)) = 0であり、また ϕ(a) = bである。 次に、xおよびx + h ∈ Gであるとする。さて、ϕ(x) = yおよびϕ(x + h) = y + kと書くと、 f(x + h, y + k) − f(x, y) = 0である。一方、平均値の定理 により、あるθ ∈ (0, 1)があり、 0 = fx(x + θh, y + θk)h + fy(x + θh, y + θk)k を得る。この式は、fy ̸= 0であるから、h → 0のときk → 0であることを示している。一方、 1 h(ϕ(x + h) − ϕ(x)) = k h = −fx(x + θh, y + θk)/fy(x + θh, y + θk) であるから、偏導関数の連続性を使えば、(3)が成立する。¥
このようにして得られた関数y = ϕ(x)を条件f(x, y) = 0から得られる陰関数という。 次に陰関数定理を一般次元に拡張しよう。簡単のために、少し記号を変える。 集合T は、(r + m)次元空間Rr+mの開部分集合とし、Tの点を一般に (x, y) = (x1, · · · , xr, y1, · · · , ym) と表す。集合T からm次元空間Rmの中へのC1−写像f が f(x, y) = (f1(x, y), · · · , fm(x, y)) によって与えられたとする。仮定により、各関数fjは微分可能であり、その偏導関数は連続である。この 写像f の零点集合Nf は、Nf= {(x, y) ∈ T : f(x, y) = 0} 【陰関数定理(多変数版)】写像f は前記の通りとし、(a, b) ∈ Nf であるとする。行列 M = ∂f1 ∂y1 · · · ∂f1 ∂ym · · · · · · · · · ∂fm ∂y1 · · · ∂fm ∂ym ((x, y) = (a, b)) が正則行列、すなわち、det M ̸= 0を満たすならば、点aのRrにおける近傍A,点bのRmにおける近傍 B,およびAからBへのC1−写像ϕが存在し、A × B ⊂ T であり、さらに、 Nf∩ (A × B) =Γϕ が成立する。ただし、Γϕは写像ϕのグラフ{(x, ϕ(x) : x ∈ A}である。さらに、この写像ϕのJacobi行 列Dϕに関して Dϕ(x) = −M(x, y)−1・ ∂f1 ∂y1 · · · ∂f1 ∂yr · · · · · · · · · ∂fm ∂y1 · · · ∂fm ∂yr が成立する。ただし、x ∈ Aである。¥ この定理の意味は、点(a, b)が方程式 f1(x, y) = f2(x, y) = · · · = fm(a, b) = 0 を満たすとき、定理の条件が成立しているならば、この方程式が y1= ϕ1(x) = ϕ1(x1, · · · xr) · · · · ym= ϕm(x) = ϕm(x1, · · · xr) という形に、点aの近傍で解けるということである。 [証明]証明は煩雑だが、本質的に2変数の場合と同様なので概略を述べる。アイデアは、R2→ Rの場合と 同様に平均値の定理を用いる。 上記の文脈で得られた ϕがC1−写像であることを示す。x, x + h ∈ Aに対して、y = ϕ(x),および ϕ(x + h) = y + kとおくと、 fj(x + h, y + k) − fj(x, y) = 0 となっている。この式の左辺に平均値の定理を使うと、 r ∑ α=1 hα∂x∂fj α(x + θjh, y + θjk) + m ∑ β=1 kβ∂y∂fj β(x + θjh, y + θjk) = 0 (1 5 j 5 m)
となるθjが存在することがわかる。上記の式は以下のように書ける。 ∂f1 ∂y1 · · · ∂f1 ∂yr · · · · · · · · · ∂fm ∂y1 · · · ∂fm ∂yr h1 ... hr + M k1 ... km = 0 この式より、 k1 ... km = −M−1 ∂f1 ∂y1 · · · ∂f1 ∂yr · · · · · · · · · ∂fm ∂y1 · · · ∂fm ∂yr h1 ... hr と書け、結果の式を得る。¥ *本稿の執筆に際しては、以下を参考とした。 ・解析学入門(田坂隆士、秀潤社) ・解析入門(杉浦光夫、東京大学出版会) ・解析概論(高木貞治、岩波書店)