5
多変数関数の微分 (教科書5章)
多変数関数の場合、微分の概念には2つの種類がある。偏微分(partial differentiation)と全微分(または単に 微分: (total) differentiation)である。偏微分は1変数の微分と実質的には同じことで、定義域上での特定の方 向への微分を指す。これに対し、(全)微分は関数があらゆる方向に滑らかに変化していることに対応する概念で ある。このように互いに異なる概念ではあるけれども、両者の間には密接な関係がある。5.1
偏微分 (教科書 5章§1)
関数 z = f (x, y) について、点 (a, b) で: A = lim h→0 f (a + h, b)− f(a, b) h . . . (♡) という極限値が存在するとき、「f (x, y) は点 (a, b) で x 方向に偏微分可能である」といい、極限値 A を「点 (a, b) における x 方向の偏微係数」と呼ぶ。(a, b) を (x, y) と書き直し、(x, y) を f の定義域内で偏微係数が存在する すべての点にわたって動かすと、x, y を変数とする関数ができる。これを「f (x, y) の x 方向の(あるいは x に よる)偏導関数 (paritial derivative)」と呼ぶ。 y 方向への偏微分も同様に考えることができる。それには上の (♡) の代わりに: B = lim h→0 f (a, b + h)− f(a, b) h . . . (♡ ′) という極限を出発点に考え、上で「x 方向の」や「x による」の x を y に置き換えればよい。 • 注: 偏微分に対し、これまで扱ってきた1変数関数の微分を「常微分 (ordinary differentiation)」と 呼ぶ。z = f (x, y)の偏導関数は下のような表し方がある。順に Lagrange, Leibniz, Cauchy によるもので、常微分の
記法の拡張になっている。 • zx, fx, fx(x, y), zy, fy, fy(x, y) (常微分の z′, f′(x) に相当) • ∂z ∂x, ∂f ∂x, ∂z ∂y, ∂f ∂y (常微分の dy dx, df dx に相当) • Dxz, Dxf, Dyz, Dyf (常微分の Df に相当) 点 (a, b) での偏微係数は fx(a, b), ∂f ∂x ¯¯ ¯¯ x=a,y=b あるいは ∂f ∂x ¯¯ ¯¯ (x,y)=(a,b) fy(a, b), ∂f ∂y ¯¯ ¯¯ x=a,y=b あるいは ∂f ∂y ¯¯ ¯¯ (x,y)=(a,b) などのように表せる。 • 注 • 微分記号にある “∂” はアルファベットの D の異体字である(ドイツ文字あたりと関連する?)。読み方は 一定していないが、普通は単に「ディー」と読むようである。常微分の dx と ∂x とを区別する場合にはい ろいろな流儀があり、たとえば「デールント」というのがある。これはドイツ語の rund(丸い)につなげ てのことらしく、「丸っこいディー」といった意味だろう。もっともこれは日本だけで通用する方言という説 もある。英語では ∂f
5.1.1 偏微分の意味 z = f (x, y) で y を y = b に固定したもの、つまり f の x 方向への断面は、x だけを変数とする1変数関数と 考えることができる: g(x)≡ f(x, b) 左辺の g がその1変数関数につけた名前である。これを使えば、「x 方向への偏微係数」を定義した (♡) は: A = lim h→0 g(a + h)− g(a) h となる。右辺の極限が存在すれば、g(x) の点 a での微係数に他ならない。つまり A = g′(a) = fx(a, b) . . . (♠) である。 g′(a)は点 a における g(x) の接線の傾きだった。g(x) は y = b における f (x, y) の断面だから、fx(a, b)はそ の断面への接線の傾きということになる。この接線をそのまま、「f (x, y) の点 (a, b) における x 方向への接線」 と定義してしまおう。したがってこの接線は:
z− f(a, b) = fx(a, b)(x− a), y = b
という連立方程式で表せる。パラメタ表示による直線の方程式では: x y z = a b f (a, b) + 1 0 fx(a, b) t となる。同様にして、「点 (a, b) での y 方向への接線」は
z− f(a, b) = fy(a, b)(y− b), x = a あるいは
x y z = a b f (a, b) + 0 1 fy(a, b) s と表せる。 (♠) に戻って、これから g′(x) = fx(x, b) つまり fx(x, b)は断面の導関数であり、各点 x での x 方向への増減の度合い(=接線の傾き)を表すこと、した がって b を変数 y に戻せば、偏導関数 fx(x, y)は f (x, y) の各点 (x, y) での x 方向への増減の度合いを表すこと がわかる。fy(x, y)についても同様である。x 方向、y 方向といった特定の方向への増減を表しているというのが 「偏微分」、つまり「偏(かたよ)った微分」という名前の由来である。 • 任意の方向への偏微分 上を拡張して、任意の方向への偏微分を考えることができる。(♡), (♡′)は点 (a, b) に対し、それぞれ x 軸、y 軸に平行な方向から近づくものであった。 点 (a, b) を通り、x 軸と θ の角をなす直線は { x = a + h cos θ y = b + h sin θ (h∈ R) と表せる。そこで点 (a, b) での θ 方向への偏微係数は lim h→0
f (a + h cos θ, b + h sin θ)− f(a, b)
h
として表せる(なお、この「θ 方向」という言い方を使えば、上で x 方向と言ったのは 0 方向、y 方向は π2 方向
と言い直せる)。これは θ 方向への偏導関数に自然に拡張できる。
5.1.2 偏微分の計算 偏微分の計算は最終的には (♡), (♡′)の極限の計算に帰着される。偏導関数はこれをすべての点 (x, y) に当て はめてえられる。 しかし実際の計算ではいちいち極限計算をしていては煩雑になるばかりであり、微分公式が利用される。 fx(x, y) = lim ∆x→0 f (x + ∆x, y)− f(x, y) ∆x は上で見たように、x 方向への断面の導関数を計算しており、極限計算の中では y は一定に保たれる。したがっ て x 方向への偏微分を計算するには、 「f (x, y) の y を定数と見なし、x だけを変数とする関数として(常)微分すればよい」 という計算方法をとればよい。y 方向についても同様である。つまり偏微分の計算は、常微分の計算方法に帰着さ れる。加減乗除や合成関数の微分公式などもそのまま使える。 なお以下で (...)xはカッコ内の x による偏微分、(...)y は y による偏微分を表す。 • 例 • f(x, y) = xy y を定数とみなせば x の1次式だから、fx(x, y) = y· (x)x= y xを定数とみなせば y の1次式だから、fy(x, y) = x· (y)y= x • f(x, y) = x2y2− 3xy2+ x2− y + 2 fx(x, y) = y2(x2)x− 3y2(x)x+ (x2)x+ (−y + 2)x= 2xy2− 3y2+ 2x
fy(x, y) = x2(y2)y− 3x(y2)y− (y)y+ (x2+ 2)y = 2x2y− 6xy − 1
• f(x, y) = sin(2x + 3y) fx(x, y) = 2 sin(2x + 3y)
fy(x, y) = 3 sin(2x + 3y)
• f(x, y) = (sin x + ey)(cos y + ex)
fx(x, y) = (sin x + ey)x(cos y + ex) + (sin x + ey)(cos y + ex)x= cos x(cos y + ex) + (sin x + ey)ex
fy(x, y) = (sin x + ey)y(cos y + ex) + (sin x + ey)(cos y + ex)y= ey(cos y + ex)− (sin x + ey) sin y
• f(x, y) = xy fx(x, y) = yxy−1 fy(x, y) = xylog x f (x, y)が特殊な形をしている場合として以下のようなものがある。 • f(x, y) = g(x) + h(y)、つまり f(x, y) が x だけの関数と y だけの関数の和として表せる。 fx(x, y) = g′(x) fy(x, y) = h′(y) つまり fxは x だけの関数、fy は y だけの関数になる。 さらに h(y)≡ 0、つまり f(x, y) 自身が x だけの関数の場合、 fy(x, y) = h′(y) = 0 になる。これは関数値が y 方向には変化しないということである。g(x) ≡ 0 の場合も同様。なおこれは h(y)≡ c という定数関数とした場合でも同様だが、定数については g(x) のほうに含めてしまえるので実質 的な違いはない。 • f(x, y) = g(x)h(y)、つまり x だけの関数と y だけの関数の積。 fx(x, y) = g′(x)h(y) fy(x, y) = g(x)h′(y)
• f(x, y) = f(y, x)、つまり関数が x, y について対称な場合。 このときは fx(x, y)の x と y を入れ替えれば fy(x, y)が得られる。これは ∂f (x, y) ∂x = ∂f (y, x) ∂x の右辺で x と y の名前を入れ替えれば ∂f (x, y) ∂y となることによる。 • 例: f(x, y) = x2y + xy2の場合、 fx(x, y) = 2xy + y2 この x と y を入れ替えた 2xy + x2が f y(x, y)になる。 • f(x, y) = g(x + y)、つまり f(x, y) が x + y についての1変数関数と見なせる場合。 fx(x, y) = fy(x, y) = g′(x + y) このとき f (x, y) は直線 x + y = t に沿って同じ値をとり、fx と fy は常に一致する。 もう少し一般化して f (x, y) = g(ax + by + c) の場合は fx(x, y) = ag′(ax + by + c) fy(x, y) = bg′(ax + by + c) となる。つまり常に fx : fy = a : bになる。 さらに一般化して f (x, y) = g(h(x, y)) の場合は: fx(x, y) = hx(x, y)g′(h(x, y)) fy(x, y) = hy(x, y)g′(h(x, y)) ここで h(x, y) = t というのは f (x, y) の等高線だから、上は「f (x, y) の偏微分は等高線及びそれに沿って の微分で表せる」ということに相当する。 • 例: f(x, y) = (xy)2+ 2(xy) のとき、 h(x, y) = xy g(t) = t2+ 2t とすれば f (x, y) = g(h(x, y)) となる。このとき: fx(x, y) = y· (2t + 2) = 2y(xy + 1) fy(x, y) = x· (2t + 2) = 2x(xy + 1) 直接計算して上が成り立つことを確かめよ。 f (x, y) が単一の数式で定義されていない場合、境界になる点では定義式 (♡), (♡′) に戻って計算する必要が ある。 • 例 f (x, y) = xy x2+ y2 ((x, y)̸= (0, 0)) 0 ((x, y) = (0, 0)) の場合、原点以外の点では fx(x, y) = y(y2− x2) (x2+ y2)2 fy(x, y) = x(x2− y2) (x2+ y2)2 となる。原点では: fx(0, 0) = lim h→0 f (h, 0)− f(0, 0) h = limh→0 0− 0 h = 0 fy(0, 0) = lim h→0 f (0, h)− f(0, 0) h = limh→0 0− 0 h = 0 である。したがってこの関数はすべての点 (x, y)∈ R で x 方向、y 方向に偏微分可能である。しかし次で見るよ うに、原点ではこれ以外の方向には偏微分できない(それどころか、原点では連続でさえない)。
5.1.3 偏微分可能性 (♡), (♡′)の極限値が存在しなければ、その点では f (x, y) は偏微分できない、つまり偏微分不能である。偏微 分できるかどうかは、上のように断面の1変数関数の微分可能性に帰着される。 x方向に偏微分できることと y 方向に偏微分できること、もう少し一般的に言えば、異なる2つの方向への偏 微分可能性は互いに無関係である。 • ごく簡単な例として、 f (x, y) = { 1 (x≥ 0) 0 (x < 0) を考えてみよう。これは y には依存せず、x だけで決まる関数で、y 軸より右側では 1、左側では 0 の値を とり、y 軸上で不連続である。ちょうど y 軸に沿って「崖」があると思えばよい。 y には依存しないから、任意の (x, y) について fy(x, y) = 0 で偏微分可能である。一方、x 方向では x = 0 が不連続点だから、このとき偏微分不能である。実は y 方 向以外のすべての方向について、偏微分不能(正確に言えば、偏微分不能な点があるということ)である。 これを地形にたとえて言えば、y 軸に平行な方向にはいくらでも進めるが、それ以外の方向では必ず崖に突 き当たる(崖の上側にいれば下に落ちる)ことになる。 • 上は不連続点のある関数の場合だったが、すべての点について連続な例として: f (x, y) =|x| + y を考えると、x 方向への断面は|x|+b の形をしているから x = 0 のときは微分できない。したがって fx(x, y) は x = 0 では存在しない。一方、y 方向への断面は y + a の形をしているからすべての y について微分で きる、したがって fy(x, y)はすべての (x, y) について存在する。特に y 軸上では、f (x, y) はすべての点に おいて x 方向には偏微分不能、y 方向には偏微分可能である。 念のため:この関数は2つの(半)平面: z = x + y (x≥ 0) z =−x + y (x ≤ 0) をつないだ形のグラフを持ち、2つの平面は y 軸上、z = y という直線で交わっている。この交線のところ で折れ曲がっているのが x で偏微分できない理由である。 • f(x, y) = √3xg(y)(ただし g(y) はすべての y について微分可能) fy(x, y) = 3 √ xg′(y) で、これはすべての (x, y) について存在する。一方 fx のほうは形式的に書くと: fx(x, y) = g(y) 3 √ x2 になる。ここで g(y)̸= 0 なら上は x = 0 のとき存在しない(分母が 0 になる)。一方、g(y) = 0 である y に対しては f (x, y) = 0 になるから、fx(x, y) = 0となる。 つまりこの関数は、(0, g(y))(ただし g(y)̸= 0)という点では x 方向に偏微分不能、他のすべての点で偏微 分可能である。 f (x, y) =|x|g(y) などとしても同様の結果になる。 次に、x, y の両方向に偏微分できても、他の方向に偏微分できるとは限らないことを見ておこう。 • f (x, y) = { 0 (x = 0または y = 0、つまり xy = 0) 1 (それ以外、つまり xy̸= 0) とする。つまり z = 1 という平面から、x 軸、y 軸だけが陥没したような形である。このとき明らかに: fx(0, 0) = fy(0, 0) = 0 つまり原点では x, y 両方向に偏微分できる。ところが他のすべての方向には偏微分不能である。x 軸、y 軸 上以外では関数は原点で不連続だからである。たとえて言えば、x, y 軸に沿って進めば(陥没した谷底に沿っ
て)原点にたどりつくことができるが、他のどんな出発点からでも、崖を落下しなければ原点にはたどりつ けない。 なおこの関数の場合、x 軸上では原点以外は fy は存在せず、y 軸上では原点以外は fxは存在しない。 • 前掲の関数: f (x, y) = xy x2+ y2 ((x, y)̸= (0, 0)) 0 ((x, y) = (0, 0)) はすでに見たように、すべての (x, y) で fx, fy が存在する。しかし原点では他の方向には偏微分できない。 実際、直線 y = mx (m̸= 0) 上の原点以外の点では: f (x, y) = xy x2+ y2 = mx2 (1 + m2)x2 = m 1 + m2 ̸= 0 という定数になって、原点で不連続になるからである(下左図:これはすでに授業でも配った)。 • 上の関数はまだ原点で不連続だった。そこでさらに: f (x, y) = x2y2 (x2+ y2)32 ((x, y)̸= (0, 0)) 0 ((x, y) = (0, 0)) としてみよう(下右図)。するとこれはすべての (x, y) について連続である。実際、これを極座標で表すと: f (x, y) = x 2y2 (x2+ y2)32 = r cos 2θ sin2θ となって、r→ 0 のとき r cos2θ sin2θ→ 0 であり、原点も含めて連続になるからである。
しかし x, y 方向以外にはやはり偏微分できない。cos θ̸= 0, sin θ ̸= 0 のとき、r cos2θ sin2θは原点で折線 になるからである。これを直接確かめるには、y = mx という直線上では f (x, y) = x 2y2 (x2+ y2)32 = m 2x4 (1 + m2)32|x|3 = m 2 (1 + m2)32|x| となることを見ればよい。最後の|x| が x = 0 のとき偏微分できない理由である。 −2 −1 0 1 2 −2 −1 0 1 2 −0.5 0 0.5 −2 −1 0 1 2 −2 −1 0 1 2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
5.2
微分(全微分) (教科書記載なし)
注: 微分・微分形式の扱いと応用については 5.10 に記す。 5.2.1 1変数関数の微分 2変数の全微分に進む前に、1変数の微分を復習しておこう。微分の本質は、「関数が注目している点の近傍で は1次式(=直線、実は接線)で近似できる」という点にある。厳密には、 ∆y ∆x = A + ε (ただし ∆y = f (x0+ ∆x)− f(x0)) とすると、∆x→ 0 のとき ε → 0 であることが微分できる条件であり、このとき A = f′(x0)となるのだった。こ れを書き直すと ∆y = A∆x + ε∆x = f′(x0)∆x + ε∆xであり、ε∆x の部分を無視すれば (∆x, ∆y) 座標系での直線の方程式になる。これを (x, y) を原点とする (dx, dy) 座標系を使って表すと: dy = f′(x)dx となる。これが接線の方程式であり、dx を x の微分、dy を y の微分と呼んだ。 5.2.2 2変数関数の微分(全微分) 2変数関数の場合にも上と同様に、 「注目している点の近傍では関数を1次式で近似できる」 という形で(全)微分可能性を考えてみよう。今度は変数が2つあるので、上の式は ∆z = A∆x + B∆y + ερ という形で書ける。ただし ∆z = f (x0+ ∆x, y0+ ∆y)− f(x0, y0) ρ =√(∆x)2+ (∆y)2 ρ→ 0 のとき ε → 0 である。この際、「(x0+ ∆x, y0+ ∆y)がどのような近づき方で (x0, y0)に近づくのであっても上が成り立つ」こ とが重要なポイントである。このとき f (x, y) は(点 (x0, y0)で)(全)微分可能 であると言う。 上と同様に、(x0, y0, z0)(ただし z0= f (x0, y0))を原点とする (dx, dy, dz) 座標系をとると、 dz = Adx + Bdy は今度は平面の方程式になる。ここでも dx, dy, dz をそれぞれ x, y, z の 微分 と呼ぶ。これを (x, y, z) 座標系に戻 せば、(dx = x− x0 などを使って) z− z0= A(x− x0) + B(y− y0) となる。この平面を f (x, y) の点 (x0, y0, z0)における 接平面 と呼ぶ。 5.2.3 微分可能性→ 偏微分可能性 f (x, y)が点 (x0, y0)で微分可能としよう。 (x0+ ∆x, y0+ ∆y)が x 方向から (x0, y0)に近づく場合、∆y = 0, ρ =|∆x| になるから: ∆z = A∆x + ε|∆x| 両辺を ∆x で割れば: ∆z ∆x = A± ε になる(± は ∆x の符号によって決まる)。右辺は ∆x → 0 のとき ε → 0 だから、A に収束する。一方、左辺は 極限をとれば、(x0, y0)での x による偏微係数に他ならない。したがってこれから: • (x0, y0)で微分可能なら、x 方向に偏微分可能である。 • 微分の係数 A は fx(x0, y0)に他ならない。 ことの2点がわかる。同様にして、B = fy(x0, y0)になる。 次に任意の方向への偏微分を考える。θ 方向への偏微分では: ∆x = ρ cos θ ∆y = ρ sin θ となるから、微分の式は:
∆z = Aρ cos θ + Bρ sin θ + ερ
になる。両辺を ρ で割ると:
∆z
ρ = A cos θ + B sin θ + ε
右辺は ρ→ 0 のとき
A cos θ + B sin θ = fx(x0, y0) cos θ + fy(x0, y0) sin θ
に収束するから左辺も収束し、これが θ 方向への偏微分に他ならない。これから、微分可能なら任意の方向に偏
微分可能なこと、また偏微係数の値は fx, fy を使って上のように表せることの両方がわかる。
つまり、「(全)微分可能」というのは任意の方向に偏微分可能であるための十分条件である(しかし下に見る ように、必要条件ではない)。
• 補足 1: 1変数関数の場合は
∆y = A∆x + ε∆x つまり ∆y
∆x = A + ε において、∆x→ 0 とすれば右辺は特定の値(A = f′(x0))に収束した。ところが2変数関数の場合: ∆z = A∆x + B∆y + ερ の両辺を ρ で割った ∆z ρ = A ∆x ρ + B ∆y ρ + ε で ρ→ 0 としても左辺は特定の値に収束しない。上で見たように、0 への近づき方によって値が変わ るからである。しかし ∆z− A∆x − B∆y ρ は全体としては 0 に収束する。つまり ∆z, ∆x.∆y の値の組み合わせ方には制約がある。このように 特定の値には収束しないが値の組として一定の関係を持つ、というのが1変数関数に対する他変数関 数の特徴であり、それが「微分」dx, dy, dz の概念が前面に出てくる理由でもある。 逆に1変数の場合、「方向」と言っても1つしかないから、偏微分と全微分とは実質同じものになり、 区別されない。 • 補足 2: 「微分」というのは始めはわかりにくい概念である。ライプニッツは微分を「無限に小さい 量」として定義したが、批判者に論理的な欠陥を突かれた。現代の「超準解析」では「無限小量」に 別の厳密な定義を与えて復活させているが、ここでは「微分とは局所座標である」という立場をとっ ておくのが一番わかりやすいだろう。 あとは実際の計算をいろいろやっていくうちに身についてくる。 5.2.4 接平面と接線 (教科書 5.1.14, 5.1.15) 上の結果から、点 (x0, y0, z0= f (x0, y0))における接平面の方程式は z− z0= fx(x0, y0)(x− x0) + fy(x0, y0)(y− y0) と書き直せる。ここで先ほどの接線の話を思い出してみよう。(x0, y0, z0)での x 方向、y 方向の接線はそれぞれ: x y z = x0 y0 z0 + 1 0 fx(x0, y0) t x y z = x0 y0 z0 + 0 1 fy(x0, y0) s
と書けた。この2本の直線は1つの平面を決定し、パラメタ表示で: x y z = x0 y0 z0 + 1 0 fx(x0, y0) t + 0 1 fy(x0, y0) s と書ける。これは上の接平面の方程式と同じものである。実際、t = x− x0, s = y− y0とおいて成分ごとに見れ ば、x, y 成分については x = x, y = y となって恒等的に成り立ち、z 成分に上の接平面の方程式が現れる。 つまり、x, y 方向への接線は、接平面に含まれている。さらに任意の方向への接線も接平面に含まれていること を確かめることができる(練習)。逆に言えば、微分可能という条件は、「任意の方向への接線が存在し(=偏微 分が存在し)、しかもそれらはすべて接平面に含まれる」ことを意味する。 これから、任意の方向 θ への接線を求める2通りの方法が得られる。 • θ 方向の偏微分を計算し、直接的に接線の方程式を求める。 • 接平面を求め、θ 方向の射影をとる。 • 例: f(x, y) = xy とし、点 (1, 1) での θ = π/4 方向(つまり y = x の方向)への接線を求める。 • fx= y, fy= x だから、π/4 方向への偏微分は: 1· cosπ 4 + 1· sin π 4 = √ 2 2 + √ 2 2 = √ 2 したがって x = t cosπ 4 = t √ 2 y = t sinπ 4 = t √ 2 とすれば点 (1, 1) は t =√2の場合にあたり、接線の方程式は z− t 平面上で z− 1 =√2(t−√2) z =√2t− 1 となる。したがって (x, y, z) 座標では: x y z = 0 0 −1 + t/√2 t/√2 √ 2t = 0 0 −1 +√t 2 1 1 2 と表せる。 • 点 (1, 1) での接平面は、 z = x + y− 1 したがってこれと y = x を連立させたものが接線の方程式になる。ここで x = y = t/√2と置けば上と同じ 結果を得る。また x = y = t とすれば x y z = 0 0 −1 + 1 1 2 t となるが、t の縮尺を変えただけで実質的には同じことである。 このように、一般には後者の方法のほうが簡単に接線が求められることが多い。 5.2.5 勾配ベクトル 一般の平面の方程式は ax + by + cz + d = 0
と書ける。このとき、係数を成分とするベクトル:t(a b c) を平面の「法線ベクトル」と呼ぶ。法線ベクトルは 平面と直交する。つまり平面上の任意のベクトルと法線ベクトルとは直交する。実際、平面上の異なる2点を (x1, y1, z1), (x2, y2, z2)とすると、これらは平面上にあるから ax1+ by1+ cz1+ d = 0 ax2+ by2+ cz2+ d = 0 両辺を引いて a(x1− x2) + b(y1− y2) + c(z1− z2) = 0 これは 法線ベクトル a b c と平面上のベクトル x1− x2 y1− y2 z1− z2 との内積が 0 であること、つまり互いに直交することを示している。 接平面の方程式 z− z0= fx(x0, y0)(x− x0) + fy(x0, y0)(y− y0) では法線ベクトルは fx(x0, y0) fy(x0, y0) −1 ないし −fx(x0, y0) −fy(x0, y0) 1 である(接平面の上側を向くか、下側を向くかによって正負が変わる。上の左は下向き、右は上向きの法線ベク トルである)。左のほうを xy 平面に射影したもの、つまり z 成分を無視した: ( fx(x0, y0) fy(x0, y0) ) を「勾配ベクトル」と呼ぶ。このとき法線ベクトルは下向きだから、勾配ベクトルは接平面の上向きの傾斜が最 も急な方向を指す。したがってこれと正反対を向いたt(−fx(x0, y0) − fy(x0, y0))は下向きの傾斜が最も急な方向 を指す。接平面は関数 f (x, y) の局所的な近似になっているから、これらは局所的には関数が最も急に増加する方 向、減少する方向に対応する(ただし、勾配ベクトルがゼロベクトル (0 0) である場合には平面は傾きを持たな い。このような点を停留点と呼ぶ(5.3.2 参照))。 一方、勾配ベクトルと直交するベクトル: ( fy(x0, y0) −fx(x0, y0) ) は、接平面上では z の値が変わらない方向に対応する。実際、接平面上で x− x0= fy(x0, y0)t y− y0=−fx(x0, y0)t にとると、 z = z0+ fx(x0, y0)(x− x0) + fy(x0, y0)(y− y0) = z0+ fx(x0, y0)fy(x0, y0)t− fx(x0, y0)fy(x0, y0)t = z0 となって、z は定数になるからである。これは局所的にはこのベクトルが f (x, y) の値の変わらない方向を指して いること、すなわち等高線の接線の方向を向いていることを示している。 • 参考: これから等高線を作図する方法が導ける。高さ k の等高線は
f (x, y) = k を満たす (x, y) の集合だが、これを方程式として解いて y を x で表したりするのは一般には難しい。これに対 し、f (x, y), fx(x, y), fy(x, y)などは比較的簡単に計算できるから、 平面上の多数の点で関数値及び等高線の方 向を求め、それらを適当につないでやればフリーハンドでもかなりよい等高線図ができる。 あるいは次のようにしてもよい。高さ k の点を1つ求め、そこでの等高線の方向 (fy,−fx) も求める。近似的 には等高線はその方向の直線と一致するから、少し伸ばしたところで同じことを繰り返す。そのようにして等高 線を近似する折線を書いていくのである。このままだと誤差が積み重なるから、間で適当な修正を挟んでゆくと よい。これは本質的には一種の微分方程式を解いていることに相当する。 • 例 f(x, y) = x2+ y2 は放物線を原点の回りで回転した形をしており、等高線は原点を中心とする同心円になる。 ここで fx(x, y) = 2x fy(x, y) = 2y であり、したがって点 (x, y) での勾配ベクトルは (x y) で原点と結んだ直線の方向、等高線の方向は (y − x) で これと直交する方向である。したがって等高線は原点を結んだ直線と必ず直交している。それを細かくプロット していけば同心円の等高線図ができるし、等高線が円であることは「1点からの直線と直交する曲線は円である」 という幾何的知識を使えばそれからもわかる。 5.2.6 偏微分可能性 → 微分可能性 (1) 上では「微分可能なら任意の方向へ偏微分可能である」ことを見たが、逆の「任意の方向へ偏微分可能なら微 分可能である」は一般には成り立たない。たとえば (x, y) = (r cos θ, r sin θ) のとき、 f (x, y) = x sin 2θ で表される関数を考えてみよう(これは一応、 f (x, y) = x sin ( 2 tan−1 y x ) (x̸= 0) 0 (x = 0) と書くことができる)。これは θ を固定すれば原点を通る直線となり、したがって原点では任意の方向に偏微分可 能である。グラフを考えると、原点を通る直線を上下に波打たせながら回転したものに相当する(下図)。 −2 −1 0 1 2 −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 • 注: このように直線を動かして得られる曲面を「線織面」と呼ぶ。逆に言えば、曲面が線織面であれ ば、その上の任意の点を通り、曲面に完全に含まれる直線が存在する。この直線は曲面の接線の1つ である。 円錐面は線織面の例である(頂点から円錐の側面に沿って直線(側線)が引ける)。逆に球面などは線 織面ではない。
この関数で、x = 0 または y = 0 なら f (x, y) = 0 であり、したがって f (x, y) は x, y 軸を含む。したがって x 方向への接線は x 軸、y 方向への接線は y 軸になり、接平面が存在するなら、この2つの直線を含む平面である xy平面(z = 0 という平面)になる。ところが他のすべて接線は xy 平面には含まれないから接平面は存在せず、 f (x, y)は原点で任意の方向に偏微分可能であるにも関わらず、微分可能ではないことになる。 5.2.7 偏微分可能性 → 微分可能性 (2) つまり「任意の方向へ偏微分できる」ことは微分可能であるための十分条件ではない。そこで偏微分可能性か ら(全)微分可能性が言えるための条件は別に考える必要がある。結論を言えば、1つの十分条件として: 「fx, fy が存在し、それらが連続であれば微分可能」 という簡単な形が知られている。これは後述の用語を使えば、「C1級関数は(1階)微分可能」と言い換えられる。 もっとも「fx, fy の両方が連続」というのは実は過大な条件で、片方だけの連続性があれば十分である。した がって逆に、微分可能「でない」ためには fx, fy の両方が不連続である必要がある。 これまで「x 方向、y 方向(あるいはその他の方向)に偏微分できるが、微分可能ではない例」をいくつか見て きたことを考えると、この簡潔さは著しい結果と言える。連続という条件をつけ加えただけで問題が解消してし まったのである。 逆に言えば、これまで見てきた例ではこの「連続」という条件が満たされていなかったことになる。たとえば f (x, y) = xy x2+ y2 ((x, y)̸= (0, 0)) 0 ((x, y) = (0, 0)) の場合を考えてみよう。これはすべての (x, y) について x, y 方向に偏微分可能で、たとえば fxは fx(x, y) = y(y2− x2) (x2+ y2)2 ((x, y)̸= (0, 0)) 0 ((x, y) = (0, 0)) であった。ここで (x, y)→ (0, 0) という極限を考える。極座標で表すと: y(y2− x2) (x2+ y2)2 =
r sin θ(r2sin2θ− r2cos2θ)
r4 =
sin θ(sin2θ− cos2θ)
r であり、(x, y)→ (0, 0) というのは r → 0(θ の取り方は任意)である。ところがこれは分子が 0 でなければ発散 するから、fx(x, y)は連続ではないことになる。fy についても同様である。 • 練習: 他の例についても連続性を確かめよ。
5.3
ここまでのまとめ
• 偏微分とは特定の方向への関数の増減の度合いを表したものであり、その方向への接線の傾きとなっている。 • (全)微分とは関数が局所的に1次式で近似できるという条件を示したものである。 • 関数が微分可能なら「微分」dx, dy, dz の間に dz = ∂f ∂xdx + ∂f ∂ydy という関係が成り立つ。これを座標として見れば接平面の方程式になる。 • 微分可能ならすべての方向に偏微分可能である。 • 接平面は、任意の方向への接線をすべて含んでいる。これが「微分可能」という条件の言い替えである。 • fx, fy が存在し、それらが連続であれば微分可能である。 実際にはこれは2つの異なる方向への偏微分であればよく、また連続性は一方が満たせば十分である。5.4
高階の偏微分 (教科書5章§2)
fx, fy は x, y の関数だから、さらにこれらの偏導関数を考えることができる。これを 2階の偏導関数 と呼ぶ。 変数が2つあるから、2階の偏導関数は微分する順番によって4種類ある。それらの表記法を下に示す(添字な どの順番に注意)。 ∂ ∂x ( ∂f ∂x ) = ∂ 2f ∂x2 = fxx(x, y) ∂ ∂y ( ∂f ∂y ) = ∂ 2f ∂y2 = fyy(x, y) ∂ ∂y ( ∂f ∂x ) = ∂ 2f ∂x∂y = fxy(x, y) ∂ ∂x ( ∂f ∂y ) = ∂ 2f ∂y∂x = fyx(x, y) • 注 1: fxxなどは fx2 と書く場合もある。 • 注 2: 本によっては ∂ ∂y ( ∂f ∂x ) を上のように ∂ 2f ∂x∂y ではなく、 ∂2f ∂y∂x のように x, y の順番を逆に書 く流儀もある。もっとも下に見るように、これは実質的には影響ない。 一般には fxy と fyx は異なることがあるが、一定の条件のもとでは両者は一致する。そのような十分条件の例 として「シュワルツの定理」がある(教科書 p.181: 定理 5.2.3 に相当):「点 (a, b) の近傍で fx, fy が存在し、さらに fxy, fyx が存在して連続なら、fxy(a, b) = fyx(a, b)」
注: 実際には fxy, fyx の(一方が)存在して連続なら、もう一方も存在して連続であり、上の定理 を満たす。 これを領域 D に広げると、fxy= fyx、つまり x による偏微分と y による偏微分の順序を交換していいことを意 味している。 逆に fxy = fyx が成り立たない例を見ておこう。 • つまらない例だが、f(x, y) = |x| とする。すると fy(x, y) = 0、したがって fyx= 0だが、fx(x, y)は x = 0 で存在しない。したがって当然、x = 0 では fxy(x, y)も存在しないから fyx とは一致しようがない。 • fx, fy がともに存在する例としては: f (x, y) = { x2 (x≥ 0) 0 (x < 0) がある。この場合は fyx は存在するが、fxy は x = 0 のとき存在しない。 • fxy, fyx の両方が存在して一致しない例としては: f (x, y) = xyx 2− y2 x2+ y2 ((x, y)̸= (0, 0)) 0 ((x, y) = (0, 0)) がある(高木貞治:「解析概論」 p.58–59)。これの計算は少し面倒だが、結論を言えば fxy(0, 0) = −1、 fyx(0, 0) = 1となって、両者は原点では一致しない。 シュワルツの定理などが満たされれば、fxy = fyxとなるから2階の導関数は(fxx, fyy と合わせて)実質的に は3個あることになる。 同様に、3階以上の高階の偏導関数を考えることができる。一般に n 階の偏導関数は 2n 通りあるが、上のよ うに偏導関数が連続なら順序を交換でき、実質的には ∂nf ∂rx∂sy (r + s = n) の形のものだけ、つまり n + 1 通りがあることになる。 • 参考
f (x, y)の n 階偏導関数がすべて存在し、連続であるとき f (x, y) は Cn 級 であると言う。上で言っているのは、 関数が Cn 級であれば、n 階偏微分の順序は交換してよい、ということである。 また無限回偏微分可能な関数を C∞ 級と呼ぶ(微分できるためには連続でなければならないから、ここでは連 続性の仮定は省略できる)。
5.5
合成関数の偏微分(変数変換) (教科書 5.1.7∼5.1.10)
合成関数の偏微分、あるいは同じことだが変数変換の公式には2通りのものがある。以下ではいずれも、登場 する関数に、必要となる微分可能性を仮定する。 5.5.1 1変数への変換 x = x(t) y = y(t) のように x, y が t の関数として表される場合、f (x, y) は実質的には t の1変数関数になる: z = f (x, y) = f (x(t), y(t)) = f∗(t) このとき、 dz dt = ∂z ∂x· dx dt + ∂z ∂y · dy dt が成り立つ。つまり f の t による(常)微分は右辺のように表せる。 (x(t), y(t))は xy 平面上の曲線を表す。特に両端が一致する場合を「閉曲線」と言う。上は結局、f (x, y) をこ の曲線の上にある部分に制限して、曲線に沿っての増減の度合いを t による導関数として求めていることにあた る。以下に例を示す。 • 特別な場合として x = t, y = b(b は定数)とすると、z = f(x, y) に対して dz dt = ∂z ∂x これは f (x, y) の y = b による断面に沿っての導関数が fx(x, b)に一致することを示している。y について も同様である。 • x = at + a0, y = bt + b0 とするとこれは方向 (a b) への直線の方程式であり、このとき dz dt = a ∂z ∂x+ b ∂z ∂y になる。これは方向 (a b) への偏微分(の定数倍)にあたる(拡大率は√a2+ b2 であり、これが 1 なら偏 微分に一致する)。 • 原点を中心とした半径 a の円周は x = a cos t, y = a sin t と表せる。このとき dz dt = a ( − sin t ·∂z ∂x + cos t· ∂z ∂y ) になる。たとえば z = xy のとき、上の公式によれば dzdt = a(x cos t− y sin t) = a
2(cos2t− sin2t) = a2cos 2t
となる。つまりこの関数は円周上では三角関数のグラフの形で上下している。一方 f∗(t) = a2sin t cos tだ
から直接計算すると:
dz
dt = a
2(sin t cos t)′= a2cos 2t
となって上と一致する。 • 放物線 y = x2 に沿っての微分は: dz dx = ∂z ∂x dx dx+ ∂z ∂y dy dx = ∂z ∂x+ 2x ∂z ∂y となる。特に z = xy の場合、
dz dx = y + 2x 2 (注: 放物線上では y = x2 だから、その上では元の関数は z = xy = x3 と表すことができ、また y = x2 を代入すると y + 2x2= x2+ 2x2= 3x2= (x3)′ となる。) ここでは x を2通りの意味(2次元座標の変数と放物線を表すパラメタ)として使っており、dz dx と ∂z ∂x と は別物であることに注意。 5.5.2 2変数への変換 x, yを1つの変数で表すと、xy 平面の曲線上でしか関数を考えることができなかった。平面上の領域での関数 を考えるには2つの変数を用いる必要がある。そこで (x, y)→ (u, v) という変数変換を考える。 x = x(u, v) y = y(u, v)
z = f (x, y) = f (x(u, v), y(u, v)) = f∗(u, v)
とすると: ∂z ∂u = ∂z ∂x· ∂x ∂u+ ∂z ∂y · ∂y ∂u ∂z ∂v = ∂z ∂x · ∂x ∂v + ∂z ∂y · ∂y ∂v が成り立つ。Lagrange の記法では zu= zxxu+ zyyu zv = zxxv+ zyyv となる。これをベクトル・行列記法で書くと: ∂z ∂u ∂z ∂v = ∂x ∂u ∂y ∂u ∂x ∂v ∂y ∂v ∂z ∂x ∂z ∂y あるいは ( zu zv ) = ( xu yu xv yv ) ( zx zy ) となる。右辺の行列を「ヤコビアン (Jacobian)」と呼び、J と書く。 • 注 1: この行列の行列式をとったものをヤコビアンと呼ぶこともある。 • 注 2: ヤコビアンは積分における変数変換で中心的な役割を果たす。 • 注 3: 逆に (u, v) → (x, y) という変換を求めるには、ヤコビアンの逆行列を使えばよい(練習)。 変数変換で特に重要なのは、1次変換と極座標への変換である。 • 1次変換 x = au + bv y = cu + dv とすると、xu= a, xv= b, yu= c, yv= dとなるから、 zu= azx+ czy zv = bzx+ dzy になる。 例として x = u + v y = u− v z = f (x, y) = x2− y2
とすると、zx= 2x, zy=−2y で、公式から zu= zxxu+ zyyu= 2(x− y) zv = zxxv+ zyyv= 2(x + y) となる。さらに u = x + y 2 v = x− y 2 だから、これを上に当てはめると zu= 4v zv = 4u になる。一方、 f (x, y) = x2− y2= (x + y)(x− y) = 4uv だから、これから直接 zu, zv を計算しても上と同じ結果を得る。上の変換は、実は座標軸を π/4 回転して全体 を√2倍したことに当たる。つまり z = x2− y2 という関数と、z = xy という関数は、回転と拡大/縮小を除け ば実質的には同じ関数である。 • 極座標 x = r cos θ y = r sin θ という極座標において、ヤコビアンは J = ( cos θ sin θ −r sin θ r cos θ ) になる。つまり zr= zxcos θ + zysin θ zθ=−zxr sin θ + zyr cos θ となる。逆行列 J−1 は J−1= cos θ − sin θ r sin θ cos θ r になるから、(r, θ)→ (x, y) への変換は zx= zrcos θ− zθ sin θ r zy = zrsin θ + zθ cos θ r となる。 極座標は、関数が原点を中心として対称な場合、つまり f (x, y) = g(x2+ y2) と表される場合や、 f (x, y) = g(x, y) h(x, y) で g(x, y), h(x, y) が同じ次数の同次式の場合などに有効である。 • 例
• z =√x2+ y2 この場合、zx, zy を求めてから公式で zr, zθ を求めてもよいが、計算が煩雑になる。 これや上の例でもそうだが、一般に変数変換の公式を使うより、f (x, y) を f∗(u, v)(あるいは f∗(r, θ))の ように関数自体を行き先の変数を用いた形に直してから直接微分を計算したほうが楽なことも多い。 今の場合、z =√x2+ y2= rだから、 zr= 1 zθ= 0 になる。これから逆に、上の J−1 を使って zx, zy を求めることもできる。 • z = x2− 2xy − y2 x2+ y2 これも直接 zx, zy を求めるのは面倒だが、極座標を使えば z = r
2cos2θ− 2r2cos θ sin θ− r2sin2θ
r2cos2θ + r2sin2θ = cos
2θ− 2 cos θ sin θ − sin2
θ = cos 2θ− sin 2θ となる。したがって zr= 0 zθ=−2(sin 2θ + cos 2θ) となる。これから逆に zx, zy を求めることもできる。ただし一般には、(r, θ) で表された式を (x, y) に直す のは面倒なこともある。今の場合、上の J−1 を使って zx= 2 sin θ r (sin 2θ + cos 2θ) = 2 sin θ
r (2 cos θ sin θ + cos
2θ− sin2θ)
= 1
r4 · 2r sin θ(2(r cos θ)(r sin θ) + r
2cos2θ− r2sin2θ) = 1 (x2+ y2)2· 2y(2xy + x 2− y2) のように、r cos θ, r sin θ の形に持っていくことが目標となる。 • 参考:fr, fθ の意味 fx, fy の場合には「x 方向、y 方向への偏微分」という言い方をした。それでは極座標の fr, fθの場合、r 方向、 θ方向といったものは何を指すのだろうか。 簡単のため、 f (r, θ) = r g(r, θ) = sin θ という関数を考えてみよう(g は g(r, θ) = θ にしてもいいのだが、それだと1周してきたところで元に戻らなく なるので上のようにした)。すると簡単な計算で fr(r, θ) = 1 fθ(r, θ) = 0 gr(r, θ) = 0 gθ(r, θ) = cos θ となることがわかる。f は r の値が変わる、つまり原点からの距離が変わるにつれて値が変わるのに対し、θ の 値が変わる、つまり x 軸となす角が変わっても変化しない。g はその逆である。 これから、fr の「方向」は、原点と点 (r, θ) を結んだ放射線の方向であり、fθはこれと直交する、つまり原点 を中心とした円の接線の方向であることがわかる。これが fr, fθの方向の意味である。もっとも fx, fy の場合に は座標平面上、どこにいても同じ方向であったのに対し、fr, fθは場所によって座標平面上での方向が変わる。実 際、極座標で (r, θ) の点を直交座標で (x, y) とすると、r 方向は (x y)、θ 方向は (y − x) という方向であり、 場所によってどんどん変化する。 もう1つ、「次元 (dimension)」の問題がある。ここで言う次元は「2次元、3次元」の「次元」ではなく、物 理などで言う単位の組み合わせ方のことである。直交座標の x, y は「長さ」という次元を持つ。したがって cm や km といった単位で測れるわけである。r も同様に長さの次元を持つ。しかし θ は長さの次元は持たない。「角 度」という次元を持つ、という言い方もできるが、普通にはこれを次元を持たない量、つまり「無次元量」とし て扱う。 微分は割り算という計算(の極限)だから、
∆y ∆x の分母が長さの次元を持てば、結果の y′ は y に比べて長さの次元が1つ少ない値になる。たとえば y = x2の場 合、y は長さの次元 2 を持つが、微分した 2x の長さの次元は 1 である。これに対し、分母が無次元量であれば、 微分しても長さの次元は変わらない。それが極座標のヤコビアンで、fθ のほうには r が付き、frのほうには付か ない理由である。 なお、極座標の場合には原点での偏微分可能性に注意。たとえば f (x, y) =√x2+ y2= rだから f r= 1だが、 これは原点では偏微分不能(正確には、片側微分が可能)である。
5.6
高階の全微分
省略。5.7
平均値の定理、テーラーの定理 (教科書 5.1.11)
平均値の定理については省略。(教科書 p.177 定理 5.1.11 参照:表し方にはいくつかの形がある) テーラー展開については1変数関数と同等に、f (a + x, b + y) を (a, b) を中心とした x, y の多項式に展開してい くことができる(定理 5.2.4 参照)。f (x, y) を C∞ 級とすると、(a, b) を中心とするテーラー展開は f (a + x, b + y) = f (a, b)+ fx(a, b)x + fy(a, b)y
+ 1 2!
(
fxx(a, b)x2+ 2fxy(a, b)xy + fyy(a, b)y2
) + 1
3! (
fxxx(a, b)x3+ 3fxxy(a, b)x2y + 3fxyy(a, b)xy2+ fyyy(a, b)y3
) +· · · のように進んでいく。各行を順に 0 次、1 次、.... n 次の項と呼ぶ。各次の展開式は2項展開の形をしていること に注意。n 次の一般項は n ∑ k=0 nCkfxkyn−k(a, b)xkyn−k の形をしている。
展開を適当な次数で打ち切れば、最後に剰余項が残る(上の f(...)(a, b)の (a, b) を (a+θx, b+θy)(θ は|θ| < 1 で
ある定数)で置き換えたもの)。また展開を無限に続けていって得られる級数が収束するなら、それが f (a + x, b + y) のテーラー展開になる。
5.8
陰関数定理・平面曲線 (教科書 5章
§4, §5)
(5.2 及び 5.10 参照)5.9
極値・停留値問題 (教科書5章§3)
5.9.1 極大・極小 点 (a, b) の近傍 D で、(x, y)∈ D、(x, y) ̸= (a, b) となる任意の点 (x, y) に対し:• f(x, y) < f(a, b) なら点 (a, b) は(狭義の)極大点、f(a, b) を極大値、 • f(x, y) > f(a, b) なら点 (a, b) は(狭義の)極小点、f(a, b) を極小値、
とそれぞれ呼ぶ。また極大値・極小値をまとめて「極値」と呼ぶ(極大点・極小点をまとめて呼ぶ呼び方はないよ うである。「極点」とでもするか?)。 不等号の <, > を≤, ≥ で置き換えた場合には広義の極大点等と呼ぶ。広義の極大/極小点の場合、他に同じ 関数値をとる点があってもよいが、それより大きい/小さい値をとることがない、というわけである。同じ関数 値をとる点が (a, b) を含む曲線上に並んでいたり、ある領域にわたって広がっている場合には、近傍をどんなに小 さくとってもそれらの点がその中に含まれることになる。 5.9.2 停留点 以下では f (x, y) は必要な回数だけ微分可能とする。
fx(a, b) = fy(a, b) = 0である点 (a, b) を f (x, y) の 停留点 と呼ぶ。停留点での接平面は、xy 平面に平行である。
つまり接平面の方程式は z = k の形をしている。このとき次のことが成り立つ: 「(狭義・広義の)極大点/極小点は停留点である。」 これは極大・極小点が関数の断面をとった1変数関数の上でも極大・極小点であること、そして1変数関数の場 合の結果からしたがう。つまり x 方向への断面で極大であることから、fx(a, b) = 0が得られる。他の場合も同様 である。 点 (a, b) が停留点であっても、(狭義の)極大・極小点とは限らない。これには広義の極大・極小点である場合、 鞍点 (saddle point) である場合などがある(特殊な場合としてそれ以外のものもある)。 • 注: 点 (a, b) が鞍点であるとは、ある方向に沿ってそれを通過すると (a, b) が極大点であり、別の方 向に沿って通過すると極小点であることを言う。より一般的には、上の「方向(=直線)」を「曲線」 に置き換える。 鞍点という名前は、馬の鞍(くら)がこの形をしていることによる。また山道の峠も鞍点の例である。 道に沿って反対側に行く場合には峠が極大点になるが、一方山の稜線に沿って進むと峠は極小点になる。 (a, b)が鞍点の場合、少なくとも2本の等高線が (a, b) で交差することに注意(なぜか?)。 実は(狭義の)極大・極小点であっても停留点とは限らない。上の定理は「微分可能」という条件のもとでの話 だから、極大・極小点で微分不能の場合、定義によってそれは停留点ではないからである。したがって一般の極 値判定は、そういった場合まで含めて総合的に考える必要がある。 5.9.3 微分による極値の判定 微分可能な場合に戻ろう。 停留点では fx(a, b) = fy(a, b) = 0だから、前節のテーラー展開の式は f (a + x, b + y)− f(a, b) = +1 2! (
fxx(a, b)x2+ 2fxy(a, b)xy + fyy(a, b)y2
) +· · · と書ける。ここで左辺は点 (a, b) と (a + x, b + y) での関数値の増減を表し、正なら増加、負なら減少である。右 辺で3次以上の項は、x, y が十分小さければ2次の項に比べて十分小さくなることに注意しよう。これは lim x→0 xn x2 = 0 (n > 2) であることによる。そこで x, y が十分小さければ、2次の項の符号がそのまま左辺の符号になる、つまり f (a+x, b+y) と f (a, b) の大小を決定することになる。これが極値判定の手がかりとなる。 簡単のため: fxx(a, b) = A fyy(a, b) = B fxy(a, b) = H
とおく。問題は P の符号がどうなるかである。 • まず A = B = 0 とする。このとき H = 0 だと P 全体が 0 になり、2次の項では判定がつかない。そこで 3次以上の項を調べるなど、他の方法が必要となる。 一方、H ̸= 0 なら P = 2Hxy となる。このとき P は x, y の値に応じて正にも負にもなる。特に y = x に 沿っては P = 2Hx2、y =−x に沿っては P = −2Hx2 となり、(x, y) = (0, 0) では一方が極大、もう一方 が極小になる(どちらが極大かは H の符号による)。つまり (a, b) は鞍点になる。 • そこで A, B の少なくとも一方は 0 でないとする。一般性を失うことなく、A ̸= 0 としよう。すると P = A [( x + H Ay )2 +AB− H 2 A2 y 2 ] という平方完成の形に分解できる。上の第1項は ( x + H Ay )2 ≥ 0 であるから、第2項が問題となる。分子の H2− AB はこの2次式の判別式である。 「判別式」としては、こちらの形のほうが高校以来おなじみなのだが、教科書 p.184 定義 5.3.4 にある「ヘッ セ行列式」は、この判別式の正負を逆にしたものである。どちらの符号をとるかは本によって様々であるが、 ここでは混乱を避けるため、教科書に合わせて: ∆ = AB− H2= fxxfyy− fxy2 と定義して用いていく。つまり ∆ > 0 なら2次式は実根を持たず、∆ < 0 なら2実根を持つ。 符号を混同しないように注意! • ∆ > 0 の場合: このとき第2項は ∆ A2y 2≥ 0 であり、等号が成り立つのは y = 0 の場合である。また第1項が 0 となるのは x + H Ay = 0 の場合、したがって(y = 0 から)x = y = 0 の場合である。 つまり P は x = y = 0 の場合にのみ 0 になり、それ以外の場合は P の符号は A の符号と一致する。 • 注: ∆ = AB − H2> 0 だから、このとき AB > 0、つまり B も A と同符号で B̸= 0 である。 そこで: • A < 0 の場合: このとき P < 0 であり、したがって f(a+x, b+y)−f(a, b) < 0 である。これが (x, y) ̸= (0, 0) である任意の (x, y) で成り立つから、f (a, b) は(狭義の)極大 である。 • A > 0 の場合: 同様にして、このとき f(a, b) は(狭義の)極小 である。 • ∆ < 0 の場合: このとき ∆ A2 < 0 だから、−∆ A2 = C 2 とおくと: P = A [( x + H Ay )2 − C2y2 ] = A [ x + ( H A + C ) y ] · [ x + ( H A − C ) y ] となり、P は x, y の1次式の積に分解される。したがって P は直線 x + ( H A + C ) y = 0 x + ( H A − C ) y = 0 の両側で符号が変わるから、(a, b) は 鞍点 になる。 先ほどの A = B = 0, H ̸= 0 の場合も ∆ = AB − H2=−H2< 0になるから、この場合に含めて考えるこ とができる。
• ∆ = 0 の場合: このとき P = A ( x +H Ay )2 であり、直線 x + H Ay = 0 に沿っては 0 になる。したがってこの直線上では P = 0 なので2次項だけでは f (a + x, b + y)− f(a, b) の 大小の判定はつかず、3次以上の項を調べるなどが必要となる。 また最初の A = B = H = 0 の場合もここに含めて考えることができる。 3次以上の項を調べる必要がある場合、x, y の3次式は x, y の符号によって正にも負にもなるから、3次項が 0でなければ極大・極小点ではないことになる。一方、4次項の場合には符号が正または負に決まる場合があるか ら、そこで極大・極小になりうる。一般に初めて 0 でなくなるのが奇数次の項なら符号は正負いずれにもなるの で極大・極小点にはなりえない。一方、初めて 0 でなくなるのが偶数次の項の場合は、その項の判別式によって 極値かそうでないかを判定することになる。しかし一般に高次の項の判別式を求めてそこから計算するのは大変 なので、関数の性質など、他の情報を利用して考えたほうがよい。 • 参考:「2次形式」 上では直接的に論じたが、線形代数の立場から言えば: P = Ax2+ 2Hxy + By2= (x y) ( A H H B ) ( x y ) のように行列・ベクトルの積として表せる。この行列が教科書の「ヘッセ行列」である。このような変数(今の 場合、x, y)の2次式で表される関係を「2次形式」と呼ぶ。線形代数の2次形式の理論は、ここで述べたような 話を一般化して、一般の n 次元(n 変数)の場合についても扱うものであり、多変数関数の極値判定もそれに帰 着される。 5.9.4 極値の判定の手順 ある点が極値を与えるかどうかを判定する、より一般的には停留点として分類するには以下の手順をとる。 • 微分不能な点がある場合、直接的な考察によって極値等になるかを考える。たとえば z =√x2+ y2 の場合、(x, y)̸= (0, 0) なら x2+ y2> 0だから、原点 (0, 0) は極小点(かつ関数全体の最小点)である。し かしこれは (0, 0) では微分不能だから、停留点ではない。 • 微分可能な場合、停留点を求める。これには fx(x, y) = 0 fy(x, y) = 0 という連立方程式を満たす (x, y) を求めればよい。これは一般には(高次の)非線形方程式、さらには超越 方程式(三角関数や指数関数を含む方程式)になるので、解析的に解くのは容易ではない。解析的に解けな い場合にはコンピュータなどを使って数値的に解を求める必要がある。 • 求められた停留点 (a, b) について、 fxx(a, b) = A fyy(a, b) = B fxy(a, b) = H を求め、上の判定方法を利用する。判定方法をまとめておくと:∆ = AB− H2に対し: • ∆ > 0: A < 0 なら極大点、A > 0 なら極小点。 • ∆ < 0: (a, b) は鞍点。 • ∆ = 0: 2次項では判定がつかないので、他の方法で調べる。
• 最後の「他の方法」については、3次、4次の項ぐらいまでを調べる、関数の性質を直接的に解析する、数 値計算で調べるなどの方法がある。 5.9.5 具体例 いくつかの具体的な例題をやっておこう。 • f(x, y) = x2+ y2 これは先ほどの√x2+ y2 と同様に、直接的に答えを得ることもできるが、上の判定方法を使うと: fx(x, y) = 2x fy(x, y) = 2y したがって fx= 0となるのは x = 0 の場合、fy = 0となるのは y = 0 の場合であり、停留点は (0, 0) た だ1つである。 fxx(x, y) = 2 fyy(x, y) = 2 fxy(x, y) = 0 したがって判別式は ∆ = 2· 2 − 02= 4 > 0。A = 2 > 0 だからこれは極小点になる。 なお、解答には x, y 座標だけでなく、その点の関数値(極大・極小点なら極大・極小値)も書いておくとよ い。今の場合、極小値は 02+ 02= 0 である。 • f(x, y) = x4+ y4 これも結果は明らかではある。しかし今度の場合、微分による判定方法を使うと: fx(x, y) = 4x3 fy(x, y) = 4y3 したがって停留点は (0, 0) のみ。ところが fxx(x, y) = 12x2 fyy(x, y) = 12y2 fxy(x, y) = 0 となって、(0, 0) では A = B = H = 0 になってしまう。したがって3次項を考えると: fxxx(x, y) = 24x fyyy(x, y) = 24y 他の3階偏微分は 0 これも (0, 0) ではすべて 0 になるので、さらに4次項を考える。 fx4(x, y) = fy4(x, y) = 24 他の4階偏微分は 0 これから、2次の場合の判定法を応用すれば (0, 0) が極小点であることがわかる。 • f(x, y) = x2y− 2xy2+ 4xy− 3y 今度は数式を眺めていても埒があかないので計算してみる。 fx(x, y) = 2xy− 2y2+ 4y = 2y(x− y + 2) fy(x, y) = x2− 4xy + 4x − 3 まず fx= 0になるのは y = 0 か、x− y + 2 = 0 の場合である。 y = 0 の場合、fy は fy= x2+ 4x− 3 = 0 これは x =−2 ±√7が解である。したがって (−2 ±√7, 0)という2つの停留点が得られた。 x− y + 2 = 0、すなわち y = x + 2 の場合、
fy= x2− 4x(x + 2) + 4x − 3 = 0 3x2+ 4x + 3 = 0 これは実数解を持たないから、こちらには停留点はない。したがって停留点は最初に求めた2つになる。 fxx(x, y) = 2y fyy(x, y) =−4x fxy(x, y) = 2x− 4y + 4 したがって (−2 ±√7, 0)の2つをまとめて書いてしまうと(以下複合同順): fxx(−2 ± √ 7, 0) = 0 fyy(−2 ± √ 7, 0) = 8∓ 4√7 fxy(−2 ± √ 7, 0) =±√7 判別式: ∆ = AB− H2= 0· (8 ∓ 4√7)− (±√7)2=−7 < 0 だから、どちらの場合も鞍点になる。関数値は .... 面倒なので省略。 • f(x, y) = (x2− y)(y2− x) fx(x, y) = 2xy2− 3x2+ y fy(x, y) = 2x2y− 3y2+ x そこで 2xy2− 3x2+ y = 0 2x2y− 3y2+ x = 0 という連立方程式を解く。一般にこういった非線形連立方程式の場合、型通りの解き方は(少なくとも人間 にとっては)ないので、いろいろ試行錯誤する必要がある。 まず (x, y) = (0, 0) が解であるのは明らか。また一方が 0 ならもう一方も 0 になる。したがって、x̸= 0, y ̸= 0 という解を探そう。第1式に x(̸= 0)、第2式に y(̸= 0) を掛けると: 2x2y2− 3x3+ xy = 0 2x2y2− 3y3+ xy = 0 上から下を引くとうまい具合に項が打ち消し合って: 3(y3− x3) = 0 これは実数の範囲では y = x だけを解に持つ。そこでこれを元の式に代入すると: 2x3− 3x2+ x = 0 x(2x2− 3x + 1) = x(x − 1)(2x − 1) = 0 y = xだから、(x, y) = (0, 0), (1, 1), (1/2, 1/2) が解になる。(0, 0) は除外したから(あるいは最初のものと ダブっているから)、停留点は3つあることになる。 fxx(x, y) = 2y2− 6x fyy(x, y) = 2x2− 6y fxy(x, y) = 4xy + 1 • (0, 0) の場合 A = B = 0、H = 1 だから、これは鞍点になる(関数値 0)。 • (1, 1) の場合 A = B =−4、H = 5 で、判別式は: ∆ = (−4) · (−4) − 52=−9 > 0 したがってこれは鞍点になる(関数値 0)。 • (1/2, 1/2) の場合 A = B =−5/2、H = 2 で、判別式は: