解析 II ・講義ノート

(1)

解析 II ^{・講義ノート}

第８回

(2020^年12^月 1^日(^火)^配信分)

(2)

§8.

^{高次の微分と極値問題}

さて、

2

^変数関数

f(x, y)

は偏微分可能として、その偏導関数

f_x(x, y), f_y(x, y)

がさらに偏微分可能のとき、

f(x, y)

^は

2

^回

(^由緒正しい本では「階」)

偏微分可能であると言い、得られる

2

^次偏導関

数を次のように表します。

∂

∂x



∂f

∂x



 = ∂²f

∂x² = (f_x)_x(x, y) = f_xx(x, y)

∂

∂y



∂f

∂x



 = ∂²f

∂y∂x = (f_x)_y(x, y) = f_xy(x, y)

∂

∂x



∂f

∂y



 = ∂²f

∂x∂y = (f_y)_x(x, y) = f_yx(x, y)

∂

∂y



∂f

∂y



 = ∂²f

∂y² = (f_y)_y(x, y) = f_yy(x, y)

と表します。上付きの

2

^{の位置、表記による}

x

^と

y

^{の順番の違}

いに気をつけましょう。

(3)

これらが全て連続のとき、

f(x, y)

^は

C²

^{級であると言います。}

f(x, y)

^が

C²

^{級のとき、}

f_xy(x, y)

^と

f_yx(x, y)

^{は一致しますが、}

C²

級でないときは、一致するとは限らないので注意が必要です。

これらを並べて出来る

2

^{次正方行列を}

f(x, y)

^{のヘッセ行列と}

呼び、

Hess f = D²f =







f_xx f_xy f_yx f_yy







で表します。

f(x, y)

^が

C²

級のとき、そのヘッセ行列は、各点

(x, y)

で実対称行列になります。

(4)

一次関数

f(x, y) = ax + by + c

^に対し、

f_xx(x, y) = f_xy(x, y) = f_yx(x, y) = f_yy(x, y) = 0 ((x, y) ∈ R²)

より、

Hess f(x, y)

^{は零行列です。}

また二次関数

f(x, y) = ax² + 2bxy + cy²

^{に対しては、}

f_xx(x, y) = 2a, f_xy(x, y) = 2b

f_yx(x, y) = 2b, f_yy(x, y) = 2c ((x, y) ∈ R²)

より、

Hess f(x, y) =







2a 2b 2b 2c







となります。

(5)

以下繰り返し、

n

^{回微分可能、}

n

^{次偏導関数、}

Cⁿ

^{級、無限回微}

分可能＝

C^∞

^級

(⇐⇒

何回でも好きな変数について好きな順番で偏微分できる

)

と言った用語が定義されます。任意の多項式関数、

有理関数は、定義域の各点で

C^∞

^{級になります。また}

2

^変数

(

^多

変数

)

^の

Cⁿ

^級関数と

1

^変数の

Cⁿ

^{級関数の合成関数も}

Cⁿ

^級にな

ります。

(6)

さて、

f(x, y)

^は

C²

^{級としましょう。点}

x₀ = (x₀, y₀)

^を通り

方向ベクトル

v = (p, q)

^の直線

(x, y) = (x₀ + pt, y₀ + qt) = x₀ + tv

(t ∈ R (

^または

0

^{を含む開区間}

))

に制限すると

(

つまりグラフを縦の平面で切ると

)

^、

t

^に関する

1

変数関数

g(t) = f(x₀ + pt, y₀ + qt) = f(x₀ + tv)

が得られますが、この関数もまた

C²

級で、次が成り立ちます。

(

以下では、慣例にならって、勾配ベクトル

grad f,

^{方向ベクトル}

v

は共に列ベクトルと考え表記します。

)

(7)

g^′(t) = f_x(x₀ + pt, y₀ + qt) p + f_y(x₀ + pt, y₀ + qt) q

=







f_x(x₀ + tv) f_y(x₀ + tv)





 ·







p q





 ( · ^は内積)

= grad f(x₀ + tv) · v

g^′′(t) = f_xx(x₀ + pt, y₀ + qt) p² + f_xy(x₀ + pt, y₀ + qt) pq

+f_yx(x₀ + pt, y₀ + qt) qp + f_yy(x₀ + pt, y₀ + qt) q²

= (p q)







f_xx(x₀ + tv) f_xy(x₀ + tv) f_yx(x₀ + tv) f_yy(x₀ + tv)













p q







= ^tv Hess f(x₀ + tv) v

(8)

この関数に

t = 0

で平均値の定理を適用すると

g(t) = g(0) + g^′(θt) t (∃θ ∈ (0, 1))

= f(x₀) + t (grad f(x₀ + θtv) · v) 2

次までのテイラーの定理を適用すると

g(t) = g(0) + g^′(0) t + 1

2g^′′(θt) t² (∃θ ∈ (0, 1))

= f(x₀) + t (grad f(x₀) · v) +t²

2 (^tv Hess f(x₀ + θtv) v)

が得られます。

(9)

特に二次関数

f(x, y) = ax² + 2bxy + cy² + kx + ly + m

^の場合

には、

g(t) = m + t







k l





 ·







p q





 + t² (p q)







a b b c













p q







ですが、一般の関数では、最後の項の行列が一定にはならず、

x₀ = (x₀, y₀)

^にも

v = (p, q)

^{にも依る上に、何より}

θ ∈ (0, 1)

^が何

か具体的にはわからないので少々注意が必要です。

(10)

今、一般の

2

^変数関数

z = f(x, y)

^{について、と言っても}

C²

級くらいは仮定して、その増減について調べてみたいと思います。

1

^変数が

2

変数になっても、とりあえずグラフを３Ｄで描く、

もしくは思い浮かべることはできました。しかし、

2

^{変数になっ}

て

1

変数と大きく違うことの一つに、増減表が書けないと言うことがあります。それは変数の変化が直線的でないため、右に行くと増え、左へ行くと減ると言ったように、関数の値の増減を表に表すことが困難だからです。そこで極大値や極小値、最大値や最小値をどこでとるか調べるにあたって、

1

^{変数のとき以上に、}

2

回微分の果たす役割が重要になります。

(11)

f(x, y)

^は

(x, y) = (x₀, y₀)

^で極大

(

^小

)

値をとるとしましょう。

極大

(

^小

)

値の定義は、本によって多少ぶれがあって、面倒なこともあるのですが、この講義では、

(x₀, y₀)

^{の十分近くでは最大}

(

^小

)

値、より厳密に言うと、十分小さい

δ > 0

^を選べば

f(x₀, y₀) ≥ f(x, y) (||(x, y) − (x₀, y₀)|| < δ)

(

極小値のときはもちろん

≤ )

^{が成り立つとき、極大}

(

^小

)

^値をと

ると言うことにしておきます。

(12)

このとき、点

(x₀, y₀, f(x₀, y₀))

^{を通る任意の縦の平面}

(x, y, z) = (x₀ + pt, y₀ + qt, z) ((t, z) ∈ R²)

で切っても、断面に現れる

( t

^に関する

) 1

^変数関数

z = g(t) = f(x₀ + pt, y₀ + qt)

は、

t = 0 (

^つまり

(x, y) = (x₀, y₀) )

^で極大

(

^小

)

^{値をとりますか}

ら、結局、偏微分を含む全ての方向微分が

(x, y) = (x₀, y₀)

^で

0

^に

ならなければなりません。

C¹

^{級のとき、偏微分が}

0

^{なら方向微}

分も

0

になりますから、とりあえず

f_x(x₀, y₀) = f_y(x₀, y₀) = 0

ならば、この条件は満たします。

(13)

さて、

1

^変数関数

y = f(x)

^{の場合には、}

x = x₀

^{で極値をとる}

ならば、

f^′(x₀) = 0

を満たしましたから、上の事実はちょうどそ

の部分に対応しています。そこで、実際に極値になっているのか

どうかは、

x = x₀

^の前後で

f^′(x)

の符号が変わるか否かで判定す

ることができました。ところが

2

変数ではこれは難しい。そこ

で、もう一つの判定方法、

C²

級のとき凹凸を調べると言う方法を

考えてみましょう。

(14)

それは、

f^′′(x₀) < 0

ならば上に凸で極大値、

f^′′(x₀) > 0

^ならば

下に凸で極小値と言うものでした。これをテイラー展開を用いて説明すると、

f(x) = f(x₀) + f^′(x₀) x + 1

2f^′′(x₀ + θ(x − x₀)) x²

= f(x₀) + 1

2f^′′(x₀ + θ(x − x₀)) x²

で、ここで

f^′′(x₀) < 0 (>)

^{ならば、十分}

x₀

^{に近い任意の}

x ̸= x₀

に対しても、

f^′′(x₀ + θ(x − x₀)) < 0 (>)

^{が成り立つので、}

f(x) < f(x₀) (>)

^{も成り立ち、}

x = x₀

^で極大

(

^小

)

^{値をとると言う}

ことになります。

(15)

2

変数の場合も同様に、偏微分が

0

ならば、先に計算しておいた

2

次までのテイラー展開は

1

^{次の項が消えるため、}

f(x) = f(x₀) + t²

となり、

f(x)

^と

f(x₀)

^{の大小は、}

2

次の項の符号だけで決まることになります。ここで

t²

2 > 0 (t ̸= 0)

^{ですから、結局十分}

0

^に近

い

t ̸= 0

^に対し、

tv Hess f(x₀ + θtv) v

が、

v = (p, q) (√

p² + q² = 1)

^と

θ ∈ (0, 1)

^{に依らず、負}

(

^正

)

^なら

ば

f(x) < f(x₀) (>)

^より、

f(x, y)

^は

(x, y) = (x₀, y₀)

^で極大

(

^小

)

値をとるとわかります。

(16)

それでは、その正負がどうしたらわかるかと言うと、行列とベクトルで表していることからもわかるように、二次関数の分類の際に、線形代数からの準備として用意しておいた、実対称行列の対角化を用いる方法が使えます。

2

次までのテイラー展開は、実は一次関数による近似

f(x₀) + t (grad f(x₀) · v) (^今は 1 ^次の項は 0 )

の誤差を

2

^{次の剰余項}

t²

によって表したもので、二次関数による近似とは言えませんが、

その誤差の部分の符号を調べることで、大雑把に言えば、どのよ

うな二次関数に近い凹凸の状況にあるかがわかります。

(17)

さて、

2

^{変数の二次関数}

ax² + 2bxy + cy²

^は行列







a b b c







の固有値

λ₁, λ₂

^{を用いて、}

λ₁X² + λ₂Y ²

の形に書き直すことができるので、固有値がどちらも負

(

^正

)

^{なら、原点以外では負}

(

^正

)

^の

値をとりました。そして、固有値は固有方程式

λ² − (a + c)λ + (ac − b²) = 0

の解でしたから、解と係数の関係より、

ac − b² > 0

^{のとき同符号}

で、さらに

a + c < 0 (>)

^のとき負

(

^正

)

になりました。ところが

ここで

ac > b² ≥ 0

^より

a

^と

c

は同符号ですから、この二つ目の

条件は

a < 0 (>)

^または

c < 0 (>)

^{に置き換えられます。}

(18)

従って、今考えている

2

変数関数の場合には、任意の単位ベクトル

v

^と十分

0

^に近い

t

^と

θ ∈ (0, 1)

^に対し、

x = x₀ + θtv

^で

f_xxf_yy − f_xy² > 0, f_xx < 0 (f_xx > 0)

ならば極大

(

^小

)

値となりますが、今仮定より

f

^は

C²

^{級なので、}

f_xx, f_yy, f_xy

^{は全て連続のため、}

f_xxf_yy − f_xy²

^{もまた連続で、}

x = x₀

の近くでは、それらの符号は

(

^従って

Hess f

^{の固有値の符}

号も

)

変わりません。よって、

x = x₀

での符号を調べれば十分と言うことになります。

一方

f_xxf_yy − f_xy² < 0

ならば、

x = x₀

^{のいくらでも近くで、}

^tv Hess f v

^{が正負両方の}

値をとってしまうので、極値にはならないことも判定できます。

(19)

以上まとめると、

C²

^級の

2

^変数関数

f(x, y)

^が、

f_x(x₀, y₀) = f_y(x₀, y₀) = 0

^{をみたすとき、}

(1) f_xx(x₀, y₀)f_yy(x₀, y₀) − f_xy(x₀, y₀)² > 0

^かつ

f_xx(x₀, y₀) < 0

^な

らば

(x, y) = (x₀, y₀)

^で極大値

f(x₀, y₀)

^をとる。

(2) f_xx(x₀, y₀)f_yy(x₀, y₀) − f_xy(x₀, y₀)² > 0

^かつ

f_xx(x₀, y₀) > 0

^な

らば

(x, y) = (x₀, y₀)

^で極小値

f(x₀, y₀)

^をとる。

(3) f_xx(x₀, y₀)f_yy(x₀, y₀) − f_xy(x₀, y₀)² < 0

^ならば

(x, y) = (x₀, y₀)

で極値をとらない。

と判定できます。

判定条件を二次方程式の判別式を用いて説明している本などでは、

f_xy² − f_xxf_yy の符号で記述していることがあります。見かけ上、正負が逆になるので、参照する際には注意して下さい。この講義では、線形代数との関わりを重視して、f_xxf_yy − f_xy² の符号で記述しました。

ちょっと例題を見ておきましょう。二次関数はもう分類済み

(20)

0 - x y z 6

z =ax²+cy² (a < 0, c <0)

◦ ^極大値

0 -

x y z 6

z =ax²+cy² (a > 0, c >0) 極小値◦

(21)

0 - x y z 6

z =ax²+cy² (a > 0, c <0) 極値でない ◦

なので、

2

^{変数の三次関数}

f(x, y) = x²y − y

^{について考えてみま}

しょう。もしこの関数がどこかで極値をとるならば、そこでは

f_x(x, y) = 2xy = 0 f_y(x, y) = x² − 1 = 0

が成り立たなければなりません。

(22)

第２式より

x = ±1

で、これを第１式に代入して

y = 0

^を得ま

す。従って、極値を取る点の候補は

(x, y) = (±1, 0)

^{です。ここで}

f_xx = 2y, f_xy = 2x, f_yy = 0

より、

f_xx(±1, 0) = 0, f_xy(±1, 0) = ±2, f_yy(±1, 0) = 0

ですから、

f_xx(±1, 0)f_yy(±1, 0) − f_xy(±1, 0)² = −4 < 0

より、極値はとらないことがわかります。

[

^練習課題

]

f(x, y) = x²y − y + 1

3y³

^{ではどうでしょうか？}

(23)

上の判定条件

(1),(2),(3)

の内、どの条件も満たさないときは、

さらに高次の微分に関する情報が無ければ、一般には判定できません。

たとえば二次関数の場合、原点で偏微分が消えていてヘッセ行列の固有値の一つが

0

ならば、対角化する座標変換により、結局

f(x, y) = ax²(+0y²) (a ̸= 0)

の場合に帰着しましたが、この場合

f_xx(0, 0)f_yy(0, 0) − f_xy(0, 0)² = 2a · 0 − 0² = 0

となり、上の判定条件は適用できないものの、

a < 0

^のとき、

f(x, y) ≤ f(0, 0) ((x, y) ̸= (0, 0)) ( a > 0

^のとき

≥ )

^{より、極大}

(

^小

)

^{値をとります。}

( y ^軸 (x = 0) 上では等号が成立してしまうので、本によってはこれを極値と認めなかったり、広義の(^{＝広い意味での})極値と言ったりします。)

(24)

0 - x y z 6

z = ax²(+0y²) (a < 0, c= 0)

◦ (広義の)極大値

0 -

x y z 6

z = ax²(+0y²) (a > 0, c= 0) (^広義の)^極小値 ◦

(25)

しかし、これが

f(x, y) = ax² + cy³ ( a ̸= 0, c ̸= 0 )

^{なら、原点}

での偏微分は

2

回まで全て上の例と一致するものの、

c > 0

(c < 0)

^のとき、

y

軸上では狭義単調に増加

(

^減少

)

^{するので、原点}

では極値をとりません。

一方、

f(x, y) = ax² + cy⁴ ( a ̸= 0, c ̸= 0 )

^{なら、やはり原点で}

の偏微分は

2

回まで全て上の例と一致しかつ、

a < 0

^かつ

c < 0

のとき、

f(x, y) < f(0, 0) ((x, y) ̸= (0, 0))

( a > 0

^かつ

c > 0

^のとき

> )

^{より、原点で極大}

(

^小

)

^{値をとりま}

すが、

a < 0

^かつ

c > 0

^{のときは、}

x

^{軸上で上に凸、}

y

^{軸上で下に}

凸

( a > 0

^かつ

c < 0

^{のときは上下が逆}

)

より、原点で極値はとり

ません。

(26)

このように、ヘッセ行列

Hess f(x₀)

^{の固有値の中に}

0

^がある、

つまり

2

回微分が消えている方向があるとき、高次の項の符号が、極値になるならないに影響して来るわけです。特に

x²y, xy², x³y, x²y², xy³

などの項が、一般には

2

^{次の場合の}

xy

のように整理できるとは限らず、判定にはより困難が伴います。

ここでは

2

変数関数について説明して来ましたが、上の判定条件は、

n

変数関数でも同様に成り立ちます。ただし、実

n

^次対称

行列の固有値の符号の判定条件を書き下すために、

Hess f(x₀)

^の

小行列式が用いられ、条件式の本数は

n

に応じて増えます。この

講義ノートでは省略しますが、参考書等で確認しておいて下さい。

(27)

第７回練習課題の解答

∂(r, θ)

∂(x, y) =







√ x

x² + y²

√ y

x² + y²

− y x² + y²

x x² + y²







=







cos θ sin θ

−sin θ r

cosθ r







= 1 r







r cosθ r sinθ

− sinθ cosθ







=







cosθ −r sinθ sinθ r cosθ







−1

=



∂(x, y)

∂(r, θ)





−1

解析 II ・講義ノート