極値の判定 - 4 II I

E = {(x, y, z)∈[0,∞)³; x² a² +y²

b² +z² c² = 1}, D = {(s, t)∈[0,∞)²; s+t≤1}

とすると、(x, y, z)∈E に(s, t) = (^x_a²2,^y_b2²)∈Dを対応させる写像は全単射かつ、

xyz=abcp

st(1−s−t).

よって

f(s, t) =st(1−s−t), (s, t)∈D

を最大にすればよい。Dはコンパクト、f は連続だからf は最大値を持つが、Dの境界では st(1−s−t) = 0 だから、最大点はD^◦ 内にある。また、最大点は極大点、f は可微分だから最大点は臨界点(命題 11.3.2)。一方、

f_s=t(1−2s−t), f_t=s(1−2t−s).

よって、D^◦ ^{内の臨界点}(f_s=f_t= 0の解)は(1/3,1/3)のみである。従ってf(1/3,1/3) = 1/27 がf の最大値。以上から、求める最大値は ^abc

3√

3. 2

問 11.3.2 a₁, ..., a_d>0 は定数、x₁, ..., x_d ≥0, ^x_a²¹2 1

+...+ ^x_a²^d2 d

= 1とし積 x₁· · ·x_d の最大値を求めよ。

次に多変数関数の臨界点が、極値点であるための十分条件を2階の微分を用いて与える。

そのためにまず次の定義をおく：

定義 11.3.5 （ヘッシアン）D⊂R^d, f ∈ C²(D →R), x ∈D^◦ ^{とする。次の行列} H(x) をf の xにおけるヘッシアン(Hessian)と言う：

H(x) =





∂1∂1f(x) . . . ∂1∂_df(x) ... . . . ...

∂d∂1f(x) . . . ∂d∂df(x)



,

また、ヘッシアンH(x) の小行列式を次のように記す：

∆_k(x) = det





∂₁∂₁f(x) . . . ∂₁∂_kf(x) ... . . . ...

∂_k∂₁f(x) . . . ∂_k∂_kf(x)



, k= 1, ..., d.

多変数関数の臨界点近傍の挙動を調べる上で、ヘッシアンが重要な理由は次のように説明できる。D⊂R^d, f ∈C²(D→ R), a∈D,^◦ f⁰(a) = 0とする。このとき、テイラーの定理(定理 11.2.4)より、

f(a+h) =f(a) +f⁰(a)h

| {z }

+¹₂h·H(a)h+R2.

|h|^{が小さいとき、誤差} R2 は h·H(a)h に比べてはるかに小さい。従って、|h|^が小さいとき、

f(a+h)^ほぼ= f(a) +¹₂h·H(a)h (11.5) と考えてよい。つまり、

f は臨界点 aの近傍で、係数行列¹₂H(a) の2次関数で近似される。

多変数関数の臨界点が、極値点であるための十分条件をヘッシアンを用いて与える。

命題 11.3.6 (極値の判定)記号は定義11.3.5の通り、a∈D^◦,f⁰(a) = 0として、以下の条件を考える：

(a1) 全ての k= 1, ..., dに対し ∆_k(a)>0.

(a2) 全ての k= 1, ..., dに対し ∆_k(a)≥0.

(b1) 全てのk= 1, ..., d に対し(−1)^k∆_k(a)>0.

(b2) 全てのk= 1, ..., d に対し(−1)^k∆k(a)≥0.

このとき、

(i) (a1)なら aはf の狭義極小点である、即ち、ある ε >0に対し x∈B(a, ε)\{a}^ならf(x)> f(a).

(ii) (b1) なら a は f の狭義極大点である、即ち、ある ε > 0 に対しx ∈ B(a, ε)\{a} なら f(x)< f(a).

(iii) (a2),(b2)共に不成立なら、aはf の極値点でない。

厳密な証明は11.3節末尾に与えることとし、ここでは証明の概略だけを述べよう。(11.5)

を認めてf を(11.5)の右辺におきかえて考えると、行列H(a)が正定値、負定値である

かに応じaは極小、極大。線形代数によれば、そのための条件が (a1), (b1)で与えられる(補題 11.3.9参照)。また、(a2),(b2)共に不成立なら、H(a)は不定符合、従ってaは極値でない。

注1：k が偶数かつ∆k(a)<0なら(a2),(b2)共に不成立。

注2：命題 11.3.6の(a2) から a が f の極小点とは言えない。例えば、f(x) = x³ (x ∈ R),a= 0 に対しf⁰(0) = f⁰⁰(0) = 0 なので条件 (a2)は満たされるが、a= 0 は f の極値点でない。同様に命題 11.3.6の条件 (b2)から aが f の極大点とは言えない。

例 11.3.7 (x, y)∈R² の関数f(x, y) =xye⁻^x2+y

2 の極値点を調べる。

f ∈C^∞(R²) なので極値点は臨界点(命題 11.3.2)。そこでまず臨界点を求める。

f_x=y(1−x²)e⁻^x2+y

2 , f_y =x(1−y²)e⁻^x2+y

2 2 . 従って、臨界点は(0,0), ±(1,1), ±(1,−1).また、

f_xx f_xy f_yx f_yy

=e⁻^x2+y

2 2

xy(x²−3) (1−x²)(1−y²) (1−x²)(1−y²) xy(y²−3)

よって、

∆1=−3xye⁻^x2+y

2 , ∆2 ={x²y²(x²−3)(y²−3)−(1−x²)²(1−y²)²}e⁻^x²⁻^y².

これらより、

∆₁(0,0) = 0, ∆₂(0,0)<0. よって (0,0)はf の極値点でない(命題11.3.6後の注参照)。

∆1(±(1,1))<0, ∆2(±(1,1))>0. よって±(1,1)はf の狭義極大点である。

∆1(±(1,−1))>0, ∆2(±(1,−1))>0. よって±(1,−1)は f の狭義極小点である。 2 問 11.3.3 (x, y)∈R² の関数が以下のように与えられるとき、臨界点、極小点、極大点をそれぞれ求めよ：(i)x³+y³−3xy. (ii)x⁴+y⁴−10x²+16xy−10y². (iii) (x²−y²)e⁻^x²⁻^y². (iv) (2x²+y²)e^x²^+y².

３変数以上の関数に対して、命題 11.3.6を適用して極値点を調べる方法は原理的には２変数の場合（例11.3.7）と同様だが、実際の計算は面倒になることが多い。ここでは、比較的簡単に計算できる例を挙げる：

例 11.3.8 関数 ¹₃(x³+y³+z³)−xy−yz−zx, (x, y, z)∈R³ ^{の極値点を調べる。}

与えられた関数を f とおく。f ∈C^∞(R³) より、極値点は臨界点(fx =fy =fz = 0 の解)である。そこでまず臨界点を求める。

f_x=x²−y−z, f_y =y²−z−x, f_z =z²−x−y.

従って臨界点は(0,0,0), (2,2,2). 更に、





fxx fxy fxz

fyx fyy fyz

fzx fzy fzz



=





2x −1 −1

−1 2y −1

−1 −1 2z



.

よって、

∆1 = 2x, ∆2 = 4xy−1,

∆₃ = 2x(4yz−1) + (−2z−1)−(1 + 2y) = 8xyz−2(x+y+z).

(∆3 は第1行について余因子展開して求めた。)これらより、

∆₂(0,0,0)<0. よって (0,0,0)は f の極値点でない。

∆_k((2,2,2))>0 (k= 1,2,3). よって(2,2,2)はf の狭義極小点である。 2 問 11.3.4 関数 x²+y²+z²+x−2z−xy ((x, y, z)∈R³)の極値点を調べよ。

命題 11.3.6の証明に、次の補題を用いる：

補題 11.3.9 行列 S = (sij)¹≤i≤d

1≤j≤d,sij =sji に対しその主小行列式を

∆_k= det





s₁₁ . . . s_1k ... . . . ... s_k1 . . . s_kk



, k= 1, ..., d

と定め、以下の条件を考える：

(a1) 全ての k= 1, ..., dに対し ∆_k>0.

(a2) S は正定値、即ち、任意のx∈R^d\{0} に対しx·Sx >0.

(a3) 全ての k= 1, ..., dに対し ∆_k≥0.

(a4) S は半正定値、即ち、任意のx∈R^d ^に対しx·Sx≥0.

(b1) 全てのk= 1, ..., d に対し(−1)^k∆_k>0.

(b2) S は負定値、即ち、任意の x∈R^d\{0}^に対しx·Sx <0.

(b3) 全てのk= 1, ..., d に対し(−1)^k∆_k≥0.

(b4) S は半負定値、即ち、任意の x∈R^dに対しx·Sx≤0.

(c) S は不定符合である、即ち、ある x, y∈R^d\{0} ^に対しx·Sx <0< y·Sy.

このとき、

(a1) ⇐⇒ (a2) =⇒ (a3) ⇐⇒ (a4), (b1) ⇐⇒ (b2) =⇒ (b3) ⇐⇒ (b4),

証明：線形代数の教科書を参照せよ。 2

命題 11.3.6の証明：(i): (a1)と補題11.3.9より、H(a)は正定値である。a∈D^◦ より B(a, ε)⊂Dを満たすε >0 が存在する。全てのk= 1, ..., dに対し∆k ∈C(D→R)かつ∆k(a)>0. よって、必要ならε >0を更に小さくとりかえることでB(a, ε)上で全ての k= 1, ..., dに対し∆k >0 としてよい。今、x∈B(a, ε)\{a} を任意、h =x−a とする。このとき、テイラーの定理(定理11.2.4)とf⁰(a) = 0より、次のようなθ∈(0,1) が存在する：

(1) f(x)−f(a) = ¹₂h·H(a+θh)h

全ての k= 1, ..., dに対し∆_k(a+θh)>0 だから補題11.3.9より H(a+θh) は正定値、

従って (1)右辺は正である。以上よりa は極小点である。

(ii):−f を考えれば(i) に帰着する。

(iii): (a2),(b2)共に不成立ならH(a)は正定値である（補題 11.3.9）。仮定より次のようなh1, h2 ∈R^d\{0} が存在する：

(2) h1·H(a)h1 <0< h2·H(a)h2.

h_j をch_j (c >0)で置き換えても、同じ不等式が成り立つから、|h_j|< ε と仮定してよい。そこで t∈(0,1)に対しテイラーの定理(定理11.2.4)と f⁰(a) = 0 より、次のようなθ_j ∈(0,1)が存在する：

(3) f(a+th_j)−f(a) = ^t₂²h_j·H(a+θ_jth_j)h_j.

|θjthj| ≤tεと(2) より tが十分小さければ、(3)の右辺は j= 1のとき負、j= 2 のとき正である。従ってaはf の極値点でない。 2

ドキュメント内 4 II I (ページ 167-172)