E = {(x, y, z)∈[0,∞)3; x2 a2 +y2
b2 +z2 c2 = 1}, D = {(s, t)∈[0,∞)2; s+t≤1}
とすると、(x, y, z)∈E に(s, t) = (xa22,yb22)∈Dを対応させる写像は全単射かつ、
xyz=abcp
st(1−s−t).
よって
f(s, t) =st(1−s−t), (s, t)∈D
を最大にすればよい。Dはコンパクト、f は連続だからf は最大値を持つが、Dの境界 では st(1−s−t) = 0 だから、最大点はD◦ 内にある。また、最大点は極大点、f は可微 分だから最大点は臨界点(命題 11.3.2)。一方、
fs=t(1−2s−t), ft=s(1−2t−s).
よって、D◦ 内の臨界点(fs=ft= 0の解)は(1/3,1/3)のみである。従ってf(1/3,1/3) = 1/27 がf の最大値。以上から、求める最大値は abc
3√
3. 2
問 11.3.2 a1, ..., ad>0 は定数、x1, ..., xd ≥0, xa212 1
+...+ xa2d2 d
= 1とし積 x1· · ·xd の最 大値を求めよ。
次に多変数関数の臨界点が、極値点であるための十分条件を2階の微分を用いて与える。
そのためにまず次の定義をおく:
定義 11.3.5 (ヘッシアン)D⊂Rd, f ∈ C2(D →R), x ∈D◦ とする。次の行列 H(x) をf の xにおけるヘッシアン(Hessian)と言う:
H(x) =
∂1∂1f(x) . . . ∂1∂df(x) ... . . . ...
∂d∂1f(x) . . . ∂d∂df(x)
,
また、ヘッシアンH(x) の小行列式を次のように記す:
∆k(x) = det
∂1∂1f(x) . . . ∂1∂kf(x) ... . . . ...
∂k∂1f(x) . . . ∂k∂kf(x)
, k= 1, ..., d.
多変数関数の臨界点近傍の挙動を調べる上で、ヘッシアンが重要な理由は次のように説 明できる。D⊂Rd, f ∈C2(D→ R), a∈D,◦ f0(a) = 0とする。このとき、テイラーの 定理(定理 11.2.4)より、
f(a+h) =f(a) +f0(a)h
| {z }
=0
+12h·H(a)h+R2.
|h|が小さいとき、誤差 R2 は h·H(a)h に比べてはるかに小さい。従って、|h|が小さ いとき、
f(a+h)ほぼ= f(a) +12h·H(a)h (11.5) と考えてよい。つまり、
f は臨界点 aの近傍で、係数行列12H(a) の2次関数で近似される。
多変数関数の臨界点が、極値点であるための十分条件をヘッシアンを用いて与える。
命題 11.3.6 (極値の判定)記号は 定義11.3.5の通り、a∈D◦,f0(a) = 0として、以下の 条件を考える:
(a1) 全ての k= 1, ..., dに対し ∆k(a)>0.
(a2) 全ての k= 1, ..., dに対し ∆k(a)≥0.
(b1) 全てのk= 1, ..., d に対し(−1)k∆k(a)>0.
(b2) 全てのk= 1, ..., d に対し(−1)k∆k(a)≥0.
このとき、
(i) (a1)なら aはf の狭義極小点である、即ち、ある ε >0に対し x∈B(a, ε)\{a}な らf(x)> f(a).
(ii) (b1) なら a は f の狭義極大点である、即ち、ある ε > 0 に対しx ∈ B(a, ε)\{a} なら f(x)< f(a).
(iii) (a2),(b2)共に不成立なら、aはf の極値点でない。
厳密な証明は11.3節末尾に与えることとし、ここでは証明の概略だけを述べよう。(11.5)
を認めてf を(11.5)の右辺におきかえて考えると、行列H(a)が正定値、負定値である
かに応じaは極小、極大。線形代数によれば、そのための条件が (a1), (b1)で与えられ る(補題 11.3.9参照)。また、(a2),(b2)共に不成立なら、H(a)は不定符合、従ってaは 極値でない。
注1:k が偶数かつ∆k(a)<0なら(a2),(b2)共に不成立。
注2: 命題 11.3.6の(a2) から a が f の極小点とは言えない。例えば、f(x) = x3 (x ∈ R),a= 0 に対しf0(0) = f00(0) = 0 なので条件 (a2)は満たされるが、a= 0 は f の極値点でない。同様に 命題 11.3.6の条件 (b2)から aが f の極大点とは言えない。
例 11.3.7 (x, y)∈R2 の関数f(x, y) =xye−x2+y
2
2 の極値点を調べる。
f ∈C∞(R2) なので極値点は臨界点(命題 11.3.2)。そこでまず臨界点を求める。
fx=y(1−x2)e−x2+y
2
2 , fy =x(1−y2)e−x2+y
2 2 . 従って、臨界点は(0,0), ±(1,1), ±(1,−1).また、
Ã
fxx fxy fyx fyy
!
=e−x2+y
2 2
Ã
xy(x2−3) (1−x2)(1−y2) (1−x2)(1−y2) xy(y2−3)
!
よって、
∆1=−3xye−x2+y
2
2 , ∆2 ={x2y2(x2−3)(y2−3)−(1−x2)2(1−y2)2}e−x2−y2.
これらより、
∆1(0,0) = 0, ∆2(0,0)<0. よって (0,0)はf の極値点でない(命題11.3.6後の注参照)。
∆1(±(1,1))<0, ∆2(±(1,1))>0. よって±(1,1)はf の狭義極大点である。
∆1(±(1,−1))>0, ∆2(±(1,−1))>0. よって±(1,−1)は f の狭義極小点である。 2 問 11.3.3 (x, y)∈R2 の関数が以下のように与えられるとき、臨界点、極小点、極大点を それぞれ求めよ:(i)x3+y3−3xy. (ii)x4+y4−10x2+16xy−10y2. (iii) (x2−y2)e−x2−y2. (iv) (2x2+y2)ex2+y2.
3変数以上の関数に対して、命題 11.3.6を適用して極値点を調べる方法は原理的には2 変数の場合(例11.3.7)と同様だが、実際の計算は面倒になることが多い。ここでは、比 較的簡単に計算できる例を挙げる:
例 11.3.8 関数 13(x3+y3+z3)−xy−yz−zx, (x, y, z)∈R3 の極値点を調べる。
与えられた関数を f とおく。f ∈C∞(R3) より、極値点は臨界点(fx =fy =fz = 0 の 解)である。そこでまず臨界点を求める。
fx=x2−y−z, fy =y2−z−x, fz =z2−x−y.
従って臨界点は(0,0,0), (2,2,2). 更に、
fxx fxy fxz
fyx fyy fyz
fzx fzy fzz
=
2x −1 −1
−1 2y −1
−1 −1 2z
.
よって、
∆1 = 2x, ∆2 = 4xy−1,
∆3 = 2x(4yz−1) + (−2z−1)−(1 + 2y) = 8xyz−2(x+y+z).
(∆3 は第1行について余因子展開して求めた。)これらより、
∆2(0,0,0)<0. よって (0,0,0)は f の極値点でない。
∆k((2,2,2))>0 (k= 1,2,3). よって(2,2,2)はf の狭義極小点である。 2 問 11.3.4 関数 x2+y2+z2+x−2z−xy ((x, y, z)∈R3)の極値点を調べよ。
命題 11.3.6の証明に、次の補題を用いる:
補題 11.3.9 行列 S = (sij)1≤i≤d
1≤j≤d,sij =sji に対しその 主小行列式を
∆k= det
s11 . . . s1k ... . . . ... sk1 . . . skk
, k= 1, ..., d
と定め、以下の条件を考える:
(a1) 全ての k= 1, ..., dに対し ∆k>0.
(a2) S は正定値、即ち、任意のx∈Rd\{0} に対しx·Sx >0.
(a3) 全ての k= 1, ..., dに対し ∆k≥0.
(a4) S は半正定値、即ち、任意のx∈Rd に対しx·Sx≥0.
(b1) 全てのk= 1, ..., d に対し(−1)k∆k>0.
(b2) S は負定値、即ち、任意の x∈Rd\{0}に対しx·Sx <0.
(b3) 全てのk= 1, ..., d に対し(−1)k∆k≥0.
(b4) S は半負定値、即ち、任意の x∈Rdに対しx·Sx≤0.
(c) S は不定符合である、即ち、ある x, y∈Rd\{0} に対しx·Sx <0< y·Sy.
このとき、
(a1) ⇐⇒ (a2) =⇒ (a3) ⇐⇒ (a4), (b1) ⇐⇒ (b2) =⇒ (b3) ⇐⇒ (b4),
(c) ⇐⇒ (a3),(a4) 共に不成立.
証明: 線形代数の教科書を参照せよ。 2
命題 11.3.6の証明:(i): (a1)と 補題11.3.9より、H(a)は正定値である。a∈D◦ より B(a, ε)⊂Dを満たすε >0 が存在する。全てのk= 1, ..., dに対し∆k ∈C(D→R)か つ∆k(a)>0. よって、必要ならε >0を更に小さくとりかえることでB(a, ε)上で全て の k= 1, ..., dに対し∆k >0 としてよい。今、x∈B(a, ε)\{a} を任意、h =x−a と する。このとき、テイラーの定理(定理11.2.4)とf0(a) = 0より、次のようなθ∈(0,1) が存在する:
(1) f(x)−f(a) = 12h·H(a+θh)h
全ての k= 1, ..., dに対し∆k(a+θh)>0 だから補題11.3.9より H(a+θh) は正定値、
従って (1)右辺は正である。以上よりa は極小点である。
(ii):−f を考えれば(i) に帰着する。
(iii): (a2),(b2)共に不成立ならH(a)は正定値である(補題 11.3.9)。仮定より次のよう なh1, h2 ∈Rd\{0} が存在する:
(2) h1·H(a)h1 <0< h2·H(a)h2.
hj をchj (c >0)で置き換えても、同じ不等式が成り立つから、|hj|< ε と仮定してよ い。そこで t∈(0,1)に対しテイラーの定理(定理11.2.4)と f0(a) = 0 より、次のよう なθj ∈(0,1)が存在する:
(3) f(a+thj)−f(a) = t22hj·H(a+θjthj)hj.
|θjthj| ≤tεと(2) より tが十分小さければ、(3)の右辺は j= 1のとき負、j= 2 のと き正である。従ってaはf の極値点でない。 2