例題 - C 条件付き極値問題 (Lagrange の未定乗数法 )

C 条件付き極値問題 (Lagrange の未定乗数法 )

C.3 例題

Lagrange の未定乗数法の例を二つほどあげる。いずれも意味が明らかな (高校数学でも答

が出る) 問題である。

例題 C.1 方程式 ax+by+c= 0 ((a, b)∈ R²\ {0}, c∈R) で表される平面内の曲線を L とする。点 (x, y) が直線L 上を動くときの、関数 f(x, y) =x² +y² の最小値を求めよ。

解答 (求めるものは原点と直線Lとの距離の平方になることは(直観的にすぐ)分かるだろう

から、微分法を用いなくても「解ける」問題であるが、Lagrangeの未定乗数法で求めてみる。) 1. 最小値が存在することの証明 (この問題の場合は、図形的な意味が分かるので「明らか」

であるが、そうでない場合もあるので、きちんと書くとどうなるか、紹介する意味で以下に示す。実は良く出て来る論法である。)L 上の点(x₀, y₀) を一つ取り(存在することは自明)、正数 R を R² =x²₀+y₀² で定め、D:={(x, y)∈R² |x²+y² ≤R²}とおく。Lを

L=L∩R² =L∩(D∪D^c) = (L∩D)∪(L∩D^c)

と分解すると、L∩D はR² の空でない有界閉集合であるから、関数 f は L∩D において最小値 m = f(α, β) を持つ。ところで (α, β) ∈ D であるから、m = f(α, β) = α² +β² ≤ R². 一方、L∩D^cにおいては、f(x, y) =x²+y² > R² であるから、m は f の L全体における最小値であることが分かる。

2. 唯一の極値は最小値である前段で最小値が存在することが分かったが、最小値は極値であるから、もしも極値が一つしか無いことが分かれば、それが最小値である。

3. f の条件付き極値を求める関数g: R² →R を g(x, y) :=ax+by+c で定義すると、

∇g(x, y) = ( a

b )

= 0.

したがって、条件 g(x, y) = 0 の下でのf の極値点は (もし存在するならば) Lagrange の未定乗数法で求まる。未定乗数を λ とおくと、方程式は、

0 =f_x(x, y)−λg_x(x, y), 0 =fy(x, y)−λgy(x, y), 0 =g(x, y).

これは

0 = 2x−λa, 0 = 2y−λb, 0 =ax+by+c となるから、解は

λ=− 2c

a²+b², x=− ac

a²+b², y=− bc a²+b² ただ一つだけである。

このようにLagrange の未定乗数法で求められた点が極値点であるかどうかは、一般にはすぐには分からないが、この場合は前段の議論から、これは極値点であり、さらには最小点に他ならないことが分かる⁶⁰。すなわち

(x, y) =

( −ac

a²+b², −bc a²+b²

)

のとき、f は最小値

( −ac

a²+b², −bc a²+b²

)

= c² a²+b² を取る。

問 C.8 直線 ax+by+c= 0 ((a, b)̸= (0,0)) と点 (x0, y0) との距離は、 |ax√₀+by₀+c| a²+b² であることを示せ。

問 C.9 平面ax+by+cz+d= 0 ((a, b, c)̸= (0,0,0))と点(x₀, y₀, z₀)との距離は、|ax₀√+by₀+cz₀+d| a²+b²+c² であることを示せ。

例題 C.2 方程式 x² a² +y²

b² = 1 (a,b は正の定数)表される平面内の楕円をE とする。点(x, y) が直線 E 上を動くときの、関数f(x, y) =x+y の最大値、最小値を求めよ。

解答これも図形的に考えると意味は明瞭で、Lagrange の未定乗数法を講義しなかった年度にこの問題の3次元版を期末試験に出したことがある (接平面をきちんと求めて、使いこなせるかというのが、出題のねらい)。

まずE は有界閉集合であるから、連続関数 f は E 上で最大値、最小値を持つことが分かる。また

g(x, y) := x² a² +y²

b² −1 とおくと、

∇g(x, y) =

( 2x/a² 2y/b²

)

であり、g(x, y) = 0 を満たす任意の (x, y) に対して

∇g(x, y)̸= 0

であることが分かる。ゆえに条件 g(x, y) = 0 の下での関数 f の極値は、Lagrange の未定乗数法で求まる。方程式は

0 =f_x(x, y)−λg_x(x, y), 0 =f_y(x, y)−λg_y(x, y), 0 =g(x, y).

これは

0 = 1−λ2x a², 0 = 1−λ2y

b², 0 = x²

a² +y² b² −1

60「犯人は確かに存在し、この部屋の中にいる」、「(もし存在するならば)犯人は男性である」、「この部屋の中に男性は一人だけいる」ならば、この部屋にいる唯一の男性が犯人である。

であり、

(x, y, λ) = ± (

a²

√a²+b², b²

√a²+b²,

√a² +b² 2

)

(複号同順).

f (

± a²

√a²+b²,± b²

√a²+b² )

=±√

a²+b² (複号同順).

f が最大値、最小値を持つことは既に分かっているから、これらがその最大値、最小値に他ならない。すなわち、(x, y) = (a²/√

a²+b², b²/√

a² +b²) のとき最大値√

a²+b², (x, y) = (−a²/√

a²+b²,−b²/√

a²+b²) のとき最小値−√

a²+b². 問 C.10 f(x, y) :=x+y, g(x, y) := x²

4 −y²−1,N_g :={(x, y)∈R² |g(x, y) = 0} とする。

(1) N_g の概形を描け。

(2) N_g 上の点(2√

2,1) における接線の方程式を求めよ。

(3) Lagrange の未定乗数法により、N_g 上でのf の極値の候補をすべて求めよ。

(4) Ng 上でのf の値の範囲を求めよ。

問 C.11 (最短距離は垂線で実現される) R³ の開集合 Ω で定義された C¹ 級関数g: Ω → R が、∇g(x, y, z)̸= 0 ((x, y, z)∈Ω)を満たすとする。またP(a, b, c)はR³ 内の定点とする。このとき Ng :={(x, y, z)∈(x, y, z)∈Ω|g(x, y, z) = 0}は曲面となるが、Ng 上の点Q(x0, y0, z0) で、P からの距離が最小となるものが存在するならば、それは P から N_g に下ろした垂線の足であることを示せ。

(注意多くの場合に「最短距離＝垂線の長さ」が成り立つことを知っていると思うが、これは上に示すような形で (かなり一般に) 成り立ち、証明も出来る、ということである。難しいことを問われているようだが、−→

P Q= (x₀−a, y₀−b, z₀−c)が、法線ベクトル∇g(x₀, y₀, z₀) と平行ということで、やってみるとすごく簡単である。)

問 C.12 (相加平均と相乗平均) n を任意の自然数とする。n 個の任意の正数 x₁, x₂, . . ., x_n に対して、不等式

x₁+x₂+· · ·+x_n

n ≥ √ⁿ

x₁x₂. . . x_n が成り立ち、等号が成立するためには

x₁ =x₂ =· · ·=x_n が必要十分であることを示せ (相加平均≥相乗平均)。

(注意これは凸関数の性質を用いて証明するのが簡単であるが、Lagrange の未定乗数法によって証明することも出来る。)

問 C.13 (対称行列の対角化) スピヴァックの有名な教科書[17]に載っている次の問題(5-17) の(a) を解け。(普通、固有値は特性多項式の根として特徴づけられて存在証明されるが、ここでは固有値と固有ベクトルを、条件付きの最大値問題の解として得ようということである。

いわゆる Rayleigh の原理の基礎となる事実。)

T: Rⁿ→Rⁿ を対称線型変換, A= (aij) を T の行列とする(aij =aji)． (a) f(x) = ⟨T x, x⟩=∑

a_ijxⁱx^j に対し，D_kf(x) = 2

∑n j=1

a_kjx^j であることを示せ．Sⁿ⁻¹ = {x∈Rⁿ;|x|= 1} 上での f の最大値を考えることにより，T x=λx となる x∈Sⁿ⁻¹ およびλ∈R が存在することを示せ．

(b) この xに対し，V ={x∈Rⁿ | ⟨x, y⟩= 0} と置くとき，T(V)⊂V およびT: V →V が対称線型変換であることを示せ．

(b), (c) は多くの線形代数のテキストに書いてあるので探せば見つかると思う。自力で(b), (c)

を解いてみたくなった人のために: 対称線型変換の定義については、やはり問題 (4-11) 中で定義されている。

T を V 上の内積，f: V → V を線型変換とする．x, y ∈ V に対して T(x, f(y))) = T(f(x), y) が成り立つとき，f を T に関する対称変換と言う．v₁, · · ·, v_n が T に関する

正交基底(正規直交基底のこと)，この基底に関するf の行列 A= (a_ij)が対称行列(すな

わちa_ij =a_ji)であることを示せ．

D ^{陰関数定理を覚える}

結構長いから、段階的に詳細化するのが一つの手である。これを説明してみよう。陰関数定理とは、授業でも言ったのだが、2 変数の

F(x, y) = 0 を1 つの変数 (ここで y とする) について

y =φ(x)

のように解くための定理であり、そのために一番重要な仮定が det∂F

∂y(a, b)̸= 0 である⁶¹。つまり、もの凄く乱暴に言うと

第1近似

det∂F

∂y(a, b)̸= 0 ならば、F(x, y) = 0 は y =φ(x)と解ける。

これを見ると、(a, b)って一体なんだろう？φって一体なんだろう？「解ける」とはどういうことか？と疑問が湧いて来る (そうでないといけない)。例えば、まず(a, b) について少し書き

61この仮定がもしも覚えにくければ、F が 1 次関数、つまりF(x, y) =Ax+By+c の場合を考えると良いかもしれない。つまりAx+By+c= 0から、By=−Ax−cとしておいて、次にやりたいのはB⁻¹を左からかけること。そのためにはdetB̸= 0 という仮定をおきたい。そしてB= ∂F

∂y である。ということで、仮定が det∂F

∂t ̸= 0であるのはもっともらしい。

足すことにしよう。F(x, y) = 0が「全体で」解けることは一般には望めなくて、注目している点の近くだけで解けることくらいしか期待できない。その注目している点が (a, b)ということだ。それは F(x, y) = 0 の上にある。そこで次のようにする。

第2近似

F(a, b) = 0, det∂F

∂y(a, b)̸= 0 ならば、F(x, y) = 0 は、(a, b) のある近傍でy=φ(x) と解ける。

φというのは、陰関数で、この存在を主張しているのが大事なところ、という話もした。そこでそれをはっきり言ってみよう。

第3近似

F(a, b) = 0, det∂F

∂y(a, b)̸= 0 ならば、あるC¹ 級の関数φが存在して、(a, b) のある近傍で、F(x, y) = 0 ⇔ y=φ(x) が成り立つ。

大部よくなって来た。採点基準は実は結構甘いのであまり言いたくないが、それによるとこの状態の答案には (満点はやらないが) 結構イイ点がつく、とだけ言っておこう。次がちょっと大変だ。ある近傍と言うのが U ×V である。その U,V というのが、φ については定義域と終域、つまり φ:U →V で、U はa の開近傍、V はb の開近傍ということである。これらは一部だけ書いて全部は書かないというのは変なので、次は一気に書くことが増える (と言っても分量で 1 行未満の増加)。

第4近似

F(a, b) = 0, det∂F

∂y(a, b) ̸= 0 ならば、a のある開近傍 U, b のある開近傍 V, ある C¹ 級の関数 φ: U →V が存在して、∀(x, y)∈U ×V について、F(x, y) = 0 ⇔y =φ(x)が成り立つ。

お好みならば、黒板文体もあるな。

第4近似^′

F(a, b) = 0, det∂F

∂y(a, b)̸= 0 =⇒(∃U: aのある開近傍) (∃V: bのある開近傍) (∃φ: U →V C¹ 級) s.t. ∀(x, y)∈U ×V F(x, y) = 0 ⇔ y=φ(x).

そろそろF についても、ちゃんと書かないとまずいだろう。

Ωは R^m×Rⁿ の開集合で、F: Ω→Rⁿ は C¹ 級の写像とし、(a, b)∈Ω とする。

というのを書き足す。C¹ というのは、そんなに難しくないであろう。∂F

∂y や ∂F

∂x が出て来るのだから。x が m 次元ベクトル、y が n 次元ベクトルとするとき、F の値も n 次元ベクトルというのが押えておきたいところである。これも授業中にしゃべったが、そうしておくことで、∂F

∂y が正方行列になって(そうでないと det も考えられない)、まともな逆が存在する可能性か生じるのである(ここら辺は線形代数がちゃんと身についているかだな)。

第5近似

ΩはR^m×Rⁿの開集合で、F: Ω→RⁿはC¹級の写像とし、(a, b)∈Ωとする。F(a, b) = 0, det∂F

∂y(a, b)̸= 0ならば、aのある開近傍U,bのある開近傍V,あるC¹級の関数φ: U →V が存在して、∀(x, y)∈U ×V について、F(x, y) = 0 ⇔ y=φ(x) が成り立つ。

後はU×V ⊂Ωを入れるくらいか。導関数の公式φ^′(x) = − (∂F

∂y(x, φ(x)) )₋1

∂F

∂x(x, φ(x)) は書いておかなくても、φがC¹ と分かっていれば後から自前で出せる(出せないといけない)。

第6近似

ΩはR^m×Rⁿの開集合で、F: Ω→RⁿはC¹級の写像とし、(a, b)∈Ωとする。F(a, b) = 0, det∂F

∂y(a, b)̸= 0ならば、aのある開近傍U,bのある開近傍V,あるC¹級の関数φ: U →V が存在して、∀(x, y)∈U×V について、F(x, y) = 0⇔y=φ(x),U×V ⊂Ωが成り立つ。

これで一応の出来上がり。

E 多変数実数値関数に関する中間値の定理

多変数関数では、区間 [a, b] をどのように一般化するかが問題である。結論を先に言うと、

ある意味で区間を一般化した「連結集合」を用いる。

定義 E.1 (連結集合) Ω ⊂ Rⁿ とするとき、Ω が連結(connected) であるとは、Ω 内の任意の2点 x, y に対して、Ω 内の連続曲線で xと y を結ぶものが存在する、すなわち

(∀x∈Ω) (∀y∈Ω) (∃φ: [0,1]→Ω連続) φ(0) = xかつ φ(1) =y が成り立つことをいう。

注意 E.2 (連結性の定義について) 実は、一般の位相空間論においては、連結性は、上とは違っ

た (あまり直観的でない) やり方で定義される。上の定義の条件を満足する集合は、^{こじょうれんけつ}弧状連結

(arcwise connected)と呼ばれるのが普通である。しかし、Rⁿ の開集合においては、連結＝

弧状連結なので、ここでは簡単で直観的な定義法を採用した。連結性の一般的な定義については、講義科目「トポロジー」で学ぶことが出来る。

Ω⊂R とするとき、Ω が連結であるためには、Ωが区間であることが必要十分である。

問そのことを証明せよ。

定理 E.3 ((多変数関数に関する) 中間値の定理) Ω は Rⁿ の連結な部分集合、f: Ω→R は連続ならば、次のことが成り立つ。

(∀a∈Ω) (∀b ∈Ω) (∀k ∈R: f(a)< k < f(b)) (∃c∈Ω) f(c) = k.

(板書の図が大事なのです…手書きのを取り込むかな？)

証明 Ω が連結であるという仮定から、a と b を結ぶ Ω内の曲線 φが取れる: φ: [α, β]→Ω 連続, φ(α) =a, φ(β) = b.

ドキュメント内数学解析 (ページ 152-162)

例題

C 条件付き極値問題 (Lagrange の未定乗数法 )

C.3 例題

D 陰関数定理を覚える

E 多変数実数値関数に関する中間値の定理

D ^{陰関数定理を覚える}