多変数関数の微分:第
10
回
6月23日 清野和彦7.5
行列を使った記法と変数変換
7.5.1 行列の掛け算を利用して公式を書きなおす 第 7.2.5 節「一般の場合」の微分公式 ∂φ ∂si = m ∑ j=1 ∂f ∂xj ∂ξj ∂si (1) のように ∑ を使ってまとめられた式を見ると何かを思い出しませんか? そう、行 列とベクトルの掛け算です。実際、たとえば φi = ∂φ ∂si fj = ∂f ∂xj xji = ∂ξj ∂si とおくと、式 (1) は φ1 φ2 .. . φn = ∑m j=1fjxj1 ∑m j=1fjxj2 .. . ∑m j=1fjxjn = ∑m j=1xj1fj ∑m j=1xj2fj .. . ∑m j=1xjnfj = x11 x21 · · · xm1 x12 x22 · · · xm2 .. . ... . .. ... x1n x2n · · · xmn f1 f2 .. . fm とまとめられます。 このまとめ方でもちろんよいのですが、第 5.2.2 節「三つの微分の関係」で f (x, y) の二つの偏微分を理由があって縦に並べずに横に並べたので、それに合わせてお いた方がよいでしょう。つまり、上のまとめ方で行と列を取り替えるわけです。 [φ1, φ2,· · · , φn] = [f1, f2, . . . , fm] x11 x12 · · · x1n x21 x22 · · · x2n .. . ... . .. ... xm1 xm2 · · · xmn とするわけです。第 5.2.2 節で紹介した記号は dφ = [φ1, φ2,· · · , φn] = [ ∂φ ∂s1 , ∂φ ∂s2 , · · · , ∂φ ∂sn ] df = [f1, f2,· · · , fm] = [ ∂f ∂x1 , ∂f ∂x2 , · · · , ∂f ∂xm ] というものでした。これを使うと、合成関数の微分公式は dφ = df ∂ξ1 ∂s1 ∂ξ1 ∂s2 · · · ∂ξ1 ∂sn ∂ξ2 ∂s1 ∂ξ2 ∂s2 · · · ∂ξ2 ∂sn .. . ... . .. ... ∂ξm ∂s1 ∂ξm ∂s2 · · · ∂ξm ∂sn というふうに 横ベクトル df に「中に入れた方の関数たち」の偏微分で作った行列を 右から掛けると dφ になる という形でまとめることができます。 1変数と 2 変数の場合で具体的に書いてみましょう。 φ(s) = f◦ ξ(s) = f(ξ(s)) のときは dφ ds = df dx dξ ds ですが、それぞれを成分が一つしかない横ベクトルと 1 行 1 列の行列と思えば [ dφ ds ] = [ df dx ] [ dξ ds ] というふうに上で説明した行列とベクトルの掛け算の形になります。 φ(s, t) = f (ξ(s, t)) のときは [ ∂φ ∂s, ∂φ ∂t ] = [ df dx ] [ ∂ξ ∂s, ∂ξ ∂t ] です。 φ(s) = f (ξ(s), η(s))のときは [ dφ ds ] = [ ∂f ∂x, ∂f ∂y ] dξ ds dη ds となります。
最後に φ(s, t) = f (ξ(s, t), η(s, t)) のときは [ ∂φ ∂s, ∂φ ∂t ] = [ ∂f ∂x, ∂f ∂y ] ∂ξ ∂s ∂ξ ∂t ∂η ∂s ∂η ∂t となります。一貫して 関数たちは縦に、変数たちは横に並べる という形になっているのです。 このまとめ方はいかにもご都合主義、上手く利用できたから利用したに過ぎな いように見えるでしょう。ところが、このようにまとめてみることで、あるいは このようにまとめることができるということの意味を積極的に探ってみることで、 「微分とは何か」ということが明らかになるのです。ただし、その話はこのゼミの レベルを超えていますので、扱わないことにします。 7.5.2 変数変換と合成関数の微分公式 合成関数の微分公式を行列で表す理由には深入りしないと言っておきながら、な ぜそのようなまとめ方を紹介したかというと、行列の記法をつかうことで変数変 換に関する偏微分の振る舞いを簡潔に表示することができるからです。 合成関数という概念が、 古い変数の関数に新しい変数の関数を代入することで新しい変数の関 数を得る というものであるために、その微分公式も 古い変数での微分と新しい変数での微分を使って新しい変数での微分 を書き表す というように、古い変数と新しい変数の入り混じった等式になってしまうのです。 これを、 古い変数での微分を新しい変数での微分で表す というように、等式の片側は古い変数による微分のみで反対側は新しい変数によ る微分のみという形に変形できていると、とても便利になります。ここでは、合 成する関数たち(中に入れる関数たち)が変数変換になっている場合には、行列 を使った記法を使うと合成関数の微分公式を簡単に 古い変数による偏微分たち = 新しい変数による偏微分たちの式
という便利な形に変形できることを説明します。 まず、1 変数関数の場合で考えてみましょう。f (x) に x = ξ(s) を代入してでき る合成関数を考えます。2 変数関数の場合と比較しやすいようにするために、合成 関数の記号を使わずに文字を変えて φ(s) と書くことにします。φ(s) = f ◦ ξ(s) で す。合成関数の微分法により dφ ds(s) = df dx(ξ(s)) dξ ds(s) となりますが、この式の登場人物のうち dg/ds と dξ/ds は s の関数で、df /dx は (今は x に ξ(s) が入っているから s の関数ですが、本来は)x の関数なので、右辺 には x の関数と s の関数が混ざってしまっていて不便です。これを、たとえば左 辺は s の関数のみで右辺は x の関数のみという形に変形したい、というのが我々 の望みです。 しかし、そんなことは簡単なことに見えます。両辺を dξ/ds(s) で割れば完了で す。と思いきや、dξ/ds が 0 になってしまう s が存在したらアウトです。ここで、 もし ξ(s) が逆関数 s = σ(x) を持つなら、逆関数の微分法から dξ ds(s) = 1 dσ dx(ξ(s)) ですので、dξ/ds(s) で割ることは dσ/dx(x) を掛けることと同じになります。と いっても、x = ξ(s) を実際に逆に解いて s = σ(x) を求めてしまってはもとの黙阿 弥です。なぜなら σ(x) は x の関数だからです。そうではなくて、逆関数の微分法 は(というか逆関数が微分できるということは) 任意の s について dξ ds(s) は 0 にならない ということ教えてくれているわけです。だから、もし ξ(s) が逆関数を持つなら、 別な言葉で言うと x = ξ(s) が変数変換なら 両辺を dξds(s)で割ることができて、我々の希望がかなうわけです。割った後の式を 書いておきましょう。ただ、見た目が自然になるように左辺と右辺を入れ替えて おきます。 df dx(ξ(s)) = dφ ds(s) dξ ds(s) となります。 例 7. ξ(s) = tan s (−π/2 < s < π/2) のばあい、 df dx(tan s) = dφ ds(s) cos 2s
となります。これは、もちろん合成関数の微分公式 dφ ds(s) = d(f (tan s)) ds (s) = df dx(tan s) d tan s ds = df dx(tan s) 1 cos2s の両辺に 1/ tan′s = cos2s を掛けただけです。 ■ 上の例のように、1 変数関数の場合にははっきり言って別にありがたくもないも のです。しかし、変数が増えるとありがたみが増してくるのです。 例によって f (x, y) に x = ξ(s, t) と y = η(s, t) を代入してできる合成関数を φ と書くことにします。 φ(s, t) = f (ξ(s, t), η(s, t)) です。合成関数の微分公式を行列でまとめたものは [ φs(s, t), φt(s, t) ] =[fx(ξ(s, t), η(s, t)), fy(ξ(s, t), η(s, t)) ][ ξs(s, t) ξt(s, t) ηs(s, t) ηt(s, t) ] でした。左辺の成分は s と t を変数とする関数だけですが、右辺の成分には(本 来は)x と y を変数とする関数と s と t を変数とする関数が混ざってしまってい ます。それを解消するには、右辺に現れている 2 行 2 列の行列の逆行列を両辺に右 から掛ければ実現できます。しかし、任意の (s, t) について右辺の行列は逆行列を 持つのでしょうか? 1変数関数のときと同様に、x = ξ(s, t), y = η(s, t) が変数変化なら逆行列を持つ のです。ただし、これらが変数変換であるとは、x と y の微分可能な関数 σ と τ で、
x = ξ(σ(x, y), τ (x, y)) y = η(σ(x, y), τ (x, y))
および s = σ(ξ(s, t), η(s, t)) t = τ (ξ(s, t), η(s, t)) (2) の成り立つものが存在することです。(微分可能性のことを無視すれば、要するに 「x = ξ(s, t), y = η(s, t) が逆に解ける」ということです。)このとき、問題の行列 の逆行列を σ と τ の偏微分使って作ることができます。例えば、二つの式 (2) に それぞれ合成関数の微分公式を適用すると、 ∂s ∂s(s, t) = ∂t ∂t(s, t) = 1 ∂s ∂t(s, t) = ∂t ∂s(s, t) = 0 であることから、 [ 1, 0]=[σx, σy ][ ξs ξt ηs ηt ] [ 0, 1]=[τx, τy ][ ξs ξt ηs ηt ]
が得られます。二つの式の右辺の行列が同じものなので、この二つの等式を一つ にまとめて、 [ 1 0 0 1 ] = [ σx σy τx τy ] [ ξs ξt ηs ηt ] と書くことができます。これは、我々が逆行列を欲しがっていた行列が逆行列を 持つこと、具体的には [ ξs ξt ηs ηt ]−1 = [ σx σy τx τy ] が成り立っていることを意味しています。 以上により、x = ξ(s, t), y = η(s, t) が (x, y) を (s, t) に変換する変数変換な らば、 [ fx(ξ(s, t), η(s, t)), fy(ξ(s, t), η(s, t)) ] =[φs(s, t), φt(s, t) ][ ξs ξt ηs ηt ]−1 (3) というように、 古い変数での偏微分たちを新しい変数での偏微分たちで表す という形に変形できることが分かりました。 注意. 変数変換 x = ξ(s, t), y = η(s, t)が具体的に与えられると、ついつい逆に解いて逆 変換 s = σ(x, y), t = τ (x, y)を求めたくなるものですが、それは必要ありません、という か求めてはいけません。それを求めて、逆行列をσ とτ の偏微分たちで表してしまうと、 また (x, y)の関数と (s, t)の関数が混ざってしまうからです。ξ とη の偏微分たちを使っ て逆行列を表示することが、変数の混ざりを解消するポイントなのです。★ 例 8. 最もよくお目にかかる変数変換は極座標変換 x = r cos θ y = r sin θ でしょう1。これまでも連続性の証明などに何度か使ってきました。これを例に、 式 (3) を使ってみましょう。 物理では、ある物理量を直交座標で表す関数 f (x, y) を考えたいけれども、状況 が原点について対称性を持っていたりして極座標で考察した方がよい場合がよく あります。もちろん、同じ物理量を極座標で表す関数 φ(r, θ) は φ(r, θ) = f (r cos θ, r sin θ) 1これは一対一ではないので定義域に制限を付けなければ変数変換になっていません。例えば r > 0, 0≤ θ < 2π と制限しているものと考えてください。
というように簡単に得られてしまいます。ところが、直交座標系による偏微分が 物理的に意味を持っていることもよくあるのです。つまり、fx(x, y) や fy(x, y)を 極座標で考察したいのです。すなわち、 ∂f ∂x(r cos θ, r sin θ) ∂f
∂y(r cos θ, r sin θ)
を φ(r, θ) によって表わしたいというわけです。まさに式 (3) の出番であることが わかるでしょう。 今の場合 ξ(r, θ) = r cos θ η(r, θ) = r sin θ なので、 [ ξr ξθ ηr ηθ ] = [ cos θ −r sin θ sin θ r cos θ ] です。(変数は、一般論での s に当たるのが r で t に当たるのが θ であることに 気をつけてください。)よって、 [ ∂f ∂x, ∂f ∂y ] = [ ∂φ ∂r, ∂φ ∂θ ] [ cos θ −r sin θ sin θ r cos θ ]−1 となります。2 行 2 列の行列の逆行列は簡単に計算できて、 [ cos θ −r sin θ sin θ r cos θ ]−1 = 1 r [ r cos θ r sin θ − sin θ cos θ ] です。行列の掛け算を実行して、 ∂f ∂x = ∂φ ∂r cos θ− 1 r ∂φ ∂θ sin θ ∂f ∂y = ∂φ ∂r sin θ + 1 r ∂φ ∂θ cos θ となるわけです。 念のためにこの式の意味を確認しておきましょう。左辺の fx や fy は (x, y) の 関数ですが、そこに x = r cos θ, y = r sin θ を入れてやると右辺の関数になる、と いうことです。 ■ もちろん、f は全微分可能でさえあればどんな関数でも結構です。そして、φ は f が与えられれば自動的に決まります。ということは、上の式の中の f とか φ は 余計だとも考えられます。そう考えて f と φ を消してしまい、 ∂ ∂x = ∂ ∂rcos θ− 1 r ∂ ∂θ sin θ ∂ ∂y = ∂ ∂rsin θ + 1 r ∂ ∂θ cos θ と書くこともよくあります。気持は、
x や y で偏微分するという操作を r や θ で偏微分するという操作で 表す ということです。もちろん、左辺の操作を施される関数に極座標変換を施したも のが右辺の操作を施される関数であることは暗黙の了解です。 この「操作」という考えになれるために、2 階微分を計算する問題を出題してお きます。 問題 36. 例 8 の状況で、さらに関数 f が C2 級であるとする。 ∂2f ∂x2(r cos θ, r sin θ) + ∂2f
∂y2(r cos θ, r sin θ)
を φ の偏微分や 2 階偏微分を使って表せ。
8
条件付き極値問題
第 6 章で考察した「極大極小を探す」という問題意識に第 7 章で学んだ合成関 数の微分公式を組み合わせることで、条件付き極値問題というものの一般的な解 法であるラグランジュの未定乗数法というものを得るのがこの章の目標です。8.1
条件付き極値問題とは
第 6 章で説明した極値判定では、2 変数関数の定義域を暗黙のうちにR2 全体と 考えていました。しかし、実際に出会う関数は、考えている対象のさまざまな事 情により定義域が狭まっていることがよくあります。例えば「原点からの距離が 1 以下の点しか意味を持たない」すなわち、定義域が R2 全体ではなく x2+ y2 ≤ 1 という単位円板だけに制限されていたりするわけです。あるいは、もっと極端に 円周上の点、すなわち x2 + y2 = 1 を満たす (x, y) だけが意味を持つような場合 もあるでしょう。 定義域が単位円板 x2+ y2 ≤ 1 の場合、f(x, y) の極値を調べるには、定義域のこ とは忘れてとりあえず停留点を求めてしまったあと、x2+ y2 ≤ 1 を満たす停留点 についてのみ以前学んだ判定法などを使って極大か極小かを判定すればよい、と 思うかも知れませんが、これでは少し考察が足りません。定義域の境界である円 周 x2+ y2 = 1 上では、定義域を忘れて考えた極値をとる点でなくても定義域を制 限した上での極値をとっている可能性があるからです。これは、1 変数関数 f (x) の定義域を f (x) が意味を持ちうる範囲全体よりも狭い区間に制限した場合、極大 極小(というより最大最小ですが)は f′(x) = 0 を満たす点の他に区間の端も候補 に入れて考えなければならなかったという事情にあたっています。 1変数関数の場合には定義域の端はいくつかの点でしかなかったので、そこでの 関数の値を具体的に計算してみるだけで話は済んだのですが、上の例のように、2変数関数の場合定義域の端(境界)は曲線になるので、関数の定義域を境界だけ に制限してもそれについての極大極小を調べるのは 1 変数関数の極大極小を調べ るのと同じくらいの手間が掛かることになります。 定義域が x2+ y2 ≤ 1 である場合、定義域の中での極値を判定法などで調べ、定 義域の境界での極値を何らかの方法で調べ、最後にその結果を比較して極大極小 を判定することになるでしょう。だから、この節では f (x, y) の定義域を中身のな い集合に制限した場合、つまり x2+ y2− 1 = 0 のように定義域がある 2 変数関数 g(x, y)の零点、すなわち g(x, y) = 0 を満たす点に限られている場合の極大極小を 考えることにしましょう。定義域に対するこのような条件の下で極大極小を調べ ることを条件付き極値問題と言います。 図形的にイメージしてみましょう。z = f (x, y) のグラフを地面の起伏とします。 また、g(x, y) = 0 で決まる曲線を地図上の(あるいは地面を真上から見たときの) 道とします。この道は z = f (x, y) で表されるデコボコを持った地面の上にあるの ですから、地図の上では(あるいは上空から見たのでは)分かりませんが、実際に は上り下りのある道です。条件付き極値問題とは、地面全体の起伏の情報 f (x, y) と地図上での道の情報 g(x, y) = 0 から実際の道の起伏を調べる問題といえます。 ただし、このような問題は、2 変数関数の定義域を曲線に限る場合だけに発生す るものではありません。例えば 3 変数関数の定義域を曲面や曲線に限る場合も考え られますし、もっと変数の多い場合も同様に考えられます。2 変数関数の定義域を 曲線に限ることは、以下で説明するように実質的には 1 変数関数の極大極小を調 べることに当たっており多変数関数特有の現象が(全くないわけではありません が)半減してしまいます。とは言え一般の多変数関数を扱うことは手に余ります。 そこで、3 変数関数の定義域を曲面に限る場合、つまり、f (x, y, z) という関数の g(x, y, z) = 0 という条件の下での極値問題もあわせて考えることにしましょう。 2変数関数の条件付き極大極小の定義をはっきり書くと、 条件付き極大極小 2変数関数 f (x, y) が点 (a, b) で条件 g(x, y) = 0 の下での極小値を取るとは、 g(a, b) = 0であり、(a, b) を中心とした半径 r の円に属する (x, y) で g(x, y) = 0 を満たすものについては f (x, y)≥ f(a, b) が成り立つことを言う。 不等号の向きを逆にしたものが極大値を取ることの定義である。 となります。3 変数関数の条件付き極大極小の定義は、上の定義で (x, y) と (a, b) をそれぞれ (x, y, z) と (a, b, c) で置きかえれば出来上がります。
8.2
条件付き極値問題をどのように解くか
条件付き極値問題にどのようにアプローチするかを 2 変数関数の場合で考えて みましょう。どうすれば条件 g(x, y) = 0 の下での f (x, y) の極大極小を見つけることができるでしょうか? 具体例で考えてみましょう。 f (x, y) = 2x2+ y2, g(x, y) = x2+ y2− 1 とします2。f (x, y) が調べたい関数で g(x, y) = 0 が条件です。反対にならないよ うにくれぐれもご注意下さい。 まず思いつくのは g(x, y)の零点は単位円なのだからパラメタ付けしてしまえばよい ということでしょう。実際、 x = cos t, y = sin t とすれば g(x, y) = 0 を満たすすべての点を表せます。だから、これを f (x, y) の x と y に代入してできる t の関数の極大極小を調べればよいわけです。具体的には、
φ(t) = f (cos t, sin t) = 2 cos2t + sin2t = cos2t + 1
によって φ(t) を定義して、これの極大極小を調べるわけです。これは普通の 1 変 数関数なのですから極大極小をいつものように調べることができます。まず、 φ′(t) =−2 cos t sin t = 0 を解いて t = n 2π n = 1, 2, 3, . . . とし、あとは増減表を書くなり 2 階微分を考えるなりすれば極大と極小が判定で きます。例えば、2 階微分の方法を使うと、 φ′′(t) = 2 sin2t− 2 cos2t となるので、 φ′′ ( 2m 2 π ) =−2 < 0, φ′′ ( 2m + 1 2 π ) = 2 > 0 ですから、 n が偶数のところは極大、奇数のところは極小 2だんだんと簡単な例に取り替えていってこれにたどり着いたのですが、よく見ると(というか すぐ分かるように)、いきなり x2か y2を消去できる関数と条件の組み合わせになってしまってい ました。もちろん、これを調べるだけならそうするのがもっとも良い方法ですが、ここでは一般の 条件付き極値問題にどう対処するかということの例としてあげたものなので、このあとに説明する 解法におつきあい下さい。
と判定できます。これを (x, y) に戻せば、 (±1, 0) で極大、(0, ±1) で極小 という結論が得られるわけです。 なお、この問題の場合、定義域を単位円に制限して考えているのですから、「増 減表」は図 1 のようなものになります。(±1, 0) と (0, ±1) 以外に極値をとる可能 性のある点がないのですから、増減が自動的にわかってしまうのは、普通の 1 変 数関数の増減表の場合と同じです。 x y f (1, 0) = 2 f (0, 1) = 1 f (−1, 0) = 2 f (0,−1) = 1 増 減 増 減 図 1: 単位円に沿って反時計回りに回ったときの増減。 問題 37. f (x, y) = x(x +√3y) の条件 g(x, y) = x2 + y2− 1 = 0 の下での極大極 小を、x = cos t, y = sin t と置くことによって調べよ。 以上、これまでの知識で(というか高校までの知識で)条件付き極値問題があっ さり解けてしまいました。それなのに、何でわざわざ条件付き極値問題のための 章を設けて議論しなければならないのでしょうか? それは、普通 g(x, y) の零点 のなす曲線をパラメタ付けすることができないからです。上の問題は条件がたま たま単位円だったので三角関数でパラメタ付けすることができましたが、例えば、 g(x, y) をちょっと (?) 変えて h(x, y) = x4+ 2x2+ y2− 3 としたらどうでしょうか? h(x, y) = 0 を満たす (x, y) を上のように見事にパラメ タ付けすることができますか? 多分無理でしょう。しかし、ヘタクソにパラメタ 付けすることならできます。例えば h(x, y) = 0 を y について解いてしまうので す。すると、 y =±√3− 2x2− x4 となります。± の意味は、
h(x, y) の零点の一部分は y = √3− 2x2− x4 で表され、他の部分は y =−√3− 2x2 − x4 で表される。 ということです。これは、パラメタ付けという視点からは「x をパラメタとして 採用する」ということを意味しますが、むしろ、 h(x, y) の零点をいくつかの関数のグラフに分けた とみる方が自然でしょう。この二つの関数の定義域は、どちらも平方根の中身が 0 以上の範囲、つまり、 3− 2x2− x4 = 4− (1 + x2)2 ≥ 0 の範囲、すなわち、 4≥ (1 + x2)2 ⇔ 2 ≥ 1 + x2 ⇔ −1 ≤ x ≤ 1 が定義域です。この二つの関数を f (x, y) の y に代入してできる x の二つの 1 変 数関数の−1 ≤ x ≤ 1 の範囲での極大極小を考えればよいわけです。実際にやって みると、f (x, y) に y は二乗でしか登場していないのでどちらの関数を代入した場 合も全く同じで、 ψ(x) = f ( x,±√3− 2x2− x4)= 3− x4 となります。よって、x = 0 で極大値 3 を取り、定義域の端の x =±1 で極小値 2 を取ることが分かります。(x, y) に戻すと、 (0,±√3) で極大、(±1, 0) で極小 ということです。 これで解けはしましたが、疑問が残ります。まず第一に「こんなに都合よく条 件式を y について解けるのか?」という問題です。もちろん、普通は解けません。 解けないのにどうするのか、というのが条件付き極値問題の最大のポイントなの で、この疑問についてはあとでゆっくりと説明することにします。もう一つ、小 さな疑問があります。y を x の関数で表し f (x, y) の y に代入したあと、x の定義 域 [−1, 1] での極値を求める方法が「中身での極値と端での値を別々に考察する」 という、このプリントの一番始めに紹介した問題(の 1 変数版)になっていること です。これでは条件付き極値問題を変数の一つ少ない条件付き極値問題に帰着し ただけではないでしょうか。「変数が一つ減ってるのだからいいじゃないか」とい う考え方もあるでしょう。しかし、具体例ではなく一般論を展開するには不向き です。少なくとも h(x, y) の零点の中に特別扱いされる点ができるのはよくないよ うに感じるでしょう。 要するに「端」ができないようにグラフ分けできればよいのです。「そんなこと 言ったって x = ±1 の点はどう見ても端じゃないか」と思いますか? それは y が
x の従属変数であると思いこんでいるからです。x が y の従属変数となるように h(x, y) = 0 を x について解いてやれば、x =±1 の点も定義域の端ではなくなり ます。実際に解いてみると、x2 ≥ 0 に注意して x2 =−1 +√4− y2 −√3 < y <√3 すなわち、 x =± √ −2 +√4− y2 −√3 < y <√3 となります。(定義域の端は考えないということを強調するために y =±√3 は定 義域から抜いてあります。)この二つの関数もあわせて考えれば、h(x, y) の零点は y =±√3− 2x2− x4 − 1 < x < 1 x =± √ −1 +√4− y2 −√3 < y <√3 という四つの関数のグラフ(端点は除く)で尽くされることになります。このよ うに考えれば、定義域の端だけ特別扱いせず、すべての点で普通の 1 変数関数の 極値判定をすればよいことになります。これが、一般的な条件付き極値問題を解 くための大雑把な方針です。 問題 38. f (x, y) = 2x2 + y2 の g(x, y) = x2 + y2 − 1 = 0 の下での極大極小を、 g(x, y) = 0 で決まる曲線(単位円)を y =±√1− x2 (|x| < 1), x =±√1− y2 (|y| < 1) の 4 つの関数のグラフに分けることで調べよ。
問題の解答
問題 36 の解答 fxx = (fx)x ですので、fx に例 8 で得た「操作の間の関係式」を二回使うことに より次のように計算できます。ただし、長くなるので (r cos θ, r sin θ) と (r, θ) は 省略しました。 fxx = ∂fx ∂x = ∂ ∂r ( φrcos θ− 1 rφθsin θ ) cos θ− 1 r ∂ ∂θ ( φrcos θ− 1 rφθsin θ ) sin θ = ( φrrcos θ + 1 r2φθsin θ− 1 rφrθsin θ ) cos θ −1 r ( φθrcos θ− φrsin θ− 1 rφθθsin θ− 1 rφθcos θ ) sin θ = φrrcos2θ− 1 rφrθ2 sin θ cos θ + 1 r2φθθsin 2θ + 1 rφrsin 2θ + 1 r2φθ2 sin θ cos θ となります。同様に、 fyy = ∂ ∂yfy = ∂ ∂r ( φrsin θ + 1 rφθcos θ ) sin θ +1 r ∂ ∂θ ( φrsin θ + 1 rφθcos θ ) cos θ = ( φrrsin θ− 1 r2φθθcos θ + 1 rφrθcos θ ) sin θ + 1 r ( φθrsin θ + φrcos θ + 1 rφθθcos θ− 1 rφθsin θ ) cos θ = φrrsin2θ + 1 rφrθ2 sin θ cos θ + 1 r2φθθcos 2θ + 1 rφrcos 2θ− 1 r2φθ2 sin θ cos θ です。この二つを足しあわせて、 ∂2f ∂x2 + ∂2f ∂y2 = ∂2φ ∂r2 + 1 r2 ∂2φ ∂θ2 + 1 r ∂φ ∂r となります。 □ 混乱してしまった人は、 g(x, y) = fx(x, y) ψ(r, θ) = g(r cos θ, r sin θ) h(x, y) = fy(x, y) χ(r, θ) = h(r cos θ, r sin θ)というように記号を置いて、gx と gy を ψr と ψθ で、hx と hy を χr と χθ であ らわし、そのあと、それらの登場人物を f や φ の偏微分たちで表そうとしてみる ことをお勧めします。このように置くと、例えば、まず、
gx(r cos θ, r sin θ) = ψr(r, θ) cos θ− 1
rψθ(r, θ) sin θ (4)
が得られます。この式において、gx = (fx)x = fxxなので、左辺は fxx(r cos θ, r sin θ) です。一方、
ψ(r, θ) = g(r cos θ, r sin θ) = fx(r cos θ, r sin θ)
なのですから、 ψ(r, θ) = φr(r, θ) cos θ− 1 rφθ(r, θ) sin θ です。よって、ψr(r, θ)や ψθ(r, θ)は上の式の右辺の r や θ による偏微分です。こ のようにして、すべてを f と φ で表すことができます。これらを式 (4) に代入す ると、 fxx = ∂ ∂r ( φrcos θ− 1 rφθsin θ ) − 1 r ∂ ∂θ ( φrcos θ− 1 rφθsin θ ) が得られます。(長いので、(r cos θ, r sin θ) と (r, θ) は省略しました。)このような 計算を文字の置き換えをすることなく f と φ のままで行ったのが上の解答です。 なお、「操作の間の関係式」としては、 ∂2 ∂x2 + ∂2 ∂y2 = ∂2 ∂r2 + 1 r ∂ ∂r + 1 r2 ∂2 ∂θ2 と書けます。これは、ラプラス作用素 ∂2/∂x2+ ∂2/∂y2 を極座標で表す公式で、 力学などでよく出会うものです。 問題 37 の解答 x = cos t, y = sin t を f (x, y) = x(x +√3y) に代入したものを φ(t) としま しょう。
φ(t) = f (cos t, sin t) = cos t
(
cos t +√3 sin t )
= cos2t +√3 cos t sin t = 1 2cos 2t + √ 3 2 sin 2t + 1 2 = cos ( 2t− π 3 ) +1 2 となります。 φ′(t) =−2 sin ( 2t− π 3 ) ですので、φ′(t) = 0 となる t は 3n + 1 6 π n ∈ Z
です。2 階微分は φ′′(t) =−4 cos ( 2t−π 3 ) なので、 φ′′ ( 6m + 1 6 π ) < 0 φ′′ ( 6m + 4 6 π ) > 0 です。よって、 6m + 1 6 π (m∈ Z) で極大、 6m + 4 6 π (m∈ Z) で極小 となります。 これを x と y に戻すと、 ± (√ 3 2 , 1 2 ) で極大、± ( −1 2, √ 3 2 ) で極小 となります。 なお、2 階微分を使わなくても、図 1 のような図を書けばどの点が極大でどの点 が極小か分かります。 問題 38 の解答 f (x, y) = 2x2+ y2 に y = √1− x2 を代入してできる x の 1 変数関数を φ +(x) とします。 φ+(x) = x2+ 1 ということです。これの極大極小を調べるのですが、微分するまでもなく x = 0 で極小で、他に極値を取る点はありません。(今、|x| < 1 というように定義域を 開区間にしているので、区間の端を考慮する必要はありません。)y =√1− x2 で すので、x = 0 に対する y の値は 1 です。 次に、y =−√1− x2 を代入してできる x の 1 変数関数 φ −(x)の極大極小を調 べましょう。 φ−(x) = x2+ 1 なので、やはり x = 0 で極小で、他に極値を取る点はありません。ただし、今度 は y =−√1− x2 なので、x = 0 に対応する y の値は −1 です。 次に、x =√1− y2 を f (x, y) に代入して得られる y の 1 変数関数 ψ +(y) の極 大極小を調べましょう。 ψ+(y) = 2− y2 なので、y = 0 で極大で、他に極値を取る点はありません。x = √1− y2 ですの で、y = 0 に対応する x の値は 1 です。
最後に、x =−√1− y2を代入してできる関数 ψ −(y)の極大極小を調べましょう。 ψ−(y) = 2− y2 なので、やはり y = 0 で極大で、他に極値を取る点はありません。ただし、今度 は x =−√1− y2 なので、y = 0 に対応する x の値は −1 です。 以上より、 (±1, 0) で極大で、(0, ±1) で極小である ということが分かりました。