解析 II ・講義ノート
第5回
(2020年11月10日(火)配信分)
§5. 2
変数関数の微分
さて、極限と連続性について、大体準備が出来たので、これか ら一般の多変数関数の増減の様子を調べるため、微分を導入しま しょう。
まずは
2変数関数
z = f(x, y)の
(x, y) = (x0, y0)における増減
の様子を、とりあえずは既知の道具
( 1変数関数の微分
)を使える
だけ使ってみることから始めます。そのためには、これまでもし
て来たように、グラフを縦の平面で切った断面を考えるのが一番
です。
グラフを描く
R3内の点
(x, y, z) = (x0, y0, f(x0, y0))を通り、
xz
平面と平行な平面は
y = y0です。従って、この平面で切った 切り口に現れる曲線は
z = f(x, y0)と表される
( y0は固定してい
るので
) xのみに関する
1変数関数です。この関数が
x = x0にお
いて
xについて微分可能のとき、
f(x, y)は
(x, y) = (x0, y0)にお
いて
xに関して偏微分可能であると言い、その微分係数、つまり
g1(x) = f(x, y0)
とおいたときの
g1′(x0)を、
f(x, y)の
(x, y) = (x0, y0)
における
xに関する偏微分係数と呼んで、
∂f
∂x(x0, y0), fx(x0, y0)
などと表します。定義をきちんと書くと
xlim→x0
f(x, y0) − f(x0, y0) x − x0
となります。
さらに、任意の
(x0, y0)において
xに関して偏微分可能のとき、
得られる偏微分係数を
(x, y)に関する
2変数関数と考えて、
f(x, y)
の
xに関する偏導関数と呼び、
∂f
∂x(x, y), fx(x, y)
などと表します。定義をきちんと書くと
hlim→0
f(x + h, y) − f(x, y) h
となります。
本によってはh はしばしば∆x と書かれ、x の増分と呼ばれます。
y
についても全く同様ですが、以下、一応省略せずに書きます。
グラフを描く
R3内の点
(x, y, z) = (x0, y0, f(x0, y0))を通り、
yz
平面と平行な平面は
x = x0です。従って、この平面で切った 切り口に現れる曲線は
z = f(x0, y)と表される
( x0は固定してい
るので
) yのみに関する
1変数関数です。この関数が
y = y0にお
いて
yについて微分可能のとき、
f(x, y)は
(x, y) = (x0, y0)にお
いて
yに関して偏微分可能であると言い、その微分係数、つまり
g2(y) = f(x0, y)
とおいたときの
g2′(y0)を、
f(x, y)の
(x, y) = (x0, y0)
における
yに関する偏微分係数と呼んで、
∂f
∂y(x0, y0), fy(x0, y0)
などと表します。定義をきちんと書くと
ylim→y0
f(x0, y) − f(x0, y0) y − y0
となります。
さらに、任意の
(x0, y0)において
yに関して偏微分可能のとき、
得られる偏微分係数を
(x, y)に関する
2変数関数と考えて、
f(x, y)
の
yに関する偏導関数と呼び、
∂f
∂y(x, y), fy(x, y)
などと表します。定義をきちんと書くと
klim→0
f(x, y + k) − f(x, y) k
となります。
本によってはk はしばしば∆y と書かれ、y の増分と呼ばれます。
また、
x, y両方に関して偏微分可能のとき、単に偏微分可能で あると言います。
具体的な
2変数関数を偏微分するとき、
xで偏微分したいとき
は
y, yで偏微分したいときは
x (一般の多変数関数なら、微分し たい変数以外の変数全て
)を固定する、つまり定数と思って微分 すればよいので、
1変数関数の微分の公式が、そのまま使えます。
たとえば、一次関数
f(x, y) = ax + by + cに対し、
fx(x, y) = a, fy(x, y) = b ((x, y) ∈ R2)
二次関数
f(x, y) = ax2 + 2bxy + cy2に対し、
fx(x, y) = 2ax + 2by, fy(x, y) = 2bx + 2cy ((x, y) ∈ R2)
となります。
極限の性質から、連続性のとき同様に、偏微分可能な関数の和、
差、積、商は、やはり偏微分可能になりますから、任意の多項式 関数、有理関数は、定義域の各点で偏微分可能になります。また
2
変数
(多変数
)の偏微分可能な関数と
1変数の微分可能な関数の 合成関数も偏微分可能になります。
g(f(x, y))x = g′(f(x, y))fx, g(f(x, y))y = g′(f(x, y))fy
[
練習課題
]2
変数関数
g(x2 + y2), g(yx)
の偏導関数を求めてみ
ましょう。
2
変数
(多変数
)関数どうしの合成関数の微分については、多少
注意が必要なので、後で章を改めて触れます。
さて、
1変数関数の微分に関する重要な性質の一つに、微分可 能ならば連続であると言うことがありました。
(逆も正しいと勘違い している人が、例年何人か見受けられます。心当たりのある人は注意して下さ い。)実際
f(x)が
x = x0で微分可能とすると、微分係数
f′(x0)が平均変化率の極限値として存在しますから、
xlim→x0
f(x) − f(x0)
x − x0 = f′(x0)
が成り立ちます。このとき
f(x) = f(x0) + (f(x) − f(x0))
= f(x0) + f(x) − f(x0)
x − x0 (x − x0) (x ̸= x0)
→ f(x0) + f′(x0) · 0 = f(x0) (x → x0)
より、
xlim→x0 f(x) = f(x0)
が成り立ち、
f(x)は
x = x0で連続です。
ところが、
2変数関数の微分に関しては、
x, y両方について偏
微分可能でも連続とは限りません。
なぜなら
f(x, y)が
(x, y) = (x0, y0)で偏微分可能としても、
f(x, y) = f(x0, y0) + (f(x, y) − f(x0, y)) + (f(x0, y) − f(x0, y0))
= f(x0, y0) + f(x, y) − f(x0, y)
x − x0 (x − x0) +f(x0, y) − f(x0, y0)
y − y0 (y − y0) (x ̸= x0, y ̸= y0)
→ f(x0, y0) +
?
· 0 + fy(x0, y0) · 0 ((x, y) → (x0, y0))で
(x,y)→lim(x0,y0)
f(x, y) − f(x0, y) x − x0
は
yも固定せずに
xと同時に動かすことになるので、
xに関する
偏微分係数の定義ではなく、極限値が存在するかどうか、何の保 障もないからです。従って、
(x,y)lim→(x0,y0) f(x, y) = f(x0, y0)
が成り立つかどうかもわかりません。
実際、
f(x, y) =
xy
x2 + y2 ((x, y) ̸= (0, 0)) 0 ((x, y) = (0, 0))
は
x軸上でも
y軸上でも恒等的に
0ですから、
(x, y) = (0, 0)で
偏微分可能で、どちらの偏微分係数も
0ですが、連続ではありま せんでした。
これは偏微分係数が、座標軸以外の斜めの方向からの近付き方 について、何の情報も含んでいないからと考えられます。そこで、
そのことも考慮に入れて、新たな微分係数を導入しましょう。
任意の単位ベクトル
v = (p, q)に対し、グラフを描く
R3内の
点
(x, y, z) = (x0, y0, f(x0, y0))を通る縦の平面
(x0 + pt, y0 + qt, z) ((t, z) ∈ R2)で切った切り口に現れる曲線は、
tz平面上
z = f(x0 + pt, y0 + qt)
と表される
tのみに関する
1変数関数で
す。この関数が
t = 0において
tについて微分可能のとき、
f(x, y)
は
(x, y) = (x0, y0)において
v方向に方向微分可能である と言い、その微分係数、つまり
g3(t) = f(x0 + pt, y0 + qt)とおい
たときの
g3′(0)を、
f(x, y)の
(x, y) = (x0, y0)における
v方向の
方向微分係数と呼んで、
∂f
∂v(x0, y0), fv(x0, y0)
などと表します。
定義をきちんと書くと
limt→0
f(x0 + pt, y0 + qt) − f(x0, y0) t
となります。
v = e1 = (1, 0)
のときが
xに関する偏微分、
v = e2 = (0, 1)の
ときが
yに関する偏微分に他なりません。また、任意の
v方向に
方向微分可能のとき、単に方向微分可能であると言います。
これで情報量はだいぶ増えたはずなのですが、残念ながら、全 ての方向
vについて方向微分可能でも連続とは限りません。なぜ なら
f(x, y)が
(x, y) = (x0, y0)で方向微分可能としても、
(x, y)の
(x0, y0)への全ての近付き方を網羅していないからです。
実際、
f(x, y) =
x2y
x4 + y2 ((x, y) ̸= (0, 0)) 0 ((x, y) = (0, 0))
は、任意の
v = (p, q)に対し、直線
(x, y) = (pt, qt) (t ∈ R)上
f(pt, qt) =
p2qt
p4t2 + q2 (t ̸= 0)
0 (t = 0)
ですから、
q ̸= 0のとき
f(pt, qt) − f(0, 0)
t = p2q
p4t2 + q2 (t ̸= 0)
→ p2q
q2 = p2
q (t → 0)
また
q = 0のとき直線
(x, y) = (pt, qt) = (±t, 0) (t ∈ R)上
f(pt, qt) = f(±t, 0) = 0 (t ∈ R)ですから、
f(pt, qt) − f(0, 0)
t → 0 (t → 0)
で、この
f(x, y)は
(x, y) = (0, 0)で方向微分可能であり、その
v = (p, q)
方向の方向微分係数は
fv(0, 0) =
p2
q (q ̸= 0) 0 (q = 0)
ですが、連続ではありませんでした。
これは断面での切り口を見て、既知の道具
( 1変数関数の微分
)だけを用いて微分を考えることの一つの限界と言ってよいで
しょう。
そこで、微分とはそもそも何者だったか、もう一度振り返って みましょう。
x = x0における微分係数とはグラフの曲線
y = f(x)
の点
(x, y) = (x0, f(x0))における接線の傾きでした。つ まり、
x = x0で微分可能とは、そこで接線がひけると言うことで す。それでは、そもそも接線とは何だったのかと言うと、点
(x0, f(x0))
を通る直線
y = a(x − x0) + f(x0)
であって、曲線
y = f(x)との差
f(x) − {a(x − x0) + f(x0)}
が
x → x0のとき、小さくなってゆくものなのですが、ここで単 に
0に近付くだけでは、同じ点を通ることしか表さず、交わって いる場合も含んでしまうので、
x − x0 (または
|x − x0| )よりも速
く
0に近付くものであると言うべきでしょう。
つまり接線であるための条件は
xlim→x0
f(x) − {a(x − x0) + f(x0)}
x − x0 = 0
と言うことになります。
ここで上の等式の左辺は
xlim→x0
f(x) − f(x0)
x − x0 − a
より結局、微分係数
f′(x0)が存在するとき、それを傾きとすれば
接線になり、また微分係数が存在しなければ、接線と呼べるもの
は無いことになります。曲線がその点で角になっている場合など
が、それに当てはまります。
さて、この考え方を
2変数関数に適用してみましょう。
z = f(x, y)
がそもそも
(広い意味での
)曲面ですから、この場合、
接線の役割を果たすのは接平面でしょう。そこで、点
(x0, y0, f(x0, y0))
を通る平面
(定数関数または一次関数です
) z = a(x − x0) + b(y − y0) + f(x0, y0)であって、曲面
z = f(x, y)との差
f(x, y) − {a(x − x0) + b(y − y0) + f(x0, y0)}
が
(x, y) → (x0, y0)のとき、
||(x, y) − (x0, y0)|| =
√
(x − x0)2 + (y − y0)2
よりも速く
0に近付くものを接平面と考えることにします。
すると、この平面が接平面であるための条件は
(x,y)→lim(x0,y0)
f(x, y) − {a(x − x0) + b(y − y0) + f(x0, y0)}
√
(x − x0)2 + (y − y0)2 = 0
と言うことになります。
ここで上の等式の左辺は、近付け方を
y = y0, x → x0 + 0に限
定すれば、
x→limx0+0
f(x, y0) − f(x0, y0)
x − x0 − a
y = y0, x → x0 − 0
に限定すれば、
− lim
x→x0−0
f(x, y0) − f(x0, y0)
x − x0 + a
x = x0, y → y0 + 0
に限定すれば、
y→limy0+0
f(x0, y) − f(x0, y0)
y − y0 − b x = x0, y → y0 − 0
に限定すれば、
− lim
y→y0−0
f(x0, y) − f(x0, y0)
y − y0 + b
より結局、接平面が存在するならば、その
x軸正方向の傾きは偏
微分係数
fx(x0, y0), y軸正方向の傾きは偏微分係数
fy(x0, y0)で
なければならないので、偏微分可能であることはどうしても必要 ですが、それだけでは不十分で、結局それら偏微分係数に対して、
(x,y)lim→(x0,y0)
f(x, y) − f(x0, y0) − fx(x0, y0)(x − x0) − fy(x0, y0)(y − y0)
√(x − x0)2 + (y − y0)2 = 0
が成り立つときに限り、接平面が存在すると言えます。
0
-x y z 6
z =f(x, y)
平面 y = y0 z = f(x, y0)
◦
0
-x y z 6
z =f(x, y) 平面 x = x0
z =f(x0, y)
◦
0 - x y z 6
z = f(x, y)
◦ 接平面
一般に
t → 0のとき、
tより速く
0に近付くものを
o(t)で表し
ます。この表記を用いると、上の条件は
f(x, y) = f(x0, y0) + fx(x0, y0)(x − x0) + fy(x0, y0)(y − y0) +o(
√
(x − x0)2 + (y − y0)2)
と表せます。
o(t) を高位の無限小と呼びます。ちなみに、もう少しゆるく、高々 t の定数 倍程度の速さで 0 に近付く、言い換えると t に対する比が有界であるものは、
同位の無限小と呼んでO(t) で表します。これらの記号をまとめてランダウの 記号と呼びます。
1
変数関数の場合で言うと、条件
f(x) = f(x0) + f′(x0)(x − x0) + o(|x − x0|)
が、
f(x)が
x = x0で微分可能であることと同値でした。
前頁の条件が成立するとき、同様の意味合いで、
f(x, y)は
(x, y) = (x0, y0)
で全微分可能であると言います。全微分可能なら ば、今度こそ連続となることは、条件式右辺において、
f(x0, y0)以外の項が皆、
(x, y) → (x0, y0)のとき
0に近付くことからわかり
ます。
また、全微分可能ならば、既に見たように偏微分可能ですが、
さらに、任意の方向
v = (p, q) (√p2 + q2 = 1)
に対し、
f(x0 + pt, y0 + qt)
= f(x0, y0) + fx(x0, y0)pt + fy(x0, y0)qt + o(|t|)
より
f(x0 + pt, y0 + qt) − f(x0, y0) t
= fx(x0, y0)p + fy(x0, y0)q + o(|t|)
→ fx(x0, y0)p + fy(x0, y0)q (t t→ 0)
が成り立つので、方向微分可能であり、方向微分係数が
fx(x0, y0)p + fy(x0, y0)q
により与えられます。
微積分の教科書において、全微分はしばしば、厳密にはまだ導入されない外 微分もしくは微分形式と言う概念を用いて、
df = ∂f
∂xdx + ∂f
∂ydy = fxdx + fydy
と表されますが、この式は、上で見た方向微分を与える式のことを表している と見ることも可能です。行ベクトルと列ベクトルの使い分けの意味と併せて、
ここで、ちょっとお話しておきます。
第2回でもちょっと触れたように、実は Rn の点並びに各点における接ベク トルは、列ベクトルで表すのが慣例です。R2 の場合、各点x0 =
x0 y0
にお
ける任意の接ベクトルp =
p q
は、正式にはその点での偏微分作用素と考え て、基底
( ∂
∂x
) x0
,
( ∂
∂y
) x0
の線形結合
p
( ∂
∂x
) x0
+ q
( ∂
∂y
) x0
=
( ∂
∂x
) x0
,
( ∂
∂y
) x0
p q
と表されます。
一方、2 変数関数 f(x, y) の全微分df = fxdx + fydy は、各点 x0 毎に、接 ベクトル空間から R への線形写像(双対ベクトル、この場合は特に余接ベクト ルと言います)
dfx0 = fx(x0)dxx0 + fy(x0)dyx0 = (fx(x0), fy(x0))
dxx0 dyx0
を表しています。ここでdxx0, dyx0 は、
dxx0 dyx0
( ∂
∂x
) x0
,
( ∂
∂y
) x0
=
dxx0 ((∂x∂ )x
0
)
dxx0
(( ∂
∂y )
x0 )
dyx0 ((∂x∂ )
x0
)
dyx0
(( ∂
∂y )
x0 )
=
1 0 0 1
を満たすもの(双対基底)です。
この意味で
dfx0(p) = pfx(x0) + qfy(x0)
が成り立つ、すなわち、dfx0 は、点 x0 における各(接)ベクトル p に対し、f の p 方向の方向微分係数を与える線形写像と言うことになります。
この表記に従うと、速度ベクトルなどの接ベクトルは列ベクトルで、2 変数 関数の(全)微分は行ベクトルで、それぞれ成分表示するのがよいことになりま す。写像の微分であるヤコビ行列(後出)も、この表記に倣って定義されます。
また、f の点 x0 における勾配ベクトルgrad fx0 は、接ベクトルとして定義 されるものなので、R2 においては、成分だけ見れば f の(全)微分と同じく偏 微分係数fx(x0), fy(x0) を並べたものですが、あくまで列ベクトルとして区別 されるべきものです。
定義域の各点
(x, y)で全微分可能であるような関数を、単に全 微分可能な関数であると言います。しかしながら、与えられた関 数が全微分可能であるか否かを、定義の条件式に当てはめて示す のは結構面倒です。
1変数の場合に倣って、二つの偏導関数
fx(x, y), fy(x, y)
が共に連続のとき、
f(x, y)は
C1級であると言
いますが、実は
C1級ならば全微分可能なので、条件としてはや
や強くなってしまいますが、
C1級を確かめることは、全微分可能
の判定に有用です。
実際、
f(x, y) − f(x0, y0) − fx(x0, y0)(x − x0) − fy(x0, y0)(y − y0)
= f(x, y) − f(x0, y) − fx(x0, y0)(x − x0)
+f(x0, y) − f(x0, y0) − fy(x0, y0)(y − y0)
=
f(x, y) − f(x0, y)
x − x0 − fx(x0, y0)
(x − x0) +
f(x0, y) − f(x0, y0)
y − y0 − fy(x0, y0)
(y − y0)
より、
f(x, y) − f(x0, y0) − fx(x0, y0)(x − x0) − fy(x0, y0)(y − y0)
√
(x − x0)2 + (y − y0)2
=
f(x, y) − f(x0, y)
x − x0 − fx(x0, y0)
x − x0
√
(x − x0)2 + (y − y0)2 +
f(x0, y) − f(x0, y0)
y − y0 − fy(x0, y0)
y − y0
√
(x − x0)2 + (y − y0)2
で、ここで
ylim→y0
f(x0, y) − f(x0, y0)
y − y0 = fy(x0, y0)
は偏微分係数の定義そのままですが、一方、
f(x, y)が
C1級であ
ることから
(x,y)→lim(x0,y0)
f(x, y) − f(x0, y) x − x0
= limy→y
0 xlim→x
0
f(x, y) − f(x0, y)
x − x0 (
∵近付け方に依らない
)= lim
y→y0 fx(x0, y) (
∵
(x0, y)でも偏微分可能
)= fx(x0, y0) (
∵
fx(x, y)が連続
)も言えて、さらに、
x − x0
√
(x − x0)2 + (y − y0)2, y − y0
√
(x − x0)2 + (y − y0)2
は共に有界ですから、結局
(x,y)lim→(x0,y0)
f(x, y) − f(x0, y0) − fx(x0, y0)(x − x0) − fy(x0, y0)(y − y0)
√(x − x0)2 + (y − y0)2 = 0
すなわち全微分可能であることが導かれます。
ちなみに、全偏微分可能な関数の和、差、積、商は、やはり全 微分可能になりますから、任意の多項式関数、有理関数は、定義 域の各点で全微分可能になります。また
2変数
(多変数
)の全微分
可能な関数と
1変数の微分可能な関数の合成関数も全微分可能に
なります。
第4回練習課題の解答
g(x, y) = x4 + y2, h(x, y) = x
のとき、
f(x, y)は原点で不連続
でしたが、相加平均と相乗平均の関係より
|f(x, y)| = |x2y|
|x4 + y2| = x2|y|
x4 + y2 = 1 2 ·
√x4y2
x4+y2 2
≤ 1 2
が成り立ちます。
(つまり関数
f(x, y)は有界でした。
)この不等
式を用いると、
g(x, y) = x4 + y2, h(x, y) = x2のときは、
|f(x, y) − f(0, 0)| = |f(x, y) − 0| = |f(x, y)|
= x2|y|
x4 + y2|x| ≤ 1
2|x| ≤ 1 2
√
x2 + y2
→ 0 (||x − 0|| =
√
x2 + y2 → 0)