解析 II ・講義ノート

(1)

解析 II ^{・講義ノート}

第５回

(2020^年11^月10^日(^火)^配信分)

(2)

§5. 2

^{変数関数の微分}

さて、極限と連続性について、大体準備が出来たので、これから一般の多変数関数の増減の様子を調べるため、微分を導入しましょう。

まずは

2

^変数関数

z = f(x, y)

^の

(x, y) = (x₀, y₀)

^{における増減}

の様子を、とりあえずは既知の道具

( 1

^{変数関数の微分}

)

^を使える

だけ使ってみることから始めます。そのためには、これまでもし

て来たように、グラフを縦の平面で切った断面を考えるのが一番

です。

(3)

グラフを描く

R³

^内の点

(x, y, z) = (x₀, y₀, f(x₀, y₀))

^を通り、

xz

^{平面と平行な平面は}

y = y₀

です。従って、この平面で切った切り口に現れる曲線は

z = f(x, y₀)

^{と表される}

( y₀

^{は固定してい}

るので

) x

^{のみに関する}

1

変数関数です。この関数が

x = x₀

^にお

いて

x

について微分可能のとき、

f(x, y)

^は

(x, y) = (x₀, y₀)

^にお

いて

x

に関して偏微分可能であると言い、その微分係数、つまり

g₁(x) = f(x, y₀)

^{とおいたときの}

g₁^′(x₀)

^を、

f(x, y)

^の

(x, y) = (x₀, y₀)

^における

x

に関する偏微分係数と呼んで、

∂f

∂x(x₀, y₀), f_x(x₀, y₀)

などと表します。定義をきちんと書くと

(4)

xlim→x₀

f(x, y₀) − f(x₀, y₀) x − x₀

となります。

さらに、任意の

(x₀, y₀)

^において

x

に関して偏微分可能のとき、

得られる偏微分係数を

(x, y)

^に関する

2

^{変数関数と考えて、}

f(x, y)

^の

x

に関する偏導関数と呼び、

∂f

∂x(x, y), f_x(x, y)

などと表します。定義をきちんと書くと

hlim→0

f(x + h, y) − f(x, y) h

となります。

本によってはh ^{はしばしば}∆x ^{と書かれ、}x ^{の増分と呼ばれます。}

(5)

y

についても全く同様ですが、以下、一応省略せずに書きます。

グラフを描く

R³

^内の点

(x, y, z) = (x₀, y₀, f(x₀, y₀))

^を通り、

yz

^{平面と平行な平面は}

x = x₀

です。従って、この平面で切った切り口に現れる曲線は

z = f(x₀, y)

^{と表される}

( x₀

^{は固定してい}

るので

) y

^{のみに関する}

1

変数関数です。この関数が

y = y₀

^にお

いて

y

について微分可能のとき、

f(x, y)

^は

(x, y) = (x₀, y₀)

^にお

いて

y

に関して偏微分可能であると言い、その微分係数、つまり

g₂(y) = f(x₀, y)

^{とおいたときの}

g₂^′(y₀)

^を、

f(x, y)

^の

(x, y) = (x₀, y₀)

^における

y

に関する偏微分係数と呼んで、

∂f

∂y(x₀, y₀), f_y(x₀, y₀)

などと表します。定義をきちんと書くと

(6)

ylim→y₀

f(x₀, y) − f(x₀, y₀) y − y₀

となります。

さらに、任意の

(x₀, y₀)

^において

y

に関して偏微分可能のとき、

得られる偏微分係数を

(x, y)

^に関する

2

^{変数関数と考えて、}

f(x, y)

^の

y

に関する偏導関数と呼び、

∂f

∂y(x, y), f_y(x, y)

などと表します。定義をきちんと書くと

klim→0

f(x, y + k) − f(x, y) k

となります。

本によってはk ^{はしばしば}∆y ^{と書かれ、}y ^{の増分と呼ばれます。}

(7)

また、

x, y

両方に関して偏微分可能のとき、単に偏微分可能であると言います。

具体的な

2

変数関数を偏微分するとき、

x

^{で偏微分したいとき}

は

y, y

^{で偏微分したいときは}

x (

一般の多変数関数なら、微分したい変数以外の変数全て

)

を固定する、つまり定数と思って微分すればよいので、

1

変数関数の微分の公式が、そのまま使えます。

たとえば、一次関数

f(x, y) = ax + by + c

^に対し、

f_x(x, y) = a, f_y(x, y) = b ((x, y) ∈ R²)

二次関数

f(x, y) = ax² + 2bxy + cy²

^に対し、

f_x(x, y) = 2ax + 2by, f_y(x, y) = 2bx + 2cy ((x, y) ∈ R²)

となります。

(8)

極限の性質から、連続性のとき同様に、偏微分可能な関数の和、

差、積、商は、やはり偏微分可能になりますから、任意の多項式関数、有理関数は、定義域の各点で偏微分可能になります。また

2

^変数

(

^多変数

)

^{の偏微分可能な関数と}

1

変数の微分可能な関数の合成関数も偏微分可能になります。

g(f(x, y))_x = g^′(f(x, y))f_x, g(f(x, y))_y = g^′(f(x, y))f_y

[

^練習課題

]

2

^変数関数

g(x² + y²), g(y

x)

^{の偏導関数を求めてみ}

ましょう。

2

^変数

(

^多変数

)

関数どうしの合成関数の微分については、多少

注意が必要なので、後で章を改めて触れます。

(9)

さて、

1

変数関数の微分に関する重要な性質の一つに、微分可能ならば連続であると言うことがありました。

₍逆も正しいと勘違いしている人が、例年何人か見受けられます。心当たりのある人は注意して下さい。)

実際

f(x)

^が

x = x₀

で微分可能とすると、微分係数

f^′(x₀)

が平均変化率の極限値として存在しますから、

xlim→x₀

f(x) − f(x₀)

x − x₀ = f^′(x₀)

が成り立ちます。このとき

f(x) = f(x₀) + (f(x) − f(x₀))

= f(x₀) + f(x) − f(x₀)

x − x₀ (x − x₀) (x ̸= x₀)

→ f(x₀) + f^′(x₀) · 0 = f(x₀) (x → x₀)

より、

(10)

xlim→x₀ f(x) = f(x₀)

が成り立ち、

f(x)

^は

x = x₀

^{で連続です。}

ところが、

2

変数関数の微分に関しては、

x, y

^{両方について偏}

微分可能でも連続とは限りません。

なぜなら

f(x, y)

^が

(x, y) = (x₀, y₀)

で偏微分可能としても、

f(x, y) = f(x₀, y₀) + (f(x, y) − f(x₀, y)) + (f(x₀, y) − f(x₀, y₀))

= f(x₀, y₀) + f(x, y) − f(x₀, y)

x − x₀ (x − x₀) +f(x₀, y) − f(x₀, y₀)

y − y₀ (y − y₀) (x ̸= x₀, y ̸= y₀)

→ f(x₀, y₀) +

^？

· 0 + f_y(x₀, y₀) · 0 ((x, y) → (x₀, y₀))

で

(11)

(x,y)→lim(x₀,y₀)

f(x, y) − f(x₀, y) x − x₀

は

y

^{も固定せずに}

x

と同時に動かすことになるので、

x

^に関する

偏微分係数の定義ではなく、極限値が存在するかどうか、何の保障もないからです。従って、

(x,y)lim→(x₀,y₀) f(x, y) = f(x₀, y₀)

が成り立つかどうかもわかりません。

(12)

実際、

f(x, y) =











xy

x² + y² ((x, y) ̸= (0, 0)) 0 ((x, y) = (0, 0))

は

x

^軸上でも

y

^{軸上でも恒等的に}

0

^{ですから、}

(x, y) = (0, 0)

^で

偏微分可能で、どちらの偏微分係数も

0

ですが、連続ではありませんでした。

これは偏微分係数が、座標軸以外の斜めの方向からの近付き方について、何の情報も含んでいないからと考えられます。そこで、

そのことも考慮に入れて、新たな微分係数を導入しましょう。

(13)

任意の単位ベクトル

v = (p, q)

^{に対し、グラフを描く}

R³

^内の

点

(x, y, z) = (x₀, y₀, f(x₀, y₀))

^{を通る縦の平面}

(x₀ + pt, y₀ + qt, z) ((t, z) ∈ R²)

で切った切り口に現れる曲線は、

tz

^平面上

z = f(x₀ + pt, y₀ + qt)

^{と表される}

t

^{のみに関する}

1

^{変数関数で}

す。この関数が

t = 0

^において

t

について微分可能のとき、

f(x, y)

^は

(x, y) = (x₀, y₀)

^において

v

方向に方向微分可能であると言い、その微分係数、つまり

g₃(t) = f(x₀ + pt, y₀ + qt)

^とおい

たときの

g₃^′(0)

^を、

f(x, y)

^の

(x, y) = (x₀, y₀)

^における

v

^方向の

方向微分係数と呼んで、

∂f

∂v(x₀, y₀), f_v(x₀, y₀)

などと表します。

(14)

定義をきちんと書くと

limt→0

f(x₀ + pt, y₀ + qt) − f(x₀, y₀) t

となります。

v = e₁ = (1, 0)

^のときが

x

^{に関する偏微分、}

v = e₂ = (0, 1)

^の

ときが

y

に関する偏微分に他なりません。また、任意の

v

^方向に

方向微分可能のとき、単に方向微分可能であると言います。

これで情報量はだいぶ増えたはずなのですが、残念ながら、全ての方向

v

について方向微分可能でも連続とは限りません。なぜなら

f(x, y)

^が

(x, y) = (x₀, y₀)

で方向微分可能としても、

(x, y)

の

(x₀, y₀)

への全ての近付き方を網羅していないからです。

(15)

実際、

f(x, y) =











x²y

x⁴ + y² ((x, y) ̸= (0, 0)) 0 ((x, y) = (0, 0))

は、任意の

v = (p, q)

^{に対し、直線}

(x, y) = (pt, qt) (t ∈ R)

^上

f(pt, qt) =











p²qt

p⁴t² + q² (t ̸= 0)

0 (t = 0)

ですから、

q ̸= 0

^のとき

f(pt, qt) − f(0, 0)

t = p²q

p⁴t² + q² (t ̸= 0)

→ p²q

q² = p²

q (t → 0)

(16)

また

q = 0

^{のとき直線}

(x, y) = (pt, qt) = (±t, 0) (t ∈ R)

^上

f(pt, qt) = f(±t, 0) = 0 (t ∈ R)

ですから、

f(pt, qt) − f(0, 0)

t → 0 (t → 0)

で、この

f(x, y)

^は

(x, y) = (0, 0)

で方向微分可能であり、その

v = (p, q)

^{方向の方向微分係数は}

f_v(0, 0) =











p²

q (q ̸= 0) 0 (q = 0)

ですが、連続ではありませんでした。

これは断面での切り口を見て、既知の道具

( 1

^{変数関数の微分}

)

だけを用いて微分を考えることの一つの限界と言ってよいで

しょう。

(17)

そこで、微分とはそもそも何者だったか、もう一度振り返ってみましょう。

x = x₀

における微分係数とはグラフの曲線

y = f(x)

^の点

(x, y) = (x₀, f(x₀))

における接線の傾きでした。つまり、

x = x₀

で微分可能とは、そこで接線がひけると言うことです。それでは、そもそも接線とは何だったのかと言うと、点

(x₀, f(x₀))

^{を通る直線}

y = a(x − x₀) + f(x₀)

であって、曲線

y = f(x)

^との差

f(x) − {a(x − x₀) + f(x₀)}

が

x → x₀

のとき、小さくなってゆくものなのですが、ここで単に

0

に近付くだけでは、同じ点を通ることしか表さず、交わっている場合も含んでしまうので、

x − x₀ (

^または

|x − x₀| )

^よりも速

く

0

に近付くものであると言うべきでしょう。

(18)

つまり接線であるための条件は

xlim→x₀

f(x) − {a(x − x₀) + f(x₀)}

x − x₀ = 0

と言うことになります。

ここで上の等式の左辺は

xlim→x₀

f(x) − f(x₀)

x − x₀ − a

より結局、微分係数

f^′(x₀)

が存在するとき、それを傾きとすれば

接線になり、また微分係数が存在しなければ、接線と呼べるもの

は無いことになります。曲線がその点で角になっている場合など

が、それに当てはまります。

(19)

さて、この考え方を

2

変数関数に適用してみましょう。

z = f(x, y)

^{がそもそも}

(

^{広い意味での}

)

曲面ですから、この場合、

接線の役割を果たすのは接平面でしょう。そこで、点

(x₀, y₀, f(x₀, y₀))

^{を通る平面}

(

定数関数または一次関数です

) z = a(x − x₀) + b(y − y₀) + f(x₀, y₀)

であって、曲面

z = f(x, y)

^との差

f(x, y) − {a(x − x₀) + b(y − y₀) + f(x₀, y₀)}

が

(x, y) → (x₀, y₀)

^のとき、

||(x, y) − (x₀, y₀)|| =

√

(x − x₀)² + (y − y₀)²

よりも速く

0

に近付くものを接平面と考えることにします。

(20)

すると、この平面が接平面であるための条件は

f(x, y) − {a(x − x₀) + b(y − y₀) + f(x₀, y₀)}

√

(x − x₀)² + (y − y₀)² = 0

と言うことになります。

ここで上の等式の左辺は、近付け方を

y = y₀, x → x₀ + 0

^に限

定すれば、

x→limx₀+0

f(x, y₀) − f(x₀, y₀)

x − x₀ − a

y = y₀, x → x₀ − 0

^{に限定すれば、}

− lim

x→x₀−0

f(x, y₀) − f(x₀, y₀)

x − x₀ + a

(21)

x = x₀, y → y₀ + 0

^{に限定すれば、}

y→limy₀+0

f(x₀, y) − f(x₀, y₀)

y − y₀ − b x = x₀, y → y₀ − 0

^{に限定すれば、}

− lim

y→y₀−0

f(x₀, y) − f(x₀, y₀)

y − y₀ + b

より結局、接平面が存在するならば、その

x

^{軸正方向の傾きは偏}

微分係数

f_x(x₀, y₀), y

軸正方向の傾きは偏微分係数

f_y(x₀, y₀)

^で

なければならないので、偏微分可能であることはどうしても必要ですが、それだけでは不十分で、結局それら偏微分係数に対して、

(x,y)lim→(x₀,y₀)

f(x, y) − f(x₀, y₀) − f_x(x₀, y₀)(x − x₀) − f_y(x₀, y₀)(y − y₀)

√(x − x₀)² + (y − y₀)² = 0

が成り立つときに限り、接平面が存在すると言えます。

(22)

0

-x y z 6

z =f(x, y)

平面 y = y₀ z = f(x, y₀)

◦

0

-x y z 6

z =f(x, y) 平面 x = x₀

z =f(x0, y)

◦

(23)

0 - x y z 6

z = f(x, y)

◦ 接平面

一般に

t → 0

^のとき、

t

^より速く

0

^{に近付くものを}

o(t)

^で表し

ます。この表記を用いると、上の条件は

f(x, y) = f(x₀, y₀) + f_x(x₀, y₀)(x − x₀) + f_y(x₀, y₀)(y − y₀) +o(

√

(x − x₀)² + (y − y₀)²)

と表せます。

(24)

o(t) を高位の無限小と呼びます。ちなみに、もう少しゆるく、高々 t ^の定数倍程度の速さで 0 に近付く、言い換えると t に対する比が有界であるものは、

同位の無限小と呼んでO(t) で表します。これらの記号をまとめてランダウの記号と呼びます。

1

変数関数の場合で言うと、条件

f(x) = f(x₀) + f^′(x₀)(x − x₀) + o(|x − x₀|)

が、

f(x)

^が

x = x₀

で微分可能であることと同値でした。

前頁の条件が成立するとき、同様の意味合いで、

f(x, y)

^は

(x, y) = (x₀, y₀)

で全微分可能であると言います。全微分可能ならば、今度こそ連続となることは、条件式右辺において、

f(x₀, y₀)

以外の項が皆、

(x, y) → (x₀, y₀)

^のとき

0

に近付くことからわかり

ます。

(25)

また、全微分可能ならば、既に見たように偏微分可能ですが、

さらに、任意の方向

v = (p, q) (√

p² + q² = 1)

^に対し、

f(x₀ + pt, y₀ + qt)

= f(x₀, y₀) + f_x(x₀, y₀)pt + f_y(x₀, y₀)qt + o(|t|)

より

f(x₀ + pt, y₀ + qt) − f(x₀, y₀) t

= f_x(x₀, y₀)p + f_y(x₀, y₀)q + o(|t|)

→ f_x(x₀, y₀)p + f_y(x₀, y₀)q (t t→ 0)

が成り立つので、方向微分可能であり、方向微分係数が

f_x(x₀, y₀)p + f_y(x₀, y₀)q

^{により与えられます。}

(26)

微積分の教科書において、全微分はしばしば、厳密にはまだ導入されない外微分もしくは微分形式と言う概念を用いて、

df = ∂f

∂xdx + ∂f

∂ydy = f_xdx + f_ydy

と表されますが、この式は、上で見た方向微分を与える式のことを表していると見ることも可能です。行ベクトルと列ベクトルの使い分けの意味と併せて、

ここで、ちょっとお話しておきます。

第２回でもちょっと触れたように、実は Rⁿ の点並びに各点における接ベクトルは、列ベクトルで表すのが慣例です。R² ^{の場合、各点}x₀ =



 x₀ y₀



 にお

ける任意の接ベクトルp =



 p q



 は、正式にはその点での偏微分作用素と考えて、基底

( ∂

∂x

) x₀

,

( ∂

∂y

) x₀

の線形結合

p

( ∂

∂x

) x₀

+ q

( ∂

∂y

) x₀

=



 ( ∂

∂x

) x₀

,

( ∂

∂y

) x₀







 p q





と表されます。

(27)

一方、2 ^変数関数 f(x, y) ^の全微分df = f_xdx + f_ydy ^は、各点 x₀ ^毎に、接ベクトル空間から R ^{への線形写像}(双対ベクトル、この場合は特に余接ベクトルと言います)

df_x₀ = f_x(x₀)dx_x₀ + f_y(x₀)dy_x₀ = (f_x(x₀), f_y(x₀))



 dx_x₀ dy_x₀





を表しています。ここでdx_x₀, dy_x₀ ^は、



 dx_x₀ dy_x₀







 ( ∂

∂x

) x0

,

( ∂

∂y

) x0





=







dx_x₀ ⁽⁽_∂x^∂ ⁾_x

0

)

dx_x₀

(( ∂

∂y )

x₀ )

dy_x₀ ⁽⁽_∂x^∂ ⁾

x0

)

dy_x₀

(( ∂

∂y )

x₀ )





 =



 1 0 0 1





を満たすもの(^双対基底)^です。

(28)

この意味で

df_x₀(p) = pf_x(x₀) + qf_y(x₀)

が成り立つ、すなわち、df_x₀ ^は、点 x₀ ^{における各}(^接)^ベクトル p ^に対し、f の p 方向の方向微分係数を与える線形写像と言うことになります。

この表記に従うと、速度ベクトルなどの接ベクトルは列ベクトルで、2 ^変数関数の(^全)微分は行ベクトルで、それぞれ成分表示するのがよいことになります。写像の微分であるヤコビ行列(^後出)も、この表記に倣って定義されます。

また、f ^の点 x₀ ^{における勾配ベクトル}grad f_x₀ は、接ベクトルとして定義されるものなので、R² においては、成分だけ見れば f ^の(^全)^{微分と同じく偏} 微分係数f_x(x₀), f_y(x₀) を並べたものですが、あくまで列ベクトルとして区別されるべきものです。

(29)

定義域の各点

(x, y)

で全微分可能であるような関数を、単に全微分可能な関数であると言います。しかしながら、与えられた関数が全微分可能であるか否かを、定義の条件式に当てはめて示すのは結構面倒です。

1

変数の場合に倣って、二つの偏導関数

f_x(x, y), f_y(x, y)

^{が共に連続のとき、}

f(x, y)

^は

C¹

^{級であると言}

いますが、実は

C¹

級ならば全微分可能なので、条件としてはや

や強くなってしまいますが、

C¹

級を確かめることは、全微分可能

の判定に有用です。

(30)

実際、

= f(x, y) − f(x₀, y) − f_x(x₀, y₀)(x − x₀)

+f(x₀, y) − f(x₀, y₀) − f_y(x₀, y₀)(y − y₀)

=



f(x, y) − f(x₀, y)

x − x₀ − f_x(x₀, y₀)



 (x − x₀) +



f(x₀, y) − f(x₀, y₀)

y − y₀ − f_y(x₀, y₀)



 (y − y₀)

より、

(31)

√

(x − x₀)² + (y − y₀)²

=



f(x, y) − f(x₀, y)

x − x₀ − f_x(x₀, y₀)



 x − x₀

√

(x − x₀)² + (y − y₀)² +



f(x₀, y) − f(x₀, y₀)

y − y₀ − f_y(x₀, y₀)



 y − y₀

√

(x − x₀)² + (y − y₀)²

で、ここで

ylim→y₀

f(x₀, y) − f(x₀, y₀)

y − y₀ = f_y(x₀, y₀)

は偏微分係数の定義そのままですが、一方、

f(x, y)

^が

C¹

^級であ

ることから

(32)

f(x, y) − f(x₀, y) x − x₀

= lim_y_→_y

0 _xlim_→_x

0

f(x, y) − f(x₀, y)

x − x₀ (

^{∵近付け方に依らない}

)

= lim

y→y₀ f_x(x₀, y) (

^∵

(x₀, y)

^{でも偏微分可能}

)

= f_x(x₀, y₀) (

^∵

f_x(x, y)

^が連続

)

も言えて、さらに、

x − x₀

√

(x − x₀)² + (y − y₀)², y − y₀

√

(x − x₀)² + (y − y₀)²

は共に有界ですから、結局

(x,y)lim→(x₀,y₀)

√(x − x₀)² + (y − y₀)² = 0

すなわち全微分可能であることが導かれます。

(33)

ちなみに、全偏微分可能な関数の和、差、積、商は、やはり全微分可能になりますから、任意の多項式関数、有理関数は、定義域の各点で全微分可能になります。また

2

^変数

(

^多変数

)

^の全微分

可能な関数と

1

変数の微分可能な関数の合成関数も全微分可能に

なります。

(34)

第４回練習課題の解答

g(x, y) = x⁴ + y², h(x, y) = x

^のとき、

f(x, y)

^{は原点で不連続}

でしたが、相加平均と相乗平均の関係より

|f(x, y)| = |x²y|

|x⁴ + y²| = x²|y|

x⁴ + y² = 1 2 ·

√x⁴y²

x⁴+y² 2

≤ 1 2

が成り立ちます。

(

^{つまり関数}

f(x, y)

^{は有界でした。}

)

^この不等

式を用いると、

g(x, y) = x⁴ + y², h(x, y) = x²

^{のときは、}

|f(x, y) − f(0, 0)| = |f(x, y) − 0| = |f(x, y)|

= x²|y|

x⁴ + y²|x| ≤ 1

2|x| ≤ 1 2

√

x² + y²

→ 0 (||x − 0|| =

√

x² + y² → 0)

なので、この

f(x, y)

解析 II ・講義ノート