定理 2. 4.1 (合成関数の微分法、
2.5 多変数の平均値の定理、 Taylor の定理
2.5.2 Taylor の定理の多変数への拡張
ここではf は 実数値 の多変数関数とする (ベクトル値 とすると、前項のような修正が必要 になってやや面倒だから —有限増分の公式だとそういうことはないのだが…)。
2 変数関数でウォーミング・アップ 簡単のため、一般的に考える前に、2変数関数f =f(x, y) を 2 階の項まで展開してみよう。
f(a+h, b+k)−f(a, b) を扱うために、
F(t) :=f(a+th, b+tk) (t∈[0,1]) という 1 変数関数を導入する。合成関数の微分法によって
F′(t) = ∂f
∂x(a+th, b+tk)h+∂f
∂y(a+th, b+tk)k である。特に
F′(0) = ∂f
∂x(a, b)h+ ∂f
∂y(a, b)k.
12与えられた Aに対して、適当なB を探してA≤B なる形の不等式を得ることを「Aを上から評価する」
という。
もう一度合成関数の微分法を用いて微分すると F′′(t) = ∂
∂x
∂f
∂x(a+th, b+tk)h·h+ ∂
∂y
∂f
∂x(a+th, b+tk)h·k + ∂
∂x
∂f
∂y(a+th, b+tk)k·h+ ∂
∂y
∂f
∂y(a+th, b+tk)k·k
= ∂2f
∂x2(a+th, b+tk)h2+ ∂2f
∂y∂x(a+th, b+tk)hk + ∂2f
∂x∂y(a+th, b+tk)kh+∂2f
∂y2(a+th, b+tk)k2
= ∂2f
∂x2(a+th, b+tk)h2+ 2 ∂2f
∂x∂y(a+th, b+tk)hk+∂2f
∂y2(a+th, b+tk)k2. 1 変数関数 F に対して平均値の定理を適用すると、∃θ∈(0,1) s.t.
f(a+h, b+k)−f(a, b)
=F(1)−F(0) =F′(0)·1 + 1
2F′′(θ)·12
=F′(0) + 1 2F′′(θ)
= ∂f
∂x(a, b)h+∂f
∂y(a, b)k + 1
2 (∂2f
∂x2(a+θh, b+θk)h2+ 2 ∂2f
∂x∂y(a+θh, b+θk)hk+ ∂2f
∂y2(a+θh, b+θk)k2 )
. これが 2変数関数の2 階までのTaylor 展開の公式である。以下で導く一般の場合の公式はか なり複雑であるが、導出の原理はまったく同様である。
n 変数関数の m 次微分 さて、それでは一般の f に対して考察を始めよう。関数F(t) = f(a+th) の 1階導関数については
F′(t) = d
dt[f(a+th)] =f′(a+th)h=
∑n i=1
∂f
∂xi(a+th)hi
という結果があり、これが前項の議論の基礎となったわけだが、まずこれを高階の導関数まで 拡張しよう。
補題 2.5.3 Ω は Rn の開集合、k ∈N,f: Ω→R は Ck級、a∈Ω, h=
h1
... hn
∈Rn,
[a, a+h] :={a+th;t ∈[0,1]} ⊂Ω とするとき、
F(t) := f(a+th) (t∈[0,1]) とおくと、F: [0,1]→Rは Ck級で
(2.14) F(m)(t) = ∑
1≤i1,i2,···,im≤n
∂mf
∂xi1∂xi2· · ·∂xim(a+th)hi1hi2· · ·him (1≤m≤k).
証明 帰納法による。m= 1 の場合は系2.4.2で済んでいる。実際、(2.14)は m = 1 のとき、
i1 を i と書き換えると
F′(t) =
∑n i=1
∂f
∂xi(a+th)hi
となるが、これは既に示した式である。(2.14) は m のとき成立すると仮定しよう: F(m)(t) = ∑
1≤i1,i2,···,im≤n
∂mf
∂xi1∂xi2· · ·∂xim(a+th)hi1hi2· · ·him. すると ∂mf
∂xi1∂xi2· · ·∂xim
(a+th) に関する合成関数の微分法により、
F(m+1)(t) = d
dtF(m)(t) = ∑
1≤i1,i2,···,im≤n
d dt
[ ∂mf
∂xi1∂xi2· · ·∂xim(a+th) ]
hi1hi2· · ·him
= ∑
1≤i1,i2,···,im≤n
[ n
∑
i=1
∂
∂xi
∂mf
∂xi1∂xi2· · ·∂xim(a+th)hi ]
hi1hi2· · ·him
= ∑
1≤i1,i2,···,im,im+1≤n
∂m+1f
∂xi1∂xi2· · ·∂xim∂xim+1
(a+th)hi1hi2· · ·himhim+1. ((i, i1, i2,· · · , im)を (i1, i2,· · · , im+1) と書き換えた。)
これは、(2.14) が m+ 1 でも成立することを示している。
記述を簡単にするため、
(2.15) (dmf)x(h) := ∑
1≤i1,i2,···,im≤n
∂mf
∂xi1∂xi2· · ·∂xim(x)hi1hi2· · ·him
とおく13。これを、f の xにおけるm 次微分と呼ぶ。これはh に関するm次同次多項式(m 次形式) である。この記号を使うと、補題2.5.3 の結果は、次式のようにまとめられる。
(2.16) F(m)(0) = (dmf)a(h), F(m)(t) = (dmf)a+th(h).
13このあたりは標準的な記号がない。ここで紹介した記号はいくつかの教科書に載っているものではあるが、
誰でも分かるとは限らない。この講義だけの記号と思っておいた方が良い。
m 次微分の同類項の整理 偏微分係数は偏微分の順序によらないのだから、上式の ∑ には 同類項が含まれている。まとめるとどうなるか?例えば 2変数関数 f の2次微分については、
既に示したように、
(d2f)a(h) =
∑2 i,j=1
∂2f
∂xi∂xj(a)hihj
= ∂2f
∂x1∂x1
(a)h1h1+ ∂2f
∂x1∂x2
(a)h1h2+ ∂2f
∂x2∂x1
(a)h2h1+ ∂2f
∂x2∂x2
(a)h2h2
= ∂2f
∂x21(a)h21+ 2 ∂2f
∂x1∂x2(a)h1h2+ ∂2f
∂x22(a)h22. 一般には
(dmf)a(h) = ∑
1≤i1,i2,···,im≤n
∂mf
∂xi1∂xi2· · ·∂xim(a)hi1hi2· · ·him
= (
h1
∂
∂x1 +h2
∂
∂x2 +· · ·+hn
∂
∂xn )m
f(a)
= ∑
α1+α2+···+αn=m
m!
α1!α2!· · ·αn!
∂mf
∂xα11∂xα22· · ·∂xαnn(a)hα11hα22· · ·hαnn. となる。ただし、ここでは二項定理
(a+b)m =
∑m r=0
(m r
)
arbm−r =
∑m r=0
m!
r!(m−r)!arbm−r を一般化した多項定理14
(a1+a2+· · ·+an)m = ∑
1≤i1,i2,···,im≤n
ai1ai2· · ·aim = ∑
α1+α2+···+αn=m αjは非負整数
m!
α1!α2!· · ·αn!a1α1a2α2· · ·anαn を用いて、多少形式的な15計算を行なった。
以上をまとめておこう。
14二項定理を認めれば、後はnに関する帰納法で簡単に証明できる。
15これを正当化することは可能である。 ∂
∂xi
は数ではないが、多項定理の証明に使うような数の性質は満足し
定理 2.5.4 (多変数の Taylor の定理) n, k∈N, Ω をRn の開集合、f: Ω→RをCk級 の関数、線分[a, a+h]⊂Ωとするとき、次の式を満たすような 0< θ <1が存在する:
f(a+h) =
k−1
∑
m=0
1
m!(dmf)a(h) + 1 k!
(dkf)
a+θh(h).
ここで(dmf)x(h) は f の x における m 次微分と呼ばれる、h についての m 次形式で、
次の式で定められる。
(dmf)x(h) = ∑
1≤i1,i2,···,im≤n
∂mf
∂xi1∂xi2· · ·∂xim(x)hi1hi2· · ·him
= (
h1 ∂
∂x1 +h2 ∂
∂x2 +· · ·+hn ∂
∂xn )m
f(x)
= ∑
α1+α2+···+αn=m
m!
α1!α2!· · ·αn!
∂mf
∂xα11∂xα22· · ·∂xαnn(x)hα11hα22· · ·hαnn.
証明 補題 2.5.3 より、F(t) :=f(a+th)は [0,1]で Ck級で、
F(m)(t) = (dmf)a+th(h) (0≤m ≤k).
1変数関数についての Taylor の定理から、∃θ ∈(0,1) s.t.
F(1) =
k−1
∑
m=0
F(m)(0)
m! ·1m+ 1
k!F(k)(θ)·1k 後は代入するだけで結論を得る。
例 2.5.5 (現代解析の基礎演習」から)f(x, y)はC2級で、f(0,0) = 1,fx(0,0) = 0.5,fy(0,0) = 0.1 であり、さらに原点と点P = (0.1,0.2)を結ぶ線分上で
|fxx(x, y)| ≤0.02, |fxy(x, y)| ≤0.05, |fyy(x, y)| ≤0.05
が成り立つとき、f(P) を評価せよ(1次近似で値を求め、Taylor の定理で誤差を評価せよ)。 (解答)a,a+h (ただしa = (a, b),h= (h, k)) を端点とする線分が f の定義域に含まれるな らば、Taylor の定理から、∃θ∈(0,1) s.t.
f(a+h) = f(a) +fx(a)h+fy(a)k + 1
2
(fxx(a+θh)h2 + 2fxy(a+θh)hk+fxx(a+θh)k2) . ゆえに
|f(a+h)−(f(a) +fx(a)h+fy(a)k)|
≤ 1 2
( max
t∈[0,1]|fxx(a+θh)|h2+ 2 max
t∈[0,1]|fxy(a+θh)|hk+ max
t∈[0,1]|fyy(a+θh)|k2 )
.
a = (0,0), h= (0.1,0.2) として用いると、
f(a) +fx(a)h+fy(a)k =f(0,0) +fx(0,0)0.2 +fy(0,0)0.2 = 1 + 0.5×0.1 + 0.1×0.2 = 1.07, 1
2 (
max
t∈[0,1]|fxx(a+th)|h2+ 2 max
t∈[0,1]|fxy(a+th)|hk+ max
t∈[0,1]|fyy(a+th)|k2 )
≤ 1
2(0.02×0.12+ 2×0.05×0.1×0.2 + 0.05×0.22) = 0.0021.
ゆえに
|f(0.1,0.2)−1.07| ≤0.0021.
これから 1.07−0.0021≤f(0.1,0.2)≤1.07 + 0.0021 であるから、
1.0679≤f(0.1,0.2)≤1.0721.
2.5.3 余談あれこれ
この項に書いてあることはいずれもかなり役に立つものであるが、はじめて勉強するときは 省略しても構わない。
Schwartz の多重指数の記法
Schwartz の多重指数 (multi-index) の記法を説明する。
(色々な公式が、1 次元のときと良く似た公式で書けることを面白く感じてくれれば幸いだが、こう いう記号は肌にあわない、と感じたら無理に覚える必要はない。)
以下α= (α1, α2,· · · , αn),β = (β1, β2,· · · , βn)で、各αj,βj は0以上の整数であるとする。
|α|:=α1+α2+· · ·+αn, α! := α1!α2!· · ·αn!, hα :=hα11hα22· · ·hαnn, ( ∂
∂x )α
:=
( ∂
∂x1 )α1(
∂
∂x2 )α2
· · · ( ∂
∂xn )αn
, f(α) :=
( ∂
∂x )α
f.
さらに
α ≥β def.⇔ α1 ≥β1, α2 ≥β2, · · · , αn≥βn, α > β def.⇔ α≥β, α̸=β
と定義し、α≥β のとき ( α β
)
:= α!
β! (α−β)!
とおく。
以上定めた記号を用いると、
(dmf)x(h) = m! ∑
|α|=m
f(α)(x) α! hα. よって
f(a+h) = ∑
0≤|α|≤k−1
f(α)(a)
α! hα+Rk, Rk = ∑
|α|=k
f(α)(a+θh) α! hα と 1 変数の場合と非常に良く似た形をした式が得られる16。
剰余項(remainder)Rk を Landau の記号を用いて書くと、次のようになる17。
系 2.5.6 定理2.5.4と同じ仮定の下で、
f(a+h) = ∑
0≤|α|≤k−1
f(α)(a)
α! hα+O(∥h∥k) = ∑
0≤|α|≤k−1
f(α)(a)
α! hα+o(∥h∥k−1) (h→0).
この記法は偏微分方程式論などでは頻繁に使われる。微積分の段階でも、Taylor の定理だ けでなく色々使い道がある。例えば、積の微分法 (f g)′ =f′g+f g′ の一般化である Leibnizラ イ プ ニッツ の公式18は (
∂
∂x )α
(f g) =∑
β≤α
(α β
)
f(β)g(α−β) のように表される。
Taylor の定理の逆
Taylor の定理の逆に相当する次の命題(証明略)は、覚えておくと便利である。
命題 2.5.7 定理2.5.4と同じ仮定の下で、
(2.17) f(a+h) = ∑
0≤|α|≤k−1
Cαhα+o(∥h∥k−1) (h→0)
が成り立っているならば、
Cα = f(α)(a)
α! (|α| ≤k−1).
これから、とにかく(2.17)の形に書ければ、主要部がTaylor の定理のそれと一致すること が分かる。
16筆者自身はこちらの書き方の方が覚えやすいと感じていて、こちらだけ記憶していた時期があった。もっと もこれは偏微分方程式の勉強をして、多重指数の記法に慣れたせいかもしれない。
17実はこの形にしておけば、ベクトル値関数でも成立する。一番暗記向きな公式かも知れない。
181 変数実数値関数の場合は(f g)(k)=
∑k
r=0
(k r )
f(r)g(k−r)であった。
例 2.5.8 f(x1, x2) = exp(x21 +x22) を原点のまわりで 4 階の項まで展開してみよう。et = 1 +t+12t2+o(|t|2) より、
ex21+x22 = 1 + (x21+x22) + (x21+x22)2
2 +o((x21 +x22)2) = 1 + (x21+x22) + (x21+x22)2
2 +o(∥x∥4)
= 1 +x21+x22+ 1
2x41+x21x22+ 1
2x42+o(∥x∥4).
であるが、上の命題から Taylor の定理の展開に他ならないことが分かる。ゆえに
∂f
∂x1(0,0) = ∂f
∂x2(0,0) = 0,
∂2f
∂x21(0,0) = ∂2f
∂x22(0,0) = 2!·1 = 2, ∂2f
∂x1∂x2(0,0) = 0, f(α)(0,0) = 0 (|α|= 3 なる任意の α∈(N∪ {0})2),
∂4f
∂x41(0,0) = ∂4f
∂x42(0,0) = 4!· 1
2 = 12, ∂4f
∂x21∂x22(0,0) = 2!2!·1 = 4, f(α)(0,0) = 0 (|α|= 4 かつα ̸= (4,0),(0,4),(2,2)なる任意の α).
有限増分の公式
既に述べたように、ベクトル値関数について、平均値の定理は拡張できないが、大抵の場合 は、次の命題を適用すれば十分である。
命題 2.5.9 (有限増分の公式) f: [a, a+h]→Rm は連続、(a, a+h) で微分可能、
sup
θ∈(0,1)
∥f′(a+θh)∥=:M <+∞ とするならば
∥f(a+h)−f(a)∥ ≤M∥h∥.
この公式の証明はそれほど難しくはないが、f に少し強い仮定をおくと、積分を用いて分か りやすく証明できるので (すぐ下で述べる)、省略する19。
あるいは、平均値の定理を以下述べるように修正すれば
∥f(a+h)−f(a)∥ ≤C∥h∥ (C は h に関係ない定数)
の形の評価式を証明するのは難しくない。f = (f1, . . . , fm)T とおくとき、各成分関数 fi は実 数値関数であるから
fi(a+h) =fi(a) +fi′(a+θih)h (1≤i≤m)
となる θi ∈(0,1) (1≤ i≤ m) は存在する。つまり、成分ごとに異なる θiを必要とすること を我慢する。
19昔々、偉い先生が「微分のことは(積分などの手は借りずに)微分でしなくちゃ」とか言ったそうであるが
積分を利用した評価
関数の増分f(a+h)−f(a)を評価するのに、積分を用いるのが有効なことも多い。f ∈C1 など、少し強い仮定が必要になるが、簡単で強力である。
f(a+h)−f(a) = [f(a+th)]t=1t=0 =
∫ 1 0
d
dt(f(a+th))dt =
∫ 1 0
f′(a+th)h dt.
この式から有限増分の公式はすぐに導かれる。実際
∥f(a+h)−f(a)∥ ≤
∫ 1 0
∥f′(a+th)h∥dt ≤ max
t∈[0,1]∥f′(a+th)h∥
∫ 1 0
dt≤M∥h∥, ただし
M := max
t∈[0,1]∥f′(a+th)∥.
(f は C1級であるから、t7→ ∥f′(x+th)∥ は連続関数であり、コンパクト集合 [0,1] 上最大値 を持つ。)
積分を用いた Taylor の定理 同様の積分表示式 f(x) = f(a) +
∫ x a
f′(t)dt から、
f(x) = f(a) +
∫ x
a
[(t−x)]′f′(t)dt=f(a) + [(t−x)f′(t)]t=xt=a−
∫ x
a
(t−x)f′′(t)dt
=f(a) +f′(a)(x−a)−
∫ x
a
(t−x)f′′(t)dt のような部分積分を繰り返すことにより、
f(x) =
n−1
∑
k=0
f(k)(a)
k! (x−a)k+Rn(x), Rn(x) := (−1)n−1
∫ x
a
(t−x)n−1
(n−1)! f(n)(t)dt
が導かれる。この形の剰余項を Schl¨omlich の剰余項と呼ぶ。積分の平均値定理を用いるこ とにより、
∃c∈[a, x] s.t. Rn(x) = f(n)(c)
n! (x−c)n−1(x−a) が得られる。これを Cauchy の剰余項と呼ぶ。