Taylor の定理の多変数への拡張

定理 2. 4.1 (合成関数の微分法、

2.5 多変数の平均値の定理、 Taylor の定理

2.5.2 Taylor の定理の多変数への拡張

ここではf は実数値の多変数関数とする (ベクトル値とすると、前項のような修正が必要になってやや面倒だから —有限増分の公式だとそういうことはないのだが…)。

2 変数関数でウォーミング・アップ 簡単のため、一般的に考える前に、2変数関数f =f(x, y) を 2 階の項まで展開してみよう。

f(a+h, b+k)−f(a, b) を扱うために、

F(t) :=f(a+th, b+tk) (t∈[0,1]) という 1 変数関数を導入する。合成関数の微分法によって

F^′(t) = ∂f

∂x(a+th, b+tk)h+∂f

∂y(a+th, b+tk)k である。特に

F^′(0) = ∂f

∂x(a, b)h+ ∂f

∂y(a, b)k.

12与えられた Aに対して、適当なB を探してA≤B なる形の不等式を得ることを「Aを上から評価する」

という。

もう一度合成関数の微分法を用いて微分すると F^′′(t) = ∂

∂x

∂f

∂x(a+th, b+tk)h·h+ ∂

∂y

∂f

∂x(a+th, b+tk)h·k + ∂

∂x

∂f

∂y(a+th, b+tk)k·h+ ∂

∂y

∂f

∂y(a+th, b+tk)k·k

= ∂²f

∂x²(a+th, b+tk)h²+ ∂²f

∂y∂x(a+th, b+tk)hk + ∂²f

∂x∂y(a+th, b+tk)kh+∂²f

∂y²(a+th, b+tk)k²

= ∂²f

∂x²(a+th, b+tk)h²+ 2 ∂²f

∂x∂y(a+th, b+tk)hk+∂²f

∂y²(a+th, b+tk)k². 1 変数関数 F に対して平均値の定理を適用すると、∃θ∈(0,1) s.t.

f(a+h, b+k)−f(a, b)

=F(1)−F(0) =F^′(0)·1 + 1

2F^′′(θ)·1²

=F^′(0) + 1 2F^′′(θ)

= ∂f

∂x(a, b)h+∂f

∂y(a, b)k + 1

2 (∂²f

∂x²(a+θh, b+θk)h²+ 2 ∂²f

∂x∂y(a+θh, b+θk)hk+ ∂²f

∂y²(a+θh, b+θk)k² )

. これが 2変数関数の2 階までのTaylor 展開の公式である。以下で導く一般の場合の公式はかなり複雑であるが、導出の原理はまったく同様である。

n 変数関数の m 次微分 さて、それでは一般の f に対して考察を始めよう。関数F(t) = f(a+th) の 1階導関数については

F^′(t) = d

dt[f(a+th)] =f^′(a+th)h=

∑n i=1

∂f

∂x_i(a+th)hi

という結果があり、これが前項の議論の基礎となったわけだが、まずこれを高階の導関数まで拡張しよう。

補題 2.5.3 Ω は Rⁿ の開集合、k ∈N,f: Ω→R は C^k級、a∈Ω, h=



 h₁

... hn



∈Rⁿ,

[a, a+h] :={a+th;t ∈[0,1]} ⊂Ω とするとき、

F(t) := f(a+th) (t∈[0,1]) とおくと、F: [0,1]→Rは C^k級で

(2.14) F^(m)(t) = ∑

1≤i1,i2,···,im≤n

∂^mf

∂x_i₁∂x_i₂· · ·∂x_i_m(a+th)h_i₁h_i₂· · ·h_i_m (1≤m≤k).

証明帰納法による。m= 1 の場合は系2.4.2で済んでいる。実際、(2.14)は m = 1 のとき、

i₁ を i と書き換えると

F^′(t) =

∑n i=1

∂f

∂x_i(a+th)hi

となるが、これは既に示した式である。(2.14) は m のとき成立すると仮定しよう: F^(m)(t) = ∑

1≤i1,i2,···,im≤n

∂^mf

∂x_i₁∂x_i₂· · ·∂x_i_m(a+th)h_i₁h_i₂· · ·h_i_m. すると ∂^mf

∂xi1∂xi2· · ·∂xim

(a+th) に関する合成関数の微分法により、

F^(m+1)(t) = d

dtF^(m)(t) = ∑

1≤i1,i2,···,im≤n

d dt

[ ∂^mf

∂x_i₁∂x_i₂· · ·∂x_i_m(a+th) ]

h_i₁h_i₂· · ·h_i_m

= ∑

1≤i1,i2,···,im≤n

[ _n

∑

i=1

∂

∂x_i

∂^mf

∂x_i₁∂x_i₂· · ·∂x_i_m(a+th)h_i ]

h_i₁h_i₂· · ·h_i_m

= ∑

1≤i1,i2,···,im,im+1≤n

∂^m+1f

∂xi1∂xi2· · ·∂xim∂xim+1

(a+th)h_i₁h_i₂· · ·h_i_mh_i_m+1. ((i, i₁, i₂,· · · , i_m)を (i₁, i₂,· · · , i_m+1) と書き換えた。)

これは、(2.14) が m+ 1 でも成立することを示している。

記述を簡単にするため、

(2.15) (d^mf)x(h) := ∑

1≤i1,i2,···,im≤n

∂^mf

∂x_i₁∂x_i₂· · ·∂x_i_m(x)hi1hi2· · ·him

とおく¹³。これを、f の xにおけるm 次微分と呼ぶ。これはh に関するm次同次多項式(m 次形式) である。この記号を使うと、補題2.5.3 の結果は、次式のようにまとめられる。

(2.16) F^(m)(0) = (d^mf)_a(h), F^(m)(t) = (d^mf)_a+th(h).

13このあたりは標準的な記号がない。ここで紹介した記号はいくつかの教科書に載っているものではあるが、

誰でも分かるとは限らない。この講義だけの記号と思っておいた方が良い。

m 次微分の同類項の整理 偏微分係数は偏微分の順序によらないのだから、上式の ∑ には同類項が含まれている。まとめるとどうなるか？例えば 2変数関数 f の2次微分については、

既に示したように、

(d²f)_a(h) =

∑2 i,j=1

∂²f

∂x_i∂x_j(a)h_ih_j

= ∂²f

∂x1∂x1

(a)h₁h₁+ ∂²f

∂x1∂x2

(a)h₁h₂+ ∂²f

∂x2∂x1

(a)h₂h₁+ ∂²f

∂x2∂x2

(a)h₂h₂

= ∂²f

∂x²₁(a)h²₁+ 2 ∂²f

∂x₁∂x₂(a)h1h2+ ∂²f

∂x²₂(a)h²₂. 一般には

(d^mf)_a(h) = ∑

1≤i1,i2,···,im≤n

∂^mf

∂x_i₁∂x_i₂· · ·∂x_i_m(a)h_i₁h_i₂· · ·h_i_m

= (

∂

∂x₁ +h2

∂

∂x₂ +· · ·+hn

∂

∂x_n )m

f(a)

= ∑

α1+α2+···+αn=m

α₁!α₂!· · ·α_n!

∂^mf

∂x^α₁¹∂x^α₂²· · ·∂x^α_nⁿ(a)h^α₁¹h^α₂²· · ·h^α_nⁿ. となる。ただし、ここでは二項定理

(a+b)^m =

∑m r=0

(m r

)

a^rb^m⁻^r =

∑m r=0

r!(m−r)!a^rb^m⁻^r を一般化した多項定理¹⁴

(a₁+a₂+· · ·+a_n)^m = ∑

1≤i1,i2,···,im≤n

a_i₁a_i₂· · ·a_i_m = ∑

α1+α2+···+αn=m α_jは非負整数

α₁!α₂!· · ·α_n!a₁^α¹a₂^α²· · ·a_n^αⁿ を用いて、多少形式的な¹⁵計算を行なった。

以上をまとめておこう。

14二項定理を認めれば、後はnに関する帰納法で簡単に証明できる。

15これを正当化することは可能である。 ∂

∂xi

は数ではないが、多項定理の証明に使うような数の性質は満足し

定理 2.5.4 (多変数の Taylor の定理) n, k∈N, Ω をRⁿ の開集合、f: Ω→RをC^k級の関数、線分[a, a+h]⊂Ωとするとき、次の式を満たすような 0< θ <1が存在する:

f(a+h) =

k−1

∑

m=0

m!(d^mf)_a(h) + 1 k!

(d^kf)

a+θh(h).

ここで(d^mf)_x(h) は f の x における m 次微分と呼ばれる、h についての m 次形式で、

次の式で定められる。

(d^mf)_x(h) = ∑

1≤i1,i2,···,im≤n

∂^mf

∂x_i₁∂x_i₂· · ·∂x_i_m(x)h_i₁h_i₂· · ·h_i_m

= (

h₁ ∂

∂x₁ +h₂ ∂

∂x₂ +· · ·+h_n ∂

∂x_n )m

f(x)

= ∑

α1+α2+···+αn=m

α1!α2!· · ·αn!

∂^mf

∂x^α₁¹∂x^α₂²· · ·∂x^α_nⁿ(x)h^α₁¹h^α₂²· · ·h^α_nⁿ.

証明補題 2.5.3 より、F(t) :=f(a+th)は [0,1]で C^k級で、

F^(m)(t) = (d^mf)a+th(h) (0≤m ≤k).

1変数関数についての Taylor の定理から、∃θ ∈(0,1) s.t.

F(1) =

k−1

∑

m=0

F^(m)(0)

m! ·1^m+ 1

k!F^(k)(θ)·1^k 後は代入するだけで結論を得る。

例 2.5.5 (現代解析の基礎演習」から)f(x, y)はC²級で、f(0,0) = 1,f_x(0,0) = 0.5,f_y(0,0) = 0.1 であり、さらに原点と点P = (0.1,0.2)を結ぶ線分上で

|f_xx(x, y)| ≤0.02, |f_xy(x, y)| ≤0.05, |f_yy(x, y)| ≤0.05

が成り立つとき、f(P) を評価せよ(1次近似で値を求め、Taylor の定理で誤差を評価せよ)。 (解答)a,a+h (ただしa = (a, b),h= (h, k)) を端点とする線分が f の定義域に含まれるならば、Taylor の定理から、∃θ∈(0,1) s.t.

f(a+h) = f(a) +f_x(a)h+f_y(a)k + 1

(f_xx(a+θh)h² + 2f_xy(a+θh)hk+f_xx(a+θh)k²) . ゆえに

|f(a+h)−(f(a) +f_x(a)h+f_y(a)k)|

≤ 1 2

( max

t∈[0,1]|f_xx(a+θh)|h²+ 2 max

t∈[0,1]|f_xy(a+θh)|hk+ max

t∈[0,1]|f_yy(a+θh)|k² )

a = (0,0), h= (0.1,0.2) として用いると、

f(a) +fx(a)h+fy(a)k =f(0,0) +fx(0,0)0.2 +fy(0,0)0.2 = 1 + 0.5×0.1 + 0.1×0.2 = 1.07, 1

2 (

max

t∈[0,1]|f_xx(a+th)|h²+ 2 max

t∈[0,1]|f_xy(a+th)|hk+ max

t∈[0,1]|f_yy(a+th)|k² )

≤ 1

2(0.02×0.1²+ 2×0.05×0.1×0.2 + 0.05×0.2²) = 0.0021.

ゆえに

|f(0.1,0.2)−1.07| ≤0.0021.

これから 1.07−0.0021≤f(0.1,0.2)≤1.07 + 0.0021 であるから、

1.0679≤f(0.1,0.2)≤1.0721.

2.5.3 ^{余談あれこれ}

この項に書いてあることはいずれもかなり役に立つものであるが、はじめて勉強するときは省略しても構わない。

Schwartz の多重指数の記法

Schwartz の多重指数 (multi-index) の記法を説明する。

(色々な公式が、1 次元のときと良く似た公式で書けることを面白く感じてくれれば幸いだが、こういう記号は肌にあわない、と感じたら無理に覚える必要はない。)

以下α= (α1, α2,· · · , αn),β = (β1, β2,· · · , βn)で、各αj,βj は0以上の整数であるとする。

|α|:=α₁+α₂+· · ·+α_n, α! := α₁!α₂!· · ·α_n!, h^α :=h^α₁¹h^α₂²· · ·h^α_nⁿ, ( ∂

∂x )α

( ∂

∂x₁ )α1(

∂

∂x₂ )α2

· · · ( ∂

∂x_n )αn

, f^(α) :=

( ∂

∂x )α

さらに

α ≥β ^def.⇔ α₁ ≥β₁, α₂ ≥β₂, · · · , α_n≥β_n, α > β ^def.⇔ α≥β, α̸=β

と定義し、α≥β のとき ( α β

)

:= α!

β! (α−β)!

とおく。

以上定めた記号を用いると、

(d^mf)_x(h) = m! ∑

|α|=m

f^(α)(x) α! h^α. よって

f(a+h) = ∑

0≤|α|≤k−1

f^(α)(a)

α! h^α+R_k, R_k = ∑

|α|=k

f^(α)(a+θh) α! h^α と 1 変数の場合と非常に良く似た形をした式が得られる¹⁶。

剰余項(remainder)R_k を Landau の記号を用いて書くと、次のようになる¹⁷。

系 2.5.6 定理2.5.4と同じ仮定の下で、

f(a+h) = ∑

0≤|α|≤k−1

f^(α)(a)

α! h^α+O(∥h∥^k) = ∑

0≤|α|≤k−1

f^(α)(a)

α! h^α+o(∥h∥^k−1) (h→0).

この記法は偏微分方程式論などでは頻繁に使われる。微積分の段階でも、Taylor の定理だけでなく色々使い道がある。例えば、積の微分法 (f g)^′ =f^′g+f g^′ の一般化である Leibniz^{ライプニッツ} の公式¹⁸は (

∂

∂x )α

(f g) =∑

β≤α

(α β

)

f^(β)g^(α⁻^β) のように表される。

Taylor の定理の逆

Taylor の定理の逆に相当する次の命題(証明略)は、覚えておくと便利である。

命題 2.5.7 定理2.5.4と同じ仮定の下で、

(2.17) f(a+h) = ∑

0≤|α|≤k−1

Cαh^α+o(∥h∥^k⁻¹) (h→0)

が成り立っているならば、

C_α = f^(α)(a)

α! (|α| ≤k−1).

これから、とにかく(2.17)の形に書ければ、主要部がTaylor の定理のそれと一致することが分かる。

16筆者自身はこちらの書き方の方が覚えやすいと感じていて、こちらだけ記憶していた時期があった。もっともこれは偏微分方程式の勉強をして、多重指数の記法に慣れたせいかもしれない。

17実はこの形にしておけば、ベクトル値関数でも成立する。一番暗記向きな公式かも知れない。

181 変数実数値関数の場合は(f g)^(k)=

∑k

r=0

(k r )

f^(r)g^(k⁻^r)であった。

例 2.5.8 f(x₁, x₂) = exp(x²₁ +x²₂) を原点のまわりで 4 階の項まで展開してみよう。e^t = 1 +t+¹₂t²+o(|t|²) より、

e^x²¹^+x²² = 1 + (x²₁+x²₂) + (x²₁+x²₂)²

2 +o((x²₁ +x²₂)²) = 1 + (x²₁+x²₂) + (x²₁+x²₂)²

2 +o(∥x∥⁴)

= 1 +x²₁+x²₂+ 1

2x⁴₁+x²₁x²₂+ 1

2x⁴₂+o(∥x∥⁴).

であるが、上の命題から Taylor の定理の展開に他ならないことが分かる。ゆえに

∂f

∂x₁(0,0) = ∂f

∂x₂(0,0) = 0,

∂²f

∂x²₁(0,0) = ∂²f

∂x²₂(0,0) = 2!·1 = 2, ∂²f

∂x₁∂x₂(0,0) = 0, f^(α)(0,0) = 0 (|α|= 3 なる任意の α∈(N∪ {0})²),

∂⁴f

∂x⁴₁(0,0) = ∂⁴f

∂x⁴₂(0,0) = 4!· 1

2 = 12, ∂⁴f

∂x²₁∂x²₂(0,0) = 2!2!·1 = 4, f^(α)(0,0) = 0 (|α|= 4 かつα ̸= (4,0),(0,4),(2,2)なる任意の α).

有限増分の公式

既に述べたように、ベクトル値関数について、平均値の定理は拡張できないが、大抵の場合は、次の命題を適用すれば十分である。

命題 2.5.9 (有限増分の公式) f: [a, a+h]→R^m は連続、(a, a+h) で微分可能、

sup

θ∈(0,1)

∥f^′(a+θh)∥=:M <+∞ とするならば

∥f(a+h)−f(a)∥ ≤M∥h∥.

この公式の証明はそれほど難しくはないが、f に少し強い仮定をおくと、積分を用いて分かりやすく証明できるので (すぐ下で述べる)、省略する¹⁹。

あるいは、平均値の定理を以下述べるように修正すれば

∥f(a+h)−f(a)∥ ≤C∥h∥ (C は h に関係ない定数)

の形の評価式を証明するのは難しくない。f = (f₁, . . . , f_m)^T とおくとき、各成分関数 f_i は実数値関数であるから

f_i(a+h) =f_i(a) +f_i^′(a+θ_ih)h (1≤i≤m)

となる θ_i ∈(0,1) (1≤ i≤ m) は存在する。つまり、成分ごとに異なる θ_iを必要とすることを我慢する。

19昔々、偉い先生が「微分のことは(積分などの手は借りずに)微分でしなくちゃ」とか言ったそうであるが

積分を利用した評価

関数の増分f(a+h)−f(a)を評価するのに、積分を用いるのが有効なことも多い。f ∈C¹ など、少し強い仮定が必要になるが、簡単で強力である。

f(a+h)−f(a) = [f(a+th)]^t=1_t=0 =

∫ 1 0

dt(f(a+th))dt =

∫ 1 0

f^′(a+th)h dt.

この式から有限増分の公式はすぐに導かれる。実際

∥f(a+h)−f(a)∥ ≤

∫ 1 0

∥f^′(a+th)h∥dt ≤ max

t∈[0,1]∥f^′(a+th)h∥

∫ 1 0

dt≤M∥h∥, ただし

M := max

t∈[0,1]∥f^′(a+th)∥.

(f は C¹級であるから、t7→ ∥f^′(x+th)∥ は連続関数であり、コンパクト集合 [0,1] 上最大値を持つ。)

積分を用いた Taylor の定理 同様の積分表示式 f(x) = f(a) +

∫ x a

f^′(t)dt から、

f(x) = f(a) +

∫ _x

[(t−x)]^′f^′(t)dt=f(a) + [(t−x)f^′(t)]^t=x_t=a−

∫ _x

(t−x)f^′′(t)dt

=f(a) +f^′(a)(x−a)−

∫ _x

(t−x)f^′′(t)dt のような部分積分を繰り返すことにより、

f(x) =

n−1

∑

k=0

f^(k)(a)

k! (x−a)^k+R_n(x), R_n(x) := (−1)ⁿ⁻¹

∫ _x

(t−x)ⁿ⁻¹

(n−1)! f⁽ⁿ⁾(t)dt

が導かれる。この形の剰余項を Schl¨omlich の剰余項と呼ぶ。積分の平均値定理を用いることにより、

∃c∈[a, x] s.t. R_n(x) = f⁽ⁿ⁾(c)

n! (x−c)ⁿ⁻¹(x−a) が得られる。これを Cauchy の剰余項と呼ぶ。

ドキュメント内多変数の微分積分学1 講義ノート (ページ 86-94)

定理 2. 4.1 (合成関数の微分法、

2.5 多変数の平均値の定理、 Taylor の定理

2.5.2 Taylor の定理の多変数への拡張

2.5.3 余談あれこれ

2.5.3 ^{余談あれこれ}