逆関数定理とその証明

6 Weierstrass の最大値定理 (1 次元版 )

11.4 逆関数定理とその証明

定理 11.4 (逆関数定理, the inverse function theorem) Ω は Rⁿ の開集合、f: Ω → Rⁿ は C¹ 級、a ∈ Ω, detf^′(a) ̸= 0 ならば、(∃U: a を含む開集合) (∃V: b = f(a) を含む開集合) fe= f|U: U → V を fe(x) = f(x) (x ∈ U) で定めると feは全単射で、逆関数 fe⁻¹: V →U も C¹ 級である。

特にfe:U →V は全単射で、feと fe⁻¹ は連続である。このような写像を同相写像(homeo- morphism) と呼ぶ。

証明の方法にはいくつかあり、解析学の常套手段である「逐次近似法」を使う証明は非常に魅力的だが、準備に手間がかかるので、ここでは Weierstrass の最大値定理に持ち込む方法を採用する。

おおまかな方針の説明: x が a に十分近いとき(δ を小さな正数として |x−a| < δ で考えて)、f(x) ≒ f^′(a)(x−a) +f(a) であるから、f は1次関数で十分良く近似される。特に

f^′(a) = I の場合を証明すれば良いことが分かるので、f(x)≒x+c となっている。与えられ

た y に対して y =f(x)を満たす x を求めるため、x7→ |y−f(x)|² の最小値を考える。

証明

1^◦ A := f^′(a), g(y) := A⁻¹y, ˜f :=g ◦f とおくと、( f˜

)_′

(a) = g^′(f(a))f^′(a) = A⁻¹A = I (I は単位行列)となる。f˜について定理を証明すれば、f =g⁻¹◦f˜について示せたことになる。そこで以下 f^′(a) = I と仮定として証明すれば十分である。

2^◦ (∃δ >0)K :=B(a;δ)とおくとき、K ⊂Ωかつ (a) (∀x∈K) |f^′(x)−f^′(a)|< 1

2. (b) (∀x∈K) detf^′(x)̸= 0.

主張 (a), (b), (c) の証明 f^′ の連続性により、x 7→ |f^′(x)−f^′(a)| は連続で、x = a のとき0 であるから、

(∃δ1 >0)(∀x∈B(a;δ1))|f^′(x)−f^′(a)|< 1 2. 同様に x7→detf^′(x) は連続で、detf^′(a) = 1̸= 0 であるから、

(∃δ₂ >0)(∀x∈B(a;δ₂)) detf^′(x)̸= 0.

xlim→a

|f(x)−f(a)−f^′(a)(x−a)|

|x−a| = 0.

ゆえに (∃δ3 >0)

(♯) (∀x: 0<|x−a|< δ₃) |f(x)−f(a)−f^′(a)(x−a)|

|x−a| < 1 2.

これから 0<|x−a| < δ₃ ならば f(x)̸=f(a) が成り立つ。実際、もしも f(x) =f(a) とすると |f(x)−f(a)−f^′(a)(x−a)|

|x−a| = |0−I(x−a)|

|x−a| = |x−a|

|x−a| = 1

となり (♯) に矛盾する。δ := min{δ1, δ2, δ3} とおけば δ >0で、(a), (b), (c) が成り立つ。

3^◦ (d) (∀x₁ ∈K) (∀x₂ ∈K) |x₁−x₂| ≤2|f(x₁)−f(x₂)|.

これから f を K に制限したものが単射であることはすぐ分かるし(x₁, x₂ ∈ K, f(x₁) = f(x₂) ならば x₁ =x₂ が成り立つ)、後述の逆写像が連続であることの証明の鍵となる。

主張 (d) の証明 g(x) :=f(x)−x (x∈K) とおくと

g^′(x) = f^′(x)−I =f^′(x)−f^′(a) であるから、(a) を用いて

maxx∈K |g^′(x)| ≤ 1 2. g の変化を g^′ を用いて評価する。

g(x₁)−g(x₂) = [g(x₂+t(x₁−x₂))]^t=1_t=0 =

∫ 1 0

dtg(x₂ +t(x₁−x₂))dt

∫ ₁

g^′(x₂+t(x₁−x₂))(x₁−x₂)dt であるから

|g(x1)−g(x2)| ≤

∫ 1 0

|g^′(x2+t(x1−x2))| |x1−x2|dt

≤max

x∈K |g^′(x)| |x₁−x₂|

≤ 1

2|x₁−x₂|. すなわち

|(f(x₁)−f(x₂))−(x₁−x₂)| ≤ 1

2|x₁−x₂|. ゆえに (不等式 |a| − |b| ≤ |a−b| を用いて)

|x₁−x₂| − |f(x₁)−f(x₂)| ≤ 1

2|x₁−x₂|. 移項して両辺を 2倍すれば、(d) を得る。

4^◦ S :=閉球 K の境界={x∈Rⁿ| |x−a|=δ}はRⁿの有界閉集合であり、x7→ |f(x)−f(a)| は連続であるから、d:= min

y∈S |f(y)−f(a)| が存在する。(c) より |f(x)−f(a)|>0 (x∈S) であるから、d >0. V :=B(f(a);d/2)とおくと、

(e) y∈V ∧x∈S ⇒ |y−f(a)|<|y−f(x)|.

(図を描くとほぼ明らかである。V は f(a) を中心とする半径 d/2 の開球である。f(x) は

f(S) 上にあるが、それは f(a)を中心とする半径 d の開球の補集合に含まれる。) 主張 (e) の証明実際、まず V の定義から

|y−f(a)|< d 2. 一方x∈S であることと、d の定義から

|f(x)−f(a)| ≥min

y∈S |f(y)−f(a)|=d

であるから

|y−f(x)|=|y−f(a) +f(a)−f(x)| ≥ |f(x)−f(a)| − |y−f(a)|

> d−d 2 = d

2 >|y−f(a)|. 5^◦ (f) (∀y∈V) (∃!x∈K \S=B(a;δ)) f(x) = y.

主張 (f ) の証明任意の y∈V を固定して、関数 h: K →Rを h(x) := |y−f(x)|² ≡(y−f(x), y−f(x))

で定義する。(これが 0になる点の存在を示すわけだが、それは最小値を与える点であることに注目しよう。) このh は Rⁿ の有界閉集合K 上の連続関数であるから、最小値を取る点 x∈K が存在する。ところで(e) より

x∈S ⇒h(a)< h(x)

であるから、S 上の点が h の最小値を与えることはない。ゆえにx̸∈S. ゆえにh は内点 x で最小値を取ることになり、∇h(x) = 0.

一般に「F: Ω→Rⁿが微分可能ならば、h(x) := |F(x)|² とおくと、∇h(x) = 2F^′(x)^TF(x)」となるので、∇h(x) = f^′(x)^T(f(x)−y). (b)よりf^′(x)は正則行列であるからf(x)−y= 0.

すなわち f(x) = y. xの一意性は (d) から分かる。

6^◦ ここまでで分かったことをまとめる。δ >0, d >0があって、

K =B(a;δ), S ={x∈Rⁿ| |x−a|=δ}, V =B(f(a);d/2) に対して

再掲(d) (∀x1 ∈K) (∀x2 ∈K) |x1−x2| ≤2|f(x1)−f(x2)|. 再掲(f) (∀y∈V) (∃!x∈K\S) y=f(x).

このとき

B :=K\S=B(a;δ), U :=B ∩f⁻¹(V) とおくと、a∈U かつU は Rⁿ の開集合である。実際、

• a ∈ B(a;δ) = B, また f(a) ∈ B(f(a);d/2) = V であるから a ∈ f⁻¹(V). ゆえに a∈U.

• B は開球であるから開集合である。

• 後は f⁻¹(V) が開集合であることを示せば、U は2つの開集合の共通部分として開集合である。その証明は、本質的に命題 8.5 (p. 75) の証明と同じである。b ∈ f⁻¹(V) とすると、f(b) ∈ V であり、V は開集合であるから、(∃ε > 0) B(f(b);ε) ⊂ V. f が連続であることから、(∃δ^′ > 0) (∀x ∈ Ω: |x−b| < δ^′) |f(x)−f(b)| < ε. ゆえに f(x)∈V. x∈f⁻¹(V). これは f⁻¹(V)が Rⁿ の開集合であることを示している。

このとき V ⊂f(B)に注意すると

f(U) = f(B∩f⁻¹(V))⊂f(B)∩f(f⁻¹(V))⊂f(B)∩V =V.

そこでfe:=f|U: U →V をfe(x) =f(x) (x∈U)で定めることが出来て、feは全単射となり、逆写像 fe⁻¹: V →U が存在する。

7^◦ fe⁻¹ は連続である。実際 (d) よりy₁, y₂ ∈V とするとき (♯) ef⁻¹(y₁)−fe⁻¹(y₂)≤2|y₁−y₂| であるから。

8^◦ ∀x∈U に対して、fe⁻¹ は y:=f(x) で微分可能で (fe⁻¹)^′(y) = (f^′(x))⁻¹.

主張の証明 x₀ ∈U に対して、A:=f^′(x₀)とおく。(b) より detA̸= 0 であるから、Aの逆行列が存在する。微分可能性の定義から

(12) f(x)−f(x₀) = A(x−x₀) +ε(x) によって ε(x) を定めるとき

(♭) lim

x→x0

|ε(x)|

|x−x₀| = 0.

さて ∀y∈V に対して x:=fe⁻¹(y)とおくと x∈U であり、f(x) = y. それで(12) の両辺に A⁻¹ をかけ、y0, y で書き直すと

A⁻¹(y−y₀) = fe⁻¹(y)−fe⁻¹(y₀) +A⁻¹ε(fe⁻¹(y)).

ゆえに

fe⁻¹(y)−fe⁻¹(y₀) =A⁻¹(y−y₀)−A⁻¹ε(fe⁻¹(y)).

そこで次のことを示せばよい。

ylim→y0

A⁻¹ε(fe⁻¹(y))

|y−y₀| = 0.

これを示すには

ylim→y0

ε(fe⁻¹(y))

|y−y₀| = 0 を示せばよい。

ε(fe⁻¹(y))

|y−y₀| =

ε(fe⁻¹(y)) ef⁻¹(y)−fe⁻¹(y₀) ·

ef⁻¹(y)−fe⁻¹(y₀))

|y−y₀| .

fe⁻¹ の連続性より、y → y₀ のとき fe⁻¹(y) → fe⁻¹(y₀) = x₀. ゆえに (♭) により右辺の第 1 因子→0. 一方第2 因子は、(♯)より 2で押さえられる。

9^◦ fe⁻¹ が C¹級であること。fe⁻¹ のヤコビ行列 (fe⁻¹)^′(y) は f^′(x) の逆行列であり、成分は Cramerの公式から、分母が detf^′(x),分子は ∂fi

∂x_j(x) の多項式として表現できる。これは y の関数として見て連続である。ゆえに fe⁻¹ は C¹級である。

12 ^{陰関数定理}

ドキュメント内数学解析 (ページ 97-101)

6 Weierstrass の最大値定理 (1 次元版 )

11.4 逆関数定理とその証明

12 陰関数定理

12 ^{陰関数定理}