6 Weierstrass の最大値定理 (1 次元版 )
11.4 逆関数定理とその証明
定理 11.4 (逆関数定理, the inverse function theorem) Ω は Rn の開集合、f: Ω → Rn は C1 級、a ∈ Ω, detf′(a) ̸= 0 ならば、(∃U: a を含む開集合) (∃V: b = f(a) を含 む開集合) fe= f|U: U → V を fe(x) = f(x) (x ∈ U) で定めると feは全単射で、逆関数 fe−1: V →U も C1 級である。
特にfe:U →V は全単射で、feと fe−1 は連続である。このような写像を同相写像(homeo- morphism) と呼ぶ。
証明の方法にはいくつかあり、解析学の常套手段である「逐次近似法」を使う証明は非常に 魅力的だが、準備に手間がかかるので、ここでは Weierstrass の最大値定理に持ち込む方法を 採用する。
おおまかな方針の説明: x が a に十分近いとき(δ を小さな正数として |x−a| < δ で考 えて)、f(x) ≒ f′(a)(x−a) +f(a) であるから、f は1次関数で十分良く近似される。特に
f′(a) = I の場合を証明すれば良いことが分かるので、f(x)≒x+c となっている。与えられ
た y に対して y =f(x)を満たす x を求めるため、x7→ |y−f(x)|2 の最小値を考える。
証明
1◦ A := f′(a), g(y) := A−1y, ˜f :=g ◦f とおくと、( f˜
)′
(a) = g′(f(a))f′(a) = A−1A = I (I は単位行列)となる。f˜について定理を証明すれば、f =g−1◦f˜について示せたことにな る。そこで以下 f′(a) = I と仮定として証明すれば十分である。
2◦ (∃δ >0)K :=B(a;δ)とおくとき、K ⊂Ωかつ (a) (∀x∈K) |f′(x)−f′(a)|< 1
2. (b) (∀x∈K) detf′(x)̸= 0.
(c) (∀x∈K\ {a}) f(x)̸=f(a).
主張 (a), (b), (c) の証明 f′ の連続性により、x 7→ |f′(x)−f′(a)| は連続で、x = a の とき0 であるから、
(∃δ1 >0)(∀x∈B(a;δ1))|f′(x)−f′(a)|< 1 2. 同様に x7→detf′(x) は連続で、detf′(a) = 1̸= 0 であるから、
(∃δ2 >0)(∀x∈B(a;δ2)) detf′(x)̸= 0.
(c) については、まず f が a で微分可能であることから
xlim→a
|f(x)−f(a)−f′(a)(x−a)|
|x−a| = 0.
ゆえに (∃δ3 >0)
(♯) (∀x: 0<|x−a|< δ3) |f(x)−f(a)−f′(a)(x−a)|
|x−a| < 1 2.
これから 0<|x−a| < δ3 ならば f(x)̸=f(a) が成り立つ。実際、もしも f(x) =f(a) と すると |f(x)−f(a)−f′(a)(x−a)|
|x−a| = |0−I(x−a)|
|x−a| = |x−a|
|x−a| = 1
となり (♯) に矛盾する。δ := min{δ1, δ2, δ3} とおけば δ >0で、(a), (b), (c) が成り立つ。
3◦ (d) (∀x1 ∈K) (∀x2 ∈K) |x1−x2| ≤2|f(x1)−f(x2)|.
これから f を K に制限したものが単射であることはすぐ分かるし(x1, x2 ∈ K, f(x1) = f(x2) ならば x1 =x2 が成り立つ)、後述の逆写像が連続であることの証明の鍵となる。
主張 (d) の証明 g(x) :=f(x)−x (x∈K) とおくと
g′(x) = f′(x)−I =f′(x)−f′(a) であるから、(a) を用いて
maxx∈K |g′(x)| ≤ 1 2. g の変化を g′ を用いて評価する。
g(x1)−g(x2) = [g(x2+t(x1−x2))]t=1t=0 =
∫ 1 0
d
dtg(x2 +t(x1−x2))dt
=
∫ 1
0
g′(x2+t(x1−x2))(x1−x2)dt であるから
|g(x1)−g(x2)| ≤
∫ 1 0
|g′(x2+t(x1−x2))| |x1−x2|dt
≤max
x∈K |g′(x)| |x1−x2|
≤ 1
2|x1−x2|. すなわち
|(f(x1)−f(x2))−(x1−x2)| ≤ 1
2|x1−x2|. ゆえに (不等式 |a| − |b| ≤ |a−b| を用いて)
|x1−x2| − |f(x1)−f(x2)| ≤ 1
2|x1−x2|. 移項して両辺を 2倍すれば、(d) を得る。
4◦ S :=閉球 K の境界={x∈Rn| |x−a|=δ}はRnの有界閉集合であり、x7→ |f(x)−f(a)| は連続であるから、d:= min
y∈S |f(y)−f(a)| が存在する。(c) より |f(x)−f(a)|>0 (x∈S) であるから、d >0. V :=B(f(a);d/2)とおくと、
(e) y∈V ∧x∈S ⇒ |y−f(a)|<|y−f(x)|.
(図を描くとほぼ明らかである。V は f(a) を中心とする半径 d/2 の開球である。f(x) は
f(S) 上にあるが、それは f(a)を中心とする半径 d の開球の補集合に含まれる。) 主張 (e) の証明 実際、まず V の定義から
|y−f(a)|< d 2. 一方x∈S であることと、d の定義から
|f(x)−f(a)| ≥min
y∈S |f(y)−f(a)|=d
であるから
|y−f(x)|=|y−f(a) +f(a)−f(x)| ≥ |f(x)−f(a)| − |y−f(a)|
> d−d 2 = d
2 >|y−f(a)|. 5◦ (f) (∀y∈V) (∃!x∈K \S=B(a;δ)) f(x) = y.
主張 (f ) の証明 任意の y∈V を固定して、関数 h: K →Rを h(x) := |y−f(x)|2 ≡(y−f(x), y−f(x))
で定義する。(これが 0になる点の存在を示すわけだが、それは最小値を与える点であるこ とに注目しよう。) このh は Rn の有界閉集合K 上の連続関数であるから、最小値を取る 点 x∈K が存在する。ところで(e) より
x∈S ⇒h(a)< h(x)
であるから、S 上の点が h の最小値を与えることはない。ゆえにx̸∈S. ゆえにh は内点 x で最小値を取ることになり、∇h(x) = 0.
一般に「F: Ω→Rnが微分可能ならば、h(x) := |F(x)|2 とおくと、∇h(x) = 2F′(x)TF(x)」 となるので、∇h(x) = f′(x)T(f(x)−y). (b)よりf′(x)は正則行列であるからf(x)−y= 0.
すなわち f(x) = y. xの一意性は (d) から分かる。
6◦ ここまでで分かったことをまとめる。δ >0, d >0があって、
K =B(a;δ), S ={x∈Rn| |x−a|=δ}, V =B(f(a);d/2) に対して
再掲(d) (∀x1 ∈K) (∀x2 ∈K) |x1−x2| ≤2|f(x1)−f(x2)|. 再掲(f) (∀y∈V) (∃!x∈K\S) y=f(x).
このとき
B :=K\S=B(a;δ), U :=B ∩f−1(V) とおくと、a∈U かつU は Rn の開集合である。実際、
• a ∈ B(a;δ) = B, また f(a) ∈ B(f(a);d/2) = V であるから a ∈ f−1(V). ゆえに a∈U.
• B は開球であるから開集合である。
• 後は f−1(V) が開集合であることを示せば、U は2つの開集合の共通部分として開集 合である。その証明は、本質的に命題 8.5 (p. 75) の証明と同じである。b ∈ f−1(V) とすると、f(b) ∈ V であり、V は開集合であるから、(∃ε > 0) B(f(b);ε) ⊂ V. f が連続であることから、(∃δ′ > 0) (∀x ∈ Ω: |x−b| < δ′) |f(x)−f(b)| < ε. ゆえに f(x)∈V. x∈f−1(V). これは f−1(V)が Rn の開集合であることを示している。
このとき V ⊂f(B)に注意すると
f(U) = f(B∩f−1(V))⊂f(B)∩f(f−1(V))⊂f(B)∩V =V.
そこでfe:=f|U: U →V をfe(x) =f(x) (x∈U)で定めることが出来て、feは全単射とな り、逆写像 fe−1: V →U が存在する。
7◦ fe−1 は連続である。実際 (d) よりy1, y2 ∈V とするとき (♯) ef−1(y1)−fe−1(y2)≤2|y1−y2| であるから。
8◦ ∀x∈U に対して、fe−1 は y:=f(x) で微分可能で (fe−1)′(y) = (f′(x))−1.
主張の証明 x0 ∈U に対して、A:=f′(x0)とおく。(b) より detA̸= 0 であるから、Aの 逆行列が存在する。微分可能性の定義から
(12) f(x)−f(x0) = A(x−x0) +ε(x) によって ε(x) を定めるとき
(♭) lim
x→x0
|ε(x)|
|x−x0| = 0.
さて ∀y∈V に対して x:=fe−1(y)とおくと x∈U であり、f(x) = y. それで(12) の両辺 に A−1 をかけ、y0, y で書き直すと
A−1(y−y0) = fe−1(y)−fe−1(y0) +A−1ε(fe−1(y)).
ゆえに
fe−1(y)−fe−1(y0) =A−1(y−y0)−A−1ε(fe−1(y)).
そこで次のことを示せばよい。
ylim→y0
A−1ε(fe−1(y))
|y−y0| = 0.
これを示すには
ylim→y0
ε(fe−1(y))
|y−y0| = 0 を示せばよい。
ε(fe−1(y))
|y−y0| =
ε(fe−1(y)) ef−1(y)−fe−1(y0) ·
ef−1(y)−fe−1(y0))
|y−y0| .
fe−1 の連続性より、y → y0 のとき fe−1(y) → fe−1(y0) = x0. ゆえに (♭) により右辺の第 1 因子→0. 一方第2 因子は、(♯)より 2で押さえられる。
9◦ fe−1 が C1級であること。fe−1 のヤコビ行列 (fe−1)′(y) は f′(x) の逆行列であり、成分は Cramerの公式から、分母が detf′(x),分子は ∂fi
∂xj(x) の多項式として表現できる。これは y の関数として見て連続である。ゆえに fe−1 は C1級である。