オートマトン形式言語及び演習 4. 正規言語の性質酒井正彦正規言語の性質反復補題正規言語が満たす性質ある与えられた言語が正規言語でないことを証明するためにその言語が正規言語であると

(1)

オートマトン・形式言語及び演習

— 4.正規言語の性質— 酒井正彦 www.trs.css.i.nagoya-u.ac.jp/~sakai/lecture/automata/ 4- 1 / 27

正規言語の性質

反復補題正規言語が満たす性質。ある与えられた言語が正規言語でないことを証明するために、その言語が正規言語であると仮定して反復補題を使い、矛盾を導く。閉包性正規言語を演算により組み合わせて得られる言語が正規言語となる演算について調べる。複雑なオートマトンを構成するツールとして利用可能。状態数の減少技術実現するチップ面積の減少。 4- 2 / 27

反復補題の直観的説明

言語L01={0n1n| n ≥ 1}が正規言語と仮定する。 L01を認識するDFAが存在する。その状態数をkとしよう。 k + 1種類の入力ε, 0, 00, . . . , 0kを考えると、状態数がkなので、同じ状態にたどり着く入力が少なくとも２種類存在する。その状態をq,二つの入力を0i、0j (i 6= j)とする。 0i1iは受理されるので、qから受理状態へ1iでたどり着ける。したがって、0j1iも受理してしまい矛盾する。 4- 3 / 27

反復補題

定理4.1: (正規言語に対する反復補題) Lを正規言語とするときn > 0が存在して、_{|w| ≥ n}なる任意のw ∈ Lについても以下を満たす分解w = xyzがある。 1. y 6= ε 2. |xy| ≤ n 3. ∀k ≥ 0, xykz ∈ L 4- 4 / 27

反復補題

証明：Lを認識するDFAが存在するので、その状態数でn を定める。 w = a1a2. . .am∈ L, m ≥ n、 pi= δ(p0,a1a2· · · ai) (i = 0, . . . m) とすると、p_i=pj, (i < j)を満たすi, jが存在する。(最小の i, jを選ぶ) 図のようにx, y, zを定めると、y 6= εかつ|xy| ≤ nかつ ∀k ≥ 0, xykz ∈ L。 4- 5 / 27

反復補題

例：反復補題を利用してLeq(0と1の出現数が等しい文字列からなる言語)が正規言語でないことを示す。 - Leqが正規言語と仮定。 - 反復補題で定まるnからw = 0n1n∈ Leqを決める。 - y 6= ε, |xy| ≤ n, ∀k ≥ 0, xyk_{z ∈ L} eqを満たす分割 w = xyzが存在。(なぜなら|w| ≥ n) - y = 0m_{(0 <}_m)_より、_xz_は₀_と₁_{の個数が異なる文} 字列。 - xz ∈ Leqより矛盾。 4- 6 / 27

(2)

反復補題

例：反復補題を利用してL_rev ={uuR| u ∈ {0, 1}∗_}_が正規言語でないことを示す。 - Lrevが正規言語と仮定。 - 反復補題で定まるnからw = 0n110n∈ Lrevを決める。 - y 6= ε, |xy| ≤ n, ∀k ≥ 0, xyk_{z ∈ L}_rev_{を満たす分割} w = xyzが存在。(なぜなら|w| ≥ n) - y = 0m_{(0 <}_m)_より、_{xz = 0}`₁₁₀n_{(` <}_n) - xz ∈ Lrevより矛盾。 4- 7 / 27

反復補題

例：反復補題を利用してLpr(素数個の1の文字列からなる言語)が正規言語でないことを示す。 - Lprが正規言語と仮定。反復補題でnが定まる。 - pをp ≥ n + 2なる素数とする。w = 1pとする。 - y 6= ε, |xy| ≤ n, ∀k ≥ 0, xyk_{z ∈ L} prを満たす分割 w = xyzが存在。(なぜなら|w| ≥ n) - |y| = m(m ≥ 1)、w0=xyp−mzとおく。 - w0_{∈ L} pr、また、|w0_{| = |xy}p−m_{z| = |xyz| + |y}p−m−1_{| =} p + m(p − m − 1) = (1 + m)(p − m)。 - p ≥ n + 2とm ≤ |xy| ≤ nより、 p − m ≥ (n + 2) − n ≥ 2。よって、|w0_|_{は素数でないの} で、矛盾。 4- 8 / 27

正規言語の閉包性

L,Mを正規言語とするとき、以下の言語は正規言語 - 和集合：L ∪ M、積集合：L ∩ M - 補集合：L、差集合：L − M - 反転：LR={wR| w ∈ L} - スター閉包：L∗_、_連接_：_L.M - 準同型の像： h(L) = {h(w) | w ∈ L, hは準同型写像} - 準同型の逆像： h−1₍L) = {w | h(w) ∈ L, h_{は準同型写像}_} 4- 9 / 27

正規言語の閉包性

定理4.4：MとM0_{が正規言語ならば、}_{M ∪ M}0_{も正規言語} 証明：M,M0_{をそれぞれ表す正規表現}_R,R0_{が存在する。こ} のとき、M ∪ M0₌_L(R+R0₎_。定理4.5：MがΣ上の正規言語ならば、M = Σ∗_{− M}_も正規言語証明：Mを認識するDFA A = (Q, Σ, δ, q0,F)が存在する。このとき、A0_{= (}_{Q, Σ, δ, q0}_,_{Q − F)}_は_M_{を認識する。}

正規言語の閉包性

例：(0 + 1)∗₀₁_{を認識する}DFA 例：(0 + 1)∗₀₁_{の補集合を認識する}DFA

正規言語の閉包性

定理4.8：LとMが正規言語ならば、L ∩ Mも正規言語証明1：ドモルガンの法則より、L ∩ M = L ∪ M。正規言語は和集合と補集合で閉じていることから、L ∩ Mも正規言語直積を用いて直接L ∩ Mを認識するオートマトンを作成することも出来る。直接の方が作成の手間がかからない。

(3)

正規言語の閉包性

定理4.8：LとMが正規言語ならば、L ∩ Mも正規言語証明2：L,Mを認識するオートマトンを AL= (QL, Σ, δL,qL,FL) AM= (QM, Σ, δM,qM,FM) とする。これらは(簡単のために)DFAとする。 - ALとAMを同時に模倣するオートマトンAを構成する。 4- 13 / 27

正規言語の閉包性

証明2 (続き) - aを読み込んだとき、 ALで状態pからsへ AMで状態qからtへ遷移する場合、 Aで状態(p, q)から(s, t)へ遷移するように構成する。 4- 14 / 27

正規言語の閉包性

証明2(続き) - 形式的には、 A = (QL× QM, Σ, δ, (qL,qM),FL× FM) ここで、δ((p, q), a) = (δL(p, a), δM(q, a)) - |w|に関する帰納法により次が証明できる δ((qL,qM),w) = (δL(qL,w), δM(qM,w))

- これより、L(A) = L(AL)∩ L(AM)が証明される

4- 15 / 27

正規言語の閉包性

例：(c)は(a)×(b) 4- 16 / 27

正規言語の閉包性

定理4.10：M,M0_{が正規言語ならば、}_{M − M}0_{も正規言語} 証明：M − M0₌_{M ∩ M}0_{なので、定理}4.5_、定理4.8_より明らか。定理4.11：Mが正規言語ならば、MRも正規言語証明1：Mを認識するオートマトンAから、MRを認識するオートマトンA0_{を構成する。} - Aの受理状態を一つに変更する。(新しい受理状態q_fを導入し、旧受理状態からqfへε遷移を作る) - 矢印をすべて逆向きにして、受理状態と初期状態を入れ換えてA0_{を構成する} 4- 17 / 27

正規言語の閉包性

定理4.11：Mが正規言語ならば、MRも正規言語証明2：正規表現Eを反転した言語を表す正規表現ERを帰納的に与える基底：εR=ε、_∅R=_∅、aR=a 帰納： - (F+G)R=FR+GR - (F.G)R=GR.FR - (F∗₎R=(FR₎∗ このとき、L(ER) = (L(E))RがEの構成に関する帰納法で証明できる 4- 18 / 27

(4)

準同型写像

以下の性質を満たす関数h : Σ∗_{→ Σ}0∗_を、_Σ_上の_準同型写

像(homomorphism)という。 h(a1a2· · · an) =h(a1)h(a2)· · · h(an)

準同型写像hによる言語Lの像： h(L) = {h(w) | w ∈ L} 例：h(0) = ab, h(1) = εで定まる準同型写像 h : {0, 1}∗_{→ {a, b}}∗_{を考えるとき、} - h(0011) = ababεε = abab - h(L(10∗₁_{)) =}_{h({11, 101, . . .}) = {ε, ab, . . .}} =L((ab)∗₎ 4- 19 / 27

準同型写像

hから定まる正規表現の変換ˆhの定義：基底：ˆh(ε) =ε、ˆh(∅) =∅、h(ˆa) =h(a) 帰納： - ˆ_{h(F+G) = ˆh(F)+}_h(G)ˆ - ˆ_{h(F.G) = ˆh(F).}ˆ_h(G) - ˆ_h(F∗_{) = ˆ}h(F)∗ 例：ˆh(10∗₁_{) =}_ε(_ab)∗_ε₌₍_ab)∗ 4- 20 / 27

準同型写像

定理4.14：Mが正規言語ならば、その準同型写像による像 h(M)も正規言語証明：Mを表す正規表現をEとし、L(ˆh(E)) = h(L(E))をE の構成に関する帰納法で示す。 - 基底：E =εまたはE =∅のとき、ˆh(E) = Eより L(ˆh(E)) = L(E) = h(L(E))。

- E =a、h(a) = b1_{· · · b}_nのとき、 L(ˆh(a)) =L(b1· · · bn) ={b1· · · bn} = h({a}) =h(L(a)) 4- 21 / 27

準同型写像

証明(続き)： - 帰納：E = F+Gのとき、 L(ˆh(F+G)) = L(ˆh(F)+ˆ_h(G)) =L(ˆh(F)) ∪ L(ˆh(G))IH=h(L(F)) ∪ h(L(G)) =h(L(F) ∪ L(G)) = h(L(F+G)) - E = F.Gのとき、 L(ˆh(F.G)) = L(ˆh(F)._h(G))ˆ =L(ˆh(F))L(ˆh(G))=IHh(L(F))h(L(G)) =h(L(F)L(G)) = h(L(F.G)) - E = F∗_のとき、 L(ˆh(F∗_{)) =}_L(ˆh(F)∗₎ =L(ˆh(F))∗ IH₌h(L(F))∗ h(L(F) h(L(F

準同型写像

準同型写像h : Σ∗_{→ Σ}0∗_{による言語}L ∈ Σ0∗_の逆像 h−1₍_{L) = {w ∈ Σ}∗_{| h(w) ∈ L}}

準同型写像

例：h(a) = 01, h(b) = 10で定まる準同型写像 h : {a, b}∗_{→ {0, 1}}∗_{を考える。}_L001₌_{L((00 + 1)}∗₎_、 Lba=L((ba)∗₎_{とするとき、}_h−1₍_L001_{) =}_L_ba_。 ⊇の証明：w = (ba)n(0≤ n)とする。 h((ba)n_{) = (1001)}n_{∈ L} 001より、w = (ba)n∈ h−1(L001)。 ⊆の証明：対偶を示す。w 6∈ Lbaとする。 - wがaで始まるとき、h(w)は01で始まるので h(w) 6∈ L001。 - wがbで終るとき、h(w)は10で終るのでh(w) 6∈ L001。 - wがaaを含むとき、h(w)は0101を含むので h(w) 6∈ L001。 - wがbbを含むとき、h(w)は1010を含むので h(w) 6∈ L001

(5)

準同型写像

定理4.16：準同型写像h : Σ∗_{→ Σ}0∗_{による正規言語}_{L ∈ Σ}0∗ の逆像は正規言語証明：Lを認識するDFA A = (Q, Σ0_{, δ,}_q0_,_F)_から、_DFA B = (Q, Σ, γ, q0,F)を構成する。ここで、 γ(q, a) = δ(q, h(a)) このとき、γ(q0,w) = δ(q0,h(w))。(|w|に関する帰納法で証明)これより、h−1₍_{L) = L(B)}_{が導ける。} 4- 25 / 27

準同型写像

例：h(a) = 01,h(b) = 10のとき、DFA Aから h−1₍_{L(A)) = L(B)}_をみたす_{DFA B}_{を構成する。} q0 q1 q2 0 1 1 0 0, 1 DFA A q0 b q1 q2 a b a a, b DFA B 4- 26 / 27

正規言語に関する決定可能な問題

空問題(L = ∅?) 所属性判定(w ∈ L?) 等価性判定(L(A) = L(A0₎_?) 4- 27 / 27

オートマトン 形式言語及び演習 4. 正規言語の性質 酒井正彦 正規言語の性質 反復補題正規言語が満たす性質 ある与えられた言語が正規言語でないことを証明するために その言語が正規言語であると