• 検索結果がありません。

生成規則・生成文法

N/A
N/A
Protected

Academic year: 2024

シェア "生成規則・生成文法"

Copied!
23
0
0

読み込み中.... (全文を見る)

全文

(1)

生成規則・生成文法

生成規則を与えることでも

言語を定めることが出来る

→ 生成文法(generative grammar)

生成規則による文法に適っている語の生成

• 初期変数を書く

今ある文字列中の或る変数を

生成規則のどれかで書換える

変数がなくなったら終わり

(2)

文脈自由文法(context-free grammar) 文脈が全て空列 ε

即ち、規則が全て A→w (AV) の形 文脈自由文法の形式的定義

• V : 有限集合 (変数の集合)

Σ : 有限集合 (終端記号の集合)

ここに VΣ=

R : 有限集合V×(VΣ) (規則の集合)

SV : 開始変数

(A, w)R が生成規則 A→w を表す

—計算機数学 2—

(3)

: 言語 A={anbnn0} は

正規言語ではないが文脈自由言語である :

S→aSb ε 従って、

文脈自由言語は正規言語より真に広い!!

さて、正規言語を計算するモデルが

有限オートマトンであった 文脈自由言語を計算するモデル

· · · プッシュダウンオートマトン

(4)

プッシュダウンオートマトン (非決定性)有限オートマトンに

プッシュダウンスタックを取り付けたもの

a b

a b

a

c b

a

a d

a push a push b push c pop pop push d

無限(非有界)の情報を保持できるが、

読み書きは先頭だけ

· · · LIFO (Last In First Out)

—計算機数学 4—

(5)

プッシュダウンオートマトンの形式的定義 M= (Q, Σ, Γ, δ, s, F)

• Q : 有限集合 · · · 状態の集合

Σ : 有限集合 · · · alphabet

Γ : 有限集合 · · · stack alphabet Σε:= Σ{ε}, Γε:=Γ {ε} と置く

δ:Q×Σε×ΓεP(Q×Γε)

: 遷移関数 (非決定的) · · · 可能な遷移先全体

sQ · · · 初期状態

FQ · · · 受理状態の集合

(6)

δ:Q×Σε×ΓεP(Q×Γε)

(r, y)δ(q, a, x) とは、

「入力 a を読んだとき、

状態 q でスタックの先頭が x なら、

スタックの先頭を y に書換えて、

状態 r に移って良い」

ということ (pop; push y)

x=y は書き換え無し

x=ε は push のみ

y=ε は pop のみ

a=ε は入力を読まずに遷移

—計算機数学 6—

(7)

スタックマシン このように

記憶場所としてプッシュダウンスタックを備えた 計算モデルや仮想機械・処理系を 一般にスタックマシンという

:

逆ポーランド電卓

PostScript

(8)

構文解析木

生成規則の適用過程を木で表したもの

G= (V, Σ, R, E)

V ={E, T, F}

Σ={a,+,×, (,) }

R:

? E→T | T +E

? T →F | F×T

? F→a | (E)

)

+ x

( a

F E

T

a

F

a

F

T

T E

E T F

—計算機数学 8—

(9)

定理 :

L : 正規言語 m

L が或る有限オートマトンで認識される 定理 :

L : 文脈自由言語 m

L が或るプッシュダウンオートマトンで 認識される 本質的な違いは?

文脈自由言語は再帰(recursion)を記述できる

(10)

文脈自由言語と再帰

S→aSb ε S(){

either

"";

or

{ "a"; S(); "b"; } }

main(){

S();

}

再帰 : 関数 S() の中で、自分自身を呼び出す

—計算機数学 10—

(11)

計算機での関数呼出・再帰の実現

関数呼出は原理的には次の仕組みで行なっている

現在の実行番地(戻る場所)を覚えておく

関数を実行する

関数を実行し終えたら、

覚えていた実行番地に戻って呼出側の実行再開 再帰呼出では呼出す度に覚えておく番地が増える

→ スタックに積んで覚えておく

(関数呼出の際に番地を push、戻ったら pop)

(12)

正規言語における再帰 正規表現 : (aa)

S→aaS ε S(){

either

"";

or

{ "aa"; S(); } }

main(){

S();

}

→ 末尾再帰の除去 main(){

loop {

"aa";

} }

繰返しで記述可能 (再帰は不要)

—計算機数学 12—

(13)

正規言語・文脈自由言語と再帰

正規言語は繰返しを記述できる

文脈自由言語は再帰を記述できる

• 再帰の実装にはスタックを要す

正規言語の生成規則は次の形に出来る

? X→xY (X, Y V, x Σ)

? X→x (XV, x Σε)

特に、末尾再帰であり再帰の除去可能

(14)

文脈自由言語の Pumping Lemma 文脈自由言語 A に対し、

nN:

wA,|w|n:

u, v, x, y, zΣ :w=uvxyz

(1) vy6(即ち v6=ε または y6) (2) |vxy|n

(3) k0:uvkxykz A

—計算機数学 14—

(15)

文脈自由言語の例

回文全体の成す言語は文脈自由

S→aSa bSb a b ε

: 回文全体の成す言語を認識する

プッシュダウンオートマトンを構成せよ

(16)

文脈自由言語の例

回文全体の成す言語は文脈自由

S→aSa bSb a b ε

: 回文全体の成す言語を認識する

プッシュダウンオートマトンを構成せよ

—計算機数学 15—

(17)

文脈自由言語の例

回文全体の成す言語は文脈自由

S→aSa bSb a b ε

: 回文全体の成す言語を認識する

プッシュダウンオートマトンを構成せよ

(18)

プッシュダウンオートマトンでは

認識できない言語の例 同じ文字列 2 回の繰返しから成る文字列全体

A={ww wΣ}

入力を読み直せないのが弱点

→ より強力な計算モデルが必要

—計算機数学 16—

(19)

プッシュダウンオートマトンでは

認識できない言語の例 同じ文字列 2 回の繰返しから成る文字列全体

A={ww wΣ}

入力を読み直せないのが弱点

→ より強力な計算モデルが必要

(20)

プッシュダウンオートマトンでは

認識できない言語の例 同じ文字列 2 回の繰返しから成る文字列全体

A={ww wΣ}

入力を読み直せないのが弱点

→ より強力な計算モデルが必要

—計算機数学 16—

(21)

一つの方法としては、

入力を覚えておくために

プッシュダウンスタックをもう一つ

使えることにする 実際これで真により強い計算モデルが得られる しかし、通常はこれと同等な

次のような計算モデルを考える

· · · チューリングマシン

(22)

一つの方法としては、

入力を覚えておくために

プッシュダウンスタックをもう一つ

使えることにする 実際これで真により強い計算モデルが得られる しかし、通常はこれと同等な

次のような計算モデルを考える

· · · チューリングマシン

—計算機数学 17—

(23)

チューリングマシン

有限個の内部状態を持つ

入力データはテープ上に一区画一文字づつ書き 込まれて与えられる

• データを読み書きするヘッドがテープ上を動く

遷移関数は次の形 :

内部状態とヘッドが今いる場所の文字とによっ て、その場所の文字を書き換え、次の内部状態に 移り、ヘッドを左か右かに動かす

受理状態または拒否状態に達したら停止するが、

停止しないこともある

参照

関連したドキュメント

校正は著者の責任において行ない,著者校正を 3 回行なう.なお,この

問題6 次の表計算ソフトの仕様を読み,各設問に答えよ。 この問題で使用する表計算ソフトの仕様は下記のとおりである。 CONCATENATE

入力条件 Handbook Studioで入力する項目の入力条件は以下の通りです。 <閲覧者アカウント> 項目名 入力条件 名

指定された書式の文字列と引数を使って、書式を整えた文字列を返す。 引数の意味は PrintWrite クラスの printf メソッド ( System.out.printf

start i=0 j=0 j=j+1 i=i+1 text[i+j]:pattern[j] return=-1 returnを返す return=i 腕ずくの文字列照合フローチャート textからpatternを探索する

機能 バッファの文字配列に printf の形式で文字列を出力する 形式 int sprintf(char *buf, char *formatstr, ... );. 引数

3 LC 構文解析の拡張 (ELC 構文 解析 ) 文脈自由言語以下のクラスの言語の場合, 生 成規則の矢印の左側が複数の文字列である生成規 則 \alpha \rightarrow

0文字以上の任意の文字を意味する。 例 A?B……Aで始まりBで終わる文字列でAB,AACB など。 4 】文字の任意な文字を示す。