• 検索結果がありません。

自然言語処理2012 -平成24年12月3日 (No 8 )-

N/A
N/A
Protected

Academic year: 2021

シェア "自然言語処理2012 -平成24年12月3日 (No 8 )-"

Copied!
14
0
0

読み込み中.... (全文を見る)

全文

(1)

自然言語処理2012 -平成24年12月3日 (No

8 )-

東京工科大学 コンピュータサイエンス学部 亀田弘之

(2)

• 前回のパワポを読み返してみよう。

(前回の残りも一緒に話をします。)

復習(頭のリフレッシュ)

自然言語処理2012 東京工科大学 コンピュータサイエンス学 2

(3)

1. 前回の復習

2. 構文解析プログラムの動作を理解する。

(後日、自分の言葉で説明できることを目指す。)

3. 日本語処理のための技術的注意点

文字コード 形態素解析

4. ここまでのアプローチの限界

今日の内容

自然言語処理2012 東京工科大学 コンピュータサイエンス学 3

(4)

構文解析プログラムの動作を理解する

自然言語処理2012 東京工科大学 コンピュータサイエンス学 4

(5)

分析対象英文の決定

• 処理対象:

John ran fast.

( 参考 )

名詞 (noun), 動詞 (verb), 副詞 (adverb)

動詞句 ( verbal phrase)

(sentence)

自然言語処理2012 東京工科大学 コンピュータサイエンス学部 5

(6)

文法の設定 (grammatical setting)

文法 G=<Vn, Vt, σ, P>

ここで、  ・非終端記号の集合 :

Vt= { s, n, vp, adv }  ・終端記号の集合 :

Vn={ john, ran, fast }  ・開始記号 σ=s

 ・書き換え規則 群 P : 右記の通り。

{ s → n,vp.

vp → v,adv.

n → john.

v → ran.

adv → fast.

}

自然言語処理2012 東京工科大学 コンピュータサイエンス学 6

(7)

[ 形式文法の書式 ] s → n,vp.

vp → v,adv.

n → john.

v → ran.

adv → fast.

[Prolog の書式 ]

(書き換えてみよう)

Prolog 形式への変換

自然言語処理2012 東京工科大学 コンピュータサイエンス学 7

(8)

[ 形式文法の書式 ] s → n,vp.

vp → v,adv.

n → john.

v → ran.

adv → fast.

[Prolog の書式 ]

s(A,C,s(_n,_vp)) :-

n(A,B,_n),vp(B,C,_vp).

vp(A,C,vp(_v,_adv)):- v(A,B,_v),adv(B,C,_ad v).

n([john|T],T,n(john)).

v([ran|T],T,v(ran)).

adv([fast|

T],T,adv(fast)).

Prolog 形式への変換

自然言語処理2012 東京工科大学 コンピュータサイエンス学 8

(9)

1. Prolog を起動する

2. 構文解析のプログラムを読み込む 3. プログラムを実行する

(自分でできますか?)

動作させてみよう

自然言語処理2012 東京工科大学 コンピュータサイエンス学 9

(10)

• 構文解析プログラム= Porlog プログラム

• Prolog を理解する必要がある。

• Prolog を理解するポイントは、ユニフィケー

ション (unification) という概念の理解にある。

• 今日の学習目標の1つがこれ。

構文解析の動作を理解しよう

自然言語処理2012 東京工科大学 コンピュータサイエンス学 10

(11)

1. ユニフィケーションとは 2. 実例による理解

3. 動作のトレース

(以下、板書で説明します。)

自然言語処理2012 東京工科大学 コンピュータサイエンス学 11

(12)

(確認)構文解析プログラムの作成手順

1. 開発環境の整備

各種ソフトウェアのインストール

文字コードの決定 など

2. プログラム作成手順

言語データの収集

言語分析 <= 対象言語の知識が必要

形式文法の設定 <= 形式言語の知識が必要

④ Prolog 形式への書き換え <= Prolog の知識が必要

⑤ NLP プログラムの実行

構文木を出力するプログラム (draw_term/1)

動作することの確認

妥当性の検証 など

公開へ向けてのドキュメント等の整備

12 自然言語処理2012 東京工科大学

(13)

限界は?

自然言語処理2012 東京工科大学 コンピュータサイエンス学 13

(14)

解決方法は?

自然言語処理2012 東京工科大学 コンピュータサイエンス学 14

参照

関連したドキュメント

Tumornecrosisfactorq(TNFα)isknowntoplayaCrucialroleinthepathogenesisof

「父なき世界」あるいは「父なき社会」という概念を最初に提唱したのはウィーン出身 の精神分析学者ポール・フェダーン( Paul Federn,

AbstractThisinvestigationwascaniedouttodesignandsynthesizeavarietyofthennotropic

(実被害,構造物最大応答)との検討に用いられている。一般に地震動の破壊力を示す指標として,入

ドリフト流がステップ上段方向のときは拡散係数の小さいD2構造がテラス上を

関東総合通信局 東京電機大学 工学部電気電子工学科 電気通信システム 昭和62年3月以降

理工学部・情報理工学部・生命科学部・薬学部 AO 英語基準入学試験【4 月入学】 国際関係学部・グローバル教養学部・情報理工学部 AO

このような状況の下で、当業界は、高信頼性及び省エネ・環境対応の高い製品を内外のユーザーに