• 検索結果がありません。

自然言語処理

N/A
N/A
Protected

Academic year: 2021

シェア "自然言語処理"

Copied!
21
0
0

読み込み中.... (全文を見る)

全文

(1)

自然言語処理 2012

- 平成 24 年 11 月 5 日 (No5)-

東京工科大学

コンピュータサイエンス学部 亀田弘之

(2)

前回の復習から

今日の課題

 先週授業で学んだことを列挙しなさい。

解答例)

     1. XXX を学んだ。

     2. XXX のインストール手順      3. XXX の定義

     4. XXX という用語

2 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(3)

NLP のプログラムを書いてみよ う!

1. Prolog のインストール 2. プログラム作成手順

1. IC 分析

2. 形式文法の設定

3. Prolog 形式への書き換え

4. NLP プログラムの実行 ( その1 )

5. 構文木を出力するプログラムへの拡張 6. NLP プログラムの実行 ( その2 )

3 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(4)

1. Prolog のインストール

• (再確認)

4 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(5)

Prolog の種類

Swi-prolog

SICStus-Prolog

I/F-Prolog

K-Prolog

Minerva

Arity/Prolog

RUN/Prolog

C-Prolog

Gnu Prolog

Open Prolog

YAP Prolog  など

5 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(6)

自由課題

• どんな Prolog があるのか調べてみよう。

• それぞれの Web Site を見つけてみよう。

• どれか1つ download して使ってみよう。

• 各 Prolog の特徴を比較し、一覧表を作っ

てみよう。

(注)本授業では swi-prolog を使います。

   なぜでしょうか?

   理由を考えてみてください。

6 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(7)

Prolog による構文解析プログラ ム

• 処理対象:

Tom broke the cup.

Natural Language Processing 2012 (Tokyo Univ. of Tech.) 7

(8)

IC 分析

• Tom broke the cup       文

 __ _____

 名詞句  動詞句

___ __ __   

 名詞  動詞 名詞句

       __ ___

限定詞 名詞

Natural Language Processing 2012 (Tokyo Univ. of Tech.) 8

(9)

形式文法

開始記号= s

終端記号 ={ tom, broke, the, cup }

非終端記号 ={ s, n, v, d, np, vp }

書き換え規則 ={

s → np + vp. np → n. np→d+n. vp→v+np.

n→tom. n→cup. v→broke. d→the.

}

Natural Language Processing 2012 (Tokyo Univ. of Tech.) 9

(10)

Prolog で表現する

s :- np + vp.

np :- n.

np:-d+n.

vp:-v+np.

n:-tom.

n:-cup.

v:-broke.

d:-the.

Natural Language Processing 2012 (Tokyo Univ. of Tech.) 10

(11)

Prog1.pl

s(A,C):-n(A,B),vp(B,C).

vp(A,C):-v(A,B),np(B,C).

np(A,C):-d(A,B),n(B,C).

n([tom|T],T).

n([cup|T],T).

v([broke|T],T).

d([the|T],T).

11 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(12)

Prog2.pl

s(A,C,s(_n,_vp)):- n(A,B,_n),vp(B,C,_vp).

vp(A,C,vp(_v,_np)):-

v(A,B,_v),np(B,C,_np).

np(A,C,np(_d,_n)):- d(A,B,_d),n(B,C,_n).

n([tom|T],T,n(tom)).

n([cup|T],T,n(cup)).

v([broke|T],T,v(broke)).

d([the|T],T,d(the)).

12 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(13)

今日の内容

1. 構文解析プログラムの動作を理解する 2. 構文解析プログラムを自分で書いてみる 3. その結果、先週までの内容の理解を深め

る。

13 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(14)

1. 構文解析プログラムの動作を理 解

• (例文) 

Tom broke the cup.

14 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(15)

2. 構文解析プログラムを自分で 書く

• 作成手順は?

(これも復習事項です。思い出せます か?)

15 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(16)

作成手順の概要

1. 処理対象を決める

2. 処理対象の各文に対して、統語構造の分 析を行う

3. 上記の分析結果をもとに、文法を書き下 す

4. 上記で得られた文法を、 Prolog の形式に 書きかえる

5. 動作を確認する

Natural Language Processing 2012 (Tokyo Univ. of Tech.) 16

(17)

自習問題

• 例文)

  

Time flies like an arrow.

Natural Language Processing 2012 (Tokyo Univ. of Tech.) 17

(18)

3. その他

18 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(19)

構文解析の種類

• 分類1

トップダウン解析方式 (Topdown) ボトムアップ解析方式 (Bottom-up)

• 分類2

縦型解析方式 横型解析方式

19 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(20)

確認問題

• 下記の用語を自分の言葉で説明しなさい。

構文解析

トップダウン解析方式とボトムアップ解析方式 縦型解析方式と横型解析方式

バックトラック

プログラミング言語 Prolog

20 Natural Language Processing 2012 (Tokyo Univ. of Tech.)

(21)

次回の予告

日本語を対象とするプログラムを一緒に作成 します。

PC を忘れないように。

Swi-Prolog が動くこと、 UTF-8 コードで保存で きるエディターが必要です。メモ帳でも OK です。

必要なら、日本語の文法書や辞書を持参して ください(たぶん要らないと思いますが..

.)。

Natural Language Processing 2012 (Tokyo Univ. of Tech.) 21

参照

関連したドキュメント

ニホンジカはいつ活動しているのでしょう? 2014 〜 2015

Guasti, Maria Teresa, and Luigi Rizzi (1996) "Null aux and the acquisition of residual V2," In Proceedings of the 20th annual Boston University Conference on Language

○   While trying to respond to situations at multiple reactor units due to lack of information about the cooling water injection status of Unit 2 since receiving information about

・ The direct causes leading to the reactor core damage accident of Fukushima Daiichi Units 1 to 3 are, in the case of Unit 1, the total loss of cooling capacity at an early stage

 “ボランティア”と言えば、ラテン語を語源とし、自

自然言語というのは、生得 な文法 があるということです。 生まれつき に、人 に わっている 力を って乳幼児が獲得できる言語だという え です。 語の それ自 も、 から

・コンクリート :破砕 処理容量 ・金属 :約 60m 3 /日. ・コンクリート :約 40m

2 保健及び医療分野においては、ろう 者は保健及び医療に関する情報及び自己