• 検索結果がありません。

PDF 意味フレームに基づく概念分析の射程

N/A
N/A
Protected

Academic year: 2023

シェア "PDF 意味フレームに基づく概念分析の射程"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

意味フレームに基づく概念分析の射程

—Berkely FrameNet and Beyond—

黒田 航

( ) 情報通信研究機構 [email protected]

1 はじめに

この論文は,ワークショップの背景となるフレーム意 味論(Frame Semantics: FS) [3]とBerkeley FrameNet (BFN) [4, 5]への入門を狙いとする.まずBFN/FSの内 容を解説し,それに続いて,私たちFOCAL研究グルー

プ[8]がBFN/FSをどのように拡張し,どんな成果を

得たかを簡単に説明する.ただし,ワークショップ当

日(09/18)の私の口頭発表では,「襲う」の意味フレーム

分析の手法の紹介と分析結果の解説に集中したいので,

BFNに対する当日の言及は最低限にし,この論文の中の 簡単な紹介で背景知識の提示は済ませる予定である.詳 細な情報に興味のある向きは[6, 8]を参考にされたい.

2 フレーム意味論 /FrameNet に超特急で入門 する

2.1 Berkeley FrameNetとはどんな研究企画か Berkeley FrameNet1)は意味フレームの大規模なデー タベースを開発する研究企画である.開発は第二期目に 入っており,現時点で数百程度の意味フレームがデー タベース化されている2).BFNの日本語版は,日本語フ レームネット(Japanese FrameNet: JFN) [12]という名 称で進行している3)

BFNはFillmoreのFS [3]の発展的応用であが,FS からBFNへの移行過程は単調ではなく,重要な概念的 変更も含まれる4).例えばFS初期の[3]の時点で想定 されていた(意味)フレームは,解釈フレーム(interpre-

tive frames)とも呼ばれ,相当広い意味で理解の背景と

なる知識構造を指すもので,Fillmore自身の表現を借 りれば,“unified frameworks of knowledge, or coherent schematizations of experience” [3, p. 232]である.

これに対し,BFNでは同じく(意味)フレームという

1)ホームページはhttp://www.icsi.berkeley.edu/ ˜framenet/で,数 多くの良質なオンライン論文が入手できる.

2)詳細は[2, 5]などを参照されたい.

3)JFNのワークショップが第四室で同時開催のはずである.

4)FSBFNとの違いの詳細は[5]などを参照されたい.

名称が使われていながらも,事実上,記述対象が状況 (内の行為)のような場合に限定されている5).私たちが (意味)フレームと呼んでいるものは,このBFNの意味 での(意味)フレームに相当する.

2.2 本家FSからの「逸脱」に関する注意

説明の便宜のため,Fillmoreが定義したFS [3] を Berkeley FS (BFS)と呼ぶ.私たちの研究はBFSの拡張 であるわけだが,現時点での研究方向づけ,特に作業 仮説はBFSのそれと同一というわけではない.特にフ レームの定義に関して,私たちはBFSに比べて限定的 な立場を取っていて「あれもこれもフレーム」という自 由奔放な定義は許容しない方針である.

具体的には,BFSは具象名詞{本,机,メガネ, . . .}が フレーム構造をもつことを許すが,私たちはそれは成立 しないと考える.これら具象名詞群が何らかのフレーム に関係していることは明らかであるが,それは,これら の概念がフレーム構造をもつことは意味しない.実際,

以下で見るようにフレーム概念の中核に状況があるとす れば,BFSのような定義の際の自由放任は明らかに好ま しいことではなく,制約する必要のあることである.

このような制約を動機づけているのは,BFSの枠組み に許されている自由度の過剰に対する懸念である6):自 由度が過剰であると,説明は恣意的になりがちである.

以下,私たちが想定する「制約されたFSの枠組み」

とBFSの共通点と相違点について,紙面が許す限りで 解説する.特に,意味フレームという用語が特定する概 念内容が基本文献で多かれ少なかれ不定であることを確 認し,現時点で私たちの研究方向にとって重要となる側 面に焦点を当て,紹介する.

5)この変更は理論的なものなのか作業の都合によるものなのか定 かではない.これから示唆されるように「フレーム」という語 が何を規定しているのかは必ずしも一定でも明白でもない.

6)基本文献[3]ではフレームの例が列挙されているばかりで,あ る概念構造がフレームと呼べるための判定条件に関して明確な 規定がないことが,この自由度の過剰の原因である.

1

(2)

2.3 意味フレームは(状況)理解の単位である

フレームFを限定的に定義した場合,F状況の理 想化で,典型的にはhh何がihいつihどこでih何のため にi. . .h何をihどうするiiのような形で表現できる.

状況の理想化としてのフレームは,ヒトが区別可能な 状況の一つ一つをコードしている非言語的な単位7)で,

有限個しか存在しないが,その数は少ないとは言えな い(人手コーディングの経験に基づいて,少な目に見積 もっても意味フレームの数は,文化ごとに数千から数万 はあると推測される).この集合がヒトが理解できる状 況の全体を定義すると考えられる8)

2.4 意味フレームは意味役割の源泉となる

同一のモノ(e.g., “本”)は(そのアフォーダンス[13]

に)基づいて,異なる状況 S1, . . . ,Sn で異なる現われ

R1, . . . ,Rn(e.g.,h出版物i,h内容i,h表現手段i, . . . )をも

つ.状況Fでのxの顕われF.R(x)がxFでの意味役 割である.この意味での意味役割をBFNはフレーム要 素(Frame Elements: FE’s)と呼ぶ[5].

例えば,BFNで(加熱)調理(cook)フレーム9)を見る と,(1)のような定義が与えられている:10)

(1) Cooking creation

Definition: This frame describes food and meal preparation. A COOKcreates a PRODUCEDFOOD

from (raw) INGREDIENTS. The HEATING IN-

STRUMENT and/or the CONTAINER may also be specified: [Cook Caitlin] [Gov baked] [Foodsome cookies] [Ingrfrom the pre-packaged dough]11) FEs:

Core:

a. CONTAINER [CONTAINER]: This FE identi- fes the CONTAINERthat holds the food being produced.

b. COOK[COOK]: The COOKprepares the PRO-

DUCEDFOOD.

c. HEATINGINSTRUMENT[HEAT INSTR]: This FE identifies the HEATINGINSTRUMENTwith which the COOKprepares the FOOD. d. INGREDIENTS [INGR]: The INGREDIENTS

which are altered by the COOKalters INGRE-

DIENTSto create the PRODUCEDFOOD.

7)[10]によって部分的に実在性が確認されている.

8)この意味でのフレームは,外延的には自然言語処理で格フレー [11]と呼ばれているものと実質的に同一だと考えられる.

9)フレームには文化差が反映する.英語のhCOOKINGiでは加熱 が前提となるが,日本語のh料理ih調理iはちがう.

10)これはFrameSQL 2.1の定義である.

11)WebインターフェイスではFEは色分けされている.

e. PRODUCEDFOOD[FOOD]:

f. RECIPIENT[REC]: RECIPIENTidentifies the person for whom the food has been prepared.

Lexical Units:12) bake.v, concoct.v, cook.v, cook up.v, make.v, prepare.v, put together.v, whip up.v

BFNのデータベースでは,フレーム群が継承や合成な どの関係によって結びつけられ,構造化されている[2]. 2.5 フレーム意味論の拡張/制約

私たちは以上のようなBFNの洞察を取り入れつつ,

FSを認知科学的観点から独自の拡張と制約を加えた.

具体的には,以下のように仮定した13)

2.5.1 勝ち残り方式のフレームの特定

BFN/FSは,人が語の意味を理解するときに,具体的

にどういう処理過程を通じてフレームが特定しているの か考察していない.これは認知科学的な観点からすると 不満が残る.この問題を解消するために,私たちは次の ように仮定する:

語の意義の曖昧性が解消されるとは,ほかの語群との 共起によって意味フレームが特定され,フレーム内での その語の意味役割が定まることである.この際,複数の フレームの競合が起こり,勝ち残ったフレームが解釈を 決定する.これは文脈(効果)の明示的モデル化である.

その品詞に係わらず,語は様々なフレームを喚起する が,喚起の仕方は語種によって異なる.動詞はフレー ムの特定に大きく貢献し,この性質故にBFNで支配項 (governor)と呼ばれ,重要視される[1]が,どんな語も 単独では意味フレームを特定する力はない.

2.5.2 意味フレームの基本レベル存在仮説

私たちは,意味フレームのネットワーク構造には「基 本レベル」と,その「上位,下位レベル」の区別がある と考えた.これを(意味フレームに関する)基本レベル の存在仮説と呼ぶ.これは概念の階層に基本レベルの概 念(e.g.,イヌ),その上位概念{動物,ペット, . . .},下位 概念(e.g.,{柴犬,チワワ, . . .})があるのと同じである.

私たちの「襲う」の分析ではフレームの基本レベルを 特定するには到っていないが,具体性のレベルの違いは 意味フレームの階層化に反映されている.

2.5.3 フレームの具体性と理解の深さは相関する

基本レベルのフレームの存在から基本レベルの理解の 存在が予想される.語群に最適な意味フレームが決定さ れたとき,あるレベルの理解が達成されるが,理解のレ ベルはフレームの具体性の度合いによって決まる.フ

12)Lexical Units (LUs)とはフレームを実現する語彙項目である.

13)基本文献[3, 4, 5]では重要な概念に正確な定義がないことが多 いため,どれがBFNにない,私たち独自の拡張なのかを正確に 言うのは難しいと断っておきたい.

2

(3)

レームの抽象性が低ければ「深い理解」が生じ,抽象性 が高ければ「浅い理解」が生じる.

3 意味フレーム解析の作業手順

この節では「襲う」の意味フレームの階層的ネット ワークを特定するための作業手順を説明する.

3.1 コーパス事例の収集とデータ編集

日英対訳コーパス[14]からコーパスKWIC (KeyWord In Context)ツールを使って「襲{わ,い,う,え,お}」の 全用例を収集した.これは参照したコーパスで観察可能 な「襲う」の全用例の分析である14).これにBFNの手 法[1]にならって意味役割を割り当て.データベース化 した.最終的に得られた事例は416例であった.

人手で意味フレームを特定しコーディングするために は,次の[a; b1, 2, 3; c1,2,3; d]の情報を指定する必要が ある: (a)文Sが実現しているフレーム名; (b1) Sの主語 句sと(b2) sの意味型,並びに(b3) sの意味役割(= FE);

(c1) Sの目的語句oと(c2) oの意味型,並びに(c3) o

意味役割; (d) Sの意味フレーム.表1に「襲う」のコー

ディング例をあげる.

表1 S1, S2の 主語句,目的語句の意味型, 味役割, Frame名コーディング例

!"#$ %&'( ' )&'(

*"+,- .+!/

0

*"+,-.+

123456

*"+,- .+"78"6

*"+9:

-.+!

/0

*"+9:-.+

123456

*"+9:- .+"78"6

*"+;<

=>?@

7ABCD"6

*E FGHIJKL MNO P FGH GQ

RSTAUVWDXY

Z[ JK \]"^)"_` ab_` Z[

*c deIfg?O4h iL

MNO P de jklm

RSBnoCBpDY qkrs &fg?

O(4hi turs RSBnoCBpDY

vs qk

3.2 「襲う」のフレームの階層ネットワーク

このデータの意味素性表示に基づいて,意味フレーム の階層的ネットワークが同定された.このような構造の ことを階層フレームネットワーク(Hierarchical Frame Network: HFN)と言う.「襲う」のHFNの最終形を図 1に示した(階層が上のフレームは抽象的,下のフレー ムは具体的なフレームである).実例を除く最下位ノー ドは(2)の12個のフレームに相当する:

(2) F01:グループ間抗争/紛争; F02:軍事侵略; F03:

(強盗などの)資源強奪; F04: 虐待; F05: 強姦; F06:動物の他個への攻撃(捕食系); F07:動物の

14)この際,用例が比喩的であるか否かの区別は,意図的に行わな かった.この理由は,比喩的な表現と非比喩な表現の区別は,

データの解析分析自体から現れれてくるべきもので,その区別 は分析者が恣意的に導入するべきものではないと考えたからで ある.実際,比喩と非比喩の区別を分析の前提としないフレー ム基盤アプローチが,その区別を前提とする比喩写像理論[9]

同等か,それ以上に比喩性の問題をうまく扱えることを示すこ とが,[7]の基本的な論点である.

ROOT 生体間 の抗争

厄災の 発生

人の襲撃

抗争/紛争

資源強奪

暴行 侵略

組員が敵対する組長を襲った 資源の乏しい国が隣国を襲った

虐待 強姦

覆面の男が銀行を襲った 通り魔が小学生を襲った

ストーカーが若い女性を襲った

動物の攻撃 捕食

非捕食

狼が子羊を襲った スズメバチの群れが人を襲った

自然災害 の発生

異変の発生 異常気象

疫病の流行

高波が海水浴客を襲った 小規模

大規模 地震が東京を襲った ペストがその町を襲った

大型の不況がその国を襲った 活動への

打撃

発病

不安が彼を襲った 肺癌が働盛りの彼を襲った

図1 「襲う」のHFN [矢印は(部分的)実現関係を表す]

他個体への攻撃(非捕食系); F08: (地震などの)大 規模な異常気象; F09: (高波などの)小規模な異常

気象; F10: 疫病の流行; F11: 活動への打撃の発

生; F12:発病

これらの意味フレームは「襲う」という語の選択制限に 反映される限り,なるべく細かく区別した.

図2には,「襲うの」意味フレームのネットワーク(つ まり「襲う」のHFN)の上部構造のみを示した.HFNの ルートはh被害の発生iで,それを除く大中規模の意味 フレーム群が9個存在することを表している

B: 人以外の生物から人を 含む生物への攻撃 [1] ーhuman, +animate [2] ‒intentional, +concrete [3] +/–human, +animate [3]が[1]から[2]な被害を受 け,犠牲になることもある

A: 生物から生物への攻撃 [1] +/–human, +animate [2] +/‒intentional, +concrete [3] +/–human, +animate [3]が[1]から[2]な被害を受 け,犠牲になることもある

R: 一般的損害・被害の発生 [1] +/–human, +/–animate [2] +/–intentional, +/–concrete [3] +/–human, +animate [3]が[1]から[2]な被害を受ける [3] Implicit

Experiencer

F: (人から見た)厄災の発生 [1] +/–human, +/–animate [2] +/–intentional, +/–concrete [3] +human, +animate [3]が[1]から[2]な被害を受け

C: 人以外の生物から人以 外の生物への攻撃 [1] ーhuman, +animate [2] –intentional, +concrete [3] –human, +animate [3]が[1]から[2]な被害を受 け,犠牲になることもある

Schematicity Level 4 (relative

to Level 0)

Schematicity Level 3 (relative

to Level 0)

Schematicity Level 2 (relative

to Level 0)

Schematicity Level 1 (relative

to Level 0) H: 異常事態の発生

[1] –human, –animate [2] –intentional, +/–concrete [3] +human, +animate [3]が[1]から[2]な被害を受 ける

Schematicity Level 0 E: 人から人への攻撃

[1] +human, +animate [2] +intentional, +concrete [3] +human, +animate [3]が[1]から[2]な被害を受 け,犠牲になることもある

I: 自然災害の発生 [1] –human, –animate [2] –intentional, +concrete [3] +human, +animate [3]が[1]から[2]な被害を受 け,犠牲になることもある

J: 活動への打撃 [1] –human, –animate [2] –intentional, –concrete [3] +human, +animate [3]が[1]から[2]な被害を受 け,犠牲になることもある D: 人以外の生物から人へ

の攻撃 [1] –human, +animate [2] –intentional, +concrete [3] +human, +animate [3]が[1]から[2]な被害を受 け,犠牲になることもある

G: (人から見た)災害の発生 [1] +/–human, +/‒animate [2] +/‒intentional, +concrete [3] +human, +animate [3]が[1]から[2]な被害を受 け,犠牲になることもある

図2 「襲う」のHFN (上位10ノードのみ)

私たちは,ネットワーク構造の成形に素性表示を用い た.実際,図2にあるように,「襲う」のFNの上位10 つのノード(上位フレーム群: Root, A, . . . , J)は,次のよ うな意味素性の組み合わせによって記述されている:

(3) a. 主語名詞の指示対象に関して(i) [±human],

3

(4)

(ii) [±animate], (iii) [±intentional]

b. 効果に関して(iv) [±concrete]

c. 目 的 語 の 指 示 対 象 が (v) [±animate], (vi) [±human]

この際,私たちは素性[±F]が{0, 1}以外の値を取らな いとは考えず,Fの値は連続で区間[0, 1]のどんな値を 取っても構わないとした.

3.3 フレーム効果の記述: メトニミーの場合

F(x)をx (x ={主語名詞s,目的語名詞o}についての 素性Fの妥当性だとすると「襲う」のネットワークでは 例えば,次の素性の共起制限が成立している:

(4) a. [. . . ,+intentional(x), . . . ,−animate(x), . . .]

from R1:[+intentional(x)][+animate(x)]

b. [. . . ,+animate(s), . . . ,−animate(o), . . .]

from R4:[+animate(s)][+animate(o)]

(4a)は個体属性を記述し,(4b)は「生物sが襲うのは 生物oである」という生体間(s, o)の相互作用を記述し ている.これは意味フレームの存在によってはじめて成 立するフレーム効果(frame effects)の一例である.

外界を一種の「情報状態」として一般化すれば,属性 は個体情報を,フレームは環境情報をコードしていると 言えるので,「フレームとは何か?」「認知モデルとは何 か?」のような根源的な問いの答えは「それらは状況と いう名で環境情報をコードする構造体だ」となる.

フレーム効果は,例えばA:「疫病がその{地方,動

物園, . . .}を襲った」のような文の解釈で発生するメト

ニミー効果をうまく説明する:「地方」や「動物園」は [+animate]の素性をもたず,図2のRの[+animate(o)]

の指定に反しているが,Aで理解される内容は「地方」

や「動物園」という(名の)抽象的な対象が襲われたとい うことではなくて,A0:「疫病がその{地方に住む人々, 動物園で飼育されている動物, . . .}を襲った」に近い.

これは,襲われるものが[+animate]なものとして再構 成されるということである.

AA0の再解釈の効果をメトニミーと言うのは簡単 であるが,それは何かの説明であるわけではない.これ をフレーム効果の一例だと見なせば,Aの目的語の箇所 にメトニミーが現れる必然性が説明される.

「暴走車が通行人を襲った」の場合,「錯乱した運転手 が運転ミスで通行人を襲った」のように暴走車を身体 の延長として解釈できると同時に,何らかの理由(例え ばブレーキの故障など)で運転手の制御から離れた車自 体に(創発的な) [+animate(s)]を認める解釈も可能であ る.加害フレームの要求である[+animate(s)]という特 性を,どのレベルの存在に帰着するかに差が現れる.

参考文献

[1] Atkins, S., Rundell, M., & Sato, H. 2003. The con- tribution of FrameNet to practical lexicography. In- ternational J. of Lexicography, 16 (3), 333–57.

[2] Baker, C., Fillmore, C., and Cronin, B. 2003. The structure of FrameNet database. International J. of Lexicography, 16 (3), 281–95.

[3] Fillmore, C. 1985. Frames and the semantics of un- derstanding. Quaderni di Semantica, 6 (2), 222—54.

[4] Fillmore, C., Wooters, C., & Baker, C. 2001. Build- ing a large lexical databank which provides deep se- mantics. In Proc. of the 15th Pacific Asia Conf. on Language Information and Computation.

[5] Fillmore, C., Johnson, C., and Petruck, M. 2003.

Background to FrameNet. International J. of Lexi- cography, 16 (3), 235–50.

[6] 黒田 航・井佐原 均2004.日本語の意味タグ体系 を定義する試み: FrameNetの視点から.自然言語 処理学会第10回大会発表論文集, 148–51.[増補改 訂版: http://clsl.hi.h.kyoto-u.ac.jp/ ˜kkuroda/ papers/

jfn-nlp10-rev3.pdf]

[7] 黒 田 航・野 沢 元. 2004. 比 喩 理 解 に お け る フ レ ー ム 的 知 識 の 重 要 性: FrameNet と の 接 点 (http://clsl.hi.h.kyoto-u.ac.jp/ ˜kkuroda/ papers/

metaphor-and-frames.pdf) [COE 21 ワークショッ プ:「メタファーへの認知的アプローチ」のため] [8] 黒田 航・金丸 利幸・龍岡 昌弘・中本 敬子・野澤 元.

2004. フ レ ー ム 指 向 概 念 分 析(FOCAL) の 目 標: Berkeley FrameNetを超えて[http://clsl.hi.h.kyoto- u.ac.jp/ ˜kkuroda/ papers/ focal-manifesto.pdf].

[9] Lakoff, G. & Johnson, M. 1999. Philosophy in the Flesh. Basic Books.

[10] 中本 敬子・野澤 元・黒田 航. 2004.動詞「襲う」の 多義性:カード分類課題と意味素性評定課題による 検討.日本認知心理学会第2回大会発表論文集, 38.

[11] 荻野 孝野・小林 正博・井佐原 均. 2003.『日本語動 詞の結合価』.東京:三省堂.

[12] Ohara, K. H., et al. 2003. The Japanese FrameNet Project: A Preliminary Report. In Proc. of PACLING

’03.

[13] 佐々木 正人. 1994.アフォーダンス:新しい認知の 理論.岩波書店.

[14] 内 山 将 夫・井 佐 原 均. 2003. 日 英 新 聞 記 事 お よ び 文 を 対 応 付 け る た め の 高 信 頼 性 尺 度. 自 然 言 語処理, 10 (4), 201–20. [http://www2.nict.go.jp/jt/

a132/members/mutiyama/jea/index.htmlで公開].

4

参照

関連したドキュメント

Gelfond と Lifschitz [1] の安定モデル意味論 (stable model semantics), Van Gelder ら

黒田 航 Kow KURODA 井佐原 均 Hitoshi ISAHARA 独情報通信研究機構 けいはんな情報通信融合研究センター National Institute of Information and Communications Technology NICT, Japan 概要

それに言語との「結びつけ」の理論を“継ぎ足す”必要がある. 第二の点を理解するには,言語と知識の結びつきのパターンは,背景知識の構造から自 動的に予測できるものではないという点を自覚することが重要である.「結びつけ」の問 題は,背景知識の構造化,組織化の理論とは別個に論じる必要があり,また,そうしなけ

FrameNet Ingestion eat.v drink.v … フレームを想起する 語を複数挙げている Ingestibles [Ingible] Ingestor [Ing] Place [Place] 意味役割

フレーム要素 (=状況ごとの粒 度の細かい意味役割) のデータ ベース (FrameElement List ) C.. 有意味な部分文字列 (語や連 続/不連続な句)

(8)では主節の chatting が Chatting フレームを喚起し,while 節はそれに付随する time

B ”に特化した辞書が必要であると考えた.そこで,隠喩の名詞句“ A の B

B ”に特化した辞書が必要であると考えた.そこで,隠喩の名詞句“ A の B