複層意味フレーム分析 (MSFA) に
意味役割の典型的実現値の情報を付加してシソーラス化する試み ∗
黒田 航 井佐原 均
独立行政法人 情報通信研究機構 けいはんな情報通信融合研究センター
1 はじめに 1)
黒田・井佐原
[14]
は意味役割の一般理論[16]
によって 可能となる意味役割(semantic roles)
の意味型(semantic
types)
からの区別によって,意味型を基準に構築されている従来のシソーラス
(e.g.,
日本語語彙大系[6])
の不備 を補うことが可能であると論じたが,そのための技術的 な詳細に具体的に触れていない.この発表はその詳細を 補う.具体的には,黒田・井佐原[12, 13, 15]
の提唱す る複層意味フレーム解析(Multilayered Semantic Frame Analyis: MSFA)
に現われる意味役割(e.g., h
逮捕.
行逮 捕者i)
に,分析対象となった文中で実際に実現値になっ ている要素(e.g., “
検察当局” IS-A h
逮捕.
行逮捕者i
,“
ディエゴ・マラドーナ” IS-A h(
被)
逮捕者i)
以外の可能 な値を補充することで,意味解析の結果をシソーラスに 結びつけることが可能となるという提案を行ない,実装 案を示す.ただし,現在のところ,結果はあくまでも試 験的なものである.2 意味役割の実現値 2.1
事の始まり階層意味フレーム分析
[11]
の作業中,第一著者は次 のような選択制限の関係に特別の注意を寄せた: 2)
.(1) a.
ライオンに襲われた{
獲物; ?
被害者;
ガゼル(?*
の群れ); *
イワシの群れ}
は深刻な被害を 受けた.b.
バラクーダーに襲われた{
獲物; ?
被害者; *
ガ ゼル(
の群れ);
イワシの群れ}
は深刻な被害 を受けた.(2) a.
三人の強盗に襲われた{ ?*
獲物;
被害者;
アサ ヒ銀行; ?
アサヒビール; ??
アサヒ組}
は深刻 な被害を受けた.b.
三人の鉄砲玉に襲われた{ ?*
獲物;
被害者;
???
アサヒ銀行; ???
アサヒビール;
アサヒ組}
は深刻な被害を受けた.(3) a.
大型台風に襲われた{ **
獲物; ?*
被害者;
被 災地;
九州(
地方); ?
加山町}
は深刻な被害を∗
この論文は言語処理学会12
回大会での同名の発表論文を加筆,修正したものである.
1)
この研究の発表のためのデータ準備の段階で,中本敬子(京都
大学)と野澤元
(NICT)
から助力があった.二人に感謝したい.2)
この結果の解釈は中本・黒田[9]
に提示されている.受けた.
b.
火山灰に襲われた{ **
獲物; ?*
被害者;
被災 地; ??
九州(
地方);
加山町}
は深刻な被害を受 けた.(4) a.
急激な発作に襲われた{ **
獲物; ?
被害者; *
被災者; (
心臓病)
患者;
佐藤さん}
は深刻な被 害を受けた.b.
急激な不安に襲われた{ **
獲物; ??
被害者; *
被災者; ?(
心臓病)
患者;
佐藤さん}
は深刻な 被害を受けた.“x
がy
を襲う”
,“y
がx
に襲われる”
という文の理解内 容は,常に「何らかの形でy
がx
から害を被る」という ものであるのに,これを言い表わすのに,y
を一般に“
被害者”
と呼ぶことはできない.このような選択制限が示唆するのは,次の関係はおの おの意味クラスとそのインスタンスとの間の実現関係で あることである
:
(5) a.
ライオンの“
獲物”
と“
ガゼル(
の群れ)”
との 関係b.
バラクーダーの“
獲物”
と“
イワシ(
の群れ)”
との関係
c.
三人の強盗の“
襲撃”
の“
被害者”
と“
アサヒ 銀行”
との関係d.
三人の鉄砲玉の“
襲撃”
の“
被害者”
と“
アサ ヒ組”
との関係e.
大型台風の“
被災地”
と“
九州(
地方)”
との 関係f.
火山灰の“
被災地”
と“
加山町”
との関係g.
発作の“(
心臓病)
患者”
と“
患者”
との関係(6)
ただし,“
佐藤さん”
がインスタンスであるような“
不安”
の受け手の意味クラスには“
被害者”
,“
患 者”
のような名称を与えることはできない.2.1.1
階層化意味フレーム分析一部の意味クラスは
“
獲物”
,“
被害者”
という形で語 彙化されているが,語彙化されたもの,されていない ものを区別せずに,一般に意味クラスがどんなクラス であるかを明示化することが階層化意味フレーム分析(Hierarchical Semantic Frame Analysis: HFNA)
である[8, 11, 10]
.“x
がy
を襲う”
,“y
がx
に襲われる”
の解釈に関して 言えば,次のような15
個のx, y
の意味クラスの対によって意味フレームが特定された
(
三つの例のみ提示):
(7) a. h h
捕食者: xi
が, h
獲物: y i
を, h
捕食: z i
のた めに, h{
襲う;
襲撃}i
するi
b. h h
侵略者: xi
が, h
犠牲者: y i
を, h
侵略: zi
の ために, h{
襲う;
襲撃}i
するi
c. h h
受難者: yi
が, h
災難: x i
に, h NULL: zi
のた めに, h{
襲われ;
見舞われ}i
るi
f
がフレーム名,r i
がf
を構成する意味役割名であるこ とを表わすのに,hfi
,hf.r i i
という表記を用いる.ただ し,hf.r i i
の表記で“ f .”
の部分は多くの場合に省略可能 である.この際,特に重要な点は次である
:
(8) a. “
捕食者”, “
獲物”, “
災害”, “
被災者”, “
加害者”,
“
被害者”
のような語彙は,状況に個別化され た意味クラスh
捕食者i, h
獲物i, h
災害i, h
被 災者i, h
加害者i, h
被害者i
を表わすための語 彙である.b.
その一方,概念化可能なすべての意味クラス が語彙化されているわけではない(
実際,メ タファーの基盤は,語彙化されていない概念(
化)
を既成の語彙を用いて近似することだと 解釈できる)
.2.1.2
意味役割名と意味型名の関係(
語∗W
で表わされる)
意味クラスC(∗W )
が(
語W
で 表わされる)
実例I(W )
で実現されることを“∗W ⇒ W ”
で表わすことにする.“
捕食者” ⇒ “
インパラ”
や“
自 然災害” ⇒ “
台風”
などのクラスとインスタンスとの実 現関係は“
意味役割名⇒
意味型名”
という形で区別で きる.2.1.3
対象関係名(
詞)
と関係名(
詞)
意味型
(
名)
と意味役割(
名)
の区別は,孤立したもの ではない.例えば,Gentner
ら[3, 4, 2]
も意味役割と意 味役割名の区別にほぼ対応するものとして,関係的カテ ゴリー(relational categories)
と関係的名(
詞) (relational
names/nouns)
の研究を始めている.Gentner
らの分析で私たちの言う意味型と意味型名に対応するのは対 象カテゴリー
(object categories)
と対象名(
詞) (object
names/nouns)
の区別である(
彼らの研究文脈では対象名(
詞)
は実体名(
詞) (entity names/nouns)
とも呼ばれる)
.2.2
以上の一般化を下敷きにして,黒田・井佐原
[14]
が 主張したのは,意味役割名と意味型名とを注意深く区別 すると,錯綜しがちなシソーラスを再構築できるという ことである.簡単な実例として彼らは“
犬”, “
番犬”, “
柴 犬”
の例を挙げ,その方向性を示したが,再構築の十分 な詳細を与えたわけではない.特に問題になるのは,{ “
番犬”, “
番犬” }
のような意味クラスはどこに,どれだけ 見つかるかという問題が明らかでないことである.[“
犬” ( ⇒ “
番犬”) ⇒ “
柴犬”]
のような二層の階層関 係があるのではなくて,[F: “
犬” ⇒ “
柴犬”] AND [G: “
番犬” ⇒ “
柴犬”]
があり,G
は[H: {“
番人”, “
番犬” } ⇒
“
番犬”]
から由来すると規定する必要がある.だが,幸い,問題の意味クラスの探索法は複層意味フ レーム分析
(MSFA) [12, 13, 15]
という形で定式化され,徐々に研究成果が上がっている.本研究では,これを意 味型名と意味役割名の区別を反映したシソーラス構築に 有効利用することを考える.
具体的には次の通りである.
MSFA
は文章の個々の 文で使われている個々の語句に,その文脈で割り当てら れる意味役割を網羅的に特定したものだと見なせる.こ の意味役割を意味クラスとみなし,それを実際に文章中 で用いられていないが実現値として可能な語句を追加す ることによって,疑似シソーラス化が可能である.以下 にその実装案を示す.3 MSFA の疑似シソーラス化
MSFA
を疑似シソーラス化する手法の概要について,一例を取り上げながら説明する.
3.1 MSFA
の実例次の文は京大コーパスの一文
(S-ID: 950107210-002)
で,MSFA
によるタグづけが行われ,結果が公開されて いる: 3)
(9)
アルゼンチンの元サッカー選手、ディエゴ・マラ ドーナ氏が六日、同国の検察当局に一次身柄を拘 束された。図
1
に示したMSFA
は,(9)
の理解内容が,(
少なくと も)
次の42
タイプのフレーム群の相互作用によって構 成されることを示す:
(10) h∼
過去性の指定∼i, h∼
特徴づけ∼[1],[2],[3]i, h∼
役割 の値の指定∼[1],[2] i, h∼
受身∼i, h∼
参照∼i, h
事件報道i, h
報道i, h
報告i, h
知らせ(
る)i, h
知りi, h
語りi, h
事 件i, h
有名人の紹介i, h
敬意の表明i, h
引退i, h
役職か らの離脱i, h
サッカー選手としての活躍i, h
スポーツ選 手としての活躍i, h
有名人としての活躍i, h
活躍i, h
団 体競技ih
賃金のための労働i, h
チームへの所属i, h
所 属i, h
権力の行使i, h
力の行使[+metaphoric]i, h
拘束[+metaphoric]i, h
逮捕i, h
処罰i, h
行動の制限i, h
役割 の代行i, h
政府機関への所属i, h
帰属i, h
犯罪性の判断i, h
法律の適用i, h
犯罪の摘発i, h
捜査i, h
調査i, h
容疑i, h
疑うi, h
犯罪i, h?
職務の担当?i
3.1.1 MSFA
に現われるフレームの仕様h∼F ∼i
はF
が(h∼
参照∼i
などのように)
文法レベル のフレームであり概念的な内容をもつとは限らないこと を,h F[+metaphoric] i
はF
がメタファーとして機能しており,
“(F) targets G”
の関係で指定される転移先フレーム
G
があることを,おのおの表わす.また,h?F? i
はF
の認定が不確実であることを表わす.文の含意の形成には,フレーム間関係
(frame-to-frame
relations)
が重要な役割を果たす.わかっている限りで3)
この例を含めて,幾つかのMSFA
がhttp://www.kotonoba.
net/~mutiyama/cgi-bin/hiki2/hiki.cgi?MSFAList
で公 開されている.ただし閲覧には第一著者による認証が必要.!"#$%&'( !) !* !+ ,* ,+ !- .) /+ .* 0* !1# .+ !12 !3 !4 0+ !5 !6 /* 7* '+ .5 0- '* !8 !*3 !*5 !*+ !*1 !*6 !*- .- '- 05 !** 03 !*) .1 .3 !*8 !+* 06 !+) !++ !*4
!"#$%9:;9
!"#$%
<%=#:>;?@
%=#2;"#:%@
!*A B"%@CBB;@
%@&/+
%=#2;"#:%@
!+ %=#2;"#:%@
,* D;?@:>:C:%
@&,* "%#=>E%@&!+D;?@:>:C:%
@&!)D;?@:>:C:%
@&!) D;?@:>:C:%
@&!)A
%=#2;"#:%@
!1#
D;?@:>:C:%
@&.* %=#2;"#:%@
!12 D;?@:>:C:%
@&!) D;?@:>:C:%
@&!1#
B"%@CBB;@
%%@&!5A
%=#2;"#:%@
0+A D;?@:>:C:%
@&.*
%=#2;"#:%@
!6F'+
%=#2;"#:%@
.5A
%=#2;"#:%@
/*
%=#2;"#:%@
7*
B"%@CBB;@
%@&'+A D;?@:>:C:%
@&!5A
%=#2;"#:%@
'*
D;?@:>:C:%
@&!**A
%=#2;"#:%@
!*)
%=#2;"#:%@
!*5
%=#2;"#:%@
!*-F!*3A :#"G%:@
!*6 B"%@C$%@
!*6A
%=#2;"#:%@
/+
B"%@CBB;@
%@&!*4 D;?@:>:C:%
@&!*6A B"%@CBB;@
%@&05
%=#2;"#:%@
05 D;?@:>:C:%
@&05 D;?@:>:C:%
@&!*8D;?@:>:C:%
@&.1 B"%@CBB;@
%@&!*4A
"%#=>E%@
!+)
"%#=>E%@
!*1A
%=#2;"#:%@
03F06A B"%@CBB;@
%@&!+) D;?@:>:C:%
@&!+*A
%=#2;"#:%@
!++
$;:>H#:%@
!*6A B"%@B#"%@
!+*
!"#$%
I#$% JKLM LM LN OPQR OR ST UVWXY
Z[U JK\]^Y_
` abYcdUefgh
Ui*j UklUUefgh
Ui+j UmnYo
YZ[Ui*jpq mrsPY
tu vwxyz {|}~Y
•€
•‚yƒz {|}~Y
•€
\]^|}
~Y•€ •€ „…†‡ˆ‰YŠ‹
YŒ•Žy••Y
‘’ ‘’ U“”U•–Y—˜
–Y—˜
i™$%:#Bš;
">Dj
›œ i™$%:#Bš
;">Dj •ž Ÿ —¡Y¢£ mnY¤—¥¦§¨•
Y‘’ ©’ Uefgh
Ui-j ªr«Y¬
-ª UmnYo
YZ[Ui+j®¯XY°
± ²³Y´µ ®¯Y¶·¸¹ º¹ »¼ ¼½ ®¯
¾ .¿À {Á {Á
¾ ÂÃ .¿À
¾ ÂÃ .¿À ÂÃ
¾ {Á .¿À
¾ ÂÃ .¿À
¾ LMÄ LMÄ LNÄ OPQRÄÅOPQR
ÄÆ ST{ Z[Ä _`Ä cdÄefghÇ
RÄ efghÇ
RÄ “”Ä efghÇ
RÄ Z[Ä
¾ kLÄ kLÄ kLÄ ORÄ ORÄ ÈÉ{ _`YÊ{ÈÉ{ Å“”ËÌ
ÄÆ
¾ JKYÍ»LNÍ»LNÍ»ORÍ»ORÍ» Í» JÎ JK ÏÐ
ÑÒÓÔŽ Ô
Õ
Öר::"i*jÕÖר::" ef mn tuÄ×ef ÙÀ¿i*F-j “”Ú o
Y ÛØ<7Ù<
¾ ‘’Žy•‘’i•¡
Ü‘j •€YÜ ‘’„…ÝJܪ‘’Žy•‘’Ú
Þ ÙÀ¿7Ù<ÙÀ¿7Ù<
vwxy pq}Š•
¡ .¿À
z{ pqßYà
á mn z{â
ÙÀ¿7Ù< ÙÀ¿ \]^•€YÍ»ãä•â
ÙÀ¿7Ù< rå ÙÀ¿7Ù< ÙÀ¿
æ ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< .¿Àª
éêëì ÕÖ ÕÖ ÕÖ í—îÄ ÕÖ o pqÄ tuÄ •€Ä •€Ä •€Ä •€Ä †‡Ä Œ•Ä ‘’Ä ‘’Ä —˜YÕÖ —˜YÕÖ훜ÄÅíÆ•žÄ ÅíÆŸ Ä—¡Ä °±ÕÖ´µÅÕÖÆ
Ä í¶·Äí¸¹Äº¹ÕÖÅíÆ»¼Äí¼Ä ®¯Ä
ï ðäñyò
ó ÙçèÙI(Ù<â
ÙÀ¿7Ù<ª aôâ
ÙÀ¿7Ù<ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù<Ùçè ÙçèÙI(Ù< ÙçèÙI(Ù< ÙçèÙI(Ù<
õ ÛØ<7Ù<ÛØ<7Ù< ÛØ<7Ù<ÛØ<7Ù<ÛØ<7Ù<ÛØ<7Ù<ÛØ<7Ù<ÛØ<7Ù< ÛØ<7Ù<ÛØ<7Ù<ÛØ<7Ù<ÛØ<7Ù<ÛØ<7Ù<ÛØ<7Ù<ÛØ<7Ù<ÛØ<7Ù<
¾ —îYö÷ef °±Ä ´µÄ ¸¹Ä º¹Ä—»¼Ä—¼Ä
¾ °±Í»ÕÖ|øR
—îר::" »¼×Ø::" º¹Í
»×Ø::"
»¼YÍ
»×Ø::"
¼ùYÍ
»×Ø::"®—úÜ
¾ ®—ûü
¾ •žY]Â ÕÖ|øR
—î »¼ º¹Í» »¼YÍ» ¼ùYÍ» ®—YÍ»
¾ •žYÂÃ.¿À —¡¢£Y
ÏÐ mn .¿À ¶·YÏÐ »¼Yýþ ¼ùYýþÿ!i*j
¾ •–"#[
ÇR²³–"#[Ç R$%›œ"&-
'ÇRýþ ¢£Yýþ .¿À ¶·Yýþ ®¯()R
|*+Rý
¾ —˜YÜ‘ —˜YÜ‘ ›œYÜ‘ •žYÜ‘ Ÿ YÜ‘ ¶·YÜ‘
, —îY-.
ûü
—˜Y-.
ûü
—˜Y-.
ûü
›œY-.
ûü•žYûü Ÿ Yûü ¶·Yûü
û
æ /Ùçè /Ùçè /Ùçè /Ùçè /Ùçè /Ùçè
0 —îÄר::" “”Þ•–Y—˜
Äר::"
–Y—˜
Äר::"›œÄר::" •žÄר::"1Ÿ Äר::"
í¤—Äi2
34•–j¥¦§¨©’Ú ef mn
3
Y .¿ÀÙ<I¿
<ª
56 —îÄ •–Y—˜
Ä –Y—˜Ä›œÄ —•žÄ1Ÿ Ä¢£Ä ¤—Ä ‘’Ä ©’Ä ÕÖ ªr«ª °±Ä —´µÄ—¶·Ä¸¹Ä º¹Ä—»¼Ä—¼Ä
-7 Ùçè Ùçè Ùçè Ùçè Ùçè Ùçè Ùçè Ùçè Ùçè Ùçè ÙÀ¿7Ù<ªª¬-Ī Ùçè Ùçè Ùçè Ùçè Ùçè Ùçè Ùçè
8 ÛØ<7Ù< ÛØ<7Ù<ÛØ<7Ù<ÛØ<7Ù<ÛØ<7Ù<
¾ —îY9:
ûü
—˜Y9:
ûü
—˜Y9:
ûü
›œY9:
ûü ÙÀ¿i™D;$
B;@>:%j
;ü —îY<=
>? —˜Y>?—˜Y>?›œY>? @ú{Á ¢£Y>? ª¶·YÍ
»
lA —îYÍ» —˜YÍ» —˜YÕÖ ›œYÕÖ ¢£YÕÖ ÿ!â
ÙÀ¿7Ù<
ÿ!â ÙÀ¿7Ù<
ÙÀ¿BÿCâ ÙÀ¿7Ù<
ÙÀ¿BÿCâ ÙÀ¿7Ù<
ÿ!i+jâ ÙÀ¿7Ù<
" ÛØ<7Ù<ÛØ<7Ù< ÛØ<7Ù<
› ÙÀ¿ .¿À ªDÎ
œ ÙÀ¿
*+ .¿À Ùçè Ùçè Ùçè Ùçè ÙçèÙI(Ù<
Š .¿À Ùçè Ùçè Ùçè Ùçè Ùçè ÙçèÙI(Ù<
E Ùçè Ùçè Ùçè Ùçè Ùçè Ùçè Ùçè Ùçè Ùçè Ùçè
図
1 (9)
のMSFA
フレーム間関係には次のものがある
:
(11) a. F constitutes G (
構成の関係: e.g., h
判決i con- stitutes h
裁判i; h
代金の支払いi constitutes h
商品の購入i; “G HAS-A F”
とほぼ同じ) b. F elaborates G (
詳細化の関係: e.g., h
判決i
elaborates h
決定i; “F IS-A G”
とほぼ同じ) c. F presupposes G (
前提の関係: e.g., h
購入i
presupposes h
販売i presupposes h
制作i . . . ) d. F presumes G (
見こみの関係: e.g., h
販売i
presupposes h
購入i, h
制作i presumes [h
購入i presumes h
購入i])
e. F targets G (
意味の転移の関係:
見かけはF
だが,実質的意味はG
によって与えられる: e.g., h
束縛i targets h
逮捕i)
3.1.2
意味役割の実現値フレームはおのおの,意味役割の集合である.例えば
h
捜査i
フレームは次のような意味役割からなる:
(12) h hAgent:
捜査者: xi
が, h Patient:
犯罪者: y i
を, . . . , hGOV:
捜査i
するi
ここでは,
hf.r i i
の表記で“.”
演算子が省略され,“=”
で現われる同一視
(
あるいは異名化)
が許されると考え ている.詳細は次のように書くことができる:
(13) a. h
捜査.
実行者i = h
捜査者i⇒ { h
警察(
官) i, h
検察(
官) i, h
検察局i }
b. h
捜査.
対象i = h
捜査対象i⇒ { h
犯罪i, h
犯 罪者i }
ここで,
“=”
で表わされる同一視の関係の意味論はほぼ 自明だが,“⇒”
で表わされる意味クラスの実現の関係 の意味論は決して自明ではない.実際,“h
捜査.
実行者i
⇒h
警察(
官) i”
や“h
捜査.
対象i ⇒h
犯罪(
者) i”
を説明す るのが状況レベルの意味フレームという概念である.3.2
役割実現の記述言語の仕様表
2
に挙げるのが(9)
のMSFA
に用いられた意味フ レームの,実際に文章に現われた語句の他にも可能な実 現形を記述したものである.意味役割の実現を効果的に記述するためには,記述言 語の使用されている.そのための記述言語の仕様を,表
2
に挙げた具体例を元に説明する.3.2.1
役割名のスター指定まず,
“*
捜査.
捜査者”
という表記に注意が必要であ る.MSFA
に現われる表記は“
捜査者”
であるが,この シートでは“*
捜査.
捜査者”
としている.これを称して「意味役割名にスター指定がある」と言う.ただし,
h
捜 査者i = h
捜査.
捜査者i
である.一般に
“*X ”
は,hXi
が意味クラスを指定する概念ポインターで,語彙ではないことを表わすと取り決めてお く.この規約が必要なのは以下のような理由による
:
(14)
第一に,“
捜査者”
という語はh
捜査.
実行者i
を 表わすことができるが,この語は(“
犯罪者”, “
獲 物”, “
犯人”
などとは異なり)
語彙化された要素で はない.これは“
獲物”
という語が“
捕獲.
対象”
を表わし,かつ,その意味で語彙化されているの と同じではない.両者は区別した方がよい.(15)
第二に,“
逮捕者”
が(h
捕獲.
実行者i ⇒ “
捕獲者”
などの場合と異なり) h
逮捕.
実行者i
の意味を表 わない,h
逮捕.
対象i = “
被逮捕者”
の語彙化であ るという例外的な場合も扱える必要がある.h
逮 捕.
実行者i = “
逮捕者”
は誤りで,h
逮捕.
対象i
⇒ “
逮捕者”
が正しい.3.2.2
名称の生成表
2
ではh
刑事捜査.
捜査者i
の可能な実現値として,“[
人名]”, “
警察”, “∼
署”, “(∼)
捜査官”
などが挙げられ ている.これを網羅的に与えるのは困難だが,このよう な指定をなるべく詳しく行なうことがMSFA
の疑似シ ソーラス化と呼ばれる記述方法である.!"#$% &'()%*+,-% ./01 2134 2135 2136 2137 2138 2139 213: 213; 213< 2134= 21344 213 45
213 46
>?@A,BC DEF GDEFHIJ DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD
>?@A,BC DBCKL?@A,M NOP
QR DSTUQRKVWXY
GDSTUQRKHZ[\GD]QRKH
^[\GDQR,_`Ha[\SWXY bU\cdefg[QRghiJ
WXY
LjklmnopqrkM DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD
QR D]QRKsDQRb]t hK
GD]QRKHZ[\GDQR,_`H a[\GDSTUQRKVWXYH,ud efv[QRib[\u]th[\wxiy
z{|}~• }~•z{ €|}~• L|%M
QR DQR},••‚ fƒ
QR DQR,_` €„ …† E‡ˆ† ‰Š ‹‡ &Œ‹• Ž•…Š €•‘’ …Š
“” D“”K GD“”KHZGD“”,_`Ha
GDz“”KH^“”gh •– {”K —{S˜•
“” D“”,_` “”E2 ~™š‰ ~,› ~,œ• ž|S›U Ÿ ¡T ¢ ?£¤¥ ?£¤¦ §¨ ©ª ~›
“” Dz“”KVz{}|U S~U‚œK
Ljklmnopqrk«M L|%M L¬-%M
®EWX DSTUWXKVWX¯
GD“”KHZ[\GDz{H^[\GD‚
œHa[\”°h±\GD“”KHZ[\GD z{Hb[\GD‚œH,”°^“² g³\GDWXYHZ[\GD“”E2H
^[\´_gh
S~UWX¯
LjklmnopqrkM S~UWXµ
®EWX D¶WXKVz{}|U }~•z{
LjklmnopqrkM z{|}~•
Ljklmnopqrk L|%M L¬-%M
®EWX D“”,_`V“”E
2V‚œ L·›%M,‚œ
®EWX D“”KV•– •–
LjklmnopqrkM
®EWX DWX¸¹VWXY WXY
LjklmnopqrkM ºW »W ¼»W
®½ DT®½K[D¾®½K GDT¿½KHZ[\GD¶®½KH
^[\GD®½,•‚H,®b[\¿gy ÀÁ« ÀÁK« Âë
®½ D®½,•‚ L·›%M,® ÄÅ® ¥® ÆsÇOÈÉ
}ÊË•
}LÌMÍ,•
Î(
Î(}LÌM
Í• ÏÐÎ( }LÌMÑ ,•½Ò
½Ò}LÌM Ñ•
ÓTÔ Õ«
®½ D¶®½K LXÖJD×›KM ·| ‚œK
ØÙL·›K,M DTØÙK GDTØÙKHZ[\GDzØÙKH
^[\uØÙ[ÙÚ°highH Û–}ÂÃU •–}}•
Õ ÂÃ
ØÙL·›K,M DSzUØÙKVØÙK ‚œK š‰K ·›K }~,•·| L|%M
ØÙL·›K,M DØÙ,_`V‚œ ‚œ ~,œ•
•ÜL·›K,M DT•ÜK GDT•ÜKHZ[\GDz•ÜKH
^[\u•Ügh[ÝÞhi Û–}ÂÃU •–}}•
Õ ÂÃ
•ÜL·›K,M DSzU•ÜKV•ÜK •ÜK š‰K ·›K }~,•·| L|%M
Eßàá D¶àáK âãK äK åæ çè éêë# L|%M
Eßàá DàáK GDàáKHZGD¶àKHbGDà
á•‚H^àávìíîïh Làḹ%M LàáðñòÝ
%M S~Uóô S~Uõ"ö S~U÷øù S~U§ú Lû¬%M S~UÝë üýþ#
S~Uÿ!#
ê"#ê
$#
S~U%K L|%M
Eßàá Dàá•‚ S~UEß ÿ!#ê %E &' ()* *$ LE2M
+,•L½Ò,M DS+,•U-V½Ò
GD+,•PHZGD+,.[D+,
•/PHbGDS+,•U-H^½Ò
*vì+,•sGDŒ0OH^¶Éh
½ÒLÌMÑ ½ÒLÌM1& ½ÒLÌML2 3,45M
図
2
図1
のMSFA
に現われた意味役割の可能な実現値の記述例効果的な記述のためには,メタ変数,関数の使用が必 要である.この点に関して以下で簡単に説明する.
“[
人名]”, “
警察”, “∼
署”, “(∼)
捜査官”
は実現の際の 働き方が次に示すように異なる:
(16) a. “[
人名]”
は人名生成関数b. “
警察”
は字面(literal)
の文字列c. “∼ X ”
はX
に付加要素が義務的に存在する文字列
d. “(∼)X ”
はX
に付加要素が随意的に存在する文字列
ただし,
“[
人名]”
が機能するための前提となる“
佐藤(
春彦)”
がh
人名i
であるという知識は,別個に与えられ ているという仮定に基づく.また,“[
人名]”
の指定は本 来なら“[
捜査官名]”
であるべきだが,“[
捜査官名]”
とい う関数を一般に定義することは困難,かつおそらく可能 でも無意味なので,より一般的な“[
人名]”
で代替するの が適切だと考える.なお,“*****”
は典型的な実現値が ないことを表わす.具体的には,これらは次の
(18)
をh
刑事捜査i
フレー ムに結びつけ,h
刑事捜査.
捜査者i
の可能な実現値であ ることを記述する:
(17) X
は,犯人は関係者と見て取り調べている.(18) X ⇒ { a.
角砂糖([
人名]
あるいは[
人の渾名]
に よって認可されるなら); b.
警察; c.
七曲署; d. (
佐藤
(
春彦))
捜査官}
特に典型的な役割名を表わす形態素
(“∼
署”, “∼
社”)
を 特定することは重要である.実際,一部の派生形態素は 意味役割を指定する演算子と見なしてよい側面もある[5]
.実際,“∼
者” (“
犯罪者”, “
解答者”)
や“∼
手” (“
歌 い手”, “
持ち手”)
のその機能が,行為者タイプの意味役 割の定義を可能にしている(
ただし,前述の“
逮捕者”
や“
取っ手”
は例外となる)
.3.2.3
役割名の横取り一部では普通名詞が役割名を横取りし,占有してい る.
h
喚問.(
行)
喚問者i = “
裁判所”
,h
裁判.(
行)
裁判者i
= “
裁判官”
,h
刑事捜査.
捜査者i = “
警察”
,h
起訴.
被起 訴者i = (h
告訴.
被告訴者i =) “
被告(
人)”
などがその例 である.実際,“(
行)
喚問者”
,“(
行)
裁判者”
のような表 現は単なる“
裁判所”
,“
裁判官”
の迂言となる.3.3
意味記述の粒度と典型値の有無との相関多くのフレームに可能な実現値を特定しようとすると わかることだが,典型値をもちやすい意味役割と典型値 をもちにくい意味役割が存在する.
(10)
に挙げた42
タ イプのフレームのうち,h∼
過去性の指定∼i, h∼
役割の 値の指定∼i, h∼
受身∼i, h
知らせ(
る) i, h
知りi, h
疑いi,
h
敬意の表明i, h
語りi, h
報告i
の9
タイプに,程度の 差こそあれ,典型値を認めがたかった.これはこれらの フレームの内容が一般的すぎて,特定の状況を絞りこみ にくいからである.この傾向は特に文法フレームには顕著であった
(
例外はh∼
参照∼i
である.これは指示詞と 先行詞の関係という形でハッキリしているからである)
. これは意味役割の実現値が概念階層を下がるにつれて,状況の特定が容易になると解釈できる.
この典型値の有無という特徴は,従って,フレームの 記述粒度の評価に有効であろう.粒度がある程度細か いフレームでないと,典型的な実現値というのは想定 しがたいからである.実際,下位レベルになればなるほ ど,典型値は代表値になり,最後には唯一可能な値にな る.実際,参与項の特定化
=
該当範囲の絞り込みの程度 によってフレームの粒度を測定することも可能なはずで ある.これは元々,HFNA [8, 11, 10]
が仮定する概念構 造の特徴でもある.4 終りに代えて : されど,これは正真正銘の シソーラス構築にあらず ?
本稿では,
MSFA
の記述に現われる意味役割に,文章 に現われている実現値の他に可能な実現を作例によって 補うというやり方で,シソーラスに結びつける手法を提 案した.だが.この手法で正真正銘のシソーラスが構築 可能かどうかは,今のところ明らかではない.実際,提案手法には長所と短所がある.短所として は,提案手法には網羅性がないことが挙げられる.これ は明らかに領域に依存しない,本当の意味での汎用シ ソーラスの構築法
[1]
としては効率が悪い.シソーラス に求められる幾つかのことのうちの一つは網羅性である が,提案手法でそれが達成できるという保証はない.そ れが私たちが敢て「疑似シソーラス化」と言って差別化 を狙う理由の一つである.実際のところ,提案手法が本 当にうまく行くかどうかは,些か賭事めいた面もある.だが,これは短所であると同時に長所でもありうる.
実際,提案手法は,シソーラス構築にありがちな「疑似 分類」を体系的に避けることが可能である.語彙分類は しばしば「正しい場所探し」という形の択一的な課題に 落としこまれるが,これは一般的には正しい方法とは言 えない.単なる語彙分類はオントロジーを与えない.あ らかじめ概念分類が与えられていない限り,語彙分類は 不可能である.提案手法は,とりあえずこの問題は回避 している.
実際,この方式によって構築されるシソーラスは知識 領域に特化しているので,専門用語辞書の開発には有効 な手法だろう.自動化で可能なレベルより深い処理を望 むのであれば,これぐらいの粒度の意味記述は必要だと 思われる.
問題をもう少し大きくして,例えば「領域に依存しな い,本当の意味での汎用シソーラス
(
あるいはオントロ ジー)
の構築は可能なのか?
」という問題を提起すること も可能かも知れない.実際,領域という形で知識の異質 性を仮定しない限り,専門用語を一般語から区別するこ とが不可能だということ[7]
を考えると,この問いの意 味は重要である.もし,語句の用法を規定する知識領域 があり,語句の意味はそれに照らし合わせて初めて決まるだと,とすると,「統一的な知識」が存在する保証はな いのではないか
?
ヒトの知識は元々が「場当たり的」で 分散的なもので,語句の使用法というのは結果として,領域ごとにバラバラであり,体系性,統一性は稀薄なの ではないのか
?
という問題提起も可能である.参考文献
[1] J. Aitchison and A. Gilchrist. Thesaurus Construction: A Practical Manual. London: Association of Information Management, 2nd edition, 1987. [
邦訳:
シソーラス構築 法.
内藤 衛亮・中倉 良夫・影浦 峡 他訳.
丸善.].
[2] J. A. Asmuth and D. Gentner. Context sensitivity of rela- tional nouns. In Proceedings of the 27th Annual Meeting of the Cognitive Science Society, pp. 163–168, 2005.
[3] D. Gentner. The development of relational category knowl- edge. In L. Gershkoff-Stow and D. H. Rakison, editors, Building Object Categories in Developmental Time, pp.
245–275. Hillsdale, NJ: Lawrence Earlbaum, 2005.
[4] D. Gentner and K. J. Kurtz. Relational categories. In W. K.
Ahn, R. L. Goldstone, B. C. Love, A. B. Markman, and P. W. Wolff, editors, Categorization Inside and Outside the Laboratory, pp. 151–175. APA, 2005.
[5] K. Kageura. The Dynamics of Terminology: A Descrip- tive Theory of Term Formation and Terminological Growth.
John Benjamins, 2002.
[6] NTT
コミュニケーション科学研究所(
監修).
日本語語彙大系