問題意識と目的
何らかの意味型 T (e.g., [ヒト]) をもつ実体 (entity) X (ID で区別される) が意味役割 R (e.g., <犯罪者>, <
犯人>) という意味クラスの実現値 (インスタンス) (e.g., 「(R1: 強盗殺人(のR2: 容疑)で) X を逮捕し た」)になる.この実体と意味役割と意味型との関 係を,なるべく網羅的に明示することは,シソー ラスに期待されていながら実装されていない機能 の一つ.
提案
細かい粒度の意味解析のための手法として提唱さ れた複層意味フレーム分析 (MSFA) に,問題となる 機能を融合する
複層意味フレーム分析 (MSFA) に意味役割の典型的実現値 の情報を付加してシソーラス化する試み
黒田 航 井佐原 均
独立行政法人 情報通信研究機構けいはんな情報通信融合研究センター
!"#$% &'()%*+,-% ./01 2134 2135 2136 2137 2138 2139 213: 213; 213< 2134= 21344213 45
213 46
>?@A,BC DEF GDEFHIJ DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD
>?@A,BC DBCKL?@A,M NOP
QR DSTUQRKVWXY
GDSTUQRKHZ[\GD]QRKH
^[\GDQR,_`Ha[\SWXY bU\cdefg[QRghiJ
WXY
LjklmnopqrkM DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD DDDDD QR D]QRKsDQRb]t
hK
GD]QRKHZ[\GDQR,_`H a[\GDSTUQRKVWXYH,ud efv[QRib[\u]th[\wxiy
z{|}~• }~•z{ €|}~• L|%M
QR DQR},••‚ fƒ
QR DQR,_` €„ …† E‡ˆ† ‰Š ‹‡ &Œ‹• Ž•…Š €•‘’ …Š
“” D“”K GD“”KHZGD“”,_`Ha
GDz“”KH^“”gh •– {”K —{S˜•
“” D“”,_` “”E2 ~™š‰ ~,› ~,œ• ž|S›U Ÿ ¡T ¢ ?£¤¥ ?£¤¦ §¨ ©ª ~›
“” Dz“”KVz{}|U S~U‚œK
Ljklmnopqrk«M L|%M L¬-%M
®EWX DSTUWXKVWX¯
GD“”KHZ[\GDz{H^[\GD‚
œHa[\”°h±\GD“”KHZ[\GD z{Hb[\GD‚œH,”°^“² g³\GDWXYHZ[\GD“”E2H
^[\´_gh
S~UWX¯
LjklmnopqrkM S~UWXµ
®EWX D¶WXKVz{}|U }~•z{
LjklmnopqrkM z{|}~•
LjklmnopqrkL|%M L¬-%M
®EWX D“”,_`V“”E
2V‚œ L·›%M,‚œ
®EWX D“”KV•– •–
LjklmnopqrkM
®EWX DWX¸¹VWXY WXY
LjklmnopqrkM ºW »W ¼»W
®½ DT®½K[D¾®½K GDT¿½KHZ[\GD¶®½KH
^[\GD®½,•‚H,®b[\¿gyÀÁ« ÀÁK« Âë
®½ D®½,•‚ L·›%M,® ÄÅ® ¥® ÆsÇOÈÉ
}ÊË•
}LÌMÍ,•
Î(
Î(}LÌM Í• ÏÐÎ(}LÌMÑ
,•½Ò
½Ò}LÌM Ñ•
ÓTÔ Õ«
®½ D¶®½K LXÖJD×›KM ·| ‚œK
ØÙL·›K,M DTØÙK GDTØÙKHZ[\GDzØÙKH
^[\uØÙ[ÙÚ°highH Û–}ÂÃU •–}}•
Õ ÂÃ
ØÙL·›K,M DSzUØÙKVØÙK ‚œK š‰K ·›K }~,•·| L|%M
ØÙL·›K,M DØÙ,_`V‚œ ‚œ ~,œ•
•ÜL·›K,M DT•ÜK GDT•ÜKHZ[\GDz•ÜKH
^[\u•Ügh[ÝÞhi Û–}ÂÃU •–}}•
Õ ÂÃ
•ÜL·›K,M DSzU•ÜKV•ÜK •ÜK š‰K ·›K }~,•·| L|%M
Eßàá D¶àáK âãK äK åæ çè éêë# L|%M
Eßàá DàáK GDàáKHZGD¶àKHbGDà
á•‚H^àávìíîïh Làḹ%M LàáðñòÝ
%M S~Uóô S~Uõ"ö S~U÷øù S~U§ú Lû¬%M S~UÝë üýþ#
S~Uÿ!#
ê"#ê
$#
S~U%K L|%M
Eßàá Dàá•‚ S~UEß ÿ!#ê %E &' ()* *$ LE2M
+,•L½Ò,M DS+,•U-V½Ò
GD+,•PHZGD+,.[D+,
•/PHbGDS+,•U-H^½Ò
*vì+,•sGDŒ0OH^¶Éh
½ÒLÌMÑ ½ÒLÌM1& ½ÒLÌML2 3,45M
背景となる理論
文 S の MSFA は一般に S の内容理解に使用される 背景知識を意味フレーム {F1, F2, ..., Fn} という形で 網羅的に明示する.
この際,おのおのの Fi を構成する意味役割 {Fi.R1,
..., Fi.Rk} について,文 S という文脈で与えられた実
現値以外に可能な実現値を明記することで,必要 となる情報をエンコードできる.
MSFAの実例 (部分)
アルゼンチンの元サッカー選手,ディエゴ・マ ラドーナ氏が六日,同国の検察当局に身柄を拘 束された.[京大コーパス S-ID 950107210-002]
他の MSFA データも公開中 (要アカウント)
MSFA に現われた意味役割の実現 値の付加情報 (断片)
ただし,実現パターンはそれな りに複雑で,その記述には適当 なパターン記述言語が必要
個別的注意
意味型に関する情報は MSFA に はハッキリ現われないので,実 現値の補完表にも現われない.
意味型が直接に言及されるのは 実は意外に稀.Gentner 2005 な ど,relational nouns と object/
entity nouns の区別を論じた論文 にも同様の指摘がある.
意味型は実体による意味役割の 実現の前提条件となることが多 い.例えば,[個体 X がある災害 Y の被害者 Z であるためには X は人(か少なくとも動物) でない といけない] (この指定は Z にあ る) など,意味型はどっちかとい うと潜伏性の意味特徴=素性の ようにふるまう.
固有名は正確には意味型名でも 意味役割名でもないが,強いて 言えば,インスタンスを一つし かもたない意味型か意味役割?
ただし,
彼は平成の円空だ
のような文では,固有名がイン スタンスを複数もつように拡張 されている.これが意味型名 ベースの拡張なのか,意味役割 名ベースの拡張なのかは不明.
謝辞
内山 将夫,中本敬子, 野澤 元, 横森大輔
一般的注意
この際,従来のシソーラスのように,語 の意味分類を,語彙分類としてトップダ ウンに行なうのではなく,実際に文章で 使われている意味クラスを,なるべく細 かい粒度で認定し,その語彙的実現値の データベース化という形で,語の意味分 類をボトムアップに行なう