新語の獲得に対応した概念ベースの構築
2
0
0
全文
(2) 情報処理学会第 80 回全国大会. 獲得し,概念ベースを構築した.この辞書を用 いることで,固有名詞や複合名詞などの長い単 語を 1 単語として分かち書きすることができる. 上記の“コンピュータ犯罪防止”は,“コンピ ュータ犯罪”と“防止”に分かち書きすること ができる.本辞書は Web から新語を含む様々な語 を収集して構築されるため,新語の検出性能の 向上が期待できる.また,属性の重みづけは従 来研究と同様に,概念ベース𝑡𝑓 ∙ 𝑖𝑑𝑓を用いた. 5. 評価実験 概念や属性の獲得方法を変えることによる概 念ベースの性能の変化を評価するため,以下の 内容の実験を行った.. では失敗していた.原因は,𝐶𝐵𝑐𝑜𝑚𝑝 での“JI CA”の属性には“無償資金協力”などが含ま れており,“協力”単体での属性は存在してい なかった.𝐶𝐵𝑛𝑒𝑜𝑙𝑜𝑔𝑑 では“協力”単体での属性 が存在していたため,“JICA”と“協力” の関連度が上昇し,評価に失敗していた.この ようなケースの改善方法としては,概念(見出 し語)とシソーラス距離が近い属性の重みを大 きくすることが考えられる.今後の課題として, シソーラス距離を考慮した重み付け手法を検討 し,精度の向上を図る.. 7. まとめ 本研究では新語の獲得に対応した概念ベース の構築方法として,単語分かち書き辞書 mecab5.1. 概念ベースの構築 ipadic-NEologd を用いた概念と属性の獲得を行 まず複数の国語辞典から基本となる概念ベー い,概念ベースを構築する手法を提案した.評 スを構築した.そして,この概念ベースに対し, 価実験では精度が 9.5%向上し,提案手法が有効 百科事典から概念の追加を行った.白石らの複 であることを示した. 合語抽出手法を用いて概念と属性を獲得し,構 築した概念ベースを𝐶𝐵𝑐𝑜𝑚𝑝 ,提案手法を用いて 謝辞 構築した概念ベースを𝐶𝐵𝑛𝑒𝑜𝑙𝑜𝑔𝑑 とする. 本研究の一部は,JSPS 科研費 JP16K00311 の助 成を受けて行った. 5.2. X-ABC 評価 X-ABC 評価では,任意の基準概念を𝑋とし,概 参考文献 念𝑋と関連が強い概念を𝐴,関連がある概念を𝐵, [1] 笠原要,松澤和光,石川勉,“国語辞書を 関連がない概念を𝐶とする.概念X, 𝐴, 𝐵, 𝐶からな 利用した日常語の類似性判別”,情報処理 る組を複数用意し,次の条件式を満たすものを 学会論文誌,vol.38,No.7,pp.1272–1283, 正解とする. 1997. 𝐷𝑜𝐴(𝑋, 𝐴) > 𝐷𝑜𝐴(𝑋, 𝐵) > 𝐷𝑜𝐴(𝑋, 𝐶) (3) [2] 佐藤敏紀,橋本泰一,奥村学,“単語分か ここで𝐷𝑜𝐴(𝑋, 𝐴)は概念𝑋と𝐴の関連度を表す.評 ち書き辞書 mecab-ipadic-NEologd の実装と 価実験では,基準概念として百科事典の見出し 情報検索における効果的な使用方法の検 語をランダムに選び,人手で概念A, 𝐵, 𝐶を設定し 討”,言語処理学会 第 23 回年次大会 発表 た 200 組の評価データを作成した. 論文集,pp.875-878,2017. [3] 井筒大志,渡部広一,河岡司,“概念ベー 5.3. 実験結果 スを用いた連想機能実現のための関連度計 実 験 結 果 を 表 1 に 示 す . 𝐶𝐵𝑐𝑜𝑚𝑝 に 比 べ て 算方式”,情報科学技術フォーラム FIT2002, pp.159–160,2002. 𝐶𝐵𝑛𝑒𝑜𝑙𝑜𝑔𝑑 では精度が 9.5%向上した.また有意水 [4] 白石卓也,芋野美紗子,土屋誠司,渡部広 準 5% で 符 号 検 定 を 実 施 し た と こ ろ , 𝑍 = 一,“複合語の概念・属性を考慮した百科 2.959182 > 1.96となり,有意に差があることが 事典および国語辞書による概念ベースの構 確認できた. 築”,情報科学技術フォーラム FIT2014, pp.213-214,2014. 表 1:X-ABC 評価の正解率(%) [5] 「 現 代 用 語 の 基 礎 知 識 」 編 集 部 ( 編 ) , 𝐶𝐵𝑐𝑜𝑚𝑝 𝐶𝐵𝑛𝑒𝑜𝑙𝑜𝑔𝑑 “現代用語の基礎知識 1991~2009”,自由 43.5 53.0 国民社,2009. [6] 工藤拓,“MeCab : Yet Another Part-of6. 考察 Speech and Morphological Analyzer ” , 基準概念𝑋を“JICA”,概念𝐴を“組織”, http://mecab.sourceforge.net/,2005. 概念𝐵を“協力”,概念𝐶を“布団”としたとき に,𝐶𝐵𝑐𝑜𝑚𝑝 を用いた評価では成功し,𝐶𝐵𝑛𝑒𝑜𝑙𝑜𝑔𝑑. 2-10. Copyright 2018 Information Processing Society of Japan. All Rights Reserved..
(3)
関連したドキュメント
うのも、それは現物を直接に示すことによってしか説明できないタイプの概念である上に、その現物というのが、
名の下に、アプリオリとアポステリオリの対を分析性と綜合性の対に解消しようとする論理実証主義の
既存の尺度の構成概念をほぼ網羅する多面的な評価が可能と考えられた。SFS‑Yと既存の
先に述べたように、このような実体の概念の 捉え方、および物体の持つ第一次性質、第二次
市民的その他のあらゆる分野において、他の 者との平等を基礎として全ての人権及び基本
Guasti, Maria Teresa, and Luigi Rizzi (1996) "Null aux and the acquisition of residual V2," In Proceedings of the 20th annual Boston University Conference on Language
forthcoming2 “A Critical Edition of Bhaṭṭa Jayanta's Nyāyamañjarī: II: The Section on Kumārila's Refutation of the Apoha Theory & III: The Buddhist Refutation of
[r]