結果 - 評価実験 - 辞書の語義立てに基づく語義曖昧性解消に関する研究

第 6 章評価実験

6.3 結果

ヘルドアウトデータでの評価の結果に基づいて、３つの分類器を組み合わせる実験を行った。表6.8は、テストデータにおける評価実験の結果である。「混合モデル」は組み合わせアルゴリズムを用いて作成した分類器である。また、比較のため各分類器単体の評価も併記した。評価の基準として精度、再現率、F値、適用率を求めた。F値は、

2×精度×再現率精度+再現率とした。適用率は、

システムが出力を返すことができた数全入力

とした。本研究は、読解支援システムでの使用を目的として作成されたので、この指標を用いた。各項目で最も数値がよいものをボールド体にした。

表6.9は、混合モデル分類器において選択された分類器の数である。

表 6.8: テストデータにおける各手法の評価精度再現率 F値適用率混合モデル 0.7172 0.7341 0.7256 0.9070 用例 0.4498 0.0898 0.0955 0.1497 文法情報 0.5396 0.1875 0.2783 0.2272 SVM 0.8016 0.7107 0.7534 0.8867

表 6.9: 混合モデルで選択された分類器の数用例文法情報 SVM 回答なし

442 847 11,883 1,350

混合モデル分類器ははSVM分類器と比べて精度は8 %強、F値は約3 %落ちた。一方で再現率は2 %強、適用率は2 %近く上昇した。これは、精度の低い用例分類器、文法情報分類器を組み合わせることによって混合モデルの精度は落ちたが、複数の分類器を同時に使用することによって再現率が向上したと考えられる。本研究の目的は、読解支援システムでの使用を前提とし、複数の知識源を用いた分類器を組み合わせることにより、より多くの単語について語義の曖昧性を解消することにある。言い換えれば再現率の向上を第一の目的としている。本結果から、この目的がある程度達成されたことが確認された。

さらに、再現率を向上させる方法としてベースライン分類器と組み合わせる方法が考えられる。ベースライン分類器の精度は0.7836、再現率は0.766、F値は0.7447、適用率は

0.9774であった。これは、混合モデルよりも性能がよい。したがって、本研究で提案した

分類器とベースライン分類器と組み合わせることにより更なる性能の向上が期待できる。

第 7 ^{章おわりに}

本論文では、より多くの単語を扱うことのできる語義曖昧性解消手法を提案した。3種類の分類器を作成し、これらを組み合わせることを試みた。3種類の分類器のうち、SVM分類器では様々な素性集合の中から最適な素性集合を調査した。他2種類は岩波国語辞典の用例と文法情報を用いて分類器を実装した。

最後に、今後の課題を３つ挙げる。

1.コーパスを使用した分類器の最適な素性と学習アルゴリズム選択

今回の実験では、学習アルゴリズムにSVMを用いたところ、比較的シンプルな素性の方が結果が良かった。一方、村田ら[27]は、本論文と素性は異なるが、SVMよりもシンプルベイズ法のほうが精度がよい、という報告をしている。多義性解消というタスクがSVMに適しているか、その他の学習アルゴリズムの方が適しているかをさらに調べる必要がある。

2.データの過疎化の問題

本論文では、多くの単語を扱うために複数の異なる言語資源を利用した。しかし答えを返すことができない単語も一割ほど残っている。2章でも言及したが、利用可能な膨大なドキュメントから語義タグの付与された文を獲得し、訓練データに加える方法が提案されている。答えを返す単語を増やすためには、教師なし学習を行う手法を併用するべきかもしれない。しかし、この方法は、学習がうまくいかないと精度を落とす原因になるので、扱いが難しい。

3.語の区切りの問題

実際にシステムを実装する際は形態素解析が必要である。しかし、形態素解析システムの辞書と岩波国語辞典では、辞書間の見出しの表記や区切り、品詞体系が異なるため辞書が引けない事態も考えられる。したがって、形態素解析の出力と岩波国語辞典の見出しの対応付けを行う必要がある[25]。

謝辞

本研究を進めるにあたり，終始熱心な御指導を賜わりました白井清昭助教授に心から感謝致します．さらに数多くの御教授を頂きました島津明教授に厚く御礼申し上げます．山田寛康助手ならびに自然言語処理学講座の皆様には，貴重な御意見、討論をして頂きました事を感謝致します．

結果

第 6 章 評価実験

6.3 結果

第 7 章 おわりに

謝辞

関連図書

第 6 章評価実験

第 7 ^{章おわりに}