• 検索結果がありません。

章 結論

ドキュメント内 JAIST Repository (ページ 43-47)

5

どのような言い換えを行うかを規則集合として記述したもの。言い換えシステムの動 作を規定するプログラムに相当する。

3. ルールコンパイラ

外部形式で記述された言い換えルールセットを内部形式に変換する。

4. 言い換えエンジン

形態素列に対して内部形式に変換された言い換えルールセットを適用し、ルールに 従った部分形態素列の言い換え(置換)を実行する。

5. 関数群

言い換えルールで使用できるサブルーチン群。活用形の調整など行う関数が用意され ている。

6. 辞書群

サブルーチンで利用される辞書の集合。

また、システムは入力として一文を取り、言い換え処理を行った後一文を出力する。言い 換え処理の内容は以下の通り。

1. 入力された文を形態素解析し、形態素列に変換する。この処理は前処理モジュールに よって行われる。

2. 形態素列に対して言い換えルールセットを適用し、適用後の形態素列を得る。 言い 換えルールセットはあらかじめルールコンパイラによって内部形式に変換されてお り、言い換えエンジンは内部形式に変換されたルールセットに従って実際の言い換え を行う。

3. 得られた形態素列を文字列に変換し、出力する。

政府自治体公的機関が発行する報告文書を対象とし、そこにみられる難解な表現を分かり やすい表現に言い換える規則集合を作成し、それを実際の文書に適用する実験を行った。

実験対象として『第百三十六回国会における橋本内閣総理大臣施政方針演説』(14000語強、

28319バイト)を用いた。実験の結果、総言い換え数87件のうち、63(72%)は言い換え

が正しく行われたが、残り24(28%)は、言い換えの結果文の意味が変わったり文法的

言い換えルールの適用を抑制しなければならない言い換えでも抑制する機構がシステ ムになかった

形態素解析システムが誤った解析結果を返したため、誤った言い換えルールが適用さ れた

並列句の複文への言い換えなど、構文解析が必要な言い換えがあった

意味的に不可能な言い換えがあったが、システムには判断不可能だった 実験の結果、以下のことが分かった。

1. 本システムは、単語列から単語列への置換で実現可能な言い換えを機械的に実行する ことができる。

2. 言い換えに、単語列中の語の係り受けの情報を必要とする場合、形態素解析のみの言 い換えシステムでは誤った言い換え結果を出力する場合がある。

3. 言い換え結果が文法的に正しくても意味的に誤っている場合もある。

より多くの種類の言い換えを精度良く実現するためには、構文解析を利用し、構文解析木 の一部を別の構文解析木に置き換える機能が必要となる。

謝辞

本研究を進めるにあたり、終始熱心なご指導を頂きました佐藤理史助教授に心から感謝 致します。

中間審査などの折には諸先生方から貴重なご意見を頂きました。感謝致します。

また、日頃より研究において適切なアド バイスを頂いた知識工学講座の皆さんに感謝致 します。ありがとうございました。

ドキュメント内 JAIST Repository (ページ 43-47)

関連したドキュメント