手順２の結果と考察

第 4 章実験

4.3 実験結果

4.3.2 手順２の結果と考察

次に，手順２によって感情極性分類を行なった．コーパスには楽天ユーザーレビューを使用した．トレーニングデータは，それぞれ5.3万件，2.7万件，1.35万件，0.7万件，

0.35万件をランダムに取得した．また，テストデータは1.4万件をトレーニングデータと重複無くランダムに取得した．図4.6と表4.2に，bigramを抽出したデータだけを学習させた場合の実験結果を示す．精度は訓練事例の数を増加していくと精度は増加するものの，トレーニングデータの数に比べ精度の向上度合いは少なかった．図4.7と表4.3に，

trigramを抽出したデータだけを学習させた場合の実験結果を示す．精度は訓練事例の数

に比例して増加していく，しかし，bigramと同様に向上度合いは少なかった．これらは，

unigramに比べると高い精度を示した．

表 4.2: bigramを用いた実験結果

データ数 3500 7000 13500 27000 53000 Precision 50.35 50.43 50.86 50.87 50.63 Recall 99.38 99.25 97.61 97.83 98.96 F値 66.83 66.87 66.87 66.93 66.98

表 4.3: trigramを用いた実験結果

データ数 3500 7000 13500 27000 53000 Precision 50.40 50.28 50.30 50.28 50.26 Recall 98.25 98.80 99.28 99.47 99.55 F値 66.62 66.64 66.77 66.79 66.79

4.3.3 _{手順３の結果と考察}

次に，手順３によって感情極性分類を行なった．コーパスには楽天ユーザーレビューを使用した．トレーニングデータは，それぞれ5.3万件，2.7万件，1.35万件，0.7万件，

0.35万件をランダムに取得した．また，テストデータは1.4万件をトレーニングデータと重複無くランダムに取得した．図4.8と表4.4に，unigramと感情極性単語総数を抽出したデータを学習させた場合の実験結果を示す．精度は，unigramのみを抽出したデータを学習させた場合に比べて，若干下がるものとなった．これは，unigramで抽出した素性ベクトルが多いため，感情極性単語総数が効果的に作用しなかったためと考えられる．図 4.9と表4.5に，bigramと感情極性単語総数を抽出したデータを学習させた場合の実験結果を示す．精度は，bigramのみを抽出したデータを学習させた場合に比べ，精度は向上

図 4.7: bigramを用いたデータセット

図 4.8: trigramを用いたデータセット

した．図4.10と表4.6に，trigramと感情極性単語総数を抽出したデータを学習させた場合の実験結果を示す．精度は，trigramのみを抽出したデータとあまり変わらなかった．

表 4.4: unigramと感情極性単語を用いた実験結果

データ数 3500 7000 13500 27000 53000 Precision 49.77 49.87 49.77 49.95 50.12 Recall 96.78 96.65 96.78 97.71 98.55 F値 65.73 65.79 65.73 66.10 66.44

表 4.5: bigramと感情極性単語を用いた実験結果

データ数 3500 7000 13500 27000 53000 Precision 50.35 50.43 50.66 50.86 51.44 Recall 99.38 99.13 98.97 97.76 96.58 F値 66.83 66.85 67.01 66.90 67.12

表 4.6: trigramと感情極性単語を用いた実験結果データ数 3500 7000 13500 27000 53000 Precision 50.34 50.39 50.3 50.29 50.27 Recall 98.63 98.79 99.28 99.46 99.55 F値 66.65 66.73 66.77 66.80 66.80

図 4.9: unigramと感情極性単語を用いたデータセット

図 4.10: bigramと感情極性単語を用いたデータセット

図 4.11: trigramと感情極性単語を用いたデータセット

4.3.4 _{提案手法の結果と考察}

次に，提案手法を用いて感情極性分類を行なった．コーパスには楽天ユーザーレビューを使用した．コーパスには楽天ユーザーレビューを使用した．トレーニングデータは，それぞれ5.3万件，2.7万件，1.35万件，0.7万件，0.35万件をランダムに取得した．また，テストデータは1.4万件をトレーニングデータと重複無くランダムに取得した．図4.11と表 4.7に，unigramと提案手法を用いて抽出したデータを学習させた場合の実験結果を示す．

精度は，他のunigramと比べて高いものとなった．図4.12と表4.8に，bigramと提案手法を用いて抽出したデータを学習させた場合の実験結果を示す．精度は，他の実験に比べて一番高いものになった．図4.13と表4.9に，trigramと提案手法を用いて抽出したデータを学習させた場合の実験結果を示す．精度は，他のtrigramと比べ高いものとなった．

表 4.7: unigramと提案手法を用いた実験結果データ数 3500 7000 13500 27000 53000 Precision 50.92 51.13 51.32 51.83 52.02 Recall 93.17 95.03 94.93 95.12 95.25 F値 65.85 66.48 66.62 67.09 67.29

表 4.8: bigramと提案手法を用いた実験結果データ数 3500 7000 13500 27000 53000 Precision 51.83 51.92 52.03 52.22 52.64 Recall 96.83 97.10 96.92 97.21 97.34 F値 67.51 67.66 67.71 67.94 68.32

表 4.9: trigramと提案手法を用いた実験結果データ数 3500 7000 13500 27000 53000 Precision 51.2 51.32 51.41 51.61 51.92 Recall 98.45 98.64 98.57 98.73 98.81 F値 67.36 67.51 67.57 67.78 68.07

図 4.12: unigramと提案手法を用いた実験結果

図 4.13: bigramと提案手法を用いた実験結果

図 4.14: trigramと提案手法を用いた実験結果

ドキュメント内構文構造を用いたテキスト感情極性分析の精度向上 (ページ 37-44)

第 4 章 実験

4.3 実験結果

4.3.2 手順２の結果と考察

4.3.3 手順３の結果と考察

4.3.4 提案手法の結果と考察

第 4 章実験

4.3.3 _{手順３の結果と考察}

4.3.4 _{提案手法の結果と考察}