第 4 章 宇野浩二の病気前後の文体変化に関する分析
4.6 形態素タグの n-gram
病気前後の作品における形態素タグの構成率を考察するために、形態素解析済みの文章か ら形態素タグの unigram のデータを集計し、対応分析を行った。各項目の時期ごとの出現頻 度を表4.10に示す。各作品での出現頻度を付録4.8に示す。第2スコアまでの個体スコアの 散布図とバイプロットをそれぞれ図4.19と図4.20に示す。
表4.10 形態素タグのunigramのデータ
形態素タグのunigram 出現頻度
(病前)
出現頻度
(病後)
助詞 105,676 102,913
名詞 99,074 107,082
動詞 44,318 42,647
記号 37,687 44,678
助動詞 32,947 30,269
副詞 8,269 6,980
連体詞 5,680 5,895
形容詞 4,262 4,249
接続詞 3,835 3,130
接頭辞 889 1,333
感動詞 117 103
第1スコアと第2スコアの寄与率はそれぞれ46.16%、20.10%である。図4.19からわかるよ うに、両グループの 95%の許容楕円が大幅に重なっているが、病前の作品は主に縦軸の正の 方向に配置されていることに対し、病後の作品は縦軸の負の方向にプロットされている。「日 曜日」は、病後のグループに近いところに位置している。なお、許容楕円から最も離れてい る「母の形見の貯金箱」という作品について、最後の付記では、「これは、随筆風の小説、小 説風の随筆。―というようなつもりで書いていた。」のように解説されている。このような創 作意図は、「母の形見の貯金箱」が他の作品から離れる原因として考えられる。
42
図4.19 形態素タグのunigramに基づいた対応分析の個体スコアのプロット
図4.20 形態素タグのunigramに基づいた対応分析のバイプロット
-0.2 -0.1 0.0 0.1 0.2 0.3 0.4
-0.2-0.10.00.10.20.30.4
CA factor map
Dim1 (46.16%)
Dim2 (20.10%)
. .
病後 二つの道_ 病後 人さまざま_ 病後 人間同志_
病後 人間往来_ 病後 善き鬼・悪き鬼_ 病後 器用貧乏_ 病後 夢の跡_ 病後 夢の通ひ路_
病後 女人不信病後 女人往来_ _ 病後 子の来歴_
病後 文学の鬼_病後 旅路の芭蕉_ 病後 木と金の間_ 病後 枯木のある風景_
病後 枯野の夢_ 病後 楽世家等_
病後 母の形見の貯金箱_
病後 水すまし_ 病後 湯河原三界_
病後 終の栖_
病後 線香花火_ 病後 身の秋_ 病後 風変りの一族_
病後 鬼子と好敵手_ 病前 「木からおりてください」_
病前 ぢゃんぽん廻り_
病前 人に問はれる_
病前 人癲癇_
病前 俳優_
病前 十軒路地_
病前 千万老人_
病前 古風な人情家_ 病前 夢見る部屋_ 病前 如露_
病前 子を貸し屋_
病前 従兄弟の公吉_
病前 従兄弟同志_ 病前 心つくし_ 病前 思ひ出の記_ 病前 恋の躯_
病前 或る春の話_
病前 昔がたり_
病前 晴れたり君よ_
病前 東館_
病前 歳月の川_
病前 浮世の窓_
病前 続軍港行進曲_
病前 足りない人_
病前 軍港進行曲_
病前 高天ヶ原_
病前 鼻提灯_
病前 日曜日_
-0.2 -0.1 0.0 0.1 0.2 0.3 0.4
-0.2-0.10.00.10.20.30.4
CA factor map
Dim 1 (46.16%)
Dim 2 (20.10%)
病後 二つの道_ 病後 人さまざま_ 病後 人間同志_
病後 人間往来_ 病後 善き鬼・悪き鬼_ 病後 器用貧乏_ 病後 夢の跡_ 病後 夢の通ひ路_ 病後 女人不信病後 女人往来_ _
病後 子の来歴_
病後 文学の鬼_病後 旅路の芭蕉_ 病後 木と金の間_ 病後 枯木のある風景_
病後 枯野の夢_ 病後 楽世家等_
病後 母の形見の貯金箱_
病後 水すまし_ 病後 湯河原三界_
病後 終の栖_
病後 線香花火_ 病後 身の秋_ 病後 風変りの一族_
病後 鬼子と好敵手_ 病前 「木からおりてください」_
病前 ぢゃんぽん廻り_ 病前 人に問はれる_
病前 人癲癇_ 病前 俳優_ 病前 十軒路地_
病前 千万老人_ 病前 古風な人情家_ 病前 夢見る部屋_
病前 如露_
病前 子を貸し屋_
病前 従兄弟の公吉_ 病前 従兄弟同志病前 思ひ出の記_ _ 病前 恋の躯病前 心つくし__
病前 或る春の話_ 病前 昔がたり_
病前 晴れたり君よ_
病前 東館_ 病前 歳月の川_
病前 浮世の窓_ 病前 続軍港行進曲_ 病前 足りない人_
病前 軍港進行曲_ 病前 高天ヶ原_
病前 鼻提灯_
病前 日曜日_ 助詞
名詞 動詞
記号 助動詞
副詞
連体詞 形容詞
接続詞
接頭辞 感動詞
43
図4.20に示しているバイプロットに基づいて、変数と作品の対応関係を考察する。「副詞」、
「接続詞」、「形容詞」と「助動詞」の多用が病前作品の特徴である。一方、病後の作品では 接頭辞、名詞と記号の多用が特徴である。これらの特徴的な項目の使用率を表4.11に示す。
表4.11 両時期の作品の特徴的な項目の使用率(%)
形態素タグのunigram 病前 病後
名詞 28.91 30.66
記号 11.00 12.79
助動詞 9.61 8.67
副詞 2.41 2.00
形容詞 1.24 1.22
接続詞 1.12 0.90
接頭辞 0.26 0.38
4.6.2 形態素タグのbigram
4.6.1節では、病気前後の作品における形態素タグの構成率について分析を行った。本節で
は、繋がり関係を示す形態素タグのbigramの出現頻度に注目して分析を行う。53編の作品か ら出現頻度の合計が25回以上の89変数を抽出し、分析に用いる。表4.12では出現頻度の高 い上位20変数を病前、病後の時期ごとに示している。詳細なデータを付録4.9に示す。対応 分析の第2スコアまでの個体スコアの散布図を図4.21に示す。
表4.12 形態素タグのbigramのデータ(上位20項目)
形態素タグの bigram
出現頻度
(病前)
出現頻度
(病後)
形態素タグの bigram
出現頻度
(病前)
出現頻度
(病後)
名詞_助詞 69,976 71,503 名詞_助動詞 8,353 6,133
助詞_名詞 36,460 36,021 助動詞_助動詞 7,192 6,514
助詞_動詞 33,973 31,787 助詞_助詞 6,721 5,256
記号_名詞 20,275 25,457 動詞_名詞 6,378 5,581
助詞_記号 19,788 22,022 助動詞_助詞 5,873 5,371
名詞_名詞 14,213 20,048 連体詞_名詞 5,254 5,359
動詞_助詞 18,298 15,705 記号_副詞 4,199 3,617
動詞_助動詞 15,721 15,873 記号_連体詞 3,376 4,395
助動詞_記号 10,153 9,766 名詞_動詞 3,521 3,711
助動詞_名詞 9,050 8,026 名詞_記号 2,293 4,939
44
図4.21 形態素タグのbigramに基づいた対応分析の個体スコアのプロット
図4.22 形態素タグのbigramに基づいた対応分析のバイプロット
-0.6 -0.4 -0.2 0.0 0.2 0.4 0.6
-0.6-0.4-0.20.00.20.40.6
CA factor map
Dim1 (33.06%)
Dim2 (19.05%) .
.
病後 二つの道_ 病後 人さまざま_
病後 人間同志_
病後 人間往来_
病後 善き鬼・悪き鬼_ 病後 器用貧乏_ 病後 夢の跡_ 病後 夢の通ひ路_病後 女人不信_病後 女人往来_ 病後 子の来歴_
病後 文学の鬼_病後 旅路の芭蕉_ 病後 木と金の間_ 病後 枯木のある風景病後 楽世家等_病後 枯野の夢__
病後 母の形見の貯金箱_
病後 水すまし_ 病後 湯河原三界_
病後 終の栖_ 病後 線香花火_
病後 身の秋_
病後 風変りの一族_ 病後 鬼子と好敵手_ 病前 「木からおりてください」_
病前 ぢゃんぽん廻り_
病前 人に問はれる_
病前 人癲癇_
病前 俳優_
病前 十軒路地_
病前 千万老人_
病前 古風な人情家_
病前 夢見る部屋_
病前 如露_
病前 子を貸し屋_
病前 従兄弟の公吉_
病前 従兄弟同志_
病前 心つくし_
病前 思ひ出の記_
病前 恋の躯_
病前 或る春の話_
病前 昔がたり_
病前 晴れたり君よ_
病前 東館_
病前 歳月の川_
病前 浮世の窓_
病前 続軍港行進曲_
病前 足りない人_
病前 軍港進行曲_
病前 高天ヶ原_
病前 鼻提灯_
病前 日曜日_
-0.6 -0.4 -0.2 0.0 0.2 0.4 0.6
-0.6-0.4-0.20.00.20.40.6
CA factor map
Dim 1 (33.06%)
Dim 2 (19.05%)
病後 二つの道_ 病後 人さまざま_
病後 人間同志_
病後 人間往来_
病後 善き鬼・悪き鬼_ 病後 器用貧乏_ 病後 夢の跡_ 病後 夢の通ひ路_病後 女人不信_病後 女人往来_ 病後 子の来歴_
病後 文学の鬼_病後 旅路の芭蕉_ 病後 木と金の間_ 病後 枯木のある風景病後 楽世家等_病後 枯野の夢__
病後 母の形見の貯金箱_
病後 水すまし_ 病後 湯河原三界_
病後 終の栖_ 病後 線香花火_
病後 身の秋_
病後 風変りの一族_ 病後 鬼子と好敵手_ 病前 「木からおりてください」_
病前 ぢゃんぽん廻り_ 病前 人に問はれる_
病前 人癲癇_
病前 俳優_ 病前 十軒路地_
病前 千万老人_ 病前 古風な人情家_
病前 夢見る部屋_ 病前 如露_
病前 子を貸し屋_
病前 従兄弟の公吉_ 病前 従兄弟同志_
病前 心つくし_ 病前 思ひ出の記_
病前 恋の躯_ 病前 或る春の話_ 病前 昔がたり_
病前 晴れたり君よ_
病前 東館_ 病前 歳月の川_
病前 浮世の窓_ 病前 続軍港行進曲_
病前 足りない人_ 病前 軍港進行曲_ 病前 高天ヶ原_
病前 鼻提灯_
病前 日曜日_ 名詞 助詞_ 助詞 名詞_
助詞 動詞_
記号 名詞_ 助詞 記号_
名詞 名詞_ 動詞 助詞_ 動詞 助動詞助動詞 記号_ _ 助動詞 名詞_ 名詞 助動詞_
助動詞 助動詞_ 助詞 助詞_
動詞 名詞_ 助動詞 助詞_
連体詞 名詞_ 記号 副詞_
記号 連体詞_ 名詞 動詞_
名詞 記号_ 記号 助詞_ 副詞 名詞_
記号 接続詞_
助詞 副詞_ 助詞 形容詞_動詞 動詞_
接続詞 記号_
形容詞 名詞_
動詞 記号_ 副詞 動詞_
記号 動詞_
助詞 連体詞_
記号 記号_
接頭辞 名詞_ 副詞 助詞_
副詞 記号_
助詞 助動詞_ 接続詞 名詞_
形容詞 動詞_ 形容詞 助詞_
形容詞 助動詞_
記号 形容詞_
助詞 接頭辞_ 形容詞 記号_ 副詞 形容詞_
名詞 形容詞_ 副詞 連体詞_
助動詞 動詞_ 副詞 副詞_
名詞 副詞_ 助動詞 形容詞_
連体詞 助動詞_ 助詞 接続詞_
副詞 助動詞_ 接続詞 副詞_
動詞 形容詞_ 名詞 連体詞_
記号 感動詞_
連体詞 形容詞_
記号 助動詞_
連体詞 動詞_
助動詞 連体詞_
接頭辞 動詞_
連体詞 記号_ 名詞 接頭辞_
感動詞 記号_
助動詞 接頭辞_ 接続詞 連体詞_
副詞 接頭辞_
動詞 連体詞_
形容詞 形容詞_
名詞 接続詞_ 接続詞 動詞_
助動詞 副詞_
動詞 副詞_接続詞 接続詞_ 助動詞 接続詞_
連体詞 接頭辞_ 連体詞 副詞_
感動詞 名詞_
動詞 接頭辞_ 連体詞 連体詞_
形容詞 連体詞_
連体詞 助詞_
接続詞 助詞_ 形容詞 副詞_ 接続詞 形容詞_
接頭辞 記号_
45
形態素タグのbigramの個体スコアの散布図は、形態素タグの構成率の結果と似たような位 置関係を示している。第1 スコアと第2 スコアの寄与率はそれぞれ33.06%、19.05%である。
病前の作品は、主に、散布図の左上に配置され、病後の作品は散布図の右下にプロットされ ている。両グループの作品の重なり具合が若干小さくなっているが、「日曜日」は、病後のグ ループの最も近いところに位置している。
変数が多くないため、図4.22のバイプロットにはすべての項目をプロットした。病前の作 品では、「接続詞_副詞」、「助動詞_接続詞」、「助詞_接続詞」、「連体詞_副詞」、「副詞_接頭辞」、
「動詞_副詞」、「接続詞_形容詞」、「接続詞_名詞」、「接続詞_連体詞」といった接続詞と副詞
を含む bigram、病後では、「感動詞_名詞」、「名詞_名詞」、「名詞_接頭辞」、「名詞_接続詞」、
「名詞_記号」、「動詞_記号」、「連体詞_記号」、「形容詞_記号」、「接続詞_記号」といった名詞 と記号を含むbigramが特徴的項目として多く見られる。これらの項目の使用率を表4.13に示 す。
表4.13 特徴的な項目の使用率(%)
形態素タグのbigram 病前 病後 形態素タグのbigram 病前 病後
名詞_名詞 4.148 5.742 名詞_接頭辞 0.012 0.023
名詞_記号 0.669 1.415 接続詞_連体詞 0.021 0.01
接続詞_記号 0.728 0.713 副詞_接頭辞 0.018 0.01
動詞_記号 0.3 0.707 名詞_接続詞 0.008 0.017
接続詞_名詞 0.279 0.131 助動詞_副詞 0.013 0.011
形容詞_記号 0.114 0.131 助動詞_接続詞 0.015 0.005
助詞_接続詞 0.051 0.023 連体詞_副詞 0.012 0.005
接続詞_副詞 0.047 0.013 感動詞_名詞 0.004 0.012
連体詞_記号 0.011 0.026 接続詞_形容詞 0.005 0.004