第 7 章 宇野浩二と同時代の作家との比較分析
7.7 形態素タグの n-gram (n=1, 2)
7.7.2 形態素タグの bigram
品詞および記号のつながり関係を考察するために、形態素タグのbigramのデータを抽出し て対応分析と階層的クラスター分析を行う。形態素解析済みの作品から 103 個の変数を抽出 し、作家ごとの各変数の総度数を表7.9に示し、詳細なデータを付録7.5に示す。
表7.9 作家ごとの各変数の総度数(上位10項目)
作家 名詞_ 助詞
助詞_ 動詞
助詞_ 名詞
記号_ 名詞
助詞_ 記号
動詞_ 助詞
動詞_ 助動詞
名詞_ 名詞
助動詞 _記号
助動詞 _名詞 病前 58,394 33,973 33,006 12,914 19,788 18,298 15,721 13,129 10,153 8,798 病後 66,308 31,787 34,816 21,524 22,022 15,705 15,873 19,640 9,766 7,932 戦後 71,168 32,174 27,365 34,974 41,046 18,599 16,950 20,114 12,223 7,581 三島 41,813 22,012 22,036 11,574 8,473 9,647 11,336 7,957 8,414 5,541 中島 28,443 14,270 15,728 8,710 6,403 6,577 7,090 7,925 4,779 4,291 井伏 14,126 8,053 8,206 3,636 2,632 4,133 3,597 4,257 2,817 1,423 坂口 28,249 15,707 16,422 7,597 6,749 8,447 6,887 7,311 5,147 3,822 堀 37,901 24,975 18,947 5,782 8,914 13,349 11,933 6,245 6,943 6,490 太宰 17,014 9,996 8,436 6,380 6,471 5,750 4,783 3,708 4,435 2,314 室生 24,976 15,527 12,563 5,381 5,348 8,127 8,081 4,023 5,734 3,939 岡本 16,199 9,103 8,945 3,938 4,048 5,253 4,399 3,620 3,085 1,350 島崎 184,702 95,497 105,573 36,952 26,812 42,038 43,896 44,444 27,980 20,908 川端 66,836 35,389 33,151 23,853 18,189 17,566 17,597 14,902 14,420 6,583 徳田 90,284 52,389 42,951 24,221 23,992 28,832 24,709 15,796 15,183 11,591 横光 88,203 48,274 51,355 17,365 13,286 22,564 24,529 14,101 15,294 11,448 正宗 8,547 4,897 4,533 2,383 2,372 2,769 2,343 1,472 1,355 1,083 永井 31,803 15,691 18,561 6,756 4,825 7,953 6,952 8,094 3,222 4,241 江戸川 49,314 25,441 23,661 17,218 16,003 13,121 13,449 12,036 10,217 7,255 泉 23,216 9,401 10,954 9,964 8,971 5,144 5,211 5,820 3,509 2,664 海野 68,417 37,482 34,175 20,401 19,875 18,489 20,065 22,398 15,045 9,125 織田 57,813 33,263 29,864 18,345 15,558 17,600 17,905 16,234 12,762 7,954 菊池 57,039 28,940 23,871 22,875 23,540 15,288 16,196 10,271 11,824 7,365
7.7.2.1 対応分析
形態素タグのbigramのデータを用いて対応分析を行った。第1と第2個体スコアの散布図 とバイプロットをそれぞれ図7.26と図7.27に示す。第1スコア、第2スコアの寄与率はそれ
ぞれ30.84%、16.64%である。作品の分布は、形態素タグのunigramに基づいて分析した結果
に類似する。宇野浩二の病前の作品は主に堀辰雄、病後は泉鏡花、菊池寛、太宰治などの作 品と重なっている。戦後の作品はやや離れていることがわかる。
155
図7.26 形態素タグのbigramに基づいた対応分析の個体スコアのプロット
図7.27 形態素タグのbigramに基づいた対応分析のバイプロット
-0.5 0.0 0.5 1.0 1.5
-0.50.00.51.01.5
CA factor map
Dim1(30.84%)
Dim2(16.64%)
.
三島_01 三島三島三島_02_04_03 三島_05
三島_06
三島_07 三島_08 三島_09 三島_10
三島_11 三島_12
三島_13 三島_14 三島_15
中島_01 中島_02 中島_03 中島_04 中島_05
中島_06中島_07 中島中島_08_09
中島_10
中島_11 中島_12 中島_13
中島_14 中島_15 井伏_01 井伏_02
井伏井伏_03_04 井伏_05
井伏_06 井伏_07
井伏_08 井伏_09
井伏_10 井伏井伏_11_12
井伏井伏_13_14 井伏_15 坂口_01 坂口坂口_02_03 坂口_04
坂口_05 坂口_06 坂口_07
坂口_08
坂口_09 坂口_10 坂口_11
坂口_12 坂口_13 坂口_14
坂口_15 堀_01 堀_02
堀_03 堀_04 堀_05
堀_06 堀_07
堀_08 堀_09
堀_10 堀_11
堀_12 堀_13
堀_14 堀_15
太宰_01 太宰_02
太宰_03 太宰_04 太宰_05
太宰_06 太宰_07太宰_08
太宰_09
太宰_10 太宰_11 太宰_12 太宰_13太宰_14
太宰_15 室生_01
室生室生_02_03
室生_04 室生_05
室生_06 室生_07
室生_08
室生_09 室生室生_10_11
室生_12 室生室生_13_14 室生_15
岡本_01 岡本_02 岡本_03 岡本岡本岡本_04_06_05
岡本_07 岡本_08 岡本_09 岡本岡本_10_11
岡本_12 岡本_13
岡本_14 岡本_15 島崎_01 島崎島崎_02_03
島崎_04 島崎_05 島崎_06
島崎_07 島崎島崎_08_09 島崎_10 島崎_11
島崎_12 島崎_13
島崎_14 島崎_15 川端_01
川端_02 川端_03
川端_04川端_05 川端_06
川端_07
川端_08 川端_09 川端_10 川端_11 川端_12 川端_13
川端_14 川端_15
徳田_01 徳田_02
徳田_03 徳田_04 徳田_05 徳田徳田_06_07
徳田_08
徳田_09 徳田_10
徳田_11
徳田_12 徳田_13
徳田_14 徳田_15 横光_01
横光_02横光_03 横光_04 横光_05
横光_06 横光_07
横光_08
横光_09 横光_10
横光_11 横光_12 横光_13横光_14
横光_15 正宗_01 正宗_02 正宗_03 正宗_04 正宗_05
正宗_06 正宗_07
正宗_08 正宗_09 正宗_10
正宗_11 正宗_12 正宗_13
正宗_14 正宗_15
永井_01 永井_02永井_03
永井_04 永井_05
永井_06 永井_07永井永井_08_09
永井_10 永井_11 永井_12 永井_13 永井永井_14_15
江戸川_01 江戸川_02 江戸川_03
江戸川_04 江戸川_05 江戸川_06 江戸川_07
江戸川_08 江戸川_09 江戸川_10 江戸川_11
江戸川_12 江戸川_13 江戸川_14 江戸川_15
泉_01 泉_02 泉_03 泉_04 泉_05
泉_06 泉_07 泉_08
泉_09 泉_10 泉_11
泉_12 泉_13 泉_14 泉_15 海野_01 海野_02
海野_03 海野_04
海野_05 海野_06
海野_07
海野_08 海野_09
海野_10 海野_11 海野_12 海野_13
海野_14 海野_15 織田_01
織田_02 織田_03 織田_04 織田_05 織田_06
織田_07
織田_08 織田_09 織田織田_10_11織田_12
織田織田_13_14 織田_15
菊池_01菊池菊池菊池_02_03_04 菊池_05
菊池_06 菊池_07 菊池_08
菊池_09 菊池_10 菊池_11
菊池_12 菊池_13 菊池_14 菊池_15
△
△
△
△
△
△
△
△
△△
△ △
△
△
△△ △△
△
△
△△ △△ △△ △△ ++ ++++
+
+ +
++ + + +
+++ ++ + + + + ×+ +
× ×× ××
× ×
× ×
××
××
△ +
× 病前 病後 戦後
-0.5 0.0 0.5 1.0 1.5 2.0
-1.0-0.50.00.51.01.5
CA factor map
Dim 1 (30.84%)
Dim 2 (16.64%) 病前_01
病前_02
病前_03 病前_04 病前_05
病前_06 病前_07
病前_08 病前_09 病前_10 病前_11 病前_12
病前_13 病前_14 病前病前_15_18病前病前_16_17
病前_19 病前_20 病前_21
病前_22 病前病前病前_23病前_24_25_26 病前病前_27_28
病後_01 病後_02 病後病後_03_04
病後_05 病後_06 病後_07 病後_08病後_09
病後_10 病後_11 病後_12 病後_13 病後_14
病後病後_15_16 病後病後病後病後_17_19_18_20
病後_21 病後_22病後_23戦後病後病後_01_24_25
戦後戦後_02_03 戦後_04 戦後戦後_05_06
戦後_07 戦後_08 戦後戦後_09_10
戦後戦後_11_12 戦後_13
戦後_14
三島_01 三島三島三島_02_04_03 三島三島_05_06
三島_07 三島_08 三島_09 三島_10
三島_11 三島_12
三島_13 三島_14 三島_15
中島_01 中島_02 中島_03 中島_04 中島_05
中島中島_06_07 中島中島_08_09
中島_10 中島_11 中島_12 中島_13
中島_14 中島_15 井伏_01 井伏_02
井伏井伏_03_04 井伏_05
井伏_06 井伏_07
井伏_08 井伏_09
井伏_10 井伏井伏_11_12
井伏井伏_13_14 井伏_15 坂口_01 坂口坂口_02_03 坂口_04
坂口_05 坂口_06 坂口_07
坂口_08
坂口_09 坂口_10 坂口_11
坂口_12 坂口_13 坂口_14
坂口_15 堀_01 堀_02
堀_03 堀_04 堀_05 堀_06 堀_07
堀_08 堀_09
堀_10 堀_11
堀_12 堀_13
堀_14 堀_15
太宰_01 太宰_02
太宰_03 太宰_04 太宰_05
太宰_06 太宰_07太宰_08
太宰_09 太宰_10 太宰_11 太宰_12 太宰_13太宰_14
太宰_15 室生_01
室生室生_02_03 室生_04
室生_05 室生_06 室生_07
室生_08
室生_09 室生室生_10_11
室生_12 室生室生_13_14 室生_15
岡本_01 岡本_02 岡本_03 岡本岡本岡本_04_06_05 岡本_07 岡本_08 岡本_09 岡本岡本_10_11
岡本_12 岡本_13
岡本_14 岡本_15 島崎_01 島崎島崎_02_03
島崎_04 島崎_05 島崎_06
島崎_07 島崎島崎_08_09 島崎_10 島崎_11
島崎_12 島崎_13
島崎_14 島崎_15 川端_01
川端_02 川端_03 川端_04川端_05 川端_06
川端_07 川端川端川端_08_11_10川端_09 川端_12 川端_13
川端_14 川端_15
徳田_01 徳田_02 徳田_03 徳田_04 徳田_05 徳田徳田_06_07
徳田_08
徳田_09 徳田_10
徳田_11
徳田_12 徳田_13
徳田徳田_14_15 横光_01
横光横光_02_03 横光_04 横光_05
横光_06 横光_07
横光_08
横光_09 横光_10
横光_11 横光_12 横光横光_13_14
横光_15 正宗_01 正宗_02 正宗_03 正宗_04 正宗_05
正宗正宗_06_07 正宗_08 正宗_09 正宗_10
正宗_11 正宗_12 正宗_13
正宗_14 正宗_15
永井_01 永井_02永井_03
永井_04 永井_05永井_06
永井_07永井永井_08_09 永井_10 永井_11 永井_12 永井_13 永井永井_14_15
江戸川_01 江戸川_02 江戸川_03 江戸川_04
江戸川_05 江戸川_06 江戸川_07
江戸川_08 江戸川_09 江戸川_10 江戸川_11
江戸川_12 江戸川_13 江戸川_14 江戸川_15
泉_01 泉_02 泉_03 泉_04 泉_05 泉_06
泉_07 泉_08
泉_09 泉_10 泉泉_11_12 泉_13 泉_14 泉_15 海野_01 海野_02
海野_03 海野_04
海野_05 海野_06
海野_07 海野_08 海野_09
海野_10 海野_11 海野_12 海野_13
海野_14 海野_15 織田_01
織田_02織田_03 織田_04 織田_05 織田_06
織田_07
織田_08 織田_09 織田織田_10_11織田_12
織田織田_13_14 織田_15 菊池菊池菊池_01菊池_03_02_04
菊池_05 菊池_06 菊池_07 菊池_08
菊池_09 菊池_10 菊池_11
菊池_12 菊池_13 菊池_14 菊池_15 名詞 助詞_ 助詞 動詞_ 助詞 名詞_
記号 名詞_ 助詞 記号_ 動詞 助詞_
動詞 助動詞_ 名詞 名詞_ 助動詞 記号_ 助動詞 名詞_
名詞 助動詞_ 助詞 助詞動詞 名詞__ 代名詞 助詞_
助動詞 助動詞_ 助動詞 助詞_ 記号 副詞_ 動詞 動詞_
連体詞 名詞_ 名詞 動詞_ 記号 代名詞_
助詞 副詞_ 助詞 形容詞_
副詞 名詞_ 形容詞 名詞_
記号 連体詞_ 名詞 記号_ 動詞 記号_
記号 接続詞_
副詞 動詞_
記号 助詞_ 記号 動詞_
接頭辞 名詞_ 助詞 代名詞_
接続詞 記号_ 助詞 連体詞_
副詞 助詞_
記号 形容詞_
記号 記号_
形容詞 動詞_ 助詞 助動詞_ 接続詞 名詞_
記号 接頭辞_ 助詞 接頭辞_
副詞 記号_
形容詞 助動詞_ 形容詞 助詞_
形容詞 記号_ 副詞 形容詞_
名詞 形容詞_ 副詞 代名詞_
代名詞 名詞_
助動詞 動詞_ 副詞 連体詞_
助動詞 形容詞_ 副詞 副詞_
助詞 接続詞_ 名詞 副詞_ 動詞 形容詞_ 接続詞 代名詞_
接続詞 副詞_
連体詞 形容詞_ 名詞 代名詞_
助動詞 連体詞_ 助動詞 代名詞_
副詞 助動詞_ 接頭辞 動詞_
名詞 接頭辞_ 助動詞 接頭辞_ 接続詞 連体詞_
記号 感動詞_
接続詞 動詞_ 代名詞 助動詞_
副詞 接頭辞_ 連体詞 動詞_ 名詞 連体詞_
連体詞 助動詞_
動詞 連体詞_ 動詞 代名詞_
動詞 接頭辞_
連体詞 記号_
助動詞 副詞_
感動詞 記号_
代名詞 動詞_
記号 助動詞_
動詞 副詞_ 形容詞 代名詞_
形容詞 連体詞_
代名詞 記号_
接続詞 形容詞_
接続詞 接頭辞_ 接続詞 助詞_
形容詞 接頭辞_ 連体詞 代名詞_
接続詞 接続詞_連体詞 副詞_
感動詞 名詞_
接頭辞 代名詞_ 連体詞 連体詞_
形容詞 副詞_
156
図7.27に示すバイプロットから、散布図の上側に位置している宇野浩二の病前の作品や堀 辰雄の作品では、「連体詞_代名詞」、「接続詞_代名詞」、「代名詞_名詞」、「連体詞_連体詞」、
「連体詞_助動詞」「代名詞_助詞」といった代名詞と連体詞を含む bigram の使用率が類似し ている。一方、横軸の正の方向に位置している宇野浩二の戦後の作品と泉鏡花、菊池寛、太 宰治の作品では、「連体詞_記号」、「記号_助動詞」、「副詞_記号」、「名詞_記号」、「接続詞_記 号」、「記号_記号」、「記号_動詞」など記号を含むbigramの使用が似ている。
7.7.2.2 階層的クラスター分析
形態素タグのbigramのデータを用いてクラスター分析した結果を図7.28に示す。宇野浩二 の作品が含まれているクラスター1と2を拡大し、それぞれ図7.29と図7.30に示す。
図7.29 形態素タグのbigramの階層的クラスター分析の結果(クラスター1)
図7.30 形態素タグのbigramの階層的クラスター分析の結果(クラスター2)
図 7.29 では、戦後と病後の一部の作品のクラスターは、泉鏡花のクラスターと融合した。
図7.30では、岡本綺堂、徳田秋声、横光利一、川端康成などの一部の作品からなるクラスタ ーが堀辰雄の作品のクラスターと融合し、さらに、病前の作品のクラスターと融合している。
0.00.20.40.60.81.01.2
Lower tree
泉_05 泉_15 泉_04 泉_08 泉_07 泉_03 泉_01 泉_02 泉_11 泉_14 泉_09 泉_06 泉_13 泉_10 泉_12 病後_01 病後_02 病後_09 病後_22 病後_15 病後_17 病後_11 病後_12 病後_21 病後_10 病後_20 病後_18 病後_19 戦後_08 戦後_05 戦後_06 戦後_11 戦後_12 戦後_14 病後_23 戦後_13 病後_25 戦後_03 病後_24 戦後_02 戦後_07 戦後_09 戦後_10 戦後_01 戦後_04
0.00.20.40.60.81.0
Lower tree
病前_18 病前_15 病前_21 病前_20 病前_19 病前_23 病前_01 織田_01 病前_11 病前_14 病前_07 病前_09 病前_12 病前_13 病前_22 病前_06 病前_08 病前_02 病前_16 病前_17 病前_10 病前_25 病前_27 病前_04 病前_24 病前_28 病後_07 中島_05 堀_10 堀_08 堀_13 堀_15 堀_01 堀_09 堀_07 堀_11 横光_10 堀_05 堀_06 堀_02 堀_03 堀_04 岡本_13 岡本_09 岡本_10 岡本_11 室生_03 室生_01 室生_02 徳田_07 徳田_06 徳田_10 横光_05 横光_07 横光_08 坂口_11 川端_15 川端_01 川端_13 三島_05 太宰_05
157
図7.28 形態素タグのbigramの階層的クラスター分析の結果
坂口_04太宰_10太宰_07太宰_08太宰_09太宰_15太宰_06太宰_11川端_09川端_10川端_05川端_08菊池_14菊池_15織田_11織田_06織田_14織田_12織田_13菊池_12菊池_09菊池_10江戸川_10菊池_05菊池_11江戸川_13江戸川_14江戸川_15海野_11菊池_13菊池_08病前_03川端_02菊池_06菊池_07泉_05泉_15泉_04泉_08泉_07泉_03泉_01泉_02泉_11泉_14泉_09泉_06泉_13泉_10泉_12病後_01病後_02病後_09病後_22病後_15病後_17病後_11病後_12病後_21病後_10病後_20病後_18病後_19戦後_08戦後_05戦後_06戦後_11戦後_12戦後_14病後_23戦後_13病後_25戦後_03病後_24戦後_02戦後_07戦後_09戦後_10戦後_01戦後_04海野_14海野_09海野_13海野_02海野_08海野_12海野_10海野_15坂口_09川端_11菊池_03菊池_02菊池_04織田_05織田_04織田_08織田_09井伏_13井伏_10井伏_14永井_05永井_07永井_01永井_03中島_11永井_04永井_12織田_15永井_14永井_02永井_09永井_10永井_08永井_15三島_02三島_03三島_07永井_13織田_10徳田_15永井_11菊池_01三島_11中島_09三島_01三島_13三島_08三島_14中島_06織田_02中島_08三島_04中島_12中島_15中島_14織田_03島崎_14島崎_15井伏_08坂口_13正宗_10正宗_03正宗_01正宗_04徳田_08徳田_14徳田_12徳田_05徳田_13正宗_08正宗_09正宗_06正宗_12正宗_15正宗_07正宗_11正宗_13岡本_15岡本_07岡本_12岡本_14岡本_01岡本_06岡本_08正宗_05岡本_02岡本_03川端_04岡本_05岡本_04島崎_09川端_06川端_12川端_14太宰_01太宰_03室生_09室生_10室生_11横光_11横光_15横光_12横光_14島崎_08島崎_05島崎_06島崎_10島崎_11島崎_13坂口_03室生_05室生_04坂口_01坂口_02室生_08室生_06室生_13室生_14室生_07堀_12堀_14横光_02横光_09横光_04横光_06横光_01横光_03島崎_03島崎_01島崎_02井伏_06島崎_07島崎_12徳田_09徳田_03徳田_04徳田_01徳田_02正宗_02正宗_14中島_07中島_04中島_10病前_26坂口_05中島_02中島_01中島_03太宰_13坂口_08太宰_14織田_07太宰_12江戸川_09徳田_11江戸川_08海野_04海野_05海野_06海野_07海野_03三島_06三島_12三島_09三島_10三島_15室生_15坂口_10中島_13坂口_07坂口_15江戸川_02江戸川_05江戸川_06江戸川_01江戸川_03江戸川_04室生_12江戸川_07江戸川_11川端_03江戸川_12太宰_02太宰_04病後_16川端_07永井_06病後_05病後_06病後_03病後_04病後_08病後_13病後_14病前_05海野_01井伏_01井伏_02井伏_03井伏_04井伏_05井伏_15坂口_12井伏_07井伏_12井伏_09横光_13坂口_06坂口_14井伏_11島崎_04病前_18病前_15病前_21病前_20病前_19病前_23病前_01織田_01病前_11病前_14病前_07病前_09病前_12病前_13病前_22病前_06病前_08病前_02病前_16病前_17病前_10病前_25病前_27病前_04病前_24病前_28病後_07中島_05堀_10堀_08堀_13堀_15堀_01堀_09堀_07堀_11横光_10堀_05堀_06堀_02堀_03堀_04岡本_13岡本_09岡本_10岡本_11室生_03室生_01室生_02徳田_07徳田_06徳田_10横光_05横光_07横光_08坂口_11川端_15川端_01川端_13三島_05太宰_05
0123456
Cluster Dendrogram
Height
クラスター1 クラスター2