• 検索結果がありません。

第 7 章 宇野浩二と同時代の作家との比較分析

7.7 形態素タグの n-gram (n=1, 2)

7.7.2 形態素タグの bigram

品詞および記号のつながり関係を考察するために、形態素タグのbigramのデータを抽出し て対応分析と階層的クラスター分析を行う。形態素解析済みの作品から 103 個の変数を抽出 し、作家ごとの各変数の総度数を表7.9に示し、詳細なデータを付録7.5に示す。

表7.9 作家ごとの各変数の総度数(上位10項目)

作家 名詞_ 助詞

助詞_ 動詞

助詞_ 名詞

記号_ 名詞

助詞_ 記号

動詞_ 助詞

動詞_ 助動詞

名詞_ 名詞

助動詞 _記号

助動詞 _名詞 病前 58,394 33,973 33,006 12,914 19,788 18,298 15,721 13,129 10,153 8,798 病後 66,308 31,787 34,816 21,524 22,022 15,705 15,873 19,640 9,766 7,932 戦後 71,168 32,174 27,365 34,974 41,046 18,599 16,950 20,114 12,223 7,581 三島 41,813 22,012 22,036 11,574 8,473 9,647 11,336 7,957 8,414 5,541 中島 28,443 14,270 15,728 8,710 6,403 6,577 7,090 7,925 4,779 4,291 井伏 14,126 8,053 8,206 3,636 2,632 4,133 3,597 4,257 2,817 1,423 坂口 28,249 15,707 16,422 7,597 6,749 8,447 6,887 7,311 5,147 3,822 37,901 24,975 18,947 5,782 8,914 13,349 11,933 6,245 6,943 6,490 太宰 17,014 9,996 8,436 6,380 6,471 5,750 4,783 3,708 4,435 2,314 室生 24,976 15,527 12,563 5,381 5,348 8,127 8,081 4,023 5,734 3,939 岡本 16,199 9,103 8,945 3,938 4,048 5,253 4,399 3,620 3,085 1,350 島崎 184,702 95,497 105,573 36,952 26,812 42,038 43,896 44,444 27,980 20,908 川端 66,836 35,389 33,151 23,853 18,189 17,566 17,597 14,902 14,420 6,583 徳田 90,284 52,389 42,951 24,221 23,992 28,832 24,709 15,796 15,183 11,591 横光 88,203 48,274 51,355 17,365 13,286 22,564 24,529 14,101 15,294 11,448 正宗 8,547 4,897 4,533 2,383 2,372 2,769 2,343 1,472 1,355 1,083 永井 31,803 15,691 18,561 6,756 4,825 7,953 6,952 8,094 3,222 4,241 江戸川 49,314 25,441 23,661 17,218 16,003 13,121 13,449 12,036 10,217 7,255 23,216 9,401 10,954 9,964 8,971 5,144 5,211 5,820 3,509 2,664 海野 68,417 37,482 34,175 20,401 19,875 18,489 20,065 22,398 15,045 9,125 織田 57,813 33,263 29,864 18,345 15,558 17,600 17,905 16,234 12,762 7,954 菊池 57,039 28,940 23,871 22,875 23,540 15,288 16,196 10,271 11,824 7,365

7.7.2.1 対応分析

形態素タグのbigramのデータを用いて対応分析を行った。第1と第2個体スコアの散布図 とバイプロットをそれぞれ図7.26と図7.27に示す。第1スコア、第2スコアの寄与率はそれ

ぞれ30.84%、16.64%である。作品の分布は、形態素タグのunigramに基づいて分析した結果

に類似する。宇野浩二の病前の作品は主に堀辰雄、病後は泉鏡花、菊池寛、太宰治などの作 品と重なっている。戦後の作品はやや離れていることがわかる。

155

図7.26 形態素タグのbigramに基づいた対応分析の個体スコアのプロット

図7.27 形態素タグのbigramに基づいた対応分析のバイプロット

-0.5 0.0 0.5 1.0 1.5

-0.50.00.51.01.5

CA factor map

Dim1(30.84%)

Dim2(16.64%)

.

三島_01 三島三島三島_02_04_03 三島_05

三島_06

三島_07 三島_08 三島_09 三島_10

三島_11 三島_12

三島_13 三島_14 三島_15

中島_01 中島_02 中島_03 中島_04 中島_05

中島_06中島_07 中島中島_08_09

中島_10

中島_11 中島_12 中島_13

中島_14 中島_15 井伏_01 井伏_02

井伏井伏_03_04 井伏_05

井伏_06 井伏_07

井伏_08 井伏_09

井伏_10 井伏井伏_11_12

井伏井伏_13_14 井伏_15 坂口_01 坂口坂口_02_03 坂口_04

坂口_05 坂口_06 坂口_07

坂口_08

坂口_09 坂口_10 坂口_11

坂口_12 坂口_13 坂口_14

坂口_15 _01 _02

_03 _04 _05

_06 _07

_08 _09

_10 _11

_12 _13

_14 _15

太宰_01 太宰_02

太宰_03 太宰_04 太宰_05

太宰_06 太宰_07太宰_08

太宰_09

太宰_10 太宰_11 太宰_12 太宰_13太宰_14

太宰_15 室生_01

室生室生_02_03

室生_04 室生_05

室生_06 室生_07

室生_08

室生_09 室生室生_10_11

室生_12 室生室生_13_14 室生_15

岡本_01 岡本_02 岡本_03 岡本岡本岡本_04_06_05

岡本_07 岡本_08 岡本_09 岡本岡本_10_11

岡本_12 岡本_13

岡本_14 岡本_15 島崎_01 島崎島崎_02_03

島崎_04 島崎_05 島崎_06

島崎_07 島崎島崎_08_09 島崎_10 島崎_11

島崎_12 島崎_13

島崎_14 島崎_15 川端_01

川端_02 川端_03

川端_04川端_05 川端_06

川端_07

川端_08 川端_09 川端_10 川端_11 川端_12 川端_13

川端_14 川端_15

徳田_01 徳田_02

徳田_03 徳田_04 徳田_05 徳田徳田_06_07

徳田_08

徳田_09 徳田_10

徳田_11

徳田_12 徳田_13

徳田_14 徳田_15 横光_01

横光_02横光_03 横光_04 横光_05

横光_06 横光_07

横光_08

横光_09 横光_10

横光_11 横光_12 横光_13横光_14

横光_15 正宗_01 正宗_02 正宗_03 正宗_04 正宗_05

正宗_06 正宗_07

正宗_08 正宗_09 正宗_10

正宗_11 正宗_12 正宗_13

正宗_14 正宗_15

永井_01 永井_02永井_03

永井_04 永井_05

永井_06 永井_07永井永井_08_09

永井_10 永井_11 永井_12 永井_13 永井永井_14_15

江戸川_01 江戸川_02 江戸川_03

江戸川_04 江戸川_05 江戸川_06 江戸川_07

江戸川_08 江戸川_09 江戸川_10 江戸川_11

江戸川_12 江戸川_13 江戸川_14 江戸川_15

_01 _02 _03 _04 _05

_06 _07 _08

_09 _10 _11

_12 _13 _14 _15 海野_01 海野_02

海野_03 海野_04

海野_05 海野_06

海野_07

海野_08 海野_09

海野_10 海野_11 海野_12 海野_13

海野_14 海野_15 織田_01

織田_02 織田_03 織田_04 織田_05 織田_06

織田_07

織田_08 織田_09 織田織田_10_11織田_12

織田織田_13_14 織田_15

菊池_01菊池菊池菊池_02_03_04 菊池_05

菊池_06 菊池_07 菊池_08

菊池_09 菊池_10 菊池_11

菊池_12 菊池_13 菊池_14 菊池_15

△ △△ △△ △ ++ ++++

+

+ +

++ + + +

+++ ++ + + + + ×+ +

× ×× ××

× ×

× ×

××

××

+

× 病前 病後 戦後

-0.5 0.0 0.5 1.0 1.5 2.0

-1.0-0.50.00.51.01.5

CA factor map

Dim 1 (30.84%)

Dim 2 (16.64%) 病前_01

病前_02

病前_03 病前_04 病前_05

病前_06 病前_07

病前_08 病前_09 病前_10 病前_11 病前_12

病前_13 病前_14 病前病前_15_18病前病前_16_17

病前_19 病前_20 病前_21

病前_22 病前病前病前_23病前_24_25_26 病前病前_27_28

病後_01 病後_02 病後病後_03_04

病後_05 病後_06 病後_07 病後_08病後_09

病後_10 病後_11 病後_12 病後_13 病後_14

病後病後_15_16 病後病後病後病後_17_19_18_20

病後_21 病後_22病後_23戦後病後病後_01_24_25

戦後戦後_02_03 戦後_04 戦後戦後_05_06

戦後_07 戦後_08 戦後戦後_09_10

戦後戦後_11_12 戦後_13

戦後_14

三島_01 三島三島三島_02_04_03 三島三島_05_06

三島_07 三島_08 三島_09 三島_10

三島_11 三島_12

三島_13 三島_14 三島_15

中島_01 中島_02 中島_03 中島_04 中島_05

中島中島_06_07 中島中島_08_09

中島_10 中島_11 中島_12 中島_13

中島_14 中島_15 井伏_01 井伏_02

井伏井伏_03_04 井伏_05

井伏_06 井伏_07

井伏_08 井伏_09

井伏_10 井伏井伏_11_12

井伏井伏_13_14 井伏_15 坂口_01 坂口坂口_02_03 坂口_04

坂口_05 坂口_06 坂口_07

坂口_08

坂口_09 坂口_10 坂口_11

坂口_12 坂口_13 坂口_14

坂口_15 _01 _02

_03 _04 _05 _06 _07

_08 _09

_10 _11

_12 _13

_14 _15

太宰_01 太宰_02

太宰_03 太宰_04 太宰_05

太宰_06 太宰_07太宰_08

太宰_09 太宰_10 太宰_11 太宰_12 太宰_13太宰_14

太宰_15 室生_01

室生室生_02_03 室生_04

室生_05 室生_06 室生_07

室生_08

室生_09 室生室生_10_11

室生_12 室生室生_13_14 室生_15

岡本_01 岡本_02 岡本_03 岡本岡本岡本_04_06_05 岡本_07 岡本_08 岡本_09 岡本岡本_10_11

岡本_12 岡本_13

岡本_14 岡本_15 島崎_01 島崎島崎_02_03

島崎_04 島崎_05 島崎_06

島崎_07 島崎島崎_08_09 島崎_10 島崎_11

島崎_12 島崎_13

島崎_14 島崎_15 川端_01

川端_02 川端_03 川端_04川端_05 川端_06

川端_07 川端川端川端_08_11_10川端_09 川端_12 川端_13

川端_14 川端_15

徳田_01 徳田_02 徳田_03 徳田_04 徳田_05 徳田徳田_06_07

徳田_08

徳田_09 徳田_10

徳田_11

徳田_12 徳田_13

徳田徳田_14_15 横光_01

横光横光_02_03 横光_04 横光_05

横光_06 横光_07

横光_08

横光_09 横光_10

横光_11 横光_12 横光横光_13_14

横光_15 正宗_01 正宗_02 正宗_03 正宗_04 正宗_05

正宗正宗_06_07 正宗_08 正宗_09 正宗_10

正宗_11 正宗_12 正宗_13

正宗_14 正宗_15

永井_01 永井_02永井_03

永井_04 永井_05永井_06

永井_07永井永井_08_09 永井_10 永井_11 永井_12 永井_13 永井永井_14_15

江戸川_01 江戸川_02 江戸川_03 江戸川_04

江戸川_05 江戸川_06 江戸川_07

江戸川_08 江戸川_09 江戸川_10 江戸川_11

江戸川_12 江戸川_13 江戸川_14 江戸川_15

_01 _02 _03 _04 _05 _06

_07 _08

_09 _10 _11_12 _13 _14 _15 海野_01 海野_02

海野_03 海野_04

海野_05 海野_06

海野_07 海野_08 海野_09

海野_10 海野_11 海野_12 海野_13

海野_14 海野_15 織田_01

織田_02織田_03 織田_04 織田_05 織田_06

織田_07

織田_08 織田_09 織田織田_10_11織田_12

織田織田_13_14 織田_15 菊池菊池菊池_01菊池_03_02_04

菊池_05 菊池_06 菊池_07 菊池_08

菊池_09 菊池_10 菊池_11

菊池_12 菊池_13 菊池_14 菊池_15 名詞 助詞_ 助詞 動詞_ 助詞 名詞_

記号 名詞_ 助詞 記号_ 動詞 助詞_

動詞 助動詞_ 名詞 名詞_ 助動詞 記号_ 助動詞 名詞_

名詞 助動詞_ 助詞 助詞動詞 名詞__ 代名詞 助詞_

助動詞 助動詞_ 助動詞 助詞_ 記号 副詞_ 動詞 動詞_

連体詞 名詞_ 名詞 動詞_ 記号 代名詞_

助詞 副詞_ 助詞 形容詞_

副詞 名詞_ 形容詞 名詞_

記号 連体詞_ 名詞 記号_ 動詞 記号_

記号 接続詞_

副詞 動詞_

記号 助詞_ 記号 動詞_

接頭辞 名詞_ 助詞 代名詞_

接続詞 記号_ 助詞 連体詞_

副詞 助詞_

記号 形容詞_

記号 記号_

形容詞 動詞_ 助詞 助動詞_ 接続詞 名詞_

記号 接頭辞_ 助詞 接頭辞_

副詞 記号_

形容詞 助動詞_ 形容詞 助詞_

形容詞 記号_ 副詞 形容詞_

名詞 形容詞_ 副詞 代名詞_

代名詞 名詞_

助動詞 動詞_ 副詞 連体詞_

助動詞 形容詞_ 副詞 副詞_

助詞 接続詞_ 名詞 副詞_ 動詞 形容詞_ 接続詞 代名詞_

接続詞 副詞_

連体詞 形容詞_ 名詞 代名詞_

助動詞 連体詞_ 助動詞 代名詞_

副詞 助動詞_ 接頭辞 動詞_

名詞 接頭辞_ 助動詞 接頭辞_ 接続詞 連体詞_

記号 感動詞_

接続詞 動詞_ 代名詞 助動詞_

副詞 接頭辞_ 連体詞 動詞_ 名詞 連体詞_

連体詞 助動詞_

動詞 連体詞_ 動詞 代名詞_

動詞 接頭辞_

連体詞 記号_

助動詞 副詞_

感動詞 記号_

代名詞 動詞_

記号 助動詞_

動詞 副詞_ 形容詞 代名詞_

形容詞 連体詞_

代名詞 記号_

接続詞 形容詞_

接続詞 接頭辞_ 接続詞 助詞_

形容詞 接頭辞_ 連体詞 代名詞_

接続詞 接続詞_連体詞 副詞_

感動詞 名詞_

接頭辞 代名詞_ 連体詞 連体詞_

形容詞 副詞_

156

図7.27に示すバイプロットから、散布図の上側に位置している宇野浩二の病前の作品や堀 辰雄の作品では、「連体詞_代名詞」、「接続詞_代名詞」、「代名詞_名詞」、「連体詞_連体詞」、

「連体詞_助動詞」「代名詞_助詞」といった代名詞と連体詞を含む bigram の使用率が類似し ている。一方、横軸の正の方向に位置している宇野浩二の戦後の作品と泉鏡花、菊池寛、太 宰治の作品では、「連体詞_記号」、「記号_助動詞」、「副詞_記号」、「名詞_記号」、「接続詞_記 号」、「記号_記号」、「記号_動詞」など記号を含むbigramの使用が似ている。

7.7.2.2 階層的クラスター分析

形態素タグのbigramのデータを用いてクラスター分析した結果を図7.28に示す。宇野浩二 の作品が含まれているクラスター1と2を拡大し、それぞれ図7.29と図7.30に示す。

図7.29 形態素タグのbigramの階層的クラスター分析の結果(クラスター1)

図7.30 形態素タグのbigramの階層的クラスター分析の結果(クラスター2)

図 7.29 では、戦後と病後の一部の作品のクラスターは、泉鏡花のクラスターと融合した。

図7.30では、岡本綺堂、徳田秋声、横光利一、川端康成などの一部の作品からなるクラスタ ーが堀辰雄の作品のクラスターと融合し、さらに、病前の作品のクラスターと融合している。

0.00.20.40.60.81.01.2

Lower tree

_05 _15 _04 _08 _07 _03 _01 _02 _11 _14 _09 _06 _13 _10 _12 _01 _02 _09 _22 _15 _17 _11 _12 _21 _10 _20 _18 _19 _08 _05 _06 _11 _12 _14 _23 _13 _25 _03 _24 _02 _07 _09 _10 _01 _04

0.00.20.40.60.81.0

Lower tree

_18 _15 _21 _20 _19 _23 _01 _01 _11 _14 _07 _09 _12 _13 _22 _06 _08 _02 _16 _17 _10 _25 _27 _04 _24 _28 _07 _05 _10 _08 _13 _15 _01 _09 _07 _11 _10 _05 _06 _02 _03 _04 _13 _09 _10 _11 _03 _01 _02 _07 _06 _10 _05 _07 _08 _11 _15 _01 _13 _05 _05

157

図7.28 形態素タグのbigramの階層的クラスター分析の結果

_04_10_07_08_09_15_06_11_09_10_05_08_14_15_11_06_14_12_13_12_09_10_10_05_11_13_14_15_11_13_08_03_02_06_07_05_15_04_08_07_03_01_02_11_14_09_06_13_10_12_01_02_09_22_15_17_11_12_21_10_20_18_19_08_05_06_11_12_14_23_13_25_03_24_02_07_09_10_01_04_14_09_13_02_08_12_10_15_09_11_03_02_04_05_04_08_09_13_10_14_05_07_01_03_11_04_12_15_14_02_09_10_08_15_02_03_07_13_10_15_11_01_11_09_01_13_08_14_06_02_08_04_12_15_14_03_14_15_08_13_10_03_01_04_08_14_12_05_13_08_09_06_12_15_07_11_13_15_07_12_14_01_06_08_05_02_03_04_05_04_09_06_12_14_01_03_09_10_11_11_15_12_14_08_05_06_10_11_13_03_05_04_01_02_08_06_13_14_07_12_14_02_09_04_06_01_03_03_01_02_06_07_12_09_03_04_01_02_02_14_07_04_10_26_05_02_01_03_13_08_14_07_12_09_11_08_04_05_06_07_03_06_12_09_10_15_15_10_13_07_15_02_05_06_01_03_04_12_07_11_03_12_02_04_16_07_06_05_06_03_04_08_13_14_05_01_01_02_03_04_05_15_12_07_12_09_13_06_14_11_04_18_15_21_20_19_23_01_01_11_14_07_09_12_13_22_06_08_02_16_17_10_25_27_04_24_28_07_05_10_08_13_15_01_09_07_11_10_05_06_02_03_04_13_09_10_11_03_01_02_07_06_10_05_07_08_11_15_01_13_05_05

0123456

Cluster Dendrogram

Height

クラスター1 クラスター2