• 検索結果がありません。

第 7 章 宇野浩二と同時代の作家との比較分析

7.7 形態素タグの n-gram (n=1, 2)

7.7.1 形態素タグの unigram

各作家の作品で使用されている品詞及び記号の構成率を考察するために、形態素解析済み の作品から形態素タグの unigram のデータを抽出し、対応分析と階層的クラスター分析を行 う。形態素タグのunigramのデータには、合計12個の変数がある。作家ごとの各変数の総度 数を表7.8に示し、詳細なデータを付録7.4に示す。

表7.8 作家ごとの各変数の総度数(上位10項目)

作家 助詞 名詞 動詞 記号 助動

副詞 代名

形容

連体

接続

接頭

感動 病前 105,676 86,539 44,318 37,687 32,947 8,269 12,535 4,262 5,680 3,835 889 117 病後 102,913 101,416 42,647 44,678 30,269 6,980 5,666 4,249 5,895 3,130 1,333 103 戦後 113,232 108,975 48,395 77,720 32,118 9,246 4,123 5,351 7,211 5,443 1,675 125 三島 63,149 58,712 30,585 21,875 20,219 4,438 4,828 4,026 2,762 1,252 645 22 中島 44,715 44,871 20,325 17,200 13,911 4,029 3,304 2,581 1,873 1,189 681 29 井伏 21,932 21,326 10,458 6,687 6,727 1,272 1,223 881 866 392 475 7 坂口 47,298 43,987 22,357 15,974 15,529 4,028 3,718 2,666 1,760 1,305 456 114 70,307 53,000 34,236 20,554 20,275 8,237 9,711 3,516 5,247 2,335 1,043 61 太宰 30,291 27,025 15,436 15,200 11,048 3,426 2,833 2,452 1,357 891 599 144 室生 41,751 34,812 22,128 12,969 14,395 3,970 3,223 3,391 1,808 901 481 50 岡本 27,263 22,770 12,720 8,048 7,851 2,203 1,584 1,502 1,195 405 667 7 島崎 276,472 260,888 122,052 71,678 70,347 15,932 13,166 14,221 12,398 3,328 6,602 77 川端 101,633 93,287 46,319 38,069 32,661 5,517 3,080 5,917 2,763 2,265 982 55 徳田 143,366 122,605 70,662 43,522 41,962 10,612 6,130 8,310 4,428 1,685 5,145 31 横光 134,826 117,791 66,319 35,251 39,267 10,326 8,260 6,115 3,926 3,695 1,603 108

正宗 14,029 11,603 6,668 4,260 3,991 720 617 772 373 199 200 5

永井 47,959 46,891 22,152 11,608 11,942 3,682 1,584 2,637 1,497 625 1,002 38 江戸川 77,288 74,153 36,094 32,471 25,665 7,225 4,651 4,595 3,210 1,789 1,006 116 33,715 35,204 14,366 18,332 9,164 2,636 865 2,140 1,245 721 1,173 113 海野 107,314 106,780 52,094 42,407 37,574 10,561 6,260 5,481 5,024 3,294 1,598 326 織田 94,602 89,226 47,129 36,680 33,257 9,560 4,297 5,304 3,385 3,152 1,411 173 菊池 88,611 79,132 42,605 41,046 28,427 6,835 4,099 5,824 2,613 2,083 884 59

7.7.1.1 対応分析

形態素タグのunigramのデータを用いて対応分析を行い、第1 と第2個体スコアの散布図 とバイプロットをそれぞれ図7.21と図7.22に示す。第1スコアと第2スコアの寄与率はそれ

ぞれ37.08%、28.47%である。宇野浩二の病前と病後の作品は他の作家の作品と重なっている

が、戦後の作品はやや離れていることが読み取れる。病前の作品は、主に堀辰雄の作品と重 なり、病後の作品は、泉鏡花、菊池寛の作品と重なっている。

151

図7.21 形態素タグのunigramに基づいた対応分析の個体スコアのプロット

図7.22 形態素タグのunigramに基づいた対応分析のバイプロット

-0.4 -0.2 0.0 0.2 0.4 0.6

-0.4-0.20.00.20.4

CA factor map

Dim1(37.08%)

Dim2(28.47%)

.

三島_01 三島_02三島_03 三島_04 三島_05

三島_06

三島_07 三島_08

三島_09 三島_10

三島_11 三島_12

三島_13 三島_14

三島_15 中島_01

中島_02 中島_03 中島_04 中島_05

中島_06 中島_07

中島_08 中島_09

中島_10

中島中島_11_12 中島_13

中島_14 中島_15 井伏_01

井伏_02

井伏井伏_03_04 井伏_05

井伏_06 井伏_07

井伏_08 井伏_09

井伏_10 井伏_11 井伏_12

井伏_13 井伏_14 井伏_15

坂口_01

坂口坂口_02_03

坂口_04 坂口_05 坂口_06 坂口_07

坂口_08

坂口_09 坂口_10 坂口_11

坂口_12

坂口_13 坂口_14

坂口_15 _01 _02

_03 _04

_05 _06

_07

_08 _09

_10 _11

_12 _13

_14 _15

太宰_01 太宰_02

太宰_03 太宰_04 太宰_05

太宰_06 太宰_07

太宰_08 太宰_09

太宰_10 太宰_11 太宰_12 太宰_13

太宰_14 太宰_15 室生_01

室生_02室生_03

室生_04 室生_05 室生_06

室生_07 室生_08

室生_09 室生室生_10_11

室生_12 室生_13 室生_14 室生_15

岡本_01 岡本_02 岡本_03

岡本_04 岡本_05

岡本_06

岡本_07 岡本_08 岡本_09 岡本_10 岡本_11

岡本_12 岡本_13

岡本_14 岡本_15 島崎_01 島崎_02島崎_03

島崎_04 島崎_05 島崎_06

島崎_07 島崎_08

島崎_09 島崎_10 島崎_11

島崎_12 島崎_13

島崎_14 島崎_15 川端_01

川端_02 川端_03

川端_04 川端_05 川端_06

川端_07

川端川端_08川端_11_10 川端_09 川端_12

川端_13

川端_14 川端_15

徳田_01 徳田_02

徳田_03 徳田_04 徳田_05 徳田_06

徳田_07

徳田_08

徳田_09 徳田_10 徳田_11

徳田_12 徳田_13

徳田徳田_14_15 横光_01

横光_02 横光_03 横光_04 横光_05

横光_06 横光_07

横光_08

横光_09 横光_10

横光_11 横光_12 横光_13 横光_14

横光_15 正宗_01

正宗_02 正宗_03 正宗_04 正宗_05

正宗_06 正宗_07

正宗_08 正宗_09 正宗_10

正宗_11 正宗_12

正宗_13

正宗_14 正宗_15

永井_01 永井_02永井_03

永井_04 永井_05

永井_06

永井永井_07_08永井_09 永井_10 永井_11

永井_12 永井_13

永井_14 永井_15

江戸川_01 江戸川_02 江戸川_03

江戸川_04 江戸川_05 江戸川_06 江戸川_07

江戸川_08

江戸川_09 江戸川_10 江戸川_11

江戸川_12

江戸川_13 江戸川_14 江戸川_15

_01 _02 _03 _04_05

_06 _07 _08

_09 _10 _11

_12 _13 _14 _15 海野_01 海野_02

海野_03

海野_04 海野_05 海野_06

海野_07

海野_08 海野_09

海野_10 海野_11 海野_12 海野_13

海野_14 海野_15 織田_01

織田_02 織田_03 織田_04

織田_05 織田_06

織田_07

織田_08 織田_09 織田_10

織田_11 織田_12 織田_13織田_14

織田_15 菊池_01菊池_02

菊池菊池_03_04 菊池_05

菊池_06

菊池_07 菊池_08

菊池_09 菊池_10 菊池_11 菊池_12

菊池_13 菊池_14 菊池_15

△△

++ ++

++ +

+ +

+ + + + +

++ + +++

+

+ + ×+ +

× ×× ××

× ×

× ×

××

×

×

+

× 病前 病後 戦後

-0.4 -0.2 0.0 0.2 0.4 0.6

-0.4-0.20.00.20.4

CA factor map

Dim 1 (37.08%)

Dim 2 (28.47%)

病前_01 病前_02

病前_03 病前_04

病前_05 病前_06 病前_07

病前_08 病前_09 病前_10 病前_11

病前_12

病前_13 病前_14

病前_15 病前病前_16_17 病前_18

病前_19 病前_20 病前_21

病前_22 病前_23病前病前_24_25

病前_26 病前_27

病前_28

病後_01 病後_02 病後_03

病後_04 病後_05

病後_06 病後_07

病後_08 病後_09 病後_10

病後_11 病後_12 病後_13 病後_14

病後_15 病後_16 病後病後病後病後_17_19_18_20

病後_21 病後_22 病後_23病後_24

病後_25 戦後_01

戦後戦後戦後_02_04_03 戦後戦後_06_05 戦後_07 戦後_08 戦後戦後_09_10

戦後_11 戦後_12

戦後_13 戦後_14

三島_01 三島三島三島_02_04_03 三島_05

三島_06

三島三島_07_08 三島_09 三島_10

三島_11 三島_12

三島_13 三島_14

三島_15 中島_01

中島_02 中島_03 中島_04 中島_05

中島_06 中島_07

中島_08 中島_09

中島_10

中島中島_11_12 中島_13

中島_14 中島_15 井伏_01 井伏_02

井伏井伏_03_04 井伏_05

井伏_06 井伏_07

井伏_08 井伏_09

井伏_10 井伏_11 井伏_12

井伏_13 井伏_14 井伏_15 坂口_01 坂口坂口_02_03

坂口_04 坂口_05 坂口_06 坂口_07

坂口_08

坂口_09 坂口_10 坂口_11

坂口_12

坂口_13 坂口_14

坂口_15 _01 _02

_03 _04

_05 _06

_07

_08 _09

_10 _11

_12 _13

_14 _15

太宰_01 太宰_02

太宰_03 太宰_04 太宰_05

太宰_06 太宰_07

太宰_08 太宰_09 太宰_10 太宰_11 太宰_12 太宰_13

太宰_14 太宰_15 室生_01

室生室生_02_03

室生_04 室生_05室生_06

室生_07 室生_08

室生_09 室生室生_10_11

室生_12 室生_13 室生_14 室生_15

岡本_01 岡本_02 岡本岡本_03_04 岡本_05

岡本_06

岡本_07 岡本_08 岡本_09 岡本_10

岡本_11

岡本_12 岡本_13

岡本_14 岡本_15 島崎_01 島崎_02島崎_03

島崎_04 島崎_05 島崎_06

島崎_07 島崎島崎_08_09 島崎_10 島崎_11

島崎_12 島崎_13

島崎_14 島崎_15 川端_01

川端_02 川端_03

川端_04川端_05 川端_06

川端_07

川端川端川端_08_11_10川端_09 川端_12

川端_13

川端_14 川端_15

徳田_01 徳田_02 徳田_03 徳田_04 徳田_05 徳田_06

徳田_07

徳田_08

徳田_09 徳田_10徳田_11

徳田_12 徳田_13

徳田徳田_14_15 横光_01

横光_02 横光_03 横光_04 横光_05

横光_06 横光_07

横光_08

横光_09 横光_10

横光_11 横光_12 横光_13横光_14

横光_15 正宗_01

正宗_02 正宗_03 正宗_04 正宗_05

正宗_06 正宗_07

正宗_08 正宗_09 正宗_10

正宗_11 正宗_12 正宗_13

正宗_14 正宗_15

永井_01 永井_02永井_03

永井_04 永井_05

永井_06 永井永井_07永井_08_09

永井_10 永井_11

永井_12 永井_13

永井_14 永井_15

江戸川_01 江戸川_02 江戸川_03

江戸川_04 江戸川_05 江戸川_06 江戸川_07

江戸川_08 江戸川_09

江戸川_10 江戸川_11

江戸川_12 江戸川_13 江戸川_14 江戸川_15

_01 _02

_03 _04_05

_06 _07 _08

_09 _10 _11

_12 _13 _14 _15 海野_01 海野_02

海野_03

海野_04 海野_05 海野_06

海野_07

海野_08 海野_09

海野_10 海野_11 海野_12 海野_13

海野_14 海野_15 織田_01

織田_02 織田_03 織田_04

織田_05 織田_06

織田_07

織田_08 織田_09 織田_10

織田_11織田_12 織田織田_13_14 織田_15

菊池菊池_01_02 菊池_03

菊池_04 菊池_05

菊池_06 菊池_07 菊池_08

菊池_09 菊池_10 菊池_11 菊池_12

菊池_13 菊池_14 菊池_15 助詞

名詞 動詞

助動詞 記号 副詞 代名詞

形容詞 連体詞

接続詞

接頭辞

感動詞

152

図7.22のバイプロットに基づいて、変数と作品の対応関係を考察する。散布図の上側に位 置している病前の作品、堀辰雄などの作品では、代名詞の使用が類似している。横軸の正の 方向にプロットされている病後の作品、菊池寛、泉鏡花、太宰治などの作品では、記号の多 用が特徴である。

7.7.1.2 階層的クラスター分析

形態素タグのunigramのデータを用いてクラスター分析した結果を図7.23に示す。宇野浩 二の作品が含まれているクラスター1と2を拡大し、それぞれ図7.24と図7.25に示す。

図7.24 形態素タグのunigramのクラスター分析の結果(クラスター1)

図7.25 形態素タグのunigramのクラスター分析の結果(クラスター2)

図7.24からわかるように、宇野浩二の病前の作品からなるクラスターは、堀辰雄のクラス ターと融合している。図7.25では、宇野浩二の病後の一部の作品は菊池寛、海野十三、川端 康成と織田作之助の作品と類似し、1 つの大きなクラスターを形成している。戦後の作品の クラスターは、泉鏡花の作品のクラスターと融合している。

0.00.10.20.30.40.5

Lower tree

_05 _05 _07 _01 _02 _06 _01 _03 _10 _05 _07 _10 _01 _02 _11 _15 _01 _13 _10 _11 _25 _27 _08 _07 _09 _19 _23 _18 _15 _21 _16 _17 _06 _22 _02 _08 _26 _06 _28 _24 _06 _07 _05 _10 _01 _07 _11 _04 _09 _05 _08 _15 _13 _15 _02 _11 _14 _03 _01 _05 _12 _06

0.00.20.40.60.81.01.2

Lower tree

_06 _11 _14 _12 _13 _03 _14 _15 _10 _13 _09 _04 _11 _05 _08 _10 _09 _13 _16 _12 _11 _18 _02 _09 _15 _22 _01 _17 _10 _19 _20 _05 _03 _11 _03 _06 _02 _04 _02 _09 _13 _01 _09 _12 _10 _15 _07 _14 _15 _15 _07 _12 _03 _04 _10 _01 _05 _06 _09 _13 _21 _08 _15 _11 _02 _14 _08 _05 _06 _11 _12 _13 _23 _14 _25 _03 _07 _24 _02 _09 _10 _01 _04

153

図7.23 形態素タグのunigramのクラスター分析の結果

_03_08_11_11_12_09_10_03_12_01_02_05_04_05_10_15_12_03_15_13_07_07_06_07_03_10_04_12_10_07_08_09_06_11_10_15_03_06_02_13_08_13_14_04_01_07_12_10_03_09_05_05_07_01_02_06_01_03_10_05_07_10_01_02_11_15_01_13_10_11_25_27_08_07_09_19_23_18_15_21_16_17_06_22_02_08_26_06_28_24_06_07_05_10_01_07_11_04_09_05_08_15_13_15_02_11_14_03_01_05_12_06_06_11_14_12_13_03_14_15_10_13_09_04_11_05_08_10_09_13_16_12_11_18_02_09_15_22_01_17_10_19_20_05_03_11_03_06_02_04_02_09_13_01_09_12_10_15_07_14_15_15_07_12_03_04_10_01_05_06_09_13_21_08_15_11_02_14_08_05_06_11_12_13_23_14_25_03_07_24_02_09_10_01_04_01_04_05_03_10_14_09_06_14_11_01_04_02_03_14_11_04_03_01_09_01_02_04_08_12_14_01_06_12_14_15_10_05_11_12_13_12_05_13_11_05_08_03_04_03_04_04_20_05_09_06_13_05_14_12_08_06_07_07_10_11_13_09_10_13_04_08_09_13_07_11_13_05_06_08_05_12_06_15_04_11_13_11_01_14_06_02_07_12_02_03_01_03_09_07_04_07_05_15_12_14_06_08_02_06_01_04_02_09_02_08_08_07_05_07_08_15_01_02_03_09_12_14_15_10_14_02_04_08_13_14_02_04_12_08_15_14_02_08_01_06_12_14_13_09_10_14_09_04_15_14_03_07_08_11_13_15

01234

Cluster Dendrogram

Height

クラスター1

クラスター2