• 検索結果がありません。

タグ付き形態素の使用率

第 6 章 宇野浩二の戦後作品の文体特徴に関する分析

6.6 トピックモデルの分析結果

6.6.2 タグ付き形態素の使用率

本節では、タグ付き形態素のデータに基づき、作品のグルーピングと各グループの特徴を 分析した結果を説明する。作品が各トピックに属する確率、各トピックにおける各変数(タ グ付き形態素の使用率)の確率をそれぞれ表6.22、表6.23に示す。変数が多いため、表6.23 では出現頻度の高い上位20項目の変数の各トピックにおける確率を示している。分析結果を 視覚化したものを図6.31に示す。

114

表6.22 作品が各トピックに属する確率

作品 病前 病後 戦後 作品 病前 病後 戦後

病前_歳月の川 0.93 0.04 0.03 病後_女人不信 0.58 0.37 0.04

病前_夢見る部屋 0.74 0.15 0.11 病後_人間往来 0.49 0.48 0.02 病前_子を貸し屋 0.34 0.01 0.65 病後_文学の鬼 0.23 0.74 0.03 病前_或る春の話 0.93 0.03 0.03 病後_夢の跡 0.35 0.58 0.07 病前_ぢゃんぽん廻り 0.92 0.06 0.02 病後_旅路の芭蕉 0.16 0.69 0.14 病前_従兄弟の公吉 0.75 0.19 0.06 病後_終の栖 0.29 0.28 0.44

病前_俳優 0.85 0.13 0.02 病後_風変りの一族 0.44 0.51 0.05

病前_心つくし 0.73 0.21 0.06 病後_夢の通ひ路 0.42 0.56 0.02

病前_東館 0.85 0.11 0.04 病後_鬼子と好敵手 0.33 0.59 0.08

病前_昔がたり 0.87 0.08 0.05 病後_母の形見の貯金箱 0.24 0.68 0.07

病前_古風な人情家 0.92 0.04 0.03 病後_楽世家等 0.30 0.68 0.02 病前_晴れたり君よ 0.60 0.09 0.31 病後_器用貧乏 0.16 0.14 0.70

病前_鼻提灯 0.87 0.09 0.04 病後_木と金の間 0.23 0.71 0.06

病前_浮世の窓 0.93 0.04 0.03 病後_善き鬼・悪き鬼 0.18 0.75 0.07

病前_思ひ出の記 0.92 0.06 0.02 病後_人間同志 0.17 0.51 0.32

病前_人癲癇 0.77 0.10 0.14 病後_女人往来 0.26 0.64 0.09

病前_千万老人 0.72 0.09 0.19 病後_二つの道 0.15 0.76 0.09

病前_如露 0.87 0.07 0.05 病後_身の秋 0.04 0.29 0.67 病前_人に問はれる 0.94 0.04 0.02 病後_水すまし 0.02 0.42 0.56

病前_十軒路地 0.92 0.06 0.02 戦後_青春期 0.02 0.25 0.72

病前_従兄弟同志 0.92 0.06 0.02 戦後_思ひ草 0.03 0.10 0.87 病前_足りない人 0.76 0.19 0.06 戦後_西方町の家 0.03 0.17 0.80

病前_高天ヶ原 0.94 0.04 0.02 戦後_思ひ川 0.01 0.19 0.80

病前_「木からおりてください」 0.93 0.05 0.02 戦後_富士見高原 0.02 0.10 0.87 病前_軍港進行曲 0.89 0.07 0.04 戦後_秋の心 0.02 0.06 0.92

病前_日曜日 0.65 0.14 0.21 戦後_うつりかはり 0.04 0.09 0.88

病前_続軍港行進曲 0.89 0.08 0.02 戦後_自分一人 0.01 0.02 0.97

病前_恋の躯 0.93 0.05 0.03 戦後_相思草 0.02 0.13 0.85

病後_枯木のある風景 0.22 0.64 0.14 戦後_大阪人間 0.04 0.51 0.45 病後_枯野の夢 0.60 0.17 0.23 戦後_寂しがり屋 0.09 0.74 0.17

病後_子の来歴 0.73 0.24 0.03 戦後_友垣 0.12 0.72 0.17

病後_湯河原三界 0.52 0.44 0.04 戦後_自分勝手屋 0.05 0.74 0.21 病後_人さまざま 0.69 0.24 0.07 戦後_人間同志 0.11 0.35 0.54

病後_線香花火 0.71 0.25 0.04

115

表6.23 各トピックにおける各変数の確率(上位20項目)

タグ付き形態素 病前 病後 戦後 タグ付き形態素 病前 病後 戦後 /助詞 0.052 0.033 0.048 その/連体詞 0.010 0.013 0.016

/助詞 0.043 0.042 0.045 から/助詞 0.011 0.013 0.014

を/助詞 0.037 0.039 0.038 い/動詞 0.010 0.007 0.009

/助詞 0.036 0.043 0.037 /名詞 0.013 0.007 0.006

/記号 0.036 0.033 0.037 /助動詞 0.010 0.008 0.008

と/助詞 0.035 0.032 0.031 いる/動詞 0.009 0.007 0.008 /助動詞 0.014 0.024 0.014 よう/名詞 0.009 0.007 0.008 /助詞 0.017 0.016 0.014 /代名詞 0.018 0.001 0.000 し/動詞 0.015 0.015 0.016 こと/名詞 0.010 0.001 0.005

/助詞 0.016 0.013 0.014 /名詞 0.004 0.008 0.007

図6.31によると、タグ付き形態素の使用では、作品は発表の時期の通りにきれいにグルー ピングされていない。そのうち、病後の 7 編の作品は病前のグループ、4 編の作品は戦後の グループに分類された。病前のグループに分類された7編の作品は、すべて復帰直後の1933 年と1934年に発表されたものである。また、病前の「子を貸し屋」(1923年)が戦後、戦後 の「大阪人間」(1951年)、「寂しがり屋」(1952年)、「友垣」(1953年)、「自分勝手屋」(1957 年)は病後のグループに分類された。

図6.31 タグ付き形態素の使用率に基づいた作品のグルーピングと各グループの特徴的変数

_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 西_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

02468

Cluster Dendrogram

Height

し 動詞/ も 助詞/ で 助詞/ 私 代名詞/ と 助詞/ が 助詞/

。 記号/ を 助詞/ は 助詞/ て 助詞/

病前

0.00 0.01 0.02 0.03 0.04 0.05

も 助詞/ で 助動詞/ し 動詞/ その 連体詞/ と 助詞/ が 助詞/

。 記号/ を 助詞/ は 助詞/ て 助詞/

戦後

0.00 0.01 0.02 0.03 0.04

その 連体詞/ し 動詞/ で 助詞/ で 助動詞/ と 助詞/ て 助詞/

。 記号/ を 助詞/ は 助詞/ が 助詞/

病後

0.00 0.01 0.02 0.03 0.04

116

棒グラフでは、3 つの時期の重要な項目としてリストアップされている変数がほとんど助 詞である。それ以外に、病前の独特の特徴として、代名詞の「私」が挙げられる。3 つのト ピックでオーバーラップした読点、助詞「の」、「に」と助動詞「た」を除き、助詞「て」、「が」、

「は」、「を」が特徴的項目として挙げられる。

そこで、作品における「て」、「が」、「は」、「を」の使用率の経年変化を図6.32の散布図に よって考察を行う。病前では、各項目の使用率が比較的安定しているが、病後ではすべて減 少する傾向を示し、戦後になると、安定するようになった。「が」と「を」の変化は、やや先 に現れている。

図6.32 各トピックの重要項目の使用率の経年変化

また、名詞、動詞と形容詞を除いて分析した結果をそれぞれ表6.24、表6.25と図6.33に示 す。図6.33からわかるように、病前、病後と戦後の作品はある程度グルーピングされている が、病後の8編の作品は戦後、「日曜日」を含む病前の5編の作品は病後に分類された。病前 の「子を貸し屋」という作品は戦後のグループに入っている。

0.0200.0250.0300.0350.0400.045

使 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 西_ _ _ _ _ _ _ _ _ _ _ _

0.0200.0250.0300.0350.0400.045

使 0.0200.0250.0300.0350.0400.045 使 0.0200.0250.0300.0350.0400.045

使

て 助詞/ が 助詞/ は 助詞/ を 助詞/

117

表6.24 作品が各トピックに属する確率(名詞、動詞、形容詞を除く)

作品 病前 病後 戦後 作品 病前 病後 戦後

病前_歳月の川 0.70 0.21 0.09 病後_女人不信 0.23 0.57 0.19

病前_夢見る部屋 0.51 0.19 0.30 病後_人間往来 0.07 0.82 0.11 病前_子を貸し屋 0.21 0.15 0.64 病後_文学の鬼 0.06 0.61 0.33 病前_或る春の話 0.50 0.31 0.18 病後_夢の跡 0.08 0.69 0.23 病前_ぢゃんぽん廻り 0.40 0.50 0.10 病後_旅路の芭蕉 0.03 0.47 0.51 病前_従兄弟の公吉 0.38 0.41 0.21 病後_終の栖 0.10 0.40 0.49

病前_俳優 0.61 0.32 0.07 病後_風変りの一族 0.08 0.71 0.21

病前_心つくし 0.35 0.41 0.24 病後_夢の通ひ路 0.05 0.78 0.17

病前_東館 0.57 0.33 0.09 病後_鬼子と好敵手 0.04 0.54 0.41

病前_昔がたり 0.61 0.26 0.13 病後_母の形見の貯金箱 0.21 0.42 0.37

病前_古風な人情家 0.68 0.23 0.10 病後_楽世家等 0.03 0.66 0.31 病前_晴れたり君よ 0.49 0.16 0.35 病後_器用貧乏 0.03 0.30 0.67

病前_鼻提灯 0.47 0.41 0.12 病後_木と金の間 0.03 0.52 0.45

病前_浮世の窓 0.71 0.24 0.05 病後_善き鬼・悪き鬼 0.07 0.52 0.41

病前_思ひ出の記 0.68 0.25 0.06 病後_人間同志 0.02 0.24 0.74

病前_人癲癇 0.43 0.31 0.26 病後_女人往来 0.04 0.56 0.41

病前_千万老人 0.44 0.27 0.30 病後_二つの道 0.04 0.43 0.53

病前_如露 0.72 0.19 0.09 病後_身の秋 0.03 0.09 0.89 病前_人に問はれる 0.62 0.34 0.04 病後_水すまし 0.03 0.06 0.91

病前_十軒路地 0.64 0.29 0.07 戦後_青春期 0.02 0.06 0.92

病前_従兄弟同志 0.66 0.27 0.07 戦後_思ひ草 0.01 0.07 0.93 病前_足りない人 0.36 0.42 0.22 戦後_西方町の家 0.03 0.07 0.89

病前_高天ヶ原 0.64 0.26 0.09 戦後_思ひ川 0.01 0.04 0.95

病前_「木からおりてください」 0.52 0.39 0.08 戦後_富士見高原 0.02 0.05 0.93 病前_軍港進行曲 0.62 0.28 0.10 戦後_秋の心 0.03 0.08 0.90

病前_日曜日 0.24 0.50 0.27 戦後_うつりかはり 0.01 0.06 0.93

病前_続軍港行進曲 0.67 0.26 0.07 戦後_自分一人 0.01 0.01 0.98

病前_恋の躯 0.82 0.10 0.08 戦後_相思草 0.02 0.08 0.90

病後_枯木のある風景 0.07 0.42 0.52 戦後_大阪人間 0.02 0.06 0.93 病後_枯野の夢 0.04 0.53 0.43 戦後_寂しがり屋 0.14 0.07 0.79

病後_子の来歴 0.20 0.72 0.08 戦後_友垣 0.16 0.09 0.75

病後_湯河原三界 0.17 0.68 0.15 戦後_自分勝手屋 0.03 0.16 0.81 病後_人さまざま 0.20 0.63 0.17 戦後_人間同志 0.12 0.20 0.69

病後_線香花火 0.18 0.66 0.16

118

表6.25 各トピックにおける各変数の確率(名詞、動詞、形容詞を除いた上位20項目)

タグ付き形態素 病前 病後 戦後 タグ付き形態素 病前 病後 戦後 /助詞 0.105 0.079 0.090 から/助詞 0.019 0.024 0.028 /助詞 0.074 0.091 0.089 /助動詞 0.020 0.015 0.017 を/助詞 0.061 0.084 0.079 私/代名詞 0.067 0.000 0.000 /助詞 0.052 0.095 0.076 ある/助動詞 0.013 0.011 0.012

/記号 0.064 0.074 0.073 あっ/助動詞 0.000 0.018 0.013 と/助詞 0.057 0.079 0.061 それ/代名詞 0.013 0.012 0.009 /助動詞 0.022 0.039 0.036 ない/助動詞 0.015 0.011 0.009

/助詞 0.031 0.036 0.029 /助詞 0.015 0.011 0.007

も/助詞 0.031 0.027 0.029 『』/記号 0.000 0.002 0.019 その/連体詞 0.016 0.023 0.032 という/助詞 0.008 0.012 0.010

図6.33 名詞、動詞、形容詞を除いた作品のグルーピングと各グループの特徴的変数

さらに、棒グラフからわかるように、名詞、動詞と形容詞を除いても、各トピックで重要 とされる変数が大きく変わっていない。助詞の「て」、「が」、「は」、「を」と代名詞の「私」

の使用率の経年変化を図6.34に示す。

_ _ _ _ _ _ _ _ _ _ _ 西_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

02468

Cluster Dendrogram

Height

も 助詞/ で 助詞/ その 連体詞/ で 助動詞/ と 助詞/

。 記号/ が 助詞/ を 助詞/ は 助詞/ て 助詞/

戦後

0.00 0.02 0.04 0.06 0.08

で 助動詞/ で 助詞/ も 助詞/ が 助詞/ と 助詞/ を 助詞/

。 記号/ 私 代名詞/ は 助詞/ て 助詞/

病前

0.00 0.02 0.04 0.06 0.08 0.10

から 助詞/ も 助詞/ で 助詞/ で 助動詞/

。 記号/ と 助詞/ て 助詞/ を 助詞/ は 助詞/ が 助詞/

病後

0.00 0.02 0.04 0.06 0.08