• 検索結果がありません。

漢字の形における統計則

N/A
N/A
Protected

Academic year: 2021

シェア "漢字の形における統計則"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

漢字の形における統計則

著者 太田 守洋, 山本 健

雑誌名 言語資源活用ワークショップ発表論文集

巻 4

ページ 149‑154

発行年 2019

URL http://doi.org/10.15084/00002563

(2)

漢字の形における統計則

太田 守洋

(

琉球大学大学院 理工学研究科

)

山本 健

(

琉球大学 理学部

)

Statistical Law Related to Shape of Kanji

Morihiro Ohta (Graduate Sch. of Eng. and Sci., Univ. of Ryukyus) Ken Yamamoto (Fac. of Sci., Univ. of Ryukyus)

要旨

本研究では漢字の形を統計的に分析する。漢字のサイズを特徴づける基本的な指標として画 数があり、画数が多い漢字ほど複雑な形である傾向がある。一方、漢字を構成する線の長さが 形の複雑性を表すとみなすことができる。本研究では、漢字の線長をコンピュータのフォント を用いて計測し、線長と画数の関係を調べた。その結果、漢字の線長は画数に対しておおむね ベキ乗則にしたがって増加することがわかった。さらに、フラクタル図形を基にした数学的な モデルを導入し、ベキ乗則の指数とフラクタル次元の関係を理論的に導出した。この関係を漢 字のベキ指数に適用すると、フラクタル次元はおよそ

2

次元となった。すなわち、漢字の形は 画数の増加とともに平面充填的に複雑化するといえる。

1.

言語とベキ乗則

言語についての様々な統計則がベキ乗則

(1)

で表される。その中でも有名なものとして

Zipf

の法則がある。ある文章において出現する単語を出現頻度によって順位付けしたとき、順位

r

の単語の出現頻度

f

r

に反比例するという経験則が

Zipf

の法則である。つまり出現頻度と 順位の間に

fr 1

というベキ乗則が成り立つ

(Zipf 2013)

。他にも、ある文章において文書 量が増えるとともに、語彙量がベキ乗則に従って増えることを表した

Heaps

の法則や、文書 を一定の単語数ごとに区切ったとき、ある単語が各々の区間に現れる数の平均と標準偏差にベ キ乗則が現れるという

Taylor

の法則などがある

(

田中久美子

2018)

一般に、ベキ乗則とは

2

つの変数

x

および

y

の間に、

yx α

は定数

)

という関係が成り立つということである。すなわち、

y

x

α

乗に比例するということであ る。ベキ乗則に従うデータを両対数グラフにプロットすると、

ln y = α ln x + C (C

は定数

)

となるので、データは直線上に並び、その傾きは

α

である。また、

x

を測る物差しの目盛を

m

[email protected]

(1)

助動詞の「べき」と区別しやすくするため、ベキ乗則の「ベキ」はカタカナで表記する。

(3)

倍して

mx

としても

y ∝ (mx) αx α

となって、比例定数を除いて関数形は変わらない。つまり、ベキ乗則に従う現象は拡大や縮小 に対して不変な性質、スケール不変性を持っている。

2.

漢字の画数と線長の関係

漢字には形・音・義という三要素があると言われているが、本研究では漢字の

の複雑性 に注目する。漢字にはサイズを特徴づける基本的な指標として画数があり、画数が多い漢字ほ ど複雑な形である傾向がある。一方で漢字は全て線で構成されているため、線の長さの和(以 下では単に線長とよぶ)はその漢字の形の複雑性を表すとみることができる。そこで本研究で は、漢字の線長と画数の関係について分析する。なお、本研究の詳細は

Ohta and Yamamoto (2019)

で述べられている。

2.1

常用漢字と

JIS

漢字

本研究では、常用漢字

2136

字と

JIS

1

水準および第

2

水準漢字

(

以下、

JIS

漢字

よぶ

) 6355

字を分析に用いた。各漢字の画数はオンラインのデータベース『

Joyo Kanji

(KeitarouNakayama 2015)

および『漢字辞典オンライン』を利用した。

常用漢字とは、「法令、公用文書、新聞、雑誌、放送など、一般の社会生活において、現代の 国語を書き表す場合の漢字使用の目安」

(

文化庁

2010)

として内閣告示によって定められた漢 字である。現行の常用漢字は

2010

年に改定され、

2136

字からなる。

JIS

漢字コードはコンピュータ等のデジタル機器でデータを通信するために、日本工業規格

(JIS; Japanese Industrial Standards)

で定められた文字コードである。現在では、

JIS

1

水 準から第

4

水準まで定められている。本研究では、

JIS

1

水準および第

2

水準の

6355

(2)

JIS

漢字と呼ぶことにする。

なお、常用漢字のうち

2102

字は

JIS

1

水準であるが、

など

30

字は

JIS

2

水準であり、

𠮟

”, “

”, “

”, “

4

字は

JIS

3

水準である

(3) (

安岡孝一・安岡素子

2017)

。そのため、本研究の

JIS

漢字は常用漢字を完全に包含しているわけではない。

2.2

線長の測定法

本研究では、コンピュータフォント

MS

ゴシックを用いて線長を測定する。コンピュータで は線長を直接測定することが難しい。そこで、以下の方法で線長を計算した。まず漢字を縦横

100

ピクセル四方の

2

値画像として出力し、黒いピクセルの数を数えることでその漢字の面積 を測定する。図

1 (a)

20 × 20

を出力した例である。次に、各行各列で黒いピクセ ルが連続していくつ並んでいるのかを数えていく。例えば、図

1 (a)

の下から

3

段目では

“4,

1, 3”

となる。線の長さにあたる黒ピクセルの長さは、筆画ごとに値が変わる。一方で、

MS

シックは一つの文字の中で線幅がほぼ一定であるため、その線幅にあたる黒ピクセルの長さは

(2)

この

6355

字は

JIS X 0208

という規格に当たる。のちに

JIS

3

水準および第

4

水準を追加した

JIS X 0213

という規格が定められた。

(3) JIS

1

水準に代わりとして

”, “

”, “

”, “

4

字が示されている。

(4)

(a) !

"#

$% $

&%'"%'!

$

! (

$

$

!

"

$

!

(b)

1

漢字の線幅の測定法の例。

(a) 20 × 20

で出力した

と連続して並んだ黒いピクセル数の例。

(b) (a)

の連続した黒いピクセルの長さのヒストグラム。

ほとんど一定になる。よって、線幅にあたる長さは線長にあたる長さより圧倒的に多く出現す るはずである。したがって、図

1 (b)

のように連続した黒いピクセルの長さのヒストグラムを 描くと、最頻値がその漢字の線幅として推定される。例えば、図

1

では、線幅は

3

と推 定することができる。漢字の線長は、面積を線幅で割れば求めることができる。なお、線幅は 字によって異なるため、線幅の推定と線長の計算はそれぞれの漢字について行う必要がある。

2.3

結果

2

(a)

常用漢字

2136

字および

(b) JIS

漢字

6355

字について、線長と画数の関係を両対 数目盛でプロットしたグラフである。線長は

2

値画像の

1

辺の長さが

1

になるように規格化し ている。各画数の平均線長

l

は画数

s

が増えるに従って、おおむねベキ乗則で増加しているこ とがわかる

:

ls β . (1)

そのベキ指数

β

は、常用漢字で

β = 0.47, JIS

漢字で

β = 0.52

0.5

に近い値をとる。

(a) (b)

2 (a)

常用漢字

2136

字および

(b)JIS

漢字

6355

字についての線長と画数の関係。丸い点は各漢字の データを示し、四角い点は各画数での平均線長を示している。実線は平均線長のベキ乗則を表したもので あり、そのベキ指数は

(a)

常用漢字で

β = 0.47, (b)JIS

漢字で

β = 0.52

である。

(5)

3 Sierpinski gasket.

フラクタル次元は約

1.59

である。

3.

フラクタルを基にしたモデル化

3.1

フラクタルとは

フラクタルとは図形の一部を拡大すると図形全体と一致すると いう性質(自己相似性)を持つ図形のことである

(

詳しくは本田 勝也

(2002)

等を参照

)

。例えば、図

3

Sierpinski gasket

では、

上半分の正三角形を

2

倍に拡大すると全体と一致する。フラクタ ルはフラクタル次元という非整数の次元を持つ。フラクタル次元 の定義は何通りかあるが、ここでは相似次元という次元を紹介す

る。正方形の

1

辺の長さを

1/2

倍にすると、その

1/2

倍の正方形を

4 (= 2 2 )

個並べるともと の正方形と一致する。また、立方体の

1

辺の長さを

1 / 2

倍にすると、その

1 / 2

倍の立方体を

8 (= 2 3 )

個並べるともとの立方体と一致する。正方形は

2

次元、立方体は

3

次元の図形であ

り、これらの次元が指数に現れている。この結果を拡張し、ある図形の

1

辺の長さを

r

倍にし たとき、その縮小した図形を

N

個並べるともとの大きさに戻るのであれば、

N = ! 1 r

" D

によって相似次元

D

を定義する。すなわち、図形の縮小倍率

r

と個数

N

の間にベキ乗則が成 り立ち、そのベキ指数が次元

D

に対応する。これを

D

について解くと、

D = ln N ln (1 /r )

となる。一般に、この次元

D

は整数とは限らない。例えば、図

3

Sierpinski gasket

1/2

倍 にした図形を

3

つ並べるともとの大きさに戻るので、そのフラクタル次元は

D = ln 3/ ln 2 ≈ 1.59

である。

3.2

モデル化

(1)

のベキ乗則を説明するために、フラクタルを基にしたモデルを導入する。このモデル は

1

ステップごとに三角形を追加していく。まず

n = 0

のとき

,

4

左のように

1

辺の長さ が

L

の正三角形を描く。このとき、各線分を

1

画で描くことにすると画数は

s 0 = 3,

線長は

l 0 = 3L

である。次に

n = 1

で、図

4

中央のように正三角形の中に

1

辺の長さが

L/2

の正三 角形を追加する。画数と線長はそれぞれ

s 1 = s 0 + 3 1 = 6, l 1 = l 0 + (3/2) 1 L = 9L/2

になる。

n = 2

では、さらに

1

辺の長さが

L/4

の正三角形が

3

つ加えられ、画数は

s 2 = s 1 + 3 2 = 15,

線長は

l 2 = l 1 + (3/2) 2 L = 27L/4

となる。この操作を

n

回繰り返したとき、画数

s n

と線長

l n

はそれぞれ

s n = s n − 1 + 3 n , l n = l n − 1 + ! 3 2

" n

L

という漸化式で表すことができ、その解は

s n = 3 +

# n i=1

3 i = 3

2 (3 n + 1) (2)

(6)

! …

n = 0 n = 1

s 0 = 3 s 1 = 3 + 3 1 l 0 = 3L l 1 = 3L +

✓ 3 2

◆ 1

<latexit sha1_base64="dbtxUILP9YzcL4MNGiGAo4S+3OM=">AAACyHichVHLahRBFD1pX3F8ZNSN4KZwyDAiDLczgiKIATciWeThJIF00nSXNZMmNd1Nd83I2MzGpT8gwY0KIuJnuDEf4CKfIC5cRFDBhbcfIBrUW1TXqXPuuXWr2o91kBqi/SnryNFjx09Mn6ydOn3m7Ez93PnVNBomUnVlpKNk3fdSpYNQdU1gtFqPE+UNfK3W/J07ub42UkkaROF9M47V5sDrh0EvkJ5hyq3LUDRvCRJNkQNbOE4tdSnnOsylrl3Cq6KzVYi6EhdY1ZW6wLKjVc+0hNNLPJl1JtncRDhJ0N82V7Zst96gNhUhDgO7Ao3be7u7zwEsRvXXcPAAESSGGEAhhGGs4SHlsQEbhJi5TWTMJYyCQleYoMbeIWcpzvCY3eFvn3cbFRvyPq+ZFm7Jp2ieCTsFZukDvaEDek9v6SP9+GutrKiR9zLm1S+9KnZnnlxc+fpf14BXg+1frn/2bNDDjaLXgHuPCya/hSz9o0dPD1ZuLs9mTXpJn7j/F7RP7/gG4eiLfLWklp+hxj/A/vO5D4PVubZNbXvpWmO+hTKmcQmX0eL3vo553MUiunzuHj7jG75b96zYemiNy1RrqvJcwG9hPf4J5/CoEQ==</latexit><latexit sha1_base64="w0Cp09+69zBABdSYC64xCbb4leg=">AAACyHichVHLahRBFD1pX3F8ZNSN4KZwyDAiDLczgiKIATciWeThJIF00nRXaiZNarqb7pqRsZmNS39A1JWCiPgZbswHuMgniAsXEVRw4e0HiAb1FtV16px7bt2q9mMdpIZof8o6cvTY8RPTJ2unTp85O1M/d341jYaJVF0Z6ShZ971U6SBUXRMYrdbjRHkDX6s1f/dOrq+NVJIGUXjfjGO1OfD6YdALpGeYcusyFM1bgkRT5MAWjlNLXcq5DnOpa5fwquhsFaKuxAVWdaUusOxo1TMt4fQST2adSTY3EU4S9HfMlS3brTeoTUWIw8CuQOP23tM8ni1G9ddwsI0IEkMMoBDCMNbwkPLYgA1CzNwmMuYSRkGhK0xQY++QsxRneMzu8rfPu42KDXmf10wLt+RTNM+EnQKz9IHe0AG9p7f0kX78tVZW1Mh7GfPql14VuzOPL658/a9rwKvBzi/XP3s26OFG0WvAvccFk99Clv7RwycHKzeXZ7MmvaRP3P8L2qd3fINw9EW+WlLLz1HjH2D/+dyHwepc26a2vXStMd9CGdO4hMto8XtfxzzuYhFdPncPn/EN3617Vmw9sMZlqjVVeS7gt7Ae/QQgt6nW</latexit><latexit sha1_base64="w0Cp09+69zBABdSYC64xCbb4leg=">AAACyHichVHLahRBFD1pX3F8ZNSN4KZwyDAiDLczgiKIATciWeThJIF00nRXaiZNarqb7pqRsZmNS39A1JWCiPgZbswHuMgniAsXEVRw4e0HiAb1FtV16px7bt2q9mMdpIZof8o6cvTY8RPTJ2unTp85O1M/d341jYaJVF0Z6ShZ971U6SBUXRMYrdbjRHkDX6s1f/dOrq+NVJIGUXjfjGO1OfD6YdALpGeYcusyFM1bgkRT5MAWjlNLXcq5DnOpa5fwquhsFaKuxAVWdaUusOxo1TMt4fQST2adSTY3EU4S9HfMlS3brTeoTUWIw8CuQOP23tM8ni1G9ddwsI0IEkMMoBDCMNbwkPLYgA1CzNwmMuYSRkGhK0xQY++QsxRneMzu8rfPu42KDXmf10wLt+RTNM+EnQKz9IHe0AG9p7f0kX78tVZW1Mh7GfPql14VuzOPL658/a9rwKvBzi/XP3s26OFG0WvAvccFk99Clv7RwycHKzeXZ7MmvaRP3P8L2qd3fINw9EW+WlLLz1HjH2D/+dyHwepc26a2vXStMd9CGdO4hMto8XtfxzzuYhFdPncPn/EN3617Vmw9sMZlqjVVeS7gt7Ae/QQgt6nW</latexit><latexit sha1_base64="tCBsMbd6DOATdN38PLJREJjWiL4=">AAACyHichVHLahRBFD1pH4njI6NuBDeFQ4YRYbidERRBCLgRySIPJwmkk6a7rJkUqeluumtGxmY2Lv0BF64URMTPcKMf4CKfIC5cRFDBhbd7GkSDepuuOnXOPbduVYWJ0ZklOphxjh0/cXJ27lTt9Jmz5+br5y9sZPEwlaorYxOnW2GQKaMj1bXaGrWVpCoYhEZthvt3Cn1zpNJMx9F9O07UziDoR7qnZWCZ8usyEs3bgkRTFMAVnlfLfCq4DnOZ707hNdHZLUVTicusmkpdZtkzqmdbwuulgcw7k3xxIrxU9/fs1V3XrzeoTWWIo8CtQANVrMT1V/DwADEkhhhAIYJlbBAg428bLggJczvImUsZ6VJXmKDG3iFnKc4ImN3nsc+r7YqNeF3UzEq35F0M/yk7BRboA72mQ3pHb+gj/fhrrbysUfQy5jmcelXizz+5tP71v64BzxZ7v1z/7Nmih5tlr5p7T0qmOIWc+kePnh6u31pbyJv0gj5x/8/pgN7yCaLRF/lyVa09Q40fwP3zuo+CjcW2S2139XpjqVU9xRwu4wpafN83sIS7WEGX932Pz/iG7849J3EeOuNpqjNTeS7it3Ae/wSr+6U3</latexit>

n = 1 s 1 = 3 + 3 1

l 1 = 3L +

✓ 3 2

◆ 1

L

<latexit sha1_base64="PoVFqTPhgW2a/pe6cxbgLShcqCs=">AAACq3ichVFNaxNBGH669aPGj6b2IngZDC0RMbzbCJVCaUEQDz20jWmL3Rp2t5N06GR32Z0E2iV/wD8gxYsKIqL/wkt7FTwU/QPisYVePPjuJiBtUd9hZp555n3eeWbGi7RKDNHhkDV84eKlyyNXClevXb8xWhy7uZKEndiXdT/UYbzmuYnUKpB1o4yWa1Es3ban5aq3/SjbX+3KOFFh8NTsRHKj7bYC1VS+a5hqFB8HYnJW2MJxCknDznBV3BPV5zmjB8wCU46WTVMWTjN2/bTaS6d6wolVa8vc5dyFRrFEFcpDnAf2AJTmDvb2XgNYDIvv4WATIXx00IZEAMNYw0XCbR02CBFzG0iZixmpfF+ihwJrO5wlOcNldpvHFq/WB2zA66xmkqt9PkVzj1kpMEFf6QMd0T59pB/066+10rxG5mWHZ6+vlVFj9MWt2sl/VW2eDbb+qP7p2aCJh7lXxd6jnMlu4ff13d2XR7WZ5Yl0kt7ST/b/hg7pM98g6B7775bk8isU+APss899HqxMVWyq2EsPSvNl9GMEt3EHZX7vaczjCRZR53M/4Qu+4bt136pZzyynn2oNDTTjOBWW/A3xbqET</latexit><latexit sha1_base64="/z9t+Xh1G8hEBGPyhEfdwrz+6HE=">AAACq3ichVFBaxNBGH1dW61ptdFeBC+DoSUihm8bQRGkBUE89NA2pi12a9hdJ+nQye6yOwm0S/5A/0CpnhREiv4LL3ot9FDqHyg9VvDiwW83AdGifsPMvHnzvW/ezHiRVokhOhqyLgyPXLw0erkwNn7l6kTx2vXlJOzEvqz7oQ7jVc9NpFaBrBtltFyNYum2PS1XvM3H2f5KV8aJCoNnZiuS6223Faim8l3DVKP4JBDTj4QtHKeQNOwMV8UdUX2RM3rAzDPlaNk0ZeE0Y9dPq710piecWLU2zG3OnW8US1ShPMR5YA9AafbLXhavFsLiezh4iRA+OmhDIoBhrOEi4bYGG4SIuXWkzMWMVL4v0UOBtR3OkpzhMrvJY4tXawM24HVWM8nVPp+iucesFJiiQ9qnM/pMH+iEfvy1VprXyLxs8ez1tTJqTOzcqH3/r6rNs8HGL9U/PRs08SD3qth7lDPZLfy+vru9e1Z7uDSVTtNbOmX/b+iIPvENgu43/92iXHqNAn+A/edznwfLMxWbKvbivdJcGf0YxU3cQpnf+z7m8BQLqPO5H3GAY3y17lo167nl9FOtoYFmEr+FJX8CKjWi2A==</latexit><latexit sha1_base64="/z9t+Xh1G8hEBGPyhEfdwrz+6HE=">AAACq3ichVFBaxNBGH1dW61ptdFeBC+DoSUihm8bQRGkBUE89NA2pi12a9hdJ+nQye6yOwm0S/5A/0CpnhREiv4LL3ot9FDqHyg9VvDiwW83AdGifsPMvHnzvW/ezHiRVokhOhqyLgyPXLw0erkwNn7l6kTx2vXlJOzEvqz7oQ7jVc9NpFaBrBtltFyNYum2PS1XvM3H2f5KV8aJCoNnZiuS6223Faim8l3DVKP4JBDTj4QtHKeQNOwMV8UdUX2RM3rAzDPlaNk0ZeE0Y9dPq710piecWLU2zG3OnW8US1ShPMR5YA9AafbLXhavFsLiezh4iRA+OmhDIoBhrOEi4bYGG4SIuXWkzMWMVL4v0UOBtR3OkpzhMrvJY4tXawM24HVWM8nVPp+iucesFJiiQ9qnM/pMH+iEfvy1VprXyLxs8ez1tTJqTOzcqH3/r6rNs8HGL9U/PRs08SD3qth7lDPZLfy+vru9e1Z7uDSVTtNbOmX/b+iIPvENgu43/92iXHqNAn+A/edznwfLMxWbKvbivdJcGf0YxU3cQpnf+z7m8BQLqPO5H3GAY3y17lo167nl9FOtoYFmEr+FJX8CKjWi2A==</latexit><latexit sha1_base64="nIfnH7hvyfZGIGqnJd3gmgmxLSw=">AAACq3ichVFBaxNBGH1dW61ptdFeBC+DoSUihm8bQREKBUE89NA2pi3t1rC7TtKhk91ldxKoS/6Af8CDJwulFP0XvXgWPBT9A9JjBS899NvNQtGifsPMvHnzvW/ezHiRVokhOh6xroyOXb02fr00MXnj5lT51u3VJOzFvmz6oQ7jdc9NpFaBbBpltFyPYul2PS3XvJ1n2f5aX8aJCoOXZjeSW123E6i28l3DVKv8PBCz88IWjlNKWnaG6+KBqL/KGV0wi0w5WrZNVTjt2PXT+iCdGwgnVp1tc59zF1vlCtUoD3EZ2AWooIilsHwAB68RwkcPXUgEMIw1XCTcNmGDEDG3hZS5mJHK9yUGKLG2x1mSM1xmd3js8GqzYANeZzWTXO3zKZp7zEqBGfpKh3RKn+kj/aCzv9ZK8xqZl12evaFWRq2pt3cav/6r6vJssH2h+qdngzae5F4Ve49yJruFP9T337w7bTxdmUlnaY9O2P8HOqYjvkHQ/+nvL8uV9yjxB9h/PvdlsDpXs6lmLz+qLFSLrxjHXdxDld/7MRbwAkto8rmf8AXf8N16aDWsDcsZplojhWYav4UlzwG1eZ45</latexit>

n = 2

s 2 = 3 + 3 1 + 3 2 l 2 = 3L +

✓ 3 2

◆ 1

L +

✓ 3 2

◆ 2

L

<latexit sha1_base64="mnadNVXUtwkDUXZmn3RHbzQH+50=">AAAC0XichVFNaxNBGH5260eNH431IngZDC0RIby7ERRBLHjx0EPbmLbQrWF3naRDJ7vL7iQQl4B41B8gxYsKIuLP8KJXwUN/gnisoAcPvrsJiBbtO8zMM8+8zzvPzASJVpkh2rfsmWPHT5ycPVU5febsubnq+fn1LB6koWyHsY7TzcDPpFaRbBtltNxMUun3Ay03gt07xf7GUKaZiqN7ZpTI7b7fi1RXhb5hqlPVkVi8JVzheZWs4xa4Ka6K5n2nHF2m9ZReZsbTsmvqwuumfpg3x7k7Fl6qejvmCguOSHDFcqdaowaVIQ4DZwpqtz/u7b0AsBJX38DDA8QIMUAfEhEMYw0fGbctOCAkzG0jZy5lpMp9iTEqrB1wluQMn9ldHnu82pqyEa+LmlmpDvkUzT1lpcACfaa3dEAf6B19oZ//rJWXNQovI56DiVYmnbknF1vfj1T1eTbY+a36r2eDLm6UXhV7T0qmuEU40Q8fPjto3VxbyBfpFX1l/y9pn97zDaLht/D1qlx7jgp/gPP3cx8G627DoYazeq22VMckZnEJl1Hn976OJdzFCtp87if8sCzLtlv2yH5kP56k2tZUcwF/hP30F4I/rGg=</latexit><latexit sha1_base64="bcR13MRhBriShDZ6YUIR+wr7SQ4=">AAAC0XichVFBSxtBFH67rVWjrbFehF4Gg5IihLcbQSmUCr148KCmUcHVsLtO4uBkd9mdBNIlID22P0C0pxZEij/Di70WevAnSI8W9ODBt5uAqKhvmJlvvnnfm29mnECKSCGeavqz5z0vevv6MwODL18NZYdfL0d+I3R52fWlH646dsSl8HhZCSX5ahByu+5IvuJsf0z2V5o8jITvfVKtgK/X7ZonqsK1FVGVrPTYxHtmMsvKRBUzwUU2yYobRjqaRMsuPU+MJXlV5ZlVDW03LrZjs82sUNS21FsSPJFgsvlKNocFTIPdB0YX5D783ktif8HPHoIFm+CDCw2oAwcPFGEJNkTU1sAAhIC4dYiJCwmJdJ9DGzKkbVAWpwyb2G0aa7Ra67IerZOaUap26RRJPSQlg3H8i7/wHE/wCM/w6sFacVoj8dKi2eloeVAZ+jpaunhSVadZwdaN6lHPCqowk3oV5D1ImeQWbkff/Lx7Xnq3NB5P4E/8R/5/4Cke0w285n/3YJEvfYcMfYBx97nvg2WzYGDBWJzKzeahE33wBsYgT+89DbMwBwtQpnP/wKWmabpe0lv6jv6lk6prXc0I3Ar92zW6964t</latexit><latexit sha1_base64="bcR13MRhBriShDZ6YUIR+wr7SQ4=">AAAC0XichVFBSxtBFH67rVWjrbFehF4Gg5IihLcbQSmUCr148KCmUcHVsLtO4uBkd9mdBNIlID22P0C0pxZEij/Di70WevAnSI8W9ODBt5uAqKhvmJlvvnnfm29mnECKSCGeavqz5z0vevv6MwODL18NZYdfL0d+I3R52fWlH646dsSl8HhZCSX5ahByu+5IvuJsf0z2V5o8jITvfVKtgK/X7ZonqsK1FVGVrPTYxHtmMsvKRBUzwUU2yYobRjqaRMsuPU+MJXlV5ZlVDW03LrZjs82sUNS21FsSPJFgsvlKNocFTIPdB0YX5D783ktif8HPHoIFm+CDCw2oAwcPFGEJNkTU1sAAhIC4dYiJCwmJdJ9DGzKkbVAWpwyb2G0aa7Ra67IerZOaUap26RRJPSQlg3H8i7/wHE/wCM/w6sFacVoj8dKi2eloeVAZ+jpaunhSVadZwdaN6lHPCqowk3oV5D1ImeQWbkff/Lx7Xnq3NB5P4E/8R/5/4Cke0w285n/3YJEvfYcMfYBx97nvg2WzYGDBWJzKzeahE33wBsYgT+89DbMwBwtQpnP/wKWmabpe0lv6jv6lk6prXc0I3Ar92zW6964t</latexit><latexit sha1_base64="QkCz8GMwujz6KKNk2fIMluaj+6I=">AAAC0XichVFBSxtBFH671WpTrbG9FLwMBiVSCG83hUpBELz04EGNUcHVsLudJIOT3WV3EkiXgPSoP8BDTwoi0p/Ri2fBgz+h9GhBDz307WZBVNQ3zMw337zvzTczTiBFpBAvNf3FwODLoeFXudcjo2/G8uNv1yK/Hbq86vrSDzccO+JSeLyqhJJ8Iwi53XIkX3d2FpL99Q4PI+F7q6ob8K2W3fBEXbi2IqqWlx6bnmMms6xcVDMTXGYfWHnbSEeTaJnRi8RYktdVkVn10Hbjci82e8wKRaOpZkjwTILJFmv5ApYwDfYQGBkoQBZLfv4ELPgKPrjQhhZw8EARlmBDRG0TDEAIiNuCmLiQkEj3OfQgR9o2ZXHKsIndobFBq82M9Wid1IxStUunSOohKRlM4QWe4hWe4U/8jf8erRWnNRIvXZqdvpYHtbG995XrZ1UtmhU0b1VPelZQh9nUqyDvQcokt3D7+s63g6vK55WpeBqP8A/5P8RL/EU38Dp/3eNlvvIDcvQBxv3nfgjWzJKBJWP5Y2G+mH3FMEzAJBTpvT/BPHyBJajSuedwo2marlf0rr6rf++n6lqmeQd3Qt//D0ZKqY4=</latexit>

4

フラクタルを基にしたモデル。

1

辺の長さが

L

の三角形から始め、各ステップごとに

1

辺の長さを 半分にした三角形を加えていく。

n

回目のステップの画数

s n

と線長

l n

をそれぞれの三角形の下に示す。

および

l n = 3L +

# n i=1

! 3 2

" i

L = 3L ! 3 2

" n

(3)

である。式

(2)

および

(3)

から

n

を消去すると

l n = 3L ! 2

3 s n − 1 " 1 − ln 2/ ln 3

となり、十分に

n

が大きいとすると

ls 1 ln 2/ ln 3 (4)

というベキ乗則が得られる。このモデルは

n → ∞

Sierpinski gasket (

3)

に収束する。

Sierpinski gasket

のフラクタル次元が

D = ln 3/ ln 2

であることから、式

(4)

ls 1 1/D (5)

と表すことができる。式

(1)

および

(5)

の指数を比べると

β = 1 − 1

D ,

つまり、

D = 1

1 − β (6)

である。漢字の線長と画数の関係から得られた指数

β

常用

= 0.47, β JIS = 0.52

を式

(6)

に代入 すると、常用漢字の場合には

D = 1.89, JIS

漢字の場合には

D = 2.08 (4)

となる。次元

D

2

に近いことから、漢字の形は画数が増えるにしたがって平面充填的に複雑化していくことが 示唆される。この結果は、画数が多い漢字を小さく印刷すると真っ黒に塗りつぶされたように 見えるという日常的な経験と対応していると思われる。

(4)

漢字は平面に描かれた図形なので、次元

D

2

を超えることはない。

JIS

漢字の場合に

D > 2

となったのは、

単に統計的な誤差が原因と考えられる。

(7)

4.

まとめ

本研究によって、漢字の線長と画数におおむねベキ乗則の関係があることがわかった。この ベキ乗則を説明するために、フラクタルを基にしたモデルを考案し解析した。実データとモデ ルの解析結果から、漢字の形は画数が増えるにしたがって平面充填的に複雑化していくという 結果が得られた。

今回の結果は

MS

ゴシックを用いたものであったが、他のフォント・書体でもほぼ同様の結 果が得られる。さらに、中国における常用漢字

通用規範漢字表

や台湾における常用漢字

常 用国字標準字体表

および

次常用国字標準字体表

を用いても

β ≈ 0.5

のベキ乗則を得るこ とができる。今後は他のベキ乗則との関係(スケーリング関係)について分析し、漢字の形に おけるベキ乗則についてさらに理解を深めたい。

謝 辞

本研究は、科研費 基盤研究

(C) (18K06406)

の助成を受けたものである。

文 献

George K. Zipf (2013). The Psycho-Biology of Language: An Introduction to Dynamic Philology. London: Routledge.

田中久美子

(2018)

.「言語の数理的普遍

(1)

言語の経験則」 数学セミナー

, 57:8, pp. 68–73

Morihiro Ohta, and Ken Yamamoto (2019). “Power-law Relation and Complexity in the

Shape of Chinese Character (Kanji).” Journal of the Physical Society of Japan, 88:6, p. 064803.

KeitarouNakayama (2015). Joyo Kanji. http://linkdata.org/work/rdf1s3597i.

文化庁

(2010)

.『常用漢字表』

, http://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/

joho/kijun/naikaku/kanji/

安岡孝一・安岡素子

(2017)

.「日本・中国・台湾・香港・韓国の常用漢字と漢字コード」 京 都大学学知創生ユニット報告書

, pp. 1–146

本田勝也

(2002)

.『フラクタル』 朝倉書店

,

東京.

関連

URL

『漢字辞典オンライン』

https://kanji.jitenon.jp/

図 4 フラクタルを基にしたモデル。 1 辺の長さが L の三角形から始め、各ステップごとに 1 辺の長さを 半分にした三角形を加えていく。 n 回目のステップの画数 s n と線長 l n をそれぞれの三角形の下に示す。 および l n = 3L + #n i=1 ! 32 &#34; i L = 3L ! 32 &#34; n (3) である。式 (2) および (3) から n を消去すると l n = 3L ! 2 3 s n − 1 &#34; 1 − ln 2/ ln 3 となり、十分に n が

参照

関連したドキュメント

・西浦英之「幕末 について」昌霊・小林雅宏「明〉集8』(昭散) (参考文献)|西浦英之「幕末・明治初期(について」『皇学館大学紀要

Mizuno: Lower Bounds for the Maximum Number of Solutions Generated by the Simplex Method, Journal of the Operations Research Society of Japan, 54 (2011), 191–200.

Keywords: homology representation, permutation module, Andre permutations, simsun permutation, tangent and Genocchi

原稿は A4 判 (ヨコ約 210mm,タテ約 297mm) の 用紙を用い,プリンターまたはタイプライターによって印 字したものを原則とする.

The inclusion of the cell shedding mechanism leads to modification of the boundary conditions employed in the model of Ward and King (199910) and it will be

Answering a question of de la Harpe and Bridson in the Kourovka Notebook, we build the explicit embeddings of the additive group of rational numbers Q in a finitely generated group

Applications of msets in Logic Programming languages is found to over- come “computational inefficiency” inherent in otherwise situation, especially in solving a sweep of

Shi, “The essential norm of a composition operator on the Bloch space in polydiscs,” Chinese Journal of Contemporary Mathematics, vol. Chen, “Weighted composition operators from Fp,