漢字の形における統計則
著者 太田 守洋, 山本 健
雑誌名 言語資源活用ワークショップ発表論文集
巻 4
ページ 149‑154
発行年 2019
URL http://doi.org/10.15084/00002563
漢字の形における統計則
太田 守洋
(
琉球大学大学院 理工学研究科) ∗
山本 健(
琉球大学 理学部)
Statistical Law Related to Shape of Kanji
Morihiro Ohta (Graduate Sch. of Eng. and Sci., Univ. of Ryukyus) Ken Yamamoto (Fac. of Sci., Univ. of Ryukyus)
要旨
本研究では漢字の形を統計的に分析する。漢字のサイズを特徴づける基本的な指標として画 数があり、画数が多い漢字ほど複雑な形である傾向がある。一方、漢字を構成する線の長さが 形の複雑性を表すとみなすことができる。本研究では、漢字の線長をコンピュータのフォント を用いて計測し、線長と画数の関係を調べた。その結果、漢字の線長は画数に対しておおむね ベキ乗則にしたがって増加することがわかった。さらに、フラクタル図形を基にした数学的な モデルを導入し、ベキ乗則の指数とフラクタル次元の関係を理論的に導出した。この関係を漢 字のベキ指数に適用すると、フラクタル次元はおよそ
2
次元となった。すなわち、漢字の形は 画数の増加とともに平面充填的に複雑化するといえる。1.
言語とベキ乗則言語についての様々な統計則がベキ乗則
(1)
で表される。その中でも有名なものとしてZipf
の法則がある。ある文章において出現する単語を出現頻度によって順位付けしたとき、順位r
の単語の出現頻度f
がr
に反比例するという経験則がZipf
の法則である。つまり出現頻度と 順位の間にf ∝ r − 1
というベキ乗則が成り立つ(Zipf 2013)
。他にも、ある文章において文書 量が増えるとともに、語彙量がベキ乗則に従って増えることを表したHeaps
の法則や、文書 を一定の単語数ごとに区切ったとき、ある単語が各々の区間に現れる数の平均と標準偏差にベ キ乗則が現れるというTaylor
の法則などがある(
田中久美子2018)
。一般に、ベキ乗則とは
2
つの変数x
およびy
の間に、y ∝ x α (α
は定数)
という関係が成り立つということである。すなわち、
y
がx
のα
乗に比例するということであ る。ベキ乗則に従うデータを両対数グラフにプロットすると、ln y = α ln x + C (C
は定数)
となるので、データは直線上に並び、その傾きは
α
である。また、x
を測る物差しの目盛をm
∗ [email protected]
(1)
助動詞の「べき」と区別しやすくするため、ベキ乗則の「ベキ」はカタカナで表記する。倍して
mx
としてもy ∝ (mx) α ∝ x α
となって、比例定数を除いて関数形は変わらない。つまり、ベキ乗則に従う現象は拡大や縮小 に対して不変な性質、スケール不変性を持っている。
2.
漢字の画数と線長の関係漢字には形・音・義という三要素があると言われているが、本研究では漢字の
“
形”
の複雑性 に注目する。漢字にはサイズを特徴づける基本的な指標として画数があり、画数が多い漢字ほ ど複雑な形である傾向がある。一方で漢字は全て線で構成されているため、線の長さの和(以 下では単に線長とよぶ)はその漢字の形の複雑性を表すとみることができる。そこで本研究で は、漢字の線長と画数の関係について分析する。なお、本研究の詳細はOhta and Yamamoto (2019)
で述べられている。2.1
常用漢字とJIS
漢字本研究では、常用漢字
2136
字とJIS
第1
水準および第2
水準漢字(
以下、JIS
漢字とよぶ
) 6355
字を分析に用いた。各漢字の画数はオンラインのデータベース『Joyo Kanji
』(KeitarouNakayama 2015)
および『漢字辞典オンライン』を利用した。常用漢字とは、「法令、公用文書、新聞、雑誌、放送など、一般の社会生活において、現代の 国語を書き表す場合の漢字使用の目安」
(
文化庁2010)
として内閣告示によって定められた漢 字である。現行の常用漢字は2010
年に改定され、2136
字からなる。JIS
漢字コードはコンピュータ等のデジタル機器でデータを通信するために、日本工業規格(JIS; Japanese Industrial Standards)
で定められた文字コードである。現在では、JIS
第1
水 準から第4
水準まで定められている。本研究では、JIS
第1
水準および第2
水準の6355
字(2)
をJIS
漢字と呼ぶことにする。なお、常用漢字のうち
2102
字はJIS
第1
水準であるが、“
鬱”
や“
丼”
など30
字はJIS
第2
水準であり、“
𠮟”, “
塡”, “
剝”, “
頰”
の4
字はJIS
第3
水準である(3) (
安岡孝一・安岡素子2017)
。そのため、本研究のJIS
漢字は常用漢字を完全に包含しているわけではない。2.2
線長の測定法本研究では、コンピュータフォント
MS
ゴシックを用いて線長を測定する。コンピュータで は線長を直接測定することが難しい。そこで、以下の方法で線長を計算した。まず漢字を縦横100
ピクセル四方の2
値画像として出力し、黒いピクセルの数を数えることでその漢字の面積 を測定する。図1 (a)
は20 × 20
で“
太”
を出力した例である。次に、各行各列で黒いピクセ ルが連続していくつ並んでいるのかを数えていく。例えば、図1 (a)
の下から3
段目では“4,
1, 3”
となる。線の長さにあたる黒ピクセルの長さは、筆画ごとに値が変わる。一方で、MS
ゴシックは一つの文字の中で線幅がほぼ一定であるため、その線幅にあたる黒ピクセルの長さは
(2)
この6355
字はJIS X 0208
という規格に当たる。のちにJIS
第3
水準および第4
水準を追加したJIS X 0213
という規格が定められた。(3) JIS
第1
水準に代わりとして“
叱”, “
填”, “
剥”, “
頬”
の4
字が示されている。(a) !
"#
$% $
&%'"%'!
$
! (
$
$
!
"
$
!
(b)
図
1
漢字の線幅の測定法の例。(a) 20 × 20
で出力した“
太”
と連続して並んだ黒いピクセル数の例。(b) (a)
の連続した黒いピクセルの長さのヒストグラム。ほとんど一定になる。よって、線幅にあたる長さは線長にあたる長さより圧倒的に多く出現す るはずである。したがって、図
1 (b)
のように連続した黒いピクセルの長さのヒストグラムを 描くと、最頻値がその漢字の線幅として推定される。例えば、図1
の“
太”
では、線幅は3
と推 定することができる。漢字の線長は、面積を線幅で割れば求めることができる。なお、線幅は 字によって異なるため、線幅の推定と線長の計算はそれぞれの漢字について行う必要がある。2.3
結果図
2
は(a)
常用漢字2136
字および(b) JIS
漢字6355
字について、線長と画数の関係を両対 数目盛でプロットしたグラフである。線長は2
値画像の1
辺の長さが1
になるように規格化し ている。各画数の平均線長l
は画数s
が増えるに従って、おおむねベキ乗則で増加しているこ とがわかる:
l ∝ s β . (1)
そのベキ指数
β
は、常用漢字でβ = 0.47, JIS
漢字でβ = 0.52
と0.5
に近い値をとる。(a) (b)
図
2 (a)
常用漢字2136
字および(b)JIS
漢字6355
字についての線長と画数の関係。丸い点は各漢字の データを示し、四角い点は各画数での平均線長を示している。実線は平均線長のベキ乗則を表したもので あり、そのベキ指数は(a)
常用漢字でβ = 0.47, (b)JIS
漢字でβ = 0.52
である。図
3 Sierpinski gasket.
フラクタル次元は約
1.59
である。3.
フラクタルを基にしたモデル化3.1
フラクタルとはフラクタルとは図形の一部を拡大すると図形全体と一致すると いう性質(自己相似性)を持つ図形のことである
(
詳しくは本田 勝也(2002)
等を参照)
。例えば、図3
のSierpinski gasket
では、上半分の正三角形を
2
倍に拡大すると全体と一致する。フラクタ ルはフラクタル次元という非整数の次元を持つ。フラクタル次元 の定義は何通りかあるが、ここでは相似次元という次元を紹介する。正方形の
1
辺の長さを1/2
倍にすると、その1/2
倍の正方形を4 (= 2 2 )
個並べるともと の正方形と一致する。また、立方体の1
辺の長さを1 / 2
倍にすると、その1 / 2
倍の立方体を8 (= 2 3 )
個並べるともとの立方体と一致する。正方形は2
次元、立方体は3
次元の図形であり、これらの次元が指数に現れている。この結果を拡張し、ある図形の
1
辺の長さをr
倍にし たとき、その縮小した図形をN
個並べるともとの大きさに戻るのであれば、N = ! 1 r
" D
によって相似次元
D
を定義する。すなわち、図形の縮小倍率r
と個数N
の間にベキ乗則が成 り立ち、そのベキ指数が次元D
に対応する。これをD
について解くと、D = ln N ln (1 /r )
となる。一般に、この次元
D
は整数とは限らない。例えば、図3
のSierpinski gasket
は1/2
倍 にした図形を3
つ並べるともとの大きさに戻るので、そのフラクタル次元はD = ln 3/ ln 2 ≈ 1.59
である。3.2
モデル化式
(1)
のベキ乗則を説明するために、フラクタルを基にしたモデルを導入する。このモデル は1
ステップごとに三角形を追加していく。まずn = 0
のとき,
図4
左のように1
辺の長さ がL
の正三角形を描く。このとき、各線分を1
画で描くことにすると画数はs 0 = 3,
線長はl 0 = 3L
である。次にn = 1
で、図4
中央のように正三角形の中に1
辺の長さがL/2
の正三 角形を追加する。画数と線長はそれぞれs 1 = s 0 + 3 1 = 6, l 1 = l 0 + (3/2) 1 L = 9L/2
になる。n = 2
では、さらに1
辺の長さがL/4
の正三角形が3
つ加えられ、画数はs 2 = s 1 + 3 2 = 15,
線長はl 2 = l 1 + (3/2) 2 L = 27L/4
となる。この操作をn
回繰り返したとき、画数s n
と線長l n
はそれぞれs n = s n − 1 + 3 n , l n = l n − 1 + ! 3 2
" n
L
という漸化式で表すことができ、その解はs n = 3 +
# n i=1
3 i = 3
2 (3 n + 1) (2)
! …
n = 0 n = 1
s 0 = 3 s 1 = 3 + 3 1 l 0 = 3L l 1 = 3L +
✓ 3 2
◆ 1
<latexit sha1_base64="dbtxUILP9YzcL4MNGiGAo4S+3OM=">AAACyHichVHLahRBFD1pX3F8ZNSN4KZwyDAiDLczgiKIATciWeThJIF00nSXNZMmNd1Nd83I2MzGpT8gwY0KIuJnuDEf4CKfIC5cRFDBhbcfIBrUW1TXqXPuuXWr2o91kBqi/SnryNFjx09Mn6ydOn3m7Ez93PnVNBomUnVlpKNk3fdSpYNQdU1gtFqPE+UNfK3W/J07ub42UkkaROF9M47V5sDrh0EvkJ5hyq3LUDRvCRJNkQNbOE4tdSnnOsylrl3Cq6KzVYi6EhdY1ZW6wLKjVc+0hNNLPJl1JtncRDhJ0N82V7Zst96gNhUhDgO7Ao3be7u7zwEsRvXXcPAAESSGGEAhhGGs4SHlsQEbhJi5TWTMJYyCQleYoMbeIWcpzvCY3eFvn3cbFRvyPq+ZFm7Jp2ieCTsFZukDvaEDek9v6SP9+GutrKiR9zLm1S+9KnZnnlxc+fpf14BXg+1frn/2bNDDjaLXgHuPCya/hSz9o0dPD1ZuLs9mTXpJn7j/F7RP7/gG4eiLfLWklp+hxj/A/vO5D4PVubZNbXvpWmO+hTKmcQmX0eL3vo553MUiunzuHj7jG75b96zYemiNy1RrqvJcwG9hPf4J5/CoEQ==</latexit><latexit sha1_base64="w0Cp09+69zBABdSYC64xCbb4leg=">AAACyHichVHLahRBFD1pX3F8ZNSN4KZwyDAiDLczgiKIATciWeThJIF00nRXaiZNarqb7pqRsZmNS39A1JWCiPgZbswHuMgniAsXEVRw4e0HiAb1FtV16px7bt2q9mMdpIZof8o6cvTY8RPTJ2unTp85O1M/d341jYaJVF0Z6ShZ971U6SBUXRMYrdbjRHkDX6s1f/dOrq+NVJIGUXjfjGO1OfD6YdALpGeYcusyFM1bgkRT5MAWjlNLXcq5DnOpa5fwquhsFaKuxAVWdaUusOxo1TMt4fQST2adSTY3EU4S9HfMlS3brTeoTUWIw8CuQOP23tM8ni1G9ddwsI0IEkMMoBDCMNbwkPLYgA1CzNwmMuYSRkGhK0xQY++QsxRneMzu8rfPu42KDXmf10wLt+RTNM+EnQKz9IHe0AG9p7f0kX78tVZW1Mh7GfPql14VuzOPL658/a9rwKvBzi/XP3s26OFG0WvAvccFk99Clv7RwycHKzeXZ7MmvaRP3P8L2qd3fINw9EW+WlLLz1HjH2D/+dyHwepc26a2vXStMd9CGdO4hMto8XtfxzzuYhFdPncPn/EN3617Vmw9sMZlqjVVeS7gt7Ae/QQgt6nW</latexit><latexit sha1_base64="w0Cp09+69zBABdSYC64xCbb4leg=">AAACyHichVHLahRBFD1pX3F8ZNSN4KZwyDAiDLczgiKIATciWeThJIF00nRXaiZNarqb7pqRsZmNS39A1JWCiPgZbswHuMgniAsXEVRw4e0HiAb1FtV16px7bt2q9mMdpIZof8o6cvTY8RPTJ2unTp85O1M/d341jYaJVF0Z6ShZ971U6SBUXRMYrdbjRHkDX6s1f/dOrq+NVJIGUXjfjGO1OfD6YdALpGeYcusyFM1bgkRT5MAWjlNLXcq5DnOpa5fwquhsFaKuxAVWdaUusOxo1TMt4fQST2adSTY3EU4S9HfMlS3brTeoTUWIw8CuQOP23tM8ni1G9ddwsI0IEkMMoBDCMNbwkPLYgA1CzNwmMuYSRkGhK0xQY++QsxRneMzu8rfPu42KDXmf10wLt+RTNM+EnQKz9IHe0AG9p7f0kX78tVZW1Mh7GfPql14VuzOPL658/a9rwKvBzi/XP3s26OFG0WvAvccFk99Clv7RwycHKzeXZ7MmvaRP3P8L2qd3fINw9EW+WlLLz1HjH2D/+dyHwepc26a2vXStMd9CGdO4hMto8XtfxzzuYhFdPncPn/EN3617Vmw9sMZlqjVVeS7gt7Ae/QQgt6nW</latexit><latexit sha1_base64="tCBsMbd6DOATdN38PLJREJjWiL4=">AAACyHichVHLahRBFD1pH4njI6NuBDeFQ4YRYbidERRBCLgRySIPJwmkk6a7rJkUqeluumtGxmY2Lv0BF64URMTPcKMf4CKfIC5cRFDBhbd7GkSDepuuOnXOPbduVYWJ0ZklOphxjh0/cXJ27lTt9Jmz5+br5y9sZPEwlaorYxOnW2GQKaMj1bXaGrWVpCoYhEZthvt3Cn1zpNJMx9F9O07UziDoR7qnZWCZ8usyEs3bgkRTFMAVnlfLfCq4DnOZ707hNdHZLUVTicusmkpdZtkzqmdbwuulgcw7k3xxIrxU9/fs1V3XrzeoTWWIo8CtQANVrMT1V/DwADEkhhhAIYJlbBAg428bLggJczvImUsZ6VJXmKDG3iFnKc4ImN3nsc+r7YqNeF3UzEq35F0M/yk7BRboA72mQ3pHb+gj/fhrrbysUfQy5jmcelXizz+5tP71v64BzxZ7v1z/7Nmih5tlr5p7T0qmOIWc+kePnh6u31pbyJv0gj5x/8/pgN7yCaLRF/lyVa09Q40fwP3zuo+CjcW2S2139XpjqVU9xRwu4wpafN83sIS7WEGX932Pz/iG7849J3EeOuNpqjNTeS7it3Ae/wSr+6U3</latexit>
n = 1 s 1 = 3 + 3 1
l 1 = 3L +
✓ 3 2
◆ 1
L
<latexit sha1_base64="PoVFqTPhgW2a/pe6cxbgLShcqCs=">AAACq3ichVFNaxNBGH669aPGj6b2IngZDC0RMbzbCJVCaUEQDz20jWmL3Rp2t5N06GR32Z0E2iV/wD8gxYsKIqL/wkt7FTwU/QPisYVePPjuJiBtUd9hZp555n3eeWbGi7RKDNHhkDV84eKlyyNXClevXb8xWhy7uZKEndiXdT/UYbzmuYnUKpB1o4yWa1Es3ban5aq3/SjbX+3KOFFh8NTsRHKj7bYC1VS+a5hqFB8HYnJW2MJxCknDznBV3BPV5zmjB8wCU46WTVMWTjN2/bTaS6d6wolVa8vc5dyFRrFEFcpDnAf2AJTmDvb2XgNYDIvv4WATIXx00IZEAMNYw0XCbR02CBFzG0iZixmpfF+ihwJrO5wlOcNldpvHFq/WB2zA66xmkqt9PkVzj1kpMEFf6QMd0T59pB/066+10rxG5mWHZ6+vlVFj9MWt2sl/VW2eDbb+qP7p2aCJh7lXxd6jnMlu4ff13d2XR7WZ5Yl0kt7ST/b/hg7pM98g6B7775bk8isU+APss899HqxMVWyq2EsPSvNl9GMEt3EHZX7vaczjCRZR53M/4Qu+4bt136pZzyynn2oNDTTjOBWW/A3xbqET</latexit><latexit sha1_base64="/z9t+Xh1G8hEBGPyhEfdwrz+6HE=">AAACq3ichVFBaxNBGH1dW61ptdFeBC+DoSUihm8bQRGkBUE89NA2pi12a9hdJ+nQye6yOwm0S/5A/0CpnhREiv4LL3ot9FDqHyg9VvDiwW83AdGifsPMvHnzvW/ezHiRVokhOhqyLgyPXLw0erkwNn7l6kTx2vXlJOzEvqz7oQ7jVc9NpFaBrBtltFyNYum2PS1XvM3H2f5KV8aJCoNnZiuS6223Faim8l3DVKP4JBDTj4QtHKeQNOwMV8UdUX2RM3rAzDPlaNk0ZeE0Y9dPq710piecWLU2zG3OnW8US1ShPMR5YA9AafbLXhavFsLiezh4iRA+OmhDIoBhrOEi4bYGG4SIuXWkzMWMVL4v0UOBtR3OkpzhMrvJY4tXawM24HVWM8nVPp+iucesFJiiQ9qnM/pMH+iEfvy1VprXyLxs8ez1tTJqTOzcqH3/r6rNs8HGL9U/PRs08SD3qth7lDPZLfy+vru9e1Z7uDSVTtNbOmX/b+iIPvENgu43/92iXHqNAn+A/edznwfLMxWbKvbivdJcGf0YxU3cQpnf+z7m8BQLqPO5H3GAY3y17lo167nl9FOtoYFmEr+FJX8CKjWi2A==</latexit><latexit sha1_base64="/z9t+Xh1G8hEBGPyhEfdwrz+6HE=">AAACq3ichVFBaxNBGH1dW61ptdFeBC+DoSUihm8bQRGkBUE89NA2pi12a9hdJ+nQye6yOwm0S/5A/0CpnhREiv4LL3ot9FDqHyg9VvDiwW83AdGifsPMvHnzvW/ezHiRVokhOhqyLgyPXLw0erkwNn7l6kTx2vXlJOzEvqz7oQ7jVc9NpFaBrBtltFyNYum2PS1XvM3H2f5KV8aJCoNnZiuS6223Faim8l3DVKP4JBDTj4QtHKeQNOwMV8UdUX2RM3rAzDPlaNk0ZeE0Y9dPq710piecWLU2zG3OnW8US1ShPMR5YA9AafbLXhavFsLiezh4iRA+OmhDIoBhrOEi4bYGG4SIuXWkzMWMVL4v0UOBtR3OkpzhMrvJY4tXawM24HVWM8nVPp+iucesFJiiQ9qnM/pMH+iEfvy1VprXyLxs8ez1tTJqTOzcqH3/r6rNs8HGL9U/PRs08SD3qth7lDPZLfy+vru9e1Z7uDSVTtNbOmX/b+iIPvENgu43/92iXHqNAn+A/edznwfLMxWbKvbivdJcGf0YxU3cQpnf+z7m8BQLqPO5H3GAY3y17lo167nl9FOtoYFmEr+FJX8CKjWi2A==</latexit><latexit sha1_base64="nIfnH7hvyfZGIGqnJd3gmgmxLSw=">AAACq3ichVFBaxNBGH1dW61ptdFeBC+DoSUihm8bQREKBUE89NA2pi3t1rC7TtKhk91ldxKoS/6Af8CDJwulFP0XvXgWPBT9A9JjBS899NvNQtGifsPMvHnzvW/ezHiRVokhOh6xroyOXb02fr00MXnj5lT51u3VJOzFvmz6oQ7jdc9NpFaBbBpltFyPYul2PS3XvJ1n2f5aX8aJCoOXZjeSW123E6i28l3DVKv8PBCz88IWjlNKWnaG6+KBqL/KGV0wi0w5WrZNVTjt2PXT+iCdGwgnVp1tc59zF1vlCtUoD3EZ2AWooIilsHwAB68RwkcPXUgEMIw1XCTcNmGDEDG3hZS5mJHK9yUGKLG2x1mSM1xmd3js8GqzYANeZzWTXO3zKZp7zEqBGfpKh3RKn+kj/aCzv9ZK8xqZl12evaFWRq2pt3cav/6r6vJssH2h+qdngzae5F4Ve49yJruFP9T337w7bTxdmUlnaY9O2P8HOqYjvkHQ/+nvL8uV9yjxB9h/PvdlsDpXs6lmLz+qLFSLrxjHXdxDld/7MRbwAkto8rmf8AXf8N16aDWsDcsZplojhWYav4UlzwG1eZ45</latexit>
n = 2
s 2 = 3 + 3 1 + 3 2 l 2 = 3L +
✓ 3 2
◆ 1
L +
✓ 3 2
◆ 2
L
<latexit sha1_base64="mnadNVXUtwkDUXZmn3RHbzQH+50=">AAAC0XichVFNaxNBGH5260eNH431IngZDC0RIby7ERRBLHjx0EPbmLbQrWF3naRDJ7vL7iQQl4B41B8gxYsKIuLP8KJXwUN/gnisoAcPvrsJiBbtO8zMM8+8zzvPzASJVpkh2rfsmWPHT5ycPVU5febsubnq+fn1LB6koWyHsY7TzcDPpFaRbBtltNxMUun3Ay03gt07xf7GUKaZiqN7ZpTI7b7fi1RXhb5hqlPVkVi8JVzheZWs4xa4Ka6K5n2nHF2m9ZReZsbTsmvqwuumfpg3x7k7Fl6qejvmCguOSHDFcqdaowaVIQ4DZwpqtz/u7b0AsBJX38DDA8QIMUAfEhEMYw0fGbctOCAkzG0jZy5lpMp9iTEqrB1wluQMn9ldHnu82pqyEa+LmlmpDvkUzT1lpcACfaa3dEAf6B19oZ//rJWXNQovI56DiVYmnbknF1vfj1T1eTbY+a36r2eDLm6UXhV7T0qmuEU40Q8fPjto3VxbyBfpFX1l/y9pn97zDaLht/D1qlx7jgp/gPP3cx8G627DoYazeq22VMckZnEJl1Hn976OJdzFCtp87if8sCzLtlv2yH5kP56k2tZUcwF/hP30F4I/rGg=</latexit><latexit sha1_base64="bcR13MRhBriShDZ6YUIR+wr7SQ4=">AAAC0XichVFBSxtBFH67rVWjrbFehF4Gg5IihLcbQSmUCr148KCmUcHVsLtO4uBkd9mdBNIlID22P0C0pxZEij/Di70WevAnSI8W9ODBt5uAqKhvmJlvvnnfm29mnECKSCGeavqz5z0vevv6MwODL18NZYdfL0d+I3R52fWlH646dsSl8HhZCSX5ahByu+5IvuJsf0z2V5o8jITvfVKtgK/X7ZonqsK1FVGVrPTYxHtmMsvKRBUzwUU2yYobRjqaRMsuPU+MJXlV5ZlVDW03LrZjs82sUNS21FsSPJFgsvlKNocFTIPdB0YX5D783ktif8HPHoIFm+CDCw2oAwcPFGEJNkTU1sAAhIC4dYiJCwmJdJ9DGzKkbVAWpwyb2G0aa7Ra67IerZOaUap26RRJPSQlg3H8i7/wHE/wCM/w6sFacVoj8dKi2eloeVAZ+jpaunhSVadZwdaN6lHPCqowk3oV5D1ImeQWbkff/Lx7Xnq3NB5P4E/8R/5/4Cke0w285n/3YJEvfYcMfYBx97nvg2WzYGDBWJzKzeahE33wBsYgT+89DbMwBwtQpnP/wKWmabpe0lv6jv6lk6prXc0I3Ar92zW6964t</latexit><latexit sha1_base64="bcR13MRhBriShDZ6YUIR+wr7SQ4=">AAAC0XichVFBSxtBFH67rVWjrbFehF4Gg5IihLcbQSmUCr148KCmUcHVsLtO4uBkd9mdBNIlID22P0C0pxZEij/Di70WevAnSI8W9ODBt5uAqKhvmJlvvnnfm29mnECKSCGeavqz5z0vevv6MwODL18NZYdfL0d+I3R52fWlH646dsSl8HhZCSX5ahByu+5IvuJsf0z2V5o8jITvfVKtgK/X7ZonqsK1FVGVrPTYxHtmMsvKRBUzwUU2yYobRjqaRMsuPU+MJXlV5ZlVDW03LrZjs82sUNS21FsSPJFgsvlKNocFTIPdB0YX5D783ktif8HPHoIFm+CDCw2oAwcPFGEJNkTU1sAAhIC4dYiJCwmJdJ9DGzKkbVAWpwyb2G0aa7Ra67IerZOaUap26RRJPSQlg3H8i7/wHE/wCM/w6sFacVoj8dKi2eloeVAZ+jpaunhSVadZwdaN6lHPCqowk3oV5D1ImeQWbkff/Lx7Xnq3NB5P4E/8R/5/4Cke0w285n/3YJEvfYcMfYBx97nvg2WzYGDBWJzKzeahE33wBsYgT+89DbMwBwtQpnP/wKWmabpe0lv6jv6lk6prXc0I3Ar92zW6964t</latexit><latexit sha1_base64="QkCz8GMwujz6KKNk2fIMluaj+6I=">AAAC0XichVFBSxtBFH671WpTrbG9FLwMBiVSCG83hUpBELz04EGNUcHVsLudJIOT3WV3EkiXgPSoP8BDTwoi0p/Ri2fBgz+h9GhBDz307WZBVNQ3zMw337zvzTczTiBFpBAvNf3FwODLoeFXudcjo2/G8uNv1yK/Hbq86vrSDzccO+JSeLyqhJJ8Iwi53XIkX3d2FpL99Q4PI+F7q6ob8K2W3fBEXbi2IqqWlx6bnmMms6xcVDMTXGYfWHnbSEeTaJnRi8RYktdVkVn10Hbjci82e8wKRaOpZkjwTILJFmv5ApYwDfYQGBkoQBZLfv4ELPgKPrjQhhZw8EARlmBDRG0TDEAIiNuCmLiQkEj3OfQgR9o2ZXHKsIndobFBq82M9Wid1IxStUunSOohKRlM4QWe4hWe4U/8jf8erRWnNRIvXZqdvpYHtbG995XrZ1UtmhU0b1VPelZQh9nUqyDvQcokt3D7+s63g6vK55WpeBqP8A/5P8RL/EU38Dp/3eNlvvIDcvQBxv3nfgjWzJKBJWP5Y2G+mH3FMEzAJBTpvT/BPHyBJajSuedwo2marlf0rr6rf++n6lqmeQd3Qt//D0ZKqY4=</latexit>
図
4
フラクタルを基にしたモデル。1
辺の長さがL
の三角形から始め、各ステップごとに1
辺の長さを 半分にした三角形を加えていく。n
回目のステップの画数s n
と線長l n
をそれぞれの三角形の下に示す。および
l n = 3L +
# n i=1
! 3 2
" i
L = 3L ! 3 2
" n
(3)
である。式(2)
および(3)
からn
を消去するとl n = 3L ! 2
3 s n − 1 " 1 − ln 2/ ln 3
となり、十分に
n
が大きいとするとl ∝ s 1 − ln 2/ ln 3 (4)
というベキ乗則が得られる。このモデルは
n → ∞
でSierpinski gasket (
図3)
に収束する。Sierpinski gasket
のフラクタル次元がD = ln 3/ ln 2
であることから、式(4)
はl ∝ s 1 − 1/D (5)
と表すことができる。式
(1)
および(5)
の指数を比べるとβ = 1 − 1
D ,
つまり、D = 1
1 − β (6)
である。漢字の線長と画数の関係から得られた指数
β
常用= 0.47, β JIS = 0.52
を式(6)
に代入 すると、常用漢字の場合にはD = 1.89, JIS
漢字の場合にはD = 2.08 (4)
となる。次元D
が2
に近いことから、漢字の形は画数が増えるにしたがって平面充填的に複雑化していくことが 示唆される。この結果は、画数が多い漢字を小さく印刷すると真っ黒に塗りつぶされたように 見えるという日常的な経験と対応していると思われる。(4)
漢字は平面に描かれた図形なので、次元D
が2
を超えることはない。JIS
漢字の場合にD > 2
となったのは、単に統計的な誤差が原因と考えられる。
4.
まとめ本研究によって、漢字の線長と画数におおむねベキ乗則の関係があることがわかった。この ベキ乗則を説明するために、フラクタルを基にしたモデルを考案し解析した。実データとモデ ルの解析結果から、漢字の形は画数が増えるにしたがって平面充填的に複雑化していくという 結果が得られた。
今回の結果は
MS
ゴシックを用いたものであったが、他のフォント・書体でもほぼ同様の結 果が得られる。さらに、中国における常用漢字“
通用規範漢字表”
や台湾における常用漢字“
常 用国字標準字体表”
および“
次常用国字標準字体表”
を用いてもβ ≈ 0.5
のベキ乗則を得るこ とができる。今後は他のベキ乗則との関係(スケーリング関係)について分析し、漢字の形に おけるベキ乗則についてさらに理解を深めたい。謝 辞
本研究は、科研費 基盤研究
(C) (18K06406)
の助成を受けたものである。文 献
George K. Zipf (2013). The Psycho-Biology of Language: An Introduction to Dynamic Philology. London: Routledge.
田中久美子
(2018)
.「言語の数理的普遍(1)
言語の経験則」 数学セミナー, 57:8, pp. 68–73
.Morihiro Ohta, and Ken Yamamoto (2019). “Power-law Relation and Complexity in the
Shape of Chinese Character (Kanji).” Journal of the Physical Society of Japan, 88:6, p. 064803.
KeitarouNakayama (2015). Joyo Kanji. http://linkdata.org/work/rdf1s3597i.
文化庁
(2010)
.『常用漢字表』, http://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/
joho/kijun/naikaku/kanji/
.安岡孝一・安岡素子
(2017)
.「日本・中国・台湾・香港・韓国の常用漢字と漢字コード」 京 都大学学知創生ユニット報告書, pp. 1–146
.本田勝也
(2002)
.『フラクタル』 朝倉書店,
東京.関連
URL
『漢字辞典オンライン』