修士学位論文
近似エントロピーによる
道路区画地図複雑さ数値化方法の研究
指導教授 鈴木 登志雄 准教授
首都大学東京
理工学研究科 数理情報科学専攻 学修番号
氏名 長谷川香
平成 年 月 日
目 次
第 章 序
はじめに 用語の説明
近似エントロピー( )
道路区画地図 周二乗面積比
区画面積の分散を修正した量 連の長さを修正した量
周二乗面積比と面積の分散を基にした指標
第 章 格子状図形のための近似エントロピー
近似エントロピーの定義 パラメータ , の決定
パラメータ の決定 パラメータ の決定 何が表わせるのか
観察された現象
第 章 と の間の負の相関 観察された現象としての負の相関 単純化したモデルにおける数学的証明
と の間の負の相関についての反例 負の相関の応用:指標の提案,計算量の半減
第 章 適用例
道路区画地図への適用実例 塗り分け方法
第 章 まとめ
第 章 付録
基準図形におけるシミュレーション 基準図形一覧
シミュレーション結果 格子図形におけるシミュレーション
モデル格子図形 シミュレーション結果 その他の指標との比較 塗り分け結果
京都市中京区の塗り分け結果
東京都目黒区・世田谷区の塗り分け結果
第 章 序
はじめに
エントロピー という概念は自然科学のいろいろな学問領域に登場する.
1865年,クラウジウスは温度に対する熱量変化の比率として エントロピー を導入し た.啓蒙書や応用研究では,しばしば「不確定さ・乱雑さ・無秩序」の度合いを表す概念とし て捉えられる場面も見られる.しかし,この エントロピー 自体を乱雑さの尺度と出来る訳で はない.一定の前提の下で「不確定さ・乱雑さ・無秩序」とみなし得るにすぎない.したがっ て,この熱力学から生まれた エントロピー という概念は現在では統計力学や情報理論など 様々な分野で導入,及び確立されているが,その計算式は,各分野に適した形で独自の発展を 成し遂げ,用いられている.しかし,いずれもあるパターンを基準にしての秩序性・規則性の 定量化という考え方に基づいている.1950年代に考案された エントロ ピー( エントロピー)を始めとしてエントロピー概念を導入し,時系列的なデータの特性 を定量的に捉えようとする試みがされてきた.
そして1990年代に入り,実験データを規則性において判別することに重点を置いた 近 似エントロピー( ) という概念が考案された.近似エントロピーと エントロピーは,類似しているが,近似エントロピーは比較的少ない有限個のデータで適 正な値を導き出せるよう工夫されている.現在では,主に生理学の分野で適用されており,標 準偏差にほとんど差の見られないデータであっても,規則性を定量化した近似エントロピーは その差を表せることから,心拍データの解析などに用いられている. また,
第 章 序
道路渋滞の解析などへの適用も試みられている.
そこで,本研究では,近似エントロピーの概念を「道路区画地図の複雑さの定量化」へ適用 するに当たっての,適用方法を検討し,適用例を示す.また,本研究においては
でも用いられている近似エントロピーの計算式を採用している.
近似エントロピーは という数列の階差で定義されている.具体的には 以下の通りである.与えられた有限 個の時系列データに対して そこから(連続する)長さ
の部分列 ( )をランダ
ムに2つ取り出すときに,それらが誤差 で一致する確率を とする.そのとき
と定義する.このとき,近似エントロピーを
と定義する.
本研究では,三角関数によって長方形格子を歪ませたモデル図形を用いたシミュレーション を行う.これにより,近似エントロピーの概念を道路区画地図へ適用した場合の性質や特徴,つ まり道路区画地図の何を反映し,その一方で何を表わせないのかを検討する.
また,このシミュレーションにおいて,近似エントロピーの値と が「負の相関」を持つと いう現象がみられた.
そこで,対象を四辺形に限定した場合に「四辺形を微小変形して長方形に近づけるとき近似 エントロピーは増加し, は減少する」ことを数学的に証明する.
各区画が四辺形に近い道路区画地図においても,近似エントロピーと の間に同様の関係が 成り立つとみなせる.
このことを応用し,道路区画地図の複雑さの指標として近似エントロピーの代わりに を用
はじめに
いることを提案する.これにより,近似エントロピーを計算する方法に比べ,計算量を約半分 にできる.
また,倉本は地図の複雑さを数値化する指標として周二乗面積比・区画面積の分散に基づい た指標を提案した .本研究で提案する は,倉本の提案した指標と比較すると,長方形格 子を多く含む(地域である)京都と,入り組んだ路地の多い(地域である)東京都との差を明 確に表わすことがわかった.
第 章では,近似エントロピーの説明,および川村 ,倉本 が提案した指標について詳 しく述べる.
第 章では,近似エントロピーの格子状図形への適用方法について述べる.
第 章では,モデル図形への適用例を基に,「 と 」の関係について数学的な証明を与 える.
第 章では,実際の道路区画地図への適用例を示す.
第 章 序
用語の説明
近似エントロピー( )
近似エントロピー( )は,有限個の時系列データを規則性に基づいて判 別する指標として導入された.以降では,近似エントロピー( )を と記述する.これは,長さ の時系列データ
が与えられたときに を長さ の(連続する)部分列をランダムに2つ取り出し,それらが 誤差 で一致する確率の分布から導かれる量である.
それにはまず,時系列データ に対し,長さ の部分列
(ただし, )
を定める.また,部分列 と の距離を
とする.さらに, を を満たす の個数とする.
この の平均値である を以下のように定義する.
用語の説明
さらに 式 の平均を とおく
そうしてこの の対数値を:
とする.このとき,近似エントロピー は
により定義される.
道路区画地図
本研究では,国土地理院が発行する「数値地図 (空間データ基盤)関東 版」
・「数値地図 (独自形式)近畿 版」 から道路中心線を抽出した地図 データを用いている.まず,地図をモノクロ ファイルとして与え,それをいくつかの正 方形領域に分割する.このとき,道路中心線は黒ピクセル,その他の領域は白ピクセルで表わ される.また,正方形領域は となるように分割する. 近似エントロピー等を適 用する地図は,分割後の の正方形領域である.
周二乗面積比
心理学実験では 世紀半ば以降,たびたび閉曲線で囲まれた図形に対する複雑さの心証に ついての実験と分析がなされている.特に と は,相似拡大で不変な量とし て閉曲線の周の長さの二乗と,閉曲線が囲む面積の比に注目した.以下ではこれを周二乗面積 比 と呼ぶ.各区間の周の長さを ,面積を とするときの のことを周二乗面積比と
第 章 序
呼ぶ.
具体的に,円では最小値 をとり,正方形では ,星形のように凹凸が多い図形では大き くなる.地図上に指定された正方形領域において,この領域に含まれる区画のすべてに渡って 周二乗面積比の平均値を求める.ただし,区画の面積に比例した加重平均をとる.
ただし
区画面積の分散を修正した量
地図上に指定された正方領域において,この領域に含まれる区画の面積の分散を ,平均を とし,以下の量に着目する.
分散に基づく指標なので,合同な区画だけからなる領域では最小値 をとる.
連の長さを修正した量
上記の と似た量を 次元で考える.地図上の領域を横切る直線上において道路中心線でな いピクセルが続くかたまり,つまり連の長さの分散を求めて,それを平均値の二乗で割る.
この実験で用いる地図画像ビットマップにおいては道路中心線が黒,そうでない部分が白で 表わされたモノクロ ファイルを基に (黒)と (白)のビット列を作る.(詳しくは次章 参照)こうして得たビット列について, の連の長さの分散 と平均 を求め
を求める.画像に対して縦・横方向から生成したビット列についての の平均値を求め,次 に斜め 度・ 度の方向から生成したビット列についての の平均値を求める.こうして 得たふたつの平均値のうち,小さい方を とする.
用語の説明
周二乗面積比と面積の分散を基にした指標
倉本 は,(地図を)スキャンする角度による影響を軽減する方法として,指標 式 式 を用いて,回転により不変な指標 式 を提案した.
と定義して,角度によらない指標
を考案した.
第 章 格子状図形のための近似エントロピー
近似エントロピーの定義
与えられた道路区画地図を元に,地図上の領域を横切る直線上において道路中心線でないピ クセルが続くかたまり,つまり連の長さからなる列を作る.その数列に対して,近似エントロ ピーを(計算して)求める.具体的には以下の通りである.
この実験で用いる地図画像ビットマップにおいては道路中心線が黒,その他の部分が白で表 わされている.与えられた の正方形領域を以下の 方向からスキャンし, (黒)
と (白)の列を作る.ここで,行は水平の並び,列は垂直の並びを表わす.
( )上の行から順に,左から右へスキャン(英文方式)
( )右の行から順に,上から下へスキャン(和文方式)
( )正方形領域を反時計回りに 度回転させてから,上の行から順に,左から右へスキャン
( ) と同様に正方形領域を反時計回りに 度回転させてから,右の行から順に,上から 下へスキャン
ただし,( )( )を行う前に, の形のブロックを に修正し,さらに
を に修正する.これは,斜めの線を連結にするためである.
第 章 格子状図形のための近似エントロピー
こうして得た つのビット列の各々について, の連の長さを並べた列 ここで
を作り,この に対し , として を求める. の定め方については,次 の節で述べる.
図 部分列イメージ図
ここで,
( )
となる長さ の部分列を作るが,適用する対象が地図であるため,図 (右側で)太字で示 した行を跨ぐ部分列 は含まないものとし,その総数を とする.
パラメータ , の決定
次に
を満たす の個数
と定義する.そして,この部分列のうち, すなわち を満たす の数を求 める.
ここで, とおき,その平均を とする.
このとき, は
と定義される.また,近似エントロピー を
で定義する.
パラメータ , の決定
第 節では,近似エントロピーを計算する際,パラメータ , を , と設定し ているが,これは以下のような理由からである.
相似拡大による影響が小さい.
長方形格子からの乖離度を最も顕著に反映している.
節参照
以下では,パラメータを決定するために行った,単純モデルによる考察について述べる.
第 章 格子状図形のための近似エントロピー
パラメータ の決定
パラメータ は,式 の を数え上げる際の誤差ととらえることができるため,例え ば対象となる図形を 倍に拡大した場合,誤差 も 倍となるのが妥当である.しかし,
とすることにより,近似エントロピーを相似拡大の影響を受けにくい指標としたい.
例として,図 の二つのモデル図形が与えられたときを考える.
図 相似図形
このとき, で与えられた部分列のうち
を満たす の個数である を求めるのであるが,2つの図形は相似であるので
パラメータ , の決定
ゆえにパラメータ は相似拡大の影響を受けるが, とすると
より,各々の図形における , , の値は等しくなる.ゆえに,
としたとき,相似拡大の影響を最小限に抑えることができる.
パラメータ の決定
図 格子図形の変形
は,与えられたデータ列 についての部分列を作る際の各部分列の長さである.本研究 では,部分列をつくるとき,行を跨ぐものは排除している 第 節参照 .ゆえに,対象となる 正方形領域の分割数による影響を受ける.分割数の少ない場合を考えたとき, が1行に含ま れる白い連の個数よりも大きくなると,計算対象となる数列から排除されてしまう.そのため,
は出来るだけ小さな値としたい.そこで,本研究では として近似エントロピー,およ び を求める.これは,近似エントロピーと を求めることができる最小の の値である.
さらに,図 のようなモデル図形について考察する.これは,正方領域を 分割・ 分 割・ 分割した格子図形を のモノクロ ファイルとして与えられたとき,
その中に含まれる直線を三角関数によって歪ませたものである.実際には,格子図形内に含ま れる交点から交点までを 周期とし,振幅を づつ増やして歪ませ,歪みの度合いに変化を
第 章 格子状図形のための近似エントロピー
つけている.ただし,歪んだ格子状図形は,元の格子状図形と同相であるもののみを対象とし,
その範囲内で振幅を増加させるものとする.
を図 のようにおき,振幅を としたとき
の近似値をプロットしている.
a
ia
i+1b
jb
m0
256
256
256
b
1a
1図 振幅モデル図形
として, で を変化させ,正方形領域の分割数が異なるモデル図形に対 し を計算するシミュレーションを行った.その結果,いずれの分割の場合においても,
としたとき,振幅 の増加に伴い, の値が増加することがわかった.このことか ら,本研究においてパラメータ とすることを妥当と考える. シミュレーション結果に ついては第 章参照
何が表わせるのか
図 分割格子図形の近似エントロピー
何が表わせるのか
第 節で用いた格子図形を三角関数によって歪ませたものを対象とし,面積の分散と近 似エントロピー( ), との関連性について述べる.
図 のように周囲の境界を含んだ四角形は黒く塗りつぶし,考えないものとする.このと き,近似エントロピーが適用される白ピクセルで構成される部分の面積は曲線の振幅の増加に よらず,ほぼ一定に保たれている.
このモデル図形に対して近似エントロピーの計算を施すと格子の歪み,つまり振幅が増すに つれ, の値は増加していることがわかった.つまり,近似エントロピーは,面積の分散 に殆ど変化のないモデルにおいても,振幅を表わすことができると考えられる.ただし,その 反面,近似エントロピーの大小によって面積の分散を表わすことは出来ないこともわかる.
第 章 格子状図形のための近似エントロピー
図 格子図形
観察された現象
前節で述べたシミュレーションを行った結果,ほぼ全てのモデル図形において,格子の歪み,
つまり振幅が増すにつれ, の値は増加する.しかし,その一方で の値は減少するとい う減少が観察された.
図 と図 は分割の異なるモデル図形に行ったシミュレーションをまとめたものである.
この現象については,次章で詳しく分析をする.
観察された現象
図
図
第 章 と の間の負の相関
観察された現象としての負の相関
第 節におけるシミュレーション結果により, と が「負の相関」をもつことが示 唆される.本節では,四辺形に限定して, と が「負の相関」をもって動くことを証明 する.与えられた四辺形に対し,第 節で定めた方法によって近似エントロピーを計算する ことを考える.このとき,四辺形に僅かな変形を施し,長方形へ近づけていくと, は増加 し, は減少することを示す.(図 図 参照)
単純化したモデルにおける数学的証明
図 モデルとなる四辺形における長さのグラフ
平行な辺を 組もつ四辺形について第 節 で定義した 方向で長さをとったとき,その
第 章 と の間の負の相関
グラフは平行な部分を つ持ち,それに直線を張り合わせたものになる.
ここで,最も単純なモデルとして図 のような図を考える.このとき,第 節 で定 義した 方向で長さをとったグラフは図 のようになる.
の場合を考える. は,閉区間 で定義された正値折れ線関数である.
さて, を小さい正の数とし,
となる自然数 をとる.また, は より十分小さい正整数とする.
各 に対し,
とおく. をランダムにえらぶとき, となる確率を とおく.
となる をとり, なる を1つ固定してランダムに を選ぶ とき
単純化したモデルにおける数学的証明
また, なる を1つ固定してランダムに を選ぶとき
したがって, と をランダムに選ぶとき
ここで, を少し に近付けるとき,すなわち を少し に近付けるときを考える.
の と の差分をとり
に注意すると, の値が減少するとき は増加することがわかる.
同様にして
ここで, を考えると
第 章 と の間の負の相関
この式について と の差分を考え
の分子が であることに注意すると の値が減少するとき は減少するこ とがわかる.したがって,このとき も減少する.
以上より,与えられた四角形が長方形へ近づくとき, は増加し, は 減少することが示された.
と の間の負の相関についての反例
前節までに,対象が四辺形を多く含む場合, と が負の相関をもって動くことを示し た.しかし,これは一般に言えることではない.
本節では, つのデータ列に対して,近似エントロピーと の間に「負の相関」が成り立た ない例をあげる.
二つの数列
を例にとる.
は,自然数 に対して,
となる.
のとき を満たす の個数は ,また のときは
と の間の負の相関についての反例
となる.よって,
となる.
同様にして
一方, の の値は
・
・
が十分大きいとき
より はともに増加する.さらに
より近似エントロピーも増加する.
第 章 と の間の負の相関
負の相関の応用:指標の提案,計算量の半減
前節までにより,対象を四辺形に限定した場合,近似エントロピーと が「負の相関」をも つことが示された.これにより,近似エントロピーによって定められる「複雑さの」相対的大 小は のみの計算によって求めることができるとみなせる.よって,道路区画地図の複雑さの 指標として近似エントロピーの代わりに を用いることを提案する.
近似エントロピーは という数列の階差で定義されている.ゆえに,新 指標として を採用することにより,近似エントロピーを計算する方法に比べ,計算量を約半 分にすることができる.
第 章 適用例
本章では,第 章で提案した方法を実際の道路区画地図へ適用し, の値を算出し,結果を 検討する.
道路区画地図への適用実例
本節で用いた地図データは,国土地理院が発行する 版数値地図 , を用い,
道路中心線だけを抽出したものである.そのなかでも東京都世田谷区・目黒区,および京都市 中京区のものを扱い,それらをモノクロ ファイルに変換した.ここまでは,倉本 と同 様の条件である.
このモノクロ ファイルに変換された地図データに対し,近似エントロピーによる複雑 さの数値化を行う.ただし,第3章で示した通り,「近似エントロピー」によって定められる「複 雑さ」の相対的大小は のみで求められる.そこで,本章では近似エントロピーの代わりに を用いる.詳しくは次の通りである.第2章の方法により, つの ファ イルに対して, の方向から求めた つの値を求める.このとき 方向での の 値を 方向での の値を 方向での の値を 方向での の値を と して
を与えられた地図データの値として採用する. 第 節参照
第 章 適用例
表 の平均と分散 平均値 分散 東京
京都
表 の平均と分散 引用 平均値 分散 東京
京都
表 の平均と分散 引用 平均値 分散 東京
京都
第 節の計算方法を京都市中京区,ならびに東京都目黒区,世田谷区の地図へ適用した結 果における,数値の分布は 図 図 のようになった.
京都は,一般に格子状の道路網が多い地域であるといわれる.ここで,東京と京都のシミュ レーション結果を比較してみると表 表 表 のようになった.
京都市中京区の の値の平均値は ,その一方で東京都目黒区・世田谷区の平均 値は となった.倉本の提案した指標 と比較すると,平均値においても,東京 都と長方形格子に近い京都市の特徴の違いが現れる結果となった.さらに,図 図 から も分かる通り,数値の分散においては, 地域の特徴の違いがはっきりと表れる結果となった.
分布表については第 章参照
道路区画地図への適用実例
塗り分け方法
本節では,第 節での結果を元に,塗りわけを行う. の値が低くなるにつれて,青 緑 黄色 橙色 赤となるように 段階に塗り分けている.
対応する色 赤 橙 黄 緑 青
図 使用した地図データ(京都市中京区)
道路区画地図に対して近似エントロピー,および を計算するにあたり,地図データを の正方形領域に分割する必要がある.(第 節参照)しかし,正方形領域 に分割したことによって,元の地図データでは つの区画だったものが,分割されてしまう可能 性が考えられる.このとき,近似エントロピー,および の値は,分割の方法によって異なっ てしまう.
よって,本研究では,倉本が用いた塗り分け領域を採用している.具体的には,与えられた 正方形領域の中心部に元の正方形領域1辺の長さの 倍の長さの小正方形領域を考える.こ の小正方形領域の面積は,元の正方形領域と比べて 倍でおよそ半分となる.
第 章 適用例
また,塗り分け結果は第 節に掲載している.
第 章 まとめ
近似エントロピーは という数列の階差で定義されている.この近似エ ントロピーという概念を道路区画地図のような,長方形格子に近い対象へ適用した場合,その 性質から,道路の歪みの度合い,つまり波打ちの程度を表わすと考えられる.このことは,第 章・第 章で行った長方形格子を歪ませたモデル図形を用いたシミュレーションにより示さ れた.その一方,地図に含まれる閉曲線で囲まれた部分(以下区画という)の分散は反映され ないこともわかった.
さらに,このシミュレーションにおいて,近似エントロピーの値と が「負の相関」を持つ という現象がみられた.
また,対象を四辺形に限定した場合に「四辺形を微小変形して長方形に近づけるとき近似エ ントロピーは増加し, は減少する」ことを数学的に示した.
各区画が四辺形に近い道路区画地図においても,近似エントロピーと の間に同様の関係が 成り立つとみなせる.
このことを応用し,道路区画地図の複雑さの指標として近似エントロピーの代わりに を用 いることで,近似エントロピーを計算する方法に比べ,計算量を約半分にできる.これにより,
計算の効率化を実現することができる.
また, を求める際には, の 方向から求めている が,表 からも見ら れる通り,通常の格子図形と斜め格子図形の結果には,大きな差異がみられた.このことから,
の値は角度の影響を受けやすいと考えられる.この影響を軽減するため, の 方 向から求めた値に対し, の平均, の平均を求め,その最小値をとった.
そして,本研究で提案する指標 を実際の京都市中京区,ならび東京都目黒区・世田谷区の
第 章 まとめ
道路区画地図へ適用した結果,倉本の提案した周二乗面積比・区画面積の分散に基づいた指標 と比較すると,京都など長方形格子が多く含まれる地域と入り組んだ路地が多く存在する東京 との差を明確に表わすことがわかった.
第 章 付録
基準図形におけるシミュレーション
基準図形一覧
図 複雑さが低い図形
第 章 付録
図 複雑さが中程度の図形
基準図形におけるシミュレーション
図 複雑さが高い図形
第 章 付録
シミュレーション結果
表 基準図形における
格子図形におけるシミュレーション
格子図形におけるシミュレーション
モデル格子図形
分割 分割
分割 分割
第 章 付録
シミュレーション結果
図 正方領域を 分割する格子図形についての近似エントロピー
図 正方領域を 分割する格子図形についての近似エントロピー
格子図形におけるシミュレーション
図 正方領域を 分割する格子図形についての近似エントロピー
図 正方領域を 分割する格子図形についての近似エントロピー
第 章 付録
その他の指標との比較
Phi 0f Kyoto
-7 -6 -5 -4 -3 -2 -1 0
020406080
図 の分布(京都市中京区)
図 の分布(京都市中京区)
その他の指標との比較
Phi 0f Tokyo
-7 -6 -5 -4 -3 -2 -1 0
0100200300400
図 の分布(東京都目黒区・世田谷)
図 の分布(東京都目黒区・世田谷)
第 章 付録
図 の分布(京都市中京区)
図 の分布(京都市中京区)
その他の指標との比較
図 の分布(東京都目黒区・世田谷)
図 の分布(東京都目黒区・世田谷)
第 章 付録
図 と の相関グラフ(東京都目黒区・世田谷), 相関係数
図 と の相関グラフ(京都市中京区), 相関係数
その他の指標との比較
図 と の相関グラフ( 分割格子状図形), 相関係数
図 と の相関グラフ( 分割格子状図形) 相関係数
第 章 付録
図 と の相関グラフ( 分割格子状図形) 相関係数
図 と の相関グラフ( 分割格子状図形) 相関係数
塗り分け結果
塗り分け結果
を用いた塗りわけ(左)と倉本 (右)である。
京都市中京区の塗り分け結果
図 図
図 図
第 章 付録
図 図
図 図
図 図
塗り分け結果
図 図
図 図
第 章 付録
東京都目黒区・世田谷区の塗り分け結果
図 図
図 図
塗り分け結果
図 図
図 図
図 図
第 章 付録
図 図
図 図
図 図
塗り分け結果
図 図
図 図
図 図
第 章 付録
図 図
図 図
図 図
塗り分け結果
図 図
図 図
図 図
第 章 付録
図 図
図 図
塗り分け結果
図 図
第 章 付録
図 図
図 図
塗り分け結果
図 図
図 図
図 図
第 章 付録
図 図
図 図
図 図
塗り分け結果
図 図
図 図
図 図
第 章 付録
図 図
図 図
図 図
謝辞
指導教官である鈴木登志雄准教授に深く感謝いたします.鈴木准教授には,本研究を進める にあたり,終始懇切丁寧なご指導と助言をいただくと共に,研究以外のことに関しても多くの 助言をいただき,ご指導賜りました.また,ご指導くださった岡田正已教授,そして村上弘准 教授に深くお礼申し上げます.
同研究室の畠山友司氏をはじめ,研究室のメンバー,同窓生のみなさんへ,この場を借りて 感謝の意を表します.
最後に,著者を支えてくれた多くの皆様に厚くお礼申しあげます.
参考文献
第 章 付録
川村保敬 ランダムなビット列における連:ブール決定木の複雑さと道路区画地図への応 用
倉本亮介 道路地図複雑さ数値化法における可変単位地区問題
国土地理院 数値地図 (独自形式)近畿 版
国土地理院 数値地図 (空間データ基盤)関東 版