• 検索結果がありません。

土木学会論文集 D3( 土木計画学 ), Vol. 71, No. 2, 31-43,

N/A
N/A
Protected

Academic year: 2021

シェア "土木学会論文集 D3( 土木計画学 ), Vol. 71, No. 2, 31-43,"

Copied!
13
0
0

読み込み中.... (全文を見る)

全文

(1)

地価公示・都道府県地価調査における標準地・

基準地点の配置問題への地球統計学の応用

村上 大輔

1

・堤 盛人

2 1国立環境研究所 地球環境研究センター(〒305-8506 茨城県つくば市小野川 16-2) E-mail: [email protected] 2筑波大学教授 システム情報系 社会工学域(〒305-8573 茨城県つくば市天王台 1-1-1) E-mail: [email protected] サンプル(標本)の適切な抽出方法の設計は,統計学における大きな関心事の一つである.空間データを 対象とした空間統計学の一種である地球統計学においてもその重要性は同様であり,サンプル地点の配置 の議論が近年活発化している.本研究では地価公示・都道府県地価調査における標準地・基準地の選定の 問題,本稿では特に削減の問題を例に,地球統計学に基づくサンプリングデザインの方法の応用を試みる. まず,標準地・基準地がどのように選定されているかを概観する.次に,地球統計学の関連研究を簡単に整 理した上で,地価公示・都道府県地価調査の主旨に整合したサンプリングデザインの方法を提示する.最 後に,提示した方法を用いて茨城県内の地価公示と都道府県地価調査における標準地・基準地の地点を削 減する問題を解きその有用性を確認する.

Key Words: sampling design, geostatistics, officially assessed land price, prefectural land price

1.はじめに

財政健全化が喫緊の課題である我が国において は,近年,行政コスト削減を目的とした様々な公的 統計調査の効率化や調査規模の縮小などが議論され ている.地価公示や都道府県地価調査(以下,本稿 ではこれらを「公的地価調査」と総称する)について も例外ではなく,平成 24 年国土交通省行政事業レ ビュー(事業番号:10 事業名:地価公示)では,「他 の土地評価制度との関係を整理した上で,標準地の 地点数の絞り込みを行い,より効率的に事業を執行 すべき」との抜本的改善を指摘され,平成 25 年度に おいて 10%以上(過去最大の削減)の予算削減措置 を実施している.そのような中で,地価公示のあり 方に関する検討会(2013)1)においても,公的地価調 査において必要な標準地点数等について議論をして いるものの,そこでは,「市区町村単位で,用途毎・ 一定の幅の価格帯毎に 1 地点は標準地が必要である と仮定し,これを全国的に積算することで必要な標 準地数を求めることができる」(報告書 pp. 27‒28)と いう素朴で理論的根拠が明確でない議論に留まって おり,統計学的な観点からの検討はなされていない. 公的地価調査の規模の縮小が余儀なくされている 中で,標準地/ 基準地の削減は大きな関心事である. 地価調査地点の選定や削減といった,広く標本点の 空間配置を決定する問題は「サンプリングデザイン (sampling design)」と呼ばれ古くから議論されてき た.Wang et al.(2012)2)によればサンプリングデザ

インのアプローチは(i)design-based approach と(ii) model-based approach に分類できる.

(i)は一定の規則に基づいて標本点を配置するア プローチであり,例えば一様乱数を用いて配置を決 める無作為抽出法(simple random sampling),一定間 隔で規則的に標本点を配置する系統抽出法(system-atic sampling),属性(例えば地域や年齢など)毎に標 本をグループ化し,分割毎に無作為抽出を行う層化 抽出法(stratified random sampling),標本を予めグルー プ化した上で,無作為にグループの一つを選択し, 次に選択されたグループの中で無作為抽出を行う二 段階抽出法(two-step sampling)などがある(Gruijter (1999)3)).Ripley(1981)4)によれば,標本に関する 事前知識がない場合は系統抽出法が,標本値が属性 に強く依存する場合は層化抽出法が,それぞれ良好 な結果を与える.アンケート調査等における標本の 抽出には design-based approach が用いられることが 多い.

(2)

(ii)は何らかのモデルを元に標本点の配置を最適 化するアプローチである.(ii-1)確定論的モデルを 用いた最適化はオペレーションズ・リサーチの分野 で 活 発 に 議 論 さ れ て き た(例 え ば 宮 川 ほ か (2004)5)).特に,需要者からの総移動距離の最小化 に基づいて p 個の施設の配置する p-median 問題や, 需要者からの最大移動距離の最小化に基づいて施設 を配置する p-center 問題には膨大な研究蓄積があ る.一方,自然科学分野においては,space-filling

design(Nychka and Saltzman(1998)6))が確定論的モ

デルを用いて空間的に均一に標本点を与える手法と して知られている.(ii-2)確率論的モデルを用いた 最適化は主に自然科学分野で議論されてきた.例え ば,線 形 回 帰 モ デ ル を 用 い る 方 法(e. g., Silvey (1980)7))や地球統計学(e. g., Cressie (1993)8) の手法を用いる方法(e. g., Zimmerman(2006)9))な どは代表的な手法として知られている.地球統計学 の方法は,データの空間変動を明示的に考慮して配 置 を 最 適 化 で き る 点 で 優 れ て お り(Brus and Heuvelink(2007)10)),近年特に研究が活発である. サンプリングデザインについてより詳しくは,Zidek and Zimmerman(2010)11),Wang et al.(2012)2)を参 照されたい. (ii)の各手法は,調査地点の削減問題を含む調査 地点の最適配置の問題に応用可能と考えられる.し かしながら,筆者らの知る限り,(ii)の手法を標準地 / 基準地の配置問題に応用した研究は皆無である. また,(ii)の従来手法は,そのままでは利用目的の多 様性や標準地/ 基準地の既往の配置基準といった地 価調査データの特性(4 章(1)参照)を考慮すること ができない.そこで本研究では,(ii)の中でも特に 研究が活発な地球統計学の手法を地価調査データの 特性を明示的に考慮できるように拡張した上で,標 準地・基準地の配置問題に応用する.なお,本稿で は特に既存の調査地点の削減に焦点をあてるが,3 章(2)でも議論するように,以降の議論は新規追加 地点の探索などにも応用できる. 次章では,地価公示及び都道府県地価調査におい て標準地・基準地点がどのように選定されているか を概観する.第 3 章では,地球統計学におけるサン プリングデザインの手法を説明し,第 4 章において 地価公示・都道府県地価調査の主旨に沿ったサンプ リングデザインの方法をいくつか示す.第 5 章では それらの方法を茨城県の地価公示及び都道府県地価 調査を例に標準地・基準地の削減の問題に適用し, その結果について考察する.最後に,第 6 章で本研 究の成果を総括する.

2.地価公示と都道府県地価調査

地価公示は,地価公示法に基づいて国土交通省土 地鑑定委員会が『標準地』について,毎年 1 月 1 日に おける当該標準地の単位面積当たりの正常な土地価 格を公示するものである(地価公示法第 2 条 1 項). ここで正常な価格とは,自由な取引が行われるとし た場合に,その取引において通常成立すると認めら れる価格を意味する(地価公示法第 2 条 2 項).地価 公示の標準地は,都市計画区域その他の土地取引が 相当程度見込まれる区域内という条件(地価公示法 第 2 条 1 項)の下で,次の 4 つの基準により選定さ れる(国土交通省(2012)12)). 代表性:市町村の区域内において,適切な近隣地 域に分布し,当該区域全体の地価水準をできる 限り代表しうるものであること. 中庸性:標準地が選定される近隣地域において土 地の利用状況,環境,地積,形状等が中庸のもの であること. 安定性:できる限り土地の利用状況が安定した近 隣地域にあって,当該地域の一般的な利用目的 に適合したものであること. 確定性:標準地は,土地登記簿,住居表示,建物, 地形等によって明確に他の土地と区分され,か つ容易に確認できるものであること. 4 つの基準に対する各標準地の適合性は毎年点検 されており(原則として 9 月 1 日から翌年 1 月 1 日 の間),4 つの基準のうちの 1 つでも欠けた標準地に ついては選定替えを行うこととなっている(国土交 通省 (2012)12)). 一方,都道府県地価調査は,国土利用計画法施行 令第 9 条に基づいて,『基準地』について,都道府県 知事が毎年 7 月 1 日の正常な土地価格を公示するも のである.地価公示とは異なり,都道府県地価調査 の調査地点を表す基準地の選定基準は明確には定め られていない.但し,実際には地価公示と同様の 4 つの基準に基づいて配置場所を選定している都道府 県 が 多 い(地 価 公 示 の あ り 方 に 関 す る 検 討 会 (2013)1)).また,基準地は,地点・時点の双方につ いて地価公示データを補う役割を担っている.その ため,基準地は,標準地の少ない都市計画区域外に も比較的多く分布しているという特徴を有する. 既述のように公的地価調査の調査地点の選定(配 置)や削減を議論した地球統計学の研究は筆者らの 知る限り皆無である.次章と次々章において,地球 統計学のモデルを用いて地価調査データのサンプリ ングデザインを適正に評価する方法を説明する.

(3)

3.地球統計学とサンプリングデザインの概説

(1)モデル 地球統計学のモデル(以後,地球統計モデル)と は,対象範囲 D⊂ℜ上の地点 s nD(n∈1, … N )で 観測されたデータ z(sn)の潜在的な空間過程を記述 するものであり,一般に式(1)で与えられる. z=Xβ+ε ε~N 0,C (1) zは N ×1 の被説明変数ベクトル,Xは N × K の説 明変数行列,βは K×1 のパラメータベクトル,εは N × 1 の撹乱項ベクトル,0はゼロを要素に持つ N×1 のベクトルである.Cは N×N の共分散行列であり, その要素を共分散関数と呼ばれる距離 dn, n 'の減衰 関数で与えることで空間データの一般的な性質であ る空間的相関(近接したデータが類似した傾向を示 す性質)を考慮する.式(1)は,データの潜在的な 空間過程が大域変動(Xβ)と局所変動(ε)で記述さ れることを仮定したモデルである. 共分散関数には,例えば球型モデル式(2)が適用 できる. cd=

τ +στ +σ fd  0 if if d=0 0<d<r otherwise (2) f d=

3d2rd2r

τ,σ,rは,それぞれナゲット(nugget),パーシャ ルシル(partial-sill),レンジ(range)と呼ばれるパラ メータであり,それぞれ空間的相関で説明される攪 乱の大きさ,空間的相関に説明されない攪乱の大き さ,空間的相関の及ぶ距離を表わす. 地球統計モデルを用いることで,任意地点 s0∈D のデータzsの予測値や期待二乗誤差を求めること ができる.いま,zsが式(3)に従うと仮定する. zs=s β+εs (3) 「 ' 」は転置の演算子,sは地点 s0の説明変数から なる K × 1 のベクトル,εsは同地点の攪乱項であ る.不偏かつ線形という制約の下で地点 s0の期待二 乗誤差を最小化することで,zsの最良線形不偏予

測量(Best Linear Unbiased Predictor:BLUP )式(4) が得られる. zs=s β+cCz−Xβ (4) β=XCX XCz c は各観測地点と地点 s0の攪乱項の共分散を表す N × 1 のベクトルであり,各要素は共分散関数に基づ いて与えられる.zsの期待二乗誤差は式(5)とな る. Ezs−zs  =σ−cCc+ −cCX XCX −cCX (5) 地球統計学とは自然科学の分野で発達した一分野 であるが,サンプリングデザイン以外の問題に関し ては,公的地価調査のデータへ適用し,その有用性 を 指 摘 し た 研 究 も 見 ら れ る(例 え ば 井 上 ほ か (2006)13),堤ら(2014)14)).地球統計モデルについ て,より詳しくは Cressie (1993)8)や Schabenberger and Gotway (2004)15)を参照されたい. (2)サンプリングデザイン a)目的関数 地球統計モデルを用いた最適なサンプリングデザ インの特定は,一般に イ)目的関数の設定 ロ)目 的関数の最小化による最良の配置の特定 の手順を 踏むことで行われる.目的関数としては,例えば重 み付けられた期待二乗誤差の平均値や最大値があり

(Zhu and Stein(2005)16)),それらを下式の通り最小

化する. min i CS=min i ∑wcS (6) min i CS=min i max wcS (7) S は調査地点数が所与の下でありうる全調査地点配 置の集合を表す.Si(添え字:i = 1, 2, . . . I )は集合 S が含む配置の一つを表し SiS = {S1, S2, . . . SI}と定 義される.m ∈{m1, m2, . . . mM}は,評価地点とは 独立に,別途対象地域 D⊂ℜ上に稠密に配置された M 個の地点(図-1 参照),wmは地点 m の重み,cSは配置を Siとしたときの同地点における期待二乗誤 差Ezs−zs  である.またwcSは配置 Si の下での地点 m における損失と考えることができ る. 目的関数(6)または(7)は,この対象地域上に稠 密に配置された各地点における損失wcSの平均 値 CS=∑wcS ま た は 最 大 値 CS=max wcSを最小化することで,最適配 置を探索する(図-1 参照).いずれの目的関数を用 いたとしても,地理空間上のデータ分布と説明変数 で規定される特徴空間上のデータ分布の両方を考慮 し て 配 置 を 最 適 化 で き る(Brus and Heuvelink

(2007)10)).但し,式(6)を用いた場合,対象地域 全体での配置の精度は良好となるものの,特異的に 精度の低い地域は残る可能性がある.一方で式(7) を用いた場合,特異的に精度の低い地域は現れない ものの,全体としての精度は式(6)を用いた場合よ りも低くなる.いずれかの目的関数を最小化するこ

(4)

とで得られる大域最適解 Si*は式(8)で定義できる. S=arg min i CS (8) ここで g ∈{1, 2}である. b)最適配置の探索 網羅的探索による Si*の探索は S の要素数が膨大と なるため通常は困難である.さらに,最適配置問題 は NP 困難(NP-hard)であり,最適配置を多項式時 間で探索することですら困難であることが一般に知 られている.従って,大域最適解 Si*を現実的な時間 内で精度よく近似するアルゴリズムが必要となる. Simulated Annealing 法(SA 法: Kirkpatrich et al.

(1983)17))はそのようなアルゴリズムの一つであ る.配置する評価地点数が所与の下で,SA 法を用い て配置の大域最適解を探索する手順は次の通りであ る. (i) 初期配置 S0とパラメータ T の初期値 T0を与 える. (ii)(ii-a),(ii-b)を交互に k 回繰り返す. (ii-a)現在の配置 Si_aと,そのうちの 1 地点を無 作為に別の地点に移動させた配置 Si_bを定義す る.

(ii-b)Si_a,Si_bの両ケースについて目的関数の

値を求め,Si_aの場合の値がより良好である(小 さい)場合は確率 1 で,そうでなければ式(9) に示す確率で Si_aを Si_bに置き換える. exp

CS_−CS_T

(9) (iii)T を pT に置き換えて(ii)に戻る.ここで p (0 < p < 1)は T の減衰率を表わす.p を極限ま で 1 に近づけることで SA 法の近似解は,理論 的には真の大域最適解に一致することが知られ ている(Kirkpatrich et al. (1983)17)).但し,p が 1 に近いほど収束までの計算時間は長くな る. T0の 与 え 方 の 一 つ に 式(10)が あ る(Brus and Heuvelink(2007)10)). T= CS−CS M log 0.8 (10) S は手順(ii-b)で改善のみを許容して SA 法を実 行した場合に得られる最適配置を表わす.(10)式で T0を与えることは,初期状態において 80% の確率で CSの改悪を許容することを意味する.なお,配置 Siを更新する度に cm(Si)=Ezs−zs  の値は 変化するため,配置を変更したが式(7)が変化しな いという事態は通常は起こらない.即ち,最大値に 基づく最適化は総和に基づく最適化と同等の計算効 率を有する. 以上の最適化は様々な問題に応用できる.例えば 対象地域 D 内の調査地点を nc個削減する場合であれ ば,最初に nc個の調査地点を無作為に削減すること で配置 S0を定義し,以降は配置 S0(Si_a)の中の 1 地 点を選択し既に削減されている nc地点の中の 1 つで 置き換える,という操作を手順(ii)で繰り返すこと で最適配置が探索できる.また,D 内に nc個の新た な調査地点を追加する場合であれば,既存の調査地 点とそれ以外の nc地点(対象地域上に稠密に配置し た地点集合の中から nc個の地点を選択)から成る配 置 S0を定義し,nc地点の配置を手順(ii)で更新して いくことで最適配置が探索できる.以上の手順はい ずれも 1 回の SA 法に基づいており,p が十分に 1 に 近い場合に,それらの近似解が大域最適解を精度よ く近似することが示されている(Kirkpatrich et al. (1983)17)). 調査地点を削減(追加)する手順には,SA 法を 1 回適用する上記の方法の他に,1 地点を削減(追加) する SA 法を nc回繰り返す方法も考えられる.しか しながら,上述の方法とは異なり,この方法が大域 最適解を精度良く近似する保証はない.例えば,100 地点を削減した後に 101 地点目を削減するよりも 1 地点を追加した方がかえって目的関数が改善すると いうことも起こりうるが,この方法では地点の追加 を考慮できない.従って,以降ではこの方法につい ては議論しない. また,最適配置問題としては,上述の D の内部だ 図-1 最適配置探索のイメージ(10 の評価地点のうちの 3 つを削減する場合).10 地点{(黒円:●)+(白 円:○)}のうちの 7 地点からなる配置(黒円のみ の集合はその一例)Siを最適化することとなる. この場合の S の要素数は10C7= 120 である.最適 配置 Si* の探索は,対象地域上に別途稠密に配置さ れた M 個の各地点(ここでは 30 個の灰色の点: ■ )における損失 wmcm(Si)の平均値または最大 値を式(6)または式(7)で最小化することで行う. この M 個の各地点は,wmcm(Si)を評価のためだ けに,評価地点とは独立に与えられる.例えば 4 章以降では,これらの地点は町丁目の各重心点で 与えている.

(5)

けを調査地点の配置の候補とする問題の他に,D の 内部に加えて D の周辺外部(D' とする)を含めた領 域を対象として調査地点を選定するという問題も考 えられる.この場合には,D の周辺外部である D' 内 の空間過程を内挿ではなく「外挿」をする必要が生 じる.しかしながら,D 内と D' 内の空間過程が同じ であるという仮定が満たされない場合も多く,結果 として外挿の精度は一般に低くなることが知られて いる(Cressie(1993)8)).なお,公的地価調査は全 国で実施されているため,例えば A 県を対象にこれ まで調査地点の存在しなかった県外縁部の陸地の調 査地点を追加するような場合でも,実際には A 県に 隣接する各県のデータが活用できる場合が多いと想 像される.また,地価調査地点は任意地域の地価変 動を一定以上の水準で説明することを担保するため に,例えば郊外部や山間部にも一定数配置されてい る(4 章(1)参照).そのため,外挿を必要とするケー スは実際には極めて稀と考えられる.これらのこと から,D の外部を対象とした配置問題に関しても, 本稿においては,以降,議論しない. 以降では,D 内の既存の調査地点の削減に着目す る.Brus and Heuvelink(2007)10)に倣い T

0は式(10), k=100,p=0. 95 でそれぞれ与えることとする.また, 既往研究に倣い,期待二乗誤差cSを記述するパラ メータτ,σ,r は,調査地点を削減する前の完全デー タで予め推定しておくものとする.この仮定は調査 地点を削減する前の完全データと削除後の不完全 データが同じパラメータ値で説明される,というよ り強い仮定に基づいているが,τ,σ,r は,データ 自体ではなくデータを発生させた潜在的な空間過程 を記述するものである(前節参照).仮に調査地点を 削減したとしても,それに伴って潜在的な(真の)空 間過程が変化することはないため,より大きな情報 量を有する削減前のデータでパラメータを推定する という仮定は妥当と考える.

4.地価調査データのサンプリングデザイン

本章では 3 章(2)で議論したアプローチを地価調 査地点の配置問題に応用する方法を考える.本章 (1)では地価調査地点の配置を議論する際の要点を 整理し,本章(2)では具体的な目的関数を地価調査 データの利用目的毎に設定する.その際の,対象地 域上に稠密に配置される M 個の地点(図-1 中の灰色 の点)は,wmを与えるためのデータ取得の制約から (本章(2)a)参照),町丁目の各重心点(以後,町丁 目重心)で与えることとする. (1)地価調査の特性と評価地点配置 公的地価調査の地点の配置を議論する際に考慮す べき重要なこととして,次のような点が挙げられる. (A)精度 (B)費用 (C)調査地点の配置(選 定)基準(第 2 章で説明)との整合性 (D)利用目 的の多様性 地球統計学の手法を用いて期待二乗誤差の総和 CSまたは最大値CSを最小化することで(A)精 度は考慮される.一方で,そのままでは直接的に(B) 費用は考慮されない.ただし,データ取得に要する 費用の地点毎の差異が比較的小さいと考えられる場 合は,費用は明示的には考慮されないことも多い. 本研究でも,地価評価の(B)費用は,対象地域内の 全ての地点で一律と仮定した上で,明示的には考慮 しないこととする. 地価調査地点の配置基準(C:第 2 章参照)は次の ように要約できる:(C-1)土地取引が相当程度見込 まれる土地であること,(C-2)代表性・中庸性・安定 性・確定性を満足する土地であること,(C-3)任意 の地点・時点における地価公示データの不足を,都 道府県地価調査が効率よく補えていること.地球統 計学の手法は空間的に均一な観測(評価)地点配置 を与えることが知られており(Zidek and Zimmerman

(2010)11)),地球統計学の方法を用いることで(C-3) の空間的な側面での補填性は考慮できる.一方,次 の 2 点を踏まえ,(C-3)の時間的な側面での補填性 は本研究では考慮しないこととした:将来時点の地 価調査データが存在せず,調査地点の削減を議論す る上で重要となる将来における地価の時間変動のモ デル化とその精度検証が困難であるため;評価時点 の地点の設定は,調査日を年に 2 日(1 月 1 日:地価 公示 7 月 1 日:都道府県地価調査)設定するという 既存のフレームを大きく逸脱しており,その実現性 は低いため.(C-2)の代表性・中庸性・安定性・確定 性は必ずしも厳密には定義されていないため,それ らを元に選出されてきた既存の公的地価調査地点が 真にそれらを満足しているかは不明瞭である.しか しながら,少なくとも既存の公的地価調査地点がそ れらの配置基準を満足しているという仮定の下で は,既存の調査地点のみを調査地点を配置する候補 とすることで,(C-2)にも配慮できる.なお,地球 統計学を応用することは,曖昧さを有する基準(C-2) を元に議論されてきた調査地点の配置問題を,統計 的見地から,より定量的に議論するために重要と示 唆される.

(6)

(C-1)を考慮するためには土地取引量に関する 情報を外生的に与える必要がある.また(D)利用目 的の多様性を考慮するためには,各利用目的の特性 を予め十分把握しておく必要がある.しかしなが ら,地球統計学の手法を用いてそれらを考慮する方 法は議論されていない. 以上を要約すると,地球統計モデルを用いること で(A)精度と(C-3)時間上・空間上での都道府県 地価調査の補完性は考慮できる.また,既存の調査 地点を配置の候補とすることで(C-2)規定の 4 つの 配置基準にも配慮できる.(B)費用は一地点当たり の調査に要する費用が一律同額であると仮定すれ ば,結局調査地点の数によって決まることとなるが, 本研究ではそれは所与であると仮定する. 次節では,上記の各点に加えて(C-1)と(D)を 考慮する方法を議論する.具体的には,地価調査 データの配置を利用目的毎に議論することで,(D) 利用目的の多様性を考慮する.また,利用目的の一 つである土地取引については(C-1)見込まれる土地 取引数も考慮して配置を議論する. (2)利用目的毎の目的関数の設定 a)利用目的と重み wm 地価調査データの代表的な利用目的に,(D-1)通 常の土地取引にあたっての土地価格の参照,(D-2) 行政による用地買収・補償にあたっての土地価格の 参照,(D-3)固定資産税や相続税などの課税額の算 定がある. 利用目的が異なれば,当然望まれる調査地点の配 置もまた異なると考えられる.(D-1)通常の土地取 引を対象とする場合であればより多くの土地取引が 見込まれる地域に,(D-3)課税を対象とする場合で あればより世帯数の多い地域に,より多くの調査地 点を配置すべきと考えられる.また,一般に,一定 の領域内の用地買収・補償に必要となる取引の数は 世帯の密集した地域でより多くなると考えられるた め,(D-2)用地買収・補償を対象とする場合につい ても世帯数の多い地域により多くの調査地点を配置 すべきと考えられる. 本研究では町丁目重心毎の重み wmを用いて配置 の優先度を表現することとする.ここまでの議論を 踏まえ,wmは(D-1)通常の土地取引を重視する場合 は各町丁目において見込まれる土地取引の数(以降, 期待取引数)で,(D-2)用地買収・補償または(D-3) 課税を重視する場合は町丁目別の世帯数(出展:政 府統計の総合窓口(http://www.e-stat.go.jp/SG1/estat/e StatTopPortal.do))で,それぞれ与えることとする. (D-1)土地取引を対象とした場合の重み wmであ る期待取引数は,国土交通省土地総合情報システム (http://www.land.mlit.go.jp/webland/)公開の土地取引 事例データをもとに算定する.同データには取引し た町丁目のラベルが付与されており,このデータを 集計することで町丁目毎の土地取引数が算出でき る.しかしながら,提供されているデータはアン ケートへの任意の回答に基づいており,その町丁目 毎の集計値は「特定の町丁目でたまたま回答率が高 かった」というような不確実性に左右されうる.ま た,町丁目あたりの取引数が少ないため「たまたま 対象年に取引が存在した」というような不確実性に も左右されうる.例えば平成 23 年度の場合であれ ば,茨城県内の住宅地取引のサンプル数は 3, 557 で あり,町丁目(総数:3, 945)あたりの取引数は 1 に 満たない. 以上のような不確実性に配慮しながら期待取引数 を評価するために,本研究では Clayton and Kaldor

(1987)18)を用いる.彼らのアプローチは,期待取引 数の確率分布(式 12)を推定し,この確率分布から 逸脱した(高い不確実性を持つ)サンプルを本分布 に近づけることで不確実性に対処しようというもの である.具体的には,まず,町丁目 m における取引 数 tmがポアソン分布(式 11)の実現値であると仮定 する. t~Poissonθ×t (11) tは取引を生じうる母体の数を表わし,本研究で はこれを世帯数で与える.θmは町丁目 m の特性を 表わすパラメータであり,上述のようにtを世帯数 とした場合は町丁目 m における世帯あたり期待取引 数となる.θmはガンマ分布(式 12)に従うものと仮 定する. θ~Gammaa,b (12) a と b はハイパーパラメータである.式(11),(12) より,θmの推定量として式(13)が得られる. θ= t+at+b  (13) θは町丁目 m における世帯あたり期待取引数の 推定量である.θは,世帯数tが少ない程その分母 を共通の水準bに近づけることで,また,期待取引数 tmが少ない程その分子を共通の水準aに近づけるこ とで,不確実性に配慮した推定量である.期待取引 数は,世帯あたり期待取引数θに世帯数tをかける

こ と で 算 出 で き る.な お,Clayton and Kaldor

(7)

b)利用目的と目的関数の型 ミニサム型の目的関数(6)を用いることで配置の 全体としての精度は良好となるものの,特異的に精 度の低い地域は残る可能性がある.一方でミニマッ クス型の目的関数(7)を用いることで特異的に精度 の低い地域は現れないものの,全体としての精度は ミニサム型を用いた場合よりも低くなる. 対象とする利用目的が異なれば望まれる目的関数 の型もまた異なる可能性がある.各利用目的(D)の 特性に着目すると,(D-1)通常の土地取引に際して は地価調査データ,不動産鑑定評価額,近隣の土地 取引額などが参照され,(D-2)用地買収・補償に際 しては,地価調査データに加え,周辺の取引額や見 込まれる収益額などが参照される.従って,(D-1) または(D-2)を対象とする場合であれば,地価調査 データの説明力(あるいは精度)の不足はその他の 参照データで補填できる.一方で,(D-1)や(D-2) の指標としての地価調査データの信頼性を保持する ためには,本データは,任意地点の地価に対して一 定以上の説明力を持たねばならない.そこで本論文 では,(D-1)または(D-2)を対象とする場合は,任 意地点における説明力(精度)の不足を一定以内に 抑えるミニマックス型の目的関数を用いることとす る. 課税額は,税率を通して,地価調査データの値に より直接的に依存するため(例えば固定資産税算定 の基となる固定資産税評価額は地価公示の 7 割程 度,相続税算定の基となる相続税路線価は地価公示 の 8 割程度),地価調査データの説明力(精度)不足 はできるだけ限り小さくすることが望ましいと考え られる.そこで,(D-3)課税を対象とする場合の目 的関数はミニサム型で与えることとする. c)各利用目的の目的関数 以上の議論を元に構築された利用目的毎の目的関 数を表-1 に整理した.各目的関数は,地価調査デー タの利用頻度を表す期待取引数または世帯数 wm期待二乗誤差cSを乗じたwcSを含むが,これ は期待二乗誤差が町丁目 m での地価調査データの利 用に及ぼす損失と解釈できる.また,∑wcSを 最小化する式(6)は対象地域における総損失の最小 化と,max wcSを最小化する式(7)は対象地域 における最大損失の最小化と,それぞれ解釈できる. 本節で構築した目的関数は,3 章(2)b)で議論した 手順で直ちに最小化できる.地球統計モデルを応用 した本最適化は(A)精度と(C-3)空間上での補完 性を考慮するものである(4 章(1)参照).また,wm を導入することで(C-1)土地取引数と(D)利用目 的の多様性もまた考慮している.なお,前述のとお り,(C-2)規定の配置基準は既存の地価調査地点の みを配置の候補とすることで考慮しており,(B)コ ストは調査地点数当たりの調査費用が一定かつ総数 を所与とすることで,ここでは明示的には考慮しな い.また,(C-3)の時間軸上での補完性もまた,4 章 (1)で示した理由で考慮していない.

5.実証分析

(1)概要 本章では,2009 年における茨城県の地価公示デー タと都道府県地価調査データ(ここでは,茨城県内 における 2009 年と 2010 年の両地価公示データの平 均値zとzの間の変化率zzより得られる 半年分の変化率

zzを乗じることで時点調整 を行った)を合わせた標本数 785 の住宅地価を効率 的に削減する方法を,土地取引,用地買収・補償,課 税の各利用目的について検証する.各目的関数は表 -1 に示とおりである.削減数は,各利用目的につい て,全体の 10% のあたる 79 地点,30% にあたる 235 地点,及び 50% にあたる 393 地点の 3 通りとする. cSと wmを与える町丁目の数は 3, 943 である.期 待二乗誤差cSの算出に使用する地球統計モデル (式 1)の被説明変数は地価(円/ m2),説明変数は最 寄りの鉄道駅までの距離(駅距離:km),最寄りの鉄 道駅から東京駅までの鉄道ネットワーク距離(東京 距離:km),各地点を包含する 1km2メッシュ内の各 土地利用の面積(田,その他農用地,森林,荒地,幹 線交通用地,その他用地,河川・湖沼,海浜,海水域, ゴルフ場:m2)とする(表-3).また,共分散関数は 球型モデル(式 2)で与える.パラメータ推定には, 地 球 統 計 モ デ ル の 代 表 的 な 推 定 法 で あ る WLS&EGLS 法(例 え ば Schabenberger and Gotway

(2004)15))を用いる.

(2)パラメータ推定結果

地球統計モデルのパラメータ推定の結果を表-4 に 示す.ここで表中の VIF(Variance Inflation Factor)は

(8)

多重共線性の診断統計量であり,表中の全ての VIF が 10 未満であることは説明変数間に深刻な多重共 線 性 が 生 じ て い な い こ と を 意 味 す る(蓑 谷 (1997)19)). 駅距離と東京距離は 1% 水準で,水戸距離は 10% 水準で負に有意であり,アクセシビリティが地価に 大きな影響を及ぼしていることが確認された.ま た,田,その他用地,森林,及び河川・湖沼がいずれ も 1% 水準で負に有意であり,非都市的な土地利用 が地価を押し下げていることもまた確認された. パーシャルシルが 1. 15 × 108であるのに対して パーシャルシルとナゲットの和は 1. 84 × 108であ る.このことは攪乱の約 62. 5(=1. 15 × 108/ 1. 84 × 108)% が空間的相関で説明されるということを 表す.また,レンジの推定結果は,空間的相関の及 ぶ距離が 6. 48km であることを表す. 次に,データをランダムに 5 分割し,そのうちの 4 つを用いて残りの 1 つを予測するという操作を全パ ターンについて行うことで精度を評価する手法であ 図-2 地価公示データの空間分布 図-3 都道府県地価調査データの空間分布 表-2 地価調査データの基本統計量(単位:万円/ m2 表-3 本研究で使用する変数 表-4 パラメータ推定結果

(9)

る 5-fold cross-validation を用いてモデルの精度を議 論する.まず同手法によって得られた予測値と実測 値を図-4 にプロットした.この図より,各予測値が 概ね実測値と近い値となっていることが確認でき

る.次に Mean Percentage Error(MPE:式 14)を用い て地価の総変動に占める予測誤差の大きさを検証す る. MPE=100 N  zs−zszs (14) ここで,zsは n 番目の地価調査データの実測値, zs は同データの予測値である.計算の結果,MPE は 18. 8 となり,推定された地球統計モデルが地価の 総変動の 81. 2 (=100 − 18. 8)% を説明する程度の 精度を有することを確認した. 一方,期待取引数を記述するポアソンモデル(3 章 (2)a)参照)のパラメータαと b の推定値は,それ ぞれ 0. 309 と 0. 130 となった.a が b に比べて大き いことは,推計式(13) = (取引数+ a)/ (世帯数+ b)において,取引数が共通の水準により強く縮小さ れたことを意味する.茨城県における町丁目あたり の取引数は平均で 1 未満と少なく不確実性が大きい ため,この結果は直感に整合する. (3)評価地点の配置結果 まず,損失wcSがcSまたは wmの増加関数で あることに注意しながら,cSと wmが最適配置に 及ぼす影響を考察したい.cSを表す期待二乗誤 差,及び wmを表す期待取引数と世帯数の空間分布を 図-5,図-6,図-7 に示す.期待二乗誤差は非都市部 (例えば南部の郊外や北西部)の損失を上昇させてお り,調査地点が元々少ない非都市部の調査地点を現 状以上に減らすべきでないことを示している.反対 に,wmを表す期待取引数と世帯数は都市部の損失を 上昇させており,地価調査データの利活用が活発と 見込まれる都市部の調査地点を現状以上に減らすべ きでないことを示している.このように,cSと wmは非常に異なる配置を選好する.従って,地球統 計学ではcSのみを考慮するアプローチが最も広 く用いられているが,地価調査地点の配置問題にお いては,cSと wmの両方を考慮することが重要と なる. (I)土地取引,(II)用地買収・補償,(III)課税に ついての各最適化の結果をそれぞれ図-9,図-10,図 -11 に示す.また,比較のために,元の調査地点配置 についても図-8 に示す.各最適配置には次のような 共通点がみられる.まず,非都市部の調査地点が比 較的多く残存した点である.このことは,非都市部 の調査地点を現状以上に削減してしまうと,非都市 部における損失wcSが増加することを示してい る.非都市部でも一定数のデータ利用が見込まれる ことから,元々少ない非都市部の調査地点を残すべ 図-4 実測値と予測値のプロット 図-5 期待二乗誤差の空間分布 図-6 期待取引数の空間分布

(10)

きという本結果は直感とも整合する.また,各利用 目的について,県庁所在地である水戸周辺で多くの 調査地点が残存し,反対につくば,土浦,日立といっ た中規模の都市周辺では比較的多くの調査地点が削 減された.この結果は,水戸周辺では,期待取引数 と世帯数(wm)だけでなく期待二乗誤差 cm(Si)も大 かったために,一定数以上の調査地点を削減するこ とで損失wcSが増加すること,及び上述の中規 模都市周辺では,期待取引数と世帯数(wm)が比較 的大きいのに対して期待二乗誤差cSは小さかっ たために,調査地点を多少削減したとしてもその影 響は小さいこと,を示している.都市毎の差異や都 市/ 非都市の差異を定量化して調査地点を削減でき る点は,地球統計学の手法を用いることの利点の一 つといえよう. 利用目的毎の結果の類似をみるために,50% の調 査地点の削減を行った際に,利用目的間で共通に削 減された地点の割合を算出した(表-5).この表よ り,(I)と(II)の両結果は類似しており,一方で両 者と(III)との類似は比較的小さいことが確認でき る.この差異は目的関数の違いによるものである (表-1 参照).例えば課税を利用目的と仮定して最大 損失を最小化した(III)は,つくば・土浦・取手で囲 まれた地域や日立周辺において空間的により均一な 配置を与えている(特に 50% 削減時;図-9,図-10, 図-11).空間的に均一な配置とすることは,近隣に 地価調査地点が存在しない世帯を減らし,各世帯で の課税額算定に地価調査データを役立てるために重 要といえよう.但し,(III)の非都市部における配置 結果は(I),(II)と酷似しており,非都市部について は,残存すべき調査地点は,利用目的によらずほぼ 同じとの示唆を得た. 最後に(I),(II),(III)の全てについて削減すべき と評価された地点を図-12 に示す.同図より,削減 が推奨される地点は鉄道駅周辺に多いことが確認で きる.また,10% 削減の場合は取手周辺に,30% ま たは 50% 削減の場合は取手・土浦・日立の各周辺に, それぞれ削減が推奨される地点が多いことも確認で きる.このことは,局所的には鉄道駅周辺に,大域 的には上述の市周辺に期待される以上の調査地点が 配置されており,それらを削減したとしても総損失 が小さく保たれる(即ち,対象地域の地価を精度良 く説明する配置となる)とともに最大損失も小さく 保たれる(即ち,対象地域内の任意地点の地価を一 定以上の説明力で説明する配置となる),ということ を示している.図-12 の結果を踏まえて実際に削減 する調査地点を決めることは,削減後の地価調査 データの質を保証する上で重要といえよう.

6.まとめ

本研究では,公的地価調査事業に対する予算削減 の機運を念頭に,精度や規定の配置基準,利用目的 (土地取引,用地買収・補償,課税)などを考慮しな 図-7 世帯数の空間分布 図-8 地価公示の標準地と都道府県地価調査の基準地の 空間分布 表-5 共通に削減されたデータの割合(50% 削減)

(11)

図-9 最適配置(利用目的:土地取引)

図-10 最適配置(利用目的:用地買収・補償)

(12)

がら地価調査地点を効率良く削減する方法を,地球 統計学の観点から議論・提示した.また,この方法 を茨城県の公的地価調査のデータに適用すること で,重視する利用目的別の最適な削減方法や,削減 が特に推奨される地点などを議論した.本研究は, 筆者らの調べた限りにおいては,我が国の公的地価 調査の調査地点配置を統計学的な見地から議論した 唯一の研究であるとともに,地価調査地点の配置問 題に対する地球統計学の有用性を示した唯一の研究 である. 一方で本研究にはいくつかの課題が残されてい る.まず,最適配置の結果は地球統計モデルの与え 方に強く依存するという Fuentes et al. (2007)20) 指摘に基づけば,地価調査データのサンプリングデ ザインを議論するための地球統計モデルをより詳細 に議論する必要がある.例えば,地価関数の非線形 性を考慮した地球統計モデルである trans-gaussian kriging(e. g., Cressie(1993)8))や geoadditive model

(Kammann and Wand(2003)21))は地価調査データの

空間構造を柔軟にモデル化するという点で本研究で 用いた地球統計モデルよりも優れており,今後,そ れらの本配置問題への応用を検討する必要がある. また,期待二乗誤差以外の誤差指標を用いて調査 地点配置を議論することも重要な課題の一つであ る.例えばz−zzを用いて誤差を評価する誤差 率の性質は,z−z  の期待値を用いる期待二乗誤 差とは異なる.また,地価の調査地点配置を論じる にあたっては,地価水準の高さにかかわらず,同様 に誤差を評価する期待二乗誤差よりも,地価水準の 高さに応じて許容される誤差を調整する誤差率を用 いる方が望ましいとも考えられる.誤差率を用いて サンプリングデザインを議論するための方法論の開 発,ならびにその公的地価データへの適用は今後の 重要な課題といえよう.なお,一般に,地球統計学 のサンプリングデザイン・アプローチは任意地点で 算出可能という期待二乗誤差の特性を活用したもの であり,誤差率をサンプリングデザインに応用する ためには,期待される誤差率を任意地点で求めるた めの方法論が必要となる.

謝辞:Japan Geoscicence Union Meeting 2012 にて議長 である小口高教授(東京大学)より,第 21 回地理情 報システム学会研究発表大会にて議長である貞広幸 雄教授(東京大学)より,それぞれ示唆に富むご指摘 を頂いた.また,両学会への多くの参加者からも有 益なたくさんのご意見・ご指摘を頂いた.加えて, 筑波大学内のゼミにて石田東生教授,谷口守教授, 岡本直久准教授はじめ多くの方からも示唆に富むコ メントを頂いている.ここに記して感謝申し上げ る. 参考文献 1) 地価公示のあり方に関する検討会:地価公示のあり方 に関する検討会 報告書,2013.

2) Wang, J. -F., Stein, A., Gao, B. -B. and Ge, Y. : A Review of spatial sampling, Spatial Statistics, Vol. 2, pp. 1‒14, 2012. 3) Gruijter, J. : Spatial sampling schemes for remote sensing, In

Stein, A., Meer, F. and Gorte, B. eds., Spatial Statistics for Remote Sensing, pp. 211‒242, 1999.

4) Ripley, B. D. : Spatial Statistics, John Wiley & Sons, 1981. 5) 宮川雅至,大澤義明,腰塚武志:施設の開設・閉鎖に

伴う移動距離変化と頑健な規則的配置,日本オペレー ションズ・リサーチ学会和文論文誌,Vol. 47,pp. 1‒23, 2004.

6) Nychka, D. and Saltzman, N. : Design of air-quality 図-12 全ての利用目的について削減が推奨された評価地点

(13)

monitoring designs, In Nychka, D., Piegorsch, W. W. and Cox, L. H. eds., Case studies in Environmental Statistics, New York: Springer, pp. 51‒76, 1998.

7) Silbey, S. D. : Optimal Design, London: Chapman & Hall, 1980.

8) Cressie, N. : Statistics for Spatial Data. Revised Edition, John Wiley & Sons, 1993.

9) Zimmerman, D. L. : Optimal network design for spatial prediction, covariance parameter estimation, and empirical prediction, Environmentics, Vol. 17, pp. 635‒652, 2006. 10) Brus, D. J. and Heuvelink, G. B. M. : Optimization of

sample patterns for universal kriging of environmental variables, Geoderma, Vol. 138, No. 1-2, pp. 86‒95, 2007. 11) Zidek, J. V. and Zimmerman, D. L. : Monitoring network

design, In Gelfand, A. E., Diggle, P. J., Fuentes, M. and Guttorp, P. eds., Handbook of Spatial Statistics, CRC Press, pp. 131‒149, 2010. 12) 国土交通省:地価公示制度の概要(http://tochi.mlit.go.j p/chika/kouji/2012/01.html:2014/ 05/ 01 最終アクセス), 2012. 13) 井上亮,清水英範,吉田雄太郎,李勇鶴:時空間クリ ギングによる東京 23 区・全用途地域を対象とした公 示地価の分布と変遷の視覚化,GIS:理論と応用,Vol. 17,No. 1,pp. 13‒24,2006. 14) 堤盛人,村上大輔,嶋田章:我が国の三大都市圏を対 象とした住宅地価分布図の作成,GIS:理論と応用, Vol. 22,No. 2,pp. 1‒11,2014.

15) Schabenberger, O. and Gotway, C. A. : Statistical Methods for Spatial Data Analysis, Chapman and Hall/ CRC, 2004. 16) Zhu, Z. and Stein, M. L. : Spatial sampling design for

parameter estimation of the covariance function, Journal of Statistical Planning and Inference, Vol. 134, No. 2, pp. 583‒603, 2005.

17) Kirkpatrich, S., Gelatt, C. D. and Vecchi, M. P. : Optimization by simulated annealing, American Association for the Advancement of Science, Vol. 220, No. 4598, pp. 671‒680, 1983.

18) Clayton, D. and Kaldor, J. : Empirical Bayes estimator of age-standardized relative risks for use in disease mapping, Biometrics, Vol. 43, No. 3, pp. 671‒681, 1987.

19) 蓑谷千凰彦:計量経済学,東洋経済新報社,1997. 20) Fuentes, M., Chaudhuri, A. and Holland, D. M. : Bayesian

entropy for spatial sampling design of environmental data, Environmental and Ecological Statistics, Vol. 14, No. 3, pp. 323‒340, 2007.

21) Kammann, E. E. and Wand, M. P. : Geoadditive models, Journal of the Royal Statistical Society: Series C (Applied Statistics), Vol. 51, No. 1, pp. 1‒18, 2003.

(2014. 5. 13 受付)

GEOSTATISTICS FOR THE ASSESSED SITE ALLOCATION PROBLEM IN

OFFICIALLY ASSESSED LAND PRICE AND PREFECTURAL LAND PRICE

Daisuke MURAKAMI and Morito TSUTSUMI

Designing sampling strategy is a major concern in statistics. The same also holds for study fields that discuss spatial data modeling, including geostatistics; and, recently, sample site selection design is intensively discussed in these fields. This study applies geostatistics to the assessed site allocation problem in the officially assessed land price data and prefectural land price data in Japan. Firstly, we explain these land price data, while mainly focusing on basic rules of their assessed site allocation. Then, studies discussing sampling design problems are briefly summarized. Subsequently, points, which we must consider, are clarified, and geostatistical approaches for the land price assessed site allocation problem are developed based on the points. Finally, the developed approaches are used to the assessed site reduction problem in Ibaraki prefecture, and their effectiveness is examined.

参照

関連したドキュメント

会員 工博 金沢大学教授 工学部土木建 設工学科 会員Ph .D金 沢大学教授 工学部土木建 設工学科 会員 工修 三井造船株式会社 会員

The present paper deals with the damage to houses in Monzen Town, especially Tohge area in Wajima City due to the 2007 Noto-Hanto Earthquake in Japan. First, an outline of damage

In this artificial neural network, meteorological data around the generation point of long swell is adopted as input data, and wave data of prediction point is used as output data.

6.. : Magneto- strictive Properties of Body-Centered Cubic Fe-Ga and Fe- Ga-Al Alloy, IEEE Trans. : Magneto- strictive property of Galfenol alloys under compressive

会 員 工修 福井 高専助教授 環境都市工学 科 会員 工博 金沢大学教授 工学部土木建設工学科 会員Ph .D.金 沢大学教授 工学部土木建設 工学科 会員

This paper studies actual conditions of large-scale commercial facilities in the local conurbation area using their floor area against number of residents and also actual conditions

In order to understand whether some kind of probabilistic reasoning was taken into account by businessmen, it is thus necessary to look at these factors

The calibration problem for the Black-Scholes model was solved based on the S&amp;P500 data, and the S&amp;P 500 call and put option price data were interpreted in the framework