土木学会論文集 D3( 土木計画学 ), Vol. 71, No. 2, 31-43,

(1)

地価公示・都道府県地価調査における標準地・

基準地点の配置問題への地球統計学の応用

村上大輔

1

_{・堤盛人}

2 1_{国立環境研究所地球環境研究センター（〒305-8506 茨城県つくば市小野川 16-2）} E-mail: [email protected] 2_{筑波大学教授システム情報系社会工学域（〒305-8573 茨城県つくば市天王台 1-1-1）} E-mail: [email protected] サンプル（標本）の適切な抽出方法の設計は，統計学における大きな関心事の一つである．空間データを対象とした空間統計学の一種である地球統計学においてもその重要性は同様であり，サンプル地点の配置の議論が近年活発化している．本研究では地価公示・都道府県地価調査における標準地・基準地の選定の問題，本稿では特に削減の問題を例に，地球統計学に基づくサンプリングデザインの方法の応用を試みる．まず，標準地・基準地がどのように選定されているかを概観する．次に，地球統計学の関連研究を簡単に整理した上で，地価公示・都道府県地価調査の主旨に整合したサンプリングデザインの方法を提示する．最後に，提示した方法を用いて茨城県内の地価公示と都道府県地価調査における標準地・基準地の地点を削減する問題を解きその有用性を確認する．

Key Words: sampling design, geostatistics, officially assessed land price, prefectural land price

1．はじめに

財政健全化が喫緊の課題である我が国においては，近年，行政コスト削減を目的とした様々な公的統計調査の効率化や調査規模の縮小などが議論されている．地価公示や都道府県地価調査（以下，本稿ではこれらを「公的地価調査」と総称する）についても例外ではなく，平成 24 年国土交通省行政事業レビュー（事業番号：10 事業名：地価公示）では，「他の土地評価制度との関係を整理した上で，標準地の地点数の絞り込みを行い，より効率的に事業を執行すべき」との抜本的改善を指摘され，平成 25 年度において 10％以上（過去最大の削減）の予算削減措置を実施している．そのような中で，地価公示のあり方に関する検討会（2013）1）_{においても，公的地価調} 査において必要な標準地点数等について議論をしているものの，そこでは，「市区町村単位で，用途毎・一定の幅の価格帯毎に 1 地点は標準地が必要であると仮定し，これを全国的に積算することで必要な標準地数を求めることができる」（報告書 pp. 27‒28）という素朴で理論的根拠が明確でない議論に留まっており，統計学的な観点からの検討はなされていない．公的地価調査の規模の縮小が余儀なくされている中で，標準地/ 基準地の削減は大きな関心事である．地価調査地点の選定や削減といった，広く標本点の空間配置を決定する問題は「サンプリングデザイン（sampling design）」と呼ばれ古くから議論されてき た．Wang et al.（2012）2）_{によればサンプリングデザ}

インのアプローチは（i）design-based approach と（ii） model-based approach に分類できる．

（i）は一定の規則に基づいて標本点を配置するアプローチであり，例えば一様乱数を用いて配置を決める無作為抽出法（simple random sampling），一定間隔で規則的に標本点を配置する系統抽出法（system-atic sampling），属性（例えば地域や年齢など）毎に標本をグループ化し，分割毎に無作為抽出を行う層化抽出法（stratified random sampling），標本を予めグループ化した上で，無作為にグループの一つを選択し，次に選択されたグループの中で無作為抽出を行う二段階抽出法（two-step sampling）などがある（Gruijter （1999）3）_{）．Ripley（1981）}4）_{によれば，標本に関する} 事前知識がない場合は系統抽出法が，標本値が属性に強く依存する場合は層化抽出法が，それぞれ良好な結果を与える．アンケート調査等における標本の抽出には design-based approach が用いられることが多い．

(2)

（ii）は何らかのモデルを元に標本点の配置を最適化するアプローチである．（ii-1）確定論的モデルを用いた最適化はオペレーションズ・リサーチの分野で活発に議論されてきた（例えば宮川ほか（2004）5）_{）．特に，需要者からの総移動距離の最小化} に基づいて p 個の施設の配置する p-median 問題や， 需要者からの最大移動距離の最小化に基づいて施設 を配置する p-center 問題には膨大な研究蓄積があ る．一方，自然科学分野においては，space-filling

design（Nychka and Saltzman（1998）6）_{）が確定論的モ}

デルを用いて空間的に均一に標本点を与える手法として知られている．（ii-2）確率論的モデルを用いた最適化は主に自然科学分野で議論されてきた．例えば，線形回帰モデルを用いる方法（e. g., Silvey （1980）7）_{）や地球統計学（e. g., Cressie （1993）}8）_）の手法を用いる方法（e. g., Zimmerman（2006）9）_）などは代表的な手法として知られている．地球統計学の方法は，データの空間変動を明示的に考慮して配置を最適化できる点で優れており（Brus and Heuvelink（2007）10）_{），近年特に研究が活発である．} サンプリングデザインについてより詳しくは，Zidek and Zimmerman（2010）11），Wang et al.（2012）2）_を参照されたい．（ii）の各手法は，調査地点の削減問題を含む調査地点の最適配置の問題に応用可能と考えられる．しかしながら，筆者らの知る限り，（ii）の手法を標準地 / 基準地の配置問題に応用した研究は皆無である．また，（ii）の従来手法は，そのままでは利用目的の多様性や標準地/ 基準地の既往の配置基準といった地価調査データの特性（4 章（1）参照）を考慮することができない．そこで本研究では，（ii）の中でも特に研究が活発な地球統計学の手法を地価調査データの特性を明示的に考慮できるように拡張した上で，標準地・基準地の配置問題に応用する．なお，本稿では特に既存の調査地点の削減に焦点をあてるが，3 章（2）でも議論するように，以降の議論は新規追加地点の探索などにも応用できる．次章では，地価公示及び都道府県地価調査において標準地・基準地点がどのように選定されているかを概観する．第 3 章では，地球統計学におけるサンプリングデザインの手法を説明し，第 4 章において地価公示・都道府県地価調査の主旨に沿ったサンプリングデザインの方法をいくつか示す．第 5 章ではそれらの方法を茨城県の地価公示及び都道府県地価調査を例に標準地・基準地の削減の問題に適用し，その結果について考察する．最後に，第 6 章で本研究の成果を総括する．

2．地価公示と都道府県地価調査

地価公示は，地価公示法に基づいて国土交通省土地鑑定委員会が『標準地』について，毎年 1 月 1 日における当該標準地の単位面積当たりの正常な土地価格を公示するものである（地価公示法第 2 条 1 項）．ここで正常な価格とは，自由な取引が行われるとした場合に，その取引において通常成立すると認められる価格を意味する（地価公示法第 2 条 2 項）．地価公示の標準地は，都市計画区域その他の土地取引が相当程度見込まれる区域内という条件（地価公示法第 2 条 1 項）の下で，次の 4 つの基準により選定される（国土交通省（2012）12）_）．代表性：市町村の区域内において，適切な近隣地域に分布し，当該区域全体の地価水準をできる限り代表しうるものであること．中庸性：標準地が選定される近隣地域において土地の利用状況，環境，地積，形状等が中庸のものであること．安定性：できる限り土地の利用状況が安定した近隣地域にあって，当該地域の一般的な利用目的に適合したものであること．確定性：標準地は，土地登記簿，住居表示，建物，地形等によって明確に他の土地と区分され，かつ容易に確認できるものであること． 4 つの基準に対する各標準地の適合性は毎年点検されており（原則として 9 月 1 日から翌年 1 月 1 日の間），4 つの基準のうちの 1 つでも欠けた標準地については選定替えを行うこととなっている（国土交通省（2012）12）_）．一方，都道府県地価調査は，国土利用計画法施行令第 9 条に基づいて，『基準地』について，都道府県知事が毎年 7 月 1 日の正常な土地価格を公示するものである．地価公示とは異なり，都道府県地価調査の調査地点を表す基準地の選定基準は明確には定められていない．但し，実際には地価公示と同様の 4 つの基準に基づいて配置場所を選定している都道府県が多い（地価公示のあり方に関する検討会（2013）1）_{）．また，基準地は，地点・時点の双方につ} いて地価公示データを補う役割を担っている．そのため，基準地は，標準地の少ない都市計画区域外にも比較的多く分布しているという特徴を有する．既述のように公的地価調査の調査地点の選定（配置）や削減を議論した地球統計学の研究は筆者らの知る限り皆無である．次章と次々章において，地球統計学のモデルを用いて地価調査データのサンプリングデザインを適正に評価する方法を説明する．

(3)

3．地球統計学とサンプリングデザインの概説

（1）モデル地球統計学のモデル（以後，地球統計モデル）と は，対象範囲 D⊂ℜ上の地点 s n∈D（n∈1, … N ）で 観測されたデータ z（sn）の潜在的な空間過程を記述するものであり，一般に式（1）で与えられる． z=Xβ+ε ε~N 0,C （1） zは N ×1 の被説明変数ベクトル，Xは N × K の説 明変数行列，βは K×1 のパラメータベクトル，εは N × 1 の撹乱項ベクトル，0はゼロを要素に持つ N×1 のベクトルである．Cは N×N の共分散行列であり， その要素を共分散関数と呼ばれる距離 dn, n 'の減衰関数で与えることで空間データの一般的な性質である空間的相関（近接したデータが類似した傾向を示す性質）を考慮する．式（1）は，データの潜在的な 空間過程が大域変動（Xβ）と局所変動（ε）で記述さ れることを仮定したモデルである．共分散関数には，例えば球型モデル式（2）が適用できる． cd=



τ + _σ τ + _{σ f} _d  0 if if d=0 0<d<r otherwise （2） f d=



3d 2r − d  2r



τ，σ，rは，それぞれナゲット（nugget），パーシャ ルシル（partial-sill），レンジ（range）と呼ばれるパラメータであり，それぞれ空間的相関で説明される攪乱の大きさ，空間的相関に説明されない攪乱の大きさ，空間的相関の及ぶ距離を表わす． 地球統計モデルを用いることで，任意地点 s0∈D のデータzsの予測値や期待二乗誤差を求めること ができる．いま，zsが式（3）に従うと仮定する． zs=s_ β+εs_ （3） 「 ' 」は転置の演算子，sは地点 s0の説明変数から なる K × 1 のベクトル，εsは同地点の攪乱項であ る．不偏かつ線形という制約の下で地点 s0の期待二 乗誤差を最小化することで，zsの最良線形不偏予

測量（Best Linear Unbiased Predictor：BLUP ）式（4）が得られる． z _s =s_ β+cCz−Xβ （4） β _=X_C_{X }_X_C_z c は各観測地点と地点 s0の攪乱項の共分散を表す N × 1 のベクトルであり，各要素は共分散関数に基づ いて与えられる．zsの期待二乗誤差は式（5）となる． Ezs−zs  =σ_+τ_−c_C_c+ _−c_C_{X X}_C_{X }_−c_C_{X }（5）地球統計学とは自然科学の分野で発達した一分野であるが，サンプリングデザイン以外の問題に関しては，公的地価調査のデータへ適用し，その有用性を指摘した研究も見られる（例えば井上ほか（2006）13）_{，堤ら（2014）}14）_{）．地球統計モデルについ} て，より詳しくは Cressie （1993）8）_{や Schabenberger} and Gotway （2004）15）を参照されたい．（2）サンプリングデザイン a）目的関数地球統計モデルを用いた最適なサンプリングデザインの特定は，一般にイ）目的関数の設定ロ）目的関数の最小化による最良の配置の特定の手順を踏むことで行われる．目的関数としては，例えば重み付けられた期待二乗誤差の平均値や最大値があり

（Zhu and Stein（2005）16）_{），それらを下式の通り最小}

化する． min i CS=min i ∑wcS （6） min i CS=min i max  wcS （7） S は調査地点数が所与の下でありうる全調査地点配 置の集合を表す．Si（添え字：i = 1, 2, . . . I ）は集合 S が含む配置の一つを表し Si∈S = {S1, S2, . . . SI}と定 義される．m ∈{m1, m2, . . . mM}は，評価地点とは独立に，別途対象地域 D⊂ℜ上に稠密に配置された M 個の地点（図-1 参照），wmは地点 m の重み，cS は配置を Siとしたときの同地点における期待二乗誤 差Ezs−zs  である．またwcSは配置 S_i の下での地点 m における損失と考えることができ る．目的関数（6）または（7）は，この対象地域上に稠 密に配置された各地点における損失wcSの平均 値 CS=∑wcS または最大値 CS=max  wcSを最小化することで，最適配置を探索する（図-1 参照）．いずれの目的関数を用いたとしても，地理空間上のデータ分布と説明変数で規定される特徴空間上のデータ分布の両方を考慮して配置を最適化できる（Brus and Heuvelink

（2007）10）_{）．但し，式（6）を用いた場合，対象地域} 全体での配置の精度は良好となるものの，特異的に精度の低い地域は残る可能性がある．一方で式（7）を用いた場合，特異的に精度の低い地域は現れないものの，全体としての精度は式（6）を用いた場合よりも低くなる．いずれかの目的関数を最小化するこ

(4)

とで得られる大域最適解 Si*は式（8）で定義できる． S =arg min i CS （8） ここで g ∈{1, 2}である． b）最適配置の探索 網羅的探索による Si*の探索は S の要素数が膨大と なるため通常は困難である．さらに，最適配置問題は NP 困難（NP-hard）であり，最適配置を多項式時間で探索することですら困難であることが一般に知 られている．従って，大域最適解 Si*を現実的な時間内で精度よく近似するアルゴリズムが必要となる． Simulated Annealing 法（SA 法: Kirkpatrich et al.

（1983）17）_{）はそのようなアルゴリズムの一つであ} る．配置する評価地点数が所与の下で，SA 法を用いて配置の大域最適解を探索する手順は次の通りである． （i）初期配置 S0とパラメータ T の初期値 T0を与える． （ii）（ii-a），（ii-b）を交互に k 回繰り返す． （ii-a）現在の配置 Si_aと，そのうちの 1 地点を無 作為に別の地点に移動させた配置 Si_bを定義する．

（ii-b）Si_a，Si_bの両ケースについて目的関数の

値を求め，Si_aの場合の値がより良好である（小さい）場合は確率 1 で，そうでなければ式（9） に示す確率で Si_aを Si_bに置き換える． exp



−CS_−CS_ T



（9） （iii）T を pT に置き換えて（ii）に戻る．ここで p （0 < p < 1）は T の減衰率を表わす．p を極限ま で 1 に近づけることで SA 法の近似解は，理論的には真の大域最適解に一致することが知られ ている（Kirkpatrich et al. （1983）17）_{）．但し，p} が 1 に近いほど収束までの計算時間は長くなる． T0の与え方の一つに式（10）がある（Brus and Heuvelink（2007）10）_）． T= CS−CS M log 0.8 （10） S は手順（ii-b）で改善のみを許容して SA 法を実行した場合に得られる最適配置を表わす．（10）式で T0を与えることは，初期状態において 80% の確率で CSの改悪を許容することを意味する．なお，配置 Siを更新する度に cm（Si）=Ezs−zs  の値は変化するため，配置を変更したが式（7）が変化しないという事態は通常は起こらない．即ち，最大値に基づく最適化は総和に基づく最適化と同等の計算効率を有する．以上の最適化は様々な問題に応用できる．例えば 対象地域 D 内の調査地点を nc_{個削減する場合であれ} ば，最初に nc_{個の調査地点を無作為に削減すること} で配置 S0を定義し，以降は配置 S0（Si_a）の中の 1 地 点を選択し既に削減されている nc_{地点の中の 1 つで} 置き換える，という操作を手順（ii）で繰り返すこと で最適配置が探索できる．また，D 内に nc_個の新たな調査地点を追加する場合であれば，既存の調査地 点とそれ以外の nc_{地点（対象地域上に稠密に配置し} た地点集合の中から nc_{個の地点を選択）から成る配} 置 S0を定義し，nc地点の配置を手順（ii）で更新していくことで最適配置が探索できる．以上の手順はい ずれも 1 回の SA 法に基づいており，p が十分に 1 に 近い場合に，それらの近似解が大域最適解を精度よ く近似することが示されている（Kirkpatrich et al. （1983）17）_）．調査地点を削減（追加）する手順には，SA 法を 1 回適用する上記の方法の他に，1 地点を削減（追加） する SA 法を nc_{回繰り返す方法も考えられる．しか} しながら，上述の方法とは異なり，この方法が大域最適解を精度良く近似する保証はない．例えば，100 地点を削減した後に 101 地点目を削減するよりも 1 地点を追加した方がかえって目的関数が改善するということも起こりうるが，この方法では地点の追加を考慮できない．従って，以降ではこの方法については議論しない． また，最適配置問題としては，上述の D の内部だ 図-1 最適配置探索のイメージ（10 の評価地点のうちの 3 つを削減する場合）．10 地点｛（黒円：●）+（白円：○）｝のうちの 7 地点からなる配置（黒円のみ の集合はその一例）Siを最適化することとなる． この場合の S の要素数は10C7= 120 である．最適配置 Si* の探索は，対象地域上に別途稠密に配置さ れた M 個の各地点（ここでは 30 個の灰色の点： ■ ）における損失 wmcm（Si）の平均値または最大値を式（6）または式（7）で最小化することで行う． この M 個の各地点は，wmcm（Si）を評価のためだけに，評価地点とは独立に与えられる．例えば 4 章以降では，これらの地点は町丁目の各重心点で与えている．

(5)

けを調査地点の配置の候補とする問題の他に，D の 内部に加えて D の周辺外部（D' とする）を含めた領 域を対象として調査地点を選定するという問題も考 えられる．この場合には，D の周辺外部である D' 内 の空間過程を内挿ではなく「外挿」をする必要が生 じる．しかしながら，D 内と D' 内の空間過程が同じ であるという仮定が満たされない場合も多く，結果として外挿の精度は一般に低くなることが知られている（Cressie（1993）8）_{）．なお，公的地価調査は全} 国で実施されているため，例えば A 県を対象にこれまで調査地点の存在しなかった県外縁部の陸地の調査地点を追加するような場合でも，実際には A 県に隣接する各県のデータが活用できる場合が多いと想像される．また，地価調査地点は任意地域の地価変動を一定以上の水準で説明することを担保するために，例えば郊外部や山間部にも一定数配置されている（4 章（1）参照）．そのため，外挿を必要とするケースは実際には極めて稀と考えられる．これらのこと から，D の外部を対象とした配置問題に関しても， 本稿においては，以降，議論しない． 以降では，D 内の既存の調査地点の削減に着目す る．Brus and Heuvelink（2007）10）_{に倣い T}

0は式（10）， k=100，p=0. 95 でそれぞれ与えることとする．また， 既往研究に倣い，期待二乗誤差cSを記述するパラ メータτ，σ，r は，調査地点を削減する前の完全デー タで予め推定しておくものとする．この仮定は調査地点を削減する前の完全データと削除後の不完全データが同じパラメータ値で説明される，というよ り強い仮定に基づいているが，τ，σ，r は，データ 自体ではなくデータを発生させた潜在的な空間過程を記述するものである（前節参照）．仮に調査地点を削減したとしても，それに伴って潜在的な（真の）空間過程が変化することはないため，より大きな情報量を有する削減前のデータでパラメータを推定するという仮定は妥当と考える．

4．地価調査データのサンプリングデザイン

本章では 3 章（2）で議論したアプローチを地価調査地点の配置問題に応用する方法を考える．本章（1）では地価調査地点の配置を議論する際の要点を整理し，本章（2）では具体的な目的関数を地価調査データの利用目的毎に設定する．その際の，対象地 域上に稠密に配置される M 個の地点（図-1 中の灰色 の点）は，wmを与えるためのデータ取得の制約から（本章（2）a）参照），町丁目の各重心点（以後，町丁目重心）で与えることとする．（1）地価調査の特性と評価地点配置公的地価調査の地点の配置を議論する際に考慮すべき重要なこととして，次のような点が挙げられる．（A）精度（B）費用（C）調査地点の配置（選定）基準（第 2 章で説明）との整合性（D）利用目的の多様性地球統計学の手法を用いて期待二乗誤差の総和 CSまたは最大値CSを最小化することで（A）精度は考慮される．一方で，そのままでは直接的に（B）費用は考慮されない．ただし，データ取得に要する費用の地点毎の差異が比較的小さいと考えられる場合は，費用は明示的には考慮されないことも多い．本研究でも，地価評価の（B）費用は，対象地域内の全ての地点で一律と仮定した上で，明示的には考慮しないこととする．地価調査地点の配置基準（C：第 2 章参照）は次のように要約できる：（C-1）土地取引が相当程度見込まれる土地であること，（C-2）代表性・中庸性・安定性・確定性を満足する土地であること，（C-3）任意の地点・時点における地価公示データの不足を，都道府県地価調査が効率よく補えていること．地球統計学の手法は空間的に均一な観測（評価）地点配置を与えることが知られており（Zidek and Zimmerman

（2010）11）_{），地球統計学の方法を用いることで（C-3）} の空間的な側面での補填性は考慮できる．一方，次の 2 点を踏まえ，（C-3）の時間的な側面での補填性は本研究では考慮しないこととした：将来時点の地価調査データが存在せず，調査地点の削減を議論する上で重要となる将来における地価の時間変動のモデル化とその精度検証が困難であるため；評価時点の地点の設定は，調査日を年に 2 日（1 月 1 日：地価公示 7 月 1 日：都道府県地価調査）設定するという既存のフレームを大きく逸脱しており，その実現性は低いため．（C-2）の代表性・中庸性・安定性・確定性は必ずしも厳密には定義されていないため，それらを元に選出されてきた既存の公的地価調査地点が真にそれらを満足しているかは不明瞭である．しかしながら，少なくとも既存の公的地価調査地点がそれらの配置基準を満足しているという仮定の下では，既存の調査地点のみを調査地点を配置する候補とすることで，（C-2）にも配慮できる．なお，地球統計学を応用することは，曖昧さを有する基準（C-2）を元に議論されてきた調査地点の配置問題を，統計的見地から，より定量的に議論するために重要と示唆される．

(6)

（C-1）を考慮するためには土地取引量に関する情報を外生的に与える必要がある．また（D）利用目的の多様性を考慮するためには，各利用目的の特性を予め十分把握しておく必要がある．しかしながら，地球統計学の手法を用いてそれらを考慮する方法は議論されていない．以上を要約すると，地球統計モデルを用いることで（A）精度と（C-3）時間上・空間上での都道府県地価調査の補完性は考慮できる．また，既存の調査地点を配置の候補とすることで（C-2）規定の 4 つの配置基準にも配慮できる．（B）費用は一地点当たりの調査に要する費用が一律同額であると仮定すれば，結局調査地点の数によって決まることとなるが，本研究ではそれは所与であると仮定する．次節では，上記の各点に加えて（C-1）と（D）を考慮する方法を議論する．具体的には，地価調査データの配置を利用目的毎に議論することで，（D）利用目的の多様性を考慮する．また，利用目的の一つである土地取引については（C-1）見込まれる土地取引数も考慮して配置を議論する．（2）利用目的毎の目的関数の設定 a）利用目的と重み wm 地価調査データの代表的な利用目的に，（D-1）通常の土地取引にあたっての土地価格の参照，（D-2）行政による用地買収・補償にあたっての土地価格の参照，（D-3）固定資産税や相続税などの課税額の算定がある．利用目的が異なれば，当然望まれる調査地点の配置もまた異なると考えられる．（D-1）通常の土地取引を対象とする場合であればより多くの土地取引が見込まれる地域に，（D-3）課税を対象とする場合であればより世帯数の多い地域に，より多くの調査地点を配置すべきと考えられる．また，一般に，一定の領域内の用地買収・補償に必要となる取引の数は世帯の密集した地域でより多くなると考えられるため，（D-2）用地買収・補償を対象とする場合についても世帯数の多い地域により多くの調査地点を配置すべきと考えられる． 本研究では町丁目重心毎の重み wmを用いて配置の優先度を表現することとする．ここまでの議論を 踏まえ，wmは（D-1）通常の土地取引を重視する場合は各町丁目において見込まれる土地取引の数（以降，期待取引数）で，（D-2）用地買収・補償または（D-3）課税を重視する場合は町丁目別の世帯数（出展：政府統計の総合窓口（http://www.e-stat.go.jp/SG1/estat/e StatTopPortal.do））で，それぞれ与えることとする． （D-1）土地取引を対象とした場合の重み wmである期待取引数は，国土交通省土地総合情報システム（http://www.land.mlit.go.jp/webland/）公開の土地取引事例データをもとに算定する．同データには取引した町丁目のラベルが付与されており，このデータを集計することで町丁目毎の土地取引数が算出できる．しかしながら，提供されているデータはアンケートへの任意の回答に基づいており，その町丁目毎の集計値は「特定の町丁目でたまたま回答率が高かった」というような不確実性に左右されうる．また，町丁目あたりの取引数が少ないため「たまたま対象年に取引が存在した」というような不確実性にも左右されうる．例えば平成 23 年度の場合であれば，茨城県内の住宅地取引のサンプル数は 3, 557 であり，町丁目（総数：3, 945）あたりの取引数は 1 に満たない．以上のような不確実性に配慮しながら期待取引数を評価するために，本研究では Clayton and Kaldor

（1987）18）_{を用いる．彼らのアプローチは，期待取引} 数の確率分布（式 12）を推定し，この確率分布から逸脱した（高い不確実性を持つ）サンプルを本分布に近づけることで不確実性に対処しようというもの である．具体的には，まず，町丁目 m における取引 数 tmがポアソン分布（式 11）の実現値であると仮定する． t~Poissonθ×t （11） tは取引を生じうる母体の数を表わし，本研究ではこれを世帯数で与える．θ_mは町丁目 m の特性を 表わすパラメータであり，上述のようにtを世帯数 とした場合は町丁目 m における世帯あたり期待取引 数となる．θmはガンマ分布（式 12）に従うものと仮定する． θ~Gammaa,b （12） a と b はハイパーパラメータである．式（11），（12） より，θmの推定量として式（13）が得られる． θ= t+a t+b  （13） θは町丁目 m における世帯あたり期待取引数の 推定量である．θは，世帯数tが少ない程その分母 を共通の水準bに近づけることで，また，期待取引数 tmが少ない程その分子を共通の水準aに近づけるこ とで，不確実性に配慮した推定量である．期待取引 数は，世帯あたり期待取引数θに世帯数tをかける

ことで算出できる．なお，Clayton and Kaldor

(7)

b）利用目的と目的関数の型ミニサム型の目的関数（6）を用いることで配置の全体としての精度は良好となるものの，特異的に精度の低い地域は残る可能性がある．一方でミニマックス型の目的関数（7）を用いることで特異的に精度の低い地域は現れないものの，全体としての精度はミニサム型を用いた場合よりも低くなる．対象とする利用目的が異なれば望まれる目的関数の型もまた異なる可能性がある．各利用目的（D）の特性に着目すると，（D-1）通常の土地取引に際しては地価調査データ，不動産鑑定評価額，近隣の土地取引額などが参照され，（D-2）用地買収・補償に際しては，地価調査データに加え，周辺の取引額や見込まれる収益額などが参照される．従って，（D-1）または（D-2）を対象とする場合であれば，地価調査データの説明力（あるいは精度）の不足はその他の参照データで補填できる．一方で，（D-1）や（D-2）の指標としての地価調査データの信頼性を保持するためには，本データは，任意地点の地価に対して一定以上の説明力を持たねばならない．そこで本論文では，（D-1）または（D-2）を対象とする場合は，任意地点における説明力（精度）の不足を一定以内に抑えるミニマックス型の目的関数を用いることとする．課税額は，税率を通して，地価調査データの値により直接的に依存するため（例えば固定資産税算定の基となる固定資産税評価額は地価公示の 7 割程度，相続税算定の基となる相続税路線価は地価公示の 8 割程度），地価調査データの説明力（精度）不足はできるだけ限り小さくすることが望ましいと考えられる．そこで，（D-3）課税を対象とする場合の目的関数はミニサム型で与えることとする． c）各利用目的の目的関数以上の議論を元に構築された利用目的毎の目的関数を表-1 に整理した．各目的関数は，地価調査デー タの利用頻度を表す期待取引数または世帯数 wmに 期待二乗誤差cSを乗じたwcSを含むが，これ は期待二乗誤差が町丁目 m での地価調査データの利 用に及ぼす損失と解釈できる．また，∑wcSを最小化する式（6）は対象地域における総損失の最小化と，max  wcSを最小化する式（7）は対象地域における最大損失の最小化と，それぞれ解釈できる．本節で構築した目的関数は，3 章（2）b）で議論した手順で直ちに最小化できる．地球統計モデルを応用した本最適化は（A）精度と（C-3）空間上での補完 性を考慮するものである（4 章（1）参照）．また，wm を導入することで（C-1）土地取引数と（D）利用目的の多様性もまた考慮している．なお，前述のとおり，（C-2）規定の配置基準は既存の地価調査地点のみを配置の候補とすることで考慮しており，（B）コストは調査地点数当たりの調査費用が一定かつ総数を所与とすることで，ここでは明示的には考慮しない．また，（C-3）の時間軸上での補完性もまた，4 章（1）で示した理由で考慮していない．

5．実証分析

（1）概要本章では，2009 年における茨城県の地価公示データと都道府県地価調査データ（ここでは，茨城県内における 2009 年と 2010 年の両地価公示データの平 均値zとzの間の変化率zzより得られる半年分の変化率



zzを乗じることで時点調整を行った）を合わせた標本数 785 の住宅地価を効率的に削減する方法を，土地取引，用地買収・補償，課税の各利用目的について検証する．各目的関数は表 -1 に示とおりである．削減数は，各利用目的について，全体の 10% のあたる 79 地点，30% にあたる 235 地点，及び 50% にあたる 393 地点の 3 通りとする． cSと w_mを与える町丁目の数は 3, 943 である．期 待二乗誤差cSの算出に使用する地球統計モデル（式 1）の被説明変数は地価（円/ m2_{），説明変数は最} 寄りの鉄道駅までの距離（駅距離：km），最寄りの鉄道駅から東京駅までの鉄道ネットワーク距離（東京距離：km），各地点を包含する 1km2_{メッシュ内の各} 土地利用の面積（田，その他農用地，森林，荒地，幹線交通用地，その他用地，河川・湖沼，海浜，海水域，ゴルフ場：m2_{）とする（表-3）．また，共分散関数は} 球型モデル（式 2）で与える．パラメータ推定には，地球統計モデルの代表的な推定法である WLS&EGLS 法（例えば Schabenberger and Gotway

（2004）15）_{）を用いる．}

（2）パラメータ推定結果

地球統計モデルのパラメータ推定の結果を表-4 に示す．ここで表中の VIF（Variance Inflation Factor）は

(8)

多重共線性の診断統計量であり，表中の全ての VIF が 10 未満であることは説明変数間に深刻な多重共線性が生じていないことを意味する（蓑谷（1997）19）_）．駅距離と東京距離は 1% 水準で，水戸距離は 10% 水準で負に有意であり，アクセシビリティが地価に大きな影響を及ぼしていることが確認された．また，田，その他用地，森林，及び河川・湖沼がいずれも 1% 水準で負に有意であり，非都市的な土地利用が地価を押し下げていることもまた確認された．パーシャルシルが 1. 15 × 108_{であるのに対して} パーシャルシルとナゲットの和は 1. 84 × 108_である．このことは攪乱の約 62. 5（=1. 15 × 108_{/ 1. 84} × 108_{）% が空間的相関で説明されるということを} 表す．また，レンジの推定結果は，空間的相関の及ぶ距離が 6. 48km であることを表す．次に，データをランダムに 5 分割し，そのうちの 4 つを用いて残りの 1 つを予測するという操作を全パターンについて行うことで精度を評価する手法であ図-2 地価公示データの空間分布図-3 都道府県地価調査データの空間分布表-2 地価調査データの基本統計量（単位：万円/ m2_）表-3 本研究で使用する変数表-4 パラメータ推定結果

(9)

る 5-fold cross-validation を用いてモデルの精度を議論する．まず同手法によって得られた予測値と実測値を図-4 にプロットした．この図より，各予測値が概ね実測値と近い値となっていることが確認でき

る．次に Mean Percentage Error（MPE：式 14）を用いて地価の総変動に占める予測誤差の大きさを検証する． MPE=100 N ∑   zs−zs zs （14） ここで，zsは n 番目の地価調査データの実測値， z _s は同データの予測値である．計算の結果，MPE は 18. 8 となり，推定された地球統計モデルが地価の総変動の 81. 2 （=100 − 18. 8）% を説明する程度の精度を有することを確認した．一方，期待取引数を記述するポアソンモデル（3 章 （2）a）参照）のパラメータαと b の推定値は，それ ぞれ 0. 309 と 0. 130 となった．a が b に比べて大き いことは，推計式（13） = （取引数+ a）/ （世帯数+ b）において，取引数が共通の水準により強く縮小さ れたことを意味する．茨城県における町丁目あたりの取引数は平均で 1 未満と少なく不確実性が大きいため，この結果は直感に整合する．（3）評価地点の配置結果 まず，損失wcSがcSまたは wmの増加関数で あることに注意しながら，cSと wmが最適配置に 及ぼす影響を考察したい．cSを表す期待二乗誤 差，及び wmを表す期待取引数と世帯数の空間分布を図-5，図-6，図-7 に示す．期待二乗誤差は非都市部（例えば南部の郊外や北西部）の損失を上昇させており，調査地点が元々少ない非都市部の調査地点を現状以上に減らすべきでないことを示している．反対 に，wmを表す期待取引数と世帯数は都市部の損失を上昇させており，地価調査データの利活用が活発と見込まれる都市部の調査地点を現状以上に減らすべ きでないことを示している．このように，cSと wmは非常に異なる配置を選好する．従って，地球統 計学ではcSのみを考慮するアプローチが最も広く用いられているが，地価調査地点の配置問題にお いては，cSと w_mの両方を考慮することが重要となる．（I）土地取引，（II）用地買収・補償，（III）課税についての各最適化の結果をそれぞれ図-9，図-10，図 -11 に示す．また，比較のために，元の調査地点配置についても図-8 に示す．各最適配置には次のような共通点がみられる．まず，非都市部の調査地点が比較的多く残存した点である．このことは，非都市部の調査地点を現状以上に削減してしまうと，非都市 部における損失wcSが増加することを示している．非都市部でも一定数のデータ利用が見込まれることから，元々少ない非都市部の調査地点を残すべ図-4 実測値と予測値のプロット図-5 期待二乗誤差の空間分布図-6 期待取引数の空間分布

(10)

きという本結果は直感とも整合する．また，各利用目的について，県庁所在地である水戸周辺で多くの調査地点が残存し，反対につくば，土浦，日立といった中規模の都市周辺では比較的多くの調査地点が削減された．この結果は，水戸周辺では，期待取引数 と世帯数（wm）だけでなく期待二乗誤差 cm（Si）も大かったために，一定数以上の調査地点を削減するこ とで損失wcSが増加すること，及び上述の中規 模都市周辺では，期待取引数と世帯数（wm）が比較 的大きいのに対して期待二乗誤差cSは小さかったために，調査地点を多少削減したとしてもその影響は小さいこと，を示している．都市毎の差異や都市/ 非都市の差異を定量化して調査地点を削減できる点は，地球統計学の手法を用いることの利点の一つといえよう．利用目的毎の結果の類似をみるために，50% の調査地点の削減を行った際に，利用目的間で共通に削減された地点の割合を算出した（表-5）．この表より，（I）と（II）の両結果は類似しており，一方で両者と（III）との類似は比較的小さいことが確認できる．この差異は目的関数の違いによるものである（表-1 参照）．例えば課税を利用目的と仮定して最大損失を最小化した（III）は，つくば・土浦・取手で囲まれた地域や日立周辺において空間的により均一な配置を与えている（特に 50% 削減時；図-9，図-10，図-11）．空間的に均一な配置とすることは，近隣に地価調査地点が存在しない世帯を減らし，各世帯での課税額算定に地価調査データを役立てるために重要といえよう．但し，（III）の非都市部における配置結果は（I），（II）と酷似しており，非都市部については，残存すべき調査地点は，利用目的によらずほぼ同じとの示唆を得た．最後に（I），（II），（III）の全てについて削減すべきと評価された地点を図-12 に示す．同図より，削減が推奨される地点は鉄道駅周辺に多いことが確認できる．また，10% 削減の場合は取手周辺に，30% または 50% 削減の場合は取手・土浦・日立の各周辺に，それぞれ削減が推奨される地点が多いことも確認できる．このことは，局所的には鉄道駅周辺に，大域的には上述の市周辺に期待される以上の調査地点が配置されており，それらを削減したとしても総損失が小さく保たれる（即ち，対象地域の地価を精度良く説明する配置となる）とともに最大損失も小さく保たれる（即ち，対象地域内の任意地点の地価を一定以上の説明力で説明する配置となる），ということを示している．図-12 の結果を踏まえて実際に削減する調査地点を決めることは，削減後の地価調査データの質を保証する上で重要といえよう．

6．まとめ

本研究では，公的地価調査事業に対する予算削減の機運を念頭に，精度や規定の配置基準，利用目的（土地取引，用地買収・補償，課税）などを考慮しな図-7 世帯数の空間分布図-8 地価公示の標準地と都道府県地価調査の基準地の空間分布表-5 共通に削減されたデータの割合（50% 削減）

(11)

図-9 最適配置（利用目的：土地取引）

図-10 最適配置（利用目的：用地買収・補償）

(12)

がら地価調査地点を効率良く削減する方法を，地球統計学の観点から議論・提示した．また，この方法を茨城県の公的地価調査のデータに適用することで，重視する利用目的別の最適な削減方法や，削減が特に推奨される地点などを議論した．本研究は，筆者らの調べた限りにおいては，我が国の公的地価調査の調査地点配置を統計学的な見地から議論した唯一の研究であるとともに，地価調査地点の配置問題に対する地球統計学の有用性を示した唯一の研究である．一方で本研究にはいくつかの課題が残されている．まず，最適配置の結果は地球統計モデルの与え 方に強く依存するという Fuentes et al. （2007）20）_の指摘に基づけば，地価調査データのサンプリングデザインを議論するための地球統計モデルをより詳細に議論する必要がある．例えば，地価関数の非線形性を考慮した地球統計モデルである trans-gaussian kriging（e. g., Cressie（1993）8）_{）や geoadditive model}

（Kammann and Wand（2003）21）_{）は地価調査データの}

空間構造を柔軟にモデル化するという点で本研究で用いた地球統計モデルよりも優れており，今後，それらの本配置問題への応用を検討する必要がある．また，期待二乗誤差以外の誤差指標を用いて調査地点配置を議論することも重要な課題の一つであ る．例えばz−zzを用いて誤差を評価する誤差 率の性質は，z−z  の期待値を用いる期待二乗誤差とは異なる．また，地価の調査地点配置を論じるにあたっては，地価水準の高さにかかわらず，同様に誤差を評価する期待二乗誤差よりも，地価水準の高さに応じて許容される誤差を調整する誤差率を用いる方が望ましいとも考えられる．誤差率を用いてサンプリングデザインを議論するための方法論の開発，ならびにその公的地価データへの適用は今後の重要な課題といえよう．なお，一般に，地球統計学のサンプリングデザイン・アプローチは任意地点で算出可能という期待二乗誤差の特性を活用したものであり，誤差率をサンプリングデザインに応用するためには，期待される誤差率を任意地点で求めるための方法論が必要となる．

謝辞：Japan Geoscicence Union Meeting 2012 にて議長である小口高教授（東京大学）より，第 21 回地理情報システム学会研究発表大会にて議長である貞広幸雄教授（東京大学）より，それぞれ示唆に富むご指摘を頂いた．また，両学会への多くの参加者からも有益なたくさんのご意見・ご指摘を頂いた．加えて，筑波大学内のゼミにて石田東生教授，谷口守教授，岡本直久准教授はじめ多くの方からも示唆に富むコメントを頂いている．ここに記して感謝申し上げる．参考文献 1) 地価公示のあり方に関する検討会：地価公示のあり方に関する検討会報告書，2013．

2) Wang, J. -F., Stein, A., Gao, B. -B. and Ge, Y. : A Review of spatial sampling, Spatial Statistics, Vol. 2, pp. 1‒14, 2012. 3) Gruijter, J. : Spatial sampling schemes for remote sensing, In

Stein, A., Meer, F. and Gorte, B. eds., Spatial Statistics for Remote Sensing, pp. 211‒242, 1999.

4) Ripley, B. D. : Spatial Statistics, John Wiley & Sons, 1981. 5) 宮川雅至，大澤義明，腰塚武志：施設の開設・閉鎖に

伴う移動距離変化と頑健な規則的配置，日本オペレーションズ・リサーチ学会和文論文誌，Vol. 47，pp. 1‒23， 2004．

6) Nychka, D. and Saltzman, N. : Design of air-quality 図-12 全ての利用目的について削減が推奨された評価地点

(13)

monitoring designs, In Nychka, D., Piegorsch, W. W. and Cox, L. H. eds., Case studies in Environmental Statistics, New York: Springer, pp. 51‒76, 1998.

7) Silbey, S. D. : Optimal Design, London: Chapman & Hall, 1980.

8) Cressie, N. : Statistics for Spatial Data. Revised Edition, John Wiley & Sons, 1993.

9) Zimmerman, D. L. : Optimal network design for spatial prediction, covariance parameter estimation, and empirical prediction, Environmentics, Vol. 17, pp. 635‒652, 2006. 10) Brus, D. J. and Heuvelink, G. B. M. : Optimization of

sample patterns for universal kriging of environmental variables, Geoderma, Vol. 138, No. 1-2, pp. 86‒95, 2007. 11) Zidek, J. V. and Zimmerman, D. L. : Monitoring network

design, In Gelfand, A. E., Diggle, P. J., Fuentes, M. and Guttorp, P. eds., Handbook of Spatial Statistics, CRC Press, pp. 131‒149, 2010. 12) 国土交通省：地価公示制度の概要（http://tochi.mlit.go.j p/chika/kouji/2012/01.html：2014/ 05/ 01 最終アクセス）， 2012． 13) 井上亮，清水英範，吉田雄太郎，李勇鶴：時空間クリギングによる東京 23 区・全用途地域を対象とした公示地価の分布と変遷の視覚化，GIS：理論と応用，Vol. 17，No. 1，pp. 13‒24，2006． 14) 堤盛人，村上大輔，嶋田章：我が国の三大都市圏を対象とした住宅地価分布図の作成，GIS：理論と応用， Vol. 22，No. 2，pp. 1‒11，2014．

15) Schabenberger, O. and Gotway, C. A. : Statistical Methods for Spatial Data Analysis, Chapman and Hall/ CRC, 2004. 16) Zhu, Z. and Stein, M. L. : Spatial sampling design for

parameter estimation of the covariance function, Journal of Statistical Planning and Inference, Vol. 134, No. 2, pp. 583‒603, 2005.

17) Kirkpatrich, S., Gelatt, C. D. and Vecchi, M. P. : Optimization by simulated annealing, American Association for the Advancement of Science, Vol. 220, No. 4598, pp. 671‒680, 1983.

18) Clayton, D. and Kaldor, J. : Empirical Bayes estimator of age-standardized relative risks for use in disease mapping, Biometrics, Vol. 43, No. 3, pp. 671‒681, 1987.

19) 蓑谷千凰彦：計量経済学，東洋経済新報社，1997． 20) Fuentes, M., Chaudhuri, A. and Holland, D. M. : Bayesian

entropy for spatial sampling design of environmental data, Environmental and Ecological Statistics, Vol. 14, No. 3, pp. 323‒340, 2007.

21) Kammann, E. E. and Wand, M. P. : Geoadditive models, Journal of the Royal Statistical Society: Series C (Applied Statistics), Vol. 51, No. 1, pp. 1‒18, 2003.

（2014. 5. 13 受付）

GEOSTATISTICS FOR THE ASSESSED SITE ALLOCATION PROBLEM IN

OFFICIALLY ASSESSED LAND PRICE AND PREFECTURAL LAND PRICE

Daisuke MURAKAMI and Morito TSUTSUMI

Designing sampling strategy is a major concern in statistics. The same also holds for study fields that discuss spatial data modeling, including geostatistics; and, recently, sample site selection design is intensively discussed in these fields. This study applies geostatistics to the assessed site allocation problem in the officially assessed land price data and prefectural land price data in Japan. Firstly, we explain these land price data, while mainly focusing on basic rules of their assessed site allocation. Then, studies discussing sampling design problems are briefly summarized. Subsequently, points, which we must consider, are clarified, and geostatistical approaches for the land price assessed site allocation problem are developed based on the points. Finally, the developed approaches are used to the assessed site reduction problem in Ibaraki prefecture, and their effectiveness is examined.