<
修士論文
>
「空間統計モデルによる地域間経済データの解析」
滋 賀 大 学 大 学 院
デ ー タ サ イ エ ン ス 研 究 科
デ ー タ サ イ エ ン ス 専 攻
修 了 年 度 : 2 0 2 0 年 度
学 籍 番 号 : 6019109
氏
名 : 下 高 原 宏 明
指 導 教 員 : 松 井
秀 俊
提出年月日 : 2021年1月19日
目次
第1章 はじめに 1 第2章 背景 2 2.1 産業連関表による地域経済分析 . . . 2 2.1.1 地域経済分析. . . 2 2.1.2 産業連関表 . . . 3 2.1.3 逆行列係数表. . . 4 2.1.4 産業連関表の分析手法 . . . 5 2.2 産業立地の先行研究 . . . 7 2.2.1 産業立地の学問 . . . 7 2.2.2 古典的産業立地論 . . . 8 2.2.3 「空間経済学」 . . . 9 2.2.4 「経済地理学」 . . . 10 2.2.5 本論文のアプローチ . . . 11 第3章 分析手法 12 3.1 空間統計学 . . . 12 3.1.1 空間データ . . . 12 3.1.2 空間データの定義 . . . 12 3.1.3 空間重み行列. . . 13 3.2 空間的相関分析. . . 15 3.2.1 空間自己相関. . . 15 3.2.2 空間相互相関. . . 18 3.3 空間計量経済モデル . . . 193.3.1 採用モデル . . . 19 3.3.2 最尤法によるパラメータ推定法 . . . 20 3.3.3 回帰係数の解釈 . . . 23 第4章 空間統計学による分析結果 25 4.1 空間相関分析 . . . 25 4.1.1 扱う経済データ . . . 25 4.1.2 空間重み行列. . . 25 4.1.3 数値シミュレーション . . . 26 4.1.4 37産業分類の空間自己相関 . . . 28 4.1.5 空間相互相関. . . 34 4.2 空間計量経済モデル . . . 37 4.2.1 データおよびモデル . . . 37 4.2.2 モデル選択 . . . 38 4.2.3 分析結果 . . . 38 4.3 考察. . . 43 第5章 終章 45 謝辞 46
第
1
章
はじめに
近年,日本では人口減少・少子高齢化の進行が懸念されており,今後経済をどのように発 展させていくか,その方向性が模索されている.社会情勢は時々刻々と変化し,グローバル 化や高度情報化の進展,そして東京一極集中などに対し国や地域で対応がなされてきた.そ うした中,2020年に拡大した新型コロナウイルス感染症は状況を一変させた. コロナ禍において人の移動は制限され,一部の産業では消費が急激に落ち込んだが,逆に 消費が増加した産業もある.また,テレワークの推進や人との接触の制限によってリモート 環境が整いつつあり,働き方にも変化がみられる.リモート環境の整備といった働き方の変 化などはこれまで求められてきていたものであり,不可逆的な変化と考えられる.今後は 「ポストコロナ」を見据えた社会形成が求められる. 政策を進めるに当たっては,「証拠に基づく政策立案(EBPM)」が推進されているように, データに基づく分析が重要である.これまでも,地域産業の分析は行われてきた.しかし, その分析は各地点を個別のものとして分析しているものがほとんどである.経済データの 一つである産業連関表は,一定の地域の中で一定期間に生産された財,サービスの投入と産 出を記録した表である.これに対して,地域内と地域外との取引を考慮するべきとして地域 間産業連関表というものが作成されている.これは,その地域とそれ以外とを区分したもの であり,そこに空間構造の情報はない.しかし,経済活動には周囲からの影響が存在し,空 間構造が関係するのが実情である.そのため,経済発展を促すための政策を打ち出しても, 空間的な影響を考慮しなければ想定した効果が得られないということにつながる. そこで,本論文では,空間統計学の手法を用いて,空間構造を考慮して各産業の分析を行 う.各産業が空間構造による影響を受けているかを検証し,産業ごとの特性を把握すること は,より効果的な地域振興政策の立案につながると考えられる.また,これまで産業集積に ついての研究は,「空間経済学」や「経済地理学」で行われてきたが,本論文の空間統計学 の手法はそれらとは異なるアプローチである.そこで,空間統計学とこれら先行研究分野に ついての関連についても検討する.第
2
章
背景
2.1
産業連関表による地域経済分析
2.1.1
地域経済分析
2015年の国勢調査において,同調査開始以来初めて人口が減少に転じ,日本は本格的な 人口減少社会へと突入した.少子高齢化の進行,東京一極集中などにより,今後,地域経済 が縮小することが懸念されている.2014年5月に「日本創生会議・人口減少問題検討分科 会」が提出した「ストップ少子化・地方元気戦略」と題する提言書では,「全国約1800の自 治体のうち,ほぼ半数の市区町村が2040年までに消滅の可能性に直面する」という試算が 示され,「地方消滅」という言葉も生まれた.こうした現状を受け,各地域において,その 特性を生かした地方創生の取組など,知恵を絞り,競い合いながら,地域活力の維持・向上 に向けた懸命な取組が進められている. 政策の立案や改定に際しては,データによる証拠に基づいた議論を行うべきであるという EBPMの考え方が普及している.地域経済政策においても例外でなく,内閣官房まち・ひ と・しごと創生本部は,「地域経済分析システム(RESAS)」を2015年4月21日より提供 している.地域経済政策の目的は,地域の経済厚生を向上させることであり,それは地域住 民の所得向上などにより達成される.そのためには,企業活動等による生産で得た所得が地 域内に分配され,支出されることでさらに生産を誘発するという経済循環構造がその地域に おいて構築されることが肝要である (日本政策投資銀行・価値総合研究所, 2019).そうした 観点から,地域経済の分析に際しては,地域の産業・経済の「生産面」に加えて,地域で得 た所得が地域住民に分配されるか,あるいは地域外に流出するかという「分配面」,そして, 地域住民が得た所得を地域内の生産物に消費・投資を行うか,あるいは地域外の生産物に消 費・投資が行われるかという「支出面」も重視されるようになり,実際,RESASでは,各 地域における生産・分配・支出の経済循環図が実装されている. 本論文では,経済データとして産業連関表を用いる.産業連関表は,産業間での財・サー ビスの流れを明らかにするものであり,ある一定地域の経済構造を総合的に把握することが できるものである (総務省他, 2020).本節では,産業連関表について,そのしくみと,分析表2.1: 産業連関表の形式 中間需要 最終需要 輸入 生産額 産業1 · · · 産業j · · · 産業n 国内 輸出 中間投入 産業1 X11 · · · X1j · · · X1n F d1 E1 −M1 X1 .. . ... ... ... ... ... ... ... ... ... 産業i Xi1 · · · Xij · · · Xin F di Ei ―Mi Xi .. . ... ... ... ... ... ... ... ... ... 産業n Xn1 · · · Xnj · · · Xnn F dn En ―Mn Xn 粗付加価値 V1 · · · Vj · · · Vn 生産額 X1 · · · Xj · · · Xn 手法およびその理論について説明する.
2.1.2
産業連関表
産業連関表とは,表2.1のように,一定の地域の中で一定期間に生産されたすべての財, サービスの投入と産出の取引金額を表形式で示したものである. 中間投入と中間需要で囲まれた部分を,内生部門と呼ぶ.内生部門では,産業間で取引さ れる原材料や燃料などの中間財の額が記載される. 産業連関表を列方向に見ることで,各産業が買い手としてどの産業からどれだけ購入して 生産に用いたかという,生産要素の投入構造の内訳が分かる.例えば,表2.1の産業jを列 方向(縦方向)に見ると,中間投入の欄で産業iからXij 購入したという原材料の購入先が 分かる.また,内生部門の下の欄の粗付加価値では,各産業の雇用者所得や営業余剰の内訳 が記載されている.中間投入と粗付加価値額を合計した額が産業j の生産額となる. また,行方向(横方向)に見ることで各産業が供給した製品がどの部門で使われたかとい うことが分かる.表2.1の産業iを行方向に見ると,中間需要の欄で産業iが産業jの生産 にXijだけ使われたということが分かる.さらに,内生部門の右の欄では各産業が最終需要 としてどれだけ消費・投資されたかということや地域外からの輸出入(あるいは,移出入) が記載されている.地域内の内生部門及び最終需要,地域外への輸出を合計した額から,地 域外より流入した財・サービスの額を引くことで地域内の生産額が計算される.行方向と列 方向の生産額は一致しており,X1= n X i=1 Xi1+ V1 | {z } 列方向 = n X i=1 X1i+ F d1+ E1− M1 | {z } 行方向 (2.1) となる.
2.1.3
逆行列係数表
産業連関表を使った分析指標として代表的なものに特化係数,感応度係数および影響力係 数がある.このうち,感応度係数,影響力係数を算出するには,逆行列係数表を作成する必 要があるので,ここでは,逆行列係数表作成のための理論について説明する. 上述の表 2.1は産業間の取引を記録した原表であり,取引基本表と呼ばれる.この取 引基本表において,産業 i から産業j への中間投入Xij を産業 j の生産額Xj で割った 値aij = XXijj を投入係数という.この投入係数や表 2.1の各要素のベクトル,行列表記を X = [Xi],A = [aij],F = [F di],E = [Ei],M = [Mi](i, j = 1,· · · , n)とすると, X = AX + F + E− M (2.2) となる.単位行列をIとするとこれは, X = (I− A)−1(F + E− M) (2.3) と変形できる. ここで,地域外からの輸入(あるいは移入)について考える.地域内の経済は,必要な財・ サービスを地域外から輸入する.この輸入量は,地域内の中間需要と最終需要の量に依存し ていると考えられる.そこで,産業iの輸入量Miが中間需要Pn j=1aijXjと地域内最終需 要F diの合計に比例しているとすると,その比率miは, mi= Mi Pn j=1aijXj + F di (2.4) となる.これを輸入係数という. この輸入係数を対角要素に持つn× nの対角行列をMˆ とおく. ˆ M = m1 0 · · · 0 0 m2 · · · 0 .. . ... . .. ... 0 0 · · · mn (2.5)この対角行列を用いると,式(2.2)は, X = AX + F + E− ˆM(AX + F) (2.6) となるので, X = [I− (I − ˆM)A]−1[(I− ˆM)F + E] (2.7) とできる.式(2.3)の(I− A)−1を表にしたものをレオンチェフの逆行列係数表,式(2.7) の[I− (I − ˆM)A]−1を表にしたものを競争輸入型の逆行列係数表という.逆行列の経済的 意味は,例えば,レオンチェフの逆行列で説明すると,国内最終需要が∆Fだけ増加した 時,各産業の生産額Xが(I− A)−1∆Fだけ増加すると解釈できる.
2.1.4
産業連関表の分析手法
産業連関表を使った分析指標として,特化係数や感応度係数および影響力係数というもの がある. 特化係数とは,地域における比較優位な産業を分析する際に用いられる指標である.地域 iにおける産業jの生産額をXijとすると,地域iの産業jの特化係数Cij は,次のように定 義される. Cij = Xij/ Pn j=1Xij Pn i=1Xij/ Pn i=1 Pn j=1Xij (2.8) つまり,特化係数は,地域iにおける,産業jの構成比が,全国の平均的な構成比と比べて どの程度大きいかを表す指標である. 次に,感応度係数および影響力係数について説明する.感応度と影響力の概念図は図2.1 のようになる. 感応度係数というのは,ある産業の販売先の消費や投資が増加した場合に,その産業が受 ける影響度を示す指標であり,逆に,影響力係数はある産業の消費や投資が増加した場合に その調達先に与える影響度を示す指標である.感応度係数は逆行列係数表の行和を,全体の 合計で割ることで求められる.つまり,n× nの逆行列係数表のi行j列の要素をBij とす ると,産業iの感応度係数Seniは, Seni= Pn j=1Bij Pn i=1 Pn j=1Bij (2.9)産業 1 産業 2 産業 n 産業 1 産業 2 産業 n ・・・・・・ ・・・・・・ 産業 i の販売先 産業 i の調達先 産業 i 影響力 感応度 調達先に与える影響 販売先から受ける影響 ( 価値総合研究所(2015)を参考に作成) 図2.1: 感応度と影響力の概念図 となる.また,影響力係数は,逆行列係数表の列和を,全体の合計で割ることで求められ る.つまり,産業jの影響力係数をEf fj とすると Ef fj = Pn i=1Bij Pn i=1 Pn j=1Bij (2.10) と計算される. 図2.2: 感応度と影響力の散布図 感応度係数と影響力係数は,通常,x軸に 影響力係数,y 軸に感応度係数をとった散 布図により視覚化が行われる(図2.2).こ の散布図において,感応度係数と影響力係 数がともに1より大きい産業は,他産業か ら受ける感応度も他産業へ与える影響力も 大きい産業であり,地域内の取引における 核となる産業であると解釈できる.そのた め,この産業を強化することで,地域内の 経済を効果的に活性化することができると 考えられる.
2.2
産業立地の先行研究
2.2.1
産業立地の学問
ある地域がある産業について相対的に優位性を持つという特化が生じる原因として, 曽・ 高塚 (2016)は2つの差異が生じるためであると述べている.1つは,生産技術における差 異であり,他の地域と比較して,相対的に生産性が高いことによるものである(リカードの 比較優位の理論).そして,もう1つは,生産要素の賦存量の差異であり,その地域に生産 要素が豊富にあることによるものである(ヘクシャー=オリーンの比較優位の理論).これ ら比較優位の理論は,貿易理論に代表されるものであるが,ある地域がある産業に特化する ということは,その産業が,その地域に「集積」しているとみなすことができ,立地理論に つながるものである. 藤田 (2010)によると,どのような産業がなぜ立地するのかという産業立地の研究は,伝 統的には「立地論」ないしは「経済地理学」において行われてきたが,1970年代末から貿 易理論を拡張する形で「新貿易理論」が発展し,1990年代に Krugman (1991)の研究から 「新経済地理学」が構築された.近年では,地理的空間における経済理論や実証分析につい ての学問分野を総称して「空間経済学」と呼んでいる. 「空間経済学」は広い意味で使われ,都市に焦点を当てた「都市経済学」や国内の地域に 焦点を当てた「地域経済学」を含むこともあるが,「空間経済学」の書籍では,均衡理論や 競争理論といったミクロ経済学的な観点の「立地論」に焦点を当てることが多いため,ここ では,「空間経済学」を「新貿易理論」や「新経済地理学」へとつながる「立地論」の文脈で 扱い,「経済地理学」と分けて議論する. このように分けて考えるのは「立地論」の文脈での「空間経済学」が,「実際の空間経済の 主要な特性について統一的な理解を可能にしてくれるような,有意義な一般立地モデルを構 築する」(藤田, 2010)ことを目的として,ミクロ経済学的な基礎理論から導かれる一般立地 モデルの作成及びそのモデルのシミュレーションによる実証分析を行うのに対し,「経済地 理学」においては,「経済現象を空間的側面や地域性から明らかにし,問題解決に寄与する」 (伊藤他, 2020)ことを目的としており,地域ごとのユニークネスから,経済現象の空間性・ 地域性の説明論理を構築するという異なるアプローチを取っているためである. 産業立地を研究する「空間経済学」と「経済地理学」であるが,その着眼点として共通するのは「距離」と「拡がり」である (伊藤他, 2020).「距離」は,財や,サービス,人,情 報が空間を移動する際に掛かる負荷である.物の移動の輸送費や人の移動費をはじめとし て,企業間の距離が離れれば取引費用の負担増加につながる.「拡がり」は人間が活動する 資源や機会を与える.生産資源が豊富であったり,取引機会が多かったりすることは,企業 の生産の増加につながる.そして生産が増えると,規模の経済により生産性は高くなる.一 方で,生産性の高い優等地ほど,高い地代が設けられ,企業のコスト増につながる.また, 空間上の「拡がり」は,財やサービスを生産するだけでなく,それらが需要される場でもあ る.人口密度が高ければそれだけ需要量も増える.しかし,一方で,人口の密集は,地代の 上昇や生活環境の悪化といった外部不経済が生じる要因ともなる.産業立地の学問では,こ れらの経済的現象を説明する理論を構築しようという試みがなされる. 中心地からの 距離 単 位 面 積 当 た り の 収 益 ( 地 代 ) 自 由 式 林 業 輪 裁 式 穀 草 式 三 圃 式 牧 畜 図2.3: Th¨unenの孤立国模式図 (近藤(1974)の図を参考に作成)
2.2.2
古典的産業立地論
Samuelson (1983)が「地理学者と立地論者にとっ て,チューネンは開祖神である」と述べているよう に,産業立地の理論はJ.H.von Th¨unenの著書「孤 立国」 (von Th¨unen, 1826)にはじまるとされる. 18世紀初頭にイギリスのノーフォーク地方で生ま れた輪裁式農業が,18世紀から19世紀にかけて西 ヨーロッパに普及した.従来の穀物栽培に加えて, 輪裁式農業は休閑地を利用して飼料作物を栽培する ものであったが,Th¨unenは休閑地の作物栽培によ り費用が嵩むことから,採算性を維持するには,主 要な消費地からの距離に応じた適地適作を考慮する 必要があると考えた.その考察の結果として出版さ れたのが1826年の「孤立国」である.Th¨unenは, 古典的なモデルを構築するため,複雑な現実を抽象 化して単純な前提条件を置いた.まず,「他国との 交易関係を持たない孤立した国」を想定し,その孤 立国が,土壌条件,気候条件などが均質な平野にあ り,農産物は最短(直線)距離で輸送できるとした.また,農業生産者は所与の土地で利益を極大化するように選択するという仮定を置いた. こうした前提条件を仮定すると,地代と輸送費用が農作物によって異なるため,農業経営 が同心円状に6圏に分化することを示した(図2.3).例えば自由式で栽培される蔬菜類や生 乳は劣化が速いため,都市に近い地点で高い収益性を確保できる.逆に第6圏の牧畜は,家 畜が自力で移動できる上,牛乳をバターなどに加工して出荷する.そのため,距離減衰の程 度が小さく,中心地より遠い位置に立地している. Th¨unenのモデルは市場競争の結果,都市からの距離に応じて立地パターンが生じるとい う洞察を得ており,現在まで産業立地の研究に広く取り入れられている先駆的な研究となっ ている.
2.2.3
「空間経済学」
経済の一般均衡モデルにおいて,空間を明示的に扱う必要があるかについては,長い間議 論があった (藤田, 2010).Arrow and Debreu (1954)など,新古典派の一般均衡理論家は,空間の問題は,各財が 消費される場所で区別することによって解決できるため,特に空間構造を考慮する必要はな
いと考えていた.一方で, Isard (1949)は,「生産者を互いに引き離している交通と空間費
用の特異な効果について考慮されるべき」としていた.
そうした中,Koopmans and Beckmann (1957)により,空間経済における完全競争の一 般均衡理論の限界が提示された.これは「空間不可能性定理」として知られており,「すべ ての地域が一様で,消費者の選好が飽和していないとき,正の輸送費を伴う競争均衡は存在 しない」ことを示した.すなわち,現実の世界で産業の集積が起きているのは以下のいずれ かの理由によるものと考えられる. (1)空間が同質的でない (2)経済活動に技術的外部性が生じている (3)市場が不完全競争的である Th¨unenの孤立国は一つの都市を空間に想定したもので,(1)に相当する. 1950年代後半,多くの国で都市問題が発生する中,都市の土地利用の研究が必要とされ,
Th¨unenの先駆的研究が注目されはじめた. Alonso et al. (1964)は,Th¨unenの農業立地 論を数理モデルに一般化することに成功し,現代の都市経済学の理論的基礎を与えた.しか し,Alonsoのモデルは単一中心都市を仮定したものであったため,都市が単一かそうでな
いかを事前に仮定しない都市モデルの構築が求められた. こうした中,Krugman (1991)は,空間構造を事前に仮定せず,企業レベルの規模の経済 と輸送費および消費者の多様性に対する選好をモデルに取り込むことで,特定の空間構造が 生まれ,変化していくことを示した.このKrugmanの先駆的な研究により,内生的に空間 構造が決定するモデルを扱うことができるようになり,「空間経済学(新経済地理学)」が急 速に発展した.この分野では,現在に至るまで,様々なモデルの改良や現実の空間構造との 接合を試みる研究が行われている (渡辺, 2017).
2.2.4
「経済地理学」
経済地理学においては,各産業の空間的様態を把握し,その分布や変動について,集積と 分散の理論から説明するという手順を取ることが多い. 伊藤他 (2020)によると,産業立地 の空間パターンは大きく次の2つに分けられる. (1)広範な地域に遍く分布する産業(遍在する産業) (2)特定の地域に偏って局地的に集中する産業(偏在する産業) (1)の「遍在する産業」は醸造業や建設資材工場といった,各地の地域需要に応えるため に比較的均等に分布している産業である.ただし,輸送費用が無視できるほど小さくなる と,それらは,大都市付近に偏在することとなる.また,電子部品や衣服縫製といった労働 集約的な産業も,安価な労働力を求めて周辺地域に立地するとともに,労働力調達上の競合 を避けて,均等に分散してきた. (2)の「偏在する産業」としては,原料地に集中する産業があり,このような生産要素や 工業用地に引き付けられた集積を「偶然集積」という.一方,ある地域に集まった事業所間 の相互作用により集積が生じる場合がある.これを「純粋集積」といい,通常,産業集積と いった場合,「純粋集積」を指す. 「純粋集積」が生じる経済的要因を Marshall (1985) は,外部経済と呼んだ. 伊藤他 (2020)では,外部経済となる経済的要因として3つを挙げている. 第1に分業による利益である.ある地域に関連産業が集まることで,その地域の企業同士 で分業をし,それぞれの経営体は自身の専門に集中することができる.第2に取引費用の節 約がある.距離が近いことにより,接触を密にとることができ,業務を円滑に行うことがで きる.最後に特化した地域労働を活用できるという点である.特定の産業が集まることで, その地域に関連技術を持った人材が引き付けられるため,専門性の高い人材とマッチングする機会が増える.これらの利点は,生産物が「需要の見通しが立ちにくく標準化されていな い」状態の時,特にその効果が発揮される. では,逆に産業が集積地から分散するのはどのような時であろうか.分散が生じるのは, 外部不経済が起きるときである.外部不経済としては,地代や賃金の上昇が挙げられる.そ れに加え,生産物が標準化され,外部経済の効果が薄れた時,産業の分散が起きると考えら れている.
2.2.5
本論文のアプローチ
以上のように,約200年前のTh¨unenの考察にはじまり,産業立地についての研究はこれ まで多くの知見が積み上げられてきた.「空間経済学」は,理論的に明快な洞察を得ること に比重を置き,解析的困難を緩和するために現実の立地空間を単純化してモデル構築を行っ てきた. 近年,「空間経済学」の一分野である「新経済地理学」の構築により,複雑なモデルの研 究が進められている.しかし,均衡解の分岐が不連続であり,その解明が困難であることか ら,モデルの一般的特性は理論的にほとんど解明されていない (高山, 2013).そのため,一 極集中的な集積のみを生ずるモデルが採用され,そのパラメータも先験的に仮定されてい る (大澤実・赤松隆, 2017). また,「経済地理学」においては,地誌的な研究や地域不均等の議論,産業集積の独自理 論の探求が行われてきたが, 松原 (2013)が近年の状況を「方法論なき実証研究」と指摘す るように,その研究は地誌学的な傾向がある. そこで,本論文では,実際の空間構造を考慮した形で,産業立地について「空間統計学」 による分析を試みることとした.「空間経済学」においても,実際の空間構造によるシミュ レーションは行われているが,上記のように現実を単純化したモデルからのシミュレーショ ンを行っており,パラメータも先験的に仮定されたものとなっている.一方で,空間統計学 は,空間相関やモデルのパラメータをデータから推定するものであり,より客観的な分析が 可能になると考えられる.第
3
章
分析手法
3.1
空間統計学
3.1.1
空間データ
空間データを取り扱う分析は,近年関心を集めている.この大きな理由として, Anselin (2010)は,人工衛星の利活用が進み,位置情報を得やすくなったことやコンピュータの高 性能化,低価格化が進むとともに,ソフトウェア開発などにより空間データを扱う技術が容 易に利用可能になったことを挙げている. 20世紀の統計学の花形の一つである時系列分析が,時間方向の1方向で影響を与えてい るのに対し,空間データは,同時点で双方向に影響しあうことから,その分析は複雑なもの となる.空間統計学の基礎的理論は1960年代以降であり,応用研究に広く使われるように なったのは1990年代になってからである (瀬谷・堤, 2014).本節では,空間データを定義 し,その統計的取り扱いについて論じる.3.1.2
空間データの定義
GIS の普及とともに様々な商用ソフトウェアで空間データが利用可能になっている.各 ソフトウェアで独自のデータ形式を扱っているが,その基本構造は共通しており, 古谷 (2011)は,いずれの空間データの形式も,幾何特性とともに,座標系に関する情報や統計的 特性を示す属性情報が関連付けられていると述べている. ここで,ユークリッド空間における空間的な位置,すなわち座標系をsとおくと,実数全 体の集合をRとした時,s∈Rd とおける.ここで,dは次元を表し,d = 2なら平面空間, d = 3なら立体空間を表す.幾何特性を領域Dとおくと,その領域における属性情報は{ Y (s) : s∈ D}と定義される.空間統計学では,Y(s)の実現値y(s)から相関関係や確率過 程のモデル化などについて分析を行う. 瀬谷・堤 (2014)は,領域Dの様態によって,空間データを3種類に分類している(表 3.1).これを, 古谷 (2011)で挙げている例と対応させながら見ていく. (1)の地球統計データy(s) では,領域Dは連続で固定された集合となっており,Y (s)は表3.1: 空間データの分類 分類 (1)地球統計データ (2)格子/地域データ (3)点過程データ 実現値y(s) 領域中のいたる ところで値を取る 離散的なサブ領域に おいて値を取る ランダムに発生する イベントに関する 値を取る 適用例 環境センサー, 土壌特性など 社会経済データ, 選挙投票行動など 犯罪密度分布, 眼球運動計測など 領域中のあらゆる位置で実現値が与えられる.例として,環境政策分野の環境汚染物質の濃 度予測がある.環境センサーで収集したポイントサンプリングデータにより,空間的な傾向 を把握して,サンプリングしていない地点の予測ができる.農業政策分野では,畑の土壌 特性をサンプリングして空間補完を行うことで,土地全体の空間分布を予測することがで きる. (2)の格子/地域データでは,領域Dは離散的で固定されたサブ領域の集合となっており, Y (s)は離散的なサブ領域ごとに実現値が与えられる.例として,都市・地域政策の分野で, 行政境界単位で集計された人口データなどを基に,住宅や職場,交通網の整備に伴う社会経 済的な影響評価が行われている.また,政治学の分野で,選挙投票行動について空間的な相 関を考慮することで,得票の空間的な波及効果や結果の要因分析に応用されている. (3)の点過程データでは,領域DはY (s)の実現値が発生する位置によって,ランダムに 変化する.例として,防犯分野では,犯罪発生地点の分布を空間点過程として分析すること で,犯罪発生環境の要因分析やホットスポットの把握が行われている.また,人間工学分野 の眼球運動計測では,注視点の集積性の分析が,自動車ドライバーの安全運転や景観解析に 応用されている. なお,本論文で使用する経済データは(2)の格子/地域データに相当するため,以降は空 間データを格子/地域データとして述べる.すなわち,離散的で固定されたサブ領域sの属 性情報Y (s)を対象とする.
3.1.3
空間重み行列
瀬谷・堤 (2014)は,空間データの特徴として,「空間的自己相関」と「空間的異質性」を 挙げている.「空間的自己相関」とは,空間的に近いものほど,事物の性質が似るというものである.一方,「空間的異質性」は,地域の固有性と表現でき,主に空間統計モデルの観 点から,誤差項の分散の不均一性として定義されることが多い. これら空間データの特徴を把握するのに必要なのは,各観測地の近さの概念である. Arbia (2014)は,空間データを扱う際に2つの異なる情報が必要になると述べている.一 つ目は,変数の観測地,すなわち座標についてであり,二つ目は,観測された場所や空間的 な観測地点間の結びつきである.この,二つ目の情報を表現するものが,空間重み行列で ある. 地点i, j(i, j = 1,· · · , n)において,観測地yi, yjが与えられているとする.観測地点がn 地点であることから,空間重み行列W はn× nの行列となる.そして,要素wijはyiとyj に依存関係があればその依存度を与え,依存関係がなければ0とする.ただし,対角線の要 素wii = wjj = 0である.空間重み行列は,yiとyj の依存関係をどのように定義するかで 決まる.
Stakhovych and Bijmolt (2009) は,空間重み行列Wの与え方を次の3つに分類して いる. (1)外生的に与える (2)データから決定する (3)推定する (1)は典型的な手法で,隣接行列や距離の逆数,各地点を三角形で結ぶ三角形分割などの 与え方が代表的である.(2)は社会ネットワークや経済的な結びつきで与える方法や後述す る局所空間統計量に基づき構築する方法が用いられている.しかし,空間重み行列は外生的 である必要があるとの指摘もある (瀬谷・堤, 2014).また,(3)の研究は非常に少なく,発 展途上とされている.そこで,本論文では,(1)の外生的に与えた空間重み行列を採用して いる.外生的に与える手法でも,距離の逆数を閾値なしで用いると,0がほとんどない密な 行列となり,空間過程が過度に平滑化され,空間相関パラメータが過小評価されることが指 摘されている (Smith, 2009).本論文においては,代表的で実証研究において使われること の多い隣接行列を行基準化したものを用いている. まず,隣接行列について説明する.隣接行列は観測値が与えられるサブ領域同士が接して いる場合1,接していない場合0とする行列である.例えば,図3.1のような仮想領域にお いては,以下のような空間重み行列で表される. 0 1 1 1 0 1 0 1 1 0 1 1 0 1 1 1 1 1 0 1 0 0 1 1 0 (3.1)
5 4 3 2 1 図3.1: 仮想領域 空間重み行列は各行の合計が1になるように,次のように基準化されることが多い. wij∗ = Pnwij j=1wij 上記の例の場合,次のようになる. 0 1/3 1/3 1/3 0 1/3 0 1/3 1/3 0 1/4 1/4 0 1/4 1/4 1/4 1/4 1/4 0 1/4 0 0 1/2 1/2 0 (3.2) 行基準化することで,後述する空間自己相関の統計量の形がシンプルになったり,空間計量 経済モデルにおいて空間ラグ変数が,近傍の観測値から受ける影響の重み付き平均となり, 空間パラメータの解釈が容易になったりする利点がある.
3.2
空間的相関分析
3.2.1
空間自己相関
空間自己相関の定量的な指標としては,MoranのI統計量(Moran’s I)が代表的であ る.これは,Moran (1948, 1950)によって導入された. Cliff and Ord (1981)はこれを一 般化し,その漸近分布が特定の仮定に依存せず,正規分布となることを証明した.空間自己相関には大域的空間自己相関と局所的空間自己相関がある.大域的空間自己相関 は,データ全体の空間自己相関の有無に対する測度であるのに対し,局所的空間自己相関は,
はグローバル・モラン,局所的空間自己相関のMoran’s Iはローカル・モランと表現され る.本論文では,特に表記がない場合,Moran’s Iはグローバル・モランを指す. 対象の領域中のn個のサブ領域における観測値y(s) = [yi](i = 1,· · · , n)に対して大域 的空間自己相関のMoran’s Iは以下のように定式化される. I = n S0 Pn i=1 Pn j=1wij(yi− ¯y)(yj − ¯y) Pn i=1(yi− ¯y)2 (3.3) ここで,S0 = Pn i=1 Pn j=1wij は空間重み行列全要素の和であり,空間重み行列が基準化さ れているとき,n S0 は1となるので,Moran’s Iの式はシンプルになる.Moran’s Iについ て,漸近正規性を仮定した場合, Z = pI− E(I) V ar(I) (3.4) と標準化したZは,漸近的に標準正規分布N(0, 1)に従うため,仮説検定が可能となる.な お,期待値および分散は以下のとおりとなる. E(I) = −1 n− 1 (3.5) V ar(I) = 1 (n− 1)(n + 1)S2 0 (n2S1− nS2+ 3S02)− [E(I)] 2 (3.6) S1= 1 2 n X i=1 n X j=1 (wij+ wji)2, S2= n X i=1 (wi+ wi∗) 2 wi= n X j=1 wij, w∗i = n X j=1 wji Moran’s Iが0より大きいと正の自己相関,すなわち,空間的に近い地点は似た傾向を 示すことを表す.逆に0より小さいと負の自己相関を示し,空間的に近い地点が異なる値 となるという,ちょうどチェッカーボードのような傾向にあることを示唆する.ただし, Moran’s Iはピアソンの相関係数のようにレンジが[−1, 1]とは限らないということは留意 する必要がある.なお, 丸山 (2014)は,Moran’s Iのレンジが[−1, 1]となるように修正 した「モランの修正型I統計量」を与えたが,オリジナルの統計量より複雑になるため,期 待値や分散の導出が困難なものとなっている. 次に,局所的空間自己相関について述べる. Anselin (1995)は,ローカル・モランを次式 のように定義した. Ii= yi− ¯y m2 n X j=1 wij(yj − ¯y) (3.7)
ここで,m2=
∑n
i=1(yi−¯y)
2 n は比例定数である.ローカル・モランの和を取ると n X i=1 Ii= n X i=1 yi− ¯y m2 n X j=1 wij(yj − ¯y) (3.8) となり,グローバル・モランと比べると, I = Ii S0 (3.9) という関係にあるため,グローバル・モランとローカル・モランの和は比例関係にあること が分かる. また, Anselin (1996)は空間的な分布の視覚化を行うモラン散布図を提案した(図3.2). モラン散布図は,x軸に標準化した観測値を,y軸に空間ラグ変数をとりプロットした散布 図である.これにより,散布図の第1象限に周囲もその地点自身も高い値を取るスポット (ホットスポット),第3象限に周囲もその地点自身も低い値を取るスポット(クールスポッ ト)がくるなど,視覚的に空間的分布を把握することができる. 第1象限:High-High 高い値が集積 第3象限:Low-Low 低い値が集積 第2象限:一人負け 自身は低いが、 周辺は高い 第4象限:一人勝ち 自身は高いが、 周辺は低い ラグ変数 観測値 y(s) 回帰直線の傾きが、 Moran’s Iの値に相当 𝑗 𝑤𝑖𝑗𝑦𝑗 図3.2: モラン散布図のイメージ
3.2.2
空間相互相関
Chen (2013, 2015)は,グローバル・モランおよびローカル・モランについて線形代数的 に単純な形式に整理し,2変数の空間相互相関の指標を提案している.n個のサブ領域にお ける観測値をX = [x1, x2,· · · , xn]T, Y = [y1, y2,· · · , yn]T とする. このとき,観測値の平均µx = 1n Pn i=1xi, µy = n1 Pn i=1yi ,母分散σx2 = n1 Pn i=1(xi− µx)2, σ2y = n1 Pn i=1(yi− µy)2 を用いて,観測値の基準化はx = X−µx σx , y = Y−µy σy ,とでき る.以後,本項では,観測値を基準化したx, yを用いる. また,空間重み行列は,1.1.3項では,行基準化w∗ij = ∑wij n j=1wij の行列を用いていたが,ここ では,Chen (2015)に合わせてW = [w˜ ij]n×n s.t.wij = wji, |wii| = 0, Pn i=1 Pn j=1wij = 1 と全要素の和が1になるものを用いる. これらを用いて,空間相互相関係数は次のように定義される. Rc= xTWy˜ (3.10) また,Rcはスカラーなので,W˜ の対称性より, Rc= (xTWy)˜ T = yTW˜ Tx = yTWx˜ (3.11) となる.ただし,本論文の第4章の行基準化した隣接行列のように,空間重み行列が対称で ない場合は,xTWy = yTWxは必ずしも成り立たない. なお,空間的距離を考慮しない場合,相互相関係数は次のように書ける. R0= xTW0y = yTW0x ; W0 = 1 nE (3.12) これは, R0= xT 1 n y = yT 1 n x = 1 nx Ty = 1 ny Tx (3.13) となるので,ピアソンの相関係数となり,xとyの単純な相互相関を示している.また, Rp = R0− Rcを部分相関とすると,各相関係数は次のように解釈できる. Rc(空間相互相関):地理的な空間距離等の要素を介したxとyの間接的な相関 Rp(部分相関):空間距離等の要素を含まないxとyの直接的な相関 R0(ピアソンの相関):直接的な相関と間接的な相関の総和3.3
空間計量経済モデル
3.3.1
採用モデル
通常の線形回帰モデルに空間自己相関を導入したものを空間計量経済モデルという. LeSage and Pace (2009)は,空間計量経済モデルを用いる動機を以下の 5つに分類して いる. (a) 時間依存性に関する動機 (b) 除外変数に関する動機 (c) 空間的異質性に関する動機 (d) 外部性に関する動機 (e) モデルの不確実性に関する動機 (a)はあるサブ領域の影響が一定時間をおいて近隣に波及するような状況を示す.(b)は, 除外している変数に空間的な自己相関があり,かつ,説明変数と相関を持つ時,その係数が バイアスを持つので,その影響を明示的に取り除くという動機である.(c)は,3.1.3項で 触れた空間的異質性を表現するため,空間的に相関する誤差項を導入するものである.(d) は,近隣地域からの影響(空間的スピルオーバー)をモデル化する動機である.(e)では,モ デルの不確実性の観点から,より一般的なモデルの使用を薦めている. 空間計量経済モデルの一般的なモデル形は以下の方程式で与えられる y = ρWy + Xβ1+ WXβ2+ u u = λWu + ϵ ϵ∼ N 0, σϵ2I y :目的変数ベクトル, W :空間重み行列 X :説明変数行列, β1, β2:回帰係数ベクトル u, ϵ :誤差項ベクトル, ρ, λ :空間パラメータ (3.14) これらすべての項を入れた式は一般化空間モデル(SARARモデル)と呼ばれ,β1, β2 = 0 の時を除いて実行可能であるが ,空間パラメータλとρの識別はできない (Elhorst, 2010). そこで、本論文の第4章では,(3.14)式が包含しており,よく使われるモデルである空間
自己回帰モデル,空間ラグモデルおよび空間ダービンモデルを採用している.これらのモデ ル式は以下のとおりである. 1 ○ ρ̸= 0かつβ1,β2= 0,λ = 0の「空間自己回帰モデル」 y = ρWy + ϵ (3.15) 2 ○ ρ̸= 0かつβ2= 0,λ = 0の「空間ラグモデル」 y = ρWy + Xβ1+ ϵ (3.16) 3 ○ ρ̸= 0かつλ = 0の「空間ダービンモデル」 y = ρWy + Xβ1+ WXβ2+ ϵ (3.17) これらのモデルの選択基準として,赤池情報量規準(AIC)がよく用いられる (Akaike, 1974).AICは, AIC =−2(log L∗− k) (3.18) log L∗:最大対数尤度, k :パラメータ数 (3.19) と定義され,このAICが最小のモデルが良いモデルとして選択される.
3.3.2
最尤法によるパラメータ推定法
一般に,最も広く用いられているパラメータ推定法は,最小二乗法であるが,空間的自己 相関が存在する場合,最小二乗推定量は最良線形不偏推定量(BLUE)とはならないことが 知られている(瀬谷, 2014).空間ラグモデルの場合,最小二乗推定量には偏りがあり,かつ 一致性も持たない.また,空間誤差モデルの場合,回帰係数の分散が過小に評価される. そのため,空間統計モデルのパラメータ推定にはいくつかの代替的な手法が用いられる. 本論文では最尤法を用いるが,最尤法のほかに,Kelejian and Robinson(1993)は,空間ラグモデルに対して空間二段階最小二乗(S2SLS)法による推定法を提案した.S2SLS法は 計算負荷が小さく,非正規分布に対して頑健であるという長所がある一方で,誤差項が正規 分布に従う場合,最尤法による推定量と比べて相対的に有効でないことが知られている(清 水・唐渡,2007). ここでは,3つのモデルの中で最も一般化されたモデルである空間ダービンモデルの最 尤推定法 (Anselin, 2013)について述べる.空間自己回帰モデル,空間ラグモデルにおいて
も,同様の枠組みで推定可能である.ここでは簡単のため,説明変数のラグ無し項とラグ有 り項を以下のようにまとめて扱う. y = ρWy + Xβ1+ Wxβ2+ ϵ = ρWy + ˜X ˜β + ϵ ϵ∼ N 0, σϵ2I (3.20) ここで,X = [X; WX], ˜˜ β = [β1; β2]である.このとき,式(3.20)は,以下のように変形 できる. y = (I− ρW)−1X ˜˜β + (I− ρW)−1ϵ (3.21) よって,ϵ∼ N 0, σ2ϵIより, E[y] = ρWy + ˜X ˜β (3.22) E[yTy] = σϵ2((I− ρW) T (I− ρW))−1= σϵ2Ω (3.23) このとき,尤度関数は次式となる. L(ρ, σϵ2, ˜β) = const.× |2πσ 2 ϵΩ|− 1 2 × exp − 1 2σ2 ϵ (y− ρWy − ˜X ˜β)TΩ−1(y− ρWy − ˜X ˜β) (3.24) よって,対数尤度関数は次のように書ける. l(ρ, σϵ2, ˜β) = const.−1 2ln|2πσ 2 ϵΩ| − 1 2σ2 ϵ (y− ρWy − ˜X ˜β)TΩ−1(y− ρWy − ˜X ˜β) (3.25) また,行列式|σ2 ϵΩ|を書き直すと, |σ2 ϵΩ| = |σ 2 ϵ (I− ρW) T(I− ρW)−1)| = σ2nϵ |(I − ρW)−1||((I − ρW)T)−1| = σ2nϵ |I − ρW|−2 (3.26) よって,式(3.25)は, l(ρ, σϵ2, ˜β) = const.− n 2ln(2πσ 2 ϵ) + ln|I − ρW| − (y− ρWy − ˜X ˜β)T(y− ρWy − ˜X ˜β) 2σ2 ϵ (3.27) となる. 推定すべきパラメータは,ρ, σ2ϵ, ˜β であるが,同時に求めることはできないので,σϵ2, ˜βの 最尤推定値を求めて,その値を代入してρの推定値を求める. 手順を示すと,以下のとおりである.
[1] y をX˜ で回帰して,OLS推定値βˆ˜0を得る ˆ˜ β0= ( ˜XTX)˜ −1X˜Ty (3.28) [2] WyをX˜ で回帰して,OLS推定値βˆ˜ dを得る ˆ˜ βd= ( ˜XTX)˜ −1X˜TWy (3.29) [3] 残差ϵˆ0とϵˆdをそれぞれ次で計算する. ˆ ϵ0= y− ˜Xβˆ˜0 (3.30) ˆ ϵd= Wy− ˜Xβˆ˜d (3.31) ˜ βの最尤推定量β˜˜は,次で与えられる. ˜˜ β = ( ˜XTX)˜ −1X˜T(I− ρW)y =βˆ˜0−βˆ˜d (3.32) 空間ダービンモデルのモデル式(3.20)より, ϵ = (I− ρW)y − ˜X ˜β = y− ˜Xβˆ˜0− ρ(Wy − ˜Xβˆ˜d) = ˆϵ0− ρˆϵd (3.33) であるから, ˆ σ2 ϵ = (ˆϵ0− ρˆϵd)T(ˆϵ0− ρˆϵd) n = (y− ρWy − ˜X ˜β)T(y− ρWy − ˜X ˜β) n ! (3.34) となる.よって,式(3.27)は,次のとおり,ρについての関数となる. lc= const.− n 2ln (ˆϵ0− ρˆϵd)T(ˆϵ0− ρˆϵd) n + ln|I − ρW| (3.35) [4] 式(3.35)を最大化する推定値ρˆを得る. [5] ˆρを用いて,β, ˆˆ˜ σ2 ϵ を得る. ˆ˜ β =βˆ˜0− ρβˆ˜d (3.36) ˆ σ2 ϵ = (ˆϵ0− ρˆϵd)T(ˆϵ0− ρˆϵd) n (3.37)
3.3.3
回帰係数の解釈
通常の線形回帰モデルy = Pkr=1Xrβr + ϵでは,観測地点間は独立であるとしているた め,観測地点i(i = 1,· · · , n)における目的変数yiの説明変数Xjr(j = 1,· · · , n)による偏微 分は,単純にi = jの時 ∂yi Xjr = βr,i ̸= jの時 ∂yi Xjr = 0となる.よって,E[yi] = Pk r=1Xirβr となり,回帰係数βr は,ある一つの説明変数Xr が1単位増加した時の目的変数yの変動 と直接的に解釈できる.しかし,空間計量経済モデルにおいては,地点iにおける説明変数 Xir の変動は,同地点のyiのみならず,他の地点のyjに対しても影響を与えるため,回帰 係数の解釈は異なる. 例えば,空間ラグモデルの場合を考える.空間ラグモデルは, y = ρWy + Xβ + ϵ (3.38) と書ける.これを変形すると, y = (I− ρW)−1Xβ + (I− ρW)−1ϵ (3.39) となる. ここで, Sr(W) = V(W)βr (3.40) V(W) = (I− ρW)−1 (3.41) とし、Sr(W)のij成分をSr(W)ij とすると, y1 .. . yn = k X r=1 Sr(W)11 · · · Sr(W)1n .. . . .. ... Sr(W)n1 · · · Sr(W)nn X1r .. . Xnr + V(W)ϵ (3.42) とできる.これを基礎として,LeSage and Pace (2009)は,以下のようなインパクト指標 を提案した. (1)平均直接インパクト(ADI) それぞれの観測地点iについて,Xirの変化がyiに与えるインパクトの総計を平均したも ので,Sr(W)の対角項の平均. ADI = 1 ntr[Sr(W)] = 1 n n X i=1 Sr(W)ii (3.43) (2)平均総インパクト(ATI)ある一つの観測地が他の全ての観測値に与えるインパクトの総計について,すべての観測 地点での平均を取ったもので,Sr(W)のすべての要素の平均. AT I == 1 n2 n X i=1 n X j=1 Sr(W)ij (3.44) (3)平均間接インパクト(AII) ATIとADIの差分を取ったもので,Sr(W)の非対角要素の平均. AII = AT I − ADI (3.45) これらの指標によって,ある地点の説明変数Xir が1単位変動したら,その地点の目的変 数yiをADIだけ変動させ,さらに,その影響が他の地点にスピルオーバーする.結果的 に,Xirの1単位の変動によって,目的変数yは平均的にATIだけ変動するという解釈に なる.
第
4
章
空間統計学による分析結果
4.1
空間相関分析
4.1.1
扱う経済データ
産業の集積を分析するため,2011年の各都道府県の産業連関表の取引基本表のうち,生 産者価格評価表を用いた.各都道府県の産業部門数は,都道府県ごとに異なっており,国が 作成している全国の産業連関表では,統合大分類は37分類で構成されているが,都道府県 が作成している産業連関表では,それぞれの地域に特徴的な産業をより詳細に分けるなど, 地域ごとに特性を示しており,産業の分類数が33∼45分類と異なっている.国では37分 類のほか,13分類の産業連関表やより細かく分けられている108分類の産業連関表などを 作成しているが,都道府県レベルでは分類数が異なっているか,あるいはこれらを作成して いない場合がある. そこで,本章の分析では,全都道府県が作成していることから,全国版の37分類に当た る統合大分類を用いることとした.前述したように,都道府県ごとに分類数がそれぞれ異 なっており,各都道府県の産業連関表を37分類に再構成する必要があったため,各都道府 県が作成している「2011年産業連関表 部門分類表」を利用して,各分類の内訳の突合を 行い,37分類に える作業を行った. ただし,東京都は他の道府県と異なり,本社部門を独立して設けている.この取り扱いに ついては,本社部門の額を各産業の生産額で案分したり,労働者の数で各産業に配分したり するなどの方法が考えられるが,上記のような手法で補正した場合,産業ごとの特徴を損な う恐れがあると判断し,東京都の産業連関表については本社部門を除くこととした. 産業部門を37分類に えた各都道府県の産業連関表について,各産業の特化係数,感応 度係数,影響力係数を計算し,以降の分析に用いた.4.1.2
空間重み行列
空間重み行列は隣接行列を行基準化したものを用いた.隣接の条件は,県境が陸続きで接 していることを基本に判定した.ただし,沖縄県と北海道はどの都道府県とも陸続きとなっ図4.1: 都道府県の隣接関係 ていないため,沖縄県と鹿児島県,北海道と青森県は隣接しているものとみなした.また, 九州,四国,本州もそれぞれ陸続きとなっていないため,関門橋でつながる山口県と福岡県, 本州四国連絡橋でつながる兵庫県と徳島県,岡山県と香川県,広島県と愛媛県もそれぞれ隣 接しているものとみなした.隣接した都道府県同士を線でつないだ様子を図4.1に示す.
4.1.3
数値シミュレーション
産業連関表のデータの分析に先だって,空間自己相関の指標であるMoran’s Iが,各都 道府県の観測値によってどのような傾向を示すのか確かめるために数値シミュレーション を行った. 2.2.1項で述べたとおり,産業立地について研究する「空間経済学」と「経済地理学」で は,「距離」と「拡がり」に着目する.本節のMoran’s Iの計算において,「距離」は,サブ表4.1: 数値シミュレーションのMoran’s I 説明変数 影響 観測値との関係 Moran’s I p値 比例 0.281 0.001 自身のみ 指数 -0.008 0.124 人口密度 逆数 0.522 0.000 比例 0.628 0.000 自身+周辺 指数 0.730 0.000 逆数 0.337 0.000 ランダム変数(正規分布) 自身のみ 比例 -0.060 0.638 領域(ここでは,都道府県)間の隣接関係で表現される.そして,「拡がり」は人間が活動 する資源や機会を与えるものであり,このシミュレーションにおいては,「人口密度」(人口 推計;2011年10月1日現在)を扱うこととした.人口密度が高いほど,財やサービスの需 要量が増え,また,労働力も確保しやすいため,人口密度は各産業にとっての資源や機会を 与えるものであり,「拡がり」を示す一つの指標として考えることができる. 各都道府県の値(観測値)の決め方として,観測値と「人口密度」はそれぞれ「比例関係」, 「指数関係」,「逆数に比例する関係」にあると想定する.なお,比較のため,正規分布から ランダムに発生した変数を用いたシミュレーションも行った.観測値を発生させる際には, 人口密度を基準化した値(以下では,単純に「人口密度」と表記する)を用いた.観測値は, 比例関係にある場合,各都道府県の人口密度の値とした.指数関係の場合は,自然数を人口 密度の値で累乗した.逆数に比例する関係の場合,人口密度の逆数の値とした.ランダムに 発生させる際は,正規分布から値を発生させた. また,観測値が「その都道府県自身の人口密度に依存する場合」と「その都道府県自身に 加えて周辺の都道府県から影響を受ける場合」を考えた.前者の場合,観測値はそれぞれの 都道府県の値のみを使用したが,周辺の都道府県から影響を受ける場合は,都道府県間の距 離の逆数と各都道府県の観測値を乗じた値を各都道府県の観測値に加算した.都道府県間 の距離は,国土地理院の都道府県庁間の距離を用いた.なお,以下の説明では,前者の方法 を「自身のみ」,後者の方法を「自身+周辺」と表現し,例えば,比例関係かつ「自身+周 辺」の方法で観測値を発生させた場合,「自身+周辺;比例関係」と表現する.空間相関の 計算には,上記の方法で発生させた観測値を基準化した値を用いた.それぞれの場合につい て,Moran’s Iを計算すると,表4.1のようになった.
比例関係,指数関係の場合は,「自身のみ」の場合より,「自身+周辺」の時の方がMoran’s I が高い傾向にあった.これは,人口密度の高い都道府県の影響が周囲に拡散することで,距 離が近いものほど事物の性質が似るという空間自己相関が強まることを示している.一方 で,「自身のみ;指数関係」と「自身のみ;ランダム」の場合,Moran’s Iの値は低かった. 図4.2に,「自身+周辺;指数関係」,「自身のみ;指数関係」および「自身のみ;ランダム」 のモラン散布図とコロプレス図を示した.コロプレス図は,サブ領域をその観測値に応じて 塗分けた地図である.ここでは,標準偏差の-3倍,-2倍,-1倍,0倍,1倍,2倍,3倍を区 切りとして8段階で塗分けており,薄いほど低い値であることを示している.「自身のみ; 指数関係」の場合,値が極端に大きくなっているサブ領域がある.そのため,Moran’s Iは 低くなり,Moran’s Iが0であるという帰無仮説を棄却できない結果になったと考えられ る.ただし,そのモラン散布図は,同じくMoran’s Iが低い,ランダムに変数を設定した 時とは異なっている.すなわち,Moran’s Iが低い場合でも2パターンが想定され,一部の サブ領域に集中して周辺と観測値が大きく異なる場合と,ランダムに観測値が観察される場 合がある.これらを判別するには,モラン散布図の分布を確認する必要がある. 一方,逆数に比例する場合は,「自身+周辺」の場合より,「自身のみ」の場合の方が Moran’s Iが高かった.逆数に比例する場合は主に地方部が高い値を取り,図4.3の中段右 のコロプレス図を見ると,「自身のみ」の場合,比較的高い値を示す都道府県が都市部から 離れるのに応じて拡がっているため,Moran’s Iが高い値をとっている.一方,「自身+周 辺」の場合では,周辺からの加算が集中する都道府県で値が大きくなり,結果として周囲か らの乖離が生じるため,Moran’s Iが低くなると考えられる(図4.3 下段).
4.1.4
37
産業分類の空間自己相関
4.1.1項で産業連関表から作成したデータおよび4.1.2項の空間重み行列を用いて,37産 業分類の特化係数,感応度係数,影響力係数について空間自己相関Moran’s Iを計算した 結果,表4.2のようになった.特化係数のMoran’s Iにおいて,37産業分類中,13産業分 類においてp値が0.01基準で有意になった.また,電気機械はp値が0.05基準で有意な結 果となった.これら14分類は,ともにMoran’s I が比較的高い結果となっているが,その モラン散布図の分布は,値が周辺のサブ領域とともに高い領域(ホットスポット)が存在し ている場合(繊維製品など)と全国に万遍なく分布しておりその空間的な推移がなだらかな 場合(医療・福祉など)で,異なっていた(図4.4の1段目及び2段目).図4.2: 指数関係とランダム値によるシミュレーション結果
上段左:自身+周辺;指数関係のモラン散布図, 上段右:自身+周辺;指数関係のコロプレス図 中段左:自身のみ;指数関係のモラン散布図, 中段右:自身のみ;指数関係のコロプレス図 下段左:自身のみ;ランダムのモラン散布図, 下段右:自身のみ;ランダムのコロプレス図
図4.3: 比例関係と逆数関係のシミュレーション結果
上段左:自身のみ;比例関係のモラン散布図, 上段右:自身+周辺;比例関係のモラン散布図 中段左:自身のみ;逆数関係のモラン図, 中段右:自身のみ;逆数関係のコロプレス図
表4.2: 各産業のMoran’s I 特化係数 感応度係数 影響力係数 農林水産業 0.58** 0.56** 0.45** 鉱業 0.07 0.20* 0.01 飲食料品 0.14 0.11 0.53** 繊維製品 0.28** 0.19* 0.25** パルプ・紙・木製品 0.13 0.08 0.18* 化学製品 -0.08 0.07 -0.07 石油・石炭製品 0.01 -0.03 -0.01 プラスチック・ゴム 0.30** 0.13 0.08 窯業・土石製品 0.19** 0.03 -0.01 鉄鋼 0.12 -0.04 -0.05 非鉄金属 -0.13 0.00 -0.06 金属製品 0.37** 0.00 -0.04 はん用機械 0.15 -0.02 0.07 生産用機械 0.14 0.05 0.01 業務用機械 0.27** -0.03 -0.02 電子部品 -0.06 -0.03 -0.08 電気機械 0.20* -0.04 0.27** 情報・通信機器 0.12 -0.07 -0.29 輸送機械 0.25** -0.02 0.06 その他の製造工業製品 0.33** -0.08 0.10 建設 0.29** -0.16 0.06 電力・ガス・熱供給 -0.07 0.04 0.06 水道 0.13 0.08 -0.16 廃棄物処理 0.44** -0.10 0.12 商業 -0.09 0.01 0.08 金融・保険 0.04 0.07 0.12 不動産 -0.01 0.42** 0.03 運輸・郵便 0.44** 0.15* 0.01 情報通信 0.08 -0.20 -0.09 公務 0.41** 0.00 -0.20 教育・研究 -0.05 0.08 -0.01 医療・福祉 0.42** -0.01 0.10 その他の非営利団体サービス 0.09 0.03 -0.27 対事業所サービス -0.01 -0.22 -0.19 対個人サービス 0.13 0.03 0.14 事務用品 -0.03 0.06 -0.17 分類不明 0.03 0.10 0.03
図4.4: 各産業における特化係数のモラン散布図およびコロプレス図
1段目:繊維製品における特化係数のモラン散布図(左)およびコロプレス図(右)
2段目:医療・福祉における特化係数のモラン散布図(左)およびコロプレス図(右)
3段目:情報通信における特化係数のモラン散布図(左)およびコロプレス図(右)
表4.3: 各産業の分類 特に高い特化係数を示す都道府県 あり なし Moran’s I 高い 繊維製品 窯業・土石製品 農林水産業, プラスチック・ゴム, 金属製品, 業務用機械, 電気機械, 輸送機械, その他の製造工業製品, 建設, 廃棄物処理, 運輸・郵便, 公務, 医療・福祉 低い 鉱業 パルプ・紙・木製品 情報・通信機器 金融・保険 情報通信 対事業所サービス 事務用品 飲食料品, 化学製品,石油・石炭製品, 鉄鋼, 非鉄金属, はん用機械, 生産用機械, 電子部品, 電力・ガス・熱供給, 水道, 商業, 不動産, 教育・研究, その他の非営利団体サービス, 対個人サービス, 分類不明 また,Moran’s Iが有意とならなかった23分類についても,同様に産業によって分布が 異なっており,特化係数が特に高い値を示す都道府県がある産業(情報通信など)と,そ うでない産業(飲食料品など)とに分けられる(図4.4の3段目及び 4段目).前者につ いては,特に高い値を示す都道府県が一か所のみ高い一方で,周辺への影響が少ないため Moran’s Iが低い値となっており,数値シミュレーションの「自身のみ;指数関係」と同様 のモラン散布図になっていた.また,後者については,全国的に不規則的に分布しているた め,Moran’s Iの値は低く,そのモラン散布図は,数値シミュレーションの「自身のみ;ラ ンダム」に似ている. 上記の「特に高い値」を客観的に把握するために観測値から指標を作成した.特に高い値 とは,平均値からの乖離度に着目するものであるから,平均が0となるように,観測値(こ こでは特化係数)を基準化した。そして,平均値からの乖離度を強調するため,基準化した 値を4乗した.ここで,2乗としなかったのは,2乗ではその合計値が全産業でそのサンプ ルサイズ(ここでは都道府県の数の47)になるためである.さらに,比較的大きい値であ るかを正負で判定するために全産業の合計した値で基準化した数値を指標とした.この結 果,Moran’s Iの検定においてp値0.05基準で有意であったかどうかと合わせて各産業を 表4.3のように4つに分類できる.