• 検索結果がありません。

深層学習による事業所数に応じた人口規模の考察

N/A
N/A
Protected

Academic year: 2021

シェア "深層学習による事業所数に応じた人口規模の考察"

Copied!
20
0
0

読み込み中.... (全文を見る)

全文

(1)

深層学習による事業所数に応じた人口規模の考察

著者 坂本 憲昭

出版者 法政大学経済学部学会

雑誌名 経済志林

巻 87

号 1・2

ページ 1‑19

発行年 2019‑09‑20

URL http://doi.org/10.15002/00022336

(2)

1

この論文は,関東一都六県の区および市単位における現状の事業所 数全体を算出基準として,夜間人口・昼間人口率の標準値をニューラ ルネットワークモデルを用いて予測する。構築した予測モデルは,評 価する地域の標準値に対する人口の過多・過少,および,事業所数が 20%または50%減少した場合の人口規模をあきらかにする。

1.はじめに

著者は,区および市単位において業種ごとの事業所数を可住地面積・夜 間人口・昼間人口を引数とする数理モデルで表現(算出)することを提案 し,評価したい地域の業種ごとの標準数に対する定量的過不足数をあきら かにした[1]−[5]。その数理モデルが算出するのは,たとえば,ある小地 域(区や市)におけるコンビニエンスストア数や薬局数の標準的な店舗数 である。また,この数理モデルは業種ごとの可住地面積・夜間人口・昼間 人口それぞれに対する重みを与える。たとえば郵便局は人口よりも面積と の相関が強く,また,事業所の業態が B to B または B to C に応じて,夜 間人口,昼間人口に対する依存度が異なることがわかる。

一方,人口減少に伴う事業所減少の懸念がある。後継者不足や人材不足 による撤退の報道が多いが,人口が減少すれば経営困難による撤退もあり

深層学習による事業所数に応じた 人口規模の考察

坂 本 憲 昭

(3)

得る。事業所が減少すれば,雇用が減り店舗がなくなり街の魅力が損なわ れ人口流出につながる。そこで国土交通省は知見として「サービス施設の 立地する確率が50%および80%となる自治体の人口規模」を発表している

[6]。これは“一定の人口規模の市町村のうち,当該産業の事業所が1つで も存在する市町村の割合(存在確率)が50%と80%を上回るような人口規 模で,最も小さいもの”である。

存在確率=A/B [%] (1)

     A:一定人口規模で当該産業の事業所が存在する市町村数      B:一定人口規模の全市町村数

式(1)の当該産業の事業所とは,分類として,小売,宿泊・飲食サービ ス,生活関連サービス,金融,学術研究・教育・学習支援,医療・福祉,

対企業サービスであり,各分類の事業所の具体的内容は,例えば,百貨店,

映画館,学習塾,一般診療所,法律事務所などである。人口規模の計算区 分は,1万人以下は1000人毎,1万~10万は5000人毎,10万人以上は5万 人毎となっている。

著者は冒頭の数理モデルを利用して,飲食店紹介Webサービス“ぐるな び”のデータにおける[6]の当該産業と一致するスターバックスとハンバ ーガー店に対して,[6]と同程度の人口規模が得られることを確認してい る[7]。

この算出の課題は,当該産業の事業所が存在していないゼロになってい る市町村数が算出基準であり,ゼロになる確率が50%または80%の場合の 人口である。これは事業所の撤退や人口減少対策を考える際に手遅れの状 況であり,また,事業所の分類ごとにその人口規模が異なるから,分類ご とに優先順位を付けることになる。すなわち,これまでの研究は業種単位 であり,小地域単位で事業所数を俯瞰的に検討するものではない。以上の ことから著者が考える必要な知見は次の2点である。既に存在している事

(4)

3 業所全体数に対して,

(1)標準値に対する人口の過多・過少(喫緊課題なのか判断材料となる)

(2)20%または50%減少した場合の人口規模。

そこで本稿は,関東一都六県の区および市単位において,現状の事業所数 全体を算出基準として,夜間人口・昼間人口率の標準値を予測する。

2.統計データ

研究対象は,著者の先行研究で整備した関東一都六県(東京都,神奈川 県,千葉県,埼玉県,茨城県,群馬県)の区と市単位の事業所数,可住地 面積,夜間人口,昼間人口率の統計データである[4]。区と市単位の可住 地面積,夜間人口,昼間人口率は2017年(平成27年)国勢調査結果(総務 省統計局)を用いる。事業所の内容をTable 1に示し,その事業所数は同 2017年にiタウンページ(NTTタウンページ株式会社)のWebサイトから 収集している。可住地面積は予測する値ではなく固定値にて説明変数に含 めている。一方,目的変数は,夜間人口と昼間人口率である。昼間人口で

Table 1 事業所内容(説明変数)一覧

No 内容 No 内容 No 内容

1 可住地面積 15 美容院 29 ホテル

2 歯科 16 在宅介護サービス 30 不動産取引

3 内科 17 デイサービス 31 税理士事務所

4 薬局 18 タクシー 32 清掃業

5 コンビニエンスストア 19 自動車整備・販売 33 保険

6 飲食店 20 ガソリンスタンド 34 運送

7 居酒屋 21 プロパンガス 35 造園業

8 すし 22 学習塾・進学塾 36 リフォーム

9 ラーメン店 23 保育園・幼稚園 37 電気工事

10 菓子店 24 組合・団体 38 印刷

11 酒店 25 市区町村機関 39 ソフトウェア業

12 電器店 26 郵便局・郵便業 40 電気機械器具製造・卸

13 生花店 27 葬祭業

14 クリーニング 28 新聞店

深層学習による事業所数に応じた人口規模の考察

(5)

はなく率を用いる理由は,夜間人口(常住人口)に対する昼間人口の増減 考察が目的であるから,絶対値ではなく「昼間人口/夜間人口[%]」を用 いる。

3.従来手法

2章に示した本研究が対象とする統計データは,説明変数40,目的変数 2,レコード数は学習地域214(4.1節参照),評価地域9(4.1節参照)で ある。このような説明変数および目的変数が多い統計データに対して従来 研究を概観すると,目的に応じて,(1)分析,(2)変数の縮約,(3)予測 モデルの構築などがおこなわれている[8]。本研究の目的は予測であり,

(1)分析手法のクラスター分析を用いて予測する研究がある[9]。クラス ター分析は「データ正規化」,「単鎖法,群平均法,単語法,最小分散法」

などの分析方法,距離計算方法の選択などさまざまな選択肢があり,選択 によって分析結果の樹状図が異なる。それは正解を把握していない以上,

選択の判断を困難にしている。(2)説明変数が多い場合,主成分分析や因 子分析などにより変数の縮約がおこなわれ,影響が小さい変数を省略して 予測を容易にする方法がある[10]。説明変数に優劣を付けるのではなく,

それぞれの影響を知りたい場合には,縮約は対象外である。(3)予測モデ ルの構築は,ビッグデータに対するデータマイニングとして,機械学習

[11]−[13]によるモデル構築が盛んにおこなわれている[14]。しかしな がら,人口統計に対する適用事例はまだ少ない(たとえば[15])。汎用的 なツールとして回帰モデルを用いる手法は,目的変数が複数の場合,目的 変数ごとに回帰式を求める必要があり,このほか複数に対応する手法とし て Support Vector Machine,Random Forest,Neural Network( 以 下,

NN)がある。事前検討として,2章の統計データの夜間人口だけを目的変 数として,統計計算に用いられることが多いフリーソフトウェアR [16]~

[19]が提供する3種類の回帰モデル(線形回帰,加法モデル,ロバスト回

(6)

5 帰),Support Vector Machine,Random Forest を適用したところ満足する 計算結果が得られなかった(付録参照)。そこで本研究は,[20][21]の NNの適用実績を利活用してNNによる予測モデルを採用する。

4.ニューラルネットワークモデルによる人口推定

4.1 ニューラルネットワークモデル

NNの構成をFigure 1 に示す。左から右方向にデータの計算を進める。記 号〇をユニットと称し,入力層のユニット数は説明変数の数と同じ40とな る。各中間層のユニット数 n を本稿では同一とし,そのユニット数 n と中 間層の列数mは調整パラメータである。入力層にあらかじめ各説明変数の 最大値と最小値から0~1に正規化した説明変数のデータを入力する。そ のデータに重みを乗算し中間層に入力する。Figure 1の線ごとに重みがあ り,その結合和をシグモイド関数(sigmoid function)で処理した結果が中 間層の出力データとなる。NNの最終計算結果は出力データであり,目的変 数の2値にあわせて出力層のユニット数は2となる。各出力データと教師 データ(目的変数)の差が誤差であり,誤差の総和が0になるように線ご との重みを学習(調整)する。実際は0ではなく,設定した収束値以下に なれば学習成功(モデル構築)とみなす。誤差の総和の指標はさまざまあ る が(RMSE:Root Mean Square Error,MAE:Mean Absolute Error,

MSE:Mean Squared Error),本稿はMSE平均二乗誤差を用いる。重みの 学習方法も数多く提案されているが,本稿は基本的な誤差逆伝播法

(Backpropagation)を適用する。MSEが収束値以下になるまで学習計算を 繰り返すことになり,繰り返し計算の回数を制限する。制限回数まで重み の修正を繰り返してもMSEが収束値以下にならなければ学習失敗である。

深層学習による事業所数に応じた人口規模の考察

(7)

以上をまとめてあらかじめ設定する値は,中間層のユニット数,中間層 の列数,収束値,繰り返し計算の回数上限値である。シミュレーションプ ログラム言語はC++を用いる(プログラムは[22][23]を参考とし,そ れらは中間層が1列限定であるため著者にて複数列に拡張)。

NNモデルを構築するために学習に用いる学習地域と,学習成功したNN モデルを使って,夜間人口と昼間人口率を求めて真値と比較する評価地域 を次のように選択する。

(A)関東一都六県の区と市の地域数は合計242である。

(B)東京23区は事業所数と人口が顕著に多いため除外する。

(C) 各説明変数と目的変数のデータを正規化するために最大値と最小値 を定める対象地域数は219(=242(A)−23(B))となる。基本的に NNが扱う入力データは0~1の範囲で正規化する必要がある。

(D) (C)の219地域における各説明変数と目的変数の最大値と最小値を 正規化に用いる。

(E) (C)の219地域のなかから乱数で5地域(茨城県日立市,茨城県牛 久市,栃木県矢板市,千葉県市原市,神奈川県三浦市)を選択し,

これを評価地域とする。残る214地域を学習地域とする。

n 2 説明 1 変数 1

入力データ 説明変数 入力層

モデル出力

出力データ 教師データ 目的変数

学習 誤 差

誤 差 出力層 中間層 1 中間層 2 中間層 m

説明変数 2

説明変数 44

2 1

2 1

2 1

2 1

n n

Figure 1 ニューラルネットワークモデルの構成

(8)

7

(F) (B)で除外した東京23区のうち,(D) で正規化した範囲にすべての 説明変数と目的変数が含まれる目黒区,中野区,北区,葛飾区の4 区を評価地域として追加する。

(G)以上をまとめると学習地域数214,評価地域数9である。

中間層のユニット数 n と列数mを検討する。学習回数を1000回として学 習計算を5回おこない,MSEの平均と標準偏差から精度が良い組み合わせ を求める。結果をFigure 2に示す(横軸は中間層のユニット数 n(列数m)

を表す)。この結果から平均と標準偏差の両方が小さい値を勘案してn=30 (m=1) を用いることにする。このほかの設定値として,収束値0.00001,

繰り返し計算回数上限値100000とする。この収束値は学習成功率が30%程 度となる値である。学習成功ごとに評価地域の夜間人口と昼間人口率の予 測をおこない,10回の結果を次節にて考察する。

4.2 夜間人口と昼間人口率の予測結果と考察

Figure 3(夜間人口)とFigure 4(昼間人口率)は10回の予測結果を示 す。図中の太い横棒━が真値である。縦棒ひとつが学習成功1回分をあら わす。Figure 4の横線は100%を示す。さらに,具体的な数値で示すために 10回の予測結果のうち最大値と最小値を除く8回の平均を求め,昼間人口

Figure 2 中間層のユニット数 n と列数mの検討 平均

0.0

20(1)20(2)20(3)30(1)30(2)30(3)40(1)40(2)40(3)60(1)60(2)60(3)60(4)80(1)80(2)80(3)

1.0 2.0 3.0

平均・標準偏差 [×0.001]

標準偏差 深層学習による事業所数に応じた人口規模の考察

(9)

率を絶対値(昼間人口)にする。その人口規模に応じて分割した真値との 比較をFigure 5とFigure 6に示す。Figure 3 ~ Figure 6に基づく考察を Table 2とTable 3にまとめる。

0

0

3 4 5 6 7 8 9 90 110 130 150 170 190 10 20

日立市

日立市

矢板市 3.3

4.1 3.2 3.2

4.5 3.5 3.8

5.2

8.5 8.7 7.2 7.5

夜間人口(真値)

三浦市 牛久市

牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区 牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区

万人万人

15 18

32

20 16

27

16 29

39

28292626 33

19 31

46

3538 3332

4646 38

46

20 25 30 35 40 45 50

万人比率[%]

30 40 50 60

夜間人口(予測) 昼間人口(真値) 昼間人口(予測)

日立市 目黒区 市原市 中野区 北区 葛飾区

夜間人口(真値) 夜間人口(予測) 昼間人口(真値) 昼間人口(予測)

0

0

3 4 5 6 7 8 9 90 110 130 150 170 190 10 20

日立市

日立市

矢板市 3.3

4.1 3.2 3.2

4.5 3.5 3.8

5.2

8.5 8.7 7.2 7.5

夜間人口(真値)

三浦市 牛久市

牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区 牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区

万人万人

15 18

32

20 16

27

16 29

39

28292626 33

19 31

46

35 38

3332 4646

38 46

20 25 30 35 40 45 50

万人比率[%]

30 40 50 60

夜間人口(予測) 昼間人口(真値) 昼間人口(予測)

日立市 目黒区 市原市 中野区 北区 葛飾区

夜間人口(真値) 夜間人口(予測) 昼間人口(真値) 昼間人口(予測)

0

0

3 4 5 6 7 8 9 90 110 130 150 170 190 10 20

日立市

日立市

矢板市 3.3

4.1 3.2 3.2

4.5 3.5 3.8

5.2

8.5 8.7 7.2 7.5

夜間人口(真値)

三浦市 牛久市

牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区 牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区

万人万人

15 18

32

20 16

27

16 29

39

28292626 33

19 31

46

3538 3332

4646 38

46

20 25 30 35 40 45 50

万人比率[%]

30 40 50 60

夜間人口(予測) 昼間人口(真値) 昼間人口(予測)

日立市 目黒区 市原市 中野区 北区 葛飾区

夜間人口(真値) 夜間人口(予測) 昼間人口(真値) 昼間人口(予測)

Figure 3 夜間人口の予測結果

Figure 4 昼間人口率の予測結果

Figure 5 人口規模10万人以下の予測結果(人口)

(10)

9 0

0

3 4 5 6 7 8 9 90 110 130 150 170 190 10 20

日立市

日立市

矢板市 3.3

4.1 3.2 3.2

4.5 3.5 3.8

5.2

8.5 8.7 7.2 7.5

夜間人口(真値)

三浦市 牛久市

牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区 牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区

万人万人

15 18

32

20 16

27

16 29

39

28292626 33

19 31

46

3538 3332

4646 38

46

20 25 30 35 40 45 50

万人比率[%]

30 40 50 60

夜間人口(予測) 昼間人口(真値) 昼間人口(予測)

日立市 目黒区 市原市 中野区 北区 葛飾区

夜間人口(真値) 夜間人口(予測) 昼間人口(真値) 昼間人口(予測)

Table 2 夜間人口予測結果

地域 考察

牛久市矢板市 三浦市

真値≒予測人口

Figure 3より予測人口と実際の人口が同等であり学習地域による標準的な事業所数 と同等な地域である。しかしながら,Figure 5より平均の詳細な数値によれば牛久市 は2千人程の誤差であるが,矢板市と三浦市の夜間人口は1万人程の大きな違いがあ る。

日立市

真値<すべての予測人口

Figure 3よりすべての予測人口よりも実際の人口が過少である。事業所の経営からみ れば顧客が少なく,この研究結果に限れば人口減少に伴う事業所数減少の懸念があ る。その過少人口はFigure 6 は真値の倍近い人口であることを示している。参考まで に総務省・経済産業省「平成24年経済センサス ‐ 活動調査」による日立市の事業所 数は7246,平成28年の調査結果では6873と減少傾向にあり,考察の通りである。

目黒区中野区

真値>すべての予測人口

Figure 3より予測人口よりも実際の人口が過多である。学習地域と比較して事業所が 少なく,この研究結果に限れば事業参入の機会がある。Figure 6はFigure 3の過多が 10万人程の規模であることを示している。

市原市北区 葛飾区

Figure 3より予測人口のばらつきが大きく真値に対する明らかな傾向がない。しかし ながら,Figure 6より平均では3千人以下の誤差に収まっている。

Table 3 昼間人口率予測結果

地域 考察

日立市

真値(100%以上)>すべての予測値(100%未満)

Figure 4より真値は夜間人口よりも昼間人口が多く,予測は逆転している。Table 2で 述べた考察と一致しており,昼間人口に対する事業所数は不足し,夜間人口に対する 事業所数は過多である(存在する事業所にとっては顧客となる人口が少ない)。つま り,この研究結果に限れば就業者または通学者を対象にした事業所を増やすべきとな る。夜間人口を増やすべき事も考えられるが,Table 4に示すとおり日立市は5年間 で8千人の人口減少であり,万単位以上の人口増加は困難と考える。

牛久市矢板市

真値≒予測

Figure 4とFigure 5より真値と予測が同等である。Table 2の考察とあわせても特に牛 久市は学習地域による標準値と同等な地域である。

深層学習による事業所数に応じた人口規模の考察

Figure 6 人口規模15万人以上の予測結果(人口)

(11)

Table 3の日立市の考察でも述べたが,現実の人口の増減数は評価地域の 場合Table 4に示すように5年間で数千人程度,多くても中野区の1万3千 人であり夜間人口の万単位の増加対策は難しい。企業や大学等誘致による 昼間人口を増やす,特定の事業所誘致に焦点をあてることが現実解と考え る。そこで,コンパクトシティにおける知見獲得も考慮し,4.3節では日常 生活に関連する事業所に絞って考察をおこなう。

NNによる予測人口のばらつきの解釈が提案手法の適用において留意す べき点になっている。矢板市と三浦市のばらつきは小さいが平均すれば誤 差は大きく,市原市と北区はその逆を示す。対策は,学習成功を増やして ばらつきを減らすことであろう。収束値をさらに小さくして予測精度をあ げることも考えられるが,計算機のメモリをさらに必要とすること,学習 成功の可能性が低いことから現実解ではない。具体的に,本研究のプログ ラムにおいて考察のための保存データを削減することやプログラムの工夫 などにより計算に使用するメモリをさらに大きく確保できるが,収束値を 1桁小さくするためには計算回数の上限値も大きくする必要があり,また,

学習成功に到達する可能性も低くなるため本設定値が限界に近い(本稿は メモリ32MBを使用して計算)。ちなみに4.3節では学習成功がさらに難しく なり,収束値が大きい値になっている。

三浦市中野区

真値(100%未満)<すべての予測値(100%以上)

Figure 4, 5, 6より昼間人口がもっと多いはずであるが実際は少ない。つまりこの研究 結果に限れば昼間人口に対する事業所数は過多である。これは日立市の逆であり,日 立市の4つの棒グラフが山型に対して谷型となっている。

目黒区

真値(100%以上)<すべての予測値(100%以上)

三浦市と中野区と同じ傾向であるが真値は夜間人口よりも昼間人口が多い。予測値は さらに多い値になっている。すなわち,三浦市と中野区と比較してすでに昼間流入す る人口が過多である。

市原市北区 葛飾区

Figure 4より予測値のばらつきが大きく真値に対する明らかな傾向がない。しかしな がら,Figure 6より平均では市原市と北区の誤差は小さく,葛飾区の誤差が10万人程 と大きい。

(12)

11

4.3 事業所の業種を限定した場合の人口予測と考察

日常生活において徒歩圏内に必要と考えるTable 5に示す13の事業所に 限定した考察をおこなう。再度NNモデルを構築するため,4.1節と同様に 中間層のユニット数 n と列数mを検討した結果をFigure 7に示す。平均と 標準偏差がともに小さいn=35(m=3)を用いる。収束値は0.0002,繰り返 し計算回数上限値30000とする。

Table 4 評価地域5年間の人口の増減数 区・市 夜間人口 平成22年~27年の人口増減数 矢板市 33,354 −1,989

三浦市 45,289 −3,063 牛久市 84,317 2,633 日立市 185,054 -8,075 目黒区 277,622 9,292 市原市 274,656 −5,760 中野区 328,215 13,465 北区 341,076 5,532

葛飾区 442,913 327

2017年(平成27年)国勢調査結果(総務省統計局)

Table 5 徒歩圏内に必要と考える13事業所(説明変数)一覧

No 内容 No 内容 No 内容

1 可住地面積 6 飲食店 11 タクシー

2 歯科 7 クリーニング 12 ガソリンスタンド

3 内科 8 美容院 13 市区町村機関

4 薬局 9 在宅介護サービス 14 郵便局・郵便業

5 コンビニエンスストア 10 デイサービス

平均

0.0 0.0

0.5 1.0

28(1) 28(2) 28(3) 35(1) 35(2) 35(3) 42(1) 42(2) 42(3)

1.0 2.0 3.0

平均[×0.001]

0

日立市 牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区

日立市 牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区 10

20 30 40 50 60

万人

70 90 110 130 150 170 190

比率[%] 標準偏差[×0.001]標準偏差

Figure 7 中間層のユニット数 n と列数mの検討 深層学習による事業所数に応じた人口規模の考察

(13)

12

4.2節Figure 3とFigure 4と同じ表現による予測結果をFigure 8とFigure 9に示す。Figure 8の夜間人口を見ると牛久市,矢板市と三浦市はFigure 3 と同じく学習地域による標準的な事業所数と同等な地域である(Table 2)。

日立市はTable 2で述べたとおり昼間人口が課題であり,本節は夜間人口に 関連が高い事業所数を対象にした予測モデルであるから,Figure 3の予測 人口よりもFigure 8のすべての予測人口が真値よりも小さくなっている。

このことは提案手法の有効性を示しているといえよう。目黒区と中野区は Figure 8ではFigure 3に比べて予測人口が多い。これは4.2節の事業所数全 体のなかで本節の事業所数が過少であることを示している。市原市および 北区と葛飾区はFigure 3と同等の傾向である。Figure 9の昼間人口率は,本 節の事業所が昼間人口と相関が低いのでFigure 4と比較してばらつきが小 さく,真値により近い結果を示している。相違は先行研究により歯科や飲 食店は昼間人口との相関も強いのでその影響と考える。

平均

0.0 0.0

0.5 1.0

28(1) 28(2) 28(3) 35(1) 35(2) 35(3) 42(1) 42(2) 42(3)

1.0 2.0 3.0

平均[×0.001]

0

日立市 牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区

日立市 牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区 10

20 30 40 50 60

万人

70 90 110 130 150 170 190

比率[%] 標準偏差[×0.001]標準偏差

平均

0.0 0.0

0.5

28(1) 28(2) 28(3) 35(1) 35(2) 35(3) 42(1) 42(2) 42(3)

1.0 2.0 3.0

平均[×0.001]

0

日立市 牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区

日立市 牛久市 矢板市 市原市 三浦市 目黒区 中野区 北区 葛飾区 10

20 30 40 50 60

万人

70 90 110 130 150 170 190

比率[%]

標準偏差

Figure 8 夜間人口の予測結果

Figure 9 昼間人口の予測結果

(14)

13

4.4 事業所数を減少させた場合の人口予測と考察

4.2節の茨城県牛久市,栃木県矢板市,神奈川県三浦市の真値と予測値の 誤差が小さいことを理由に,この3市で事業所数を減少させた場合の予測 人口を考察する。4.2節で学習成功した10ケースの予測モデルを使用し,入 力データである事業所数を一律80%と50%に削減して予測人口を求めて真 値と比較した結果をFigure 10(80%), Figure 11(50%)に示す。矢板市は 事業所数が減少したにもかかわらず予測人口が真値よりも多いのは,

Figure 3では真値と予測人口がほぼ同等であるが,Figure 5 に示したとお り詳細は予測人口が多いためであり,予測人口が減少しても真値の人口よ り多い。そこで真値を除外し,予測人口だけの相対値で考察をするために 減少人数だけを求めた結果をFigure 12(80%), Figure 13(50%)に示す。

さらに,Figure 14はFigure 5とFigure 6と同じく10回の予測結果のうち最 大値と最小値を除く8回の平均を求めて真値とあわせて描写したものであ る。次に,モデルによる予測人口減少率を真値にあてはめた結果がFigure 15, Figure 16である。

牛久市は,矢板市と三浦市と比較して人口が倍近く,事業所数の減少率 と人口の減少率が近い傾向を描くが,矢板市と三浦市は事業所数の減少率 と比較して人口の減少率が小さい。少ない人口の地域の方が,人口減少が 事業所数に大きく影響することを示している(真値は矢板市より三浦市の 方が多いが,予測人口は三浦市の方が少ない)。Figure 16より牛久市は万 単位の人口減少であるが,矢板市と三浦市は千人単位である。Table 4より 矢板市と三浦市は実際に可能性がある人口減少数である。この結果は自明 なことであるが,コンパクトシティのなどの小地域では事業所数が人口の 増減に敏感に影響することを定量的に示している。

深層学習による事業所数に応じた人口規模の考察

(15)

3

茨城県牛久市 栃木県矢板市 神奈川県三浦市

4 5 6 7 8 9

万人

0.0 0.5 1.0 1.5 2.0

茨城県牛久市 栃木県矢板市 神奈川県三浦市

万人

3

茨城県牛久市 栃木県矢板市 神奈川県三浦市

4 5 6 7 8 9

万人

3

茨城県牛久市 栃木県矢板市 神奈川県三浦市

4 5 6 7 8 9

万人

0.0 0.5 1.0 1.5 2.0

茨城県牛久市 栃木県矢板市 神奈川県三浦市

万人

3

茨城県牛久市 栃木県矢板市 神奈川県三浦市

4 5 6 7 8 9

万人

3

茨城県牛久市 栃木県矢板市 神奈川県三浦市

4 5 6 7 8 9

万人

0.0 0.5 1.0 1.5 2.0

茨城県牛久市 栃木県矢板市 神奈川県三浦市

万人

3

茨城県牛久市 栃木県矢板市 神奈川県三浦市

4 5 6 7 8 9

万人

0 1 2 3 4 5

茨城県牛久市 栃木県矢板市 神奈川県三浦市

万人

3

50%

60%

70%

80%

90%

100%

100% 80%

仮定した事業所数減少[%]

50%

5 7

9 8.5 8.9 7.1

5.0

3.5 4.1 3.8 3.4

4.5

3.5 3.3 3.1

茨城県牛久市 栃木県矢板市

真値

神奈川県三浦市

三浦市 矢板市

牛久市 事業所数

万人 人口減少率[%]

100% 80% 50%

2 4 6

8 8.5

6.9 4.8

3.5 3.2 2.8 4.5 4.3 4.1

茨城県牛久市 栃木県矢板市

真値

神奈川県三浦市

万人

80% 50%

Figure 10 事業所80%時の夜間人口予測(真値との比較)

Figure 11 事業所50%時の夜間人口予測(真値との比較)

Figure 12 事業所80%時の減少する夜間人口の人数予測(相対評価)

Figure 13 事業所50%時の減少する夜間人口の人数予測(相対評価)

(16)

15 0

1 2 3 4 5

茨城県牛久市 栃木県矢板市 神奈川県三浦市

万人

3

50%

60%

70%

80%

90%

100%

100% 80%

仮定した事業所数減少[%]

50%

5 7

9 8.5 8.9 7.1

5.0

3.5 4.1 3.8 3.4

4.5

3.5 3.3 3.1

茨城県牛久市 栃木県矢板市

真値

神奈川県三浦市

三浦市 矢板市

牛久市 事業所数

万人 人口減少率[%]

100% 80% 50%

2 4 6

8 8.5

6.9 4.8

3.5 3.2 2.8 4.5 4.3 4.1

茨城県牛久市 栃木県矢板市

真値

神奈川県三浦市

万人

80% 50%

0 1 2 3 4 5

茨城県牛久市 栃木県矢板市 神奈川県三浦市

万人

3

50%

60%

70%

80%

90%

100%

100% 80%

仮定した事業所数減少[%]

50%

5 7

9 8.5 8.9 7.1

5.0

3.5 4.1 3.8 3.4

4.5

3.5 3.3 3.1

茨城県牛久市 栃木県矢板市

真値

神奈川県三浦市

三浦市 矢板市

牛久市 事業所数

万人 人口減少率[%]

100% 80% 50%

2 4 6

8 8.5

6.9 4.8

3.5 3.2 2.8 4.5 4.3 4.1

茨城県牛久市 栃木県矢板市

真値

神奈川県三浦市

万人

80% 50%

0 1 2 3 4 5

茨城県牛久市 栃木県矢板市 神奈川県三浦市

万人

3

50%

60%

70%

80%

90%

100%

100% 80%

仮定した事業所数減少[%]

50%

5 7

9 8.5 8.9 7.1

5.0

3.5 4.1 3.8 3.4

4.5

3.5 3.3 3.1

茨城県牛久市 栃木県矢板市

真値

神奈川県三浦市

三浦市 矢板市

牛久市 事業所数

万人 人口減少率[%]

100% 80% 50%

2 4 6

8 8.5

6.9 4.8

3.5 3.2 2.8 4.5 4.3 4.1

茨城県牛久市 栃木県矢板市

真値

神奈川県三浦市

万人

80% 50%

深層学習による事業所数に応じた人口規模の考察

Figure 14 真値と事業所数減少に対する予測人口の平均

Figure 15 事業所数減少に対する予測人口減少率

Figure 16  真値に対して予測人口と同じ割合(Figure 15)で減少すると仮定し た場合の人口

(17)

5.おわりに

回帰分析や,Support Vector Machine,Random Forestの機械学習では解 析が困難である40の説明変数(可住地面積と各事業所数)と2つの目的変 数(夜間人口と昼間人口率)の統計データに対して,Neural Networkによ る予測モデルを提案した。

提案手法により,214地域を学習地域として事業所数に対する標準的な 夜間人口と昼間人口率を算出する予測モデルを構築し,9つの地域を評価 して得られた主な知見を示す。矢板市と三浦市および牛久市は学習地域と 同様に標準的である。日立市は昼間人口に対する事業所数が不足し,夜間 人口に対する事業所数は過多である。目黒区と中野区は日立市と逆の傾向 を示し,昼間人口に対する事業所数は過多である。これらの結果はおもに 夜間人口と関連が強い事業所に絞って評価した結果からも裏付けられた。

また,事業所数が80%と50%に減少した仮定からは,少ない人口の地域の 方が,人口減少が事業所数に大きく影響することを定量的に示した。

提案手法の課題は,学習モデルであるため予測値のばらつきである。ば らつきを克服するためには学習成功のモデル数を増やすことで予測精度を あげることが考えられ,また,取り上げる事業所を精査して夜間人口と昼 間人口の相互影響をなるべく避けることである。今後はこれらの考え方に より学習結果のばらつきが低減することを確認したい。

文  献

[1]坂本:東京都江東区タワーマンション地域における事業所数の評価モデ ル,日本オペレーションズ・リサーチ学会, 2016年秋季研究発表会, 1-H-7, pp.140-141 (2016)

[2]N.Sakamoto:A Method to Evaluate an Urban Area by Using the Model That Calculates a Number of Facilities from an Area and a Population, Current Urban Studies, Vol.04, No.4 (2016)

[3]坂本:江東区タワーマンション地域のコンパクトシティに関する考察,日

(18)

17 深層学習による事業所数に応じた人口規模の考察

本オペレーションズ・リサーチ学会, 2017年春季研究発表会, 2-F-2, pp.183-184 (2017)

[4]坂本:事業所充実度の評価に関する検討(タウンページと経済センサス),

日本オペレーションズ・リサーチ学会,2017年秋季研究発表会,1-D-6,

pp.70-71 (2017)

[5]坂本:事業所数評価モデル(政府統計使用による新潟県コンパクトシティ の評価),経済志林(法政大学経済学部学会), Vol.85, No.2, pp.147-165 (2018)

[6]国土交通省:「国土のグランドデザイン2050~対流促進型国土の形成~」,

ホームページ>政策・仕事>国土政策>国土計画>「国土のグランドデザイ ン2050~対流促進型国土の形成~」「国土のグランドデザイン2050」参考 資料[1],P35,http://www.mlit.go.jp/common/001050896.pdf

[7]坂本:ぐるなびデータを用いた店舗数に関する考察,オケージョナル・ペ ーパー,法政大学日本統計研究所,No.92 (2018)

[8]山口,高橋,竹内:多変量解析の基本と仕組み,秀和システム (2004)

[9]McCarthy J.S., Jacob T and Atkinson D:Innovative uses of data mining techniques in the production of official statistics. In: UN statistical commission session on innovations in official statistics, New York (2009)

[10]Salvador García, Julián Luengo and Francisco Herrera:Data Reduction, Data Preprocessing in Data Mining, Springer, Chapter 6, pp.147-162 (2014)

[11](社)人工知能学会(監):深層学習,近代科学社 (2015)

[12]小高:機械学習と深層学習,オーム社 (2016)

[13]小高:強化学習と深層学習,オーム社 (2017)

[14]Bruce Ratner:Statistical and Machine-Learning Data Mining: Techniques for Better Predictive Modeling and Analysis of Big Data, 3rd Edition, CRC Press (2017)

[15]澤田:サポートベクトル回帰を用いた地域人口の推定−国土データ基盤か ら算出した地域特徴量の考察−,愛知大学情報メディアセンター紀要,

Vol.26, No.1 (2016)

[16]金:Rによるデータサイエンス,森北出版 (2007)

[17]The Comprehensive R Archive Network:https://cran.r-project.org/.

(accessed 30 March 2019)

[18]An Introduction to R: https://cran.r-project.org/doc/manuals/r-release/

R-intro.html#Some-non_002dstandard-models, 11.2 Linear models, 11.8 Some non-standard models. (accessed 30 March 2019)

(19)

[19]The R Project for Statistical Computing: https://www.r-project.org/, (accessed 30 March 2019)

[20]坂本,森:ニューラルネットワークモデルによる特異地域の抽出,平成31 年電気学会全国大会,G401-B1 (2019)

[21]坂本:階層型ニューラルネットワークモデルによる特異地域の抽出,オケ ージョナル・ペーパー,法政大学日本統計研究所,No.95 (2019)

[22]平野:Cでつくるニューラルネットワーク,パーソナルメディア (1991)

[23]白井,岩田,久間,浅川:基礎と実践ニューラルネットワーク,コロナ社 (1995)

付 録

・線形回帰モデル(lm)結果:Residual standard error 7.121  Multiple R-squared 0.7445,Adjusted R-squared 0.6854

・加法モデル(gam)結果:計算エラーにて結果を得られず

・ロバスト回帰モデル(rlm)結果:Residual standard error 5.341

・Support Vector Machine結果:Training error 0.327828

・Random Forest結果:Mean of squared residuals 226.1063

(20)

19 深層学習による事業所数に応じた人口規模の考察

Population size according to numbers of facilities using Deep Learning

Noriaki SAKAMOTO

《Abstract》

This paper estimates the standard values of nighttime and daytime populations for wards and cities in Tokyo, Kanagawa, Chiba, Saitama, Tochigi, Gunma and Ibaraki, using current numbers of facilities as a standard of calculation. To do this, we use the Neural Network model, which clarifies whether the population in the area being evaluated is larger or smaller than a standard value, and predicts populations on an assumption drawn from 20% and 50% reductions in the number of facilities in the area.

Figure 6 人口規模15万人以上の予測結果(人口)

参照

関連したドキュメント

Secondly, the reformulation of the solution of (2.1) in Theorem 3.1 has certain advantages; if an almost sure estimate on the rate of decay of U can be obtained, the problem reduces

The main purpose of this paper is to extend the characterizations of the second eigenvalue to the case treated in [29] by an abstract approach, based on techniques of metric

Oscillatory Integrals, Weighted and Mixed Norm Inequalities, Global Smoothing and Decay, Time-dependent Schr¨ odinger Equation, Bessel functions, Weighted inter- polation

In this note, we consider a second order multivalued iterative equation, and the result on decreasing solutions is given.. Equation (1) has been studied extensively on the

This paper develops a recursion formula for the conditional moments of the area under the absolute value of Brownian bridge given the local time at 0.. The method of power series

the existence of a weak solution for the problem for a viscoelastic material with regularized contact stress and constant friction coefficient has been established, using the

“Breuil-M´ezard conjecture and modularity lifting for potentially semistable deformations after

In order to solve this problem we in- troduce generalized uniformly continuous solution operators and use them to obtain the unique solution on a certain Colombeau space1. In