中央大学理工学部情報工学科 卒業研究論文
新築分譲マンションの供給の地域特徴と 売れ行き判別モデルの構築
学籍番号
03D8104021K佐藤 春樹
指導教員 田口 東 教授
2007年
3月
あらまし
現在,首都圏において,マンションに住むことは代表的な居住形態である.また,近年 の都心地域の人口増加の要因として,新築マンションの供給の増加が考えられる.
本研究では,まず,発売されるマンションの地域特徴を,マンションの価格,面積,㎡
単価,間取りに注目して分析する.次に,対象地域内で発売されたマンションのデータを 基に,将来,対象地域に流入する人口を推計し,実際の転入者数からマンション入居率を 推計し,考察する.また,決定木分析を用いてマンションの売れ行きを判別するモデルを 構築する.そして,構築されたモデルから各地域の売れ行きを左右する要因を探る.
キーワード:マンション,地域特徴,流入人口,決定木分析
目次
第
1章 はじめに...1
第
2章 使用データ
...22.1 全国マンション市場動向...2
2.2 対象地域の特徴...4
2.3 発売地域によるマンションの特徴...7
2.3.1 区ごとの発売件数...7
2.2.2 発売地域によるマンションの特徴...8
第
3章 発売マンションへの流入人口の推計... 16
3.1 流入人口の推計... 16
3.1.1 流入人口推計モデル... 16
3.1.2 実際の人口の変化との比較... 16
3.2 推計流入人口の居住分布... 18
第
4章 売れ行き判別モデルの構築
... 214.1 決定木... 21
4.1.1 決定木の構築アルゴリズム... 21
4.1.2 情報利得比... 22
4.2 売れ行きの定義... 23
4.3 決定木による判別分析... 23
4.4 分析結果... 24
4.4.1 江東区の分析結果... 24
4.4.2 港区の分析結果... 25
4.4.3 世田谷区の分析結果... 25
4.4.4 中央区の分析結果... 26
4.4.5 区ごとに構築された決定木の特徴... 27
第
5章 おわりに... 29
5.1 まとめ... 29
5.2 今後の課題... 29
謝辞
... 30参考文献
... 31第 1 章 はじめに
東京都区部の人口は,1997 年を期に転入超過に転じ,9 年連続で続いている[7].この ことから,人口の都心回帰と呼ばれる現象が見てとれる.都心回帰現象の一つの要因とし て,近年のマンションの大量供給が考えられる.文献[1,2,3]によると,東京都区部の マンションの年間供給戸数は
1993年の
8,402戸から
1994年に
20,000戸台に増加し,そ の後,1998 年まで
20,000戸台で推移し,1999 年から
2005年に至るまで,30,000 戸台で 推移している(図
1.1).そこで,実際にマンションの供給がどれくらい人口の増加に関係しているかを推計することは,東京都の人口の移動を考えるにあたって必要といえる.
ところで,マンションが発売される地域は住宅地や都心の商業地など様々である.その ため,発売される地域によって,発売されるマンションの特徴は異なると考えられる.ま た,地域によってマンションの売れ行きの好不調を左右する要因も異なると考えられる.
そこで,本研究では,地域ごとに,発売されているマンションの特徴を分析する.また,
対象地域内で発売されたマンションのデータを基に,将来,対象地域のマンションに流入 する人口を推計し,実際の対象地域内への転入者数との関係を考察する.そして,決定木 を使用して,マンションの売れ行きの好調と不調を判別するモデルを構築し,各地域の売 れ行きを左右する要因を探る.
0 5,000 10,000 15,000 20,000 25,000 30,000 35,000 40,000 45,000
1993年 1994年 1995年 1996年 1997年 1998年 1999年 2000年 2001年 2002年 2003年 2004年 2005年
マ ン シ ョ ンの 供給 戸数 [ 戸 ]
-80,000 -60,000 -40,000 -20,000 0 20,000 40,000 60,000 80,000
人口 の社 会増 減数 [ 人 ]
マンション供給戸数[戸] 人口の社会増減数[人]
図
1.1 マンションの供給戸数と人口の社会増減(1993 年から
2005年)
第 2 章 使用データ
2.1 全国マンション市場動向
全国マンション市場動向は,各年度の全国における新築分譲マンション(原則として
3階建て以上の民間の中高層共同分譲住宅)の発売データを基に,全国のマンション発売動 向だけでなく,都道府県別の動向を分析したデータである.本研究では全国マンション市 場動向
2003年度版,2004 年度版,2005 年度版[1,2,3]に収録されている東京都
23区の発売物件リスト(以下,発売リスト)を使用する.ところで,東京都
23区で
2003年 から
2005年までの間で,発売されたマンションの数は
1年当たり,平均
750棟,35,594 戸である.発売リストでは
1つのマンションであっても多期に分かれて発売される場合,
発売
1期ごとに
1件の物件として扱っている.発売リストに記載されている項目から,以 下のデータを利用する.
・ 物件所在地 ・ 最寄り駅名
・ 路線名 ・ 最寄り駅からの距離
・ 発売戸数 ・ 全戸数
・ 平均価格 ・ 平均面積
・ 最高分譲価格 ・ 最低分譲価格
・ 最小専有面積 ・ 最大専有面積
・ ㎡単価 ・ 主要間取り
・ 発売日 ・ 初月契約率
・ 最新契約率
抽出したデータの一例を表
2.1に示す.
表
2.1 マンションの発売データの一例物件所在地 東京都中央区
明石町 529-6
路線名 日比谷線
駅名 築地
最寄り駅からの距離[分] 6
発売戸数 83
全戸数 150
平均価格[万円] 4409
最低分譲価格[万円] 1660
最高分譲価格[万円] 8550
平均面積[㎡] 66.92
最小専有面積[㎡] 23.8
最大専有面積[㎡] 111.9
㎡単価[万円] 65.9
主要間取り 3LDK
発売日 20030421
竣工日 200403
初月契約率 100%
最新契約率 100%
「最寄り駅からの距離」とは最寄り駅からのマンションまでの徒歩での時間距離[分]
である.ただし,バスを使用する場合は,最寄り駅からバスでかかる時間とバス停からマ ンションまで徒歩でかかる時間の合計である.
「主要間取り」の一例は以下のとおりである.
・
1R:ワンルーム
・
1K:1 部屋とキッチン
・
1DK:1 部屋とダイニングキッチン
・
1LDK:1 部屋とリビング・ダイニングキッチン
・
2K:2 部屋とキッチン
・
2DK:2 部屋とダイニングキッチン
・
2LDK:2 部屋とリビング・ダイニングキッチン
・
3LDK:3 部屋とリビング・ダイニングキッチン
・
4LDK:4 部屋とリビング・ダイニングキッチン
ここで,「K」と「DK」と「LDK」の違いについて説明する.これらの間の線引きは具 体的には決まってはいない.一般的に,「K」はキッチンがある部屋を指し,それが,食事 が出来る程度の広さになると「DK」となり,さらに,家族が集まってくつろげるような広 さになると「LDK」と表される.
なお,全国マンション市場動向は紙媒体のデータのため,手作業でデジタル化を行う必 要がある.しかし,全ての発売を入力するには,膨大な時間がかかってしまう.そこで,
本研究では
2003年から
2005年までの間で,マンションの発売戸数が東京都
23区で上位
4区である江東区,港区,世田谷区,中央区を対象とする.
2.2 対象地域の特徴
対象地域で発売されたマンションは
3年間で
1,112件である.平均価格の分布を図
2.1に 示す. 4000 万円台の発売が最も多く,全体の約
30%を占めている.また,3000万円台か ら
5000万円台の発売が約
70%でこの3つの価格帯の占める割合が大きい.一方でわずかで あるが
1億円台から
3億円台の発売があることがわかる.
次に,平均面積の分布を図
2.2に示す.
70㎡台の発売が最も多く,全体の約
35%を占めている.また,
60㎡台から
80㎡台の発売が約
70%で3つの面積帯の占める割合が大きい.
一方でわずかであるが
100㎡から
250㎡のマンションが発売されていることがわかる.
次に,㎡単価の分布を図
2.3に示す.60 万円台の発売が最も多く全体の約
30%を占めている.また,50 万円台から
80万円台の発売が約
75%で.この4つの価格帯の占める割合 が大きい.一方でわずかであるが
100万円台から
200万円台のマンションが発売されてい ることがわかる.
次に,主要間取り別発売件数を図
2.4に示す.2LDK と
3LDKの発売が約
75%である.特に
3LDKの発売が多く,全体の約
50%を占める.40000
35000
30000
25000
20000
15000
10000
5000
0
平均価格 [万円]
400
300
200
100
0
発売件数﹇ 件 ﹈
図
2.1平均価格の分布
250
200
150
10050
0
平均面積 [㎡]
400
300
200
100
0
発売件数﹇ 件 ﹈
図
2.2平均面積の分布
200
150
10050
㎡単価 [万円]
300
200
100
0
発売件数﹇ 件 ﹈
図
2.3㎡単価の分布
4LDK
3LDK
2LDK2DK
1LDK1DK
1K
1R
主要間取り
600
500
400
300
200
100
0
発売件数﹇ 件 ﹈
図
2.4主要間取り別発売件数
また,発売リストには,各マンションの住所が町丁目単位で記載されている.そこで,
マンションの地域分布を見るために,東京大学空間情報科学センターが提供する
CSVアド
レスマッチングサービス[6]を利用して,町丁目単位の住所をポイントに変換して地図上 に表示する.マンションの全戸数と駅からの時間によるマンションの発売分布を図
2.5に示 す.棒の高さは全戸数,すなわちマンションの規模を表している.また,棒の色はマンシ ョンまでの最寄り駅からの距離[分]を表しており,赤色のなるほど駅に遠く,青色にな るほど駅に近いことを表している.なお,紫の線は行政区の境,灰色の線は鉄道を表して いる.図
2.5より,江東区,港区,中央区の臨海地域に大規模なマンションが発売されてい ることがわかる.一方,世田谷区で発売されるマンションは比較的小規模である.また,
世田谷区では他の区に比べ,駅に遠いマンションの発売が多い.
図
2.5 マンションの規模と駅からの時間2.3 発売地域によるマンションの特徴
本節では,発売されたマンションを区ごとに集計して,平均価格,平均面積,㎡単価,
主要間取りから区の特徴を述べる.
2.3.1
区ごとの発売件数
図
2.6に
3年間における年ごとの各区における発売件数を示す.対象地域で,2003 年に 最も発売件数が多い区は,
150件発売された世田谷区である.一方,最も発売件数が少ない 区は,57 件発売された中央区である.また,2004 年に最も発売件数が多い区は,125 件発
世田谷区
港区
中央区 新宿駅
東京駅
江東区
品川駅
[分]
売された江東区である.一方,最も発売件数が少ない区は,
94件発売された中央区である.
また,2005 年に最も発売件数が多い区は,101 件発売された世田谷区である.一方,最も 発売件数が少ない区は,41 件発売された江東区である.
0 50 100 150 200 250 300 350 400
江東区 港区 世田谷区 中央区
発売件数[件]
2005年 2004年 2003年
図
2.6 3年間での発売件数
2.2.2
発売地域によるマンションの特徴
図
2.7から図
2.10は各区の
2003年から
2005年のマンションの発売件数を平均価格,平 均面積,㎡単価,主要間取りでそれぞれ分類し,構成比率で表したものである.
図
2.7から,江東区では,平均価格が
3000万円台の発売が最も多く約
45%を占め,それに
4000万円台の発売が約
40%で続く.この2つが全体の約
85%を占め,江東区での発売の大半を占める.他の区に比べ,比較的,平均価格の安いマンションで構成されていると いえる.
港区では,平均価格が
4000万円台の発売が最も多く約
25%を占め,それに5000万円台 の発売が約
20%で続く.また,6000万円以上の発売が約
45%を占める.特に1億円以上の マンションを「高級マンション」とすると,そういったマンションの発売が多く,全体の
約
15%を占める.他の区に比べ,比較的高いマンションで構成されているといえる.世田谷区では,平均価格が
4000万円台の発売が最も多く約
30%を占め,それに5000万 円台の発売が約
25%,6000万円台の発売が
25%で続く.この3つが全体の約
80%で,世田谷区での発売の大半を占める.江東区や中央区に比べ,比較的高いマンションで構成さ れているといえる.
中央区では,平均価格が
3000万円台の発売が最も多く約
50%を占め,それに4000万円
台の発売が約
25%,3000万円台の発売が約
15%で続く.この3つが全体の約
90%で,中央区での発売の大半を占める.また,中央区の平均価格の発売構成は,比較的安いマンシ ョンの構成比率が大きく,江東区と平均価格の平均価格の発売構成比率は似ているといえ る.
0%
20%
40%
60%
80%
100%
江東区 港区 世田谷区 中央区
発売構成比率
1億円以上 9000万円台 8000万円台 7000万円台 6000万円台 5000万円台 4000万円台 3000万円台 3000万円未満
図
2.7 平均価格別構成比率図
2.8から,江東区では,平均面積が
70㎡台の発売が最も多く約
55%を占め,60㎡台 の発売が約
20%,80㎡台の発売が約
15%で続く.この3つが全体の
90%を占め,江東区での発売の大半を占める.他の区に比べ,比較的広いマンションで構成されているといえ る.
港区では,平均面積が
70㎡台の発売が最も多く約
25%を占め,60㎡台の発売が約
15%,80
㎡台の発売が約
15%で続く.この3つが全体の約
55%を占める.また,60㎡未満の発
売が約
30%,一方,90㎡以上の発売が約
15%を占める.世田谷区では,平均面積が
70㎡台の発売が最も多く約
40%を占め,80㎡台の発売が約
20%,60
㎡台の発売が約
15%で続く.この3つが全体の約
75%で,世田谷区での発売の大半を占める.また,世田谷区と江東区の平均価格の発売構成比率は似ているといえる.
中央区では,平均面積が
50㎡台の発売が最も多く約
30%を占め,それに,60㎡台の発
売が約
25%,40㎡台の発売が約
15%で続く.この3つが全体の約
70%で,中央区での発売の大半を占めている.
0%
20%
40%
60%
80%
100%
江東区 港区 世田谷区 中央区
発売構成比率
100㎡以上 90㎡台 80㎡台 70㎡台 60㎡台 50㎡台 40㎡台 40㎡未満
図
2.8 平均面積別構成比率図
2.9から,江東区では,㎡単価が
50万円台の発売が最も多く約
45%を占め,それに 50万円未満の発売が約
25%,60万円台の発売が約
25%で続く.この3つで全体の約
95%を占める.他の区に比べ,比較的㎡単価が安いマンションで構成されているといえる.
港区では,㎡単価が
100万円以上の発売が最も多く約
35%を占め,70万円台から上の発 売が全体の約
80%で,港区での発売の大半を占める.他の区に比べ,比較的㎡単価が高いマンションで構成されているといえる.
世田谷区では,㎡単価が
70万円台の発売が最も多く約
30%を占め,それに80万円台の
発売が約
30%,60万円台の発売が約
25%で続く.この3つが全体の約
85%で,世田谷区での発売の大半を占める.港区ほどではないが,江東区や中央区に比べ,比較的㎡単価が 高いマンションで構成されているといえる.
中央区では,㎡単価が
60万円台の発売が最も多く約
50%を占め,それに70万円台の発
売が約
25%,50万円台の発売が約
10%で続く.この3つが全体の約
85%で,中央区での発売の大半を占める.港区や世田谷区ほどではないが,江東区に比べ,比較的㎡単価が高
いマンションで構成されているといえる.
0%
20%
40%
60%
80%
100%
江東区 港区 世田谷区 中央区
発売構成比率
100万円以上 90万円台 80万円台 70万円台 60万円台 50万円台 50万円未満
図
2.9㎡単価別構成比率
図
2.10から,江東区では,主要間取りが
3LDKの発売が最も多く約
70%を占め,発売の大半を占める.それに続く
2LDKの発売の構成比率は約
20%である.港区では,主要間取りが
2LDKの発売が最も多く全体の約
40%を占め,それに3LDKの発売が約
25%,1LDKの発売が約
25%で続く.この3つが港区での発売の大半を占める.世田谷区では,江東区 と同様に,主要間取りが
3LDKの発売が最も多く全体の約
70%を占め,世田谷区での発売の主な部分を成している.それに続く
2LDKの構成比率は約
15%である.また,江東区の主要間取りの発売構成比率と似ている.中央区では,主要間取りが
2LDKの発売が最も多 く全体の約
40%を占め,それに1LDKの発売が約
20%,3LDKの発売が約
15%で続く.この
3つが中央区での発売の大半を占める.
0%
20%
40%
60%
80%
100%
江東区 港区 世田谷区 中央区
発売構成比率
4LDK 3LDK 2LDK 2DK 1LDK 1DK 1K 1R
図
2.10主要間取り別構成比率
図
2.11は,横軸に平均面積,縦軸に㎡単価をとった区ごとの発売マンションの散布図で ある.
江東区では,他の区に比べ,㎡単価が安く,平均面積が広めである.江東区のマンショ ンの発売が,比較的安めの平均価格で構成されているのは,㎡単価が比較的安いため,平 均面積が広くなっても,平均価格が抑えられていることが一因として考えられる.このこ とより,江東区は比較的安くて広いマンションの発売が多い地域と考えられる.
港区では,他の区に比べ,異なる傾向を示している.他の
3つの区は㎡単価が高くなる ほど,平均面積は,狭くなる.しかし,港区では,㎡単価が高くなるにつれ,平均面積が 広くなる傾向がある.そのため,
1億円を超えるような高級マンションの発売が目立つ.そ の一因として,港区には白金台,麻布,青山などの高級住宅地といわれる地域があり,そ ういった地域では,価格よりも,面積が重視されたマンションが発売されていると考えら れる.また,㎡単価が高いため,他の区で発売されたマンションと同じ価格の場合,比較 的狭いマンションが多いと考えられる.
世田谷区では,平均面積の発売構成比率は江東区と似ているが(図
2.8),江東区と比べ,㎡単価の高い発売で構成されている.すなわち,江東区と同じような広さのマンションが 世田谷区では江東区に比べ,高値で売られているといえる.もともと,世田谷区には,住 宅街が多く,住みやすいというイメージがあり,人気があるためだと考えられる.
中央区では,他の区に比べ,平均面積が狭く,㎡単価は江東区よりも高めである.中央
区の平均価格の発売構成比率は,江東区と似ている(図
2.7).しかし,実際に発売されているマンションのタイプは異なり,江東区と同様に平均価格が安いマンションで構成され
ているのは,㎡単価は比較的高いが,平均面積が狭くなることで平均価格が抑えられてい
ることが一因であると考えられる.
250 200
150 100
50
平均面積[㎡]
200
150
100
50
中央区 世田谷区 港区 江東区
㎡単 価﹇ 万円﹈
図
2.11 発売マンションの㎡単価と平均面積の関係次に,図
2.12から図
2.15に各区の発売マンションの主要間取りごとの散布図を示す.こ こで,発売件数が少ない,「1R」と「1K」と「1DK」をまとめて「1K」とし,「2DK」を
「2LDK」として扱った.ところで,間取りは面積による具体的な分類基準は無い.例えば,
3LDK
の
1部屋を二つに分けると
4LDKになる.そのため,一概に間取りの数字が大きい ほど広いとはいえない.
図
2.12より,江東区では,平均面積ごとに間取りが概ね,分かれていることがわかる.
また,平均面積が
60㎡から
80㎡のマンションの間取りは
3LDKであるため,この面積帯 が江東区の
3LDKのマンションの一般的な広さといえる.この面積帯で間取りが
4LDKで 発売されているマンションが見られる.このようなマンションは,
1部屋あたりの広さより,
部屋数を重視したマンションといえる.また,
100㎡を超えるようなマンションは,間取り を
4LDKにして発売されており,部屋数を多くとって発売されているといえる.
図
2.13より,港区では,平均面積が
100㎡を超えるようなマンションは,間取りを
2LDKや
3LDKとして発売されており,1 部屋を広めにとったマンションが発売されているとい える.また,平均面積が
50㎡未満のマンションの間取りは,1LDK と
1Kが大半である.
図
2.14より,世田谷区では,平均面積ごとに間取りが概ね,分かれていることがわかる.
江東区と同様に,3LDK の発売が主である.また,平均面積が
100㎡より広いマンション
に注目すると,㎡単価の安いマンションの間取りは,4LDK であるのに対し,㎡単価の高 いマンションの間取りは
2LDKと
3LDKで,1 部屋が広めにとられているといえる.
図
2.15より,中央区では,平均面積ごとに間取りが概ね,分かれていることがわかる.
また,70 ㎡より狭いマンションの発売が多い. また,他の区にはない特徴として,平均面 積が狭い上,㎡単価も安いマンションの発売が見られる.
以下に,本項で行った分析から推測できる各区の特徴を述べる.
江東区で発売されているマンションは,3LDK が主で,比較的平均面積が広めなことか ら,江東区はファミリー向けのマンションが多く発売されている地域である.
港区は,他の区に比べ,平均面積が著しく広く,平均価格が
1億円を超える高級マンシ ョンの発売が目立つことから,高所得者向けのマンションが多く発売されている地域であ る.
世田谷区は,発売されているマンションの間取り,平均面積に注目すると江東区と発売 構成が似ているので,江東区と同様にファミリー向けのマンションが多く発売されている 地域である.しかし,江東区より平均価格は高めである.
中央区で発売されているマンションは,比較的平均面積が狭いマンションで構成され,
その間取りは
1LDK,1Kや
2LDKが主である.そのため,中央区は人数の少ない世帯向け のマンションが多く発売されている地域である.
120 100 80 60 40 20
平均面積[㎡]
70
60
50
40
4LDK 3LDK 2LDK 1LDK 1K 主要間取り
図
2.12主要間取りごとの㎡単価 と平均面積(江東区)
250 200 150 100 50 0
平均面積[㎡]
210 180 150 120 90 60
4LDK 3LDK 2LDK 1LDK 1K 主要間取り
㎡単 価﹇ 万円﹈
㎡単 価﹇ 万円﹈
図
2.13主要間取りごとの㎡単価
と平均面積(港区)
120 100 80 60 40 20
平均面積[㎡]
120
100
80
60
40
4LDK 3LDK 2LDK 1LDK 1K 主要間取り
100 80 60 40 20
平均面積[㎡]
110 100 90 80 70 60 50
3LDK 2LDK 1LDK 1K 主要間取り
㎡単 価﹇ 万円﹈
㎡単 価﹇ 万円﹈
図
2.14主要間取りごとの㎡単価 図
2.15主要間取りごとの㎡単価
と平均面積(世田谷区) と平均面積(中央区)
第 3 章 発売マンションへの流入人口の推計
3.1 流入人口の推計
本節では,マンション
1戸当たりにどれくらいの人が住むのかを仮定し,各区の分譲マ ンションへの流入人口(推計流入人口)を推計し,実際の転入人口との関係を考察する.
3.1.1
流入人口推計モデル
発売リストに記述されている「最新契約率」は,マンションが発売された年の年末時点 での契約率である.そこで,最新契約率に発売戸数を乗ずることで,その年に売れた戸数
(売上戸数)を計算できる.売上戸数に
1戸当たりに流入する人数を乗ずることで,ある 年に発売されたマンションに流入する人口を推計できる.さて,マンションは,様々な間 取りで発売されており,間取りによって居住人数が異なると考えられる.そこで,
1人当た り
1居室に住むとして戸別流入人口を仮定する.例えば,1K,1LDK ならば
1人,3LDK ならば
3人が住むこととする.発売マンション
1件への推計流入人口の定義を以下に記す.
戸別流入人口 最新契約率
発売戸数
推計流入人口
= × ×表
3.1に,各マンションの推計流入人口を区ごとに集計した結果を示す.
表
3.1 各区の推計流入人口推計人口[人]
2003 年 2004 年 2005 年 3 年間累計 江東区 8,446 13,183 4,038 25,666
港区 5,490 10,567 7,966 24,022 世田谷区 7,230 8,382 7,622 23,234 中央区 3,147 3,774 7,050 13,971
3.1.2 実際の人口の変化との比較
東京都統計局の東京都住民基本台帳人口移動報告[7]に掲載されている,各区の年ごと
の転入者数と
3.1.1項で求めた各区の推計流入人口との関係を考察する.各区の年ごとの転
入者数を表
3.2に示す.世田谷区を除いて,年を追うごとに転入者が増加していることがわ
かる.また,世田谷区は毎年,約
66,000人転入しており,他の区に比べ,転入者数が多い.
表
3.2 各区の転入者数転入者数[人]
2003 年 2004 年 2005 年 3 年間累計 江東区 28,847 27,065 33,603 89,515
港区 19,125 20,094 22,308 61,527 世田谷区 66,357 66,214 65,557 198,128 中央区 11,348 12,992 14,656 38,996
ここで,転入者がどれくらいマンションに住むかを測る尺度として,転入者に対するマ ンション入居率を以下のように定義する.
転入者数
人口 各区の前年の推計流入 マンション入居率
=ここで,前年の推計流入人口を用いるのは,マンションは完成する前に発売されること が多く,発売日からマンションを購入した人が住み始めるまで時間差がある.そのため,
本研究では発売された翌年に入居が始まると仮定する.また,同区内で引っ越しを行い,
マンションに入居した人がいると考えることが出来るが,ここでは,考慮しない.
表
3.3に各区のマンション入居率を表す.
表
3.3 各区のマンション入居率マンション入居率[%]
2004 年 2005 年
江東区 31.2% 39.2%
港区 27.3% 47.4%
世田谷区 10.9% 12.8%
中央区 24.2% 25.8%
2005
年は対象地域の全ての区でマンション入居率が増加している.このことから,転入
者数が増加している要因として,対象地域内のマンションを購入したため,転入してくる
人が増加したと考えることが出来る.特に,港区と江東区の入居率が高いので,その傾向
が強いといえる.しかし,世田谷区の入居率は
2年ともに
10%強と他の区に比べ,入居率が低い.したがって,他の区に比べ,中古マンション,一戸建て,賃貸住宅などに住む転
入者の割合が高いと考えられる.
3.2 推計流入人口の居住分布
図
3.1から図
3.3は,
2003年から
2005年に発売されたマンションを発売年ごとに地図上 に表示したものである.赤い棒がマンションである.また,棒の高さは,
3.1節で推計した,
マンション
1件あたりへの推計流入人口である.ただし,同じマンションで,多期にわた って発売されている場合は,
1件あたりへの推計流入人口を足し合わせている.なお,黒の 線は行政区の境,灰色の線は鉄道を表している.図
3.1より,2003 年は,港区と江東区で は臨海地域に比較的規模の大きなマンションの発売があり,多くの人が流入すると予測さ れるマンションはあるが,各区ともに,全体に小中規模のマンションが発売されており,
各区に流入する人口は分散している.図
3.2より,2004 年は
2003年に比べ,港区と江東 区の臨海地域に大規模なマンションの発売があり,多くの人口が流入すると予測されてい ることが目立つ.また,世田谷区でも
2003年に比べ,鉄道に沿って人口が流入すると予測 される.図
3.3より,2005 年は,2004 年よりも,港区と江東区の臨海地域に予測される流 入人口が集中しているといえる.また,中央区も同様に臨海地域に流入人口が集中すると いえる.そして世田谷区では,2004 年に比べ,発売されるマンションが鉄道に近づいてい る傾向が見られる.
以上のことより,
2003年から
2005年に発売されたマンションによって,江東区,港区,
中央区の臨海地域には他の地域と比べ,特に多くの人々が流入してくると予測できる.ま
た,世田谷区では,小,中規模のマンションが主に発売されている上,一ヶ所に集中して
いないので,人口がある特定の地域に集中することは起こりにくいといえる.
図
3.1マンションの分布と予測流入人口(
2003年)
図
3.2 マンションの分布と予測流入人口(2004年)
世田谷区
港区
中央区
江東区 新宿駅
東京駅
品川駅
図
3.3マンションの分布と予測流入人口(
2005年)
第 4 章 売れ行き判別モデルの構築
本章では,発売リストの項目をもとに,区ごとにマンションの売れ行きの好調,不調を 判別するモデルを構築する.その手法として,決定木を用いる.
4.1 決定木
本節は文献[4,5]に基づいて述べる.決定木とは,データの項目間の関係を木構造で 表す分析手法である.決定木はノードとリンクから構成され,各ノードにはデータを分類 するための分割テストが示されている.ノードとその下位ノードとを結ぶリンクには分割 テストを適用した結果のとり得る変数値が対応付けされている.子を持たないノードを終 端ノードと呼び,各終端ノードは目的変数のクラスを持つ.与えられたデータは,決定木 を使用して,いずれかの終端ノードに分類される.
表
4.1のようなデータが与えられ,目的変数を「売れ行き」,目的変数のクラスを好調と 不調として,説明変数を価格と面積とするときに構築される決定木の例を図
4.1に示す.
表
4.1 データの例図
4.1 決定木の例4.1.1
決定木の構築アルゴリズム
定 とおりである.
p 1 母集団のデータを決定木の根に当たるノードに対応づけ,任意の変数でデータ
Step 2
ノードごとの各クラスの割合を計算
Step 3
順をすべての説明変数に対して繰り返し,もっとも効率よくクラスを判
決 木の構築アルゴリズムは以下の
Ste
を分割する.
分割後の各ノードに属するデータを集計し,
する.
上記の手
価格[万円] 面積[㎡] 売れ行き 7,000 80 好調 3,000 50 好調 5,000 60 不調 面積
価格
不調 好調
<80
好調
≧
分割テスト80
<5000
≧5000
別できる変数を,枝分れを決定する変数とする.ここでいう最も効率よく枝分 かれさせる方法については
4.1.2項で述べる.
Step 3
の枝分かれで生成されたノードを出発点と
Step 4
し,
Step 2と
Step 3の手順を
.1.2
情報利得比
述べた最も効率よく判別できる変数を決定するための尺度として,
繰り返す.ただし,生成されたノードの不純率が
1%未満の場合とノードに属するデータ数が母集団の
0.8%未満になった場合はそのノードを終端ノードとし,ノードに属するクラスの多い方その終端ノードに対応づける.
4
4.1.1
項の
Step 3 で情報利得比を用いる.決定木の枝分かれは情報利得比の最も大きい説明変数で分岐させる.
情報利得比の定義を以下に述べる.
Cj
はク
S
はノード
Sのデータ数, ラス
Cのデータ数,
Aは分割に用いる変数,
Sjは
分割 の る.
定義する.
後のノード データ数とす ノードの情報量
E(S)を以下のように
C S P C
S P S
E( )= ( , j)log2( ( , j))
S C C S
P j j
j
=
−
∑
) , (
次に,分割後の情報量
E(S,A)を以下のように定義する.
∑
=
j
j
j E S
S A S
S
E( , ) ( )
以上より,分割による情報利得 は
S,A ) , (S A gain )
( ) ,
(S A E S E
gain = − ( )
と表せる.
を以下のように定義する.
) , (S A ESplit
次に分割の情報量
∑
⎟⎟⎠
⎞
⎛ S
⎜⎜
⎝
−
=
j
j j
Split
S S
S A
S
E ( , ) log2
以上より,情報利得比
gainRatio(S,A)は
) , () , ) (
, (S gainRatio
A S E
A S A gain
Split
=
となる.
4.2 売れ行きの定義
リ 本研究では,
満
決定木による判別分析
マンションごとの売れ行きの好調と不調を目的変数
さらに,マンションの周辺施設の数として, (株)昭文社 の
MAPPLE 10000から取得し
ータの中から学習用データ
表
4.2 判別結果の出力例発売 ストには,売れ行きを表す尺度として初月契約率が記載されている.
マンションが発売された月に完売したか,しなかったかで売れ行きの好調,不調を分ける こととする. したがって,売れ行きの好調,不調を以下のように定義する.
好調:初月契約率が
100%不調:初月契約率が
100%未4.3
決定木による判別分析を行うため,
とし,説明変数として発売リストから以下の項目を利用する.
・ 最寄り駅からの距離 ・ 間取り
・ 発売戸数 ・ 全戸数
・ 平均価格 ・ 平均面積
・ 最高分譲価格 ・ 最低分譲価格
・ 最大専有面積 ・ 最小専有面積
・ ㎡単価
た対象地域内の駅,小中学校,スーパー,コンビニエンスストア(コンビニ),病院,保育 園,バス停の座標値をもとに,マンションの周囲
100m,300m,500m,1,000m,1,500m,2,000m以内のそれぞれの数を説明変数として利用する.
まず,全てのデータを区ごとに分割する.そして,各区のデ
を選択する.学習用データは,売れ行きが好調,不調であるとすでに判別されているデー タである.本研究では,各区の分析対象データを
1対
1にランダムに分割し,一方を学習 用データとし,他方を検証用データとする.学習用データを用いて決定木の学習を行い,
構築された決定木を判別モデルとし,その判別モデルを用いて検証用データを検証した.
判別結果の一例を,表
4.2に示す. 「実際」とは実際のマンションの売れ行きであり, 「判別 結果」とは,構築された決定木をもとに,データを判別した結果である.
判別結果
不調 好 調
不調 7 2 4 8
実際 好調 35 23
4.4 分析結果
トの項目のみ,発売リストの項目と周辺施設の数を用いた場合 説明変数として発売リス
で,実行した.なお,分析には, (株)数理システムが提供している,
Visual Mining Studio 3.0を使用する.出力における,正解率,好調誤判別率,不調誤判別率を以下のように定義 する.
「実際」が好調の数 数
「判別結果」が不調の 不調誤判別率
「実際」が不調の数 数
「判別結果」が好調の 好調誤判別率
判別対象の数
,不調が合致した数 不調と「実際」の好調
「判別結果」の好調,
正解率
=
=
=
.4.1
江東区の分析結果
たマンションの売れ行きが好調と不調の発売件数と割合を示
周辺施設の距離を説明変数として決定木を構築した場合,正
表
4.3江東区の売れ行き
4
表
4.3に江東区で発売され
す.また,表
4.4に決定木の検証結果を示す.発売リストの項目のみを説明変数として決定 木を構築した場合,正解率は約
67%である.また,好調誤判別率は約
33%で, 「好調」を正 しく判別する割合は約
67%である.また,不調誤判別率は約
34%で, 「不調」を正しく判別 する割合は約
66%である.
次に,発売リストの項目と
解率は,約
70%で,説明変数に発売リストの項目のみを用いた場合に比べ,約
3ポイント 増加している.また,好調誤判別率は約
30%で,説明変数に発売リストの項目のみを用い た場合に比べ,約
3ポイント減少している.不調誤判別率は約
32%で,説明変数に発売リ ストの項目のみを用いた場合に比べ,約
2ポイント減少している.説明変数に周辺施設の 数を加えたモデルの方が,わずかではあるが,精度が向上した.
売れ行き
不調 好 調
発売件数 13 6 14 5
割合[%] 48.4 51.6
表
4.4検証結果(江東区)
説明変数の取り 方
発売リストの項目 発売リストの項目 + 周辺施設の数
正解率[%] 66. 9 69 .8
好調誤判別率[%] 32.5 29.3
不調誤判別率[%] 33.9 31.6
.4.2 港区の分析結果
売れ行きが好調と不調の発売件数と割合を示す. また,表
4.6離を説明変数として決定木を構築した場合,正
表
4.5 港区の売れ行き4
表
4.5に江東区での発売で
に決定木の検証結果を示す.発売リストの項目のみを説明変数として決定木を構築した場 合,正解率は約
58%である.また,好調誤判別率は約36%で,「好調」を正しく判別する割
合は約
64%である.また,不調誤判別率は約47%で,発売リストの項目のみでは売上の「不調」を正しく判別することができない.
次に,発売リストの項目と周辺施設の距
解率は,約
65%で,説明変数に発売リストの項目のみを用いた場合に比べ,約7ポイント 増加している.また,好調誤判別率は約
33%で,説明変数に発売リストの項目のみを用いた場合に比べ,約
3ポイント減少している.また,不調誤判別率は約
38%で,説明変数に発売リストの項目のみを用いた場合に比べ,約
9ポイント減少している.説明変数に周辺 施設の数を加えたモデルの方が,精度が向上し,売れ行きを正しく判別できることがわか る.
売れ行き
不調 好 調
発売件数 147 12 4
割合[%] 54.2 45.8
表
4.6 検証結果(港区)説明変数の取 り方
発売リストの項目 発売リストの項目 + 周辺施設の数
正解率[%] 58. 1 64 .7
好調誤判別率[%] 36.1 32.9
不調誤判別率[%] 46.7 38.3
.4.3
世田谷区の分析結果
表
4.7に世田谷区での発売で売れ行きが好調と不調の発売件数と割合を示す.また,表
4
4.8
に決定木の検証結果を示す.発売リストの項目のみを説明変数として決定木を構築した
明変数に発売リストの項目のみを用いた場合に比べ,約
14ポイント
売れ行き
場合,正解率は約
53%で,単純に判別した場合と変わらない.また,好調誤判別率は約
68%で,単純に判別する場合と変わらない.また,不調誤判別率は約
33%で,単純に判別する 場合と変わらない.つまり,発売リストの項目のみでは売上の好調,不調を正しく判別す ることができない.
次に,発売リストの項目と周辺施設の距離を説明変数として決定木を構築した場合,正 解率は,約
67%で,説
増加している.また,好調誤判別率は約
43%で,説明変数に発売リストの項目のみを用い た場合に比べ,約
25ポイント減少している.また,不調誤判別率は約
27%で,説明変数に 発売リストの項目のみを用いた場合に比べ,
6ポイント減少している.説明変数に周辺施設 の数を加えた方が,精度が向上し,売れ行きを正しく判別できることがわかる.
表
4.7世田谷区の売れ行き
不調 好調
発売件数 248 119
割合[%] 67. 6 32. 4
証結果 田谷区
説明変数の取り方
表
4.8 検(世 )
発売 リストの 項 目 発売リストの項 目 + 周辺施設の数
正解率[%] 53.4 67.2
好調誤判別率[%] 67.6 43 .1
不調誤判別率[%] 32.7 26.8
4.4.4
結果
表
4.9に中央区での発売で売れ行きが好調と不調の発売件数と割合を示す.また,表
4.10売リストの項目のみを説明変数として決定木を構築した場
説明変数に発売リストの項目のみを用いた場合に比べ,約
12ポイント
中央区の分析
に決定木の検証結果を示す.発
合,正解率は約
65%である.また,好調誤判別率は約51%で,「好調」を正しく判別する割
合は約
49%である.また,不調誤判別率は約23%で,正しく「不調」を判別する割合は約77%である.
次に,発売リストの項目と周辺施設の距離を説明変数として決定木を構築した場合,正 解率は,約
77%で,増加している.また,好調誤判別率は約
37%で,説明変数に発売リストの項目のみを用いた場合に比べ,約
14ポイント減少している.また,不調誤判別率は約
13%で,説明変数に発売リストの項目のみを用いた場合に比べ,約
10ポイント減少している.説明変数に周辺
施設の数を加えた方が,精度が向上し,売れ行きを正しく判別できることがわかる.
表
4.9中央区の売れ行き
売れ行き
不調 好調
発売件数 129 64
割合[%] 66. 8 33. 2
検証結果(中央区)
説明変数の取り方 表
4.10発売 リストの項目 発売リストの 項目 + 周辺施設の数
正解率[%] 64.6 77.1
好調誤判別率[%] 51. 2 36 .6
不調誤判別率[%] 22.6 12.7
4.4.5
された決定木の
決定木では,より根に近いノードに対応付けられている説明変数の方が効率よくデータ 行きの好調と不調を判別するために,よ
ル
1:最寄り駅からの距離,平均価格,最高分譲面積,最高分譲価格 ・
ベル
1:平均価格,最高分譲価格,全戸数,300m以内の病院の数最寄り駅からの距離,平均価格,発売戸数,最低分譲価格
・
根:100m以内のスーパーの数
1:1,500m以内のコンビニの数
均面積,発売戸数
区ごとに構築 特徴
を分割する.そのため,根に近い説明変数は売れ
り重視される基準といえる.そこで,各区のデータで構築された決定木の根に近い説明変 数を比較する.なお,比較する説明変数は,各決定木の根に対応する説明変数,根を親と するノード(深さレベル
1のノード)に対応する説明変数,第
1ノードを親とするノード
(深さレベル
2のノード)に対応する説明変数とする.
以下に,各区の決定木の根から深さレベル
2までのノードを記す.
・江東区
根:2,000m以内のコンビニの数 深さレベ
深さレベル
2:100m以内の駅の数港区
根:平均面積 深さレ
深さレベル
2:世田谷区 深さレベル
深さレベル
2:最小専有面積,平・
根:
2,000m以内の駅の数
ル
1:発売戸数,平均価格,最低分譲価格 の距離,㎡単価
以 ではなく,価格に関する情報が好調と不
判別している.港区では,平均面積と価格に関する情報で好調と不調を判別している 中央区
深さレベ
深さレベル
2:最寄り駅から
上のことより,江東区では面積に関する情報 調を
傾向がある.世田谷区では,周辺のスーパーやコンビニの数で好調と不調を判別している.
また,他の区では重視されていると考えられる最寄り駅からの距離が決定木の分岐基準と
して扱われていなかった.中央区では,面積に関する情報ではなく,価格に関する情報で
好調と不調を判別している.これらのことより,区ごとに,売れ行きを左右するのに重視
される要素は異なることがわかる.
第 5 章 おわりに
5.1 まとめ
新築マンションの発売データをもとに,対象地域を江東区,港区,世田谷区,中央区と して以下の分析を行った.
2
章では,マンションの平均価格,平均面積,㎡単価,主要間取りに着目し,地域ごとの 特徴を分析した.その結果,江東区での発売は比較的安いマンションで構成され,港区で の発売は比較的高いマンションで構成されるなどの発売地域によって特徴があることがわ かった.
3章では,マンション
1戸あたりに住む人数を主要間取りから仮定し,マンション の発売戸数と最新契約率を用いてマンションの発売一件あたりへの流入人口を推計した.
それを区ごとにまとめ,実際の転入人口から,マンション入居率を考察した.その結果,
江東区と港区のマンション入居率が高いことがわかった.また,町丁目単位で推計流入人 口を地図上に表示した.その結果,マンションの発売によって,江東区,港区,中央区の 臨海地域に多くの人口が流入すると推計できた.
4章では,区ごとに決定木分析を行い,各 区の売れ行き判別モデルを構築し,売れ行きを左右する要因を探った.その結果,港区で は,マンションの平均面積と価格に関する情報が要因として考えられ,一方で,世田谷区 では周辺のスーパーの数が要因として考えられることがわかり,区によって,売れ行きを 左右する要因が異なることがわかった.
5.2 今後の課題
今後の課題を以下に記す.
・ 地域分析にあたっては,マンションの発売戸数を考慮していない.そのため,発売戸数 の多いマンションと少ないマンションを同じ一件として扱っている.件ベースで分析し た場合と戸ベースで分析した場合とで地域の傾向が異なる可能性が考えられるので,発 売戸数を考慮に入れた分析を行い.比較する必要がある.
・ 本研究では,推計流入人口は
1戸あたりに住む人数を仮定している.したがって,世帯 の平均人数や形態などを考慮して推計を行う必要がある.
・ 本研究では,マンション入居率は,対象地域内での移動者を考慮していない.したがっ て,同地域内の移動者を推定し,考慮にいれて定義する必要がある.
・ 本研究では,構築した売れ行き判別モデルの正解率は約
7割程度で,正解率が高いとは
いえない.説明変数のとり方を工夫するとともに,売れ行きに影響を与える要因を考察
し,それを考慮に入れたモデルを構築する必要がある.
謝辞
本研究を進めるにあたり,多くのご指導ご助言をいただきました中央大学理工学部情報
工学科の田口東教授に心より感謝の意を表します.また,多くのご助言とご協力をいただ
いた鳥海重喜氏,三河辰洋氏,円地隆之氏をはじめとする田口研究室の方々に深く感謝い
たします.
参考文献
[
1]“全国マンション市場動向・
2003年実績・展望” ,不動産経済・特別資料集,株式 会 社不動産経済研究所,東京,
2004.
[
2]“全国マンション市場動向・
2004年実績・展望” ,不動産経済・特別資料集,株式 会 社不動産経済研究所,東京,
2005.
[
3]“全国マンション市場動向・
2005年実績・展望” ,不動産経済・特別資料集,株式 会 社不動産経済研究所,東京,
2006.
[
4]福田剛志,森本康彦,徳山豪, “データマイニング”,データサイエンス,共立出版 株式会社,東京,
2001.
[
5]株式会社数理システム, “
Visual Mining Studio技術資料”, (オンライン),入手先
< http://www.msi.co.jp/vmstudio/materials/tech/ >
.
[
6]東京大学空間情報科学センター,“
CSVアドレスマッチングサービス”,(オンライ ン),入手先
<http://pc035.tkl.iis.u-tokyo.ac.jp/~sagara/geocode/>.
[
7]東京都統計局,“東京都住民基本台帳人口移動報告”, (オンライン),入手先
< http://www.toukei.metro.tokyo.jp/jidou/ji-index.htm >