SMARTCITY
大数据+AI
+房产价格+土地价值
-FutureSmartCities-
赋能城市新基建,助力地产金融科技
文章简介无论是政府还是开发商还是城市中的普通居民,大家都对城市当中不同地段的土地价值以及潜在的升值地段非常有兴趣。但是,因为政府政策的复杂性以及包括开发商和不同投资者在内的不同主体之间的博弈,城市中不同地段的土地价值的识别则变得十分复杂。近年来。大数据和深度学习技术的兴起都为我们尽可能地利用相关算法挖掘城市多源数据中的有效信息去识别城市中不同地段的土地价值及其在不同假设下动态模拟其不同的变化情况提供了可能。
因此,本文将介绍基于融合包括遥感影像数据,街景数据,兴趣点数据(poi)等在内的多源大数据,通过综合利用空间统计分析,传统机器学习算法,深度神经网络以及多智能体强化学习对北京市全境内不同地块的土地价值进行识别,并且预测模拟了不同假设下城市内不同地段的土地价值的动态变化情况,从而辅助评估不同地段的土地价值以及发现不同地段的升值潜力的相关探索。
PART1
什么是土地价值,我们如何定义它?
土地价值通常可以通过不同的变量来反映,比如土地初次交易价格,土地成交后的溢价价格(开发商进行开发后土地的价格)等。本次研究中采用的二手住宅的平均售价作为反映土地价值的变量。我们首先获取了链家网上的二手住宅小区的销售数据,并将相关数据映射到了每个住宅小区所处的地块上面,如下图所示。图1和图2分别是北京市在年和年的二手住宅小区的平均售价的空间分布图,其中颜色越亮越红代表价格越高,颜色越紫越蓝代表价格越低,黑色代表该地块上没有相关的二手住宅小区的数据。
从两张图的对比当中,我们可以发现,整体而言北京市的二手房房价整体呈现出从中心到外围再到城市郊区逐步递减的态势。从细节上来讲,均价在万-万的小区主要豪宅小区主要分布在圆明园和颐和园附近,奥森公园附近,均价在万-万的高等住宅小区则主要分布在以清华北大为代表的高等院校附近,以及城市内部核心区域周围,比如故宫附近,金融街附近,三里屯附近,东单附近等。而城市内部均价比较一般的刚需住宅小区以及价格比较低的二手住宅小区则交错分布在城市中心向外延伸的空间中的不同角落,这充分说明了在同一特定距离下的空间范围之中,不同地块的价值是有可能存在着巨大差异的。
那么问题就来了,是哪些要素共同作用造成了这种同一特定范围内的空间下可能交错分布着不同价格的住宅小区的现象,以及如何通过综合建模去找到这些要素并且识别出城市中不同地块的土地价值,最终找到城市发展的驱动模式?
PART2
决定土地价值的因素是哪些?
地铁和学校作为公认的有利于房价提升的要素,我们首先选择了地铁和学校周围米范围内的不同住宅小区和北京市所有住宅小区的平均售价以及最高售价的价格分布进行了对比,希望能够从对比图当中发现是否所谓的地铁房和学区房会明显的明显地高于北京市其他地区的二手住宅小区的售价。
下图中蓝色的代表的分别是地铁周围,学校周围以及整个北京市二手住宅小区的平均售价,红色的则是三个不同空间范围的二手住宅小区的最大售价。从三者当中的从平均售价和最大售价的对比,我们可以发现地铁周围的二手住宅小区和学校周围的二手住宅小区的价格分布和整个北京市二手住宅小区的价格分布并没有明显的差异,也就是说地铁和中小学并没有成为北京市土地价值升值的明显因素。
造成这种因素的原因可能有三种,一是北京市内的地铁和中小学分布的数量比较多,而且在空间上分布得相对比较均匀,并没有出现明显的差异;二是还有其他的要素对提升房价的作用更加明显;三是除了地铁和中小学还有其他影响房价的因素共同作用从而影响了房价,并且这种影响是复杂的和非线性的。
那么,除了地铁和学校,其他因素呢,是如何共同作用形成土地价值进而影响周围的住宅价格呢?在探究这些问题之前,我们先进一步可视医院,大型商场和一定程度上反映了城市中生活便利性的超市和便利店等不同要素在空间当中的分布差异情况。从图中我们可以清楚地观察到这些不同的要素在空间当中的分布是不一样的,医院和大型商场这类属于城市中的核心且稀缺资源,少量地散布于城市中的特定角落,而中小学这类城市中核心且必须满足的基础资源,则大量分布在城市中各个角落。很显然,城市中不同等级以及不同类型的资源是不均匀地分布在城市中的不同角落的,那么我们如何结合这些影响房价的不同要素,以及如何通过房价映射到不同地块的土地价值?
PART3
土地价值识别及动态演化综合计算框架
我们以北京市每个小区的二手住宅的平均价格作为反映土地价值的目标值,融合了包括遥感影像、街景图片和POI等多个数据源,利用了包括传统机器学习相关算法,DNN和SEGNET等在内的深度神经网络以及强化学习等算法,构建了不同情境下土地价值的识别以及动态演化的综合计算框架。
如图所示,上图展示了在识别土地价值的计算过程中部分模型对于房价的拟合效果以及北京市不同地段对于二手住宅的价格影响程度的重要性排名。其中,左边的图显示的是不同模型在训练集和测试集上的表现差异,右边这张图是则是北京市内不同地段的整体的相关重要性排名,从图中的地段排名中,我们可以发现排在前面的区分别是西城区,东城区以及海淀区。从街道层面上来看的话,排在前面的分别是东城的东单,金宝街附近,西城区的金融街附近。
在构建整个土地价值识别系统的时候,我们也通过正向建模对不同特征的重要性进行了参数提取,下图选择了部分公共服务设施的特征重要性进行了参数排名以及计算了一定空间范围内不同设施之间的相关性。通过观察我们可以发现不同设施在特定空间范围内通常是“绑定”出现的,比如咖啡厅和银行,快餐厅和便利店以及超市一般都一起出现。除此之外,我们还发现对二手住宅平均售价正向影响比较大的设施分别是快餐厅,医院,负向影响比较大设施分别是诊所,便利店和公交站。
PART4
北京市全市范围内不同地块土地价值识别最终成果
我们最终识别了北京市全市范围内不同地块的土地价值以及不同条件下同一地块不同价值的动态演化模拟过程,如下面的动态GIF所示。
肖惠丹
未来城市实验室
未完待续
机房老哥
欢迎扫码