基于线性回归的房价分析预测

2017-10-08 06:50邱思嫄
世界家苑 2017年10期
关键词:线性回归房价

邱思嫄

摘 要:主要运用线性回归分析方法,以波士顿房价及链家等提供的北京、石家庄房价数据为样本,通过纵向和横向分析研究,得出宏观政策、人口因素、环境因素等对房价的影响,并综合各种因素对近期房价作出基本预测。

关键词:线性回归;分析预测;房价

随着中国经济的飞速发展和城市建设的不断推进,城市房价一路高涨,成为近几年民生关注的热点问题。无论是寻找限购空隙的投资客,还是被溢出效应挤到一线城市周围地区的刚需人群,抑或是被市场购房热情助推的二三线城市房价,都与楼市息息相关。如何透过纷繁复杂的楼市表象,探寻房价影响因素,预测房价趋势走向,无疑具有很强的社会实践意义。本文将主要运用线性回归分析方法,对房价影响因素及其趋势走向加以分析预测。

1 时间维度上的房价指数纵向分析

该部分主要探究在时间方向上的房价增速与政策影响的关系。

1.1 数据源分析

以链家提供的北京市2011—2013年房价数据为例,关键的几个因素为:小区编码、签约时间、单价。我们的处理方法是,首先,得到各个时间点上小区上次成交的平均单价,再对各个小区求得均值,认为是该时间点上整个北京的房价均值(表1)。

从曲线可以看到,这并不符合所谓的“稳步上涨”。从常理上推断,房价的上涨受宏观形势(尤其是国家政策)的影响更为明显。

1.2 宏观政策和房价增速的关系

参考以下链接https://wenku.baidu.com /view/1421ae5ca76e 58fafbb0031e.html,

总结在2010-2013年时间段国家关于房地产领域调控的关键政策[3],列表如下:(表2)

对比上文的房价指数图,可以看到,宏观政策对指数增速的影响是显著的。

1.3 分段加权线性回归

我们简化地认为,房价的增长模式是简单的稳定增长,然而增长速率由政策的不同而不同。同时,考虑到政策对市场影响的延后性,我们直接对房价指数的对数做分段线性回归。

观测房价走势图,可以看到,在2011年10月份,房价指数并不稳定。查看源数据,在这段时间成交量比较少,大数定律不起作用,所以不能有效地准确估计房价指数。因此,在回归过程中,我们在损失函数中加入权重。下文中,我们以该日成交量的平方根作为权重。对下文的数据作解释如下:

以2011年10月5日作为第0日,10月6日作为第1日,以此类推,作为自变量 ;以当日的房价指数index的对数作为观测值 ;以当日的成交量num的平方根作為权重 ;总的天数记为 。

之所以取对数,是因为把等比例增长转化为线性增长;以成交量的平方根作为权重,是考虑到中心极限定理的置信区间估计。我们的目标是,拟合出一个 段线性函数 ,最小化损失函数: 。对于分段线性回归来说,如何选择“转折点”是一个关键的问题。“转折点”选的合适不合适,直接影响到拟合的效果。为求解这个问题,采用动态规划的方法来确定各个转折点。添加辅助函数,记

我们希望求解 ,建立转移方程

而 ,是容易由简单的线性回归求得的。递归通过上述转移方程,能够求解得到 。

最终,结果绘图如下(表3):

也就是说,在假设政策不变的情况下,可以按照最新的增长速率对房价进行预测。

2 不考虑时间维度的横向分析

以波士顿房价为例,使用CMEDV(调整后的均价)作为观测值 ,结合数据中给出的经度与纬度信息,以此观测数据背后的含义。

波士顿房价数据的关键几列为:

●TOWN:镇名

●TOWN#:编号

●TRACT:土地片区的编号

●LON:LAT 经度纬度

●MEDV:业主自用价

●CMEDV:调整后的业主自用价

●CRIM:犯罪率

●ZN:城镇住宅用地比例的数字向量

●INDUS:非零售业务比例

●CHAS:是否与CharlesRiver和毗邻

●NOX:氮氧化物的浓度

●RM:平均每户住房数

●AGE:不太清楚,1940年前建造的单位

●DIS:到波士顿五个就业中心的加权距离

●RAD:城镇公路可达性指数

●TAX:税率

●PTRATIO:学生-教师比率

●B: ,其中 是黑人占比LSTAT:低端人口百分比

根据每列的意义和实际生活经验,选取可能会对房价造成影响的一些列,有:

[‘CRIM,‘ZN,‘INDUS,‘CHAS,‘NOX,‘RM,‘AGE,‘DIS,‘RAD,‘TAX,‘PTRATIO,‘B,‘LSTAT]。

通过分析,对于房价的影响权重较强的因素有:低端人口比例、与商圈的距离、空气质量。可以看出,人口因素、位置因素、环境因素等对房价的影响权重较大,与我们实际生活中的感受较为一致。

3 房价预测

3.1 房价量化方法

3.2 不考虑政策变动的线性预测

运用上节给出的预测方法,我们采集石家庄市桥西区2011年1月到2018年4月的单价数据,使用第一节中的分段回归方法,对价格序列的对数做回归,并对线段进行延长,得到的图如下(表4)。

把对数曲线的三个延长点的预测值还原为真实的房价值,得到的结果如下(表5):

3.3 宏观影响的定性分析

3.3.1时间维度

考虑到中国特色“金三银四”的效应,春节过后,一部分被压抑的购买需求被释放出来,这对房价的走势会有一定的向上修正效应。

3.3.2经济维度

在美国加息预期强烈,国内缩紧货币供应的形式下,中国的房产观望气息较重,总体上仍然处于下行走势。考虑到石家庄本地的收入水平,我们对石家庄的房价走势持消极观点。

3.3.3人口维度

根据2016年末石家庄市人口变动调查显示,一方面,人口数量向主城区流入的趋势比较明显,另一方面,全市常住人口总量保持低速增长态势,且净流入人口逐年减少,外来人口吸引力相对不强,因此人口对房价不会有太大影响。

3.3.4政治维度

在中央“房子是用来住而非炒”的大的方向把握上,在地方各级政府对房地产的强势干预下,中国的房地产走势像以往向上的可能性不大,应以保持平稳健康发展为主基调。

(作者单位:石家庄二中)

猜你喜欢
线性回归房价
房价上涨对居民消费的影响研究
房价上涨抑制英国出生率:每年少生7000多名婴儿
国道公路养护管理与规划研究
投资者情绪与股票市场收益的相互影响分析
企业退休金收支平衡的研究
2016房价“涨”声响起
企业退休金收支平衡的模型分析
中国服务业竞争力因素分析
《公积金额度让你瞬间土豪?》