BP神经网络模型在房地产智能评估市场法中的应用

2018-11-24 05:18赵振洋王若天
中国资产评估 2018年11期
关键词:神经网络误差样本

■ 赵振洋 王若天

当前,人工智能在经济社会各个领域之中不断地融合发展,基于各种人工智能的新业态正在逐渐成为新的经济增长动力。人工智能依托互联网技术,以数据分析为基础,逐渐发展完善并运用到了各行各业之中,对于传统的预测和分析方法带来了革新。

传统资产评估在数据量和评估经费方面存在客观的劣势,资产评估师获取信息和数据的方式有限,只能通过实地勘察或自己公司存档的案例进行查阅学习。并且,传统的资产评估方法也不可避免的存在着大量的主观性,对于评估结果的客观公允产生了一定的影响,如何最大限度的消除评估过程中的主观性,最大程度的建立一套客观的评估体系,也是新时代经济社会发展的一大要求。

一、房地产评估领域人工智能的发展现状

人工智能(Artificial Intelligence),英文缩写为AI。它是计算机科学的一门分支,是通过对人的意识、思维的信息过程的模拟,来研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能是一门前沿学科,属于自然科学、社会科学、技术科学三向交叉学科,几乎涉及到了包括哲学、认知科学、数学和计算机科学等在内的所有学科。其具体的应用范畴囊括了语言的学习与处理、知识表现、智能搜索、推理、规划、机器学习、知识获取、组合调度问题、感知问题、模式识别、逻辑程序设计等方面。

房地产价格是一个复杂的经济范畴,既包括土地的价格,又包括房屋建筑物的价格,房与地是不可分割的统一体,房地产价格是这个统一物的价格。房地产价格的形成机制与一般商品价值相同,都是人类劳动智慧的结晶,具有价值。

房地产估价,全称房地产价格评估,就是对房地产进行估价。即由持有《房地产估价人员岗位合格证书》或《房地产估价师注册证》的专业人员,根据估价目的,遵循估价原则,按照估价程序,运用估价方法,在综合分析,影响房地产价格因素的基础上,结合估价经验及对影响房地产价格因素的分析,对房地产的特定权益,在特定时间最可能实现的合理价格所作出的估计、推测与判断。

目前人工智能已经在资产评估的部分领域进行了尝试应用,也取得了一定的成果。以房地产评估为例,当今的房地产评估行业的人工智能的发展呈现出两种方向,如图1所示,一种是以构建房地产估价系统平台为代表的自上而下的“因——果”式发展思路,另一种是以搭建新人工智能房地产实际成交价预测模型为代表的自下而上的“果——因”式发展思路。

图1 房地产行业人工智能发展模式示意图

人工智能的第一种模式是模拟人们解决问题的认知流程,以“专家系统”为代表,用大量“如果——就”的规则定义,用自上而下的“因——果”思路来模拟人们对事物的认知,也就是直接模拟人的认知判断过程来进行编程运用,本质是从大量的“如果——就”判断中得出一个最好的步骤。此种模式在房地产评估行业的应用的具体表现就是各大评估机构所搭建的各类房地产估价系统平台。如图2所示,目前的估价系统(产品)主要有估价作业系统、估价业务与报告发送平台、估价业务与报告发送平台、房地产数据服务系统等几种。

图2 房地产估价系统平台分类示意图

人工智能的另一个分支则是以人工神经网络为代表的新型估值模型的产生。人工神经网络则不是模拟人们思维解决问题的思路,而是直接从底层模拟大脑神经元的结构思路。它从信息处理的角度对人脑神经元网络进行抽象,建立某种简单的模型,并依照不同的连接方式构建出不同的网络。人工神经网络标志着另外一种自下而上的“果——因”思路,不需要给出既定规则,只要给出足够的数据,让其自行发现规则,发现连接,从而开辟一条全新的认知道路。

二、BP神经网络模型概述

BP神经网络,是目前人工智能领域应用较广的一种人工智能神经模型。本文拟采用此神经网络模型,探讨其在房地产评估中的可行性问题。

人工神经网络(Artificial Neural Network,ANN),亦被称为神经网络(Neural Networks,NN),是由大量处理单元(神经元Neurons)广泛互连而成的网络,是对人脑的抽象、简化和模拟,反映人脑的基本特性。BP网络(Back-Propagation Network),是一种多层前馈神经网络,名字源于网络权值的调整规则,采用的是后向传播学习算法,即BP学习算法。

感知器的学习是神经网络最典型的学习。目前,在控制上应用的是多层前馈网络,这是一种感知器模型,学习算法是BP法。

多层感知器神经网络(MLP)算法在输入层和输出层之间添加了一个或多个隐含层,其典型输入输出关系如下式(以隐含层第j神经元为例):

f是某种线性函数,通常为Sigmoid函数:

在实际网络中,λ常取1,vj是隐含层第j个神经元的输出,uj的输出,也即隐含层第j个神经元的第i个输入,ωi是连接输入层第i个神经元与隐含层第j个神经元的连接权(即连接强度),Tj是隐含层第j个神经元的阕值(修正值)。理论证明,层数大于(或等于)3的BP可用来进行任意复杂的模式识别。在本模型中,感知器中的输入神经元个数由信息单元特征向量的维数决定,输出神经元个数由冗余度的等级数决定。

三、神经网络在市场法中的应用

(一)神经网络应用于房地产评估的可行性

BP神经网络作为评估智能化的一种预测手段,可以应用于传统的市场法评估实务中去,这将会大大减少评估实务的工作量,提高工作效率,同时保证了评估的精确度,减少评估误差。BP神经网络的优势在于,相较于传统的线性回归方法,BP神经网络模型可以解决大量的非线性问题,同时其样本数据可以不断更新,每完成一次评估工作,即可以将该评估数据归入评估数据库,使得该项评估工作得以多次循环利用,从而将评估工作的重点,由传统的侧重于评估方法的应用转变为评估数据库的维护,进一步降低评估工作成本。

(二)构建房地产价格因素的评估指标体系

1.住宅房地产评估影响因素的分类

房地产价格受到多种影响因素的影响,设定房地产价格评估指标体系必须首先合理划分房地产价格的各项影响因素,然后分析影响因素的合理性和客观性,选取那些具有动态性和概括性地反映某一时间、某一地区房地产价格的影响因素,将其纳入到房地产评估指标体系中去。

住宅房地产价格是众多因素相互影响、相互作用的结果。影响住宅房地产价格的因素整体可以分为住宅房地产价格宏观因素和微观因素两类。实务操作中,为了便于归类量化计算,常常只将上述微观因素中的交易日期、交易情况、区域因素和个别因素加以考虑,而宏观因素都采用评估假设的方法在评估之前便提前假定宏观因素不发生变化。

住宅房地产宏观影响因素包括政治因素、政策因素、经济因素和社会因素。

1)政治因素。政治因素主要包括了国际关系、国内政局、产权制度和法律环境等因素。

2)政策因素。对住宅建筑物价格具有影响的主要政策因素有区域发展政策、住房政策、土地开发政策、信贷资产、货币政策、限购政策和税收政策等。

3)经济因素。经济因素包括了经济发展状况、经济结构、居民收入、城市化水平、消费者结构等。

4)社会因素。社会因素包括人口、教育、科技、文艺、道德、宗教、价值观念、风俗习惯、社会治安、媒体讯息等。

住宅房地产微观影响因素包括交易日期、交易情况、区域因素和个别因素等。

1)交易日期。交易日期因素主要体现了不同交易日期间住宅房地产价格的波动和房地产随时间升值的自身特性。

2)交易情况。交易情况因素考虑了关联交易情形、急于变现交易情形、特殊房产交易情形、交易方是否缺乏了解、相邻房地产的合并交易和交易税非正常负担等相关因素。

3)区域因素。区域因素包括了商服繁华度、交通便捷度、医疗卫生、文化教育、环境质量优劣、绿地覆盖率、基础设施完备度、公用设施完备度和规划限制等因素。

4)个别因素。个别因素包括了小区所处位置、临街状况、新旧程度、楼层、朝向、建筑结构、建筑质量、住宅房型布局、权利状况、装修水平、设备状况和物业管理等因素。

2.房地产价格因素的评估指标体系确定

由于在评估实务中,对于影响房地产价格的宏观因素多采用评估假设提前假定,此类宏观因素多不纳入房地产价格因素评估指标体系的考虑范围内。房地产价格因素评估指标应考虑到该项指标的实用性和可操作性,因此,在实际参考了房地产评估实务工作人员的意见后,最终将包括交易日期、交易情况、区域因素和个别因素在内的微观因素纳入房地产价格因素的评估指标体系。

3.评估指标体系量化方法

由于在影响房地产价格因素的评估指标体系中既有定性指标又有定量指标,因此考虑到各指标在整个评估体系中的可比性,应将定性指标进行量化处理。针对定性指标,往往通过等级打分法来进行区分,但由于不同指标在实际房地产价格评估过程中的影响程度不同,划分等级的个数也应该做到有针对性的详略。为了进一步细化和规范等级打分法的具体应用,提高影响因素的量化准确度,本文借鉴了辽宁众华资产评估机构等在房地产评估实务中的房产价格影响因素权重模型,如表1所示。并根据每种影响因素的不同权重,在询问评估实务人员的意见和参考了评估工作经验的基础上,最终确定了不同影响因素在等级打分法时对应的具体等级划分内容,如表2所示。

表1 房地产评估实务影响因素权重模型

4.市场法中评估指标体系的构建

所选取的23个因素指标当中,第1个为交易日期因素指标,第2个为交易情况因素指标,第3-11个为区域因素指标,第12-23为个别因素指标。汇总得到各项影响因素的量化标准如表3。

(三)市场法下神经网络评估模型设计

应用BP神经网络构建住宅房地产评估模型的基本思路是:房价与其影响因素之间的关系是未知的,无法给出一个具体的数学模型,各影响因素重要性的权重也无法提供,但是可以收集到一定数量的样本,并且能够合理量化这些样本的房价及其影响因素。应用神经网络模型,将住宅房产样本价格的各种影响因素作为输入,住宅房产样本的价格作为输出,通过样本学习,确定网络的结构和学习参数;神经网络结构确定了,并己知网络的层数、各层的神经元结点数以及各结点之间的连接权值,这样就建立了房价与其影响因素之间的非线性关系;测算房地产价格时,只要输入待测样本的价格影响因素量化值,就可输出该样本的价格。

表2 等级打分法各项影响因素等级划分标准

续表

四、基于神经网络的房地产评估实证分析

(一)样本选择及归一化

1.样本选择

以房地产市场上交易最活跃也最具代表性的普通住宅为研究对象,通过分析神经网络模型对于住宅型房地产价格的预测功能,来印证人工智能估价模型在房地产评估领域的适用性。

本文案例均为辽宁省大连市的真实房地产交易案例。选择案例时的考虑因素主要有以下4方面:交易日期以近期为主,主要选择2017年10月的案例;样本覆盖大连市所有行政区;样本是有区域代表性的住宅房地产;评估案例已进行实际成交。共筛选并选取出了50个样本,其中40个样本作为神经网络模型的测试样本,10个样本作为神经网络模型的检测样本。

2.构建样本数据集

根据表3中的影响因素量化标准,得到样本影响因素的量化结果。

3.样本归一化

通常情况下,神经网络的输入/输出数据应介于0到1之间,由于本文所构建的模型中并不满足这样的要求,因此需要对选取的样本数据进行归一化处理。归一化方法的形式多种多样,包括最大最小法,Z-Score法等,本文采用如下方法进行归一化的处理:

同样的,在MLP神经网络和RBF神经网络的训练和测试完成之后,需要对其输出结果进行反归一化处理,将预测输出的预测值由[O,1]之间转换为网络的实际输出值。本文采用的反归一化的处理方法如下:

(二)建立住宅价格评估模型

利用神经网络预测方法建立住宅价格评估模型,必须事先确定好网络输入层节点数、隐含层节点数、输出层节点数、

1.网络层数的确定

理论上已经证明,具有偏差和至少一个S型隐含层加上一个线性输出层的网络,能够逼近任何有理函数。增加网络层数可以降低误差,从而提高精度,但同时也会使神经网络复杂化,增加网络权值的训练时间。而实际上提高神经网络模型的精度,也可以通过增加隐含层中包含的神经元数目来获得,并且其训练效果比增加隐含层层数更便于观察及调整,因此在一般情况下,应当优先考虑单隐层网络结构。本文因此采用具有单隐层的三层网络。

2.网络输入层和输出层节点数的确定

BP网络的输入和输出层的节点数一般是由网络的用途和研究工作的实际情况来决定。输入层节点的多少与影响房住宅价格因素的个数相对应,本文选取并量化了23个影响住宅价格的因素,故输入节点数为23。因模型是用于预测住宅房地产价格,因此确定输出节点数为1。

3.隐含层节点数的确定

隐含层节点数选择是否合适是应用BP网络成功与失败的关键因素之一,如果层数太少,学习过程可能不收敛或不能达到网络误差的要求;如果层数过大,则增加网络结构的复杂性,使网络的学习速度变慢并难以收敛。目前,最佳隐含层节点数的选择尚无理论指导,但存在以下三个经验公式:

其中M表示隐含层节点数,N表示输入层节点数,L表示输出层节点数,表示1到10之间的一个常数。

根据上述三个经验公式,得到的此次神经网络应确定的隐含层个数为[4,15]之间的一个常数。并且,当隐含层个数为4-15之间的一个常数时,神经网络都可以在10,000次训练内收敛,经过对测试数据进行统计分析,不同隐含层个数对应的平均误差及相关系数如图3。

由图4可知,隐含层节点数的改变会引起平均误差和相关系数的改变,二者都隐含层节点数的增加呈现波浪式变化。综合来看,当隐含层节点数为8时,测试部分样本的平均误差最小,并且所有样本误差均在设定的最大误差范围之内,同时相关系数也较大,整体效果最好。所以最后确定网络的最佳隐含层节点数为8。

4.最大误差指标的确定

通过向辽宁省众华资产评估公司的考察,选取其房地产评估实务中可允许的最大10%的估价允许误差作为本次网络模型中的最大误差指标。

图3 不同隐含层节点数下的测试平均误差

图4 不同隐含层节点数下的测试相关系数

(三)训练神经网络模型

数据输入后,利用不同的神经网络学习算法,合理确定网络的隐含层层数和神经元节点数,并为各层网络选择合理的训练函数,对网络模型进行训练。计算各层神经元之间的权值、阈值。进而利用各层间的传递函数,逐层递进运算,从而得出最终的输出结果与网络模型。

样本训练时,如果训练次数已超过最大训练次数时,网络还没有训练成功,则进行回判检查,若发现某个样本误差很大,而其它样本的误差却远小于它,则应去掉该样本,继续学习,重复以上操作直到收敛。如果没有发现异常的样本,则调整网络结构及学习参数,重新训练网络,直到网络训练成功。

将选择的检测样本,测试已学习好的神经网络,得到样本检测误差,判断建立好的模型是否满足要求,如果不满足要求,应回到第一步,直到满足要求。

利用MATALAB对于神经网络模型进行训练,得到的训练样本部分的预测值与房地产实际成交价值的对比如图5所示。神经网络模型的训练精度相当高,相关系数为0.99982。因此,训练样本的预测拟合效果较为理想。

图5 训练部分BP神经网络预测结果示意图

并且,如图6所示,通过对于训练部分BP神经网络预测误差曲线的分析,可以看出神经网络预测模型的收敛速度非常快,只运行了4个epoch就达到了网络误差平方和期望的要求。因此,训练样本通过了误差检验,本次神经网络模型所选参数是合适的。

图6 训练部分BP神经网络预测误差曲线

五、测试结果分析及评价

建立好的模型需要对其准确性和可靠性进行验证,因此将测试样本集数据代人到上述建立好的模型中,并得出预测结果。利用以上建立的神经网络模型,所得出的检检测部分的住宅房地产评估预测值与实际成交价格对比分析图如图7所示。

由BP神经网络模型与房地产实际成交价值的对比图可以看出,BP神经网络模型对于房地产成交价值的预测功能较为强大,预测模型的相对误差和实际误差如表4所示:

通过对以上所建立的模型的预测结果进行对比分析,可以证实BP神经网络非常适用于房地产价格预测分析。此外,基于网络的结构特点,其网络的训练时间很短,运算效率很高,网络输出的房地产评估价格与实际价格比较接近,最大误差仅为4.51%,远远低于评估实务中设定的10%的最大误差标准。

图7 检测部分BP神经网络预测结果示意图

表4 BP神经网络模型预测误差分析表 单位:元

为了更加准确地分析BP神经网络的预测效果,本文选用了平均相对误差MAPE、最小误差平方和LSE、方差VAR、标准差SD、均值MEAN、最大值MAX和最小值MIN,分别从模型精确性、集中程度、偏离程度和相关性四个方面对BP模型预测结果进行评价。

BP神经网络模型下房地产评估价格预测的误差结果如表5:

表5 BP神经网络评价指标汇总

从模型的精确性角度来说,BP神经网络模型的MAPE(平均相对误差)比较小,小于设定的模型误差10%,说明模型的精确程度比较高,比较准确的预测出了房地产预期成交价,与实际成交价较接近。

从模型的集中程度来看,BP神经网络模型相对误差的极值区间和均值比较小,且均值小于本次模型设定误差,说明集中程度较好。

从模型的偏离程度来说,BP神经网络模型相对误差的方差和标准差都比较小,说明其偏离均值的程度不大,相对误差在一个较小的区间内变动,各相对误差间相差不大。

从模型的相关性角度来说,BP神经网络模型的LSE(最小误差平方和)比较小,说明模型的相关性比较高,较好地描绘出了房地产实际成交价格和各项影响因素之间的非线性关系。

因此,综合模型的精确性、模型集中程度、模型偏离程度和模型相关性四个角度,可以看出,BP神经网络适合作为房地产评估中价格预测的工具。

在人工智能不断发展的今天,传统资产评估逐渐暴露出一系列的缺陷与问题,不断产生的新的评估需求要求评估人员采用新型的评估手段,搭建智能化的评估模型。本文在研究房地产价值影响因素和房地产成交价的基础上,通过探讨BP神经网络模型在房地产评估中对于价格预测的功能,揭示了影响因素和最终成交价之间的内在非线性映射关系,同时通过实证研究验证了BP模型具有较高的预测精度和效度,并从模型的精确性、模型集中程度、模型偏离程度和模型相关性四个角度对BP模型进行了分析评价,从而试图为人工智能时代下房地产评估预测提供了一种新的思路和方法。

猜你喜欢
神经网络误差样本
用样本估计总体复习点拨
角接触球轴承接触角误差控制
Beidou, le système de navigation par satellite compatible et interopérable
神经网络抑制无线通信干扰探究
压力容器制造误差探究
基于神经网络的中小学生情感分析
随机微分方程的样本Lyapunov二次型估计
基于神经网络的拉矫机控制模型建立
九十亿分之一的“生死”误差
村企共赢的样本