神经网络下的空气质量预测

2016-10-14 05:47方成
科学与财富 2016年28期
关键词:聚类

方成

摘 要:社会经济的增长促进社会工业化进度和人口城市化的加快,也由此带来越来越多的环境问题,其中一大气污染问题较为严峻。我国济南市环保检测站在针对大气环境污染的防治方面,成立专项的城市空气质量自动检测系统,以便通过大量的监测数据分析研究城市空气质量的变化。鉴于传统的预测方式对精准历史数据分析的诸多局限,人工神经网络的空气质量监测,借助神经网络的容噪能力和非线性处理能力对空气质量进行预测,是当前环境管理部门获取全面、精准、及时环境信息的有效途径。

关键词:BP神经网路;资源分配网络;聚类;空气质量预测

城市人口激增、交通能源开发利用,以及大型建筑的兴起,产生的氮氧化合物、颗粒物、二氧化硫等大气污染物给自然环境和资源带去严峻挑战。完善的城市环境空气质量监测系统,能够将整个城市的空气质量检测数据及具体的污染指数和重点污染物等,直接传达至环境监测中心操控室的数据库。神经网络下的空气质量预测,是现代神经科学运用到空气质量监测的重要成果。

1.神经网络和数据标准的概述

一定意义上,神经网络能够模拟神经系统的信息处理和检索、储存功能,使大量神经元组建的非线性系统,且具备一定的学习、计算和记忆能力。神经网络的显著特征是有大量简单的神经元构成、无需建立精准的数学模型、强大的非线性映射能力、便于实现并行计算且容易传输有效的知识和信息。神经网的结构,以神经元作为连接节点,并在节点之间有向连接为边组成的整幅图。结构的连接方式相对多样化,总的来说分为分层型和互联型两种。其中分层型神经网络将全部的神经元按照功能划分为输入层、中间层和输出层,每一层按照顺序性分别相连。

神经网络的误差反向传播,是实现任意非线性输入和输出的映射。反向传播学习算法,及BP学习算法的训练则主要利用样本的输入和输出来实现,使得网络形成输入和输出间的映射函数关系。当前存在的缺憾在于网络系统对BP初始值敏感度很强,导致收敛速度差异过大;BP学习算法常在误差阶梯曲面的平坦区域停滞,导致收敛缓慢直至出现不再收敛;算法过程中训练网络极易陷入局部极小点;网络隐含层节点数量的选取方面没能统一指导;学习速度规则性不明确且训练过程容易引发动荡等。

数据的标准化研究中,为防止神经元的过分饱和,减少因数据量纲不同引发的影响,规定输入神经网络的训练数据样本要全部进行归一化处理。将所有的输入数据归一到零至一的区间范围内,而后面要进行网络训练输出的结果则必要采取相反的方式处理。

2.样本自组织聚类的BP神经网络空气质量预测

在预测领域,BP神经网络的非线性逼近能力得到广泛应用。鉴于实际应用中,样本数据的产生存在诸多变性和不确定因素,导致样本数据的累加和网络的多次反复计算,造成不必要的精力和时间浪费。将自组织竞争网络和BP网络进行有机结合,通过自组织的竞争网络来寻找样本内部本质规律和属性,进而进行有规则的聚类。样本数值的预测输入,根据自组织模型的竞争网络来判别属性,可尽可能地减少网络运行的时间并有效提升预测的精确度。空气质量的变化在一天之内产生的规律,可经过神经网络预测模型进行预测。自组织竞争神经网络作为一类既有竞争机制的前馈网络,能够进行自主性学习,并自主寻找数据样本的本质规律和特性,通过改变网络参数及其组织结构,实现聚类的目标。

BP网络算法的训练理论必须具备严谨、高精、通用且可靠的特点,所以改进后的训练算法用误差精度偏高且收敛速度较快的增加运量项和自适应调节学习速率相融合,提升BP神经网络的算法性能。

聚类自组织竞争网络,构建样本自组织聚类的BP神经网络模型结构(如下图)。模型的竞争网络对训练样本自组织聚类,完成数据样本的分类,并运用分类后的样本数据进行BP网络训练。输入的样本数据训练网络不同,然而输入值、隐层和输出层的神经元数量却是相对固定,且样本数据结构较为一致,导致最终的网络训练权值和阈值略有差距。BP神经网络模型的建立,一般经历初步确立自组织竞争网络和网络结构、自组织竞争网络聚类所有的训练样本、衡量聚类结果进行自适应学习速率的调整和BP训练、标注训练样本调整网络的误差权值并结束网络训练输出最终预测结论几个基本步骤。

3.隐节点剪枝的RAN空气质量预测

城市空气质量预测中多元化的非线性因素极易影响预测结果,因此需要构建一种具备在线学习能力的空气质量预测模型,来应对多样、突变的空气变化、污染变化和指数变动。RBF神经网络在预测空气质量方面,因其具备的学习速成、拟合高精、结构简单且泛化力强等多项优点被广泛运用到时间序列、分类和函数的预测领域。神经网络的建立过程,预测对象时时处在变动之中,简单的收集输入输出数据将无法精准捕获信息对象的非线性特征。另外,样本数据的不完整,使得离线学习方式下搭建的神经网络远远不能满足现实需要。在保证不危害使用性能的情况下,为实现算法训练网络能够满足实际运用并拥有泛化能力,神经网络模型的结果复杂度必然要降低。构建基于隐节点的剪枝RAN空气质量预测模型,将在一定意义上完善算法的缺失并保证结果精准。

作为资源分配网络的主旨思想,神经网络的学习中模型样本未建立之时,应当依据新性条件来分配节点计算。剪枝方法中很重要的一种手段是依据节点的相关性进行剪枝。一旦隐节点的输出小于所有样本的标准差,节点输出数据可当做常数,进而将其并入到输出层的阈值范围;而两个隐节点的输出与所有样本相关时,可将其进行有规则的合并使其成为一个节点;样本数据的常数调节致使隐节点距离工作区域严重偏离时,样本数据不具备激活隐节点的能力,可以直接删除。基于隐节点剪枝建立的RAN空气质量预测模型,在改良传统学习算法后,增加了隐节点合并性能的关联度。通过网络模型的检测,观察预测数值远远精准过聚类RBF网络或其他传统RAN的预测能力。因此,神经网络在空气质量预测方面的应用明显优于传统的预报方式。值得注意的是,神经网络技术下的空气质量预测涉及的信息量过广,网络设计、样本选择、建模方法以及信息获取方式等都存在很大的进步空间。因此,建立并完善更加全面、及时、高精、合理的神经网络空气质量预测模型仍需不断努力。

参考文献

[1]李翔. 基于GAB和模糊BP神经网络的空气质量预测[J]. 华中科技大学学报(自然科学版),2013,S1:63-65+69.

[2]汪小寒,张燕平,赵姝,张铃. 基于动态粒度小波神经网络的空气质量预测[J]. 计算机工程与应用,2013,06:221-224.

[3]孟栋,樊重俊,李旭东,卜宾宾. 混沌遗传神经网络在空气质量预测中的应用[J]. 安全与环境学报,2014,04:246-250.

猜你喜欢
聚类
基于K-means聚类的车-地无线通信场强研究
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
条纹颜色分离与聚类
基于Spark平台的K-means聚类算法改进及并行化实现
局部子空间聚类
基于最小圆覆盖的海上突发事件空间聚类研究
基于改进的遗传算法的模糊聚类算法
一种层次初始的聚类个数自适应的聚类方法研究
基于熵权和有序聚类的房地产周期分析