基于GA-SVM的主要影响角正切求取方法研究

2016-12-27 08:04
黑龙江工程学院学报 2016年6期
关键词:遗传算法向量样本

严 超

(河南理工大学 测绘与国土信息工程学院,河南 焦作 454000)

基于GA-SVM的主要影响角正切求取方法研究

严 超

(河南理工大学 测绘与国土信息工程学院,河南 焦作 454000)

当采取概率积分法进行开采沉陷预计时,主要影响角正切是重要的预计参数之一,它对确定采空区上方地表变形的影响范围具有重要意义。在综合分析主要影响角正切及其5个主要影响因素的基础上,利用遗传算法(GA)和支持向量机(SVM)建立了求取主要影响角正切的GA-SVM模型。运用遗传算法(GA)自动获取建立模型的3个参数,利用筛选出的国内典型地表移动观测数据对模型进行训练和测试,并将预测值与实际值进行对比。结果表明,运用GA-SVM模型求取的主要影响角正切最小相对误差为0.29%,最大相对误差为3.08%,求取速度快,能够满足实际工程的精度要求,且模型的泛化能力较强,具有一定的实用价值。

遗传算法;支持向量机;主要影响角正切;开采沉陷

矿山开采沉陷学研究的核心内容之一是对开采引起的地表移动和变形进行准确的预计,主要影响角正切是表征地表移动规律的重要参数之一。目前常用的求取主要影响角正切的方法是根据大量的地表移动观测站的实测数据进行反演,虽然也获得了较为可靠的结果,但是耗费的资源较大,文献[1-2]分别运用单一的神经网络和支持向量机对主要影响角正切的问题进行了研究,文献[3]运用灰色理论优化的BP神经网络对求取主要影响角正切的速度和精度有了一定的提高,因此,准确确定主要影响角正切对开采沉陷预计具有重要的现实意义。

支持向量机(Support Vector Machines,SVM)[4]在解决小样本、非线性和高维数等实际问题时表现出很多优势。遗传算法(GA)[5]具有简单通用、随机搜索、全局搜索和鲁棒性强等特点。本文运用GA优化的SVM建立主要影响角正切与其影响因素之间的非线性回归关系,并用收集的样本进行训练和测试,从而获得较为精确的主要影响角正切值。

1 SVM基本原理[4,6]

SVM方法是Vapnik等人根据统计学习理论提出的一种新的机器学习方法,它根据结构风险最小化原理,通过适当地选择函数子集及该子集中的判别函数,从而构造一个目标函数将两类模式尽可能地区分开来。

对于一个给定的训练数据集

(1)

选取适当的从空间Rn到H空间的变换Φ:x=Φ(x),适当的精度ε>0,即不敏感损失函数,合适的惩罚系数C>0,其作用是用来平衡最大分类边界和最小分类误差。SVM将回归分析问题转化为以下优化问题:

(2)

ε.

(3)

(4)

构造决策函数

(5)

引入核函数[7]替换上述对偶问题中的向量内积,即K(xi,x)=Φ(xi)·Φ(x),得到最终的决策函数

(6)

2 GA原理

遗传算法[5]是Holland等人于1975年提出的模拟生物在优胜劣汰、适者生存的自然环境下,遗传和进化过程中逐渐形成的一种不仅具有自适应能力而且能够全局性搜索最优解的算法。它和传统的搜索方法不同,它并不是基于多次统计和单一的评估函数的梯度获得一个确定性的序列解,而是通过搜索全局来获得最优解。

GA对SVM参数寻优过程如下[1]:

首先,初始化SVM参数,对初始值进行编码,随机产生遗传算法的初始种群,将初始种群结合SVM进行选择和交叉操作,得到适应度值,如果该适应度值不满足GA结束的条件继续返回进行选择和交叉操作,如果满足结束条件,则通过SVM的初始模型即可寻得最优的参数,最后,用获取的最优参数返回到SVM中建立GA-SVM模型用于待求问题的求解。

3 GA-SVM模型

3.1 主要影响角正切影响因素

能够影响主要影响角正切的因素是多方面的,因此,选取合理有效的影响因素是主要影响角正切预计是否准确的关键。根据文献[2-3,11],影响主要影响角正切的因素有:①覆岩的岩性影响系数D:在同等条件下,岩性影响系数越大,岩性越软,主要影响角正切越小,影响范围越大;反之,岩性影响系数越小,岩性越坚硬,主要影响角正切越大,影响范围越小。②开采厚度M:在同等条件下,当开采厚度较小时,主要影响角正切随开采厚度的增大而增大;当开采厚度较大时,主要影响角正切随开采厚度的增大有一定的减小趋势。③开采深度H:一般情况下,主要影响角正切随开采深度的增大而缓慢增大。④工作面斜长L:在采深及采厚一定的情况下,工作面斜长增大会导致地表采动程度系数增大,进而导致主要影响角正切增大;当达到充分采动后,主要影响角正切趋于稳定。⑤煤层倾角α:大量资料研究表明,主要影响角正切随煤层倾角α的增大而减小,但是变化幅度不明显。因此,求取的过程就是要建立上述5个影响因素与主要影响角正切之间的非线性关系。

3.2 数据来源

选择合适的样本数据,在一定程度上能够提高模型的预测能力。根据文献[3,12-13],筛选出31个典型的地表移动观测实例数据作为模型的训练和测试样本,将其中的1~28作为训练样本,29~31作为测试样本。试验数据如表1所示。

表1 训练和测试样本

3.3 实验参数的选择

为提高算法的精度及有效性,增强模型的泛化能力,首先运用GA对模型的惩罚系数C、不敏感损失函数ε和核函数r进行参数寻优,GA-SVM模型经过200次进化计算得到了一个最佳适应度的稳定迭代值,如图1所示。

图1 GA-SVM进化曲线

最终得到最优的结果为C=2.573 5,ε=0.045 9,r=0.024 8,此时训练集的最小均方差为0.135 19,经过试验和验证此时支持向量的总数为28个。最后将以上3个最优参数返回到SVM中建立GA-SVM模型。用该模型对训练结果进行预计,结果如表2所示。

3.4 模型的测试

将表1中的29~31三组测试数据对所建立的模型进行测试,测试结果如表3所示。由表3可知,主要影响角正切tanβ的预测值与实际值的最大绝对误差为0.046 2,最大相对误差为3.08%,其精度能够满足工程现场的实际精度要求。

表2 训练结果

表3 模型测试结果

4 结 论

1)将遗传算法(GA)与支持向量机(SVM)有效结合,建立了求取主要影响角正切的GA-SVM模型。在综合分析了主要影响角正切的5个影响因素的基础上,通过收集的典型观测数据对模型进行训练和测试,测试结果为模型预测值的最大相对误差为3.08%,证明采用GA-SVM模型求取主要影响角正切的方法可行,且具有一定的实用价值。

2)通过遗传算法(GA)自动寻取最优参数能够避免和克服单一支持向量机模型参数选取的困难,能够快速准确地获取模型参数,而且不需要人为参与,提高了模型的应用效果。

3)由试验可知,模型的预测精度在一定程度上与选取的训练样本有着密切的关系,目前试验样本的选择都是人工筛选并测试,功过效率较低,筛选的样本数据不理想会导致模型建立失败,因此,试验在样本数据的选取上还存在一定的局限性。

[1] 刘希亮,赵学胜,陆锋,等. 基于GA-SVM的露天矿抛掷爆破抛掷率预测[J]. 煤炭学报,2012,37(12):1999-2005.

[2] 高彦涛,谭志祥,邓喀中. 基于神经网络的主要影响角正切值求取方法[J]. 煤矿安全,2007(4):30-33.

[3] 魏好,邓喀中,卢正,等. 基于支持向量机的主要影响角正切求取方法研究[J]. 金属矿山,2010(5):120-123.

[4] 陈冰梅,樊晓平,周志明,等.支持向量机原理及展望[J]. 制造业自动化,2010,32(12):136-138.

[5] 边霞,米良.遗传算法理论及其应用研究进展[J]. 计算机应用研究,2010,27(7):2425-2429.

[6] 邓乃扬,田英杰.支持向量机:理论、算法与拓展[M].北京:科学出版社,2009.

[7] 高雷阜,张秀丽,佟盼. GA_SJ在SVM核参数优化中的应用[J]. 计算机工程与应用,2015,51(4):110-114.

[8] 吴明圣. 径向基神经网络和支持向量机的参数优化方法研究及应用[D].长沙:中南大学,2007.

[9] 宋小杉,蒋晓瑜,罗建华,等. 基于类间距的径向基函数-支持向量机核参数评价方法分析[J]. 兵工学报,2012,33(2):203-208.

[10] 冯守良. 基于RBF网络曲线拟合的研究[J]. 黑龙江工程学院学报,2015,29(1):23-26.

[11] 吴朝阳,李宁. AGO-BP神经网络在主要影响角正切求取中的应用[J]. 煤矿安全,2012,43(3):117-120.

[12] 国家煤炭工业局. 建筑物、水体、铁路及主要井巷煤柱留设与压煤开采规程[M].北京:煤炭工业出版社,2000.

[13] 赵保成,谭志祥,邓喀中. 利用随机森林回归模型计算主要影响角正切[J]. 金属矿山,2016(3):172-175.

[责任编辑:刘文霞]

Research on calculation method of tangent of majorinfluence angle base on GA-SVM

YAN Chao

(School of Surveying and Land Information Engineering,Henan Polytechnic University,Jiaozuo 454000,China)

When the probability integral method for mining subsidence expected is used,the tangent of majorinfluence angle is one of the most important parameters,which is of great significance to determine the influence range of surface deformation above mined out area.This paper, based on the comprehensive analysis of tangent of majorinfluence angle and its five main influence factors,uses GA and SVM to set up a model of GA-SVM to calculate the angent of majorinfluence angle.With GA to obtain the three parameters of model automatically,this paper tests the model by using the typical domestic surface movement observation data,and comparing the prognostic value with actual value.The results show that:the minimum relative error of tangent of majorinfluence angle by using GA-SVM model is 0.29%,the maximum relative error is 3.08%,and the calculating speed is fast,which can meet the accuracy requirements of the actual project. This model has a strong generalization ability and some practical value.

GA;SVM;tangent of majorinfluence angle;mining subsidence

10.19352/j.cnki.issn1671-4679.2016.06.004

2016-07-21

河南省高等学校科技创新团队(131RTSTHN029)

严 超(1990-),男,硕士研究生,研究方向:矿区开采沉陷与土地复垦.

TP18;TD325

A

1671-4679(2016)06-0016-04

猜你喜欢
遗传算法向量样本
向量的分解
用样本估计总体复习点拨
聚焦“向量与三角”创新题
推动医改的“直销样本”
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
随机微分方程的样本Lyapunov二次型估计
向量垂直在解析几何中的应用
软件发布规划的遗传算法实现与解释
村企共赢的样本