基于混沌粒子群的AWLSSVM 瓦斯预测研究

2020-08-21 08:02孙振明侯运炳毛善君牛永寿
煤矿安全 2020年8期
关键词:权值测点瓦斯

李 栋,孙振明,李 梅,侯运炳,毛善君,牛永寿

(1.中国矿业大学(北京)能源与矿业学院,北京100083;2.北京大学 遥感与地理信息系统研究所,北京100871;3.陕西旬邑青岗坪矿业有限公司,陕西 旬邑711300)

瓦斯防治是煤矿安全工作的重中之重,建国以来发生的24 起一次死亡百人以上的事故中,瓦斯事故19 起占总数的79%[1]。因此,对瓦斯的精准预测对煤矿管理部门来说具有重要意义。瓦斯浓度预测的模型主要包括神经网络[2-4]、灰色理论[5-6]、时间序列分析[7-9]和支持向量机[10-11]等。以上预测方法各有优缺点,或算法理论性不足,或泛化能力差,或只考虑了单一的瓦斯浓度时间序列。支持向量机对样本量要求少且有较强的非线性学习能力。最小二乘支持向量机(LSSVM)是支持向量机的延伸,但是其鲁棒性较差。加权最小二乘支持向量机(WLSSVM)在计算权值时易产生误判。综合考虑了目标测点的各类影响因素,基于离散点的分布特征,提出了一种自适应加权最小二乘支持向量机(AWLSSVM)。AWLSSVM 的预测效果依赖于超参数的选取。粒子群算法(PSO)的参数较少,寻优过程简洁清楚,但初期迭代收敛速度慢,后期迭代容易陷入局部最优。混沌粒子群算法(CPSO)在粒子群每次迭代中都对每个粒子进行混沌映射,迭代初期加大了全局搜索,但是后期不利于种群精细化搜索全局最优解。自适应混沌粒子群算法[12](ACPSO)只对每次迭代后部分适应度值表现较好的粒子进行混沌映射,而惯性权重的更新是随迭代次数而减小的,迭代初期很可能因为速度较大错过最优粒子。基于此,提出了一种改进混沌粒子群的多变量AWLSSVM 瓦斯预测模型,且实现了瓦斯浓度的多步预测,对矿井安全生产具有重要的指导意义。

1 混沌粒子群算法

粒子群算法的基本思想是通过个体之间的相互协作和信息共享来寻找全局最优解,粒子速度和位置更新公式如下:

式中:vi、vi+1为第i 个粒子在t、t+1 时刻的速度;ω 为惯性因子;c1、c2为学习因子;rand1、rand2为(0,1)之间的随机数;xi、xi+1为第i 个粒子在t、t+1时刻的位置;pbesti为第i 个粒子在每次迭代后的最佳位置;gbesti为种群在迭代后最优位置。

首先混沌初始化种群的位置和速度,提高了种群的多样性和粒子搜索的遍历性。混沌映射采用一维混沌映射Logistic 映射,公式如下:

式中:zi为第i 次迭代的混沌序列,初始值z0为(0,1)间的随机数,z0不取0.25,0.5,0.75(保证系统完全处于混沌状态);n 为迭代次数;μ 为控制参数(通常取4,保证迭代生成的值是一种伪随机分布的状态)。

混沌变量xi映射到混沌序列zi公式为:

通过载波函数可生成混沌变量xi:

式中:xmax、xmin为初始化设置的上限、下限。

将表现较差的粒子重新设定在较优粒子的区间内且对表现较优的粒子速度权值按照适应值的大小式(6)进行更新,在保证全局搜索能力的条件下,又能提高种群的精细化搜索,避免陷入局部最优,进而提高算法的收敛速度。

式中:ωmin、ωmax为惯性权重ω 的最小值和最大值;fav为当前种群适应度的平均值;fmin为种群的适应度值的最小值;fi为粒子i 的适应度值。

2 多变量相空间重构

瓦斯浓度的影响因素众多,且各因素之间呈现复杂的非线性特征,为了有效地利用多种影响因素,可以利用相空间重构的思想,充分挖掘非线性动力系统的特征。

单变量时间序列[x1,x2,…,xn],重构后的相空间为:

式中:m 为嵌入维度;τ 为延迟时间;Vi为m 维相空间中的相点;M 为相点个数。

多变量相空间重构是对每个变量分别进行单变量重构,将重构的相空间组合成1 个空间。采用互信息法确定延迟时间τ,假近邻法确定嵌入维数m,得到重构后的相空间和原动力系统是微分同胚的。

3 自适应加权最小二乘支持向量机

3.1 加权最小二乘支持向量机

Suykens 等[11]在LSSVM 算法的基础上提出了加权最小二乘支持向量机算法(WLSSVM),其优化问题的Lagrange 函数L(w,b,ξ,α)可描述为:

式中:w 为权系数向量;φ(xi)为输入到高维空间的映射;C 为正则化参数;b 为阈值;αi(i=1,2,…,N)为对应于xi的拉格朗日乘子;ξ 为误差序列。

根据KKT(Karush-Khun-Tucker)条件,消去w,ξi,可得:

式(9) 可求得b 和α,输入测试样本得到WLSSVM 模型形式如下:

WLSSVM 权值计算公式如下:

式中:s1、s2的取值分别为2.5、3.0;sˆ为误差序列的标准估计差。

式中:IQR 为误差ξi序列从小到大排列,第三四分位与第一四分位数值的差。

3.2 自适应加权最小二乘支持向量机权值计算

式(11)所计算的权值是线性分布的,计算结果会导致误判。从离散点的分布特征出发自适应的计算权值,首先将离散点分成2 类:①高杠杆点,这些点远离输入数据中心;②高残差点,这些点的预测值与实际值相差较大。加权方法可以将离散点的不利影响降到最低。

第i 个样本数据的残差权值vξ

i 定义如下:

式中:T 为残差的鲁棒尺度估计值。

T 定义如下:

式中:‖·‖为欧氏距离;median 为中位值;xi为第i 个样本数据;c 为常数(通常取4);x 为所有输入样本。

综合考虑上述2 种权值,则第i 个样本数据的权值vi定义如下:

4 混沌粒子群优化的AWLSSVM 瓦斯预测模型

混沌粒子群优化的AWLSSVM 瓦斯浓度预测步骤如下:

Step1:初始化粒子群算法的参数,混沌初始化种群的位置、速度。

Step2:由LSSVM 回归方程式(17)确定每个样本的拟合残差ξ,利用式(11)、式(12)计算初始化权值v,代入式(9)、式(10)得到WLSSVM 模型:

式中:E 为N×N 单位阵。

Step3:重新计算每个样本数据的残差ξ,利用式(13)~式(16)重新计算权值v。

Step4:根据权值v 代入到式(9)、式(10)建立AWLSSVM 模型。

Step5:将3 折交叉验证集的平均绝对误差(MAE)做为粒子的适应度值,确定个体最优位置pbesti和全局最优位置gbesti。

式中:yˆi为预测值;yi为真实值。

Step6:将性能较好的m 个粒子进行混沌优化,剩下的粒子随机初始化到表现较好的粒子空间内,从而获得新的种群。

Step7:检查是否达到最大迭代次数或者全局最优适应度值的变化量是否小于设定的阈值,若是,则终止,否则转到Step2,进行下一次迭代。

5 实例分析

5.1 数据处理

数据来自陕西某矿综采工作面监控监测系统上隅角瓦斯浓度(A02 测点)、工作面10 m 瓦斯浓度(A01 测点)、风速(A09 测点)、粉尘含量(A11 测点)、回风15 m 温度(A07 测点)、回风15 m 瓦斯浓(A08 测点)。样本采集时间为2019-05-26T12:19 到2019-05-31T17:19,原始数据采样间隔为1 min,数据分布具有明显的锯齿状特点,因此采用5 min 做为采样间隔,获得1 500 组样本,选取前1 400 组样本进行模型训练,剩余样本进行模型测试。监控监测数据样本集见表1。

表1 监控监测数据样本集Table 1 Monitoring data sample set

由表1 可知,各类数据的量纲不同,因此采用极差化处理方法,对样本进行归一化处理,归一化区间为[0,1]。

搜集到的数据包含3 个监测点的瓦斯浓度数据,瓦斯浓度数据分布如图1。考虑到A08 测点瓦斯浓度监测值较高,因此以A08 测点为目标预测测点构建瓦斯浓度预测模型,更具有现实意义。

由于现场监测环境复杂、传感器故障等问题,导致采集的数据中含有噪点,首先采用移动平均法对A08 测点数据进行降噪处理,降躁后数据如图2。

采 用SPSS 软 件 对A02、A01、A09、A11、A07、A08 监测点进行了皮尔逊相关性分析。为保证实验结果的可靠性,应尽可能选取更多数据进行实验,实验数据采用原始采样间隔的17 820 个点,各影响因素相关性分析结果见表2。

图1 瓦斯浓度数据分布Fig.1 Gas concentration data distribution

图2 降躁后数据Fig.2 Data after reducing noise

表2 各影响因素相关性分析结果Table 2 Correlation analysis results of various influencing factors

由 表2 可 知,A01 和A08 是 高 度 相 关,A02、A09、A07 和A08 是中度相关,A11 和A08 是低度相关。因此,选择瓦斯、风速、温度、粉尘做为多变量预测模型的输入参数是合理的。对A08 求时间延迟和嵌入维数,互信息法求时间延迟如图3,假近邻法求嵌入维数如图4。经过多次实验模拟,对各类监测点数据均采用嵌入维数为4,时间延迟为6,进行多变量相空间重构。

5.2 实验结果

原始用于训练的1 400 组数据相空间重构后为1 382 组样本,作为AWLSSVM 模型的输入,对第1 401 个到第1 470 个瓦斯浓度进行预测。混沌粒子群算法的初始参数设置如下:种群数量50(其中进行混沌变换的粒子数为30),迭代次数100,学习因子c1=c2=1.494 45,惯性权重ωmin=0.4,ωmax=0.9,正则化参数C 的取值范围为[0.1,1 000],核函数参数σ2的取值范围为[0.01,1 000],最优适应度变化量阈值设置为10-7。

图3 互信息法求时间延迟Fig.3 Mutual information method for time delay

图4 假近邻法求嵌入维数Fig.4 Calculating the embedding dimension using the fake neighbor method

仅考虑A08 相空间重构后的样本做为模型的输入端进行单变量瓦斯浓度预测。分别采用PSO、CPSO、ACPSO 和改进的混沌粒子群算法优化单变量AWLSSVM,适应度值变化曲线如图5。

图5 适应度值变化曲线Fig.5 Change curves of fitness value

由图5 可知,提出的混沌粒子群算法相对于PSO、CPSO、ACPSO 具有较快的收敛速度,4 种算法的粒子群分布如图6,由粒子群的分布密度可知,提出的混沌粒子群算法相对于PSO、CPSO、ACPSO 具有较好的全局搜索能力。

图6 4 种算法的粒子群分布Fig.6 Particle swarm distribution of four algorithms

考虑到优化模型超参数的过程中,样本量大、多变量预测中样本维数较大,且混沌粒子群算法采用了3 折交叉验证计算粒子的适应度值,迭代过程需要多次计算式(9),导致计算代价过大。对于每一组粒子进行训练时,均随机打乱样本集且随机抽取300 个样本进行模型的训练,实验所用电脑配置为i9 处理器,32 GB 运行内存,寻优过程可从73 min 21 s 降低到了2 min 33 s,即缩小了粒子群算法的迭代时间,同时也保证模型学习到了所有的样本集,使得本文的预测结果更具有现实意义。

混沌粒子群算法优化的LSSVM、WLSSVM、AWLSSVM 模型单变量预测结果对比如图7。

综合A02、A01、A09、A11、A07、A08 相空间重构后的样本作为模型的输入端进行多变量AWLSSVM瓦斯浓度预测。单变量AWLSSVM 与多变量AWLSSVM 预测结果、预测误差分别如图8、图9。

采用MAE 作为评价模型预测精度的指标,不同时间步内单变量预测和多变量预测对应的LSSVM、WLSSVM、AWLSSVM 的预测精度见表3。

图7 单变量预测结果对比Fig.7 Comparison of univariate prediction results

图8 单变量AWLSSVM 与多变量AWLSSVM 预测结果Fig.8 Prediction results of univariate AWLSSVM and multivariate AWLSSVM

图9 单变量AWLSSVM 与多变量AWLSSVM 预测误差Fig.9 Prediction error between univariate AWLSSVM and multivariate AWLSSVM

由表3 可知,AWLSSVM 单变量预测精度相对于LSSVM、WLSSVM 分别提高了5.3%和6.7%;多变量AWLSSVM 相对于单变量AWLSSVM 五步预测精度 分 别 提 高 了39.3% 、49.6% 、55.9% 、59.7% 和62.5%。多变量预测精度明显优于单变量预测,且实现了瓦斯浓度的多步预测。

6 结 论

1)提出了1 种基于混沌粒子群优化的多变量AWLSSVM 瓦斯浓度预测模型,可利用监控监测数据进行瓦斯浓度时间序列预测。

表3 不同模型预测精度对比Table 3 Comparison of prediction accuracy of different models

2)提出了1 种新的混沌粒子群算法,其收敛速度和全局搜索能力均优于PSO、CPSO、ACPSO。

3)根据离散点的分布特征,自适应的计算权值,建立了AWLSSVM 模型。AWLSSVM 模型的预测精度均高于LSSVM、WLSSVM 模型。

4)综合考虑了目标测点的相关影响因素,确定了相邻点瓦斯、温度、风速、粉尘做为影响因素指标。应用到陕西某矿回风15 m 瓦斯浓度预测中。结果表明,多变量预测结果明显高于单变量预测结果且实现了瓦斯浓度的多步预测。所提算法具有较高的预测精度和较好的泛化能力,可为瓦斯的防治提供理论依据。

猜你喜欢
权值测点瓦斯
一种融合时间权值和用户行为序列的电影推荐模型
逐级降压解吸过程中解吸瓦斯膨胀能变化特性
基于CATIA的汽车测点批量开发的研究与应用
基于5G MR实现Massive MIMO权值智能寻优的技术方案研究
基于小波包位移能量曲率差的隧道衬砌损伤识别
矿井瓦斯涌出量预测
广州市老城区夏季室外园林空间人体舒适度评价①
一种基于互连测试的综合优化算法∗
室外风环境实测及PHOENICS 模拟对比分析研究*
——以徐州高层小区为例
11采区永久避难硐室控制瓦斯涌出、防止瓦斯积聚和煤层自燃措施