基于AdaBoost分类器的电煤价格预测

2024-04-10 05:53牟晓霞
中国储运 2024年3期
关键词:电煤决策树分类器

文/牟晓霞

为适应我国能源结构和市场需求变化,提供决策参考,预测电煤价格至关重要。本文从煤炭供给、消耗、行业发展、新能源、气温等方面收集了200个影响因素,建立基于AdaBoost分类器的随机森林和决策树模型对全国及山西地区的未来1、2、3用电煤价格进行预测。结果显示,预测模型效果优于随机森林、极端随机树、线性回归和决策树模型,预测结果可为煤炭消耗型企业购煤决策提供参考。

1.引言

近年来,随着国家能源结构调整、供给侧改革的深入推进,煤炭消费量有所下降,但我国“富煤、贫油、少气”的国情和所处的发展阶段并未改变,煤炭在我国能源消费中仍占主导地位。在维护能源安全和托底保供方面,煤炭仍发挥着“压舱石”的作用。预测电煤价格有助于理解突发事件对价格的影响机理,为煤炭企业决策提供参考。

2.研究方法与数据处理

本文综合考虑了200个影响电煤价格的因素指标,确定影响因素指标包括:各地区和各行业煤炭产量、用电量、发电量、生铁产量、水泥产量和气温,煤产品进口量,电厂供、耗、存。本文数据源于Wind数据库,选取全国以及山西地区的电煤市场价,以2013年10月至2022年1月为时间窗口,进行预测和分析。利用Excel对原始数据进行清理,综合分析皮尔逊系数结果、格兰杰因果检验结果和特征重要性三个结果,剔除相关性和显著性较低的指标,完成变量的筛选。

3.煤价预测模型构建

本文采用Adaboost分类器,训练多个弱分类器,并将它们集成为一个更强的最终分类器,构建基于六种模型的预测模型,包括AdaRF(自适应随机森林)、Adatree(自适应树)、RF(随机森林)、ExtraTrees(极端随机树)、LR(线性回归)和Tree(决策树)。本文将交叉验证与网格搜索相结合,以MSE最小化为参数优选的目标,避免抽样随机性对模型性能的影响。

4.预测结果与模型评估

以全国和山西省的电煤价格为研究对象,对全国以及山西省的月度电煤价格和各影响因素的指标值进行收集。综合考虑全国及山西的六种预测方法的结果,得到全国及山西的未来三个月的电煤价格,全国1月后572.96元/吨,2月后573.52元/吨,3月后574.46元/吨,山西1月后486.87元/吨,2月后488.17元/吨,3月后489.55元/吨。当电煤消耗量平稳的状态下,当预测到电煤价格上升时,地区甚至国家应该增加短期内购买量,采购燃料补充库存。在电煤价格预测的指导下,保证每次的燃料采购价格最优,年度燃料采购价格最小,年度燃料库存及损耗成本能够得到有效地降低。为评价模型的预测性能,选择均方差(MSE)、平均绝对误差(MAE)作为预测评价指标。根据图2的全国电煤价格预测模型效果对比,Adatree的预测效果最佳,各项误差值均相对最小;AdaRF的预测效果次之,各项误差值的较小。由于收集数据的限制,山西电煤预测模型效果与全国的模型相比较差,但是预测稳定性达到较高水平。

图1 全国(左)和山西(右)预测模型误差

5.结论

本文建立AdaRF、Adatree、RF、ExtraTrees、LR、Tree六种模型,对全国和山西的1、2、3月后的煤价进行短期预测。通过实验对比各模型的预测误差,证明该方法能够根据各个影响因素的指标值对电煤价格进行有效预测,且预测准确率较高。本文对优化燃料采购,降低燃料库存及损耗成本提供参考。

猜你喜欢
电煤决策树分类器
4月份湖北省统调火电厂电煤消耗量同比下降22.6%
5月份湖北省统调电厂耗煤量同比下降14.3%
7月份湖北省统调电厂耗煤量同比增长58.1%
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
BP-GA光照分类器在车道线识别中的应用
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于决策树的出租车乘客出行目的识别
基于肺癌CT的决策树模型在肺癌诊断中的应用