基于混合模型及LSTM的锂电池SOH与剩余寿命预测

2021-03-19 06:13刘伟霞肖家勇
储能科学与技术 2021年2期
关键词:容量电池预测

刘伟霞,田 勋,肖家勇,常 伟,李 源,毛 樑

(1北京新能源汽车股份有限公司,北京100176;2上海觉云科技有限公司,上海200030)

随着电动汽车在中国的推广和车联网技术的应用,其保有量持续增加,电动汽车的行车数据根据国家标准(GB/T 32960)[1]进行实时采集。电池作为电动汽车的动力来源,随着充放电次数和行驶里程的增加,容量不断衰减。电池作为典型的动态非线性电化学系统,其退化状态识别和状态估计仍存在巨大挑战。因此亟需能够动态、自学习和优化的算法进行电池健康度(SOH,state of health)的精确估算。

SOH 估算是用来判断电池健康状况的一种方法,采用电池所能充入或放出电量与电池标称容量的百分比表示。对于新电池,其值一般大于100%,随着电池的使用以及老化,其值逐渐降低,依据IEEE 标准1188—1996[2]规定,当动力电池的容量能力下降到80%时,应更换电池。

1 传统SOH计算方法

获得SOH的传统方法大致包括:

(1)开路电压的IC 曲线:锂离子电池容量增量法即ICA(incremental capacity analysis)是研究锂离子电池衰减机理分析常用的方法,该方法可将平缓的电压平台转化为容量增量曲线中的峰值,使用Lorentz 函数拟合IC 峰以获得IC 峰的特征参数。如式(1)所示,其中Ai是第i个IC峰下方的面积,Wi是第i个IC峰的半峰宽,V0i是第i个IC峰的对称中心,V为动力电池的外部电压。通过转换为整数形式来简化,可得到式(2)中所示的电池充电模型,其中C为常数。

(2)安时积分法:通过每个充电段中的SOC(充电状态)变化计算每次充电中的充电容量,使用SOC 更改来标准化容量,以获得与SOH 每百分之一相对应的容量,乘以100即可得出当前时间计算出的总可用容量。

(3)卡尔曼滤波方法[3]:需先前样本的系统变量,以及当前样本的强制术语和观察值。

(4)大数据方法[4]:利用电池历史数据和实测数据,依靠大数据平台提供的海量分布式存储和并行计算功能,提取相关特征以实现SOH 在线估算并通过单体之间的差异进行校正。

上述方法仅能计算历史SOH 数据,而无法知悉当前状态。因此,文章实现了利用机器学习技术预测电池SOH 的方法。通过长期的数据收集,使用电池额定值信息和状态监视数据来挖掘隐藏的电池健康状态信息及其演变规则。文章建立了机器学习模型以实现实时预测,并在此基础上开发了应用LSTM网络的电池未来趋势预测模型。

2 数据处理

2.1 数据准备

文章的研究基于大量实车数据,采集跨度从2018年中至2020年初,持续收集数据时间跨度达500 天。该批数据直接来自两种车型共计600 辆,数据采集规则为每隔10 s 记录一次,共计收集约4.2亿个数据样本。

上述电动汽车电池的数据为电动汽车监控数据,监控数据包括正常使用状况下与电池相关的电池自身数据以及汽车状态数据,内含超过200个数据变量。数据形式均为基于时间序列的流式数据,包括与机器学习算法训练相关的电流、电压、温度、剩余电量(SOC)等,由以上实测数据获得SOH的处理步骤为:①根据总电压划分提取充电片段区间(划分稳定的电压、电流区间);②在区间内用电流和时间的积分获得区间内充入的容量(A·h);③对每辆车的每次充电片段重复①②步骤;④对每辆车的所有容量数据进行筛选(去除异常值);⑤采用滑动平均进行容量平滑;⑥定义初始容量为100%容量,后续容量除以初始容量得到SOH数值。

2.2 数据特征重要性

文章主要基于处理后的数据为研究对象,为确保高质量的数据、提高结果的准确性,因此需对收集的数据进行整理。数据排序必须首先清理数据,并制定相应的清理规则,以将低质量的数据转换为符合数据质量要求的数据,清理规则包括空余赋值、错值去除、交叉检验等。

由于在后续的处理步骤中需对数据进行处理和计算,为便于计算和识别数据的特征,首先需要对整理后的数据进行特征化以便于展现,从而便于计算和识别。由图1可知:重要性相对较高的两个特征为mile 和day,重要性相对较低的特征为over_in_charge。

图1 特征重要性对比Fig.1 Comparison of feature importance

2.3 容量至SOH的转换

容量转换如图2所示,对容量数据进行异常值剔除,整体过程如下:①获得原始数据点;②采用箱线图的方法展示整体数据结果,删除大于98%和小于2%分位数的数据点;③针对每20个连续的数据点,删除最高的值(若最高值为第一个,则不删除)和最低的值(若最低值为最后一个,则不删除);④对数据进行滑动平均,滑动窗口大小取数据长度的1/3。

3 模 型

3.1 模型介绍

构造预测模型包含两阶段:

(1)当前实时电池运行状况预测模型:该模型将实时输入当前的一组特征值,并返回模型预测的当前电池运行状况。

(2)未来电池健康状态预测模型:从原始数据中提取充电段特征后,需按天补充缺失的数据,删除重复数据,以相等间隔提取数据,区分SOH 序列,将数据标准化并应用滑动窗口将非监督数据转换为监督数据的方法,区分训练集和测试集,最后建立LSTM模型以预测未来3个月的电池SOH走向。

图2 容量转换Fig.2 Conversion of capacity

3.2 建立实时SOH模型

针对此问题,本文对6个机器学习模型进行了训练,模型包括:L1、L2正则化的线性回归模型;Ridge 和Lasso 回 归; XGBoost; LightGBM;CatBoost 以及LSTM 模型。鉴于实时预测SOH 属于回归问题,因此文章选择平均绝对误差(MAE)进行模型性能的衡量。

3.2.1 特征工程

为得到相关性最高的特征输入模型,文章依据安时积分法计算出相应SOH 具有明显正相关和负相关的特征。

3.2.2 模型选择

(1)线性回归模型(Ridge和Lasso)

线性回归模型的问题在于参数和变量之间的线性关系。由于准确率很大程度上取决于数据集本身,因此当数据不在规则范围内时,导致模型性能不稳定,且模型和参数适用范围窄。为解决此问题,文章选取基于梯度增强决策树的模型。

(2)基于梯度提升决策树的模型

梯度提升决策树通过使用强大的损失函数,可以更好地处理离群值。XGBoost、LightGBM 和CatBoost 模型优化了分布式梯度提升库。XGBoost 提供了并行计算[5],LightGBM 支持并行和GPU计算[6],而CatBoost支持分类变量指标[7]。

(3)深度神经网络

文章设计了常规的三层神经网络,其中第1层包含256 个神经元,第2 层包含128 个神经元,第3 层包含64 个神经元,应用ReLu 作为激活函数,批处理大小为128,迭代次数设置为3000。

应用学习率衰减技术进行动态调整,当优化达到瓶颈时,当前学习率可能不再适合优化。相对而言,当模型学习率较大时,步长变大或导致损失函数收敛结果而无法达到最低要求。因此起始训练时将学习率设置为0.1,若经过100 次迭代后损失函数未减小,则学习率减半。

实验得到模型平均绝对误差为0.034,其实验表现与CatBoost 和LightGBM 相比并无显著优势。各模型的预测结果见表1 及图3 所示预测效果图,其中绿点表示该时刻真实值,红点表示预测值。可直观得出LightGBM和CatBoost的效果最优。

表1 各模型的平均绝对误差比较Table 1 Comparison of average absolute error of each model

3.2.3 混合模型

通过在两辆实车测试CatBoost和LightGBM的混合模型,对比模型预测值与实际观测数值,得到如表1所示的实验结果,同时如图4所示对两个模型的预测结果详细解释了如何对两个模型进行均值融合。

图3 模型测试结果Fig.3 Test results of models

3.2.4 模型选择小结

由表1可知,CatBoost模型性能最佳,其次为LightGBM 模型,两者性能差异较小,与其他模型之间性能差距较大,因此文章取输出平均值对两种模型进行混合,以获得更好实验结果。

3.3 建立未来的电池健康状态预测模型

图4 LightGBM与CatBoost混合模型Fig.4 Combined model of LightGBM and CatBoost

对于未来健康状况预测,研究目标为获得SOH 的衰减曲线。根据事物发展的连续性,该问题属于对于未来健康状况预测,研究目标为获得SOH 的衰减曲线。根据事物发展的连续性,该问题属于时间序列预测问题[8],因此文章选取长短期记忆模型(LSTM)进行未来电池健康状态趋势的分析。

由于采集的总数据量大,训练全部数据周期过长,因此文章从总体数据中抽取4000 万条数据作为样本数据集。为保证数据分布的平衡性,样本数据集的选取综合考虑季节、时段等因素。最后将样本数据集以0.7、0.2以及0.1的比例划分为训练集、验证集与测试集。由于模型的唯一特征为SOH 数值本身,但文章未直接使用电池的SOH 数据,而是在每个时间间隔计算其差值。此处理,将保证无论某个电池的SOH 在何种范围内进行波动,其差值变动小,因此分布不会受到影响,训练集,验证集和测试集将共享相似的分布范围。为确保模型参数不超过样本大小,文章针对小样本集设计小模型。LSTM 模型损失函数收敛情况如图5 所示,测试效果如图6所示,图中绿点表示真实值,红点表示预测值,同时图7详细描述了模型对13个周的数据进行预测,得出对应预测值。

图5 LSTM与损失函数收敛示意图Fig.5 Convergence diagram of LSTM loss function

图6 LSTM模型测试效果Fig.6 Diagram of LSTM’s results

图7 LSTM数据流Fig.7 Data flow of LSTM

4 结 论

研究了估计实时SOH 并预测未来衰减趋势的方法,实验结果表明两个模型在处理此类数据集方面表现良好。CatBoost和LightGBM的混合模型在预测实时SOH 方面具有较低的平均绝对误差,弥补了安时积分法的缺陷,该混合模型易于调参,且适用于广泛的数据集。LSTM网络对于预测未来的趋势具有出色的性能,文章验证了其预测SOH 衰减趋势的良好效果。通过构建以上模型,电池使用相关方可更好地掌控新能源汽车锂电池的状态,从而实现相关的调度管理。

猜你喜欢
容量电池预测
无可预测
电池很冤
“一粒盐电池”
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
把电池穿身上
穿在身上的电池
水瓶的容量
IQ下午茶,给脑容量加点料
不必预测未来,只需把握现在