改进PSO-K-means算法在汽车行驶工况估计中的应用

2021-12-07 03:38范艺璇阚秀曹乐沈颉
智能计算机与应用 2021年7期

范艺璇 阚秀 曹乐 沈颉

摘 要: 针对城市道路上轻型车的行驶工况问题,分析福建省莆田市某实际道路采集的行驶数据和道路交通运行特征,对实采数据进行清洗并划分成运动学片段,根据车辆运行机制和运动学片段统计分布特点,采用PCA方法对特征参数进行降维处理,设计改进的PSO-K-means算法构建车辆行驶工况,并从10个主要特征参数角度与实际工况进行对比,结果表明所构建工况能够准确反映车辆在实际道路上的行驶特征,说明使用改进PSO-K-means算法构建轻型车行驶工况的合理性和有效性。

关键词: PCA分析; 数据清洗; 改进PSO-K-means算法; 行駛工况

文章编号: 2095-2163(2021)07-0080-07中图分类号:TP391文献标志码: A

Application of improved PSO-K-means algorithm in the estimation of driving cycle

FAN Yixuan, KAN Xiu, CAO Le, SHEN Jie

(School of Electronic and Electrical Engineering, Shanghai University of Engineering Science, Shanghai 201620, China)

【Abstract】Aiming at the driving cycle of light vehicles on urban roads, the driving data and road traffic operation characteristics collected from a real road in Putian City, Fujian Province are analyzed. The collected data are cleaned and divided into kinematic segments. According to the vehicle operation mechanism and the statistical distribution characteristics of kinematic segments, PCA method is used to reduce the dimension of the characteristic parameters, and the improved PSO-K-means algorithm is designed to construct vehicle driving cycle. The paper compares the constructed driving cycle and actual driving cycle from the perspective of 10 main characteristic parameters. The results show that the constructed driving cycle can accurately reflect the driving characteristics of the vehicle on the actual road, which shows the rationality and effectiveness of using the improved PSO-K-means algorithm to construct the driving cycle of light vehicles.

【Key words】PCA analysis; data cleaning; improved PSO-K-means algorithm; driving cycle

0 引 言

近年来,随着乘用车保有量的迅猛增长,道路交通、能源消耗和排放污染等一系列问题随之出现,行驶工况作为衡量车辆能耗、排放测试和行驶特征的重要标准,其构建问题一直受到相关领域学者的广泛关注[1-5]。由于各城市发展背景和环境不同,采用统一的行驶工况标准进行汽车能耗/排放等认证显然不合适,因此,依据不同城市的实际汽车行驶数据,构建反映实际道路行驶工况具有重要的研究意义。

为适应不同地区的车辆行驶特征和道路条件,现有行驶工况研究大多针对具体的地区展开。刘燕[6]应用K-means聚类方法研究了具有山地道路特性的重庆市行驶工况。高建平等人[7]采用主成分分析和改进的模糊聚类(FCM)方法构建了符合郑州市交通特征的行驶工况。Amirjamshidi等人[8]运用多目标遗传(MOGA)算法构建了多伦多市卡车的行驶工况,并进行了车辆排放试验。宋怡帆[9]使用改进的AP聚类方法针对深圳市的轻型车进行行驶工况分析。刘子谭等人[10]从估计区间的角度改进K-means聚类方法,并研究了广州市的轻型车行驶工况。

本文基于莆田市某型号汽车的行驶数据,利用改进的PSO-K-means算法构建了适应该地区该车型的行驶工况,论文的具体内容结构如图1所示。第2节介绍了基于改进的PSO-K-means算法的流程。第3节阐述了数据清洗的过程和运动学片段的划分。第4节根据运动学片段分布特点和车辆行驶特征,提取典型特征参数,通过 PCA对典型特征降维,得到4个主要成分。第5节基于改进的PSO-K-means算法,构建汽车行驶工况,并结合车辆实际运行情况,评估所构建行驶工况的合理性。

1 改进PSO-K-means算法

粒子群优化算法[11](PSO) 是一种进化计算技术,具有易实现、收敛快和精度高等优点,且对初始值要求不高,而K-means聚类方法具有聚类效果好但对初始中心点敏感的特点,本文将PSO算法和K-means方法结合,使得改进后的PSO-K-means算法实现对行驶工况的精确快速估计。PSO-K-means算法的流程如下所示:

(1)初始化粒子群:随机生成m个粒子,每个粒子的位置由k个样本的d个特征信息决定,即初始聚类中心位置。

(2)利用适应度函数计算每个粒子的个体极值和全局最优值的适应度值,适应度定义如下:

其中,Cj为k个聚类中心对应的k个类别;Si为类Cj中的其他所有点;Zj为聚类中心。初始化粒子速度vi(t),计算个体适应值,确定个体极值位置xBesti和种群达到的全局最优位置xgBest。

(3)设置最大迭代次数tmax,当前迭代次数t=1。设置判断粒子群收敛速度的适应度方差阈值为θ,方差σ2计算公式如下:

其中, f(xi)为粒子i的适应度值, favg为所有粒子的适应度均值。

(4)根据每个粒子的个体极值位置xBesti和全局最优位置xgBest,按以下公式更新粒子的速度与位置信息:

其中,xi(t)为第i个粒子所在的位置; vi(t)为第i个粒子的速度;c1,c2分别为惯性因子和约束因子ρ1和ρ2为取值[0,1]区间的随机数;ω(t)为惯性权重。

针对理想PSO算法中前期全局搜索强后期局部搜索强的特点,对ω(t)值采用如下公式刻画的自适应操作[12]:

其中,ωmax为最大惯性权重,ωmin为最小惯性权重。

(5)判断当前迭代次数t是否等于最大迭代次数tmax,如果t=tmax则输出适应度值最小的粒子为k个聚类中心;如果tθ,继续重复(4)、(5)过程。

(6)计算种群中每个个体与以上步骤中得到的聚类中心之间的距离,按照如下公式计算个体a与个体b第h个特征之间的距离:

将每个样本归为距离最近的中心点,更新每个数据簇的中心点。

(7)重复步骤(6)直至聚类中心不发生变化,算法结束。

2 数据清洗与运动学片段提取

行驶数据来自于车联网管理平台数据库,车辆通过无线传输设备将车载传感器数据信息发送至车联网管理平台数据库,由于GPS信号丢失、环境因素或传感器老化等因素会造成数据部分丢失、不连续和异常等现象,为尽可能真实地还原车辆实际行驶状况,首先要对原始数据进行清洗,本文通过对汽车行驶时相应参数变化的分析,对原始数据的丢失或异常部分进行插值拟合、替换和剔除等清洗处理操作,具体清洗处理流程如图2所示。

2.1 缺失数据值处理

(1)若信号丢失前车速>10 km/h,且GPS车速不为0,采用如下插值方法将丢失数据补齐,此时需用到的公式为:

xi,...,xi+n-1=xi,...,xi+n-1三次样条插值傅里叶插值0n=00<n≤100100<n≤300n>300i=0,1,...,k (7)

其中,n为丢失数据点,数据点的间隔以s为单位。

(2)若信号丢失前车速<10 km/h,则视为异常,将该信号缺失段的数据点删除。

2.2 异常数据值处理

(1)存在汽车加、减速异常的数据(此型号轻型车一般情况下:0~100 km/h的加速度时间大于7 s,紧急刹车最大减速度在7.8~8  m/s2),因此针对2.1节中已经插补后的数据值的情况,通过双树复小波算法,查找加减速异常值,然后对异常值进行筛选和剔除。

将行驶工况看作一个随时间变化的离散小波信号,基于双树复小波变换[13],默认汽车加速状态下的加速度为平均加速度,刹车状态下的最大减速度为瞬时减速度。以2017-12-18 18:01:50至2017-12-18 18:08:29中400组数据为例,选取时刻记为ti(i=1,2,…,400)。并截取其时间—车速图像,设ti时刻速度vi数据异常,通过小波分析将异常点筛选,并按如下公式得到更正点v'i,数学公式可写为:

其中,vi+a表示ti时刻前a个点的速度;vi-a表示ti时刻后a个点的速度;n为数据点数。

图3为一段含异常点的时间-速度图,虚线框处速度和加速度值出现异常,按照上述处理方式,可以得到更正后的时间-速度图如图4所示。

(2)调查表明福建省交通信号红灯持续时间一般不大于180 s,因此设定车辆的最长怠速时间为180 s。对于车辆处于怠速且怠速时间超过180 s的时间段以及发动机转速为0但采集设备仍运行的情况下的数据点进行删除,对于怠速时间在180 s之内的数据段车速置为0。将车速跳变的地方用连线表示出来,其密集程度表示车速数据的连贯性。

经过2.1节和2.2节对原始数据清洗处理后,处理前后数据如图5和图6所示,具体就是車速密连贯性图,序列号为数据的编号,但是时间并非连续的,所以纵轴的尺度较之横轴大。图5中,颜色越深处表示清洗处理前数据缺失量越大。由图6可以看出,清洗处理后数据较为均匀,能够反映真实的行驶状况,为后续构建合理的行驶工况提供依据。

2.3 运动学片段的提取

运动学片段是指汽车从一个怠速状态开始至下一个怠速状态开始之间的车速区间,且一个标准的运动学片段需要包括加速状态、减速状态、巡航/匀速状态和怠速状态[14]。提取步骤为:将车速较慢且时间不长的片段进行降噪处理,将片段时间小于20 s的剔除,遍历所有数据点,遇到速度为0的点即记录该位置为起始点,当速度从非0点跳至0的时刻,记该位置为结束点,结束点与起始点之间的时间片段大于20 s则保留为运动学片段,重复此过程操作,具体运动学片段提取算法流程如图7所示。

基于所给行驶数据,按照上述步骤提取出3 408个运动学片段。

3 特征参数

3.1 提取有效特征参数

分析车辆行驶机制和运动学片段分布特点,选取10个主要特征参数,见表1。

表1中,S=∑ki=1Vi,j=1,2,3,...,k,是该运动学片段所有数据点速度的总和,T代表该运动学片段的总点数,Ti为速度为0的数据点的总个数,Ta为该运动学片段中加速度不小于0.1 m/s2的总点数,Td为该运动学片段中加速度小于-0.1 m/s2的总点数。

3.2 PCA降维处理

上述过程选取的10个特征参数间存在一定的相关性,PCA方法在保持数据信息的前提下,将特征参数进行组合,形成新的相互独立的参数,降低估计行驶工况的计算复杂度[15]。根据处理后的3 408个运动学片段和选取的10个特征参数,可构成如下运动学特征值参数矩阵:

设λi∑10j=1λj为第i个主成分的贡献率,∑lr=1λr∑10j=1λj为前r个成分的累计贡献率,经验表明累计贡献率大于80%的成分为工程上所需求的主成分。统计结果见表2。分析表2,发现前三个主成分的特征值均大于1,所以选择前三个主成分作为特征参数数据的代表,由于第四个主成分的累计贡献率为81.99%,超过了一般工程应用需求的80%,故最终选用4个主成分。

特征参数所对应的主成分上的相关系数绝对值越大,该成分与这些特征参数的相关性就越高,对表3中各特征参数与4个主成分的相关系数进一步分析可知:

(1)第一主成分与减速时间比、加速度标准差、速度标准差、平均速度、平均行驶速度这几个特征参数的载荷系数最高,因此主要代表减速时间比、加速度标准差、速度标准差、平均速度和平均行驶速度的特征值信息。

(2)第二主成分与平均加速度、平均减速度的载荷系数绝对值都超过了0.6,相关性较高,因此主要代表平均加速度、平均减速度。

(3)第三主成分与加速时间比、怠速时间比的载荷系数的绝对值较大,因此主要代表加速时间比、怠速时间比。

(4)第四主成分与最大速度的载荷系数非常高,因此主要代表最大速度的特征值。

4 行驶工况估计

根据城市交通状况,可将车辆行驶状态分为3类:

(1)拥堵行驶工况:交通状况拥堵,车辆行驶速度缓慢,车辆需经常启停。

(2)稳态流动行驶工况:没有拥堵,车流数目较多,平均行驶速度较低。

(3)畅通行驶工况:路面交通状况良好,车流数目较少,怠速状态少。

将其特征参数降维后的3 408个运动学片段进行分类。依据经验设定初始K值为3,把所有的运动学片段划分成上述3种状态,得到拥堵行驶工况的数目有426个,稳态流动行驶工况的数目有2 130个,畅通行驶工况的数目有852个。

应用改进PSO-K-means算法,将低速工况、高速工况、中速工况进行连接,合成持续时间1 289 s的道路行驶工况,构建成如图8所示的由八段数据组成的汽车行驶工况曲线。

实际工况总速度占比和构建工况总速度占比基本吻合,表4给出构建工况与实际工况中各项参数值,可以看出对应参数差距很小,说明所估计的行驶工况科学合理。图9为构建工况和实际工况相关雷达图,表明实际工况和构建工况在特征参数中相关性较高,进一步说明所估计行驶工况的合理性和有效性。

5 结束语

本文根据福建省莆田市某型号轻型车的行驶数据,研究了其在实际道路上的行驶工况估计问题。根据行驶道路特征和数据采集传输原理,清洗原始数据并进行运动学片段划分,分析车辆运行机制和运动学片段分布特点,提取主要特征参数并使用PCA方法降维处理,利用改进的PSO-K-means算法估计车辆行驶工况,并从10个主要特征参数角度对比构建工况与实际工况,数据显示各项特征参数值占比相近,进一步说明所估计行驶工况的科学性和有效性。

参考文献

[1]ANDRE M. Driving cycles development: Characterization of the methods[J]. SAE S pecial Publications , 1996 , 1201 (12) :312,322.

[2]LEE T C, JUDGE G G, ZELLNER A. Estimating the parameters of the Markov probability model from aggregate time series data[J]. Journal of the American Statistical Association, 1970, 66(335):653.

[3]LIN J, NIEMEIER D A. An exploratory analysis comparing a stochastic driving cycle to California's regulatory cycle[J]. Atmospheric Environment, 2002, 36(38):5759-5770.

[4]Pacheco A F, et al. New European Drive Cycle (NEDC) simulation of a passenger car with a HCCI engine: Emissions and fuel consumption results[J]. FUEL -GUILDFORD-, 2013.

[5]彭育輝,杨辉宝,李孟良,等. 基于K-均值聚类分析的城市道路汽车行驶工况构建方法研究[J]. 汽车技术,2017(11):13-18.

[6]刘燕. 基于抽样和最大最小距离法的并行K-means聚类算法[J]. 智能计算机与应用,2018,8(6):37-39,43.

[7]高建平,高小杰. 改进模糊C均值聚类法的车辆实际行驶工况构建[J]. 河南科技大学学报(自然科学版),2017,38(6):21-27,4-5.

[8]AMIRJAMSHIDI G, ROORDA M J. Development of simulated driving cycles for light, medium, and heavy duty trucks: Case of the Toronto Waterfront Area[J]. Transportation Research Part D, 2015, 34(1):255-266.

[9]宋怡帆. 基于聚类和Python语言的深圳市城市道路车辆行驶工况构建[D]. 西安:长安大学,2018.

[10]刘子谭,朱平,刘旭鹏,等. K均值聚类改进与行驶工况构建研究[J]. 汽车技术,2019(11):57-62.

[11]于仲安,褚彪,葛庭宇. 基于HPSO-BP神经网络融合的锂电池SOC预估研究[J]. 汽车技术,2019(6):20-24.

[12]谢秀华,李陶深. 一种基于改进PSO的K-means优化聚类算法[J]. 计算机技术与发展,2014,24(2):34-38.

[13]王盟,余粟,冯益林.改进小波阈值对热泵电机振动信号的去噪研究[J]. 智能计算机与应用,2020,10(4):17-21.

[14]石琴,郑与波,姜平. 基于運动学片段的城市道路行驶工况的研究[J]. 汽车工程,2011,33(3):256-261.

[15]郑与波,石琴,王世龄. 合肥市汽车行驶工况的研究[J]. 汽车技术,2010(10):34-39.

作者简介: 范艺璇(1997-),女,硕士研究生,主要研究方向:数据处理; 阚 秀(1983-),女,博士,副教授,主要研究方向:智能控制、路径规划、网络化系统建模等; 曹 乐(1986-),男,博士,讲师,主要研究方向:惯性传感器、组合导航技术、先进传感技术等; 沈 颉(1993-),男,硕士,主要研究方向:智能控制。

通讯作者: 阚 秀Email:xiu.kan@sues.edu.cn

收稿日期: 2021-04-08