基于运行数据的电动客车误踩加速踏板状态识别研究

2021-05-23 01:43赵登峰高岩刘朝辉秦朝峰高立杰
汽车与安全 2021年3期
关键词:随机森林交通事故

赵登峰 高岩 刘朝辉 秦朝峰 高立杰

摘 要:驾驶人误踩加速踏板导致的电动客车交通事故时有发生,影响因素复杂。为准确识别误踩加速踏板行为,提醒电动客车驾驶人安全驾驶,基于电动客车车载终端采集的车辆运行状态数据,提取9项与误踩加速踏板行为相关的驾驶特征,采用随机森林算法模型对电动客车误踩加速踏板状态进行识别,结果表明整体的识别准确率为99%,召回率为0.99,表明99%的误踩加速踏板行为可被识别出来。实验表明采用随机森林算法进行误踩加速踏板状态识别具有较好的效果,且与逻辑回归、Adaboost等识别算法相比,具有准确率、召回率和精确率高等特点。该方法利用电动客车的运行数据进行分析,简单高效成本低,具有一定的可行性和实用性。

关键词:驾驶行为;交通事故;误踩加速踏板识别;随机森林;电动客车

中图分类号:U471.3 文献标志码:A

Step faultily on the accelerator state detection based on vehicle running data

ZHAO Dengfeng1,GAO Yan2,LIU Zhaohui1,QIN Chaofeng1,GAO Lijie1

(1. Zhengzhou Yutong Bus Company Ltd., Zhengzhou 450016,China; 2. Key Laboratory of Ministry of Public Security for Road Traffic Safety, Wuxi 214000,China)

Abstract: Fault stepping the Accelerator is one of the main causes of traffic accidents. It is of great importance to detect fault stepping precisely and remind drivers of electrical bus to concentrate on driving safely. Based on the vehicle running data collected by electrical bus data acquisition system, this paper extracts 9 features relevant to driving behaviors and uses random forest algorithm to identify fault stepping. The results show that the overall recognition accuracy is 99%, and the recall rate is 0.99 which means 99% of fault stepping conditions can be successfully identified. Experiments show that fault stepping detection based on vehicle running data with Random forests is the most effective. Compared with other fault stepping detection methods, the proposed method is simple and convenient, the cost is relatively low.

Keywords: Driving behavior; traffic accident; fault stepping accelerator pedal; random forests; electrical bus

驾驶人误踩加速踏板是影响汽车安全行驶、导致交通事故的主要原因之一[1]。电动客车动力性好,速度提升快,当驾驶人误踩加速踏板时,在城市人流量大的交通环境中极易发生群死群伤的严重交通事故。因此,分析电动客车驾驶人误踩加速踏板时的驾驶行为特征,构建模型进行误踩加速踏板行为识别,对日常改善驾驶人的危险驾驶行为、保证电动客车安全行驶具有重要意义。

目前,识别误踩加速踏板行为的主流技术主要分两类:(1)被动型技术,如加速踏板运动速度检测技术[2]、加速踏板力量检测技术[3]、前方障礙物探测技术[4]等;(2)主动型技术,如驾驶人右脚位置检测技术[5]、驾驶人不良驾驶行为识别技术[6-7]、大数据检测[8-9]等。其中被动型技术主要通过分析驾驶人对车辆加速踏板的踩踏动作来进行识别,此类技术可以识别出一些误操作行为,存在的问题是决策用的输入信息相对单一,在一些特定场景下可能会识别错误。主动型技术通过传感装置提前识别驾驶人右脚踩踏加速踏板的行为,进而规范驾驶人踩踏加速踏板的动作,存在的问题是需要新增工业相机等信息采集与处理装置而导致成本增加,且对传感器和采集系统的可靠性要求较高。

本文基于电动客车车载终端采集的车辆运营数据,提出一种可有效用于识别驾驶人误踩加速踏板的识别方法。该方法通过综合利用电动客车的运行数据,提取与异常加速相关的驾驶特征,构建误踩加速踏板行为识别模型,分析误踩加速踏板的数据规律模式,可用于指导驾驶人误踩加速踏板行为改善。

1 车辆运行数据采集与误踩加速踏板状态识别

基于电动客车车载终端采集的车辆运行数据,将运行数据切分处理为正常操作加速踏板样本和误踩加速踏板样本,通过构建识别误踩加速踏板的模型,实现通过车辆运行数据准确识别误踩加速踏板行为的目的。工作流程如图1。

1.1 车载运行数据采集

利用车载终端对电动客车的运行状态数据进行采集,采集的数据均为电动客车自然驾驶状态下产生。采集的数据包括正常驾驶数据和踏板误操作驾驶数据,通过人工分析筛选,获取了电动客车CAN总线上的运行数据和车载监控视频数据。其中通过CAN总线采集的车辆运行数据包括车辆状态、挡位以及车辆速度、加速度、乘客门开关信号、转向灯信号、手刹信号、加速踏板开度、制动踏板开度、GPS经纬度、日期和时间、驾驶人ID、车牌号等。车载监控视频数据包括驾驶区、乘客区、前视和驾驶人DMS等摄像头数据。电动客车运行数据采集系统如图2。

1.2 数据样本切分处理

先在企业驾驶实验场地进行驾驶人踏板误操作的实验,在不同工况条件下模拟驾驶人加速踏板误操作行为,以提取归纳驾驶人的踏板误操作特征规律,作为电动客车数据分析平台自然驾驶数据中踏板误操作的筛选准则。模拟实验设计方案如表1所示,实验选择在天气良好条件下进行,实验驾驶人为某公交公司驾驶人,实验前无饮酒、药物等异常情况。

驾驶人误操作实验完成后,将实验数据通过CAN总线及OBD接口导出。初步对实验数据进行研究分析,提取驾驶人踏板误操作行为特征。通过对以上共19次实验的数据进行基本分析,得到误操作下加速踏板变化率指标和满踩加速踏板持续时间特征,如图3所示,发现误操作下最大加速踏板开度变化率一般在75%/s以上且满踩加速踏板持续时间超过3s以上。

通常来说,公交车驾驶人在起步时很少猛踩加速踏板且持续较长时间,基于实验得到的参数阈值,作为电动客车数据分析平台踏板误操作数据初步筛选准则,从而对误踩加速踏板数据样本进行切分。结合上述实验,对最大加速踏板变化率和满踩加速踏板阈值进行适当降低,以便筛选更多的异常驾驶数据。最终确定筛选准则如下:车辆的加速度大于2m/s2、最大加速踏板开度变化率大于70%/s、加速踏板开度维持在95%以上的时间大于2.0s。

根据同步采集的车辆运行过程中视频数据,对驾驶人是否误踩加速踏板进行判断确认,若结果为驾驶人错误操作,则定义该时间段为误踩加速踏板标签;若不是驾驶人错误操作,则定义该时间段为正常驾驶状态标签。通过人工标定的各时间段驾驶状态标签,将车辆运行数据切分为误踩加速踏板状态数据和正常驾驶状态数据。

1.3 误踩加速踏板行为识别模型构建

基于业务理解,利用误踩加速踏板状态样本与正常驾驶状态样本,提取与误踩加速踏板行为相关的驾驶特征,采用随机森林分类算法,构建误踩加速踏板驾驶行为识别模型。

1.4 误踩加速踏板行为识别与应用

基于CAN总线采集的车辆运行数据,对误踩加速踏板行为进行识别,评估驾驶人误踩加速踏板风险,指导对高风险驾驶人进行危险驾驶行为改善,降低因误踩加速踏板导致的事故率。

2 构建误踩加速踏板行s型

基于车辆运行数据,构建误踩加速踏板驾驶行为识别模型,模型主要由四个部分组成:第一部分准备数据样本;第二部分从样本数据中提取与车辆误踩加速踏板相关的驾驶特征,如车速、加速踏板开度、制动踏板开度、转向灯信号、门开关信号等参数;第三部分,对提取的驾驶特征两两组合进行相关性分析,同时将各驾驶特征与误踩加速踏板行为之间进行相关性分析;最后,采用随机森林算法对误踩加速踏板行为进行识别,为驾驶人误踩加速踏板行为风险评估与改善提供指导。构建误踩加速踏板状态识别模型框架如图4。

2.1 数据样本准备

数据来源于市场上曾发生误踩加速踏板驾驶事件的电动客车运行数据,共收集20组运行数据样本514775个。其中误踩加速踏板样本9067个,占总样本数量的比例为2%,具体见表2。

2.2 駕驶特征提取

驾驶人误踩加速踏板状态与正常驾驶状态相比,车辆位置、车速、加速踏板开度、制动踏板开度等驾驶特征控制的稳定性存在一定的差异。因此,可以将这些参数认为是判断驾驶人处于误踩加速踏板状态或正常驾驶行为的标准,从而可以从这些数据信号中提取与误踩加速踏板行为相关的驾驶特征。

基于现有的数理统计学知识和对于模型需求的理解,对采集到的驾驶行为数据特征进行提取,本文一共提取了9个与误踩加速踏板驾驶行为相关的特征,具体特征见表3。

2.3 驾驶特征分析

通过分析前文所选定的驾驶特征参数与驾驶人误踩加速踏板之间的相关性,从而获取与误踩加速踏板行为最相关的特征,为判断是否误踩加速踏板提供数据基础。对所提取的9个驾驶特征,可采用皮尔森相关系数[11-12]来判断它们之间的相关性以及与误踩加速踏板的相关关系,皮尔森相关系数分布在[-1,1]区间范围内,相关系数越靠近 1,说明两个特征正相关性越强,越靠近-1则说明两个特征负相关性越强[11-12]。具体如图5所示。

从图5可以看出,不同驾驶特征之间相关系数的离散性较大。

各驾驶特征与是否误踩加速踏板的相关系数见表4。

从表4可以看出,加速踏板开度信号与误踩加速踏板的相关系数最大,为0.91,其它特征与误踩加速踏板的相关系数低于0.65,这与工程实际相符合。

2.4 误踩加速踏板识别

本文采用随机森林算法对误踩加速踏板行为进行识别。随机森林算法是一种基于分类树的集成学习算法,其基本原理是通过随机采样特征和数据样本,生成很多决策树,每一颗决策树均不相关,将多棵决策树组合在一起就形成森林,通过各决策树进行投票决策,最终选择多数投票的策略来决定最终结果[10,13]。随机森林算法具有处理高维特征样本数据时准确率高、抗干扰能力强、抗过拟合能力强等特点,同时可对驾驶特征重要度进行排序,找出对误踩加速踏板有主要影响的驾驶特征。

具体的算法步骤如下[10,13]:

(1)原始训练集中共有特征M个,样本总数为N个。采用有放回的随机Bootstrap抽样技术,从训练集中随机抽取N个样本形成训练子集;

(2)从M个特征中随机选取m(m≤M)个特征作为特征子集,从这m个特征中选择最优的切分点再做节点分裂,直到节点的所有训练样例都属于同一类。节点按基尼指数、信息增益率、均方差等规则分裂,且在分裂过程中完全分裂不剪枝;

(3)重复(1)(2)步骤k次,即可得到由k棵决策树构建而成的随机森林;

(4)利用新采集的运行数据,使用随机森林进行决策。决策公式如下:

式中:H-随机森林模型;Y-是否误踩加速踏板分类标签;x-测试样本;k-决策树数量;hi-单棵决策树,其中i={1,...,k};I-指示性函数。

3 模拟计算与结果分析

本文集中于分析不同驾驶特征的差异性来识别误踩加速踏板行为,将原有数据按照8:2的比例随机分配,其中80%作为训练样本集,20%为测试样本集,利用随机森林算法经过剪枝和参数调优,对训练样本集數据进行训练,得到的混淆矩阵如表5所示,其中各参数值分别为:M=9,N=127673,m=2,k=10。

根据表5实验结果,可计算出准确率为0.99,即准确预测正常驾驶和准确预测误踩加速踏板的样本数之和占样本总数的比例。

考虑到本文所使用数据的样本标签分布并不均匀,因此在评价实验结果所采用的指标中,除了判断算法的准确率以外,导入召回率、精确率等指标来对有偏数据实验结果进行进一步评价[10,14]。其中召回率是指预测为误踩加速踏板实际也为误踩的样本数与总的实际误踩加速踏板的样本数的比值,精确率是指预测为误踩实际也为误踩的样本数与总的预测为误踩的样本数的比值。

本次实验得到召回率为0.99,表示误踩加速踏板被正确检测出来的概率达到99%。本次实验得到精确率为0.97,表示正确预测出误踩加速踏板的比例可到达97%。

为了研究不同算法对电动客车驾驶人误踩加速踏板行为预测结果的影响,分别使用逻辑回归算法和Adaboost算法[15]对标签数据进行分类识别,分类识别结果如表6所示。

如图6所示,在对误踩加速踏板行为识别中,随机森林算法的准确率、精确率和召回率均优于逻辑回归算法和Adaboost算法,即证明随机森林算法更适用于电动客车误踩加速踏板行为状态的识别。

4 结论

(1)本文基于电动客车在运行过程中采集的车速、加速踏板开度、手刹状态等数据,提取与驾驶行为相关的 9 项特征,对驾驶人的误踩加速踏板行为进行了分析和识别。本文选取了随机森林、逻辑回归和Adaboost三种算法分别对样本数据进行训练并测试,结果表明随机森林算法对误踩加速踏板行为的识别效果最好,总体的准确率为0.99,召回率为0.99,精确率为0.97,具有方法简单、精度高、成本低等优势,对于检测驾驶人误踩加速踏板行为具有一定的可行性和实用性。

(2)本文基于车辆运行数据对驾驶人误踩加速踏板行为的识别进行了有价值的探索,涉及更大规模样本数据,考虑车辆动力性能差异与驾驶人个体差异,进一步提高误踩加速踏板行为检测准确率与可信度的相关实验与方法有待深入研究。

(3)在未来研究中将对驾驶人误踩加速踏板的形成机理进行研究,提取驾驶人误踩踏板的行为特征以便进一步提升算法的识别精度。基于电动客车数据分析平台开发驾驶人踏板操作风险评分系统,利用本文算法智能识别驾驶人潜在的踏板误操作行为,并将结果反馈到公交运营公司,纠正不良踏板操作行为,最大限度的降低驾驶人因个人因素而造成的踏板误操作事件,保障道路行车安全。

参考文献

[1] 苑警支.基于多传感器融合的误踩油门辅助系统控制方法研究[D]. 长春:吉林大学,2019.

[2] 胡振奇,朱昌吉等.汽车防误踩加速踏板系统的研发[J]. 汽车工程,2011,33(08):713-715+176.

[3] 邓彪,简晓春.汽车误踩油门智能保护系统的设计[J]. 交通科学与工程,2014,30(02):67- 71.

[4] 尹怡欣,徐令仪等.基于旋转编码器的汽车油门误踩检测[J]. 控制工程,2013,20(04):611-613+622.

[5] 张小恒.防范油门误踩关键技术分析[J]. 科技资讯,2016,14(35):220+222.

[6] 朱晓艳.机动车驾驶人不良驾驶行为研究[D]. 哈尔滨:哈尔滨工业大学,2018.

[7] 高晨宵. 纯电动汽车驾驶行为预测和驾驶模式识别[D].大连理工大学,2017.

[8] 佘承其,张照生,刘鹏,孙逢春.大数据分析技术在新能源汽车行业的应用综述——基于新能源汽车运行大数据[J].机械工程学报,2019,55(20):3-16.

[9] 毛正涛,张金喜.基于新能源汽车远程监控数据的驾驶行为识别建模与应用[J].汽车与配件,2017(17):80-83.

[10] 蔡素贤,杜超坎,周思毅,王雅斐.基于车辆运行数据的疲劳驾驶状态检测[J].交通运输系统工程与信息,2020,20(04):77-82.

[11] 徐維超.相关系数研究综述[J]. 广东工业大学学报,2012,29(3):12-17.

[12] 曹鑫. 江苏全省设区市生态文明建设评价及路径探究——基于耦合协调模型及Person系数和因子分析[D].南京大学,2020.

[13] CUTLER A, CUTLER D R, STEVENS J R. Random forests[M]. Ensemble Machine Learning. Springer, Boston, MA, 2012: 157-175.

[14] RAND W M. Objective criteria for the evaluation of clustering methods [J]. Journal of the American Statistical Association[J], 1971, 66(336): 846-850.

[15] Archana R. Panhalkar, Dharmpal D. Doye. A novel approach to build accurate and diverse decision tree forest[J] ,Evolutionary Intelligence, Springer, Boston, MA,Jan.2021.

猜你喜欢
随机森林交通事故
预防交通事故
基于元胞自动机下的交通事故路段仿真
基于元胞自动机下的交通事故路段仿真
月圆之夜车祸致死率高
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
拱坝变形监测预报的随机森林模型及应用
基于随机森林算法的飞机发动机故障诊断方法的研究
基于随机森林算法的B2B客户分级系统的设计
基于多视角特征融合与随机森林的蛋白质结晶预测