基于交通大数据的高速公路逃费车辆特征分析

2022-03-24 08:56杨朋涛牛军燕
技术与市场 2022年3期
关键词:通行费车牌收费站

杨朋涛,牛军燕

(河南交通职业技术学院,河南 郑州 450015)

0 引言

目前,我国正处在一个飞速发展的黄金时期,高速公路日益扩张,私家车拥有量也在连年攀升,与此同时,也为高速公路管理带来了很多问题。由于高速公路通行产生较多的通行费,一些过往车辆便滋生逃费念头,致使高速公路管理部门流失大量的通行费[1]。为了优化高速公路运行秩序,提升高速公路管理水平,有效稽查高速公路逃费车辆,亟需了解高速公路逃费车辆行驶特征,掌握逃费车辆时空变化规律。

国内很多学者进行了大量研究,靳诚[2]基于高速公路联网收费数据,分析了高速公路交通流变化特征。赵彦[3]通过对稽查方法的研究总结出计算机联网收费系统可有效辅助逃费行为的治理。黄志军[4]基于高速公路大数据设计了联网收费稽查系统。李松江等人[5]通过对逃费车辆特征的分析,建立了逃费预测模型,并对逃费行为进行预测。

本文通过对高速公路联网收费数据的处理,提取有效数据,分析高速公路逃费车辆特征,掌握了逃费车辆的总体特征、时空变化特征以及通行费特征。

1 数据筛选与清洗

1.1 数据筛选

以陕西省榆林市高速公路联网收费系统1个月不间断通行卡流水数据为研究数据,其通行卡字段(见表1)记录了过往车辆通行信息。

表1 通行卡字段

表1(续)

通行卡共记录车辆通行信息31个字段,剔除无用属性,筛选车辆出、入口通行时间、车牌、车型等有效属性20个,如表2所示。

1.2 数据清洗

原始数据量巨大,存在缺失、错误等情况,为了精确分析逃费车辆出行特征,对原始数据进行清洗。

1.2.1 缺失值处理

缺失值分为每个字段单一属性缺失、每个字段多个属性缺失以及机器故障引起,针对不同缺失类型,本文采取不同处理方法,如表3所示。

1.2.2 错误值处理

错误值多是由于系统识别导致,且主要表现为车牌识别错误,如“(蓝)陕X00000”,因此本文仅介绍车牌识别错误的处理方法,图1为处理流程图,错误率的计算方法为第i天错误值条数除以第i天数据总条数。

图1 车牌号错误值处理方法流程图

2 高速公路逃费车辆特征分析

2.1 总体特征

对金鸡滩收费站、大保当收费站、锦界收费站、西沟收费站、神木收费站、店塔收费站6个收费站的逃费情况进行分析,经过数据的筛选与清洗,总计得到样本数量45 621个。

通过对数据的分析,对逃费类型的主要特征进行研究,从结果发现车牌不符为主要逃费类型,占到逃费车辆总体的50%以上,其次为车辆超时,根据高速公路车辆真实行驶情况可知,驾驶员由于中途服务区休息以及车辆损坏都会导致车辆超时,从车辆超时逃费类型在整体逃费类型的占比中可以看出,驾驶员企图偷逃通行费的现象普遍较多。

2.2 空间特征

2.2.1 行驶轨迹

以金鸡滩收费站、大保当收费站、锦界收费站、西沟收费站、神木收费站、店塔收费站6个收费站的车辆通行信息以及陕西省384个收费站的经纬度信息为数据基础,对逃费车辆数据进行分析,得到逃费车辆空间行驶轨迹如图2所示。

图2 逃费车辆行驶轨迹

图中圆点代表收费站点,颜色由浅至深表示逃费次数逐渐增多。本文对逃费车辆的空间轨迹分析未还原车辆的真实行驶轨迹,而是以收费站点为基础来展现车辆的行驶状态特征。通过对逃费车辆空间行驶轨迹的分析,直观展示了逃费车辆的空间分布以及行驶状态。

2.2.2 出行异常频率

以某个单独样本作为直接分析对象,对其在特定时间每天或者每周的出行次数进行统计分析,有利于捕捉逃费车辆的空间行驶特征[6]。逃费车辆大量存在的根本原因就是出行次数多,为了降低出行通行费便滋生逃费念头,促使车辆进行逃费。本文将出行强度作为逃费空间特征的基本信息进行分析,并将逃费车辆的日均逃费次数定义为出行强度。

为了直观分析逃费车辆的出行强度信息,本文选取车牌不符的逃费车辆进行统计,剔除车牌号码逃费次数较高的异常数据,得到每月逃费在4次以上的车牌号。发现每月逃费次数普遍分布在4~7次,较高者每月逃费次数达19次以上,经过研究发现,车牌不符逃费类型亦呈现出一定的规律性,即逃费次数达到4次以后逃费行为就会变得更加严重。根据车牌不符逃费车辆行驶情况,选取逃费8次的某样本数据进行统计分析,从而对逃费车辆的空间出行强度进行分析。表4为高速公路逃费车辆的某样本出行强度表。

表4 高速公路逃费车辆某样本出行强度表

从表中可以看出,该样本几乎每天都会有逃费现象发生,出行强度较大,由于数据统计天数总共为28 d,总计逃费8次,故逃费车辆出行强度为0.286,逃费车辆的出行强度很好地描述了逃费车辆的空间行驶特征。

2.3 时间特征

逃费车辆的时间特征主要包括周末、节假日、高峰出行等特征,由于本文所选取逃费车辆数据为5月份数据,包含了“五一”假期,将重点对整月数据的分布进行研究,从中发现在节假日与平常逃费车辆的出行特征,其次对每天的高峰逃费时期进行研究,以把握逃费车辆的时间出行规律。

2.3.1 节假日出行异常

对节假日出行异常进行分析,分别就U型、闯关、入口无重、记重更改几种逃费类型的时间分布进行分析。

总体来看在5月10—5月15日,逃费车辆出行强度最大,随着时间的推移,车辆出行强度逐渐减弱,但是逃费车辆的数量仍然是巨大的,整体呈现出月初较少,随后增多的特点。根据实际调查情况可知,由于“五一”放假期间,车辆较多,政府部门对高速公路管理提出了更高的要求,因此,上旬表现出逃费车辆较少的状态,而随着假期的结束,逃费车辆又陆续增多。

从1个月的逃费车辆分布中可以看出,车辆的出行强度呈现出一定的规律性,在节假日期间较弱,在其他时段出行强度增大。

2.3.2 高峰出行异常

本文仍然以车牌不符逃费类型数据为基础,分客车、货车统计车辆在不同时间段的逃费次数,观察车辆的高峰出行强度。

从一天的变化中可以看出,客车的逃费次数存在明显的高峰时期,即5:30左右以及20:30—23:00,特别是晚上,逃费车辆的出行强度较大,夜间逃费现象更加严重。而货车在一天中的变化不是很大,但从中午以后逃费次数明显增多,出行强度增大,即货车在午后更容易逃费。整体来看,逃费车辆的出行强度依然较高。

2.4 通行费特征

对逃费车辆的通行费特征分时间、空间地域进行分析研究,可以得到各个收费站在不同月份的逃费额分布情况。

结果发现每年的5—6月逃费额最多,每个收费站的逃费额分布则大致相当,但逃费额仍然处在一个很高的状态,并呈现出一定的分布规律,因此,在逃费车辆特征分析中,逃费额亦是一个重要特征,有利于对高速公路逃费车辆的时空分布研究。

3 结语

本文依托高速公路联网收费系统,以陕西省金鸡滩收费站、大保当收费站、锦界收费站、西沟收费站、神木收费站、店塔收费站6个收费站联网收费数据为基础数据展开研究,分析了高速公路逃费车辆总体特征、时空特征以及通行费特征,总结逃费车辆的时空变化规律,为高速公路管理提供了重要支撑,也为交通管理的研究提供了新的思路,将大数据运用到交通管理中,更加精确地剖析交通变化特征,从冗杂的数据中发现规律,从而高效打击高速公路不良行驶现象,规范高速公路行驶秩序。

猜你喜欢
通行费车牌收费站
江苏20个高速收费站实施“准自由流”改造
浙江首个“云收费站”投用
通行费校核分析方法探究
数字图像处理技术在车牌识别系统中的应用
基于Spark的高速收费站大数据系统的设计与实现
一种收费站排队模型的模拟实现
浅谈国内高速公路通行费移动支付
高速公路通行费收益补偿方案设计
第一张车牌
基于MATLAB 的车牌识别系统研究