基于车联网数据挖掘的货运车辆驾驶行为聚类研究

2017-07-18 11:48
无线互联科技 2017年11期
关键词:特征参数货运数据挖掘

王 潇

(国际关系学院 信息科技学院,北京 100091)

基于车联网数据挖掘的货运车辆驾驶行为聚类研究

王 潇

(国际关系学院 信息科技学院,北京 100091)

车联网环境下的海量信息,就挖掘分析货运车辆的驾驶特征来说有着特殊的意义与价值。通过挖掘车辆速度、加速度等行驶数据有助于研究车辆驾驶人员的驾驶行为,有利于规范驾驶人员的驾驶行为,同时实现对车辆的智能化管理。文章以车联网数据为基础,将河北省范围内运营的部分货运车辆作为研究对象,获取这些车辆驾驶人员的驾驶行为的特征参数,利用基于因子分析的数据挖掘方法对参数进行转化,以此作为指标并采用K-Means聚类方法对驾驶行为进行挖掘分析。

车联网;数据挖掘;因子分析;聚类分析;K-Means聚类

1 车联网的概念介绍

车联网是指由车辆位置、速度、路线等车辆信息组成的庞大的交互网络[1]。该网络的实现,以车辆安装的电子标识为基础,利用无线射频等电子技术,实现在信息网络平台上显示所有车辆的属性信息和静态、动态信息。对这些信息进行提取并有效利用,根据不同的功能需求可以对所有车辆的运行状态进行有效的监管,提供综合服务。本文主要从数据挖掘的角度出发,分析司机人员的驾驶行为与道路安全之间的关系。

2 数据挖掘

数据挖掘技术,顾名思义,是指在海量的、混杂的、随机的数据中,根据需要提取出隐藏在其中的、具有应用价值的数据的过程[2]。应用数据挖掘技术,使得大量冗杂的数据重新具有了应用的价值。在数据量呈爆炸式增长的今天具有重要意义。

3 货运车辆的驾驶行为特征参数的提取

本文使用的数据是车载终端收集的车辆运营数据,主要是利用车联网技术实现货运车辆的智能化管理。数据精度符合数据分析的要求。这些数据主要包括车辆的定位信息、行驶道路信息以及车辆速度信息等内容。

4 货运车辆驾驶行为的数据挖掘分析

4.1 数据处理

本文使用的数据是车联网数据,该车联网数据采集的是2016年10月10—19日这20天当中,在河北省某国道上行驶的16辆货运车辆的车载终端的数据。该数据一共为2 000万条原始数据。从实际的角度出发,文章在数据处理过程中舍弃了速度持续为0的数据。表1显示的是数据处理的结果。

表1 数据处理结果

4.2 数据分析

4.2.1 驾驶行为特征参数因子分析

本文对驾驶行为特征参数进行数据分析使用的工具是SPSS19.0统计软件,因子的提取采用的是主成分分析方法、因子旋转采用的是最大方差法。通过对驾驶行为特征参数进行因子分析,得出变量间的KMO度量为0.61,该数值表明各个表两件具有一定的相关性。同时,数据的球形假设检验得出的结果是0.000,即显著水平是0.000,拒绝零假设,说明实验采用的数据样本量充足。驾驶行为特征参数的因子分析结果如表4所示。

从表2可以看出,累计方差达到了79.899%的情况下,对驾驶特征参数的分析获得了2个主因子,并且这两个主因子包含了原始数据的79.899%的信息,满足了进行因子分析的要求,并且旋转前与旋转后的累积贡献率也没有发生变化。

表2 解释的总方差

从表3可以看出,因子1与加速度有关的特征参数(平均加速度、加速度标准差、正向平均加速度、反向平均加速度)的载荷分别是0.987,0.942,0.932,0.889,明显大于在其他变量上的载荷。通过表4能够发现,对主因子1和主因子2进行旋转后,旋转因子1与加速度相关的量(平均加速度、加速度标准差、正向平均加速度、反向平均加速度)的关联度分别是0.992,0.923,0.913,0.910。

表3 成分矩阵

表4 旋转成份矩阵

4.2.2 基于K-Means聚类的分析

通过对主因子、旋转因子以及驾驶行为特征变量之间的相关性可以看出:主因子1与加速度相关的变量之间有着较强的关联性。因此,可以将主因子1作为K-Means聚类得标准。与此同时,可以将主因子2作为速度相关驾驶行为的聚类标准进行聚类。

将主因子1作为K-Means聚类的标准得出的聚类结果如表5所示。

表5 聚类结果

通过表5可以看出,货运车辆的驾驶行为的特征参数根据主因子1的特征进行聚类,聚类为2类是比较合适的。货运车辆驾驶人员在货车运行过程中的变速行为均有着不同的程度,但是剧烈变化的数量比较少[4]。将主因子2作为K-Means聚类的标准得出的聚类结果如表6所示。

表6 聚类结果

由表6可以看出,对货运车辆驾驶行为的特征参数以主因子2作为标准进行聚类,聚类为4类比较合适。货运车辆驾驶人员在驾驶货运车辆过程中,绝大部分没有出现超速行为,只有极少数的车辆在行驶过程中出现了不同程度的超速行为。

5 结语

本文以货运车辆上安装的车机终端收集的货运车辆车联网数据作为研究对象,提取并且进一步细化了有关货运车辆驾驶行为的特征参数,将获取的河北省范围内运营的货运车辆产生的海量车联网数据进行处理,使其能够更加清晰、明确地体现货运车辆在行驶过程中的驾驶行为特征。在分析的过程中,采用了因子分析与聚类分析相结合的方法,对货运车辆的驾驶行为特征参数进行因子分析以及聚类分析,较好地体现出了各个特征参数之间的相关性,明确地反映出了货运车辆在行驶过程中特征行为的分布。

[1]高永强.网络安全技术与应用[J].技术研究,2013(9):42-43.

[2]张兆锋.基于科技文献的科技监测信息可视化方法研究[D].北京:中国科学技术信息研究所,2007.

[3]庞明宝.基于动态环境的车辆调度问题研究[D].天津:河北工业大学,2009.

[4]任浩明.车辆主动安全中碰撞临界安全车距算法研究[D].长沙:湖南大学,2011.

Research on clustering of freight vehicle driving behavior based on vehicle networking data mining

Wang Xiao
(Information Science and Technology School of University of International Relations, Beijing 100091, China)

The massive information under the background of Internet of car is of special signi fi cance and value. By digging vehicle speed, acceleration To analyze the characteristic of the freight vehicle driving. Through mining driving data of vehicle speed, accelerated speed and other data is helpful to standardize the driving behavior of vehicle drivers and realize the intelligent management of the vehicle. In this paper, the part of freight vehicles operating within the bounds of Hebei province as the research object to obtain the characteristic parameters of vehicle driver’s driving behavior based on vehicle networking data, and using data mining method based on factor analysis to convert the parameters as indicators, and the K-Means clustering method is applied to analyze driving behavior .

Internet of car; data mining; factor analysis; cluster analysis; K-Means clustering

王潇(1990— ),男,河北秦皇岛。

猜你喜欢
特征参数货运数据挖掘
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
波音公司试飞电动垂直起降货运无人机
基于PSO-VMD的齿轮特征参数提取方法研究
AT200大型货运无人机实现首飞
基于并行计算的大数据挖掘在电网中的应用
货运之“云”
一种基于Hadoop的大数据挖掘云服务及应用
统计特征参数及多分类SVM的局部放电类型识别
俄发射“进步”M23M货运飞船