滑动窗窗体长度及滑动步长对事故多发路段鉴别影响

2018-09-10 10:26孟祥海张道玉吴佩洁
交通运输系统工程与信息 2018年4期
关键词:窗体位数步长

孟祥海,张道玉,吴佩洁

(哈尔滨工业大学交通科学与工程学院,哈尔滨150090)

0 引言

事故次数法是最原始、最简单的基于交通事故数据对事故多发路段进行鉴别的方法,即直接用固定长度内一定时间发生的事故数来鉴别事故多发路段.为了更加科学的鉴别事故多发路段,一些学者运用概率统计学知识,给出了固定长度内一定时间段发生事故的事故率及事故次数概率分布,用于增强鉴别结果的准确性[1].后来研究发现交通事故发生的概率与交通量有着密切的关系,因此又引入交通量给出质量控制法来鉴别事故多发路段.为了衡量交通事故的严重程度,文献[2]引入交通事故经济损失,给出当量财产损失事故法,从而对事故鉴别方法进一步改进.近些年国内外学者又引入一些新方法进行事故多发路段鉴别,如Michal Bíl[3]首先对交通事故进行聚类分析,然后运用核密度法挑出事故严重的区域,最后用蒙特卡洛法进行模拟估计,并进行验证得出最终鉴别结果;张道玉等[4]通过运用改进贝叶斯网络对高速公路交通设施进行风险评估进而对事故多发路段进行识别.

以上基于历史事故数据的事故多发路段鉴别方法均是基于事故次数统计进行的,在统计过程中,需将路段划分为同一长度(将道路按照某一长度分段)或不同的长度(将道路按照路段性质划分).在定长或不定长的划分方法中,一旦确定路段长度,位置也将固定.用固定的路段对历史事故进行统计,有时会遗漏事故多发点(固定长度的路段分界线正好将事故多发点处的事故数分隔,导致统计时每个路段的事故数变少),有时会夸大事故多发路段(事故数较为集中,仅占划分路段的一部分,而判别时会将整个路段识别为事故多发路段).为弥补这一缺陷,可将用于统计的路段长度设置为可变的长度,并且设置为像窗子一样可以滑动,即本文将给出的滑动窗口法.为进一步研究滑动窗口法在事故多发路段鉴别时的效果,本文以京珠高速公路粤北段为例,分析滑动窗口法鉴别事故多发路段时可能存在的问题,研究滑动窗窗体长度、滑动步长对事故多发路段鉴别的影响,并运用分位数法给出最佳窗体长度及滑动步长的取值范围.

1 基于滑动窗口法的事故多发路段鉴别

1.1 滑动窗口法

滑动窗口法是时间系列法的一种.1974年B.Rubinger首次提出滑动窗口法的概念,随后逐渐确立了滑动窗口法的基本步骤,形成了滑动窗口法的雏形[5].随后滑动窗口法在计算机及相关领域中得到不断完善.滑动窗口法因其具有简单易行、可操作性强、实用性强、精确度高等优点,在其他领域也得到广泛运用.Elvik R.等将基于时间系列的滑动窗口法推广到基于空间的滑动窗口法,并运用于道路交通事故多发点的鉴别,形成了基于滑动窗口法的道路事故多发路段鉴别方法[6].滑动窗口法在欧美等国家得到较为广泛的运用,甚至有的国家还据此编制成软件用于事故多发路段鉴别[7].

滑动窗口法能更好地反映道路沿线上事故点的集疏情况,从而能更准确地确定事故多发路段的具体地点.在我国应用滑动窗口法来鉴别事故多发路段将会是一种发展趋势.

1.2 滑动窗口法在事故多发路段鉴别中的运用

滑动窗口法鉴别事故多发路段的步骤如下:

(1)匹配交通事故数据.将统计期内的每起事故按事故发生地点桩号标注于道路上,形成沿道路纵向的事故点分布图.

(2)确定滑动窗的窗体长度和事故多发路段鉴别标准.依据道路类型,选择适当的滑动窗窗体长度,一般为0.1~1.0 km,并根据不同的窗体长度确定相应的事故多发路段鉴别标准.

(3)确定滑动步长并搜索事故多发路段.为了不出现遗漏区域,步长(s)应小于或等于窗体长度(l),即0<s≤l.在已知窗体长度、滑动步长及事故多发点鉴别标准后,即可沿道路纵向开始搜索事故多发路段,搜索过程如图1所示.当某个窗口上的事故数大于鉴别标准时,该窗口就是初步确定的事故多发路段.

图1 滑动窗法示意图Fig.1 A diagram of sliding window

(4)确定事故多发路段.滑动时,当第i个窗口为初步确定的事故多发路段时,记录该窗口的起始桩号(i-1)s.继续滑动窗口,若第i+1个窗口不是初步确定的事故多发路段,记录第i个窗口的终点桩号(i-1)s+l,得到的事故多发路段范围为[(i-1)s,(i-1)s+l].若在第i窗口之后的连续至第j个窗口全部为初步确定的事故多发路段,记录下第j个窗口的终点桩号(j-1)s+l,此时确定出的事故多发路段为[(i-1)s,(j-1)s+l].当连续多个窗口均为初步确定的事故多发路段时,事故多发路段鉴别过程如图2所示.

图2 事故多发段鉴别示意图Fig.2 A diagram of black spots identification

(5)事故多发路段鉴别结果汇总.给出每个事故多发路段起终点桩号、长度、各段发生的事故总数、累计事故多发路段里程等信息.

1.3 滑动窗口法鉴别事故多发路段存在的问题分析

在运用滑动窗口法鉴别事故多发路段时,若采用的窗体长度、滑动步长不合理,会出现事故多发路段遗漏或夸大两种情况.

遗漏事故多发路段的示例如图3(a)所示.假设事故多发路段鉴别标准为10起事故,取滑动步长等于窗体长度时,在滑动过程中窗口1(事故次数8起)和窗口2(事故次数8起)均不是初始的事故多发路段.但取滑动步长为窗体长度的1/2时,窗口3上的事故数达到了11起,为事故多发路段.

夸大事故多发路段的示例如图3(b)所示.同上,在滑动窗滑动过程中窗口1(事故次数12起)与窗口2(事故次数11起)均是初始的事故多发路段,此时,确定事故多发路段是从窗口1起点至窗口2终点所包含的路段.而交通事故主要集中于窗口1和窗口2的交界处,最有可能的事故多发路段则是窗口3所处的路段,窗口3左右侧多余的区段夸大了事故多发路段的范围.

图3 遗漏及夸大事故多发路段示例Fig.3 A diagram of the black spots be omitted and be exaggerated

2 数据来源及描述

数据来源于广东省交通运输厅科技项目“基于全社会成本的高速公路设计方案评价技术研究”.数据为在京珠高速公路粤北段并行路线(广乐高速公路)建成之前公安管理部门采集的京珠高速公路2006—2012年发生的1 170起交通事故.京珠高速公路粤北段全长109 km,设计速度为100 km/h和80 km/h,是1条典型的山岭区双向4车道高速公路.

在2006—2012年,京珠高速公路运行状态及运行条件并未发生突变,因此可将该期间视为同质期间.在同质期间内,统计期越长,事故多发路段与非事故多发路段的事故数之差越大,就越能凸显出事故多发路段,因此本研究将统计周期定为7年.

运用课题组开发的“交通事故与公路建设信息管理系统”,将7年间1 170起事故按事故发生地点匹配到公路路线上,得到了沿公路走向分布的交通事故分布图,如图4所示.

图4 京珠高速公路事故分布图Fig.4 The distribution of traffic accident in Jingzhu freeway

3 滑动窗窗体长度对事故多发路段鉴别的影响

3.1 不同窗体长度下的事故多发路段鉴别标准

确定事故多发路段的鉴别标准,是在一定置信水平及路段长度下确定出事故次数的临界值.若某一路段上实际发生的事故数大于事故次数临界值,该段路就是事故多发路段.窗体长度越长,事故次数临界值就越大.相关研究表明,路段上的事故一般服从泊松分布或负二项分布[8-9],因此,事故多发路段鉴别标准可按以下方法确定:

当事故次数服从泊松分布时,不同窗体长度下的事故多发路段鉴别标准可按式(1)计算确定.

式中:N为事故次数;Nmin为事故多发路段鉴别标准,即事故次数临界值;P(N≥Nmin)是事故次数大于事故次数临界值的概率;λ为平均每公里的事故次数;l为滑动窗窗体长度;a为显著性水平,事故多发路段鉴别时取5%.

当事故次数服从负二项分布时,不同窗体长度下的事故多发路段鉴别标准可按式(2)计算确定.

式中:k表示负二项分布的参数,即过度离散参数,k>0;Γ(·)为伽玛函数.

负二项分布为泊松分布的一种,因此本文按泊松分布下的计算公式计算.京珠高速公路粤北段平均每公里的事故次数为10.7起,即λ=10.7,按照式(1)可得出的不同窗体长度下的事故多发路段鉴别标准如表1所示.

表1 不同窗体长度下的事故多发路段鉴别标准Table 1 Different identification standard in different window size

3.2 不同窗体长度下事故多发路段鉴别结果及分析

本文用控制变量法分析窗体长度对事故多发路段鉴别结果的影响,事故多发路段鉴别结果用累计事故多发路段长度来表征.在固定滑动步长的基础上,通过改变窗体长度确定事故多发路段鉴别标准、鉴别事故多发路段并分析累计事故多发路段长度的变化情况.将该方法运用于京珠高速公路粤北段,得到不同窗体长度下事故多发路段鉴别结果,如图5所示.

图5 窗体长度与累计事故多发路段长度的关系Fig.5 The relationship of window size and cumulative length of black spots

由图5中关系可知,在固定滑动步长下,随着窗体长度的增加,累计事故多发路段长度均呈现逐渐增加的趋势.以滑动步长100 m为例,当窗体长度由100 m增至1 000 m时,累计事故多发路段长度由11.8 km增至24.6 km.即选择的窗体长度越长,鉴别出的事故多发路段越多,夸大事故多发路段的可能性也就越大.

4 滑动步长对事故多发路段鉴别的影响

同样运用控制变量法来分析滑动步长对事故多发路段鉴别结果的影响,结果如图6和图7所示.

图6 1 000 m窗体长度在不同滑动步长下的事故多发路段鉴别结果Fig.6 The result of black spots in different sliding length and 1 000 m window size

图7 滑动步长与累计事故多发路段长度的关系Fig.7 The relationship of window sliding length and cumulative length of black spots

分析滑动步长与累计事故多发路段长度的关系可知,在各种窗体长度下,随着滑动步长的增加,累计事故多发路段长度均呈逐渐减少趋势.以窗体长度为1 000 m为例(图6),当滑动步长由100 m增至1 000 m时,累计事故多发路段长度由27.7 km减少至17.0 km.选择的滑动步长越长,鉴别出的事故多发路段越少,遗漏事故多发路段的可能性也就越大.

5 最佳窗体长度和滑动步长探讨

窗体长度及滑动步长会明显地影响鉴别结果:窗体长度越长,夸大事故多发路段的可能性越大;滑动步长越长,遗漏事故多发路段的可能性越大.为此,本文应用分位数法探讨最佳窗体长度、滑动步长及其组合问题.分位数的计算公式为

式中:p为选定的分位数;MP是p分位数下序列数的数值;x(i)为系列数中第i个数的数值,i=1,2,3,…,n;k为序列数的序号,取为[(n+1)p],此处[]为取整符号;n为序列数所包含的数值个数.

本文选取第一四分位数作为遗漏事故多发路段的边界条件;第三四分位数作为夸大事故多发路段的边界条件;n为55(本例中为表3中的55种组合情况).第一四分位数p为1 4,序列号k=[(55+1)×1/4]=14,此时,M14=x(14)=159×100 m;第三四分位数p为3 4,序列号k=[(55+1)×3/4]=42,此时,M34=x(42)=215×100 m.因此,根据分位数法确定出的最合理的累计事故多发路段长度范围为[159,215].由最合理的累计事故多发路段长度取值范围,确定出的窗体长度及滑动步长,如表2中的阴影区域.

表2 最佳窗体长度及滑动步长下的累计事故多发路段Table 2 The cumulative black spots length in optimum window size and sliding length(100 m)

由表2可知:滑动窗窗体长度可根据道路线形等条件来取值,但不宜小于300 m,而滑动步长以不小于100 m为宜.进一步探讨最佳窗体长度与滑动步长的关系,建立最佳鉴别结果下窗体长度和滑动步长的关系,如图8所示.可知:滑动步长与窗体长度的比值在0.4~0.8时最佳.

图8 最佳鉴别结果下窗体长度和滑动步长的关系Fig.8 The relationship of window size and sliding length in optimum result

6 结论

本文主要结论如下:

(1)在运用滑动窗口法鉴别事故多发路段时,若采用的滑动窗体长度、滑动步长不合理,会出现事故多发路段遗漏或夸大.

(2)不同窗体长度下采用的事故多发路段鉴别标准不同,可根据滑动窗体长度使用泊松分布或负二项分布确定事故多发路段鉴别标准.

(3)应用滑动窗口法鉴别事故多发路段时,选择的窗体长度越长,夸大事故多发路段的可能性也越大;选择的滑动步长越长,遗漏事故多发路段的可能性也越大.

(4)可用分位数法确定最佳窗体长度及滑动步长.运用分位数法可知窗体长度可根据道路线形来取值,以不小于300 m为宜,滑动步长应不小于100 m,且滑动步长与窗体长度的比值在0.4~0.8时最佳.

对后续研究工作的展望如下:

(1)事故多发路段的鉴别还与交通量、道路线形等因素密切相关,在后续研究工作中可以在滑动窗口法中融入这些因素,以增加事故多发路段鉴别的可靠性.

(2)本文中滑动窗口法在鉴别事故多发路段时,仅仅给出了是否为事故多发路段,在后续工作中可以对事故多发路段进行危险等级研究,以达到事故多发路段的精细化鉴别.

猜你喜欢
窗体位数步长
中心差商公式变步长算法的计算终止条件
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
五次完全幂的少位数三进制展开
连续自然数及其乘积的位数分析
基于随机森林回归的智能手机用步长估计模型
试谈Access 2007数据库在林业档案管理中的应用
基于Qt的多窗体快速并行图形绘制方法研究
基于动态步长的无人机三维实时航迹规划
遥感卫星CCD相机量化位数的选择
叶丽娅的年龄