公路运输量统计中的计量误差分析

2012-09-26 09:11孙磊磊
统计与决策 2012年12期
关键词:运输量调查员被调查者

孙磊磊,李 琼

0 引言

在公路运输量调查统计中的误差分为抽样误差和非抽样误差,其性质有所不同。抽样误差是一种随机误差,没有系统性的偏差,误差的大小可以用公式计算,它随着样本量的增大而减少,是抽样调查不可避免的,抽样误差在概率抽样的条件下是可以计量,并通过抽样设计加以控制;而非抽样误差恰恰相反,它是任何调查都可能产生的,并不随样本量增大而减少,它既难以计算又难以控制。即使采用全面调查,虽然没有抽样误差,但如果非抽样误差足够大时,也会使全部的调查结果被歪曲,因而在大样本的抽样调查中,非抽样误差成为影响调查结果可靠程度的主要问题。在对公路运输量统计的研究中,对统计方法和抽样误差的研究比较多,而对非抽样误差的研究相对较少,往往只是对一些非抽样误差的类型进行阐述,或者是仅仅提出一些措施,但是对所述的措施仅仅停留在主观上,没有理论和客观的依据。本文拟通过构建数学模型,对公路运输量统计非抽样误差中的计量误差进行研究分析,以期为公路运输量调查实践中采取的措施提供理论上的支持。

1 计量误差的成因分析

按照非抽样误差产生的原因,把非抽样误差分为:抽样框误差、无回答误差和计量误差。本文主要对公路运输量调查统计中的计量误差进行分析。

计量误差是指在公路运输量调查统计中所获得的数据与所欲调查项目的真值之间不一致而产生的误差。无论是全面调查还是抽样调查,计量误差都是存在的。在公路运输量统计调查中,计量误差的主要成因来设计误差、调查者误差、被调查者误差和其他误差。

(1)设计误差。也即调查设计不周引起的误差。运输统计人员在设计审计调查表时,由于设计方案不够科学、不够完善或存在某些欠缺而产生误差。如公路运输调查项目涵义不清楚,用词模糊不清,计量单位不统一等。

(2)调查者误差。公路运输量调查统计人员的水平和工作是否认真会反映到运输量统计结果中。在运输量调查统计中,有些计量误差是由调查员工作不认真,如记录错误等造成的;有些是因为本人的业务水平与能力,所引起的误差。由于粗心造成的误差大多为随机的,而由于本人的某种习惯,如听不懂方言,理解上的错误或进行诱导所引起的误差往往是系统的。又如,公运输量调查统计人员由于缺少培训导致在调查过程中态度生硬,导致被调查者的不合作等。

(3)被调查者误差。在公路运输量调查统计的计量误差分析中,被调查者误差是最重要的一种,这是指被调查者在运输量调查过程中没有给出真实的回答。当然这里不包括前面提到的对问题不理解以及调查者原因导致的计量误差。可以把被调查者误差分为两类:无意识误差和有意识误差。无意识误差主要表现是回忆误差,指对调查内容记忆不清而回答是真,无意识误差还包括“倾向数字”。比如在货运调查中回答运输情况时,对运输货物重量的回答上,被调查者往往倾向于整数,以及5的倍数等,尽管真实的数值并非如此。被调查者有意识的回答错误则多半是由于问题的敏感或其他原因使回答具有某种倾向性,如在货运调查中,对于运输货物重量的填报上,由于害怕相关部门对超重的惩罚,尽管在调查中,调查员把调查目的告诉被调查者,或告知被调查者不会对其进行罚款等,但是被调查者仍然会有对货物重量倾向低报的可能。

无意识误差可以看作是随机的,不会带来估计偏差。但是有意识误差则不然,由于它存在倾向性,所以会导致严重的估计偏差。一般而言,这种误差的倾向性,是可以根据经验和实际情况的分析是可以察觉的。

(4)其他误差。计量误差还可能其他的来源,比如在调查表录入的过程中,发生的错误;整理误差,在对回收调查表整理过程中,由于疏忽而引起样本数据资料计算、汇总错误。在样本数据采集后,要经过多次的编辑,包括一些数据的计算,如旅客运输周转量调整系数的计算,在这些过程中的每一个环节,若不注意都可能造成错误,从而引起新的误差。

2 公路运输量统计中的计量误差影响分析

对于计量误差的研究,国内外已有大量的文献展开讨论,这里仅用最基本的计量误差模型对公路运输量调查统计中的计量误差的影响做出理论上的分析。

在理论上可以假设对第i个车辆单元进行多次重复性调查并做计量,令

其中,ui为第i个车辆单元项目真值;eit为第i个车辆单元真值第t次计量中的误差。对于ui,在公路运输量调查统计中一般都具体存在的一个确定值,如车轴数、运输距离、货车载重、旅客数量、运输趟次等都存在具体的确定值;在公路运输量调查统计中我们一般不涉及抽象模糊的,很难定义的真值,不对主观抽象内容进行调查。

在对同一个车辆单元项目进行重复计量的情况下,eit通常假定是服从正态分布的,并令

其中,Bi为计量的偏倚。如果Bi=0,说明虽有计量误差,但它是随机的,其期望值为零;反之,若Bi≠0,则说明对i车辆单元项目的计量存在系统性偏倚。

对于特定的i车辆单元,偏倚Bi是个常量,但由于不同的i,或者对于不同的统计项目,Bi可能不同,

则称B为所有车辆单元的常数偏倚。

不妨令

其中,dit为对每个车辆单元i在第t次计量时误差的波动部分。显然,dit与eit具有形同的分布,其期望值E(diti)=0。因此有

表明车辆单元i的具体观测结果,它受其均值、计量系统偏倚及计量随机误差几个因素的影响。

进一步令

则是对车辆单元i进行t次计量后的平均,也即

如前所述,是计量过程中的随机误差,它所表现的是实际测量值yit与包括偏倚在内的测量均值ui′之间的差异。

由(8)式,有

其中

是u′i在总体中的均值。

在公路运输量调查中,抽取容量为n的样本,令

对样本加以平均,则(5.24)式可以写为

其中,uˉ为真值ui的均值,由此得到均方误差的公式:

式(13)右边的第一项为计量随机误差,第二项为抽样方差,第三项为计量偏倚的平方,最后一项为协方差,由于有E(diti)=0,故此项通常为零。

通过对上式的分析,可以说明以下几个问题:

首先,如果计量中存在偏倚,结果会导致估计量产生偏倚。

其次,偏倚虽然可以影响估计量,但是不会影响方差估计。因为如果每个yi中都包含偏倚,其均值yˉ中也包含偏倚,在计算∑(yi-过程中,偏倚部分互相抵消。

第三,若计量误差dit之间存在相关,如在同一个调查员对某个区域的车辆的调查,计量误差之间的相关性就是可能的。这时

其中,θw为样本内相关系数。即使θw很小,对V(dˉt)的影响也是巨大的。例如:θw=0.1,n=100,则1+(100-1)10.1=10.9,即为原来的10.9倍。从中可以看出,如果调查员中的某一个调查员对调查方案理解有偏差,就可能导致调查结果的误差增大,对调查精度影响明显,从而必须要对公路运输量调查员进行规范化的培训,减少计量误差之间的相关性而导致的误差。

第四,对均方误差公式中的计量误差V(dˉt),抽样方差V(uˉ′),偏倚平方 (u′-uˉ)2=B2,进一步展开,则均方误差公式又可写为:

通过以上的分析可知,在公路运输量调查统计中,由于样本车辆n比较大,在均方误差估计中,由于抽样产生的误差会随着n的增大而减小的,但是计量误差中的θw和B2,不会随n的增大而减小,相反随着n的增大样本内相关系数θw对计量误差影响会增大。因此,可以得出这样的结论,在公路运输量调查统计中,抽样误差会随着样本的增加而减少,在时间和费用等方面允许的情况下,我们可以通过增加样本量的方式来减少抽样误差对结果的影响。但是样本量的增加不可能减少计量误差,相反随着样本量的增加甚至可能会导致计量误差的增大,因此在公路运输量调查统计过程中,我们一定要认识到调查过程中的质量控制的重要性。

3 公路运输量统计中的计量误差的控制

在公路运输量调查过程中,计量误差涉及的内容最为广泛,要减少计量误差需要对调查过程进行全程的质量控制。

(1)调查设计方面。有能力的调查组织者能够充分利用可以使用的调查员以及其他有限的资源,设计出更好的调查程序,在最大程度上控制调查过程中产生的计量误差。在公路运输量的调查组织程序设计好后,应组织有关人员进行讨论,还应在正式调查之前进行预备调查,在实践中对调查组织程序进行检验。如2008年的公路水路运输量专项调查方案就是在2006年的试点方案的基础上而设计的。公路运输量的调查设计阶段是整个调查活动的起点,其专业技术性较强,对人员素质和技能要求较高,一旦设计出现问题,其造成的误差以及错误往往是难以补救的。如果公路运输量调查设计人员具有丰富的专业知识,又了解实际情况,由调查设计所引起的误差是可能得到有效预防的。

(2)现场准备方面。在公路运输量正式调查之前,需要做很多的准备工作,以保证运输量调查工作能够按时、保质的完成。这些准备工作质量的好坏,对以后的计量误差会产生直接的影响。涉及到主要准备工作有招聘调查员、对调查员的培训、调查手册的编写。

(3)调查结果审核方面。公路运输量调查中的数据审核是对调查质量进行控制的一道工序,也是减少计量误差的有效方法。进行公路运输量数据审核的目的是为了保证调查数据的完整性、一致性以及有效性。对于数据的审核应该贯穿整个公路运输量调查过程。

公路运输量调查数据的审核主要有数据完整性审核和一致性审核。公路运输量调查数据的完整性审核,主要是指审核调查表中的必填项是否填写,如货运车辆的载货种类、载货里程等。数据的一致性审核,主要是审核数据是否存在逻辑性错误。比如调查中出现,在调查期内燃油消耗很小甚至为0,而车辆实际行驶里程又很大,这样的错误就属于一致性审核需要审核的对象,当然这样的错误在调查员填表的时候,认真填写的话,很容易发现,并且及时处理。数据的有效性审核,主要是审核填报的数据是否存在非法数据。

对于公路运输量调查数据的审核一般包括数据搜集过程中的审核和数据收集完毕后的审核。

(1)数据收集过程中的审核。在公路运输量调查过程中,公路运输量调查员在调查进行中根据培训得到的知识,以及常识或经验,可以判断车主和司机的答案是否属于“可接受”范围。在调查结束后,立即审核所做的记录,由于刚才的信息记忆犹新,很容易找到被调查者并核查确切信息,因此,发现问题并切纠正错误的机会很大。这就要求对公路运输量调查员的招聘和培训必须做的很踏实,也就是对公路运输量调查员的业务素质和思想素质的要求。

(2)数据收集完毕后的审核。在公路运输量调查中,比较全面、比较复杂的数据审核工作是在调查数据收集完成之后进行的。数据审核过程应该分为两个步骤,以保证数据的质量。第一步,由了解情况、经验丰富的相关工作人员或专家进行审核,主要是对数据的完整性和有效性进行审核。第二步,由计算机软件来实现数据的审核。将调查数据录入到相应的运输量调查软件中,由计算机程序对数据的一致性进行审核。

4 结论

计量误差作为影响公路运输量调查统计结果的主要误差部分,必须要对其成因和影响进行深入的分析研究,并采取适当措施,才能使公路运输量调查中的计量误差控制在合理的范围内。

[1]孙磊磊.公路运输量调查统计方法研究[D].西安:长安大学,2009.

[2]冯士雍,倪加勋,邹国华.抽样调查理论与方法[M].北京.中国统计出版社,1998.

[3]李纪治.王建伟.提高汽车运输抽样精度的途径与方法[J].中国公路学报,1996,9(2).

猜你喜欢
运输量调查员被调查者
提升乡村社会调查员素养浅析 以农村固定观察点调查员为例
一个可供选择的全随机化模型
国内客运恢复快速 航司第一季度亏损程度收窄
简析双城区病虫害乡村调查员管理办法
00后阅读偏好的三大特点
9月份中国民航旅客运输量同比增长7.9%
我国家事调查员运行现状研究
建立社会调查员制度,深入开展“关爱明天,普法先行”教育活动
你为何不能幸福地工作?