上海私车额度拍卖系统行为统计学习分析

2014-08-02 03:59冯苏苇
交通运输系统工程与信息 2014年3期
关键词:私车投放量概率分布

林 昌,冯苏苇

(1.福建江夏学院,福州350108;2.上海财经大学 公共经济与管理学院,上海200433)

上海私车额度拍卖系统行为统计学习分析

林 昌1,冯苏苇*2

(1.福建江夏学院,福州350108;2.上海财经大学 公共经济与管理学院,上海200433)

私车额度拍卖是政府为抑制交通需求所采取的一种经济控制手段.本文选用上海私车额度拍卖市场中车牌投放量、竞买人数和牌照均价三个关键变量作为研究对象,根据拍卖市场所表现出的整体运行规律,采用针对性的统计学习方法,深入分析它们之间存在的复杂的耦合互动关系.通过主成分分析发现,车牌投放量、竞买人数和牌照均价之间存在近似的线性约束关系,车牌投放量在其中起到了关键的制约作用,显著影响了竞买人数和牌照均价两个变量.同时,本文应用概率型自组织神经网络算法,根据有限的试验样本,精确地估计出这三个变量的各种概率分布函数,建立了准确的系统概率分布模型,从而客观、量化地描述出拍卖市场的系统行为.本文的研究比较精确地刻画了各市场要素之间的定量关系,可为确定车牌投放量、优化拍卖规则,以及规范市场秩序提供决策参考.

城市交通;统计学习方法;私车额度;主成分分析;概率密度估计

1 引言

近些年来,随着国民经济的快速发展及城镇居民收入水平的不断提高,我国私有汽车保有量呈现出持续高速增长的趋势.私有汽车的增长有力地带动了城市经济的发展,并显著地改善了人民的生活水平,但也产生了交通拥堵等一系列外部性问题,对城市管理及可持续发展提出了严峻的挑战.交通拥堵是一个全球性的共性问题,拥挤收费与车辆配额拍卖是当前交通需求管理中常用的市场手段[1].研究表明,合理征收一定的拥挤费用是治理交通拥堵的有效方法,并在实际应用中取得明显的成效[2].新加坡从上世纪70年代开始对私人机动车的拥有和使用实施严格的控制,1990年推行的牌照拍卖制度,大大降低了年平均机动车增长率,但也导致了高昂的牌照费用,以及抑制了人们对汽车的消费.Chin等人[3]和Chu[4]对新加坡牌照拍卖政策进行了回顾和评价,但车牌拍卖政策的绩效问题仍值得从不同角度、应用不同方法进行深入分析研究.

面对日趋刚性的私车消费需求,地方政府如何通过市场机制,有效配置车辆牌照和城市交通资源,是现阶段城市机动车管理的关键问题之一.我国部分沿海城市(如上海、温州、广州等)先后采用了车牌额度拍卖方式,对机动车的拥有权进行规制,引发了较为广泛的关注.上海私车额度拍卖市场最早形成于上世纪80年代,但在2003年之后,政策目标和管制效果才初步显现.从实践上看,当前实施车牌额度管制的国内外经验仍然比较欠缺.现有国内车牌额度拍卖市场的研究基本可分为两类:第一类是对拍卖市场机制的研究,这类文献着重对拍卖市场多个经济要素之间的因果关系进行理论建构和实证分析,如Song和Zhou对2008年上海车牌拍卖规则变更所产生的市场影响进行了评估[5],王金桃与罗维[6]分别就拍卖要素、规则过程,以及机制设计展开了定性研究;第二类研究侧重对拍卖政策所产生的宏观影响进行分析,如冯苏苇等人[7]采用社会成本收益分析和有无对比分析等方法,对政策进行了较为全面的定性与定量评估.总体而言,这些文献在研究以拍卖方式配置牌照资源方面取得了一定成果,但仍然缺乏从公共政策视角,对政策工具产生的市场影响和政策实施效果进行定量的分析与评估,从而难以获得对拍卖市场机制设计,以及牌照投放管理具有指导意义的量化分析结果.

从系统科学的角度,车牌拍卖市场构成了一个复杂的社会及经济系统,对其系统行为进行量化分析具有重要的理论价值,将理论成果运用于完善拍卖市场机制可取得显著的社会及经济效益.本文通过对拍卖市场进行细致的观察,从拍卖数据中选取车牌额度投放量、竞买人数和牌照均价三个关键因素作为主要研究对象;根据系统所表现出的整体运行规律,采用针对性的统计学习方法,对车牌拍卖市场的运行机制进行全面、深入地分析,比较精确地刻画了各市场要素之间的定量关系.在此基础之上,对当前拍卖市场面临的诸多问题,比如拍卖价格高涨及政策效力减弱等进行了简要分析.本文研究可为合理确定车牌投放量、优化拍卖规则,以及规范市场秩序提供一定的决策参考,从而促使车牌拍卖市场发挥出最优的资源配置功能.

2 私车牌照拍卖系统的相关性及主成分分析

车牌投放量、竞买人数、平均价格是反映车牌拍卖系统关键特征的3组核心数据,本文分别用xt,yt,zt来表示这3个时间序列.图1给出了2002.1-2013.7期间它们的变化趋势(为了便于数值计算,本文将这3个序列的数值进行规范处理,所有数值都以万为单位).从图中可以看出,这3组数据呈现出稳定、持续增长的趋势:12年间车牌投放量、竞买人数、平均价格分别增长了543%、487%和419%.

对xt,yt,zt分别进行相关分析发现:xt与yt之间的相关系数为0.683 458;xt与zt的相关系数为0.592 051;yt与zt的相关系数为0.448 518.通过相关系数的显著性检验可以进一步证明这3组数据之间存在很强的线性关系,因此可应用主成分分析的方法来进行数据降维并去除相关性.

图1 2002.1-2013.7车牌拍卖系统数据变化趋势图Fig.1 2002.1-2013.7 Shanghai private car licenses auction market data changing trends

主成分分析(Principal Component Analysis, PCA)[8]的出发点是从一组特征中计算出按重要性从大到小排序的新特征,要求新特征为原特征的线性组合,并且互不相关.PCA基于样本的协方差矩阵进行分析,是一种使变换结果具有最大方差的技术.就数据类型而言,高斯变量的所有信息均包含在其协方差矩阵中,因此PCA方法在实际应用中具有明显的现实意义.在拍卖系统行为分析过程中,每个月份的一组数据被视为一个3维列向量,即有.根据Karhunen-Loeve变换原理,样本向量φt可以用一个完备的正交归一化向量系ui;i=1,…,∞来展开,即有.由已知条件,这里训练集共包含138个训练样本,所有输入样本的总协方差矩阵为

这里 μ=[0 .664 9 1.466 6 4,050 5]T为所有样本的均值向量,m为样本总数.根据线性代数理论,ui是矩阵Σ的特征向量,可以通过求解协方差矩阵的特征方程得到.通过简单的数学计算得Σ的特征值(按降序排列)如下:

如果以前2个分量作为主成分,容易计算出它们所代表的数据占全部方差的比例为99.23%.可见数据中绝大部分信息都集中在了这两个主成分上,因此可选择它们作为样本的新特征,将样本投影到u1,u2所构成的平面上进行特征降维,以便于进一步的数据分析.图2和图3分别给出了车牌拍卖数据的PCA分析示意及降维结果.这里,车牌拍卖数据经PCA降维后所得数据用θt=[αt,βt]T,t=1,2,…,138来表示,并且有

图2 车牌拍卖系统数据PCA分析示意Fig.2 Principal component analysis of private car licenses auction market data

图3 车牌拍卖系统数据PCA降维及曲线拟合结果Fig.3 PCA dimensionality reduction and curve fitting results of auction market data

PCA分析不仅可以有效降低特征维数并消除原始数据中的噪声,这里我们更利用PCA来消除数据间的二阶相关性.通过上述分析可以发现,通过上述分析可以发现,xt,yt,zt数据之间存在如下的近似线性关系:

将式(4)视为一个二元线性回归模型,并对回归方程及回归系数进行显著性检验(F检验及t检验),经计算可得:F统计量=92.66,两个回归系数的t统计量分别为t1=8.62,t2=5.55.容易看出,对于绝大多数任意给定的显著性水平,回归方程及各回归系数都是显著的.

式(4)表明,不仅竞买人数随着车牌投放数量的增加而增长,车牌的拍卖价格也将随之而增高,这充分反映了这个市场中存在显著的“量价齐升”特征,说明车牌的投放数量远小于市场对牌照的刚性需求,亦即“车牌额度拍卖”制度很大程度上抑制了人们对本地私车牌照需求的增长;与此同时,牌照投放量也受到竞买人数和平均拍卖价格的正向影响,政府会根据牌照需求和价格的变化,合理调整牌照投放量,稳定拍卖市场.

3 私车牌照拍卖数据的概率分布特性分析

基于前一节的PCA分析将车牌拍卖数据进行降维,并得到图3所示的一组2维列向量θt=[αt,βt]T,t=1,2,…,138.易于验证αt,βt之间的相关系数为0,这是由Karhunen-Loeve变换的属性所决定的,由此说明αt,βt之间可能存在非线性的关系.进一步应用径向基(Radial Basis Function, RBF)神经网络进行回归分析,可以得到如图3所示的拟合曲线.尽管在理论上RBF能以任意精度逼近任意非线性映射,并且求解结果稳定,但从图3的分析结果可以看出:采用回归的方法难以精确地描述车牌拍卖系统中各变量之间的数学关系.为此,可以考虑从概率分布的角度进行分析.

由上一节的PCA分析可知,xt,yt,zt变量之间存在近似的线性关系,因此在分析变量之间的关系时,可以仅考虑其中任意两个变量之间(如xt,zt)的关系,而第三个变量可以由式(3)线性确定,由此可简化数据的分析过程并便于对分析结果进行明确的解释.这里以xt,zt变量为研究对象,分别计算它们的概率分布函数p(x)、p(z)及它们之间的联合概率分布函数p(x,z).在得到这些概率分布之后,即可用于准确地分析、描述系统的各种行为.比如,由条件概率公式,就能根据车牌投放量合理地推断出平均交易价格的区间.

由于试验中样本集合的数据比较有限(仅有138组数据),因此应用有限的数据来准确地估计出变量的各种概率分布函数是进行有效统计分析的关键及必备前提.为此我们采用Lin等人[9]提出的概率型自组织(Probabilistic Self-Organizing Network,PSON)神经网络算法来进行概率密度估计. PSON以Kullback-Leibler偏差(Kullback-Leibler Divergence,KLD)为优化目标,采用随机逼近方法进行求解.KLD也被称为相对熵,它反映了p(x)与pˆ(x)之间的偏差程度.假设输入样本的真实概率分布为p(x),其估计分布为pˆ(x),则它们之间KLD定义为

当KLD越小,p(x)与 pˆ(x)越相似;当且仅当p(x)与pˆ(x)完全相同时,KLD=0.KLD可近似地等同于对数似然函数的数学期望,因此具有内在的泛化能力.PSON将信息论、最大似然估计、随机逼近、自组织神经网络等多种理论方法密切结合;可真正应用异质混合来进行概率估计;并采用随机梯度下降学习方法,能有效克服局部极值点而获得全局最优或接近全局最优的解.由于这些显著的特点,使得PSON不论应用于大的数据训练样本集,还是应用于小数据集,都能获得非常精确的概率估计精度,并已在实际应用中得到了广泛的验证[9].

应用PSON,我们可以得到准确的 p(x,z)与p(x)估计函数,如图4和5所示.从图4可以看出,p(x,z)可以用一个二维高斯分布函数来近似表示为

从多方面分析可以发现p(z)也近似为高斯分布函数.在数理统计中,中心极限定律说明独立同分布的随机变量之和近似地服从正态分布,这一定律对变量均值同样成立,因此可以推测:在拍卖过程中,所有的成交价格应该是相互独立的.由此可以说明所研究的车牌拍卖市场应为一充分自由竞争的市场.

图4 联合概率分布函数 p(x,z)的估计函数Fig.4 Estimate of joint probability distribution functionp(x,z)

本文应用统计学习理论,对上海市私车牌照拍卖市场的内在运作规律进行深入的分析.通过PCA分析可以发现,车牌投放量、竞买人数、平均价格这三个关键指标中存在显著的线性关系.进一步的分析表明,这个市场中存在“量价齐升”的特性.说明车牌投放量在其中起到了关键的制约作用,证明了政府通过控制车牌投放量,显著地抑制了本地牌照汽车数量的增长.

在PCA分析的基础上,我们应用概率型自组织神经网络来精确地估计出各关键变量的概率分布及联合概率分布函数,从而用概率统计的方法准确地描述了系统的行为.通过分析,我们合理地推测通过分析,我们合理地推测在当前政府管制政策较为宽松的前提下,车牌拍卖市场充分呈现出自由竞争的特性.相比“摇号”等方式,车牌拍卖能更充分地反映出不同群体对车牌需求的迫切程度,并通过市场竞争机制最为合理地满足供需双方的要求,最大程度地实现了市场配置效率.由此也说明现阶段应从不断增强拍卖信息透明度着手,进一步完善市场的自由竞争机制,从而最大限度地保证有限资源的合理配置使用.其次,建议公开、合理使用拍卖所得收益,将这些资金充分应用于道路和轨道交通建设,有效提高城市交通运载能力,实现社会福利在不同利益相关者之间的合理转移.最后,应进一步加强差异化路权的配置和监管措施,积极促进路权的公平分配和提升政策效力.

在得到准确的p(x,z)之后,易于求得各种条件概率函数.例如,图6给出了xt=0.8时zt的条件概率分布 p(z |x=0.8).可见,此时平均成交价主要分布在[3.671 3,5.715 9]的数值区间之内.也就是说,通过对系统进行深入的统计分析,我们完全能够根据车牌投放数量,合理地推测出成交价格区间.

图5 p(x)的估计函数Fig.5 Estimate of probability distribution functionp(x)

图6 xt=0.8时 zt的条件概率 p(z |x=0.8)Fig.6 Conditional probability ofzt(p(z |x=0.8),xt=0.8)

4 研究结论

参考文献:

[1]S Muthukrishnan.Vehicle ownership and usage charges [J].Transport Policy.2010,17(6):398-408.

[2]B Schaller.New York city’s congestion pricing experi⁃ence and implications for road pricing acceptance in the united states[J].Transport Policy.2010,17(4):266-273.

[3]A Chin,P Smith.Automobile ownership and government policy:The economics of Singapore's vehicle quota scheme[J].Transportation Research A.1997,31(2): 129-140.

[4]S Chu.Sealed v/s open bids for certificates of entitle⁃ment under the vehicle quota system in Singapore[J]. Transportation.2011,38(2):215-226.

[5]F T Song,W X Zhou.Analyzing the prices of the most ex⁃pensive sheet iron all over the world:Modeling,predic⁃tion and regime change[J].Physica A:Statistical Me⁃chanics and its Applications.2010,389(17):3538-3845.

[6]王金桃,罗维.汽车牌照额度拍卖规则调整的理论分析与实证研究[J].系统管理学报.2010,19(6):610-617.[WANG J T,LUO W.Study on the rules adjust⁃ment of vehicle license auction[J].Journal of System& Management.2010,19(6):610-617.]

[7]冯苏苇,马祖琦,余凯.上海私车牌照拍卖政策效果分析 [J].综合运输.2011,353(1):36-41.[FENG S W, MA Z Q,YU K.Performance analysis on the private ve⁃hicle plate auction in Shanghai[J].Comprehensive Trans⁃portation.2011,353(1):36-41.]

[8]张学工.模式识别[M].第三版.北京:清华大学出版社.[ZHANG X G.Pattern recognition[M].Third Edi⁃tion.Beijing:Tsinghua University Press,2010.]

[9]C Lin,C X Yu.Modified self-organizing mixture net⁃work for probability density estimation and classification [C].Proceedings of the 2013 International Joint Confer⁃ence on Neural Networks.Dallas,2013.

Behavior Analysis on Shanghai Private Car License Auction Market with Statistical Learning Methods

LIN Chang1,FENG Su-wei2
(1.Fujian Jiangxia University,Fuzhou 350108,China;2.Shanghai University of Finance and Economics,Shanghai 200433,China)

The quota auction of private car licenses is one of the market-based regulatory measures used by the local government to control the vehicle demand.According to the operating rules of the auction market, this paper selects three key elements:the released quotas,the number of bidders and the average prices as analytical variables.It studies the system behaviors and the coupling interactions among the key elements with statistical learning methods.By using the principal component analysis,the paper proposes a linear constraining relationship among the key elements,which quantitatively shows that the released quotas play an important role on effecting and restricting the other two elements.Meanwhile,the probabilistic self-organizing network is used to accurately estimate the joint-probability and the conditional-probability distributions of these elements from the limited training samples.Finally,a probability distribution model is developed to describe the behavior of the auction market objectively and quantitatively.Based on the precise characterization of the relationship between the key elements,the paper provides some constructive advice on determining the released quotas,optimizing the auction rules and regulating market order.

urban transportation;statistical learning method;private car license quota;principal component analysis;probability density estimation

1009-6744(2014)03-0221-06

U491

A

2013-09-10

2013-12-31录用日期:2014-01-07

教育部社科规划基金项目(11YJA790029);上海市哲学社会科学规划一般课题(2009BCK002).

林昌(1971-),男,高级工程师,博士.*通信作者:fsuwei@mail.shufe.edu.cn

猜你喜欢
私车投放量概率分布
离散型概率分布的ORB图像特征点误匹配剔除算法
共享单车投放调度研究
加州鲈上演“王者归来”,2019行情强势回归!各主产区大鱼库存告急,春苗投放量锐减30%,今年头批鱼开盘价值得期待?
关于概率分布函数定义的辨析
基于利益链合作模式的抗生素耐药性控制模型
年末银行间资金面持续偏紧,分析认为央行隐性加息
基于概率分布的PPP项目风险承担支出测算
医生私车公用撞伤人 医院担责
2015年上海私车额度投放约10万张
依赖于时滞概率分布的不确定细胞神经网络的鲁棒稳定性