城市规划与管理中的数据分析和信息化建设

2018-05-08 02:35李栋北京清华同衡规划设计研究院技术创新中心常务副主任
中华建设 2018年4期
关键词:信息化

李栋 北京清华同衡规划设计研究院技术创新中心常务副主任

当下数据发展有以下几个大趋势:

首先全社会数据可用性极大增加。当前全球超30亿人、约170亿设备联网在线,这些设备无时无刻不在产生数据。据统计,人类从直立行走到2003年所创造数据量总计5艾字节,到2007年短短几年间数据量已超了300艾字节,而到了2015年,全球网络流量接连翻番,数据量达到接近1000艾字节,预测到2025年,全球数据总量将增长至现在的200倍到170,000艾字节。可以说展望未来,大数据时代其实还没有真正来临,数据发展将呈现更加富集的趋势。

图1 大数据富集趋势

其次计算能力和算法挖掘手段全面提升。计算能力得到飞速强化。强大的计算机通过网络连接,大量数据的并行处理成为可能,硬件方面也有很大的提升。现在的手机计算能力已经远远超过了早期的电脑。而且所使用的算法获得了全面的更新。十余年机器学习发展基础上,可以将这些庞大的数据和算力用于算法的训练,开发新规则来执行日益复杂的任务。以深度学习为代表的新手段得到持续优化,启发新服务,刺激了对AI领域各方面的投资和研究。数据、设备、算法几个方面快速的发展,终将整个人类社会信息化的趋势逐渐推向一个又一个高潮。

一、信息化的两种场景

数据分析只是广义信息化的一个环节,我们可以简单做下分类,一类是流程信息化(狭义信息化),指在既有机制下对业务的信息化改造,如政府委办局的办公OA等,流程和机制是预先规定好的。另一类是决策智能化(广义信息化),比如说我们要对城市发展的信息化做整合,而城市管理的规则和机制是开放的、不断发展和变化的,我们的挑战是如何运用信息化的手段处理这种挑战。利用信息化对开放系统进行综合决策,需要采集整理决策所需信息、设计多种决策方案、对方案开展模拟与预评估、对方案进行比选优化,对方案实施开展周期性监控、方案实施后评估等等,这是一个值得开展长期探索的方向,也是数据应用高附加值所在之处。

流程信息化,规则相对清晰、条件相对封闭、目标相对明确。而决策智能化规则相对模糊、条件相对开放、目标不够明确,依赖更多、更复杂、非标准化信息输入作为基础。当面对决策智能化的时候,作为规划师往往会感到信息焦虑以及对工具的渴求,会怀疑自己是不是遗漏了什么关键信息、从而对项目造成一些决定性影响,这是所有咨询者、决策者共同面对的一个很大挑战。

以规划编制为例,即使是同一个地区,即使是遵循相同的规划编制技术要求等规则,但由于每一次规划编制的背景不同、规划目标和实施手段也大相径庭,因此对规划内容本身(即待决策的方案)的评判标准也会存在很大的差异,更毋论如何对规划方案进行优化和持续改进了。

如果从一个更大的、数据的视角来看待这个问题,流程信息化指利用自有数据解决自己的问题,比如财务报销自动化等,而决策智能化则意味着要综合使用自有数据和他类数据(alternative data),一起来解决自己的问题。

他类数据是指全社会其他部门数字化、信息化之后的积累,例如原本用于运营商计费和网优的手机信令数据,原本用于公交系统计费的市政一卡通刷卡数据,原本用于网站和APP经营的移动互联网流量内容数据等等。我们现在之所以能够在城市规划中利用这些大数据,其实都要感谢早年其他部门所做的信息化基础工作,虽然这些数据出现的动机并非是服务规划师。推广而言,所以若想解决城市这类开放系统的决策智能化问题,就需要全社会每个部门都把自己的信息化工作做好。

二、建立基础“认知闭环”

规划师扮演的是决策咨询的角色,为决策者出谋划策。因此我们自己首先要建立一个逻辑闭环,按照了解、认识、见解、行动的顺序。一般规划师往往更关注感知、认知与决策这三个环节,但对于“行动”,或者说“实施”,则是规划或者咨询业者不太擅长的。规划信息化的工作其实在另一个层面就是在做“行动”或“实施”,在不断地修补、完善信息化系统。所以我也特别希望规划从业者能够再多走一步,将分析出来的好方案亲手实现出来,建立起完整的数据思维闭环。

数据思维体现为对数据应用的工作流程(workflow),一是感知:数据的清洗收集,对现实了解得更精细;二是测度:数据的分析评价,对状况判断得更合理;三是挖掘:数据的综合解读,对原因理解得更深入。

1.数据感知:对现实的精细了解

用精细化的数据感知来满足规划师对于信息渴求的状态,例如2017年做朝阳区人口统计时,数据分析的目的不仅想了解朝阳区的总人口规模,还想知道人口分布的具体位置、根据每个位置人口活动的24小时规律进行分类等等。

图2 朝阳区人口分布

图3 朝阳区人口24小时活动规律

再进一步细化,比如了解CBD片区每个小建筑里面大致人口分布的多少,工作日与非工作日的变化。甚至包括对每一个网格,都想去了解人口构成的结构与信息等等。

多源数据耦合、交叉检验。当数据源不同时需要做一些检验,例如对一个地区的移动信令数据、滴滴出行数据、互联网定位数据做交叉对比,判断出哪个数据相对更合理。

2.数据测度:分析与评价

通过设计评价指标体系来联系物理世界与信息世界。将信息空间和物理空间联系起来就是信息-物理系统(Cyber-Physical System),二者通过指标体系相互反馈、调控。

图4 信息-物理系统

通过算法工具对状况的合理判断。数据评价包括许多内容,包括评价方式。单纯把收集的数据落在图上,很难直观看出规律,需要模型、算法、工具来帮助形成一定的结构化指标,从而可得到诸如聚类、分析等结论。例如下面右图中的方块是共享自行车骑行轨迹的时空热点,在相同时间空间,可以识别出哪里是骑行行为相对比较聚集的区域,并进一步分析聚集的原因和影响等。

图5 自行车骑行轨迹热点时空分析

此外还需要把非结构化数据(如街景图片)变成可计算的结构化指标,这是大数据很关键的核心问题,需要借助专门的工具或一些技术手段来实现。

数据评价:对状况的合理判断。在充分感知数据、分析评价数据之后,就加入结论判断环节了。例如我们可以根据骑行轨迹、街道状况等要素,对骑行环境做出综合评判。将结构化与非结构化数据叠合后,形成关键指标,根据问题和目标进行打分,最后得出好中差的观点。

叠合分析的应用示例。比如在对北京危险品运输风险的大数据分析工作中,通过将危险品车辆GPS和同一时段人口分布进行重叠,识别出重叠率高的危险路段。左边是进城的路段中重合较高的部分、右边是危险品有大量聚集并停留较长时间的区域,把这些路段与片区识别出来,可以较好地预防一些危险品的泄露、爆炸等事故,避免不必要的生命财产损失。

图6 危险品车辆出入城时段高重叠区(左);危险品车集中地(右)

在设施评估案例里,我们对朝阳区32个2、3级医院开展了就诊人群分析,用医院的到访人口来源与分布情况,观测京内京外比重,看哪些医院是受外地人欢迎。

图7 千人床位指标推算的理论覆盖范围(左);手机数据表示的实际覆盖范围(右)

传统医院的配给指标是以一个区域的千人床位数来确定的,那我们可以根据这个指标反推出一个医院的理论覆盖范围,如图7(左),但用人流数据可以更直观的看到一个医院的实际覆盖范围,如图7(右)。通过对比,我们可以得到一些初步结论:一是四环以外的人口聚集区缺乏医疗设施的覆盖;二是医院的就诊来源主要但不限于医院周边;三是某些外围的卫生设施如地坛医院存在覆盖范围重叠浪费的情况。

图8 朝阳区32个二、三级医院评估

结合人口的本外地属性,可以看到,中国医学院肿瘤医院的外地患者最多,占到了44%,而其他的医院则逐次下降。

3.数据挖掘:深入理解现象背后的机制和规律

除通过数据分析了解现象本身,继续探索现象背后发生的原因规律及内在机制,在大量评价指标中找出隐藏的规律,简单的方式如线性回归,对于城市这样非线性的复杂系统,最基础但有效的包括随机森林等。以骑行行为挖掘为例,随机森林模型展示了影响骑行轨迹分布权重较大的因素,主要包括道路长度、功能兴趣点POI 总数、道路适宜度水平、公交车站300米覆盖路段长等。

图9 上海城市人口随机森林模型

以上海城市人口结构挖掘为例,随机森林模型所示,影响上海年轻人分布权重较大的因素主要包括外地人口比重、最近轨道站点距离等。

表1 随机森林各变量权重计算结果

最后,将利用仿真、模拟为主要手段,反向使用前述数据挖掘得到的结果,应用所获得的规律。通过改变某些指标(对应城市规划或管理措施),使得决策树的走向发生变化,也即开展了一次政策预演,反复试算,使得我们可以基于隐含的规律对城市发展进行大量的沙箱模拟,寻求政策工具的最佳组合。

因此自然而然地会观察到,围绕数据流开展的这些工作,无论是处理非结构化数据还是剖析非线性关系时,我们都在严重地依赖算法作为工具。在数据时代,算法的价值怎么重视都不为过。

全社会广义信息化需求将越来越旺盛。如果把上述数据流过程拓展到整个社会来观察,会发现他们是相辅相成的,不同行业之间需要互相依赖彼此对数据的感知、测度、挖掘,最终实现整个社会的信息化和智能化。

图10 城市规划与运行管理信息化

三、城市规划与运行管理信息化

1.信息化系统

建设信息化系统体现为解决问题的创造性、实践性策略。主要强调三个原则,一是以人为本:同理用户感触、贴近用户需求。二是模糊推进:在知识和能力的范围上保留足够弹性、充分尝试。三是原型迭代:由粗略简易的原型开始设计和实施,快速持续地进行修正。

以呼市新城区居家养老服务体系为例,其涵盖了政策法规、运作机制、引导监督机制、居家养老智慧管理平台等内容,以老年人需求为导向,社会服务力量整合,政府监管体系为目标,提供多元化、专业化、高品质的养老服务。

2.化系统实施

首先是需求分析。信息技术为养老精细化管理与精准服务提供新的方法和手段,主要用户面向政府、老人、服务单位。

图11 呼市新城区居家养老服务体系需求分析

其次是定位与策略。我们认为居家养老智慧管理平台应该实现连通政府各级部门、老人、服务单位等对象的基本能力,促使信息互通互联、养老业务全过程留痕、线上线下有效互动,实现老年事务的联动管理、服务单位的监督监管、智慧养老决策支持等核心功能。

实施中利用软硬件进行整合支撑。以养老卡为核心载体,利用手机APP、信息查询一体机、智能穿戴设备等各类线上线下手段,采集老人基本信息、为老交易、健康状况等各类数据,联动卫计、民政等多个政府部门的业务数据,实现老人数据的全面覆盖和联动更新,在此基础上合理实施技术架构,通过统一的底层数据库支撑上层各类应用系统,采用模块化的方式,后期可按照需求进行功能的增减调整。

上线运行、迭代维护。信息系统建设交付其实只是一个开始,更加重要的是提供长期的线上线下运维服务。目前平台初步实现了国家及各地的相关公开数据的整合,为新城区居家养老服务体系建设提供参考;融合本地老年人各类健康数据,全方位实时掌握老人健康信息;实现服务商信息的统计、审核、以及监管,对服务商相关数据收集、分析;为政府部门对养老事业相关决策提供科学、客观的数据支撑。

四、展望智能化的远景

我们重新把视角聚焦在城市规划与管理上,未来远景目标是在规划师个体认知闭环的基础上,完善城市发展相关业务智能化的闭环。

以决策咨询为视角,有两个关键支撑点,一方面是必须整合多源大数据,数据可获得性、维度、属性决定了数据分析、信息化工作的基本面。另一方面是必须熟悉业务领域需求,应该说数据分析和挖掘的视角是多样化的,而城市问题又是如此复杂,需要识别并紧密围绕领域内的关键需求来工作,科学设计指标体系,指导实施措施,在有限的数据分析结论中催生最大化的现实价值。

数据思维与实施思维并非是割裂的,更好的做法是把二者有机地结合在一起。数据思维可能比较阳春白雪,进行大数据分析,做各种酷炫的展示,属于脑力劳动,但其实真正发挥作用的也许是一些不起眼的信息化项目、实干项目,姑且称之为下里巴人。我正试图在二者之间建立一种能够相互促进的正向反馈模式,未来肯定还需要大量的探索和完善。

猜你喜欢
信息化
月“睹”教育信息化
月“睹”教育信息化
幼儿教育信息化策略初探
水利信息化
“云会计”在中小企业会计信息化中的应用分析
论述金融管理信息化的创新与应用实践
基于会计信息化下的企业内部审计探讨
如何构建交通信息化的防护墙?
法律为信息化护航
审计信息化与会计信息化的关系研究