大数据视域下的城市公共危机案例库建设研究

2016-05-14 20:24刘翔
现代情报 2016年8期
关键词:案例库大数据

刘翔

〔摘要〕面对城市危机事件的频繁发生,结构化研究资料匮乏等问题的日益突出。大数据技术的发展为城市公共危机案例库系统的研究提供了新的机遇。基于大数据技术的案例库系统研究显得十分重要。分析大数据的内涵、思维模式及基于大数据技术的实体研究,构建大数据视域下的城市公共危机案例库系统,包括功能设计、系统架构、系统实现等。将大数据的关联思维、总体思维、容错思维、智能思维等引入到案例库的构建中,从技术实现和功能需求上为城市危机管理的减缓工作提供了一些新的思路,尝试解决传统案例处理模式无法实现的功能。

〔关键词〕大数据;城市公共危机;案例库

DOI:10.3969/j.issn.1008-0821.2016.08.011

〔中图分类号〕G203〔文献标识码〕A〔文章编号〕1008-0821(2016)08-0061-05

〔Abstract〕In the face of the city public crisis which occurs frequently,the problems of the shortage of structured research data are increasingly prominent.The development of big data provided new opportunities for the study of city crisis case base.This paper expounded the connotation and thought patterns of the big data and the factual research based on the big data technology,and the paper constructed the functional design,systems architecture and system implementation of city crisis case base based on the big data.The innovation of the paper was that relevant thinking,overall thinking,fault-tolerant thinking and intelligence thinking of big data was introduced into the construction of the case base,filling in the coordination work of the functions of the case base.

〔Key words〕big data;city public crisis;case base

城市公共危机管理问题的研究已经进展多年,有关专家和学者在理论与实践层面都进行了深入的研究。学者Birch和Guth把危机管理划分为事前、事中、事后等3个阶段,并且分别论述了3个阶段危机管理的应对策略[1]。Robert Heath提出了危机管理的4R模型,并将公共危机事件应对过程分为减弱、就绪、响应、恢复等4个阶段,提出了不同阶段的风险管理理论[2]。王传清、毕强提出了政府危机信息管理联动系统模型等[3]。

然而,人、机、物三元世界的高度融合引发了公共危机案例数据规模的爆炸式增长和数据模式的高度复杂化,世界已进入大数据时代[4-5]。仅仅依靠传统案例处理模式、联动处理模式等是无法完全支撑公共危机管理的问题的。由于大数据隐含着巨大的社会、经济、科研价值,已引起了各行各业的高度重视[6-7]。城市公共危机事件中多形态、多信源、高冲突的危机数据可能与大数据的特征相吻合,在构建数据库、系统模型等方面尝试融入大数据的研究和应用,可能会为城市公共危机案例库的建设和应用带来更大的发展空间,为更好地解决城市公共危机的管理问题提供相关理论借鉴和经验尝试。

1文献综述

通过文献研究发现,城市公共危机案例管理系统、平台建设方面的研究尚比较弱,相关文献也仅限于相关模型的构建、数据挖掘模式的构建、关键技术的支撑等。实体研究方面例如兰州大学共危机信息管理研究团队组织研发的《中国公共危机事件案例知识库》[8],该系统收集了2007年以来我国发生的四级以上关于自然灾害、事故灾难、公共卫生、社会安全以及网络舆情的突发公共事件案例等。北京天演融智软件公司研发的《中国危机事件与管理案例库》[9],该系统为各类型组织提供一个学习型的集成化危机预警与辅助决策支持平台。但是系统模式、功能模块的构建还需引入大数据思维。

大数据比较有代表性的定义是3V定义[10],即大数据的特点可以总结为3个V:规模性(Volume)、多样性(Variety)和高速性(Velocity)。面向大数据的思维是多维的,研究者所关注的点不同,思维方式也不同,大数据思维主要有定量思维、总体思维、容错思维、相关思维、智能思维、实验思维等[11]。

大数据在城市应用领域有着迅速的发展,目前基于大数据技术的城市研究机构有:北京大学智慧城市研究与规划中心,该中心致力于智慧城市理论研究与技术攻关、时空间行为大数据研究及智慧城市规划管理应用[12];龙瀛博士创建了北京城市实验室BCL,BCL是致力于采用多学科结合的定量方法进行城市研究的非官方学术研究网络[13];上海同济城市规划设计研究院成立了可持续智慧城市实验室SU-SMART CITY LAB,SSCL是一个以集成数据与原创研究为依托的城市研究与规划设计机构[14];北京清华同衡城市规划设计研究院成立了北京西城—清华同衡城市数据实验室UDL等[15]。网站也开始重视大数据和城市应用研究领域,例如城市数据派UDParty[16];城市规划云平台CITYIF等[17]。

目前在城市公共危机管理的研究中,大数据思维模式下的城市公共危机案例库建设尚比较弱,在建设中引入大数据思维,构建城市公共危机案例库,尝试突破传统思维造成的信息壁垒,利用大数据所集成的数据挖掘、机器学习等前沿技术,利用大数据定量分析、智能判断等优势,实现对城市公共危机案例管理的智能化、大数据化等具有深刻的意义。

2城市公共危机案例库功能设计

基于相关理论与实践研究,依据相关案例库的用户需求,结合大数据技术,构建大数据视域下的城市公共危机案例库系统。城市公共危机案例库系统的总体框架由危机案例数据获取模块、危机案例大数据处理模块、危机案例检索与决策支持模块3个功能模块和案例库、工具库、规则库等相关数据库构成。功能模块和功能数据库协同工作,实现危机案例库系统的设计功能。系统的总体结构框架如图1所示。

21危机案例数据获取模块

城市危机案例信息采集是整个城市公共危机案例库建设的基础,也是案例分析及大数据处理的前提和条件。传统数据分析我们主要使用样本分析法,这是在有限的技术条件下无法获取全部数据的无奈选择。舍恩伯格认为:“在大数据时代进行抽样分析就像在汽车时代骑马一样。”[18]为了实现大数据的总体数据思想,模块中设置城市数据信息采集、危机案例数据采集、城市危机案例采集引擎等功能项,这一功能主要由人机交互共同实现。

城市是一个多因素、多层次、多功能的大系统,案例库中城市数据信息的采集不是简单的信息任务上传,采集的数据也不都是结构化的数据,很多数据信息是动态的、隐性的,分析城市危机案例,首先要把城市的全部基本数据信息进行采集存储,这是研究城市公共危机案例的基础。城市数据信息采集功能项需要在大数据的总体思维下把城市的基本数据信息进行全方位采集并存储,这部分主要由人工采集存储。

在现实社会中,危机一般是指对一个社会系统的基本价值和行为准则架构产生严重威胁,并在时间压力和不确定性极高的情况下必须作出关键决策的事件[19]。城市危机不但具有突发性、不可预测性、高度不确定性等危机的一般特性,而且还具有突发性与紧急性并存、公共性与灾难性并存、共振性与复杂性并存、不确定性与时间的有限性并存等特点[20]。危机案例数据采集功能项需要在大数据的总体思维下把城市公共危机事件数据进行全方位采集并存储,重点解决半结构化和非结构化信息数据的采集,这部分主要由人工采集和计算机智能采集存储。

由于大数据的量大,案例库设置城市危机案例采集引擎。该采集引擎注重信息源及其内容的全面性,数据来源包括各大网站、论坛、博客、微博等;采集的内容包括文字、图片、音频、视频等。采集引擎借鉴互联网搜索引擎技术,代替人工智能采集城市公共危机事件,重点采集半结构化和非结构化事件数据、隐性危机信息数据、价值密度低数据等,强调采集数据的完整性。

危机案例数据获取模块经3个功能项获取大量数据后,经过数据集成形成最初的危机案例数据库,该数据库是大量数据的聚集地,没有经过系统处理和加工,交由危机案图1城市公共危机案例库系统结构图

例大数据处理模块进行处理。

22危机案例大数据处理模块

由于大数据时代数据处理发生了重大转变,处理数据的流程也相应发生了变化。大数据普遍适用的处理流程分为采集、导入和预处理、统计和分析、数据挖掘四部分。危机案例库可以借鉴大数据处理数据的流程和大数据思维设置大数据处理模块。

经过危机案例数据获取模块集成的数据导入到分布式案例存储集群,经过专业化信息工具处理进行简单的数据清洗和处理,分布式数据库及计算集群对存储于存储集群的大数据进行数据分析和分类汇总等,形成具备一定功能形态的城市危机案例库。例如把非城市公共危机范畴的数据进行筛除,对自然灾害危机、意外事故危机、公共卫生危机、社会安全危机等案例进行分析和分类汇总等。

由于危机案例库更多的要体现大数据思维,更重要的在功能上还要体现智能化,所以要进一步应用大数据视域下的核心思想,引入大数据的关联思维、容错思维及智能思维对城市危机案例库进行深层次地数据挖掘。与简单的数据清洗和分析分类不同,数据挖掘在过程上具有发散性,主要是对数据进行各种算法的计算,为了更好地满足高级别数据分析的需求。

221关联数据挖掘

在小数据时代,人们常常关注城市公共危机案例的因果关系,试图通过有限样本案例来分析总结其中的内在机理,但是这些有限的危机案例样本数据不能很好地、全面地反映出案例之间的相关关系。在大数据时代,可以通过大数据技术挖掘危机案例之间的隐性关系,获得更多隐性数据的显性化,利用显性化的数据信息可以帮助决策者进行数据获取和数据预测,从而进行更加准确的决策推理。在大数据处理模块引入关联挖掘技术,可以帮助案例库用户检索案例、检索决策、进行决策推理、向用户推送信息等。

222容错数据挖掘

由于小数据时代人们获取的危机案例样本量比较少,所以比较注重危机案例数据的结构化和精确化。舍恩伯格指出:“只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户”[16]在大数据背景下,引入容错思维,适当忽略一定层面上的精确性,接受一定程度的错误和混杂,可能在数据的宏观层面获得更多隐性数据的显性化,帮助决策者进行数据获取和数据预测等。在大数据处理模块引入容错挖掘技术,可以帮助案例库用户进行决策推理、向用户推送信息等。

223智能数据挖掘

大数据时代要求数据库处理数据从线性等简单的思维向智能思维转化,这是大数据处理的显著特征和核心内容。在大数据背景下,引入智能思维,可以对城市公共危机案例数据进行逻辑分析、智能判断、科学预测等。大数据处理模块引入智能挖掘技术,可以更好地支撑危机案例库的数据处理功能,为各项功能的协调运行提供智能化支撑。

在关联挖掘、容错挖掘、智能挖掘等相关大数据处理技术的支撑下,对城市危机案例库进行大数据处理形成城市危机智能案例库。该库可以有效支撑案例库用户的案例检索、决策检索、决策推理等功能。

23危机案例检索与决策支持模块

危机案例检索与决策支持模块主要实现用户的检索需求与决策推理需求。由城市危机智能案例库中的案例数据库、决策数据库、决策推理模块等构成。数据库和功能模块协同工作,实现用户检索与决策推理的设计功能。由智能决策推理形成的新决策方案充实到决策数据库中。用户的检索效果与决策推理效果反馈到案例库的数据获取模块与大数据处理模块。

3城市公共危机案例库系统实现

基于城市公共危机案例库的功能设计,结合大数据技术,给出城市公共危机案例库的系统实现。

31案例库的系统架构

在构建城市公共危机案例库系统功能等研究的基础上,提出案例库的系统架构,其核心部分如图2所示。图2城市危机案例库的系统架构图

案例库系统通过各种不同的连接器,实现对各类数据库、系统、第三方应用的数据进行数据采集;案例库系统对采集的案例数据进行清洗、抽取、处理等操作,生成案例数据索引;案例库系统是通过分布式系统建立数据仓库,并利用大数据技术提供数据挖掘功能;数据服务层为其上的数据应用层提供各类数据接口。用户权限系统可以从数据的各个层面进行嵌入。

32案例库系统的交互环境

在案例库系统功能、系统架构等研究的基础上,构建案例库系统的交互环境案例库交互环境中的案例检索的部分功能实现如图3所示。

在案例检索交互界面中,设置快速检索和高级检索等功能。输入关键词进行检索,在检索界面的左侧,设置危机属性、危机描述、利益相关、案例分析等功能链接。以“2015年8月12日天津大爆炸”为例,危机属性包括天津爆炸的时间、地点、主要影响、危机领域、危机类型、所属行业、危害程度等各项数据;危机描述包括天津爆炸案例的前兆、紧急、持续、结果等阶段的具体数据描述;利益相关主要是指危机利益相关者数据分析等;案例分析主要是对危机案例数据进行大数据处理后进行处理结果的展示,包括案例数据对比分析、案例数据统计分析、数据宏观指导、数据智能判断等,例如港口爆炸案例数据分析、图3案例检索交互测试界面

化学品爆炸案例数据分析、智能爆炸案例数据统计等。

4总结和展望

本研究依据案例库设计的理论和实践研究,结合大数据技术,构建了城市公共危机案例库的功能结构和系统实现,在案例库中嵌入了大数据思维,从技术实现和功能需求上为城市危机管理的减缓工作提供了一些新的思路。

但是系统实现方面还有很多挑战,例如如何在这些数据库之间进行负载均衡、如何实现大数据的智能算法等问题是需要深入思考的,在后续研究中,需要进一步研究功能模块的系统性、精确性、效用性等;工作流程的逻辑性、系统性、规则性等;案例库系统实现的稳定性、实用性、创新性等。

参考文献

[1]张岩.非常规突发事件态势演化和调控机制研究[D].合肥:中国科学技术大学,2011.

[2]Henth R.危机管理[M].王成,译.北京:中信出版社,2004:18-21.

[3]王传清,毕强.政府危机信息管理联动系统模型构建[J].图书情报工作,2012,(9)31-36.

[4]李国杰.大数据研究的科学价值[J].中国计算机学会通讯,2012,8(9):8-15.

[5]James Manyika,Michael Chui,Brad Brown et al.Big Data:The Next Frontier for Innovation,Competition,and Productivity[Z].McKinsey Global Institute,2011.

[6]Divyakant Agrawal,Philip Bernstein,Elisa Bertino et al.Challenges and Opportunities with Big Data[EB/OL].Cyber Center Technical Reports,February,2012.http:∥docs.lib.purdue.edu/cctech/1.

[7]Pattern-Based Strategy:Getting Value from Big Data[Z].Gartner Group Press Release,2011.

[8]兰州大学.中国公共危机事件案例知识库[EB].http:∥ccm.lzu.edu.cn/.

[9]麦尼哲中国危机管理资源网[EB].http:∥www.crisismanagement.com.cn/index.aspx.

[10]Grobelnik,M..Big-data Computing:Creating Revolutionary Breakthroughs in Commerce,Science,and Society[R/OL].http:∥videolectures.net/eswc2012grobelnik-big-data/,2012-01-02.

[11]张义祯.大数据带来的四种思维[N].学习时报,2015-01-26.

[12]北京大学城市与环境学院智慧城市研究与规划中心[EB].http:∥www.smartcity.pku.edu.cn/intro/info-5000.shtml.

[13]Beijing City Lab[EB].http:∥www.beijingcitylab.com/.

[14]可持续智慧城市实验室(SSCL)[EB].http:∥116.236.160.182:1310/SmartCity/SuSmart/lab/FirstPageCN.

[15]清华同衡城市数据实验室UDL[EB].http:∥xc.urbandatalab.com/.

[16]城市数据派UDParty[EB].http:∥www.udparty.com/

[17]城市规划云平台[EB].http:∥www.cityif.com/.

[18]维克托·迈尔-舍恩伯格.大数据时代[M].杭州:浙江人民出版社,2013-01-01.

[19]Rosethal Uriel,Chares Michal T.,ed.Coping With Crises,the Management of Disasters,Riots and Terrorism[M].Springfield:Chares C Thomas,1898.

[20]赵妮娅,叶静.建立健全预警和应急机制:政府应对突发事件的关键[J].甘肃行政学院学报,2004,(1):26-28.

(本文责任编辑:孙国雷)

猜你喜欢
案例库大数据
心血管外科教学案例库的建设及应用研究
国内首个海事司法案例库正式上线
基于实践应用的基坑工程设计案例库建设研究
化工原理课程思政案例库建设初探
MTI朝鲜语同声传译教学案例库建设研究
基于“微博”动态案例库的“微案例”教学研究与实践——以高职院校“西方经济学”为例
大数据环境下基于移动客户端的传统媒体转型思路