基于众包的遥感灾害监测与评估模型

2017-04-28 03:23王玉娴段建波刘士彬马彩虹
自然资源遥感 2017年2期
关键词:正确率灾害工作者

王玉娴, 段建波, 刘士彬, 马彩虹

(1.中国科学院遥感与数字地球研究所,北京 100094; 2.中国科学院大学,北京 100049)

基于众包的遥感灾害监测与评估模型

王玉娴1,2, 段建波1, 刘士彬1, 马彩虹1

(1.中国科学院遥感与数字地球研究所,北京 100094; 2.中国科学院大学,北京 100049)

为了提高自然灾害应急响应的时效性,提出了一种基于众包(crowdsourcing)的遥感灾害监测与评估模型,重点研究了模型中基于动态投票一致性策略的灾害数据评估,并在模型的基础上设计实现了基于众包的遥感灾害监测与评估原型系统。研究表明: 该模型能够汇聚和融合互联网亿万网民的知识参与,快速解译灾区高分辨率遥感影像,实现遥感影像数据的快速处理、海量灾害数据的高效采集和实时的灾害评估。

众包; 遥感; 灾害监测与评估; 动态投票一致性

0 引言

随着数据通讯技术、卫星传感器技术和航空航天技术等不断发展,遥感技术已经在重大自然灾害的监测、预警、辅助决策、评估和重建等过程中发挥了巨大作用[1]。但在突发自然灾害的情况下,遥感数据的获取会呈集中式快速增长态势,在短期内积聚的遥感数据规模将会变得非常庞大,此时如何快速、高效、准确地从这些大量遥感数据中提取灾害信息显得非常关键。而当前主要方式是专业人员对遥感卫星数据的解译与评估。针对大量灾区遥感数据,会形成大量数据与有限人员之间的矛盾,导致遥感应急速度不够理想[2]。为了解决当前由于获取卫星数据量短期激增、卫星数据处理人员不足等因素而导致的应急速度缓慢,将众包模式引入到遥感灾害监测与评估应用中[3]。

本文在对国内外大量众包模式和应用的研究资料进行深入探索的基础上,针对目前自然灾害灾情评估工作存在的一些问题,考虑到自然灾害的突发性、发生位置不可预测性等特点,综合分析了基于众包模式进行灾情监测与评估的优势与潜力[4],提出了一种基于众包的遥感灾害监测与评估模型,重点研究了模型中基于动态投票一致性策略的灾害数据评估,并实现了模型的原型系统。

1 众包模式研究现状

众包是互联网带来的一种分布式问题解决和生产组织模式,指的是一个公司或机构把过去由特定人员执行的工作任务,以自由自愿的形式外包给(通常是网络上的)非特定大众的做法[5]。通过众包模式,企业或机构可以充分利用网络资源,借助外部群体的智慧,节约大量成本。

众包模式是网络社会的社会生产,其理念是组织利用互联网将工作分派出去,发现创意或者解决技术问题。众包本质上是一种在线、分布式的问题解决和生产模式。众包的产品形式包括能被任何人获取的视频、音乐或百科知识等。目前,众包在欧美等发达国家已逐渐兴起,并出现了很多成功的应用,如Amazon的Mechanical Turk平台是基于经济奖励制度的方式让大众解决实际难题,Foodpickle则通过将众包与微博结合产生了关于食品的即时问答平台[6-7]。在地理信息领域,基于众包的概念Goodchild提出了“人人都是传感器”[8],即每一个人都可以完成地理数据的采集。该思路打破了地理信息专业人员和公众之间的界限,使得“公众(public)参与公民(citizen)科学”成为一种可能。本文将众包模式引入到遥感灾害监测评估工作中来,提出了基于众包的遥感灾害监测评估模型。

2 模型建立

基于众包的遥感灾害监测与评估是众包工作者(指互联网上任何志愿参加到该项工作的人员,是模型的主要参与者,以下简称工作者)通过互联网,在发布的高分辨率遥感影像数据上进行目视解译的过程,而模型则采集各工作者解译出的灾害数据并做出评估。具体步骤包括: 首先,利用众包模型,借助互联网和亿万网民的力量,目视解译灾区高分辨率遥感影像,以完成海量灾害数据的收集; 然后,采用动态的投票一致性策略对收集到的灾害数据进行可信度评估; 最后,根据评估结果主动驱动相应的专家系统工作(专家处理系统为外部模块),从而实现“公众”与“专家”的信息互补,有效提高灾害评估结果的准确性和实时性,为应急指挥和救援决策提供信息支持。

基于众包的遥感灾害监测与评估模型主要由基础数据准备层、灾害数据采集层、灾害数据评估层组成,模型示意图如图1所示。

图1 基于众包的遥感灾害监测与评估模型

2.1 基础数据准备层

在基础数据准备层,准备用于众包工作者进行灾害数据解译的高分辨率遥感影像。将获取的遥感数据影像,进行辐射校正、几何纠正和图像镶嵌融合等图像预处理。模型也同时提供受灾地区灾前与灾后的影像数据,并对它们进行图像配准,共同作为模型的基础工作数据,便于工作者通过影像对比,更方便、准确地解译灾害情况。

2.2 灾害数据采集层

在灾害数据采集层,将准备好的灾区高分辨率遥感影像在线发布,并预先设定好符合本次自然灾害的灾情分类解译标注,数量庞大的众包工作者通过终端可看到这些遥感影像,工作者利用自己的知识对遥感影像进行目视解译来开展工作。图2是一个地震灾情分类解译标注示例图。

图2 地震灾情分类解译标注示例图

2.3 灾害数据评估层

由于参与众包的工作者是采用自由组织的工作形式,工作质量参差不齐,存在较大的不确定性: 一方面,由于工作者缺乏专业背景,解译结果容易出现偏差; 另一方面,有些工作者责任性差,工作随意,甚至故意出错。因此,对于工作者的严谨度和工作质量进行评估管理是非常必要。

为了保证在数据采集层获取的解译结果的准确性,本文采用一种基于动态投票一致性策略机制,将每一个解译结果分配给多个投票工作者独立投票,然后将答案通过投票方式进行整合,将大多数的意见作为最终的正确结果的过程。同时为保证结果的可靠性,在工作者工作过程中对其工作结果进行评估,并根据动态结果引导工作者的后续工作,以最大限度地保证评估结果的准确性。

3 模型灾害数据评估策略

众包灾害数据的评估方法直接影响灾害评估和监测的质量,因此灾害数据评估层是模型的核心部分,其对工作者工作结果可信度的评估机制成为决定此众包模型成败的关键[9]。为了保证任务结果的精度,现有众包应用中通常采用2种质量评估策略,一种是基于黄金标准机制的策略,另一种是基于投票一致性的策略[10]。针对遥感灾害监测与评估众包模型的特点,为最大限度地保证工作者工作态度的严谨性和工作结果的可靠性,模型中采用动态投票一致性的质量评估策略来实现灾害数据可信度的评估,利用黄金标准数据方法辅助得到工作者的初始投票正确率。

工作者对遥感图像目视解译的结果可以进行2种操作: 添加灾害标注和对已添加的灾害标注进行投票。因而在逻辑上,工作者分为解译工作者和投票工作者2类,故每个工作者都具有解译正确率和投票正确率2个正确率属性。

收集的灾害数据包括在该工作阶段产生的灾害标注以及每个灾害标注的投票情况。灾害标注的投票情况包括该标注的得票信息及参与该标注投票的工作者的投票正确率信息。众包模型通过质量评估算法利用投票数据对灾害标注进行可信度评价,得到灾害标注的可信度评价结果。

3.1 相关定义

1)工作者(worker)。利用w(w∈W)表示工作者;W代表工作者集合,即W={wi} (1≤i≤n),其中n为参与该项任务的工作者总数。

2)灾害标注(tag)。利用t(t∈T)表示工作者提供的一条灾害标注;T表示工作者提供的灾害标注的集合,即T={tj} (1≤j≤m),其中m为灾害标注的总数。

投票工作者与灾害标注之间存在投票的映射关系,一个工作者可以对多条灾害标注进行投票,一条灾害标注也可以由多个工作者投票。

3)投票(vote)。利用v(w,t)表示一个投票,是工作者w与灾害标注t的映射,即工作者w给标注t投了一票。V={v(wi,tj)} (1≤i≤n, 1≤j≤m),其中V为所有投票的集合。

工作者的正确投票数、总投票数及投票正确率是根据工作者多次参与众包平台任务的表现而得出的,并且会随着新任务的结束而得到更新。

4)正确投票数(correct votes)。利用c(w)表示工作者w参与历史任务中投票选择正确的总次数,c(w)初始值为0。

5)总投票数(total votes)。利用t(w)表示工作者w参与历史任务中所有投票的总数,t(w)≥c(w),t(w)初始值为0。

6)投票正确率(accuracy)。利用a(w)表示,即

a(w)=c(w)/t(w),

(1)

该值为正确投票数与总投票数的比值,表示工作者w进行投票工作的正确率,工作者的初始投票正确率采用黄金标准数据的方法得到。

7)灾害数据可信度(reliability)。利用r(t)表示灾害标注t可信的概率。

3.2 投票正确率的计算

动态的投票一致性质量评估算法除了考虑灾害标注所得投票的具体情况,还需要考虑工作者本身的投票正确率,工作者的投票正确率可由黄金标准数据方法[11]及EM算法[12]得到。为了准确评估工作者的投票工作能力,模型利用黄金标准数据方法计算工作者的初始投票正确率,同时根据每次灾害标注的评估结果更新工作者的投票正确率。动态更新正确率用到了工作者历史工作表现的数据,提高了正确率评估的准确性,而且能够及时识别不合格工作者,提高收集到的灾害数据的质量。投票正确率也是灾害数据评估的影响因子,直接影响对下次任务结果的评估。

系统中设有一个黄金标准数据库,数据库中包含的是已知答案的测试数据。工作者初次参与投票任务时,在分配给工作者的投票任务中插入一定比例的黄金标准数据,这些黄金标准数据是从黄金标准数据库中随机抽取的。由此得到工作者的初始投票正确率,这样不仅对工作者的水平进行了一个衡量,同时为灾害标注可信度的计算提供数据。

3.3 灾害标注可信度的计算

对某条灾害标注t,已知对该灾害标注进行投票的工作者的集合W(t)={wi} (1≤i≤k),其中k为对该灾害标注进行投票的工作者数,每个工作者的投票正确率a(wi),投票选择集合R={rj} (1≤j≤2)。设r1表示正确票,r2表示错误票,投票分布X={v(wi,t)} (1≤i≤k,v(wi,t)∈R),求该条灾害标注的可信度r(t) =P(r1|X),即在分布X的情况下,r1可信的概率,可表示为

(2)

没有先验知识的情况下,每种投票ri∈R出现的概率是相等的,即P(ri)=1/2,则公式(2)可表示为

(3)

由于工作者wi提供正确投票的概率是a(wi),提供不正确投票的概率是1-a(wi),即得

(4)

带入公式(3),得

(5)

根据公式(5)便可计算得到灾害标注的可信度r(t)。

3.4 评估流程

1)管理人员在线发布灾后遥感影像数据及对应的灾情解译标注后,工作者开始在所发布的遥感影像上进行目视解译,在标注模式下添加新的灾害标注或者在投票模式下对已有的灾害标注进行投票(每个工作者对相同的灾害标注只能进行一次投票,而且不对自己提交的灾害标注投票)。

2)灾害标注的可信度评估。根据系统收集到的灾害标注和对灾害标注的投票结果,以及参与投票工作的工作者的投票正确率等数据,计算得到每条灾害标注数据的可信度r(t)。保留可信度r(t)≥0.50的灾害标注,得到灾害数据的评估结果。

3)根据评估结果更新每个工作者的投票正确率a(wi)。如果投票正确率a(wi)低于设定的投票正确率阈值,暂时中止该工作者的工作。

4 原型系统设计

在建立基于众包的遥感灾害监测与评估模型的基础上,明确了模型各层次的功能,基于Web2.0实现了基于众包的遥感灾害监测与评估原型系统。

4.1 系统功能

基于众包的遥感灾害监测与评估原型系统的核心功能包括:

1)以众包模式收集海量灾害数据。广大互联网工作者通过该众包平台参与到遥感灾害监测工作中,工作者提供的受灾点位置、类型及投票等信息被录入到系统后台数据库。

2)实现海量灾害数据的有效评估。系统通过动态投票一致性策略对数据库中存储的灾害数据进行处理评估,计算得到所收集灾害标注的可信度,去除低可信度标注数据,得到灾害专题图。

3)根据灾害信息评估结果智能驱动专家处理系统。根据灾害数据评估结果判断灾害的严重程度,如果较为严重,向相应的专家系统发出预警,让专家介入作进一步处理。

4)空间数据管理功能。系统采用PostGIS空间数据库,对空间基础地理信息、高分辨率灾害遥感影像、灾害标注信息、投票信息和专题图等数据实现管理。根据数据采集、评估和处理的级别不同,将不同类型的数据进行分别存储管理,以备满足不同研究者的不同工作性质的科研需求。数据库中的高分辨率遥感影像数据采用外部文件方式存放,影像的索引图等其他相关信息存放于空间数据库中,该数据管理方式提升了图像的入库速度,提高了应急的时效性。

4.2 系统设计

基于众包的遥感灾害监测与评估系统包括多元不同时相遥感影像数据发布子系统、基于众包模式的灾害数据采集子系统、基于动态投票一致性策略的灾害数据评估子系统、智能灾害专家驱动子系统。

系统采用Web技术,以面向广大互联网工作者的众包模式为基础,搭建一个公众参与的遥感灾害监测与评估平台。系统的总体架构如图3所示。

图3 基于众包的遥感灾害监测与评估原型系统总体架构

4.3 系统实现

原型系统是采用B/S架构进行实现,服务器端采用Ubuntu,服务端和客户端通信采用标准Http协议,数据库存储管理使用开源的PostGIS数据库,搭载整个系统运行的Web应用服务器是Tomcat。

原型系统包括标注模式和投票模式。在标注模式下,界面包括灾情分类解译标注区、工作信息区和导航区等。系统能够在高分辨率遥感影像上实时显示工作者已浏览区域、所标注的受灾点等信息。在投票模式下,影像上显示一个其他工作者解译的受灾点标注,工作者判断正确或错误,工作信息区实时显示工作者已投票的标注数。原型系统实现界面如图4所示。

(a) 标注模式界面 (b) 投票模式界面

5 结论

本文探索性地将众包模式应用于遥感领域,提出了一种基于众包的遥感灾害监测与评估模型,重点研究了模型中基于动态投票一致性的灾害数据评估策略,在此基础上设计实现了基于众包的遥感灾害监测与评估原型系统。该模型明确了标注模式下添加新的灾害标注或者在投票模式下对已有的灾害标注进行投票的评估工作流程,通过汇聚互联网众多网民的知识参与,实现了大量遥感影像数据的快速处理,提高了自然灾害应急响应的时效性,为自然灾害监测评估探索了一种新模式; 灾害数据评估采用了基于动态投票一致性的评估策略,且考虑了工作者正确率因素并对正确率进行动态更新,提高了灾害标注评价的准确性。

模型中应用的基于动态投票一致性策略的灾害数据评估还有改进的空间: ①进一步考虑不同专业背景的工作者工作结果所占的权重对评估结果的影响; ②重复灾害标注的识别与合并; ③采用综合变化检测方式进行灾害评估。

[1] 郭华东,刘良云,范湘涛,等.对地观测技术用于汶川和玉树地震灾害的研究[J].高校地质学报,2011,17(1):1-12. Guo H D,Liu L Y,Fan X T,et al.Study of earth observation for disaster reduction in Wenchuan and Yushu earthquakes[J].Geological Journal of China Universities,2011,17(1):1-12.

[2] 陶和平,刘斌涛,刘淑珍,等.遥感在重大自然灾害监测中的应用前景——以5·12汶川地震为例[J].山地学报,2008,26(3):276-279. Tao H P,Liu B T,Liu S Z,et al.Natural hazards monitoring using remote sensing:A case study of 5·12 Wenchuan earthquake[J].Journal of Mountain Science,2008,26(3):276-279.

[3] Barrington L,Ghosh S,Greene M,et al.Crowdsourcing earthquake damage assessment using remote sensing imagery[J].Annals of Geophysics,2011,54(6):680-687.

[4] Oliveira F,Ramos I.Crowdsourcing:A tool for organizational knowledge creation[C]//22nd European Conference on Information Systems.Tel Aviv,Israel:Association for Information Systems,2014.

[5] Doan A,Ramakrishnan R,Halevy A Y.Crowdsourcing systems on the world-wide web[J].Communications of the ACM,2011,54(4):86-96.

[6] 李勇军,缑西梅.基于“众包”的软件开发模式[J].计算机系统应用,2014,23(6):7-10. Li Y J,Gou X M.Software development model based on crowdsourcing[J].Computer Systems & Applications,2014,23(6):7-10.

[7] Yan T X,Kumar V,Ganesan D.CrowdSearch:Exploiting crowds for accurate real-time image search on mobile phones[C]//Proceedings of the 8th International Conference on Mobile Systems,Applications,and Services.San Francisco,CA,United States:Association for Computing Machinery,2010:77-90.

[8] Goodchild M F.Citizens as sensors:The world of volunteered geography[J].GeoJournal,2007,69(4):211-221.

[9] Heipke C.Crowdsourcing geospatial data[J].ISPRS Journal of Photogrammetry and Remote Sensing,2010,65(6):550-557.

[10]岳德君,于戈,申德荣,等.基于投票一致性的众包质量评估策略[J].东北大学学报:自然科学版,2014,35(8):1097-1101. Yue D J,Yu G,Shen D R,et al.Crowdsourcing quality evaluation strategies based on voting consistency[J].Journal of Northeastern University:Natural Science,2014,35(8):1097-1101.

[11]Liu X,Lu M Y,Ooi B C,et al.CDAS:A crowdsourcing data analytics system[J].Proceedings of the VLDB Endowment,2012,5(10):1040-1051.

[12]张志强,逄居升,谢晓芹,等.众包质量控制策略及评估算法研究[J].计算机学报,2013,36(8):1636-1649. Zhang Z Q,Pang J S,Xie X Q,et al.Research on crowdsourcing quality control strategies and evaluation algorithm[J].Chinese Journal of Computers,2013,36(8):1636-1649.

[13]Jiang H B,Su Y Y,Jiao Q S,et al.Typical geologic disaster surveying in Wenchuan 8.0 earthquake zone using high resolution ground LiDAR and UAV remote sensing[C]//Proceedings of SPIE 9262,Lidar Remote Sensing for Environmental Monitoring XIV.Beijing,China:SPIE,2014:926219.

(责任编辑: 邢宇)

Remote sensing disaster monitoring and evaluation model based on crowdsourcing

WANG Yuxian1,2, DUAN Jianbo1, LIU Shibin1, MA Caihong1

(1.InstituteofRemoteSensingandDigitalEarthChineseAcademyofSciences,Beijing100094,China; 2.UniversityoftheChineseAcademyofSciences,Beijing100049,China)

To improve the time effectiveness of emergency response work toward natural disaster, this paper proposes a remote sensing disaster monitoring and evaluation model based on crowdsourcing, the strategy of dynamic voting consistency for disaster data evaluation is studied in detail, and the prototype system is realized based on the model. The model gathers the knowledge from hundreds of millions of users through the Internet to provide visual interpretation of high-resolution remote sensing images of disaster area quickly and effectively, so it achieves a rapid processing of image data, efficient collection of massive disaster data and real-time hazard assessment.

crowdsourcing; remote sensing; disaster monitoring and evaluation; dynamic voting consistency

10.6046/gtzyyg.2017.02.15

王玉娴,段建波,刘士彬,等.基于众包的遥感灾害监测与评估模型[J].国土资源遥感,2017,29(2):104-109.(Wang Y X,Duan J B,Liu S B,et al.Remote sensing disaster monitoring and evaluation model based on crowdsourcing[J].Remote Sensing for Land and Resources,2017,29(2):104-109)

2015-10-24;

2016-01-21

王玉娴(1990-),女,硕士研究生,主要从事遥感数据服务系统开放式架构研究。Email: yuxianw@hotmail.com。

段建波(1981-),男,硕士,工程师,主要从事空间数据管理和WebGIS方向的研究。Email: jbduan@ceode.ac.cn。

TP 753

A

1001-070X(2017)02-0104-06

猜你喜欢
正确率灾害工作者
河南郑州“7·20”特大暴雨灾害的警示及应对
个性化护理干预对提高住院患者留取痰标本正确率的影响
关爱工作者之歌
致敬科技工作者
我们
——致敬殡葬工作者
千年蝗虫灾害的暴发成因
蝗虫灾害的暴发与危害
门诊分诊服务态度与正确率对护患关系的影响
普法工作者的“生意经”
地球变暖——最大的气象灾害