移动群智感知质量度量与保障理论和方法

2019-12-03 01:04健,陶
小型微型计算机系统 2019年5期
关键词:度量节点质量

胡 健,陶 丹

(北京交通大学 电子信息工程学院 智能感知与信息处理研究所,北京 100044)

1 引 言

近年来,伴随着移动终端处理器、内存等硬件设备的快速发展和提升,移动设备领域得到了繁荣发展,摄像头、麦克风、GPS、陀螺仪、加速度计等传感器嵌入到以智能手机、平板电脑为代表的智能移动终端中[1].同时以TD-LTE为代表的第四代移动通信技术的发展,使得人们可以通过移动智能设备方便快捷地接入互联网,随时随地获取所需的服务.据相关统计,截至2017年底全球使用移动设备用户人数已突破50亿.这些搭载了各种各样传感器的移动智能终端拥有越来越强大的感知、计算、存储和通信等能力,可以灵活地提供更大规模、更复杂、透彻而全面的感知服务.

学术界通常将利用普适的移动终端提供感知服务的新型感知模式称之为社群感知或群智感知[2].人们将众包(Crowdsourcing)思想与移动感知有机结合,将普通用户的移动智能设备作为基本感知单元,通过相互协作进而形成群智感知网络,实现感知任务分发与感知数据收集,完成大规模的、复杂的社会感知任务[3].有别于基于无线传感网和物联网的感知方式,群智感知是以大量普通用户作为感知源,强调利用大众的广泛分布性、灵活移动性和机会连接性进行感知,并为城市及社会管理提供智能辅助支持,广泛应用在环境监控、城市管理、智能交通、公共安全与社交服务等众多领域[4].

作为一种新型的感知模型,群智感知成为当前国内外学术界、工业界关注的焦点和热点研究领域.国际学术界陆续在IEEE/ACM系列期刊及会议上发表了一系列重要研究成果,相关论文数量呈快速增长趋势.微软研究院、IBM研究院等科研机构及美国麻省理工学院、南加利福尼亚大学,英国剑桥大学、南安普顿大学,新加坡南洋理工大学等国际知名高校纷纷启动了群智感知算法理论和系统应用的研究.我国科研学者也十分重视该领域研究,清华大学、北京邮电大学、上海交通大学、西北工业大学等较早开展该领域探索并取得一些较具影响的研究成果,研究得到了国家自然科学基金、国家重点基础研究发展“九七三”计划和国家科技重大专项的支持,如:国家自然科学基金委在2013年将群智感知列为4个科学部优先资助重点领域之一,设置了“群智感知网络理论与关键技术”重点项目群.“十三五”国家科技创新规划“新一代信息技术”将人本计算、智能感知作为重点发展方向.

目前群智感知的研究方兴未艾.然而,国内外对群智感知网络的研究都尚处于起步阶段,现有研究往往集中在群智感知网络中数据传输与保护[5,6]、信息分析与推断[7,8]、用户优选与激励[9]、系统平台与应用[10,11]等方面,而针对于感知质量度量与保障方面的研究积累并不多.作为移动群智感知应用的一个关键性的基础问题,感知质量度量与保障优劣是群智感知应用成败的关键.然而,下述移动群智感知所独有的特点也给感知质量管理的研究带来巨大的挑战.

1)泛在用户带来的非均匀时空覆盖

移动群智感知网络利用移动智能感知设备进行感知,并结合蜂窝网、WiFi等多种传输方式,无需部署维护感知设备以及传输网络,大大地降低了系统成本.同时,用户的泛在特性给科研和应用等提供极大的时间/空间广度和精度[12].虽然,移动群智感知的以上优点能够代替传感器等静态部署模式,但传感器静态部署方式所带来的数据格式统一、散布均匀等优点是其所不具备的.例如,参与用户的移动性会造成采集数据分布是不均衡的,大量用户聚集的城市热点区域会形成数据冗余,但少量用户存在的偏僻区域则会引起数据量稀疏.

2)混合感知带来的差异化数据质量

移动群智感知中的数据是通过移动用户自身携带的移动智能终端(例如智能手机或可穿戴设备)所采集到的,即作为基本单元的感知节点主要以人与智能终端混合形式存在.移动群智感知网络用户大都是松耦合组织,任何有意愿参与的用户都可以向系统提供数据,对于用户感知主客观行为(属性/位置/情境/主观认知等)以及所携带的感知设备类型性能(型号/性能/处理方式等)没有专业级的要求,从而造成感知数据质量的参差不齐.特别地,用户恶意参与行为也可能引起感知数据的不可靠和不准确.

3)多源数据带来的融合型数据分析

混合感知带来差异化的数据质量,有必要对这些多源异构、且实时涌现的海量数据进行智能分析和挖掘以发挥其价值.多源数据融合能够将多种传感器提供的数据信息进行组合,对有用信息进行保留、错误信息进行剔除,通过信息冗余来确保系统可靠性,进而实现信息的优化.然而,移动用户感知的数据既包括结构化的(标量)也包含非结构化的(矢量),时效性也时强时弱,价值密度也时高时低,这些都给融合型数据分析带来了不小的挑战.

2 移动群智感知质量度量

2.1 基于覆盖质量的度量研究

在传统的传感器网络中,研究者常常使用覆盖率作为网络感知质量的度量指标[13].区域覆盖、点覆盖、路径覆盖、K重覆盖等多种覆盖问题得到了广泛研究,积累了很多成熟的理论和方法[14,15].然而,这些研究成果显然没能考虑到群智感知网络中移动用户的移动特性,即“以人为中心的感知”,因此无法直接地应用到群智感知网络中.

Chon等人[16]率先研究了“以地点为中心”的移动群智感知应用的覆盖质量,即自动识别或跟踪用户每天访问的不同地点来帮助用户认识和分析自己的日常行为模式,用已经访问过的地点数量与地点总数的比值作为覆盖率.此时的覆盖问题刻画为:多长时间内多少用户采集数据能覆盖到多少人们经常访问的地方?Zhao等人[17]考虑到网络中移动用户的位置随时空变化,整个监测区域被细化为一系列网格单元,将每个网格单元被连续覆盖两次的间隔时间——“覆盖间隔时间”作为度量指标,并揭示覆盖间隔时间服从截断的帕累托分布.进一步提出“机会覆盖率”来刻画监测区域的整体感知质量与节点数目之间的关系,其定义为在特定时间间隔内被覆盖的网格单元占所有网格单元的比例的期望值,可以表示成关于覆盖间隔时间分布的函数.针对城市感知网络,Liu等人[18]率先从时空两个角度定义了“城市分辨率”这一新的指标来度量城市感知图像的质量,通过对大量实测出租车移动轨迹数据集分析与建模,揭示城市环境下感知节点规模与感知质量的重要关系.研究成果为城市感知研究建立了新的度量指标体系,提供的基础性模型与方法,奠定了城市中群智感知网络的规划准则.Nistorica 等人[19]基于三种人群移动模型,提出一种计算完成群智感知任务所需要的最佳用户规模的方法以最小化网络资源和激励成本.

2.2 基于数据质量的度量研究

作为面向应用的技术,移动群智感知质量问题已不仅仅是单纯的覆盖含义,更与数据质量紧密相关.用户感知方式的随意性以及不同用户的使用习惯都会影响感知数据的正确表达和解释.由此产生的感知数据会存在不准确、不完整、不一致等问题.因此,评估用户数据质量是十分必要的.

移动群智感知数据质量受到多方面影响,主要来自感知设备类型、采集数据环境与方式、用户主观认知能力与参与态度等[13].当前关于群智感知网络中数据感知质量度量的研究较少.文献[20]只考虑最简单的二进制型任务数据结果的度量.例如,当用户发现街道内某个特定的位置存在垃圾的时候,上报1以标定,否则上报0.其中一种简单的方法是通过投票方式确定,一旦当事件发生的用户数目大于某个特定阈值的时候,才能确定该事情的发生.然而,在相当一部分的实际群智感知网络中,移动用户的感知到的数据要比0-1数据复杂得多.就复杂的污染源监控场景而言,文献[21]提出了一种基于最大期望算法的真实污染源识别方法和传感器自校正方法,具体来说就是依靠不可靠的用户感知数据就能准确地识别真实污染源和校正用户的感知设备.文献[22]提出一种解决群智感知网络中数据不完全性的方法,但解决方案没有充分考虑感知数据误差问题.另外,针对连续信号型任务,Kousopoulos等人[23]提出了一种感知数据质量的度量方法,计算某个用户提交的历史数据与所有用户数据的平均值之间的累积误差,并将此作为该用户的感知数据质量指标.

上述研究成果的基本思想都是利用网络中的群体智慧来抵御或者降低感知数据不可靠性和不准确性带来的影响,然而这些方法并不能很好地应对恶意用户攻击行为所带来的不良后果.因此,出现了一些研究成果解决移动群智感知数据的可信性问题.例如:考虑到用户信誉度的高低在一定程度上决定了用户感知数据的质量好坏,文献[12]建立信誉系统评估用户历史感知数据的可信性.

3 移动群智感知质量保障

3.1 移动群智感知覆盖增强

覆盖质量增强是移动群智感知质量保障研究的一个基本出发点,即通过优化配置移动群智感知节点分布实现整个网络感知质量增强,进而确保感知全面性.总结目前移动群智感知质量增强方法主要包括两类:基于网络节点优配的覆盖增强和基于参与用户优选的覆盖增强.

3.1.1 基于网络节点优配的覆盖增强

在传统的传感器网络中,优化部署被看作为覆盖增强问题的重要途径,并反映了传感器网络所能提供的感知服务质量[24].研究成果表明,合理选择节点部署策略,优化节点数目及布局,能够最大限度地利用和整合传感器网络资源,进而实现网络覆盖性能优化.节点部署策略具体包括冗余部署、节点移动、新增节点、混合部署等,目前已经积累了基于几何图论、虚拟势场、仿生优化等的节点优化布局方法[25].例如,早期固定部署传感器网络通常需要密集部署大量节点保证网络覆盖和连通性,但节点分布的随机性会导致网络覆盖空洞.文献[26]提出一种称为“变形虫优化”的新型仿生优化算法来解决无线传感网中的最小暴露路径问题.Tao等[27,28]基于图论知识快速判定已知网络部署情况下是否能够成栅栏覆盖,并设计满足不同目标函数的策略优化有向节点布局,并通过额外部署固定节点改善网络栅栏覆盖性能.研究者随即引入移动传感器节点,利用其灵活的移动性实现感知薄弱区和盲区的覆盖增强[29].由此,传统的覆盖部署策略由静态覆盖扩展为动态覆盖,传感网络类型也由单一网络演化为混合网络.针对混合型传感器网络,文献[30]从固定部署节点和移动节点资源互补出发,实现成本有效的目标覆盖增强.

相比于群智感知网络,虽然传统的无线传感器网络存在部署成本高、可扩展性差等缺点,但是冗余部署的固定节点可以提供相对稳定可靠的感知质量.受到群体活动规律、个人参与意愿等影响,群智感知区域质量差异性较大,这给群智感知网络中基于网络节点优配的覆盖增强研究带来了巨大的挑战[31],此方面的研究成果少之又少.Zhao等人[17]指出移动群智感知中的覆盖是与人移动的机会性具有密切关联的机会覆盖问题.Ding等人[24]探索性地研究由固定部署节点和移动节点构建的混合群智感知网络中的机会覆盖增强问题,通过基于几何图论分析固定部署节点和移动节点对覆盖质量的影响,设计机会覆盖部署策略.

3.1.2 基于参与用户优选的覆盖增强

群智感知涉及到大量的用户,这些用户具有多元性、多样性和自主性;同时感知任务对环境和完成要求具有差异性、依赖性和不确定性,因此很多研究将感知任务按照某种特性进行划分,比如物理空间位置,并制定灵活的用户选择策略.文献[32]较早开展“以人为中心”的移动群智感知网络中覆盖质量研究.假设移动用户的移动基于理论的离散马尔科夫模型,通过选取节点子集以实现对感兴趣区域覆盖性能的改善.文献[33]提出了一种群智感知网络中的用户选择方法,在所有兴趣点都被覆盖的情况下实现总体成本的最小化.但上述研究工作仅仅是针对感兴趣区域进行覆盖,研究成果难以扩展到整个区域范畴.针对区域覆盖增强,Reddy等人[34]较早地提出了一种面向时空覆盖的参与者优选方法,均衡因为用户分布不均匀而造成的数据感知不完整性;并提出基于参与式感知的参与者选择架构.文献[35]研究感兴趣环境参数在特定区域的分布,绘制出感兴趣环境参数的密度分布图,通过优选感兴趣环境参数覆盖密度高的区域的参与者来满足应用需求.Cardone等人[36]研究在参与者数目一定时,如何使得感知任务的空间覆盖范围最大化的问题.Zhang等人[37]设计了一种参与者选择框架CrowdRecruiter,在确保空间覆盖率的情况下,提出了一个多目标优化的方案,实现参与者数目和激励支付同时最小化.根据群智感知任务的空间分布,Tong 等人[38]设计了一种全局的在线微任务分配模式,结合带权二分图的最优匹配算法,提出一种高效的在线任务分配算法.

另外,相关实验数据表明:提高用户参与积极性也是群智高效感知的重要途径.激励用户优化时空分布从而实现群智感知网络覆盖增强,也是保证群智感知质量的一个研究热点.自研究伊始,用户激励机制就引起了学者的极大关注同时积累了大量研究成果[39].例如:文献[40]采用动态激励机制提高感知任务不同侧面的覆盖.Zheng等人[41]研究基于一定的预算下实现网络感兴趣区域的最大化覆盖的激励机制.Guo等人[42]提出了一种动态用户激励机制,在提高用户参与性的同时,实现高质量数据感知.

3.2 移动群智感知数据分析

数据质量是移动群智感知质量保障方法研究的另一基本出发点,即基于感知数据时空相关性及社会关联,利用智能分析方法实现网络感知数据的质量优化,确保网络感知质量[43].目前在群智感知网络领域积累了一系列数据去噪、增强、恢复、融合等质量保障的数据分析方法.面向群智感知中感知周期短、实时性要求高、数据量大的应用,研究者们也提出了云计算、边缘计算等新型计算模式以实现高效的数据分析.

3.2.1 基于信息恢复的数据分析

针对GPS、Wi-Fi、加速计、陀螺仪等获取的数值型感知数据,基于数据之间的时空相关性过滤异常数据并恢复缺失数据,以解决移动群智感知网络数据稀疏性问题,也将直接影响整个感知结果的数据质量.针对大规模网络应用,先后出现了基于空间插值[44]、压缩感知[45-47]、动态贝叶斯网络[48]以及协同过滤[49]等缺失信息恢复方法.文献[44]提出采用传统的插值方法,对已知点的数据进行平均、加权等运算推求相邻区域的未知点数据.此类方法计算简单,但准确度有限.空间插值压缩感知理论利用信号的稀疏性从包含信号重要信息的少量测量中精确或近似精确地恢复原始信号,在大规模网络应用如道路交通重建[46]、环境数据恢复[45]以及目标定位[50]被广泛采用.基于噪音感知数据的空间相关性,文献[22]提出利用压缩感知方法对稀疏的噪声数据进行恢复.压缩感知的理论前提是感知数据的内在结构可以被稀疏化表示.然而,移动群智感知应用中的多源异构数据并不能很好满足.Hao等人[47]扩展了压缩感知理论,提出了基于密度差异意识的增强型数据恢复方法.在压缩感知阶段依旧采用便于实现的随机抽样,而在数据恢复阶段设计了硬阈值恢复算法以及基于极大似然估计的加权恢复算法.针对城市中稀疏的车辆数据,文献[48]提出一种概率的车流量估计和预测方法,引入动态贝叶斯网络以表征对网络的时空依赖性,通过对大规模历史数据的学习实现对车流量的实时评估.为获得更高的城市分辨率,Kang等人[49]提出基于协同过滤的方法,以矩阵的形式构建感知地图,并进一步建立信号相关矩阵表征不同类型数据相关性,以实现网络空白区域信息弥补.另外,针对摄像头低分辨率、恶劣天气造成模糊的图像和视频数据,采用时空域特征统计学习和超分辨率相结合的方法分别进行低质图像和视频进行恢复性增强也是一个重要的研究领域[51,52].例如Guo等人[43]考虑到物理世界海报的有限时空覆盖范围,利用物理空间交互特征来对信息共建内容进行增强感知和理解,采用多标签分类和启发式规则相结合方法进行语义标注.

3.2.2 基于信息融合的数据分析

移动群智感知数据是多源异构的,有必要进行智能分析和挖掘以发挥其价值.传统常用的数据融合主要有以下几种:加权平均、贝叶斯、卡尔曼滤波、D-S证据合成、模糊推理、神经网络、粗糙集等方法,在无线传感网络、车联网等大规模网络得到普遍应用.移动用户产生海量的感知数据,包括结构化的和非结构化的,时效性强和时效性弱的,价值密度高和价值密度低的,这些都给融合型的数据分析带来新的研究思路.多模态数据融合可以较好地实现信息优化.例如,Nericell系统[53]实现对城市交通和道路质量的监控和评估,通过融合来自汽车驾驶员智能手机采集到的加速度、位置、音频等数据.ParkNet系统[54]使用安装在车辆上的超声波传感器联合智能手机来探测城市街道上可用的停车位,利用环境指纹提高定位精度.从“人机共生”的思想出发,文献[55]利用贝叶斯预测模型融合人类智能和机器智能两者贡献以实现群智感知中用户行为的预测.

特别地,移动群智感知数据采集过程除了获取的直接数据内容外,也隐含了丰富的群体和情境信息.Yu等人[56]研究基于跨空间异构数据融合的商业推荐,充分关联信息空间和物理空间信息,对商铺类型选择进行理解与决策.Guo等人[57]设计并开发CrowdStory系统,实现多模态数据融合的微博社会事件刻画,将群体贡献数据根据时空情境和文本聚类形成多线索动态演化描述,根据视觉相关性和交互情境等群体智能实现线索间关联关系生成.现有融合数据内容、群体信息和情境信息的数据分析方法多是针对某类特定应用提出,缺乏普适性.而且,对于群智感知应用中高实时性、短周期感知数据处理缺乏有效的数据分析理论和方法.

4 亟待解决问题及研究方向

4.1 混合感知质量度量

移动群智感知质量度量是一个复杂的问题,受到多种因素的共同制约和影响,其中覆盖质量和数据质量是衡量感知质量的两个重要指标.虽然研究者考虑感知覆盖的时空变化因素,但对于移动群智感知用户群体性和移动性的特点刻画尚不充分.另外,与移动群智感知网络感知质量密切相关的数据质量研究工作大都是针对不同任务类型开展,缺乏通用的度量指标和方法.未来针对覆盖质量,如何建立揭示“时—空—人”三要素与感知模型主要参数之间的关系形成基于时空的度量方法;针对数据质量,如何联合数据时空相关度与参与用户属性形成基于主客观的度量方法;两者兼而有之,设计通用且有效的质量度量方法将成为研究趋势.

4.2 覆盖增强

移动群智感知覆盖增强是一个基础而重要的问题,目前大部分成果都集中在研究和设计满足一定约束条件的用户选择策略、用户激励机制.但研究工作或者从覆盖质量出发,或者从数据质量出发,约束条件不够完备.

基于节点优化部署的网络覆盖增强方法,在移动传感网络、混合传感网络被广泛认同和采用,而在移动群智感知网络中鲜有研究.相比于目前普遍采用的基于覆盖约束的用户优选与激励等方法,从网络节点优配出发的节点二次部署方法可以快速、针对性地实现网络中感知盲区修补,获得移动群智感知质量增强而备受关注.另外,目前绝大多数用户优选及激励机制是基于单目标开展的,而充足的用户资源以及群智感知平台上并发出现的任务为研究基于多目标多任务的用户优选以及激励研究提供了可能性,尤其在用户资源匮乏情况下可以很好地增强整个网络的感知质量.

4.3 数据分析

针对移动群智感知应用,基于信息恢复和信息融合的数据分析仍存在诸多挑战.对于信息恢复,现有大部分采用平均插值、压缩感知等方法,理论前提是感知数据的内在结构可以被稀疏化表示.然而,移动群智感知应用中的多源异构数据不能很好地满足要求.深入探索感知数据类型和时空关联性,设计行之有效的缺失信息恢复方法显得迫切而必要.

目前,移动群智感知数据融合的研究大都是现成理论与算法的复用,即使少量的研究成果也是针对某类特定应用提出难以推广使用.群智感知网络中普遍采取“分布式采集,集中式认知”的计算模式,虽然在一定程度上可以缓解海量异构性型感知数据的处理给资源有限的移动终端带来巨大的压力,但忽略了泛在移动终端所具有的一定计算和处理能力.充分考虑海量数据呈现的实时持续涌现趋势,设计云计算与端计算协同的计算模型,进而提高多模态数据融合的计算效率将成为研究热点.

5 总 结

移动群智感知质量度量和保障相关研究方兴未艾,在国内外仍处于初期的探索阶段,开展相关研究对丰富与完善群智感知网络理论与关键技术体系,建立信息感知新途径,推动物联网发展都具有重要意义.

猜你喜欢
度量节点质量
鲍文慧《度量空间之一》
基于图连通支配集的子图匹配优化算法
二年级下册期末质量检测(一)
结合概率路由的机会网络自私节点检测算法
面向复杂网络的节点相似性度量*
采用贪婪启发式的异构WSNs 部分覆盖算法*
突出知识本质 关注知识结构提升思维能力
度 量
三参数射影平坦芬斯勒度量的构造
睡个好觉