大数据安全与隐私保护

2017-06-02 09:51杭长山
电子技术与软件工程 2017年10期

大数据直接影响人们的日常生活、工作以及思维模式,因此有关学术和产业界开始不断加大对其研究力度,不过在进行收集、存储和沿用这类数据过程中,却不可避免地遗留诸多安全隐患,致使许多用户隐私被泄露,并衍生出许多虚假和无效的大数据分析结果。由此,笔者针对大数据内涵机理、应用中面对的安全隐患,以及日后合理化保护应对措施等内容,加以系统化论证解析。

【关键词】大数据 安全 隐私保护 操作细节

现阶段,大数据已经成为在云计算技术之后的全新信息产业增长点,在2013年带动全球IT支出340亿美元,预测2016年末将提升至2000多亿美元。不过发展期间仍旧遗留弊端,最为重要的便是安全和隐私问题,必须尽快予以克制,否则将直接限制我国综合发展实力。

1 大数据的内涵机理和相关类型

所谓大数据,实质强调的是大规模且繁琐的数据库管理器具,或是用来处理数据的数据集,其特征具体表现为大规模、高速和多元化,因为来源存在差异,因此可划分以下几种类型:

(1)人们在操作互联网中衍生出的文字、图片、视频等不同类型数据。

(2)计算机信息系统运行时产生的文件、数据库、多媒体等行驶的数据,以及审计、日志中生成的信息。

(3)不同数字设备收集整理的数据,包括摄像头的数字信号、医疗物联网中的特征值等。

2 我国大数据应用中面临的安全隐患

2.1 数据发布中的匿名性破坏攻击

其可以说是针对结构化或是关系数据实施隐私安全防护的关键技术,现阶段我国在该类技术应用上还处于完善阶段。须知大数据环境下,数据发布匿名保护问题十分繁琐,攻击主体可以透过不同途径获取相关数据,如在Netflix应用中,攻击者会透过数据公开获取IMDB相对比数值,进而将Netflix中目标的账号识别出来,这样便可将用户政治倾向和宗教信仰等掌握透彻。

2.2 社交网络中的匿名推测攻击

社交网络中形成的数据可以说是大数据的主要来源,当中同样隐藏着重大的隐私信息,就是说攻击主体完全可以借助用户公开的信息,以及其社交结构推测用户个体等级关系,或是以限制随机游走方式推测各类连接关系存在的概率。结合以往实践经验整理论证,社交网络集聚特性,对于关系预测方法的精准性存在决定性意义,一旦说内部局部连接密度持续增长,集聚系数就会同步增大,连接预测算法准确性亦会加强。

3 日后进行大数据安全和隐私保护的具体措施

3.1 利用大数据做好威胁发现工作

在大数据分析技术支持下,企业完全可以挣脱以往保护-检测-响应-恢复模式束缚,进一步主动挖掘一切安全隐患。如IBM开发出专属的大数据安全智能创新型安全保护工具,主要借助大数据完成企业外部安全威胁窥探任务,特别是经过电子邮件和社交网络全方位扫描认证过后,将一切存在不满情绪的员工予以清晰化标示,提示企业主管做好企业机密的防护工作。归结来讲,该类技术将同步表现出分析内容范围较大、分析内容时间跨度更长、对攻击威胁灵活的预测性,以及对一切未知威胁检测的全面性等优势特征,不过分析结果准确程度上还是饱受质疑。主要是因为大数据收集分析工作原本就难以做好完善精准,而作为分析基础的数据本身又存在片面性,因此,日后完全有必要同步收集企业内外环境的数据。

3.2 借助大数据完成用户身份认证任务

身份认证,即信息系统或是网络空间上进行操作主体身份检验的环节,传统认证技术包括口令和数字证书等形式,不过这部分凭证经常会被攻击者盗窃,同时要求用户记忆复杂的口令,无形中给他们带了较为沉重的负担。而在上述认证技术之中融入大数据分析之后,将透过用户和设备行为数据收集、分析等途径,获取相关特征,并鉴别操作人员身份。其和上述传统认证技术相比,存在诸多优势,表现为令攻击者难以透过用户行为特征模仿等途径顺利地通过认证,全面减轻用户记忆复杂口令的身心压力,再就是令不同系统认证机制至此得到全面统一掌控。

另一方面,以大数据为基础的真实性分析。目前该类方式被认定是保护网络用户安全和隐私实效最高的方式,因此许多企业都开始研究该类技术项目,包括雅虎等都开始利用大数据进行垃圾邮件过滤,而Yelp等社交点评网络则应用大数据分析进行虚假评论自动屏蔽。归结来讲,以大数据为基础的数据真实性分析方式,能够大幅度提升垃圾信息的鉴别实力,特别是在机器学习技术支持作用下,能够挖掘更多新型的垃圾信息。如今有关企业仍面对一类艰难挑战,就是怎样收集、存储和管理大数据,如今最为可行的方式就是结合不同技术特色领域,以底层大数据服务为指导媒介,令不同企业之间快速衍生出一类支撑性较强的信息安全服务体系,这样便可以在整体上形成信息安全产业界的妥善生态控制环境。

4 结语

综上所述,尽管说我国在引进和沿用大数据过程中,面临较为严峻的用户信息和隐私泄露危机,不过却也可以凭借大数据完成后续的访问控制和隐私保护改良任务。客观层面观察鉴定,当前我国在大数据隐私防护上的研究还存在漏洞,不过相信经过多元化技术手段和政策法规相互结合之后,必将能够将这部分问题予以科学合理化解决,最终为广大用户提供一类安全健康的网络操作环境。

参考文献

[1]戈悦迎.大数据时代信息安全与公民个人隐私保护——访中国电子商务协会政策法律委员会副主任阿拉木斯[J].中国信息界,2014,11(02):94-101.

[2]王惠莅.大数据安全标准化研究进展[J].信息安全研究,2016,18(05):125-136.

[3]拖洪华.大数据时代安全隐私保护技术探究[J].网络安全技术与应用,2016,11(05):79-88.

作者简介

杭长山(1965-),男,蒙古族。内蒙古自治区兴安盟乌兰浩特市人。大学本科学历。工程师。在中国人民银行兴安盟中心支行从事科技工作。

作者单位

中国人民银行兴安盟中心支行 內蒙古自治区乌兰浩特市 137400