基于大数据的网络舆情预测分析

2019-10-21 08:08刘定一应毅
现代信息科技 2019年12期
关键词:预测方法网络舆情大数据

刘定一 应毅

摘  要:近五年以来,中国网民规模和互联网普及率都在稳步增长。随着网络日益发达,相关部门对前期数据进行获取,基于大数据技术对网络舆情预测问题进行分析,通过网络舆情预测混合算法、大数据舆情预测算法、网络舆情生命周期模型的应用,发现潜在的舆情危机,科学迅速地采取适当措施,引导事件的正确发展,很有现实意义。

关键词:大数据;网络舆情;预测方法;算法研究;生命周期模型

中图分类号:TP311.13;TP393.09     文献标识码:A 文章编号:2096-4706(2019)12-0100-03

Abstract:In the past five years,Chinas internet users and internet penetration rate have been growing steadily. With the increasing development of the network,relevant departments have acquired the pre-data,analyzed the problem of network public opinion prediction based on big data technology,and applied the mixed algorithm of network public opinion prediction,big data public opinion prediction algorithm,and network public opinion life cycle model. It is of great practical significance to discover potential public opinion crisis,to take proper measures scientifically and quickly,and to guide the correct development of events.

Keywords:big data;network public opinion;forecast methods;algorithm research;life cycle model

1  研究意義

2019年2月28日,中国互联网络信息中心(CNNIC)在北京发布第43次《中国互联网络发展状况统计报告》,从多个方面展示了2018年我国互联网发展状况。截至2018年12月,我国网民规模达8.29亿,普及率达59.6%,较2017年底提升3.8个百分点,全年新增网民5653万。我国手机网民规模达8.17亿,网民通过手机接入互联网的比例高达98.6%。

随着网络技术的不断进步和网上媒体平台逐渐趋于成熟,对于研究舆情的相关部门来讲,通过前期复杂数据的获取和后期数据的处理分析,找到老百姓关注的、感兴趣的热点话题,采用有效的预测方法来预估网络舆情事件的发展态势,发现潜在的舆情危机,科学迅速地采取适当措施,引导事件正确地发展,很有现实意义。在2016年4月的网络安全和信息化工作座谈会上,习近平总书记指出:“网民来自老百姓,老百姓上了网,民意也就上了网。”网络起着引导舆论和反映民意的作用,因此,网络舆情的监控预测能够使得政府更加及时地了解群众所思所愿、准确判断和控制舆情发展趋势、及时解疑释惑以及引导事态的正常发展,从而让互联网成为了解群众、贴近群众、为群众排忧解难的新途径,成为发扬人民民主、接受人民监督的新渠道,形成良好网上舆论氛围。

2  国内外研究现状

舆情通常是指作为社会主体的民众对社会事件与现象的看法、态度、情绪或意见的总和,是国情的重要组成部分。网络舆情是由个人和各种社会群体构成的公众,在一定的社会空间内,通过互联网/移动互联网对自己关心或与自身利益紧密相关的各种公共事务所持有的多种情绪、态度和意见交错的总和。它是舆情在网络环境下的表现。当前,网络舆情研究的重点和难点主要体现在网络舆情判断机制的建立与预测方法论的研究。网络舆情判断是一个复杂的系统工程,涉及多种信息获取渠道、信息采集和分析,用到了许多技术和方法理论;预测方法论大多取决于预测方法学的研究进展。

2.1  预测方法和预测模型的研究现状

预测方法在当今许多领域得到了大规模的应用,在实践过程中起到了很重要的作用。目前研究较多的预测模型分为两种:一种是以传统的数学和物理方法为基础的预测模型,一种是基于智能机器学习算法的预测模型。

基于传统的数学和物理方法为基础的预测方法主要包括:微分方程模型、时间序列模型、参数回归模型、指数平滑模型、ARIMA模型、移动平均模型。

基于智能机器学习算法的预测方法主要包括:灰色理论模型、支持向量机模型、神经网络模型、马尔科夫模型、混沌理论、贝叶斯网络、EM聚类、群体智能算法。

2.2  网络舆情预测的研究现状

网络舆情的预测是首先对舆情数据进行准确获取,其次经过系统的数据分析,最后用先进的科学技术方法来对未来网络舆情发展方向进行预测分析,判断其发展态势。

相较于2000年国内互联网开始普及和快速发展,国内网络舆情预测方面的研究起步较晚,从2008年至2012年才逐渐开始。随着网络舆情事件的不断出现和爆发以及网民数量的不断扩大,相关部门对网络舆情的监控也越加重视;研究社会舆情的专家学者也越来越关注网络舆情及预测,得到了一些研究心得。

但相对于网络舆情这个研究的大方向来说,舆情预测的研究尚处于起步、探索阶段,缺少舆情预测的模型。现有的网络舆情预测分析,主要是对民众感兴趣、敏感的话题讨论数据获取、热点事件的发展方向、模型的建立及预测。如图1所示,是网络舆情预测的一般处理过程。

3  大数据的网络舆情预测研究

3.1  大数据舆情的现状

传统的社会舆情主要研究的是社会热点新闻、新政策对老百姓的影响等,方法主要有问卷调查、访谈、分类统计,运用简单的数学建模、函数处理结构简单的舆情数据。

经过多年的快速发展,网络已成为人民群众获取信息、表达观点的最重要的渠道,各种新型社交平台以及科学技术的进步,使得公众的网上言论越来越丰富。目前网络舆情分析方法常用的有:网络调查、基于统计规则、基于内容挖掘的分析方法等。

当前社会舆情的研究正处于从网络舆情分析到大数据舆情分析的过渡阶段。在互联网环境下,网络舆情在数据的体量、复杂性和产生速度等方面,发生了翻天覆地的变化,网络舆论处理方法已超出了传统信息技术框架的能力。大数据舆情分析继承了网络舆情分析的许多方法,针对大数据的4V特征(Volume——数据体量巨大、Variety——数据类型多样、Value——有价值、Velocity——处理速度快),需要运用大数据处理和数据挖掘相关技术从海量数据中提取有用的信息。

3.2  大数据网络舆情预测混合算法

网络舆情是一种复杂、多变的系统,它的发展趋势由于有广大网民的参与,具有爆发性、演变不确定性、隐匿性、互动性等特点。在网络信息技术高速发展的今天,舆情对当今社会的稳定影响越来越大。一方面,网络舆情能够起到社会监督的作用;但另一方面,负面的网络舆情也会对社会公共安全稳定形成较大威胁。

由于网络舆情发展趋势的预测具有较高的复杂性,采用传统统计学的方法具有一定的局限性,因此非线性预测方法是一个大的方向。同时,传统方法在参数方面没有确定统一标准,对比神经网络算法在预测准确性上没有特别的优势。

运用大数据技术能够保存网民在网络上发帖、跟帖的数据信息,反映人民群众的想法和利益诉求,提高大数据舆情分析的科学性、全面性。传统的舆情分析选择的数据和信息不全面,会导致做出片面的舆情判断,结果与真实的状况存在较大偏差。运用大数据技术方法,可以获得真实的、有效的数据来进行判断分析。但是,舆情数据规模的膨胀使得传统算法的时空开销随之增长,原本在小数据集上可以有效运行的计算复杂度,在大数据集上会变得不可接受。

4  拟解决的相关问题

4.1  舆情生命周期阶段划分的表征量选择

以网络舆情事件的关注度为依据,可将其生命周期划分为若干阶段,划分依据是舆情事件的热度表征量。表征量包括:关键词出现次数及变化幅度、发帖总量及变化幅度、百度指数等。具体选择哪一类表征量要根据舆情事件、媒體平台及实验来确定。

4.2  大数据网络舆情生命周期模型

生命周期理论最早由Hill和Hansen提出,后被Vernon、Abernathy、Utterback等人广泛地运用于产品、项目乃至企业。网络舆情事件也同样拥有独特的生命周期。

网络舆情事件的生命周期原理,包括两层含义:一是网络舆情事件具有一定的生命周期,即任一特定事件,都会从其萌发走向消亡;二是网络舆情事件可以分为若干阶段,其演进具有一定的规律性。在不同的生命周期阶段,网络舆情事件表现出不同的特点,各阶段的特点决定了事件的应对方式,对舆情事件进行阶段划分,并找出相应的应对方式,对网络舆情事件的管理至关重要。

借鉴生命周期理论,在舆情预测数据的基础上,研究舆情话题出现后的演化机制和演化规律模型,以关键词(百度指数)或发帖(主帖+跟帖)总量/变化幅度作为主要表征量,对舆情事件生命周期阶段进行定量划分,寻找各阶段的舆情特征,提出相应的引控工作流程和要点。

通过对网络舆情预测算法和网络舆情生命周期模型的研究,为及时、准确地预测互联网舆论热点的走向和趋势提供信息化支撑,有利于政府对舆情信息的监控和引导,也有利于社会的和谐稳定。

5  结  论

本文基于大数据技术,对网络舆情预测问题进行分析,通过大数据网络舆情预测算法、网络舆情生命周期模型的应用,可以提高快速发现潜在舆情危机的能力,科学地判断舆情事件发展趋势,从而能够进行有效的、正确的引导。

参考文献:

[1] 游丹丹,陈福集.基于改进粒子群和BP神经网络的网络舆情预测研究 [J].情报杂志,2016,35(8):156-161.

[2] 应毅,刘定一,任凯.基于大数据技术的舆情分析与决策支持系统架构研究 [J].图书情报导刊,2017,2(9):32-36.

[3] 游丹丹,陈福集.我国网络舆情预测研究综述 [J].情报科学,2016,34(12):156-160.

[4] 应毅,刘定一,任凯.社交网络的舆情热点发现模型研究 [J].图书情报导刊,2018,3(9):68-71+77.

[5] 兰月新,夏一雪,刘冰月,等.面向舆情大数据的网民情绪演化机理及趋势预测研究 [J].情报杂志,2017,36(11):134-140.

[6] 钱爱玲,瞿彬彬,卢炎生,等.多时间序列关联规则分析的论坛舆情趋势预测 [J].南京航空航天大学学报,2012,44(6):904-910.

[7] 周耀明,李弼程.一种自适应网络舆情演化建模方法 [J].数据采集与处理,2013,28(1):69-76.

[8] 夏火松,甄化春.大数据环境下舆情分析与决策支持研究文献综述 [J].情报杂志,2015,34(2):1-6+21.

作者简介:刘定一(1983-),男,汉族,江苏靖江人,硕士,研究方向:计算机应用与高性能计算。

猜你喜欢
预测方法网络舆情大数据
风电短期发电功率预测方法探讨
“互联网+”背景下高校平安校园建设研究
浅析网络舆情治理
基于社会稳定视角的网络舆情预警机制构建的思考
基于大数据背景下的智慧城市建设研究
突发事件网络舆情的演化规律与监控
船舶交通流量及几种预测方法分析