传统议题的大数据突破策略——以央视春节报道的《“据”说过年》系列报道为例

2015-02-26 18:48白玛央金王晓晔中央电视台新闻中心北京00859中国人民大学新闻学院北京0087
新闻研究导刊 2015年16期

白玛央金王晓晔(中央电视台 新闻中心,北京. 00859;中国人民大学 新闻学院,北京. 0087)

传统议题的大数据突破策略
——以央视春节报道的《“据”说过年》系列报道为例

白玛央金1王晓晔2
(1中央电视台 新闻中心,北京. 100859;2中国人民大学 新闻学院,北京. 100872)

摘 要:大数据带来的信息风暴正在改变我们的生活、工作和思维。随着数字技术的发展和新闻界对新闻客观性和真实性的不断探索,大数据新闻应运而生。大数据新闻的关键不在于数据本身,而在于数据讲故事的能力,在于能否基于读者的不同地域和兴趣图谱来进行个性化推荐和新闻定制,以及对未来趋势的预测性报道。本文结合案例分析,对电视媒体如何实施大数据策略进行了探讨。

关键词:大数据范式;大数据新闻

一、大数据范式

大数据带来的信息风暴正在改变我们的生活、工作和思维。大数据颠覆了人类的思维惯性,对人类的认知世界和与世界交流的方式提出了新挑战。2011年时,全球的数据量就已经达到1.8Z[注:1K=1024Byte,1M=1024K,1G=1024M,1T=1024G,1P=1024T,1E=1024P,1Z=1024P],预计2015年将接近8Z。大数据具有规模大、价值高、交叉复用等特征,不同行业、不同领域的数据之间的交换与相互利用也变得频繁,对于如此巨大的数据量,传统的研究范式必须做出改变,“大数据研究范式”应运而生。

1998年获得图灵奖的数据库领域专家的吉姆·格雷(James Gray)认为一个完整的科学研究周期包括四个部分——数据采集、数据整理、数据分析及数据可视化。现代科学研究可以通过多种方式收集和生成数据,但对于大量收集到的数据却缺乏好的整理与分析。因此,吉姆·格雷于2007年提出了科学研究的“第四种范式”,即大数据范式。

在大数据范式提出前,观测是有目的地搜集数据再做验证的研究过程。而大数据范式下,预设的目的不是研究的必要前提,可以在观测数据的同时发现微小的“秘密”。

另外,大数据时代已经可以基于大数据分析和挖掘每一个人的社会行为。过去的数据分析更多的是对一个群体进行行为定位。例如,青少年群体、妇女群体等,而大数据使基于全样本的研究成为可能。例如,在央视2014年的《据说春运》系列报道中,央视第一次尝试使用大数据来展现春运过程中中国36亿人的迁徙过程,对每个开启定位功能的手机进行记录,一次移动就是一条亮线,在地图上生成了无数亮线,亮线越亮越粗,说明迁徙人数越多。在这个大数据新闻报道中,研究样本是每个开启了手机定位功能的行为个体,基本上做到了全样本研究。

二、大数据新闻的理念形成与操作路线

大数据新闻并不是凭空出现的,是随着数字技术的发展和新闻界对新闻客观性和真实性的不断探索发展而来的。

20世纪60年代,精确新闻报道(Precision Journalism)伴随着抽样技术和计算机技术在新闻领域的运用开始不断发展,为新闻报道提供了更高的精确度和更快的效率。

随着计算机技术的普及和应用,20世纪90年代计算机辅助新闻(Computer Assisted Journalism)在调查报道中的比例日益增加,也有助于精确新闻报道在技术上和精确度上的进一步提高。

20世纪90年代,继计算机辅助新闻以后,西方新闻界又陆续提出了“新闻采写2.0”、“数据库新闻”等概念。在21世纪初,记者们开始尝试从一些数据库中找一些数据集以便挖掘新闻专题,这些数据库既包括政府公开数据库,也包括媒体自己的数据库。在早期的数据库新闻里,没有基于数据的价值挖掘,也没有深度分析,只有对原始数据的初步整合。

大数据新闻是基于大数据分析思维的新闻报道,代表了未来新闻发展的一种趋势,是数据驱动新闻更高一级的形态。新闻内容的价值来自于对数据价值的深度挖掘和关联性分析。大数据新闻的关键不在于数据本身,而在于数据讲故事的能力,在于能否基于读者的不同地域和兴趣图谱来进行个性化推荐和新闻定制,以及对未来趋势的预测性报道。

三、《“据”说过年》在大数据新闻道路上的探索

(一)传统选题的大数据视角

“春节”是多年不变的媒体报道选题。在大数据的带动下,对春节选题的挖掘已经从人物故事和亲情等话题中跳脱出来,变得更加丰富多彩。在2015年2月11日的央视晚间新闻《“据”说过年》中,从春运的大数据中挖掘出了铁路新规催生出的“屯票族”。据节目介绍,今年通过网络购票的人群当中,11%的人买了三张或者是三张以上的火车票,也就是说我们身边10个人里就有一个“屯票族”。“屯票族”产生了很多连锁反应,在广东佛山,买票取票的只开一个窗口,可是退票的改签的却有3个窗口。青年男性成了最活跃的“屯票族”。在2015年2月18日,《“据”说过年》关注了“年夜饭”,节目中说,年夜饭菜单、年夜饭菜谱、年夜饭作文是年夜饭搜索的前三名。而且年夜饭菜谱越来越“瘦”,排骨成了最受欢迎的肉菜。“口味迁徙图”反映了东北菜在南下,川菜在东进北上,菜系的迁徙一定程度上反映了人口的迁徙变化。

这些从“屯票族”、“口味迁徙图”引发的对于铁路新规的思考、对于人们生活方式的变化规律思考是以往没有大数据的时代很难触及的选题。那么,可以说,央视利用大数据完成了传统议题的新演绎。展现出了不一样的春节报道视角。

(二)主动寻求大数据平台的技术支持

《“据”说过年》系列报道中运用了百度地图LBS定位大数据,在屏幕上直观地向观众展示全国范围内春运人潮流动情况。当前央视大数据新闻的数据来源多为互联网公司及第三方服务提供商等机构,它们本身在大数据生产、存储、分析、呈现方面具有硬件上的优势。例如,百度、腾讯、新浪、当当网、360搜索、亿赞普、中国银联等。其中,互联网公司在所有数据来源中所占的比重最高。以数据引用频次最高的百度为例,百度是国内最大的搜索引擎提供商,目前占据了中国搜索引擎市场月81.7%的份额,覆盖了国内超过6亿的网民群体,这是百度基于海量网民行为数据进行大数据开发的基础。百度开发了“百度迁徙”(基于百度地图的LBS数据)、“百度预测”(以百度搜索数据为基础)、“百度商情”(以百度搜索数据为基础)等多款大数据产品,提供给包括央视在内的第三方机构。同理,腾讯、新浪、当当网等公司旗下都拥有多款海量用户的互联网产品,并据此积累了社交、电商等领域大数据优势,可以为新闻机构提供这方面的数据。

(三)视觉效果形象化

在新闻学的实践探索中,我们提出“不要堆砌数据,让数据鲜活起来”的经验总结。受众不是数据分析师,一味地堆砌数据并不能产生传播效果的飞跃。在央视的《“据”说过年》系列报道中,运用了简单的动画效果完成数据解读,单调的语言有了更加形象化的画面予以配合。另外,电视传播媒介特别是对于新闻事件的传播,不仅有对既有事实的报道,也有预测性报道。虚拟的画面恰恰能够展现事物变化规律和方向。

在2015年2月18日的《“据”说过年》节目中,在展现年夜饭相关大数据时,用了虚拟的菜品动画,这些动画立体感强,又逼真形象,充分展现了电视在画面呈现方面的明显优势。并且图像展现与主持人的讲解词配合紧密,不断变化,进一步吸引了受众的注意力。斯坦福大学2013年的纪录片《数据时代的新闻学》中就曾提到,作为一种讲故事的方式,可视化技术利用了许多其他领域中发展出来的技术,生成各类可视化图表。例如,杂志风格的图表、加注释的图表、科学展览海报式图表、动态流程图、连环漫画图、幻灯片、电影/电视/动画/等。这些都使数据时代的新闻学有了“悦读”的效果。

这种视觉效果的美感就在于可视化数据和动态图形的结合。既有趣,又严肃,有了娱乐性,而视觉的体验又很强烈。央视在视觉效果的呈现上在不断地试图突破。2014年,央视首次运用大数据进行春节期间的报道时,《“据”说春运》系列报道也做过和2015年《“据”说过年》相同的关于春运的动态画面,当时的画面是在主持人身后出现的屏幕,而经过了一年的技术改进,数据画面更加富有变化性,立体效果更强,在画面切换时也有了更加逼真的展现。

四、结论与讨论:电视媒体如何做到大数据策略的巧应用

(一)大数据不代表结论客观

央视作为主流媒体要努力创造“公信力市场”(trust market),在海量数据可以通过数字化技术得到快速传播的今天,核实信息的真伪似乎变得比获取信息更费力。当信用成为一种稀缺资源之后,包括电视在内的传统媒体如果能够创造一种“公信力市场”(通过深入调查事实、剖析事情发生的原因、趋势来为公众筛选出具有价值的信息、提供具有公信力的融合报道)就可以创造新的竞争优势。

大数据的来源越来越多,无论是商业机构、政府机构还是门户网站、搜索引擎,都可以成为大数据的提供者。但我们必须对数据的真实程度、全面程度有一个基本的评估。

另外,科学的研究方法的运用也是大数据新闻操作过程中需要注意的。大数据是一种宏观的趋势分析,而趋势和规律背后的原因需要配合微观的个体调查方法、相关性分析方法等多种研究方法来实现。《卫报》在对骚乱事件进行报道的过程中,一方面对250多万条与骚乱有关的Twitter进行分析;一方面进行了300多个深度访谈。

而央视的一部分对大数据的解读并没有充分的依据。中国人民大学陈力丹教授就曾对《据说春运》系列报道的一组大数据的分析提出了质疑。系列报道中说,春节期间,搜索相亲的人中,78%是男性,这中间20~39岁的人数占79%,因此得出结论,这个年龄段的人群,可能正在路上,心里盘算着怎么躲过父母安排的相亲呢。而陈力丹认为,在20~39岁中搜索相亲的男性,他们都是未婚人群吗?如果未婚,搜索相亲一定代表他们在谋划着如何躲避父母的相亲嘛?这个结论过于武断。

事实上,变量之间的因果关系很难确定。大数据通常只能解释变量之间的相关性,但这并不是因果关系。如果A和B之间存在相关性,有可能一方是因,一方是果,也有其他因素导致了A和B的变化。而且如果限定条件有变,可能会存在对结果产生很大影响。

(二)进行大数据新闻团队建设

外国媒体对大数据新闻的实践早于中国。早在2012年年初,数据新闻项目“信息亚马逊”就实现了为全世界最原始的生态系统提供互动地图的功能。这个地图可以提供最新的数据和报道,读者也可以自行上传内容。

目前国内利用大数据做新闻还处于起步阶段,央视和百度2014年初合作的“据说春运”、“据说春节”等开启了大数据新闻的有益尝试。但这一尝试目前仅偶尔为之,没有成为有固定时段的新闻节目。如果要在大数据新闻方面做出突破式的进步,要有专门的大数据新闻团队,根据国际同行的经验,大数据的新闻团队均由新闻专业人员与产品研发人员、数据分析人员组成,后者充分进入媒体生产流程,其情形如同《芝加哥论坛报》的新闻应用团队所说,它们就像潜入新闻编辑部的一支快乐黑客团队,常在与记者面对面交谈中找到他们需要做的东西。

央视如果想在大数据新闻上做出真正的突破,应该建立专业团队,打破传统思维,选题出新,与先进技术接轨,与IT专业人员结合,利用自身的优势资源,打破传统思维的束缚,以专业团队做专业内容。

注释:①关于大数据新闻历史沿革的分类和时间路线,参考了香港城市大学祝建华教授2014年5月中旬在中国人民大学新闻学院讲座PPT里的内容。

参考文献:

[1]苏萌,周涛.大数据商业革命《2012年夏季达沃斯特刊》[DB/OL]. http://www.sootoo.xom/content/340794.shtml. 2012.

[2]喻国明,李彪,杨雅,李慧娟.新闻传播的大数据时代[M].北京:中国人民大学出版社,2014:224.

[3]朱家麟.环宇计算机辅助新闻学[J].中国记者,2002.

[4]徐琦,宋祺灵.国内电视媒体大数据新闻实践探析——以央视新闻为例[J].新闻界,2014(14).

[5]黄超.复杂议题融合报道中的大数据策略——以《卫报》网“解读骚乱”专题为例[J].新闻界,2013(14).

[6]陈力丹,李熠祺,娜佳.大数据与新闻报道[J].新闻记者,2015(02).

中图分类号:GG221100......

文献标志码:A...

文章编号:1674-8883(2015)16-0249-02