让数据说话,提升新闻价值
——人民网数据新闻发展综述

2016-11-10 10:15唐述权
传媒 2016年14期
关键词:人民网排行榜可视化

文/唐述权

让数据说话,提升新闻价值
——人民网数据新闻发展综述

文/唐述权

数据新闻建立在对大量数据和信息进行分析、处理的基础上,因其直观的可视化和独特的叙事效果而广受新闻界青睐。但数据新闻也存在数据滥用、数据不准确、形式重于内容等问题。

人民网在数据新闻方面做了许多尝试,也取得了一定成效,并且注意避免“为数据而数据”,力求数据为新闻服务,以数据提升新闻价值,增强数据新闻的影响力和社会效益。

人民网数据新闻的发展现状

人民网数据新闻一般由各编辑部门策划和统筹,技术人员和美编共同参与完成。人民网数据新闻的选题策划以要闻部、共产党新闻网、地方部等编辑部门为主,可视化工作由设计部完成,数据分析处理由研发部、人民在线完成,复杂的数据新闻也会采取对外合作的方式。每个数据新闻的参与人数与其复杂程度直接相关,简单的3人就可以完成,复杂的需要5人以上共同参与。

以要闻部为例,可视化新闻组是数据新闻的主要团队,编辑一般在4人左右,简单的数据新闻可由两位编辑进行前期的策划和数据搜集、清洗、分析,后期由设计部1位设计师实现图表可视化。如果是难度较大的数据新闻,则会邀集部门内其他同事参与。上述编辑部门各自形成了有影响力的栏目和新闻产品,比如,要闻部的“十问”年度报道、“图解新闻”、“求真”等,共产党新闻网的“学习路上”“中国领导干部资料库”等,地方部的“地方领导留言板”“旅游数据库”等。

人民网设计部在可视化新闻方面有颇多建树和探索,在历年两会报道、历届党代会报道、“9·3”阅兵等大型报道中均有视觉冲击力强的优秀作品。

人民网数据分析方面的技术力量主要集中在研发部和人民在线,负责数据过滤、整理、分析等。人民在线是舆情分析领域的标杆和先行者,有强大的技术团队,数据分析能力强。

数据新闻产品:为新闻而生

人民网数据新闻的产品分布在各频道中,有的紧跟新闻热点,时效性强,有的经过长时间酝酿有很强的话题设置能力,有的是短平快的数据图解新闻,有的是长期追踪和更新的数据专题。

人民网数据新闻注重数据来源的可靠权威,对数据进行充分整理和过滤,谨慎分析得出结论,或提供数据互动平台。

“老赖排行榜”:数据+新闻=社会效益。

2014年,人民网要闻部策划推出全国失信被执行人(俗称“老赖”)黑名单排行榜,可以查询全国自然人和法人“老赖”的失信排行,也可以查询各省份及各地级市内的排行情况,还可以按失信金额、失信时间、失信次数等多个维度进行排序。该排行榜数据是根据最高人民法院网站公布的“老赖”数据提取分析所得。排行榜一经推出,受到广泛关注。一些企业来函说明情况请求“下榜”。某IT知名公司CEO在排行榜推出后10天内被网友“挖”出,该公司来函表示当日已经缴纳费用要求从排行榜撤除。排行榜还引发了媒体的持续跟进报道(图1)。

同时,最高人民法院执行局对此也高度关注,并与人民网联系,决定以双方名义联合推出。2014年7月,最高人民法院时任执行局局长刘贵祥专程来人民网启动该排行榜并致辞,称赞人民网高瞻远瞩,敢为人先。他表示,“失信被执行人排行榜”充分体现了人民网作为国家权威媒体敏锐的观察力和勇于担当社会责任的魄力。

该排行榜抓取了数十万条原始数据,数据处理工作是最大的难点和工作量最大的环节。原始数据虽然是结构化的数据库,但其中并没有给出具体的涉案金额。为了进行排序,需要将原始数据中的判决一项进行语义分析,提取其中的涉案金额数字。为了确保数据的可比性,对数据做了技术性处理,涉案金额只计主要金额部分,未计入利息、诉讼费等。

为了数据准确,人民网对上榜数据全部进行了人工核对,并且多次核对,核对次数达上万次。核对中发现了许多原始数据录入错误,比如,金额中多一个“万”字的情况。由于数据条目达到百万量级,数据核对的工作量非常大,核对工作非常艰苦。

该数据新闻没有停留在“数据”和“可视化”的形式上,而是紧紧贴合热点新闻,编发多条原创新闻报道,提升了“老赖”黑名单的震慑力,助力破解备受社会关注的执行难问题,发挥了很好的社会效益。

图1 全国失信被执行人(俗称“老赖”)黑名单排行榜

《人民日报》年度报道大数据分析:用数据发现风向标。上头条,哪家强?《人民日报》作为权威的政经风向标,各省份、各地方领导以及各企业上头条和头版情况备受关注。人民网在2014、2015年连续推出了年度分析策划。2015年度的数据新闻,不仅发布专题策划页面,还推出了H5页面、图解新闻和图文新闻报道,在PC端和微信微博等移动端同步发布(图2)。

该数据新闻读取了全年的《人民日报》数据,梳理出31个省份及主要领导、各企业及企业家的见报情况,将数据整理成各类排行榜并进行分析,形成多篇新闻稿件。

稿件包括《2015各地上人民日报头版头条排行榜:浙江第一》《2015各地上人民日报头版排行榜:四川第一》《2015人民日报头版提及最多的地方领导:郭金龙》《2015人民日报报道提及最多的企业家:马云》等。因其揭示了一定的新闻价值,所以获得较大关注度,在微信微博以及传统纸媒上均产生较大反响。

数据采集和分析采用机器分析和人工核对相结合的方式。由于上头条的数量准确度要求非常高,人民网对上头条的标准进行了严格界定,并进行多次逐篇逐日核对,力求准确。

图2 《人民日报》2015年度报道大数据分析

《人民日报》的数据是人民网做数据新闻的富矿和优势所在。在2016年两会中,人民网还推出了《人民日报两会特刊“全息图”》,基于报网融合理念,通过数据分析,以可视化方式发掘《人民日报》的两会关注点,分为“热点话题”“代表委员说”“省份扫描”三个板块逐日扫描。

地方领导留言板排行榜:为民办实事的数据平台。

“地方领导留言板”是备受百姓瞩目的民生栏目,也是人民网的品牌栏目,曾获得中国新闻奖一等奖,被授予“新闻名专栏”称号。

栏目自2006年开办以来,已累计有50多位省委书记省长、500多位地市级一把手、1400多位县级领导对人民网《地方领导留言板》网友留言做出公开回复,涉及全国内地31个省区市中的30个。20多个省市区以“红头文件”形式,建立起回复办理人民网《地方领导留言板》留言的固定工作机制。

截至2016年5月,“地方领导留言板”总留言84万多条,各级党委政府总回复近50万条,成为名副其实的为民服务平台和干群沟通桥梁(图3)。

在此基础上,人民网推出地方领导留言板排行榜,可一目了然地展示各地留言及回复情况,还有各类排行榜以及主题词热度等。在领导回复榜中,能按类别详细展示副省级、市级、县级领导的全国排行情况。此外,人民网还发布各地每月留言回复报告,日常高频次发布网友留言情况和留言回复情况。

图3 人民网地方领导留言板

“阅兵网民情绪展示”:网民抒怀的数据窗口。在2015年“9· 3”阅兵报道中,人民网联合人民在线、新浪、哈尔滨工业大学联合发布数据新闻策划“网民情绪展示”。该策划利用大数据手段,采集当日8∶30~12∶30四个小时内网民在新浪微博平台上的阅兵相关话题并进行统计分析(图4)。

该策划共采集网民有关阅兵的原创微博及转发微博总帖量为453万人次。数据显示,网民参与发帖的峰值点为中午12∶00,峰值数据达50万人次。新浪微博在最热话题中置顶推荐该策划,曝光量达20多亿次。

人民网根据这个策划还推出了数据新闻《“网民阅兵情绪”大数据:裁军最受关注 广东人最爱聊》,广受关注。

在这个项目中,由要闻部作为项目总统筹,新浪提供微博数据,哈尔滨工业大学进行数据运算,人民在线提供前端展现,人民网技术部提供技术保障支持,设计部提供视觉统筹、模板适配。为此,临时组建了20多人的多单位合作项目小组。在一个多月的时间里,项目小组开了数次电话会议,反复沟通细节,并在阅兵前十来天每天进行一场实战彩排,最终在阅兵当天推出,成为全媒体中唯一舆情大数据产品,有效释放了广大网民为阅兵喝彩的真实情绪和真挚情感。

图4 人民网发布“阅兵网民情绪展示”

“‘据’说两会”:用大数据发现网友关注点。2014年两会期间,人民网联合百度知道共同推出数据新闻“‘据’说两会”。该策划基于百度知道的搜索分析平台,通过数据样本分析,得出网友关注度较高的改革、民生、反腐等两会热门话题的关键词排行。该数据新闻以图解形式生动展现,并配合推出文字稿件进行深入解读。

推出的图解报道有《31省区市网友最关注的两会话题》《哪些改革话题网友最关心?》《最热民生话题:就业PK房价,哪个高?》等,并围绕政府工作报告、“两高”报告、总理记者会等推出数据解读。同时,两会期间每日一期的“两会热搜词”也是一大看点(图5)。

图5 人民网联合百度知道共同推出数据新闻“‘据’说两会”

“旅游3·15投诉平台”和“旅游收入监测平台”:数据让新闻产生价值。人民网“旅游3·15投诉平台”于2009年上线,旨在为网友提供能够进行旅游投诉、旅游建言的平台,帮助网友快速、及时地将投诉问题反映给有关部门,推动问题的早日解决(图6)。

网友在该平台留言后,编辑将通过审核的留言信息及时转交负责单位核实,并寻求解决和回复,收到回复后编辑将内容及处理结果发布在平台上。该平台的特点是快速、直观,网友每一条留言的投诉内容、被投诉单位、解决状态、回复状态都以表格的方式罗列在网上,网友可以方便、清楚地看到自己留言的处理状态。

投诉平台根据网友投诉和回复情况发布月度、季度、年度等各种形式的数据分析报告,在旅游业内有很大影响力。各省、市旅游质监所和携程、去哪儿等相关企业积极回复网友投诉。网友投诉成为各大媒体报道的素材,至今已经先后四次被央视节目用作报道案例和数据来源,包括《焦点访谈》《朝闻天下》等节目,案例有“杭州母女日本游机场被甩”“香港澳门贵宾券变购物游”等。此外,《南方日报》《中国新闻周刊》《经济参考报》等媒体也多次引用平台的数据。截至2016年5月,平台共发布投诉2万条,回复2000多条,追回款项总计1800多万元。

此外,人民网旅游频道长期跟踪国内旅游收入情况,搜集整理各省份公开的各大节日的旅游收入数据,推出“旅游收入监测平台”,并在每个节假日后及年末推出“各省区市旅游收入排行榜”“重点旅游城市旅游收入排行榜”“5A景区旅游收入排行榜”等系列稿件,引发业界关注。

图6 人民网“旅游3·15投诉平台”

小型数据新闻:贴近新闻事实并提升新闻价值。除了大型的数据新闻,人民网日常也会推出相对简单的数据新闻,其取材广,可操作性强,制作周期短。这些数据新闻往往更加聚焦某一个新闻事实而深入挖掘,产生独特的新闻角度和新闻价值。以下是一些代表性作品。

从10年数据看党的十八大后发展党员如何“控制总量提高质量”。搜集整理近10年中国共产党党内统计公报的数字,以图表形式直观展现,提炼出“控制总量、提高质量”这个核心观点,也是中央对发展党员的核心要求(图7)。

图7 从10年数据看党的十八大后发展党员如何“控制总量 提高质量”

“2015年政府工作报告对账单”。用数字对比形式表现前一年政府工作报告中所作各项数字指标性承诺的完成情况。

人大代表建议分析。从全国人大官网提取近3400份人大代表的建议全文,将其全部570.8万字进行数据分析和挖掘,形成数据新闻类图解《3393件代表建议今年大公开都在关注啥?》。

各城市空气优良天数分析。“十三五”规划提出,到2020年地级及以上城市空气优良天数比率要超过80%。以此为切入口,人民网在各地环保部门官网和媒体报道中,对36个省会城市和计划单列市的优良天数进行近三年数据的逐个查找和核对,整理形成一份目标差距排行(图8)。

图8 近3年各城市优良天数平均值离292天还差多远

2015美国枪击案地图。从统计美国枪击案历史数据的枪支暴力档案网站 gunviolencearchive.org搜集2015年全年的枪击案详情数据,经过数据分析,制作成一份美国枪击案地图(图9)。

图9 2015年美国各州枪击案详情数据

数据新闻的展望

与大数据结合越来越紧密。数据新闻的独特之处在于用数据说明问题,数据的多少、准确度、完整性等关系到数据的质量优劣,以及得出某个结论的说服力。无疑,大数据在数据质量方面相对于零散数据有很大优势。比如,如果是一个关于北京市空气质量变化情况的数据新闻,就需要近十年甚至几十年的每日空气优良情况、PM10或PM2.5的数值、臭氧浓度值、二氧化硫浓度值等,再进行建模换算对比,同时需要对长时间跨度里生成数据的不同标准进行处理。如需分析成因,还需要小汽车数量、尾气排放数据、各类工业排污数据等。

需要更加具有新闻价值、更加接地气。数据新闻如果脱离新闻这个本质,只在技术表现上故弄玄虚,就难以持续发展。新闻价值的高低决定着数据新闻的质量以及传播力。

纵观国内各家网络媒体,在经过最近几年的数据新闻探索后,越来越意识到需要更多地回归到新闻内容的本真上,越来越重视与热点新闻事件的结合,以及通过数据分析来更进一步揭示出新的新闻点。

高质量产品需要更多地对外合作或借用外力。国内有传统媒体背景的新闻网站普遍缺乏自有数据,需要更多地与拥有大型数据的外部单位合作,才能制作出高质量的数据新闻产品。

对外合作的对象一般有政府部门、调查机构、科研机构、大型商业网站等。如各大部委等政府网站公布的权威数据,国内许多调查机构和科研院所会不定期发布数据类调研报告。另外一个与民生贴近的重要数据来源是商业网站,如百度地图和滴滴的出行数据、支付宝和蚂蚁金服的金融数据、携程的旅游数据、大众点评的饮食数据等。

可视化、动态化、移动化更明显。在可视化方面,除了常规的图表、折线图、关系图等,对电子地图、卫星地图甚至街景地图的利用会得到更多普及,最近崭露头角的VR技术(虚拟现实)应该也会有更多的尝试,地图和VR技术更具有身临其境的现场感。

在今年全球编辑网络(Global Editors Network)峰会上揭晓的2016数据新闻奖中,包括年度最佳数据可视化奖在内的多个获奖作品均很好地利用电子地图来呈现。在动态化方面,GIF动态图、短视频会受到更大的重视。在移动化方面,会更多考虑产品在多平台的兼容性。

受制于全社会的数据公开水平。目前,中国的数据公开水平还有很大提升空间,尤其是掌握大量权威数据的政府部门,普遍存在数据未公开、公开数据有限、数据格式不统一等问题,这些对数据新闻的制作带来很大障碍。

在美国,数据公开上升到大数据国家战略层面,2009年推出的Data.gov是美国最重要的数据开放平台,涵盖了农业、气象、金融、教育、医疗、交通等各个政府门类的数据,而且有统一数据格式和应用接口,非常便于再开发利用。

中国政府近年来也非常重视政府数据公开,出台了《促进大数据发展行动纲要》等重要文件,相信我国的数据公开水平会有很大提升,数据新闻也可随之有更大发展。

作者系人民网要闻部可视化新闻组主编

猜你喜欢
人民网排行榜可视化
基于CiteSpace的足三里穴研究可视化分析
思维可视化
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
排行榜
从人民网的实践看区块链技术在主流媒体创新中的探索应用
排行榜
排行榜
人民网:杭州9名环卫工赴新加坡“进修”
美妆排行榜