借大数据实现对受众需求的精准分析

2016-05-14 05:38王君
中国广播 2016年5期
关键词:受众需求大数据

王君

【摘要】实现精准的个性化受众需求服务的前提条件,就是精准的个性化传播需求分析。要实现这一目标,必须依靠以大数据为代表的新技术。本文从大数据智能分析系统平台的建立、大数据分析的步骤和方法以及不断提高受众需求分析的准确性和高效性三个方面来论述如何实现对受众需求的精准分析。

【关键词】 大数据 受众需求 迭代思维

【中图分类号】G201 【文献标识码】A

大数据之大,可以用三个“之”来概括,一是体量之大,二是维度之多,三是功能之强。体量之大很好理解,就是它的信息已经不是我们日常所提及的GB、TB(1024GB=1TB)量级,需要用PB(1024TB=1PB)、EB(1024PB=1EB)、ZB(1024EB=1ZB)甚至更大量级来计算了;所谓维度之多,是指对一个事物所掌握和记录的信息是全方位的,这些信息均来自于客观世界的自然流露和真实状态;所谓功能之强,是指其强大的对数据信息的分析、处理和应用能力。大数据理念最终实现让数据说话,一切以数据为基础,通过数据之间的相互关联性找到问题的症结,对事实的真相进行相互佐证。

当今时代,受众已经牢牢占据信息传播的中心和主导地位,这一点毋庸置疑。新兴传播更多地表现为小众化和分众化传播,媒介市场和受众资源已经被细分。作为信息服务提供者的媒体,都在想方设法地为吸引更多的受众、占据更大的市场份额、获得更好的信息传播效果而不懈地努力着。如果把营销学里提倡的精准营销的观点引入到传媒领域,可以确立这样一个命题:实现精准的个性化受众需求服务的前提条件,就是精准的个性化传播需求分析。要实现这一目标,必须依靠以大数据为代表的新技术。

本文从研究受众需求出发,审视和探察居于其中的广播受众信息需求的规律和特点,最终形成用数据分析、用数据决策、用数据创新的“三用”分析方法。

一、建立大数据智能分析系统平台

简单理解,系统平台就是对数据信息资源实现采集、分析和处理等工作的硬件环境和软件环境的总称,是大数据时代彰显技术魅力的关键部分,最终把数据变成有价值的决策信息。系统平台的建立有两个办法:“自己建”或“别人帮着建”。对于传统媒体来说,自建大数据平台几乎没有可能,也没有必要,第一是因为投入过高,第二是缺乏相应的人才和机制。

传统媒体如果能够利用好各种开放的数据信息和自身掌握的数据信息资源,将分散的信息数据全部集中在大数据中心进行处理,完成个性化设计或订制自己的大数据系统平台,就能为实现精准的受众信息需求分析打下基础。如图1所示,“开放的数据资源”和“自有的数据资源”相比,所包括的图形和样式都较丰富,这是因为开放的数据资源来源渠道更广泛、形式更多样。

那么,具体到基于广播的大数据系统平台,在功能模式的建立上应包括如下三点:

(一)关注移动人群

处在移动中的受众,因为声音伴随性强而将广播作为获取信息的首选。所以,基于广播的大数据分析系统在建设之初,就应该把着力点放在对移动人群信息需求的数据采集和分析上。我们可以设想这样一个场景:2016年1月28日早晨,一上班族在私家车上无意中收听到了中央人民广播电台(以下简称中央电台)中国之声早间的《新闻纵横》节目正在播出的《致我们正在消逝的文化印记——归来兮鲁班》,富有画面感的文字、背景音乐加之播音员充满磁性的声音,一下就勾起了听众对孩童时期关于木工这一传统手艺的记忆,让听者很温暖也很有感触。那么,有关这一期节目的音视频、文字和图片等信息都可能成为他之后要了解的相关信息。广播如何通过大数据平台感知到并通过相关渠道(比如注册的手机)让受众能够方便地获取,这些都是需要我们思考和破解的难题。

(二)聚焦手机客户

不容置疑,智能手机已经成为获取信息、沟通世界、娱乐消费等功能集于一身的随身必备工具。据2016年1月22日发布的第37次《中国互联网络发展状况统计报告》显示,截至2015年12月,中国手机网民规模达6.2亿。那么,手机用户理所当然成为我们必须要关注和服务的庞大受众群体,通过大数据分析平台,运用手机客户端等方式进行实时采集、分析与准确把握手机用户的需求,才能更精确地改进节目产品、丰富节目样态,更好地服务和满足受众。

(三)挖掘声音魅力

中央电台台长阎晓明在2016年中央电台战略资源推介会上表示:“在一个用眼过度、视觉疲劳的时代,人们希望重新开发和利用耳朵,通过声音获得信息与雅致。”的确,声音不仅能够传递信息,还可以让人们得到享受。闭上眼睛、进入声音的世界,让眼睛得到休息、重新品味声音的魅力已成为越来越多人自我休息、调整的方式。在声音的领域里,广播能够深耕和挖掘的东西还有很多,这是广播的优势,也是广播的特色。大数据系统平台,应该给广播人提供更多有价值的参考数据,为采编策划人员的计划和决策提供依据。同时,我们也应该认识到,声音已经被越来越多地拓展到人机交互领域,声音与文字之间的互译(机器人自动播报、微信里的“语音输入”)也已经成为现实。通过大数据挖掘声音的魅力并匹配受众的个性化需求,就能使广播未来的发展空间得到无限的延展。

二、对受众需求进行大数据分析的步骤和方法

大数据分析的步骤,大致包括数据采集、数据整理、数据分析和结果呈现四个环节,本文重点讨论前三个环节。

(一)对数据进行采集

1.数据来源渠道的多样性

必须认识到,通过收音机收听广播来参与广播节目,是无法实时感知的,因为数据没有被数据化和网络化,我们无法采集。大数据平台通过互联网可认知的终端设备(比如手机、互联网PC等智能设备)上的不同应用系统(比如手机客户端、微信公众号、微博、交互论坛等),可以获取来自不同渠道的受众多维度信息。

2.数据分析参数的多重性

横看成岭侧成峰,这句诗揭示了一个自然界的普遍规律,人们观察和分析事物的角度不同,会得到不同的结果。不难理解,大数据平台数据信息来源的渠道越广泛、数据参数越多样(统称为维度越多),那么对受众信息需求的分析和判断也就越全面、理性和客观。在大数据技术研究领域有一种非常形象的说法叫“给用户画像”,你用一笔画一个人物和用十笔画一个人物,哪个更清楚、更容易辨认,结果不言而喻。

就传统广播来说,需要采集的、感知的受众信息需求的分析参数包括但不限于:参与的时间、时长,关注的节目类别、内容,受众的年龄、文化程度,体现出来的声音、视频、图片甚至是地理位置等诸多信息。这里既包括可以用数量度量的结构数据,也包括不能被数量关系衡量的半结构或非结构数据。

如图2所示,以目前的中国之声为例,把参与界面、分析参数、中国之声的所有节目作为研究的三个坐标轴,便可以立体和直观地勾画出一个关于受众参与中国之声所有节目的具体情况。在分析参数中,受众的身份信息包括性别、年龄、学历,甚至是地理位置等情况,参与的情况包括参与的时间、参与的时长和关注的细节等情况,交互的信息包括文字留言、图片、声音和视频等信息。

(二)大数据平台对数据进行分析

对广播来说,在进行节目设计和节目产品的制作之前,如果能够通过对自身系统平台采集到的海量受众信息进行特定的推算和分析,实现受众需求的精准定位,就可以使节目设计和产品制作更加贴近受众。目前,美国好莱坞已经开发并使用了类似的分析系统,能够准确地预测出一部电影的票房,可见广播要实现上述目标在技术上已经不存在多大的障碍。

分析指的是数据整理和数据分析两部分之和的简称。首先是关于数据整理,在大数据的存储阶段就要完成对数据的基本整理工作,整理工作的主要任务就是两个:“去重”和“标注”。要达到低成本、低能耗、高可靠性目标,通常要用到冗余配置、分布化和云计算技术,在存储时按照一定规则对数据进行分类,进行多元、立体化的标签标注,通过信息噪音过滤和去重,减少存储量,同时加入便于日后检索的标签。

其次是关于数据分析。目前,各行业、各领域都在进行基于大数据的技术创新和实践活动。鉴于当前情况,我认为数据分析和处理可以设想的重点和核心问题主要有以下四点:

1.大数据平台的独立运算单元:基于一个最基础的需求

因为是基于自有数据信息的分析,所以对受众信息需求的分析结论是最直接和准确的,而得出结论的这个系统可能就是由一个或几个小系统平台组成的。那么,基于一个最基本的任务和目的的小系统平台,就成为了未来系统走向智能化、架构大数据平台的独立运算单元。在现阶段,绝大部分的分析、预测系统平台也都是基于某一特定的需求而设立的,具有明确的目的和意义,是理想化的大数据平台的雏形。

2.由繁到简:大数据平台分析处理数据的前奏

再繁杂的数据信息,都需要完善的分析结构和有效的算法来进行剥离,最终得到一个相对准确、清晰的判断或结果,以指导实践并成为我们创新发展的依据。在分析处理数据时有一个常用概念:降维,即降低数据的维度。三维的变二维,二维的变一维,目的就是为了压缩数据量,找出其中蕴含的规律。简单理解,比如一张纸是两维的,你从它的侧面去看,就是一条线,自然就降低了一个维度。降维从数学角度来看,是一种机器算法,是数据预处理的一部分,通过降维,可以减少冗余信息所造成的误差,来提高认识的精度,寻找出数据内部的本质结构特征,提高后续计算的速度。

3.衡量智能化水平的标准:关联数据量的大小和运算能力的强弱

机器智能是通过模仿“人脑”来实现的,即“事件关联”。所有的决策都是在有了记忆、有了关联之后自然发生的事情。人的认识规律是这样的:碰到开水,烫到了手下次就不会碰,因为记忆了“开水”和“烫手的痛苦”,并将这两个记忆关联在了一起,自然就有了下次不去碰开水的决策。那么,如果把“开水”“烫手的痛苦”和“杯子”,这三个记忆关联在一起,就会增加一种新的决策结果,就是可以用“杯子”去打“开水”,就不会发生“烫手的痛苦”。当然,前种判断基于的数据信息量自然要小于后种判断的信息量,但后种判断比前种判断更加复杂和智能。

4.从庞杂的数据中挖掘规律:从“已知”推导出“未知”

每一个数据信息的产生都是真实世界的反映,都能够反映一定问题,这就是数据存在的意义和价值。而且,同一个事物不同维度的数据信息之间,必然存在着内部因果联系。

假设发生在每个人身上的事情都能够被数据化,并且这些数据信息除去涉及国家安全、个人隐私等法律法规明令禁止的之外,都是公开的、可检索的,那么,基于这个人的信息的全部组合就能无比清晰、准确地勾勒出这个人的“全貌”。他的行为习惯、工作环境、饮食特点和健康状况等,就能够成为媒体为其提供信息服务的重要参考依据。

未来,无论大数据平台如何发达、网络化程度如何高,世界上的所有事件我们永远也无法百分之百地全部被数据化之后完成记录和采集,但是,从另外一个角度来说,只要我们能够收集重要的、足够多的信息,就能对某些我们无法感知的事物或将要发生的事件进行准确的推断和预测。由已知推断未知,这也是人类认识世界、探索前行的普遍规律。

三、迭代思维:不断提高受众需求分析的准确性和高效性

迭代思维简单说来就是快和重复,快是迭代的必然要求,重复不过是迭代的表现形式,而迭代的真正内涵是升华、是积累、是总结、是量变到质变再到量变的无限的过程,每一次迭代都是站在新的起点上的再开始。对反馈信息的总结是迭代过程中的重点,没有反馈,没有总结,迭代出来的结果跟迭代前没什么本质的区别。

在对数据进行分析和处理的过程中,人的因素始终处于主导地位。数据不能代替判断,相关性也不能取代理论。大数据归根到底还是数据,是精华与糟粕并存的。相关性更多的是两个或两个以上的变量之间的简单线性关系,不像理论具有多变量、变量与变量之间的结构性与多变性,两者不是简单的对等关系。

首先,要通过不断地去迭代实现数据的去芜存菁,去伪存真。没有谁可以一次性地解决问题,也没有谁可以一步走到完美,对大数据这样一种在当下听起来“很美”,但还处于探索和实践当中的新事物来说尤其如此。其次,根据反馈信息,通过迭代,实现实时跟踪和准确把握受众信息需求变化的功能。也因如此,对大数据平台的系统性能提出了更高的要求。

眼下热度极高的大数据、算法、可视化等都只是工具与手段而已,最根本的还是对人性的领悟,对人的需求的尊重,以及媒体人自身的知识、智慧、勇气和品德。受众既依赖媒体,又对媒体有要求和选择;媒体既为受众服务,又要有自己的风格和品行。大数据时代,作为媒体人,需要很好地理解和把握开发受众需求、满足受众需求、引领受众需求之间的关系和媒体在其中的角色及职责使命。

注释

喻国明 李彪 杨雅 李慧娟 《新闻传播的大数据时代》,中国人民大学出版社,2014年10月第1版,第165页。

李光斗 《移动互联网时代的迭代思维》,《福建质量管理》,2014年第3期。

蔡雯 《“端”的探索与“心”的联通》,《新闻与写作》,2015年第8期。

(作者单位:中央人民广播电台办公室)

(本文编辑:饶雷)

猜你喜欢
受众需求大数据
历史剧中现实中的指涉与受众需求探析
受众需求视角下的电视新闻编辑创新方式论述
基于受众需求的电视台新闻编辑工作的创新思考
电视媒体微信公众号运营探索
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
基于受众需求的电视纪录片创作
使用与满足理论与真人秀节目人物形象