爱奇艺流量防刷系统获专利引领视频平台展开流量盗刷“歼灭战”

2016-02-15 02:34
综艺报 2016年21期
关键词:爱奇艺流量内容

2016年已过大半,视频网站的自制内容如雨后春笋层出不穷,各平台内容品质也以破竹之势迅速提升,但其中到底有多少水分一直牵动着大家的神经。怎样才能营造一个健康公平的发展环境,被越来越多的业内人士所重视。

爱奇艺从5月份高调宣布构建平台生态以来,持续释放势能,强调从内容生产者、提供方向IP综合服务提供方转化。截至今年8月,爱奇艺最新数据显示,其日均用户行为日志分析数据已达40 TB。

在更多的用户、客户和内容生产者着陆爱奇艺的同时,爱奇艺没有放松作为技术公司的追求,全面升级了数据监控系统。其自主研发的防刷系统能够通过机器学习,结合业务特性对反刷规则进行动态更新,并在反作弊引擎和自适应实时反作弊装置等多项数据防刷技术上获得独家专利。

爱奇艺CTO汤兴表示:“爱奇艺作为中国最大的综合视频服务平台,有责任持续通过有效的技术和法律手段维护内容健康生态,保障用户、广告主和片方利益。爱奇艺将继续加大在防刷量系统上的研发投入力度,促进行业长久健康发展。”

流量盗刷猛于虎

一直以来,抵制数据作假就是影视行业的长期战役。虽然国家政策三令五申,但终究苦于没有有效的监测手段公平评判,业内人士也通常凭经验判断。

“原来的数据作假,现在的视频网站流量作假,都是完全在利益驱动下产生的。一些人要增加自身价值,以便获得更多广告或是分成收益。但这种作弊行为造成了恶劣影响。”汤兴直言不讳地说出长久以来被行业漠视的问题。

这种不真实的数据让行业陷入混乱。汤兴坦言,刷流量的行为危害极大,“数据的公正性是平台良性发展的基础,刷出来的流量失去真实性,影响平台的自身运营决策;用户通过流量选择观看内容也会受到误导;广告客户决策会把预算分配到流量高的内容上,而虚假流量会影响投放判断。”

爱奇艺一直在呼吁成立“反刷联盟”,虽然这可能不比防止盗版容易多少,但是已经受到了很多合作伙伴的认同,“我们接触的很多内容生产者都已经认识到数据真实的作用,因为公平才能帮助他们更好的链接消费者,变现并获得收益。”

“公平公正的内容竞争环境,让用户、广告主、片方和平台多方都从中获益。用户可以从真实数据中获得有效的观影参考,优质内容能够获得对应的关注热度和流量口碑积累。真实有效的数据系统,也能够帮助广告主将商品推广触达真实用户,实现营销效果最大化。流量数据的真实有效能够让内容回归最本质的品质竞争,头部内容更有机会获得更大的商业回报和用户关注。”

开放的数据平台带来精准定位

数据的真实性对视频网站能否精准判断用户喜好的力量不可小觑。

“如果一个内容它的流量是刷出来的,你怎么能知道用户准确的喜好,把内容的品质分析出来。”汤兴说,这会误导制作与购买的决策。

作为一家以技术为先导的公司,爱奇艺为了让数据更有说服力,监测的维度比第三方数据监测公司还要宽广,除了基础的视频播放时长、产生的UV、VV数量,还兼顾到了整体广告投放数据、用户间数据的对比等关键点。这也是为什么爱奇艺能够长期准确地判断出类型不同产品的市场预期,大胆上马《来自星星的你》《太阳的后裔》《老九门》《余罪》等精品剧。

“爱奇艺大的数据运营系统根据以往的数据,判断题材、导演、演员的选择,精准度相当高,提前一年就能预测出未来受欢迎的类型,预测的精度在85%以上,这就是总能选好剧,选对剧的关键原因。”汤兴说。

依靠大数据的支持,爱奇艺正在逐步勾画出自己的平台属性与用户画像,即:用户年龄偏年轻化,人群分布在19-35岁之间。“这样就要求演员选择上更倾向于年轻、青春阳光,而内容上偶像剧是优先考虑的范畴。”汤兴介绍,其实从《奇葩说》开始,其中的很多话题就是基于数据分析判断出来的;而近期备受年轻网友推崇的《十三亿分贝》也是精准的选择了符合平台属性、用户喜好的内容进行提炼,确定了方言唱歌比对话方式更好,而最初的四川方言的選择也是通过数据分析出这是网友最欢迎的。

这些真实的数据不仅在爱奇艺自己的内容制作及采购部门分享,还会提供给合作方,让内容生产者能了解爱奇艺平台上的用户喜欢的内容以及明星类型、场景情节,帮助他们准确选择题材、导演演员的类型风格。

爱奇艺选剧的过程也有一套行之有效的流程,采用人工+智能的方式,任何题材的内容进来以后,先由专业的内容采购人员打分,然后由数据系统结合原来的类似题材做预测,对未来的流量、变现做预估,最终确定是否执行。汤兴认为这种基于平台人群特性的选择是最科学有效的,“今年的几个爆款,《余罪》《灭罪师》《灰姑娘与四骑士》等剧,都没有特别有名的演员,但最终的市场反响很不错。”

“魔高一尺道高一丈”的博弈

在防盗刷系统进步的同时,盗刷技术也在逐渐提高。“最初的刷流量手段是人工操作,现在已经进化到能够大规模分布式的刷流量了。”汤兴认为在这个“魔高一尺道高一丈”的博弈中,要采用更加智能化、自动化的技术来把好第一道关口——判断这个流量是不是“真人”(有效的真实IP)产生的。

近几个月以来,爱奇艺每天的接入设备量平均在2.6亿个,用户上传的使用行为基础数据相当庞大,要判断这些流量的真实性不能依靠一年两年的积累,从建站开始的长期基础数据收集给爱奇艺建立了稳固的技术壁垒。汤兴解释,“最初爱奇艺只是建立了数据的整体收集,比如依据用户看片的类型,给用户推荐影片,提高用户体验的同时也获得了建立用户使用习惯的基础模型,然后挖掘这些数据,建立系统模型。”

而在具体的操作与技术研发上爱奇艺投入了100多人的研发团队,并且非常重视数据的完整度,比如结合百度搜索的数据进行用户行为汇总,通过绿镜技术筛选出观众最喜欢的情节片段,同时也会对重点有刷流量动机的内容进行核对,确认IP长期的使用情况。

从直播崛起的趋势看,视频行业未来自媒体一定会蓬勃发展,每家平台上都会有众多的内容生产者,公平的竞争环境的营造势在必行。“比如网络大电影的流量会直接影响爱奇艺对片子的推荐,也会反映到收入分成上,就会有人去作弊,关键是采取哪些措施去规范行为。”汤兴说,只有把不真实的流量挡在平台大门外,才能构建实时的用户基础模型,而这点至关重要,因为真实流量影响内容购买选择的判断结果。

爱奇艺如今已经形成了全球领先的实时风控系统和实时防刷系统相结合的四级防护体系。汤兴介绍,这个体系包括三个维度,从内容、用户,再结合人工审核系统,能够实现一级实时风控、二级实时反刷量、三级离线清洗、四级业务校验,最大程度的做到流量防刷系统的准确高效。

通俗的讲,一级实时风控能过滤掉90%的盗刷流量,剩下的比较难监测的百分之几的流量,可以通过离线清洗和业务校验相结合,分析一天内监控情况再综合用户行为判别真伪,二次判定是不是真人产生的流量,最后把异常流量在第二天扣除,这样的反盗刷准确度基本在99%以上,各级防护体系间信息有效流动,保障爱奇艺数据的准确真实,反映用户对内容的真实判断。

好处是显而易见的,爱奇艺精确的定位了用户喜欢的题材,打造了更多爆款内容,其刚刚上线的《画江湖之不良人》《坑王驾到》等内容正在引领新的话题热度。

(王艳)

猜你喜欢
爱奇艺流量内容
爱奇艺获融资2.85亿美元
爱奇艺一季度营收80亿元 首发致股东信强调“工作室”策略
爱奇艺会员同比下滑
过去的一年开启了“流量”明星的凛冬时代?
流量大变局
三大运营商联手阿里巴巴酝酿推出“流量钱包”