机器学习驱动下的教育出版新机遇

2017-01-27 06:13张世钦
中国出版 2017年10期
关键词:机器内容用户

□文│张世钦

机器学习(Machine Learning, ML)是一门多领域交叉学科,是集数据挖掘功能为一体的分析工具。它可以指导计算机利用已知数据得出适当的模型,并利用模型对新的情境给出判断的过程。机器学习使挖掘历史数据和预测未来趋势成为可能,目前已成为人工智能研究领域的一个重要方向。作为大数据分析的主要工具,机器学习不仅在教学领域日益受到重视,在新闻传播出版领域也被广泛应用。其实,它的许多应用已经存在于我们生活中,例如人脸与图片辨识、手写输入辨识、自动过滤垃圾邮件、自动侦测信用卡盗刷等。目前,科技巨头如亚马逊、谷歌、百度、微软、苹果及许多初创公司纷纷投资这一领域。《2017德勤技术趋势》特别指出包含机器学习在内的机器智能到2019年全球商业支出将达到313 亿美元。[1]

目前,机器学习已被一些国外出版机构运用,成为数字化转型升级的组成部分。机器学习能够运用于新闻传播出版产业链的哪些环节,将机器学习运用于教育出版领域的关键因素有哪些,国内教育出版机构在运用这一新技术时的实现路径是什么,这些是本文讨论的重点。

一、机器学习在出版业的运用现状

在国外,机器学习已经渗透到出版传播的每个环节,涉及出版物的各个类别,如图书、报纸、期刊、电子出版物和互联网出版物。有的出版机构还利用机器学习技术服务于自身业务流程再造,如《纽约时报》的数据收集、分析、预测系统。[2]谷歌公司也推出了图像识别和机器学习技术开发的APP软件,帮助用户在移动设备上看漫画时得到更好的体验。[3]

1.选题策划

出版机构通过机器学习可以了解读者的行为。2014年《纽约时报》就尝试运用机器学习来了解用户习惯,[4]如受众在看什么类型的新闻、花多长时间以及受众的阅读习惯与广告、内容订阅等有什么关系等,都能形成特定的数据。通过对这些数据收集和分析做出预测,确定报纸要对哪些选题进行报道、报道的方向与受众关注度的如何结合、内容是通过网页展示还是在 APP 上推送效果更好,等等。

机器学习可以帮助出版业务流程实现自动化。美联社一直致力于将自动化引入到新闻业发展中,为此还与专门从事机器学习的技术公司合作,希望提高新闻报道量,扩大报道范围,拓展新业务。如根据不同客户或受众的需求来定制报道内容,使新闻能够适应不同的终端设备。[5]

机器学习可以搜索大量关于用户行为的数据集,以发现其中的行为模式,实时调整相关内容,如可以利用用户行为模式决定哪些版面的文章需要予以特别关注。一些数字出版商如BuzzFeed(嗡嗡喂新闻)和《赫芬顿邮报》在标题和部分内容方面的编辑业务中也采用了类似的方式。[6]

2.内容生成

机器学习提升了用户生成内容(UGC)的价值。在当今网络Web2.0时代,用户生成内容具有海量、动态和去中心化的特点。从这些海量内容里寻找到优质内容,利用传统的方法是行不通的。机器学习模型可以自动确定用户生成内容的优劣,剔除劣质内容,挑出优秀的内容并显示给用户。因此,机器学习在数字内容出版中,内容组合、内容自动生成等发挥了独特的作用。拼趣网利用机器学习向人们展现了更多有趣的内容。美国最大的点评网站尖叫网(Yelp) 用机器学习整理用户上传的照片,并向用户推荐最有用和可信任的评语。美国最大的邻里社交隔壁网(NextDoor) 用机器学习筛查留言板上的内容。

机器学习还可以帮助识别一篇作品的优点和不足,作者或编辑可以借此对作品进行完善,从而加快编辑流程。例如, 机器学习出具的报告能够识别需要改进的地方,如指出语言冗长、结构问题或内容敏感等问题。这些具有针对性的行为或建议提示了稿件修改的重点,从而大大减轻了编辑工作量。

3.产品营销

机器学习还可以帮助出版商了解读者的阅读习惯和真实需求,并能推断出他们可能购买的下本图书的数据以便于出版商做出个性化的产品推荐。知名国际期刊出版集团康泰纳仕集团使用的康泰纳仕尖塔(Condé Nast Spire)数据服务平台,能够判断消费者的具体购买群体,分析读者在看什么和购买什么之间的关联性,然后利用机器学习技术来优化广告内容,提升广告投资的回报率。[7]

4.用户服务

机器学习能够优化用户体验,如推荐书目、帮助发现不易找到的所需内容。在不久的未来,机器学习将能够推送针对具体问题的答案、推送图书部分章节及推送糅合多渠道信息自动生成的回复。[8]今日头条目前已经积累了超过6亿用户,其大规模机器学习系统每天为这些用户推荐个性化的新闻、图集和视频内容。在媒体和内容方向,今日头条尝试用机器学习进行对自然语言的理解、与人对话、问答。[9]

机器学习还擅长情感分析。在过去几年中,通过机器学习监听社交媒体已成为标准的运营程序。如某款流行电子游戏在主线中推出新的主题时,玩家在社交媒体的吐槽被工作室监测之后,游戏公司找出自身产品的问题予以了改进,满足玩家的需求。

5.在线教育

在国际上,自适应学习(Adaptive Learning)是一种已经证实的领先的学习和测评系统。自适应学习平台基于机器学习技术,通过分析和记录学习者的数据、习得规律和算法,提供智能的个性化推荐和指导,被具体应用在针对个体的自适应调整和教学材料组织等个性化学习服务,以及大用户群体聚类分析指导课程设计等方面。目前国际教育出版商培生集团、麦格希教育集团、麦克米伦教育集团均建立了自己的自适应学习平台,把技术和服务驱动的内容和测评业务作为自己的核心竞争力。

二、机器学习运用于教育出版领域的关键因素

机器学习实现了数据挖掘、分析和预测、搜索排序、关联推荐和自动化,从而支持了出版物出版的选题策划、内容生成、产品营销和用户服务等多个环节,扩大了出版边界。随着技术的逐步成熟,机器学习已被看成出版业的下一个引爆点。在教育出版领域,机器学习有利于因材施教或个性化教育的实施。从机器学习中不断学习新的知识和技能会对很多行业产生十分直接的影响,教育是最有机会从中受益的。[10]但是目前在国内教育出版机构,机器学习尚未得到广泛地运用。让这一技术服务于教育出版领域,需要考虑以下几个关键因素。

1.技术因素

研发机器学习技术的多是如谷歌这样的技术公司,技术开发并非出版机构的专长,因此国外教育出版机构采取了与技术公司合作或者收购技术公司的方式来实现技术方面的突破。培生教育集团、麦克米伦教育集团均采取了与自适应技术的领先者纽顿(Knewton)合作的方式,开发出了适合自己公司产品链的平台产品。麦格希教育集团通过收购技术公司亚历克斯(ALEKS)拥有自适应学习平台,学习管理平台渴望学习(Desire2Learn) 收购了自适应学习平台知识村(Knowillage Systems),[11]收购行为既减少了研发费用和时间成本,又解决了缺乏技术人员的问题。因此,与技术公司合作或者收购技术公司或者技术外包是当前解决技术短板的快速路径。

2.资金保证

无论是与技术公司合作、收购技术公司或者外包都涉及资金的投入。目前的出版企业尤其是很多出版上市公司,以延伸产业链、布局新业态为拓展方向的实体收购已成为趋势。尽管机器学习的发展在国内尚处于起步阶段,但是它发展迅猛,潜力无穷。国外许多出版公司已经看到了机器学习正向的投资回报率,愿意在这方面投资。美国顶级风投重点关注的16个投资领域,机器学习和大数据排在第三位。[12]国内教育出版机构应该把握机会,考虑往这个方向投资。如果选择收购或与技术企业合作投资研发,将会拥有更多的话语权,在未来发展中占据主动。这关系到商业模式的走向,出版机构应该对投资该领域综合考虑。

3.认识问题

自适应学习技术从2015年以来,越来越受到在线教育公司的关注和重视。一些教育出版机构也开始参与搭建自己的平台。但机器学习的其他应用并没有大规模展开。究其原因,教育出版机构认识上存在误区,不熟悉这一技术,不知道将其如何与传统业务融合是主要原因。对此,出版机构要突破思维局限,要有前瞻性眼光和开放性的态度,建立新型教育出版的概念,关注并加速了解机器学习的应用领域和方式,找出与自身现有业务结合的角度与方向,积极探索内容资源与技术平台、运营模式如何有效结合,根据自身产品特点与有实力的技术公司或团队合作。

三、教育出版企业运用机器学习的实施路径

考虑到出版的共性,机器学习在新闻出版等领域各个环节发挥的作用可以平移运用到教育出版领域,开发出一些改变教育生态的、属于教育出版特有的产品和服务。

1.自适应学习平台

结合国外的运用情况和国内实际,开发以测促学的工具平台类产品,通过“实施测试-发现问题-提出建议-专项练习”的模式,帮助学生有效提高水平。具体来讲,当学习者回答测评题时,根据试者答题结果,下一个题目会动态调整,只提供适合使用者程度的题目,以便有效率地测出学习者的能力定位。测试完毕后,系统提供即时反馈,指出问题所在,然后根据学习者的知识水平与对各知识点的精熟度不同而调整学习路径,推荐相应图书,然后针对学习者的弱项进行专项练习并提供阶段性支持与评测。在实践层面上,应采用研究者引领、教学者参与和出版者主导相结合的模式,孵化出好的产品和服务。另外,科学的教育模式一定是线上线下的深度融合。线上提供可循环利用、结构化的高质量内容和服务,线下提供基于线上内容和服务的个性化管理及延伸服务和产品,打造完整的学习闭环。目前山东教育出版社正在策划开发的自适应教学与评测服务平台“智能化分层练习评测系统”就是一个很好的案例,未来它将帮助教师实现精准化教学。

2.图书定制出版

近年来高校教材多元化、中小学校本教材多样化已成趋势。虽然高校教材不限价,但高额的开发成本使得出版社开发的品种数量非常有限,而对于基础教育学段的校本教材,由于价格低、销量少,基本上出版社不会参与。运用机器学习技术,出版社可以快速搜索、发现、累积大批优质资源和作者,通过清理版权、改写、试读、反馈等工作,为学生定制专门的教材内容,最大限度地满足他们的个性化需求。机器学习的另外一个特点是分类,出版机构可以运用这一技术对引进版的英语读物进行分级:通过设定一定的参数,机器学习平台可以通过扫描PDF版本,对读物的难度做出判断并匹配到相应的年级。对于特定地区的需求,可以通过这种方式来实现定制出版。出版形式为电子图书,如需纸质版可额外支付费用通过按需印刷获得。

3.智慧课堂

近年来,智慧课堂已成为教育信息化的着力点。所谓智慧课堂是以硬件平台为支撑,搭载互动课堂教学应用软件,完成课堂互动交流、在线考试评测、教学效果评估等内容,为广大师生提供一套完整的“教、学、练、评”和具有大数据元素的互动教学平台。以机器学习为内驱的智慧课堂,可以预测学生的兴趣和目标,并将学生的兴趣和学习能力相结合,使学生能够更好地认识自我,早日取得成功。智慧课堂得到了各地政府的关注和支持。例如宁波为打造智慧教育、智慧课堂共投入了8亿元。目前,全市已建起400多个数字化校园,智慧课堂早已经成为宁波学生的寻常课堂。[13]目前智慧课堂在内容和应用方面尚需要教育出版机构深度参与。教育出版机构可以通过内容授权或服务收费的商业模式进行参与。

4.用户服务

在现阶段,纯内容已很难盈利,只有内容+服务、而且是响应用户需求的新服务,是把创意、技术和商业模式融为一体的服务,才是创作盈利的手段与方式。机器学习可以根据用户的阅读习惯和水平定时自动推送合适的内容甚至定制内容。用户可以通过前期打赏的方式进行体验,后期订阅的方式来获取持续的服务。机器学习可以实时回答用户的疑问,并通过分析用户的实时反馈,更新内容,改进产品,实现产品的迭代更新。在目前教材选用竞争日趋白热化的情况下,这对于稳定教材市场有着特殊的意义。同时,在提供内容的基础上,出版机构能进一步挖掘的增值点包括反馈、监督、学习框架建立、提升知识消化效率等,都可以促进用户付费。

此外,基于机器学习的自动评分系统如国内的批改网、培生集团的以写促学平台(WriteToLearn)不仅能批改作文,还能判断是否涉嫌抄袭已经初具规模。类似的服务不仅满足了教师的需求,而且通过向学校收取费用并通过线上服务带动线下产品销售,而具有了一定的商业模式。教育出版机构在推出匹配自身教材的类似服务产品方面更具优势,能更好地与教材产品链对接,实现效益最大化。

另外,机器学习强大的搜索功能可以为教师直接所用:依据教学实际快速地为学生搜寻高质量的学习材料,并掌握学生对这些材料的使用情况。麦克米伦集团为了提升自己的服务,收购了基于机器学习的教育服务平台提供商因泰勒斯学习(Intellus Learning),旨在通过该平台搜索、整合数字内容的能力使教师的教学目标更易实现并为学生提供经济实惠的个性化学习体验,从而增加了用户黏性。[14]这一模式还能为出版商提供相关数据,为教材新版本的出版提供参考。

四、结语

机器学习在教育出版领域的运用使得教育出版朝着内容化、智能化、个性化方向发展,已孵化出了诸多新形态的产品和服务;相信在不久的将来,还能看到更多突破性的进展和成果,它将不断刷新我们对教育的认识,重新定义出版的概念。传统教育出版行业应该把握契机,实现机器学习与传统业务的深度结合,参与教育内容生态搭建,实施智慧出版,最终实现从教育内容提供商到教育服务商的转变。

猜你喜欢
机器内容用户
机器狗
内容回顾温故知新
机器狗
未来机器城
关注用户
主要内容
关注用户
关注用户
如何获取一亿海外用户