科技赋能出版新业态:生成式出版的内涵特征、实践进路与发展反思

2024-03-10 22:00周文婷刘莹
出版广角 2024年3期
关键词:出版社内容

周文婷?刘莹

【摘要】结合学业界已有研究和实践,对生成式出版的开放性内容生产、低成本高效率、一站式出版流程、个性化用户服务等内涵特征进行深入分析,并从生产可供性、行动者网络对生成式出版的实践进路进行客观总结,同时从技术层面和行业层面作出必要反思,以期为新时期出版业布局新赛道、新领域,以科技赋能出版新兴业态,加速转型升级和实现高质量发展提供有益启示。

【关  键  词】AIGC;生成式人工智能;生成式出版;科技赋能;新兴业态

【作者单位】周文婷,东北大学出版社;刘莹,东北大学出版社。

【基金项目】上海出版传媒研究院招标课题“生成式AI时代图书编辑继续教育模式的创新性探究”(SAYB2306)阶段性研究成果;教育部人文社会科学基金青年项目“中小型高校出版社策划编辑入门培养机制研究”(19YJC860056)阶段性研究成果。

【中图分类号】G230.7【文献标识码】A【DOI】10.16491/j.cnki.cn45-1216/g2.2024.03.010

2023年被称为AIGC“元年”。这一年,以出版业为代表的内容行业积极进军生成式人工智能技术领域,不断加大AI研发及应用力度,以期将高新技术嵌入行业生产全流程,开启生成式出版新征程。2023年12月,中国音像与数字出版协会发布《出版业生成式人工智能技术应用指南》团体标准并宣布自2024年1月20日起正式实施,为AIGC时代的行业转型和产业升级指明了方向。未来,在新一代人工智能技术的强势赋能下,生成式出版必将成为行业发展新兴业态。在此背景下,积极了解和把握生成式出版的内涵特征,不断摸索和进一步完善其实践进路,并作出科学、及时、有效的技术反思,是出版业高质量发展和转型升级的关键。

一、生成式出版的内涵特征

生成式出版作为AIGC时代的新兴业态,是科技赋能出版的有力体现,也是数字出版向智能出版甚至智慧出版过渡的必然阶段,其本质是利用新一代生成式人工智能技术驱动出版业的内容、流程和服务创新,从电子出版、互联网出版、数据出版等发展阶段迈入更高级的智能出版发展阶段。在这一过程中,基于新一代人工智能技术优势,我们可分析和总结生成式出版的四大发展特征。

1.开放性内容生产

从内容生产角度来看,开放性是生成式出版的核心特征,主要表现在两个方面。一是内容规模和生产方式层面。生成式出版借助AIGC强大的技术优势和爬取能力,能够开放获取海量数据资源(包括无标注文本数据和人工标注数据),经由专业大模型的反复训练后,可根据用户指令生成或创造新的出版内容。二是内容模态和呈现形态层面。生成式出版利用AIGC同时支持生成文字、图片、音频、视频等多模态内容的机制,可为不同用户群体定制多元出版产品,并实现不同模态内容的同时输出和相互关联,真正实现“一种内容,多次开发”的理想目标。未来,随着AIGC开放获取和生成能力的进一步增强,生成式出版的内容生产必将涵盖文字、音视频等多个领域,甚至“可以面向增强现实出版物提供3D模型、面向虚拟现实出版物提供数字化虚拟环境”,实现跨越式发展。

2.低成本高效率

低成本高效率是生成式出版的另一大重要特征。得益于AIGC强大的技术优势,在内容生产过程中,生成式出版的实际成本和产出效率得到显著优化,切实达到降本增效的目的。

从生产成本层面来看,生成式出版的成本大大降低,以有声出版最具代表性。有声书以往主要采用真人录制方式,录制环节冗长,对轨和审听过多依赖人工,导致出版成本高昂。利用AIGC赋能,生成式有声出版的投入成本将大幅降低,如在Reflect Audio打造的有声读物制作平台,AI有声书的生产速度超过500万字/天,录制成本可降低90%以上。在传统图书出版领域,生成式出版依托AIGC技术赋能可实现AI选题、AI生成、AI编辑、AI校对等目标,这同样可以降低出版机构的人力、时间等成本支出。

从生产效率层面来看,生成式出版利用AIGC技术可大幅缩短整个生产周期,进一步提高出版效率。《韩国经济日报》报道,韩国出版商Snowfox Books在新书《找到人生目标的45种方法》(45 Ways to Find the Purpose of Life)內容创作与生产过程中利用ChatGPT撰文、Papago翻译(韩国科技巨头Naver研发的翻译软件)以及AI韩语检查工具(釜山大学AI实验室和韩国新创Nara Info Tech共同开发)校对,用时不到10小时。未来,随着AIGC技术不断迭代升级,生成式出版的内容生产周期和质量稳定性还将进一步优化。

3.一站式出版流程

从运行流程来看,一站式是生成式出版的重要特征。所谓一站式出版流程,主要是指在AIGC赋能作用下,生成式出版可实现从前期内容选题、创作、编辑、校对,到后期产品推广、运营等的自主运作。2023年6月,电子工业出版社与京东图书联合举办“大模型时代——AIGC内容创作产业论坛暨《大模型时代》与《人人都能玩赚AI绘画》新书发布会”,其中《大模型时代:ChatGPT拉开硅基文明序幕》一书便是由司马华鹏和团队先勾勒内容框架和文稿脉络,再通过ChatGPT完成撰稿工作的。此外,该书的推广和销售也有AI参与,真正实现“一本AI写的书,且由AI去销售”的目标。

不仅如此,在有声出版领域,利用“AIGC+TTS”技术组合,还能将传统文本无缝转换为音频资源,从而实现从传统纸质书到AI有声书的一站式输出。由此可见,依托AIGC技术优势,生成式出版在某种程度上已经具备了流程再造和自主运行能力,其较传统出版业态不仅能达到降本增效的目的,还能在大幅释放出版生产力和内容价值的同时,将从业人员从烦琐、机械的工作流程中解放出来,去从事更具挑战性和创造意义的工作,以此开启行业的“第二增长曲线”。

4.个性化用户服务

从用户服务来看,个性化是生成式出版的又一重要特征。以往的出版业态多是出版机构单向进行内容输出或知识传播,虽有不同的用户群体定位,但仍较难实现“千人千面”的个性化服务目标。在AIGC赋能作用下,生成式出版凭借多模态内容输出和及时交互优势,打造的产品不再是单纯的图书、数字阅读物,而是多元内容平台,可供读者用户自行检索并精准生成其所需的内容,从而实现“千人千面”的个性化服务目标。2023年10月,喜马拉雅珠峰实验室与西北工业大学aslp lab合作研发的珠峰语音生成式技术正式亮相2023云栖大会,并成功应用于喜马拉雅APP的“爸妈讲故事”功能板块。该技术具备快速实现语音音色和风格定制功能,同时支持丰富场景下的实时转换,用户仅需简单录制5段文本交由系统进行AI模型训练并定制声音,便可在海量中外名著、侦探故事、诗词国学、童话寓言等有声出版资源的阅读过程中充分享受亲子共读的个性化服务体验。随着AIGC技术进一步强化和完善,生成式出版在按需定制、个性化服务等方面发展前景非常可观,将给读者带来前所未有的体验。

二、生成式出版的实践进路

生成式出版虽未大规模落地应用,但已成为国内外众多机构、平台新的竞争赛道和布局重点。根据国内外部分出版机构、内容平台、网络企业等已有实践来看,生成式出版正迈向垂直细分领域,是新时代内容行业转型升级和高质量发展的新驱动。因此,本文总结已有成功经验,为更多出版机构进入新技术领域和新发展阶段提供路径选择和实践参考,以实现“科技赋能出版”的目标。

1.基于生产可供性的生成式出版实践进路

生产可供性包括专业出版商信息生产的主体性和大众读者群体信息生产的能动性两方面。截至2023年底,AIGC赋能的生成式出版已经成为行业布局重点,尽管这一新兴业态具有开放性内容生产、低成本高效率、一站式出版流程以及个性化用户服务等优势,但也有观点表明,技术可能造成“恐怖谷效应”“数字极简主义心理”等问题。因此,从生产可供性角度推动生成式出版落地发展,成为不少出版机构、内容平台、传媒企业的首要选择。

从专业出版商信息生产维度来看,生成式出版具有传统出版难以匹敌的生产能力和规模效应,能最大限度地实现降本增效的目的。但是,规模化生产也容易导致读者群体对生成式出版产品的质疑,如质量能否得到保证、隐私安全问题如何解决等。为打破用户市场的刻板印象,一些专业出版商付出巨大努力,基于专业大模型建设、内容资源专业性与权威性保障、个性化服务成效等考量,启动生成式出版业务布局。例如,在2023年9月举办的第十三届中国数字出版博览会上,中国新闻出版研究院、北京版上阅动科技公司联合推出“版阅AI内容服务平台”,该平台以大语言模型在新闻出版行业垂直领域的深度应用为目标,以智谱AI自主研发的GLM-130B大模型为支撑,以中国新闻出版研究院权威的基础研究数据为保障,为行业提供智能、安全、可靠的审校服务、对话式AI应用以及综合解决方案,这可视作生成式出版落地应用的基础性尝试。

从读者群体信息生产维度来看,生成式出版具有个性化服务优势和即时交互特性,能给读者带来前所未有的阅读服务体验。因此,以“受众即市场”为核心追求,将读者群体的主观能动性纳入生成式出版的内容生产维度,也是行业布局与实践的重点,这在一些内容平台上表现得尤为明显。例如,喜马拉雅APP“爸妈讲故事”功能板块创造性地运用珠峰语音生成式技术,利用听众读者提供的语音数据样本,为他们量身定制個性化阅读方案。为进一步增强生成式出版的内容互动性和用户体验感,有声阅读平台“云听”利用AIGC技术赋能,在声音出版领域开创诸多新玩法,如联合农业农村节目中心成功打造集线上声音采集、用户互动、数据可视于一体的科文融合产品——“乡音博物馆”,推出粤、湘、吴等7大语言馆,为AIGC时代的有声出版发展提供诸多经验启示。不可忽视的是,无论是AIGC技术的发展程度,还是生成式出版的实践应用,仍处于初步探索阶段,包括专业出版社、内容平台等在内的行业机构获得的实践经验较有限,面向读者群体所提供的内容服务和阅读体验还不足以完全释放其主观能动性,未来仍需不断优化和调整。

2.基于行动者网络的生成式出版实践进路

生成式出版从理论到实践需要资源、技术等要素配合,仅靠行业内部驱动难以达到理想目的,唯有集聚多元行动主体的有效力量,才能实现预期目标。

首先,行业内部合作实践,包括出版社与出版社、出版社与内容平台之间的协同发展,联合布局生成式出版业务领域。例如,入选2023年度出版融合发展工程名单的“好好唠科——少儿科普知识服务平台”项目便由数传集团与吉林科学技术出版社携手打造。该平台主要以数智技术为依托,依托专业出版机构海量的内容资源优势,为新时代的青少年群体提供多元科普百科知识。以猿辅导为代表的在线教育公司自成立图书业务线后,与新华出版社、华东理工大学出版社等多家教育出版机构达成了战略合作协议,目前已推出新一代智能教辅产品《我们的语文》等。华东理工大学出版社副社长王雪表示,未来出版社将在内容研究和市场拓展方面继续发挥自身优势,同时结合猿辅导在内容研发和技术赋能教育方面的强大能力,加快教育出版数字化乃至智能化的发展速度[1]。

在生成式出版业务布局的当下,传统出版社与新兴内容企业携手合作的案例不断增多,这在教育出版领域尤为明显:日新月异的技术发展和线上教育的旺盛需求,使得智慧教育出版不断提速,传统出版社尤其是中小型出版社由于自身技术短板和成本限制,必然要积极寻求外力援助,而内容企业尤其是在线教育企业本就具有技术优势,加上与出版社合作历史悠久,自然成为生成式出版业务落地的主要实践进路。

其次,行业外部合作实践,具体是指出版机构、高校以及技术企业之间就生成式出版业务建立跨界合作和协同发展关系。2023年2月,人民交通出版社宣布将接入百度“文心一言”,成为其首批生态合作伙伴,旨在通过与头部科技公司开展战略合作,将AIGC及智能对话技术成果创造性应用于专业出版领域,为生成式出版的实践落地和快速发展提供助力。目前,百度“文心一言”已经与人民交通出版社、上海辞书出版社、四川人民出版社、中文在线等出版和文化机构形成合作关系,是生成式出版从理论走向实践的重要助力。

为进一步强化技术适配性,加快生成式出版的实践应用速度,一些出版机构与技术公司、高校达成合作关系,旨在以“资源+技术+人才”的多主体协同模式助力生成式出版落地发展。2023年8月,高等教育出版社发布与浙江大学、阿里云和华院计算等单位共同研制,面向教育出版领域的垂直大模型“智海·三乐”,该模型以阿里云通义千问70亿参数通用模型为基座,利用出版社与高校的核心教材、学术资源等高质量语料和专业指令数据集,建成专注于“人工智能+教育出版”领域的专业系统,从而为教育出版领域的现实需求提供优质而高效的技术解决方案。此外,中华书局古联公司与南京农业大学信息管理学院于2023年内联合研发“荀子”古籍大语言模型;中信集团自2023年5月成立平行出版实验室后,开始尝试与作者和大模型技术公司合作进行语言训练,开发智能阅读应用产品;中国知网于2023年9月发布出版传媒行业大模型和文化遗产大模型,同时推出AIGC检测服务系统,为出版传媒行业提供AI选题策划、AI增强检索等各类应用工具。上述行业实践表明,随着多主体行动网络的形成,生成式出版不仅进入实践应用阶段,还向古籍出版、数据服务等行业细分领域渗透。可见,跨界合作不仅是生成式出版落地实践的重要进路,也是出版业深度融合的有效手段。

三、生成式出版的发展反思

在生成式出版落地实践的发展背景下,我们既要看到高新技术赋能出版转型升级的利好机遇,也要警惕这些技术可能造成的现实危机。作为一种新兴出版业态,生成式出版极可能助力行业迈入转型升级的新阶段,但同时也可能引发诸多新问题,带来诸多新挑战,为此我们必须作出反思。

1.技术层面——警惕技术滥用

AIGC虽能强势赋能生成式出版落地应用,但也极易导致技术滥用现象。其一,过度依赖技术赋能和算法赋值,导致生成式出版内容的真实性、权威性较难得到保障。自2023年初以来,《纽约时报》等多家外媒多次报道,AI生成的书籍正大量充斥于亚马逊等电商平台,这些书籍涉及范围较广,且部分内容存在“某些错误信息”。其二,技术滥用极易导致敏感信息泄露,由此引发隐私安全问题。当生成式出版投入使用并与读者用户交互,出于获取精准用户画像的目的,其往往会收集、存储并分析用户数据,这可能危及用户隐私安全,甚至成为生成式出版大规模普及应用的威胁。

对此,一方面,国家及行业相关部门应制定技术应用标准和法律规范,在鼓励行业技术创新应用的同时,合理预防和及时治理生成式出版领域的技术滥用现象。例如,相关立法部门可在《中华人民共和国民法典》《中华人民共和国个人信息保护法》的现行条款里合理纳入《生成式人工智能服务管理暂行办法》等内容,就AIGC技术应用场景、范围、服务内容等作出细化规定,为行业提供实践准则,避免技术滥用导致虚假出版等问题。出版机构、内容平台、传媒企业等部门需要在《出版业生成式人工智能技术应用指南》的基础上进一步完善行业技术应用细则,确保生成式出版商及相关服务商在资源爬取与训练、内容生成与公开、信息存储与分析等实践过程中不滥用算法技术并做到全程可控。

另一方面,相关技术商和出版方应遵循“技术规制技术”的发展原则,研发更高级、更敏感的技术解决方案,为生成式出版的实践应用和长效发展保驾护航。正如人民教育出版社编辑杨凡所言,通过模型优化训练的方式防止再次生成虚假不实的内容虽然通过一般技术难以实现,但利用价值对齐的算法、采取内容过滤等措施或可实现[2]。未来在生成式出版发展过程中,出版机构和技术商应针对技术滥用可能导致的出版内容不实和隐私安全问题联合开发更先进、高效的智能应用工具,制定更科学的解决方案。

2.行业层面——规避侵权危机

生成式出版可能造成的内容侵权问题亟须重视和解决。生成式人工智能技术强大的数据爬取能力和内容生成能力,加之TOC模式带来的巨大传播效应,极易造成内容侵权危机。2023年7月,8500多名海外文学作家联合发表《致生成式人工智能领导者的公开信》,并呼吁OpenAI、Meta、Microsoft等技术研发商的首席执行官在AI内容生成领域就版权保护问题征得所有权人同意并给予补偿。生成式出版主要通过大量已出版作品训练和生成“新内容”,极易出现版权侵权问题,而当存在侵权问题的生成式出版物大量流入市场,不仅会侵害原作者和著作权人的合法权益,也会侵害读者用户的知情权,同时还可能因为同质化内容竞争导致“劣币驱逐良币”的现象频繁发生。据《纽约时报》和彭博社的一项媒体采访结果,不少新闻出版机构的高管表示,以生成式人工智能技术为代表的AIGC机制会颠覆行业已有运行模式,读者受众的注意力将被不断稀释和转移,而这也容易导致出版机构的市场体量和用户规模大幅减少,甚至引发生存危机。

针对上述问题,可从以下几个方面着手解决。

一是建立行业联盟并制定监管原则。目前,以《纽约时报》为代表的全球2000多家媒体、出版机构已经组成发展联盟并发布相关草案,加大版权保护力度。据已披露的草案内容,该联盟强烈呼吁科技公司为高质量、值得信赖的专业内容付费。2023年6月,中国工人出版社、同方知网、中文在线等26家业界单位共同发布国内首个有关AIGC训练数据版权的倡议书,旨在通过行业联盟唤醒国内AI企业关于大模型训练数据的版权意识,并为AIGC研发者规避版权争议提供方向性指引。不仅如此,行业联盟还有利于携手共建专注于出版业的资源库和大模型,在强化版权保护力度的同时,以互利共赢为基础进一步释放版权价值效益,利用高质量出版资源的共建共享,有效避免生成式出版可能出现的内容不实、非法传播等问题。值得一提的是,在生成式出版模型建立过程中,无论出版机构、内容平台,还是技术商、服务商,都应明确标注内容来源,以此保护版权方和读者用户权益。

二是深化与第三方技术供应商的合作力度,通过引入智能审核工具和智慧解决方案,及时发现、认定和处理内容侵权问题,保障版权所有者的合法权益。例如,清华大学人工智能研究院发起成立的瑞莱智慧(RealAI)便是全球为数不多、专为生成式内容检测以及给大模型安全系统“挑刺”的人工智能产品。出版机构、内容平台等在尝试建立生成式出版業务线的同时,可与此类企业合作,针对行业现实需要联合开发先进、高效的AI出版技术应用工具,为预防和解决生成内容侵权问题提供有效支撑,确保行业及市场的长效发展和良好运行。

|参考文献|

[1]缪晨霞,贾宁. 继续探索图书领域,猿辅导与多家出版社签订战略协议[N]. 新京报,2023-09-03.

[2]杨凡. AI时代的教育出版研究:以生成式AI为技术驱动力[J]. 出版广角,2023(16):27-31.

猜你喜欢
出版社内容
内容回顾温故知新
内容回顾 温故知新
内容回顾温故知新
我等待……
今日華人出版社有限公司
On the Problematic Sounds of English Interfered by Shaanxi Dialect from My Students and the Analysis of Reasons
你想踩着哪一款轮子飞驰?
主要内容
石油工业出版社
贵州教育出版社