出版的当下与未来

2023-04-18 22:56毛文涛

出版与印刷 2023年6期

毛文涛

跳出图书出版的传统视角，从“知识和思想的大规模传播”考察出版的话，可以说：数字化是出版的当下，智能化是出版的未来。

20 世纪末互联网开始在全球普及，作为信息传递新工具和新通道的互联网，自然而然快速介入内容和知识的传播，电子书、网络小说、维基百科等内容知识产品和服务创新应运而生，可以说，出版是被互联网改造得最早的、被数字化改造得最早的行业之一，出版界也早就有“狼来了”的忧虑。然而，从此后20 多年的发展看，尽管出版行业始终高度关注互联网发展和数字化进程，但是从《中国数字出版产业年度报告》等统计结果看，出版单位的数字化转型发展并不乐观，尤其是基于传统出版业务的数字化转型依然缓慢。客观地讲，出版的数字化转型仍在当下，正在进行，远未完成。

自2022 年11 月30 日OpenAI 的聊天机器人软件ChatGPT（Chat Generative Pretrained Transformer）发布以来，其语言理解和文本生成能力已经达到了相当高的水平，特别是GPT-4 的推出，又在推理和多模态等方面再进一步，甚至有人认为GPT-4 通过了图灵测试。基于这一重大突破，将生成式人工智能（artificial intelligence generated content，英文缩写AIGC）用于内容创作和出版，自然引起人们的关注。出版的智能化已在路上。与数字化进程类似，AIGC 主要涉及内容创作，出版自然就成为最早摇响警铃、也可能是最早受到影响的行业之一。目前，越来越多的研究表明，大语言模型（large language model，英文缩写LLM）的幻觉问题和缺乏常识，是一个难以解决的问题，甚至可以将LLM 的幻觉和其生成能力的创造性之间的关系类比于量子力学中位置和动量之间的测不准关系。“LLM 温度”是用于控制人工智能生成文本的创造力水平的参数，提高LLM 温度，则LLM的创造性越强，但其产生幻觉的可能性就越大；相反，降低LLM 温度，即减低LLM 的创造性，其产生幻觉的可能性也就越低，其生成内容的可靠性就越高。如果这个问题不能很好解决，那么基于预测下一个词的概率机制的LLM，也许又会大大延缓出版智能化的进程。

这就是出版。

无论如何，出版已经被数字化深刻改变，也即将被智能化深刻改变。

一、数智时代的出版是大平台出版

纵观过去20 多年的数字经济发展浪潮，“以互联网平台为主要载体，以数据为关键生产要素的”平台经济，占据重要位置，呈现蓬勃生机。平台经济借助互联网发展如此迅猛，有其自身特殊的规律。以与内容相关的互联网平台为例，从互联网发展早期的综合新闻平台（如新浪网等），到搜索引擎（如百度等），再到受到推荐算法加持的新闻聚合平台（如今日头条等），以及网络文学领域的起点中文网、七猫中文网等，无不以大规模内容聚合为基本特征，提供海量内容供给，形成用户的高度聚集，实现流量的非线性经济价值。

正是因为看到了互联网平台模式的价值，出版行业也效仿其他行业，各出版单位纷纷着手构建平台型应用，打造各类数字出版平台，可以说是不胜枚举。但是，真正在市场上立得住脚，实现了内容的海量供给、用户的高度聚集、流量的非线性变现的平台，则屈指可数。究其原因，可能与未能充分把握蕴含其中的互联网发展规律有关。实践表明，数字出版平台作为传统出版单位转型的载体，应该具备三种能力。一是一体化融媒体编辑能力，这既是实现传统内容生产方式向数字化内容生产方式转变、适应网络化传播所必须具备的工具，也是推动组织转型的一个助推器。二是门户级的用户响应能力，也就是实现大规模的用户链接，形成广泛应用的能力。三是技术驱动、数据驱动的知识服务能力，这是整个平台依靠传统出版长期积累的优质资源发展起步之后，能否自我造血、迭代前进的动力机制。三种能力缺一不可，彼此有机互动，逐步推动平台成为一个出版的生态闭环。

对于数字出版平台应该具备这样的定位和能力，出版人应该不难理解。因为，对于平台运作的商业模式，出版人是熟悉的。传统出版单位在某种意义上就是一家平台型公司。之所以这么说，是因为从一般的产业分析来看，除了部分工具书和教材之外，出版单位一般不像制造业的企业那样自己研发产品，而更多的是对产品进行筛选、甄别、加工、设计、营销。传统出版的这种运作模式，与平台商业模式类似，其与互联网平台的差别仅仅在于：内容产品的筛选依赖于编辑出版人的眼光而不是用户的点击点播，内容质量的提升依赖于专业编辑人员的付出而不是以众筹方式迭代改进，运营销售依赖于多层次渠道而不是在线直接链接终端用户。尽管有这些不同，但是其背后的基本商业模式是一致的，所以可以说出版单位就是平台型的。

正因为出版单位本身的这种平台性质，在谋求数字化转型发展的当下，更需要依托数字技术、尊重数字出版规律去拓展平台属性。在图书出版过程中，出版单位通常比较重视中长期出版规划，较多地从产品线和品牌塑造方面开展选题规划工作，而从编辑个体来说，往往重视单个选题的质量和可及性。这是自然而然的事情。但是，在数智时代，特别是在依托数字出版平台推进转型的过程中，互联网平台经济发展规律要求，出版单位要在继续保持内容质量高的前提下，尽量提供海量内容供给，满足读者一站式服务的需要。客观的限制条件是，出版社规模普遍较小，没有能力在较为宽泛的领域提供这样的内容知识服务，所以一个理性的选择就是聚焦特定的、有比较优势的垂直领域，在这个垂直领域达成海量内容供给，满足读者一站式需要。

因此，面向细分市场，构建一个垂直领域的完整知识体系就非常必要，而且要求随着市场、技术的演进，在垂直领域向纵深方向深耕细作，不断强化，形成壁垒，构筑护城河。从这个发展方向出发，则要求出版社在选题规划和开发环节，不仅要重视选题质量，更要重视选题对于构建知识体系方面的紧迫性和必要性。从出版社管理的角度来说，要优先选择有利于补短板、补缺项的选题，强调编辑团队作战意识。简言之，就是要既见树木，更见森林。

上海世纪出版集团最近几年建设的聚典、汇典等垂直领域的数字出版平台，就是沿着这个思路，坚持长期主义，持之以恒围绕打造垂直领域的知识体系持续推进的。从这些平台的选择和发展过程分析，不难发现，出版单位要培育和发展出垂直领域的数字出版平台，需要谨慎选择具有比较优势的出版方向，在这个方向上出版社有长期高质量的图书版权积累，初步形成了相对完整的知识体系，版权权利是基本可控的。也可以说，高质量版权积累、相对完整的知识体系、版权可控是发展垂直领域数字出版平台的三个要素。

二、数智时代的出版是大数据出版

大数据出版，是建立在大数据基础之上的出版活动。一个典型例子就是智能商品推荐，即通过智能商品推荐算法实现图书的自动化智能推荐，进行精准营销。其实，大数据出版可以在更广泛的范围发挥作用。关于大数据出版多有讨论和设想，但是鉴于出版单位在传统出版业务中缺乏第一手的用户大数据和阅读大数据，许多讨论和设想长期以来只能停留在美好的愿望阶段，落不了地。

随着传统出版数字化转型不断深入，不论是借助电商平台的店中店模式，还是借助社交平台的公域流量私域化运营，抑或是依靠自有的集成性数字出版平台，越来越多的出版单位逐步找到了实现大规模用户链接的途径，可以快速获得目标读者的用户数据和阅读行为数据，使得大数据出版成为可能。

借助电商平台的店中店模式以及借助社交平台的公域流量私域化运营模式，都有开发成本低、建设速度快的优势，但也存在自主性不强、多平台跨平台融合不足等问题。不少出版单位在数字化转型发展过程中，有了前期工作的基础，实力逐步增强，经验逐渐丰富，纷纷转向建设自有的集成性数字出版平台，来集成更多的内容资源和功能，以实现持续发展。毫无疑问，没有大平台就没有真正意义上的大数据。

集成性数字出版平台一旦建立，可以实现出版单位与读者的大规模直接链接，在这个平台上将集成出版单位长期积累的海量内容数据，同时又可取得大规模读者数据和阅读行为数据。多种海量数据的交互，经过科学的分析挖掘，可以产生大量有价值的信息和见解，成为一座数据金矿。

大数据支撑的出版，选题开发可以不盲目，而是依托大数据提供的需求信息；大数据支撑的出版，内容产品营销可以精准高效，实现供求精准匹配、高效匹配；大数据支撑的出版，产品迭代甚至平台的迭代都可以源自大数据，形成自我强化的演进轨迹；大数据支撑的出版，还能创生有别于传统出版物的创新产品和创新服务。

聚典数据开放平台（简称“聚典”）就是一个典型的例子。作为一款用于知识查验服务的工具书数据开放平台，聚典通过汇聚海量优质纸质工具书内容，结构化云端存储，开放API 接口供应用开发商实时调用，用户发出查询请求时动态载入数据并推送到用户终端。由于聚典开放的功能设计，大量产业链上下游客户纷纷接入聚典的服务，使得聚典在几年的时间里迅速成长为总用户数超过5000 万人、月活用户数超过600 万人的一个创新互联网应用，并通过其独特的BBC 模式（即在商业上是B2B，在数据流上是B2C），实现了用户的实时广泛链接，成为国内数据量最大、服务最广泛的工具书数据开放平台。

基于平台的广泛链接和大规模响应，聚典在为读者提供知识查检服务的同时，读者的知识查检行为也都汇聚到聚典上来，在聚典平台，可以分析了解读者阅读的特点和规律。对于这些阅读数据，可以在众多方面开发利用。比如，依托9 亿次的查询访问，在2023 年世界读书日前夕，聚典发布了面向全域的知识搜索榜，基于知识搜索数据还可以分析各区域全民阅读情况和水平。从知识搜索榜可以看出，读者对哪些作品比较感兴趣，可以帮助出版单位寻找选题开发思路。又比如，基于聚典捕捉到的读者查询落空事件，可以发现漏收词条和新词新语，由此经过一定的筛选程序，聚典形成了新的内容生产闭环，成为补充和完善内容建设的一个重要方面。再比如，分析查询落空事件发现，原文差错、切词缺漏会引起用户体验不佳，这为聚典的迭代升级提供了依据、指明了方向。2023 年8 月发布的聚典2.0 版，运用AI 技术已经基本实现了对原文差错和切词缺漏等问题的容错，改善了用户体验。从以上几个例子可以看到，通过分析读者阅读行为数据可以发现大量潜在的需要，对这些数据善加开发利用，就可以帮助聚典完善内容体系、提升用户体验，形成业务闭环。这就是所谓“以数据驱动产品研发和服务”。

一个更具代表性的例子就是中国知网。中国知网是同方股份有限公司（简称“同方”）旗下的学术平台。20 世纪90 年代，同方以制作《中国学术期刊（光盘版）》起步，走过了从单机版CD 到数据库，再到网络版的发展过程，初期的产品现在看来是很初级的，而且早期的网络版也只是提供论文查询服务而已。但是，随着海量内容资源的汇聚，论文查重、期刊影响力评价等大数据应用自然而然地被开发出来了。而论文查重这些功能，很难想象是公司在创立之初就规划设计好的。

大数据出版能带来哪些机会和可能？这个问题只能在不断的实践中去发现。坐而论道不如起而行之，如果不着手构建自己的数字出版平台，并持续完善数据资源的有效采集、科学分析和合理开发，一切都是纸上谈兵。

三、数智时代的出版是大模型出版

出版传媒业运用人工智能技术帮助内容生产、创作由来已久。但是，像2022 年11月30 日发布的ChatGPT 引起的轰动和震撼还是未曾预料到的。LLM 和AIGC 对出版业无疑是一次生产力革命，其影响不亚于现代印刷术和激光照排对出版业的影响，甚至更为广泛和深远。

传统出版由编印发三个环节组成，现代印刷术推动了印刷环节的生产力飞跃，使得纸质出版物大规模复制、广泛传播，知识以前所未有的速度走入千家万户；20 世纪80 年代，激光照排系统的出现和广泛使用，突破了印前环节的瓶颈，再一次大幅度提升了出版的生产力水平，带动了出版的又一轮繁荣。可以乐观地预测，LLM 和AIGC 引领内容创作生产环节生产力的大幅度提升，将引发出版新一轮发展。

LLM 是“预测下一个词”的统计语言模型。它以自注意力机制的解码器作为基本结构单元，通过层级堆叠，构成Transformer，同时以自回归训练方法，将海量语料输入模型进行预训练得到基础模型，进而通过SFT（supervisedfine-tuning，有监督的微调）技术和RLHF（reinforcementlearningwithhuman feedback，基于人类反馈的强化学习）技术，进一步提高模型性能，与人类价值观对齐，构建起ChatGPT。

各类测试表明，ChatGPT 是迄今为止最为强大的语言模型，它一举解决了为数众多的传统NLP(naturallanguageprocessing，自然语言处理）任务，改变了NLP 的研究范式，甚至使得NLP 领域的许多研究人员不得不转变研究方向。《辞海》对“智慧”一词的释义是“对事物能认识、辨析、判断处理和发明创造的能力”，也称“思维能力”。思维的工具是语言，思维的形式是概念、判断、推理等，思维的方法是抽象、归纳、演绎、分析和综合。如果从这几个维度看，以ChatGPT 代表的LLM 在某种意义上已经具备相当高的“智慧”了，或者可以说是“智慧体”了。

比如，就语言方面而言，以ChatGPT 为代表的LLM，除了在各标准数据集的测试中表现优异之外，用户使用的直观感受更具有说服力。如“多轮对话不跑题”“概念形成很到位”“一词多义能理解”等，这些足以说明LLM 的语言能力。LLM 的阅读理解和归纳综合能力也非常突出，它可以准确抽取给定文本中的各类信息，可以非常准确地总结归纳文章中心思想，完成各类阅读理解任务等。LLM 还具备一定的推理能力，显示出对概念之间逻辑关系的理解和运用。总之，抛开ChatGPT 是运行在硅基实体上之外，它在表象上与人类智慧已非常接近。

LLM 还是一个知识模型。LLM 的预训练过程实质上是一个信息压缩过程，所以LLM在构建语言能力的同时，还给出了一种知识存储的新方案。在这个新方案中，人类创作的各类知识以语料的形式被LLM 通过预训练的方式反复学习，内化到其规模巨大的参数系统之中，并在这个学习过程用一组低维稠密向量完成了其自身对各类概念的理解和表示，从而构建起一个完整的关于世界知识的新表示。所以，从这个意义上说，LLM 本身是一个知识模型。可以期待的是，如有足够多高质量的语料，可以精调出垂直领域的LLM 知识库。

同时，LLM 还是人机接口的一次革命。计算机发明以来，如何与计算机进行对话交互，一直在不断改进。从最早的穿孔纸带编码信息通过读卡器输入信息进行交互，到沿用至今的键盘，再到后来为适应图形窗口界面而出现的鼠标，交互方式不断进步。有了移动智能手机，虚拟键盘和触屏输入成为人机交互的主要方式，随着语音技术的成熟，语音输入也成了某些场合更加高效的交互方式。有了LLM 之后，它不仅对已有的键盘输入和语音输入赋能，也成为一种新的人机交互的方式，带来一种更加自然的人机交互。

鉴于LLM 以上这些属性，显而易见，大语言模型的这次技术进步会对出版产生很大影响，甚至会超越互联网技术带来的影响。

作为人机接口的一次革新，LLM 必然对内容传播和服务带来深刻影响，就像上一轮互联网改变了读者阅读习惯和方式一样，这次LLM 使得人机交互更加自然高效，必然在产品和应用上带来新的变化。投资了OpenAI的微软首先就想到要利用LLM 优化其搜索引擎。由此也就不难理解，ChatGPT 出现之后，甚至有人预言，所有互联网应用都要用LLM再做一遍。对于各类数字出版产品和平台而言，运用LLM 也是一种趋势，甚至是必然会发生的。比如，语言学习类App 已经开始用LLM 模拟虚拟教师，扮演角色、选择场景、主动发起或者被动应答，进行双语学习交流了。

作为一个语言模型，LLM 高超的生成能力必然改造人们的创作方式。互联网的发展曾经催生了UGC（usergeneratedcontent，用户生成内容），而“阅读过”几乎所有人类创作的文本之后的大语言模型，可以按照给定的体例、设定的主题、需要的语言风格等各类要求，快速、高效地生产高水平内容。有人担心，有朝一日我们阅读到的文字更多来自大语言模型而不是人类的创作，这不免让人感到有些魔幻。其实，不仅是文字作品，AIGC 还可以生成绘画作品、视频作品、动画作品，甚至3D 作品，AIGC 将会成为一个重要的内容产品生产者。退一步讲，在这些内容生产过程中，即便不是由AI 独立完整地完成生产创作，也可以帮助人类创作者提高创作效率，这样创作出的作品不见得没有创造性。

作为一个知识模型，基于LLM 的训练机制，在某种意义上可以认为LLM 学到了人类知识，并通过生成模式实现知识的重新表达和传播。从这个维度认识LLM，那么作出下面这样的断言，也就不为过了：LLM 即出版。也就是说，LLM 是一个出版物，一个集成性的出版物，一个新形态的出版物。这个新形态的集成性出版物是以大语言模型的形式出版的。LLM 即出版，树立这样一种意识，有助于重新理解LLM，也有助于理解出版。

站在时代的门槛，回望过去数字化的历程，展望未来智能化的前路，将目光聚焦到远处大道而不是紧盯着眼前细部小节，可以略窥发展的潮流和脉络。从这个视角来分析出版，可以概括地讲：对数智时代的出版而言，大平台是基础，大数据是金矿，大模型是未来。