数据要素资本化驱动人工智能演进分析

2023-03-15 08:47嵇正龙

淮阴工学院学报 2023年6期

嵇正龙，肖艳，宋宇

（1. 宿迁学院经济管理学院，江苏宿迁 223800；2. 宿迁学院数字经济发展研究中心，江苏宿迁 223800；3. 西北大学经济管理学院西安 710127）

党的十九届四中全会首次明确了数据是参与分配的新型生产要素。随后发布的《关于构建更加完善的要素市场化配置体制机制的意见》，进一步提出了加快培育数据要素市场。从数据的要素化，到数据要素市场的培育，不仅是社会主义市场经济体制的重要发展，而且是马克思主义政治经济学的理论创新和坚实拓展。数据作为一种新生产要素，具有虚拟化的特征，是数字的自然属性和信息的社会属性的融合［1］，其价值的实现需要借助人工智能系统链接其他要素参与生产过程。基于海量数据训练的ChatGPT一经发布，迅速引爆了市场，成为AIGC 领域的领军产品，并被迅速整合进入微软系列产品，获得用户的高度认可。由此，数据要素驱动了人工智能的不断演进，并经历了新旧两个阶段。新一代人工智能技术与大数据、云计算、物联网等形成了互为支撑、协同演进的技术体系，被称为第四次工业革命，前三次工业革命分别是“机器与蒸汽革命”“钢铁与电力革命”“信息化革命”［2］。中国、美国、欧盟和英国等世界主要国家和经济体都认识到了新一代人工智能对于对经济增长、产业发展和就业等都有具有重要影响，从中看到发展机遇，并做出各自的发展和支持规划［3］。

总的来说，数据要素驱动人工智能的经济实践远远地超过了与其相关的经济理论发展。现有关于人工智能对经济增长的影响的文献主要集中在生产率和经济增长、就业、收入分配和公共政策等几个方面［4］。这些研究大多遵循了西方经济学主流的经济学范式，将人工智能作为新技术因素，或者新生产要素，引入既有的理论模型或者生产函数，考察产出贡献、收入分配、就业替代以及公共政策效果等。原因在于人工智能具有物理特征属性，容易被模型化处理，或者说符合传统工业生产模式下的既有认知范式。毫无疑问，现有的理论研究和少量的实证文献，开创性地探讨了人工智能对经济的影响，延续了西方经济学一贯的“经济学帝国主义”的做派。但是本文认为简单地将人工智能看作技术因素或者生产要素，仍然囿于传统工业经济时代的经济学思维，未能体现新经济的数字特征。因此，笼统地将人工智能引入成熟的理论范式不会得到更多令人意外的发现，也不能揭示新经济所蕴含的更深层的经济规律。

马克思认为“人学会让自己过去的、已经对象化的劳动产品大规模地、像自然力那样无偿地发生作用”［5］，这恰恰是新经济中人工智能生产活动所表现出的典型特征。所谓的“无偿”正是人工智能演进中数据所扮演的角色。本文以政治经济学理论和范式为遵循，尝试从数据要素驱动的视角阐释人工智能演进的脉络和逻辑，进一步丰富马克思主义政治经济学理论［6］。

1 人工智能演进的三个阶段——数据要素驱动的脉络

人工智能是与人类智能有着本质性差异的解决知识难题与实践困境的工具与方法［7］。已有关于人工智能的定义各有不同，如：人工智能是人们通过研究人类智能行为的规律建构的智能系统，以胜任一些复杂工作［8］；人工智能技术是数据生产、算法及软件开发、芯片、存储器、其他硬件设备等技术和产品集成的复杂系统［9］；人工智能是基于计算机科学、语言学、数学等多种学科相互渗透的综合性新技术等［10］。从已有的人工智能的定义也能看到数据驱动的作用，基本都是强调以数据计算技术和大数据为基础。

关于人工智能的发展，目前公认的是经历了三个阶段［3，9］。第一阶段，20世纪50～60年代，自然语言的数理逻辑表达和推理阶段。1956 年，达特茅斯会议以“如何用及其模仿人”为主题讨论了“人工智能”，被认为是人工智能元年。随着计算机的发展，通过自然语言处理进行程序翻译和推理，产生了神经网络和遗传算法等代表性成果；第二阶段，20 世纪80 年代，概率统计的建模、学习和计算阶段。该阶段的典型成果是专家系统和知识工程等；第三阶段，21 世纪初以来，主动学习和深度学习阶段。这一阶段得益于移动互联网和云计算技术的大规模应用，经济社会进入了大数据时代，促使深度学习和主动学习取得了突破性的进展，成为新旧人工智能的分水岭。

三个阶段的划分不难发现是数据的容量和规模激发了人工智能的热潮。在自然语言的数理逻辑表达和推理阶段，是基于当时的计算机发展技术，对简单规则的翻译，并能够应用小样本数据进行自动化处理；概率统计的建模、学习和统计阶段，建立在计算机技术和数学建模技术的突破性进展，对于复杂的预设规则的理解和翻译，能够处理计算机发展所产生大样本数据集，形成知识发现和决策支持的自动化；而主动学习和深度学习阶段，互联网所产生的大数据，促使人工智能实现了质的飞跃，促使人工智能从被动的规则预设转向了主动规则自生的阶段，从而具备了主动学习和深度学习的能力。

三个阶段都可以发现，计算机技术和算法的发展都早于人工智能发展的阶段，为其质的变化奠定了基础。计算机技术和算法的发展并未能催生出人工智能，更多的体现是人工智能发展的基础。唯有数据与每一个人工智能的发展阶段相匹配。这不是偶然现象，三个阶段都与当时的数据获取能力相适应，客观地说明了人工智能发展的数据驱动的本质。如：深度学习所包含的算法在20 世纪末就已经成熟，但是直到2010 年之后才呈现暴发的态势。究其原因是互联网和云计算等信息技术的大规模商业应用成为通用技术，形成了海量数据集，为深度学习所必需的迭代和优化提供了足够的数据支撑［9］。机器学习预测效果大幅提升是建立在海量数据基础上，其内在机制是纯粹的数据驱动，而不是基于理论的预设规则驱动。换句话说，规则预设约束转向数据驱动和规则自生，也称为规则涌现。

2 新旧人工智能识别的三个维度——数据要素基础的线索

除了上述三个阶段的划分，通常还将人工智能的发展分为新旧两个阶段。在互联网和云计算技术成为通用技术之前，人工智能发展所需的大规模数据尚未形成，制约了人工智能的发展。随着互联网和云计算技术成为通用技术，大数据的形成、存储和计算都被有效解决，推动了人工智能质的飞跃。通常将当前在互联网和大数据基础上催生的人工智能的第三阶段称为新一代人工智能，而之前的统称为旧人工智能。可以从数据规模、规则设定和知识分类三个维度理解。

首先，数据规模。人工智能发展的三个阶段中，对应的是数据规模的变化。数据规模不仅仅是数据量的问题，也包括了结构和质的问题。从第一阶段走到第二阶段是数据量为主导，第三阶段大数据不仅是量的爆炸，而且是结构和质的变化，纳入了更多的数据内容和形式，形成了所谓一切皆数据的现象。也是所谓的新经济被称为数字经济，或者数据经济的原因。

其次，知识分类。知识通常被分为显性知识和隐性知识两类。能够被明确编码表达传播的知识被称为显性知识，还有不能够编码，只能意会的知识，被称为隐性知识。人工智能在发展的初期主要是对显性知识的处理，无法突破隐性知识的限制。在大数据支持下，隐性知识的掌握就变得相对容易，从而推动了新一代人工智能的诞生。

第三，规则设定。旧人工智能是对人类已有认知的规则和逻辑的翻译，受到人的认知范畴约束。最初自动化处理和计算，更多体现的是对人的工作的替代或者延伸，主要起到的是辅助作用，或能够在既定的规则和逻辑下，发现新的知识，支持决策。但是在海量数据支撑下，人工智能可以自己建立规则和逻辑，超越人类的已有认知，并进一步进化，拓展人类知识的边界。从规则预设转向规则自生，这是新旧人工智能的分水岭，也是当前不少专家担心新一代人工智能威胁人类的重要原因。

无论新旧人工智能，其都是数据要素驱动。新一代人工智能，依靠大规模的数据和极强的计算能力，掌握了隐性知识，推动了人工智能质的飞跃，实现复杂的功能，推进了人工智能的通用性。新一代人工智能的内在机制不再是传统的以预设规则和逻辑推理为基础，通过机器翻译，然后执行的模式。而是纯粹依靠数据要素驱动，通过自主学习，发现规则和逻辑，超过了人的认知范围，也是“新”之所在。由此，数据本身的发展已经成为关键要素，并且是人工智能持续演进的不竭动力。

3 人工智能系统的三元结构——数据要素核心的系统

对于工业生产背景下机器与人的关系，马克思进行了深入的思考，做出了许多经典的论断。马克思认为，机器“是人的产业劳动的产物，是转化为人的意志驾驭自然界的器官或者说在自然界实现人的意志的器官的自然物质。”［11］随着大数据存储和处理技术、硬件和算法的进步，人工智能进入了突破性发展时期［4］。人工智能技术是数据生产、算法及软件开发、芯片、存储器、其他硬件设备等技术和产品的集成系统［9］。人工智能包括计算能力与存储能力的物质载体、具有深度学习功能的算法以及大数据三个部分［12］。也就是说数据、硬件和算法三者是人工智能的基本结构。进一步分析，人工智能的构成，硬件：物理属性，存储功能，表现为实际可见的物质；软件：虚拟的算法和规则，展现表达结果；数据：原料驱动，控制其他部分，具有自我增殖性。物质载体与算法是载体支撑，海量的数据要素是智能计算与学习必需投入。三个阶段的发展具有几个共性的特征，那就是计算机技术、数据和数据的处理模式。

综合已有关于人工智能作为复杂系统的解构分析，本文认为人工智能呈现硬件、软件和数据三元结构。首先硬件发展得最早，长期以来都是计算机技术的发展代表，是软件和数据的物理存储支撑，是可见的物质基础和事实表现，也就是数据资本控制下的人工智能需要通过硬件实现和展示。其次，软件本身就是算法的集成系统，因此从抽象层面来看，软件就是算法。第三，数据是人工智能的核心部分。没有数据的人工智能就和一个石头没啥区别。经济社会的数字化过程，正是数据要素形成的过程，是人工智能的发展起到了决定性的作用。虽然硬件、软件和数据都重要，但不影响数据的核心地位。深度学习所包含的多元统计学习、机器学习算法20世纪就产生了，但是直到互联网、大数据和云计算等技术的大规模应用才显示出其潜力，原因在于深度学习的优化迭代需要海量的数据和足够的算力支持。当然，这里也离不开硬件和软件技术的进步。

4 人工智能发展为通用技术——数据要素资本化途径

被吸收在资本中的“知识和技能的积累，社会智力的一般生产力的积累”，“表现为资本的属性”［13］。资本以获得价值增殖为根本目的，而价值需要在资本运动过程中实现。数据是要素、数据可以用于交易、数据控制资源并具有分配能力，意味着数据已经成为资本，并且决定着人工智能的发展。

旧的人工智能时代是将人工智能的设备投资作为资本化处理，新经济中数据要素才是核心资本。传统资本将让位于数据资本，数据驱动的人工智能发展的阶段现实已经证明了这一点。人工智能作为新一代信息技术，逐渐发展成为通用技术，具有极强的渗透性，被全面应用到经济社会中［14］。从已有的研究中可以发现，数据要素在人工智能发展中起到了决定性的作用。大数据不仅是新一代人工智能的基础，更是一种影响经济总体活动、企业的生产决策、市场竞争的新要素［15］。

金钱和信息是数字经济交易中的两种不同的货币［16］。也就是说数据要素具有货币属性。结合现实来看，数据企业所提供的免费服务，其实并不是免费的。服务的使用者是以让渡个人数据为代价的，包括个人信息和使用服务过程中产生的行为信息等，也就是以这些数据作为支付代价的。当数据要素积累到一定的量，用于组织生产和分配，那么数据要素成为资本就顺理成章了。

传统的资本强调所有权，并形成以所有权为中心的资本体系。而新经济中数据要素突破了传统的限制，全面融合和渗透传统产业。蓝江认为数字资本主义正是在大数据和云计算形成的庞大的关联体系的基础上架构出来的体系，数据用于引导和监控金融资本的投资是其成为资本的原因［17］。事实并非如此，从事实体生产的产业资本家，甚至金融资本也在趋于边缘化，而Google、Apple、Facebook、Twitter、微软等更重视数据资本的公司成为这个世界潮流的主导，而他们占据的就是处在数据资本主义金字塔尖上的一般数据。张弛和张曙光则从产权角度分析，认为数据要素的存在以共享替代传统的所有，即使用权为中心替代了所有权为中心［18］。宋宇和嵇正龙认为控制权、超额利润分配势力和开发利用能力是数据要素资本化的三个关键前提，从而实现对其他要素的雇佣和控制［1］。由于数据要素的虚拟性和多变性，那么传统的以所有权、使用权为前提的资本化逻辑不再成立，控制权才是基本前提。

数据要素具有独特的流动配置方式，就是在生产的过程中，不会灭失，相反却会自我增殖，同时由于数据资本的虚拟性，需要借助物理平台系统得以展现。人工智能对数据要素具有非常重要的两方面价值：一是参与生产的手段，也就是数据要素参与生产需要借助人工智能系统，实现与其他要素的协同配合；二是自我增殖的平台，数据资本在参与生产的过程中会产生新的数据，也就是实现自我增殖，需要存储在人工智能系统。进一步看，数据要素驱动的人工智能生产过程具有双重性，即数据的投入和增殖同时发生。可以说，人工智能对于数据资本具有关键的作用，前述的数据资本的控制、开发和分配，到这里的自我增殖等过程都需要借助人工智能系统实现。因此，人工智能系统是数据资本的实体化途径，而数据要素才是人工智能的本体。

5 人工智能企业垄断——数据规制的原则

马克思敏锐地洞察到第二次工业革命中的资本加速集中，少数大企业通过淘汰或吞并小企业，导致所谓的自由竞争终结，最终走向垄断。市场发展的规模经济和网络效应形成马太效应决定资本往往都具有垄断的倾向。数据要素驱动的人工智能经济也从最初的所谓分散化走向集中垄断。数据公司通过持续的数据收集和积累，形成了规模优势，并通过网络效应进一步强化了其黏性，拥有了数据的控制权，并且在持续的服务过程中，不断地更新优化，形成了垄断势力，从而具有定价权，组织生产并主导分配。

市场集中、控制和垄断是当前数据公司的显著特征，也就是说，数据资本悄然成型，不同于过去货币资本的影响，数据资本的影响范围和链条都更广泛。当前的数据资本主要集中在诸如亚马逊、谷歌，阿里巴巴等头部企业巨头手中，形成了几个数据生产系统，进一步强化其数据垄断的地位，也就是数据资本化的进程中具有自我繁殖强化的机制。因为这些大的数据公司通过其所控制的数据已经形成了组织生产，进行利润分配和市场操控，在当前法律法规滞后的现实中，数据资本已经以极快的速度完成积累。垄断的经济学逻辑是高固定成本极低边际成本，目前数据公司完全符合，甚至是零边际成本。

领先的数字企业通过利用数字产品的网络效应并扩展机会，建立了社会技术生态系统，愿望成为强大的垄断企业，并在一定程度上取得了成功［16］。人工智能企业，首先应该是数据企业。现在我们可以看到的人工智能企业，要么是大型的互联网数据公司，要么是被其投资控股的独角兽人工智能公司。究其原因，数据才是人工智能得以发展进化的根本。数据要素的集中化趋势很难逆转，并且发展成具有影响市场的庞大势力。数据资本形成的垄断，相较于传统物质资本的垄断，更为隐蔽和强势。数据垄断者使得非垄断者成为其附庸，并牵制了政府规制政策。如政府对消费者的保护，需要数据资本垄断者的配合，以及消费者的参与。数据资本垄断通过开放数据规制亦难以奏效。原因在于，政府强制具有自然垄断特征的数据企业开放数据，并不能实现帕累托最优或改进。因此，对数据资本垄断的有效规制理论和可行的实践都处于探索阶段。

数据的资本化趋势，形成的数据垄断问题，很像自然垄断。那么在规制数据垄断的过程中是一个效率和公平的权衡问题。在一个新产业发展的初期，从社会收益的角度出发，需要提高对数据资本垄断的容忍度，采取适度监管的原则，给予其发展和完善的空间和时间。对于数据的开放，采取分层原则，确保底层数据封闭的同时，鼓励数据在应用层面的开放，也就是在保护数据安全和隐私的前提下开放共享数据要素资源。传统的规制约束手段，对新经济中的数据资本很难奏效。根本原因在于数据资本和传统的物质资本存在极大的不同。那么如何对数据资本展开规制。本文认为，在类似自然垄断性质的数据垄断企业规制中，需要遵从以下三个原则。

首先，包容性规制政策。由于大数据的收集和存储、更新、开发等都存在很高的门槛，需要巨大的沉没成本，具有类自然垄断特性。尊重自然垄断的客观事实和经济规律，要求相关企业对数据的安全存储和合理利用做出约束，并采取包容性规制政策，创新规制举措，构建与新经济相匹配的监管制度体系。

其次，数据要素分层开放。数据要素根据其来源和性质可以分为原始数据要素和衍生数据要素。数据要素的共享并不是将原始数据的直接开放，自由获取，而主要是衍生数据要素的市场化交易。原始数据，也称之为底层数据，含有许多敏感信息，需要加强保护，因此维持企业垄断控制，具有无可替代的社会效益和经济价值。但是经过脱敏处理的衍生数据可以有偿或者无偿开放给社会进一步加工和用于生产。那么，数据要素的分层标准和识别、数据要素交易制度的制定和交易秩序的维持等都需要政府的介入。

第三，人工智能系统适度开放。数据要素资本的垄断势力主要体现在搜集控制能力和开发利用能力，也就是人工智能手段会搜集存储数据进行加工，并能用于生产，这是一个很高的门槛。因此，单纯的数据开放并不能从实质上将数据要素投入到实际生产过程中，还需要人工智能系统的链接。人工智能系统的适度开放也是数据要素市场规制的关键一环，可以破解数据要素流动的障碍，充分发挥数据要素的生产价值，并在一定程度上高效地约束数据企业的垄断势力和行为。

6 结语

新一代人工智能浪潮的兴起，主要归功于数据、算力和算法的飞跃［19］。人工智能的发展阶段受到数据的约束，也就是数据要素驱动了人工智能的发展。数据要素资本化的控制权，组织生产能力和参与生产分配，都需要人工智能系统作为基本的实现途径。人工智能系统是数据要素价值得以实现的物理途径，是虚拟形态的数据要素的可见外壳。信息技术之前的技术进步主要是替代体力劳动，先替代强体力劳动，后替代重复性体力劳动，而信息技术进步在脑力劳动岗位上愈发重要，体现出更高的效率和准确率［20］。新一代人工智能则通过大数据和跨平台智能的融入，对劳动形成了非对称替代，降低应用创新技术门槛，提升企业转型升级的能力，是实现“制造2025”的重要技术支持。

从现有的趋势来看，新经济已经成为世界经济转型的关键力量，而尤其以数据要素为基础的新一代人工智能发展最为突出。即使是当前热门的区块链应用，也不过是数据要素基础上的人工智能的一个应用场景而已。从本质上把握数据要素驱动人工智能演进的逻辑，并且认识到数据资本化而逐渐形成的垄断及其与传统要素垄断的区别，探索必要和可行的规制措施，服务于数据要素市场的培育，便于数据要素与人工智能的协同发展，从而促进新经济竞争优势的形成。