机器学习与科学认知的新方式*

2022-11-22 09:59郦全民

社会科学 2022年1期

郦全民项锐

2020年11月30日，《自然》杂志在一篇题为《“它将改变一切”： AI在求解蛋白质结构中实现巨大飞跃》的科学新闻中，突出报道了谷歌公司旗下“深智”（DeepMind）团队运用机器学习系统AlphaFold，精准高效地预测了大量蛋白质的三维结构形状；①Callawa E., “‘It Will Change Everything’: AI Makes Gigantic Leap in Solving Protein Structures”, Nature, Vol. 588, 2020, pp.203-204.2021年7月16日，该团队再次在《自然》上发文，宣布新一代的AlphaFold2已成功地预测了98.5%的人类蛋白质结构。②Tunyasuvunakool K. et al.,“Highly Accurate Protein Structure Prediction for the Human Proteome”, Nature, https://doi.org/10.1038/s41586-021-03828-1, 2021-07-22.在科学界，目前普遍认为，这是21世纪以来最为重要的科学成就之一。而从科学哲学和科学方法论的视角看，这也是人工智能（特别是机器学习）改变科学认知方式的出色范例。本文中，我们结合这一范例，试图就机器学习对科学认知方式的改变及其哲学意蕴进行初步的探究。

一、科学认知的计算方式

简单地说，AlphaFold是具有一定的自主学习能力的计算系统，因而，当其被用于求解蛋白质折叠这一科学问题时，实质上是计算方式（或进路）在当代科学认知中运用的具体表现。为了探究机器学习如何改变人类科学地认识世界的过程，我们有必要先对科学认知中计算方式的兴起和发展进行简单概述。

我们知道，近代科学诞生以来，依仗一代又一代探索者的热情、智慧和努力，伟大的经验发现和理论创造不断涌现。其结果是，人类认识的视野拓展到了宇宙的起始阶段和物质的基本构成；我们在相当程度上知晓了自己究竟从何而来，也通过技术释放出科学所蕴含的巨大力量。总之，科学取得了无与伦比的成功。从认知的角度看，科学的成功在于系统地、习惯地运用了人类认识世界的两种基本方式，即实验和理论，并在认知过程中将两者动态地整合。也就是说，在伽利略、开普勒和牛顿等开创近代科学以后的数百年间，科学的探索者们一方面通过不断地发明仪器设备去从事实验和测量，以更多、更精确地获取关于自然现象的经验数据，另一方面通过创造理论来统一地解释和合理地预测各种自然现象。而在实验与理论之间，既依靠已确立的理论来指导、设计和实施实验，又用实验数据对新理论进行严格的检验，这样就实现了两者之间的正向互动，不断地推动科学的繁荣和进步。

大约自20世纪80年代起，一方面出于科学自身演进的内在要求，另一方面由于信息技术（尤其是计算机）持续增强的影响，科学发展的版图上呈现一系列新的景象。其中，引人注目的是“计算科学运动”（the computational science movement）的兴起。①Denning P., Martell C., Great Principles of Computing,Cambridge: The MIT Press, 2015, p.10.其标志是运用计算模型和方法研究自然现象乃至社会现象，形成了众多冠以“计算”的新兴学科，如计算物理学、计算化学和计算生物学，从而开创了科学认知的第三种基本方式，即除了实验和理论以外的计算方式。当时，颇有代表性的是，诺贝尔物理学奖获得者威尔逊（Wilson K.）基于他本人创立的重正化群变换理论，建构了计算模型，并利用计算机成功地发现了一些物质材料的相变。于是，他宣告： “除了理论和实验，计算是做科学（doing science）的第三种方式（way）。”②Wilson K.,“Grand Challenges to Computational Science”, Future Generation Computer Systems, Vol.5, No.2-3, 1989, p.171.

在认识世界的过程中，尽管依仗实验和理论以及两者的整合，科学已经取得了极其辉煌的成就，但事实上，这两种认识方式都存在着内在的局限或不足。对实验来说，虽然研究者通常可以对实验对象进行控制或变革，或者制备简化、纯化或强化的相对理想的环境，从而发现在特定条件下对象的属性或变化的模式，但一旦这样做，所获得的认识就不一定反映自然条件下实际对象的真相。尤其是，大量复杂的或极端的物质系统实际上无法通过实验加以研究。此外，探究多组元（或复杂）系统的结构、功能和变化过程，不仅要求发展更加精准、有效的探测工具，也需有处理和分析大量数据的手段，而这单靠人力或简单的统计方法远远不够。就理论而言，所有理论都是由基本的概念和规律所构成，这些概念和规律又是科学抽象的产物，因而，它们一方面具有普遍性和抽象性，另一方面与实际系统之间的关系往往是间接的、迂回的和粗粒化的。正因为如此，除非所面对的实际对象很简单，否则，从理论的规律（加上相关的辅助条件）通常无法严格地推演出可以解释或预言具体对象的属性或过程的结论。

相当程度上，计算方式能够克服或突破传统理论和实验的局限，并成为两者在当代科学认知中发挥更大作用的有力推进器。在实验方面，当代科学的重心已转向对复杂系统的结构、功能和演化过程的具体研究，如生物系统和全球气候变化。这不仅要有灵敏探寻和精确测量对象的尖端仪器，而且要有对获得的海量数据进行快速和有效处理的能力。因此，不论是在科学实验还是科学观测中，计算技术和方法已经必不可少。特别是，计算机模拟可以在一定程度上充当实验的角色。这种方法是将表征现实或可能对象（原型）的模型在计算机上运行，以期通过对运行过程和结果的研究来认识对象。尽管模型的运行只是基于算法的程序生成过程，却类似于真实的实验，因为其具有可重复性和对错误过程的可修改性等，并能生成稳定的输出结果。在理论方面，通过在已有理论的指导或约束下建立关于对象的具体计算模型，并运用计算机对模型进行操作，就能在理论与经验之间架起可以通达的桥梁。事实上，基于理论建构模型，并让其在计算机上实现和运行，再将输出的结果与经验数据作比较，或者运用模型对现象进行解释和预言，已经成为探索复杂系统的主要认识方式。如今，计算方式已经在科学领域无处不在，极大地改变了科学研究的面貌。

二、从运行模型到建构模型

在基于深度人工神经网络的机器学习出现之前，虽然计算机模拟和计算技术已经被广泛地用于科学研究，并取得了极大的成功，但是，这种（旧的）计算方式存在着自身的局限或不足。

一个完整的计算机模拟过程，实际上由三个基本的环节构成，即计算模型的建构、计算模型的运行、对生成结果的阐释和评价。其中，计算机所承担的角色是模型的运行，这个过程本质上是“按部就班”的程序运作，并不包括自主学习和创造的成分，因而没有“智能”；而模型的建构和结果的阐释需要由具有智能的认知者——人——来履行。同样，那些嵌入仪器的专用计算机和通用计算机上用于数值计算和数据处理的软件，也是由人根据事先确定的目标而设计和实现的，并不具备自主学习的功能。

从中我们可以很容易地看出，在计算机模拟和数据处理中，建构模型和设计软件是前提，也是关键。就模型的建构而言，选择什么样的变量和规则（或函数）是一个具有高度创造性的智力活动，这不仅依赖于所模拟的对象和环境，更取决于建模者拥有的知识和能力。由于模型的建构需要由人的心智来完成，而面对复杂的研究对象，人的心智直接获取数据的容量和处理数据的能力均十分有限，因此，一般是通过抽象生成概念的方式来进行表征。这样，建构模型的元素的属性和元素之间的联系相对较少，且假定这些属性和联系是刻画研究对象的本质的或主要的方面。这就意味着，由人的心智所建构的模型通常只是对实际系统的简化，或者说并非是对实际系统的真实结构和过程的描述。正因为如此，在科学认知中，以往所建构的计算机模型主要是作为理性思维的手段而起类似于理论的作用。

基于深度神经网络的机器学习的出现，使情况发生了一个实质性的变化。我们知道，一个具有自主学习能力的认知者，比如人，能够对外部输入的信息进行选择并从这些信息中发现模式（对认知者而言属于建构模型）。人工神经网络的理论研究表明，要让一个系统（机器）具有较强的学习能力，需要创建具有多个中间层（体现深度）并带有反馈等机制的神经网络，而这依赖于强大的计算力和丰富的训练数据（数据是在媒介上登录的信息）。大约十年前，随着计算力和大数据这两个基本条件得到满足，基于深度神经网络的机器学习才得以兴起。

2016年春，当“深智”团队基于深度神经网络开发出击败围棋世界冠军的AlphaGo以后，人工智能技术在大众媒体中迅速走红，通过人脸识别和语音处理等技术开始影响人们的生活，并在网络安全、自动驾驶、医疗健康和教育等领域展示出巨大的应用前景。而对于“深智”的创始人哈萨比斯（Hassabis D.）来说，创立公司的初衷正是希望研发具有智能的人工计算系统，以推动当代科学的繁荣和发展。事实上，在创建AlphaGo的同时，“深智”团队就已经着手研发AlphaFold，以求解决蛋白质折叠这一困扰人类50年之久的重大科学难题。因此，当AlphaFold2取得巨大成功后，哈萨比斯兴奋地写道： “这是我一生中梦寐以求的日子，也是创办DeepMind的缘由：创建AI并用它去实现非凡的科学突破，像Alphafold2那样，以推进科学并造福人类。”①https://www.tuipster.com/us/tweet/1418229304194859011.

目前，包括AlphaFold在内的机器学习系统基本上依赖深度神经网络，这些神经网络具有一定的自主学习能力，经过大量的数据训练后就能从新的数据中建构针对特定问题的经验模型，比如蛋白质的三维结构，进而作出可靠的预测。而从本质上说，只有当具备学习能力的人工智能系统出现后，才有可能像人那样进行模型的建构或在数据中发现模式。因此，基于深度神经网络的机器学习系统的问世，标志着科学认知的计算方式可以实现从单纯的模型运行到包括模型建构在内的飞跃，从而能对科学研究产生巨大的推动作用。近年来，以机器学习为代表的人工智能技术正迅速地被应用于各种各样的科学探索，并呈爆炸性的发展态势。

三、人工自主体的认知角色

一般认为，像AlphaFold这样的机器学习系统可被看作具有一定自主性的人工自主体（artificial agent）。在科学认知的过程中，这类人工自主体处于何种地位？它的介入对于科学知识的获取和科学知识的属性究竟具有什么样的影响？

为了确定人工自主体在科学认知中的地位，需要先界定和阐明认知和科学认知这两个概念的内涵。这里，我们采用认知科学和认知心理学中的主流观点，即认知本质上是信息加工（或计算）。一般的认知过程包括三个基本环节：（1）认知是关于某个或某些对象的。这样的对象叫作认知客体，而从事这种活动的就是认知者（或认知主体）。其中，作为认知客体的可以是具体的物质对象，也可以是思想的建构体（如数），而充当认知者的是具有认知能力的自主体，包括人、动物甚至机器。（2）认知在于获得认知客体的信息。这样的信息可以是全面的也可以只是部分的，可以为真也可以为假，而获得信息是通过认知者的知觉、判断、记忆、推理和联想等具体的学习活动或过程来实现的。（3）为了确认获得的信息是否为真或似真，也就是可否称为知识，认知者需要展开行动进行经验的和逻辑的检验；这样，在认知者与认知客体之间就形成了信息互动的环路。

科学认知是人类认知的一种特殊情形，其区别于自然（或常识）认知的两个最明显的特点是：（1）在自然认知中，获取认知客体的信息，所依仗的基本上就是作为认知者的人所固有的感觉器官和肢体，而科学认知则常常借助观察仪器和测量仪器等认知工具，如显微镜和计数器。这样，自然认知是获取并确认认知者所处的周围环境的信息，而科学认知则借助认知工具实现了对前者的超越。（2）在自然认知中，人们基本上是运用自然语言或身体图式（如手势）来对获取的信息进行表征。从功能上说，自然语言和身体图式均是保存或传递信息的自然媒介。与此相对照，在科学认知中，认知者除了运用自然媒介，更多（或者说越来越多）地依赖于人工符号来表征知识；尤其是，通过系统地运用数学语言，认知者不仅可以精确地表征科学知识，而且能实现基本假设与具体结论之间的形式推理。因此，自然认知是运用自然媒介表征知识，而科学认知则借助数学语言等人工符号突破了这一限制。①郦全民：《当代科学认知的结构》，科学出版社2021年版，第56—57页。

由此可知，具有学习能力的人工自主体在科学认知中可以处于特殊的地位，实际上能承担双重角色。一方面，面对具体的数据对象，人工自主体可以通过学习建构并运行关于对象的模型，而如果数据对象是真实的物质对象的体现，则模型就是对后者模式的刻画。倘如这种模式是人类此前未曾知晓的，比如由AlphaFold预测的蛋白质的新结构，那么，我们可以将这种人工自主体视作能进行科学发现的人工认知者，类似于在实验室里从数据中发现模式的经验科学家。另一方面，人工自主体单独（至少目前）并不能完成真正的科学发现。这是因为：其本身是人类发明的产物，更为重要的是，一个科学发现的过程还包括研究者（人）对问题的设定，对所生成模型的解读、解释和评价等，离不开研究者的知识、洞察和判断。故对于研究者而言，人工自主体可以被看作是整个科学认知过程中的有用工具，类似于显微镜和质谱分析仪。不过，随着认知能力和自主性的持续增强，人工自主体的第一种地位正在不断提升。

如果将人工自主体看作人工认知者，那么就会遇到两个深刻的哲学问题。一是意向性问题。在心智哲学中，意向性一般指人（也可包括一些动物）的心智状态是关于或表征某个对象的，简单地说就是“关于性”——这是人有别于机器等人工物的本质特性。哲学家塞尔（Searle J.）提出的“中文屋”思想实验，就是为了论证一个仅仅依据指令执行程序（运行模型）的计算系统并没有内禀的意向性，因而不具备真正的理解力。②Searle J.,“Minds, Brains, and Programs”, Behavioral and Brain Sciences, Vol.3, No.3, 1980, pp. 417-457.而如今，具有学习能力的人工自主体，并非仅仅执行程序或运行模型，还能够进行模型的建构，那么，其是否具备了某种内禀的意向性呢？我们认为，如果一个人工自主体能通过自主学习在内部建构模型，且这样的模型又是关于外部对象的，比如蛋白质的结构，那就意味着其内部状态具备了内禀的意向性。当然，这种意向性还只是原初的或一阶的，且不涉及意识。而作为人，我们不但具有原初的意向性，还具有对建构的模型进行评价和反思的能力，也就是说，具有高阶的意向性和意识。

二是知识问题。由AlphaFold准确预测所获得的蛋白质结构，在什么意义上可以被称为“知识”？从认知的三个基本环节中可以看出，前两个环节已经可由AlphaFold自主地履行，但这样获得的结果实际上还只是针对特定对象的信息结构（模型），而这样的信息结构是否真的表征和刻画了某种蛋白质的结构，则还需要通过“深智”团队的研究者或其他生物学家的证成（或辩护）来完成。所以，严格地说，并不能将单独由AlphaFold预测所得的蛋白质结构称为知识。不过，这种蛋白质结构也不是充当研究者的人单独获得的，事实上，即使是AlphaFold的设计者也不一定能理解其生成新的蛋白质结构的具体机制和过程。鉴于此，在这种情况下，我们不妨引入一个“超认知者”的概念，作为所发现知识的承担者：其由像AlphaFold那样的人工自主体与科学家所组成，并通过两者的协同来进行科学发现。可以预期，在科学研究中，特别是当面临复杂的科学问题时，这样的“超认知者”将扮演越来越重要的角色。

四、心智建模能力的外化

从意向性问题和知识问题出发，自然可引出一个更具哲学意味的问题：随着人工智能不断发展，是否有可能出现拥有高阶意向性和更有创造力的人工自主体，从而进一步改变科学认知乃至人类生存的方式？这里，我们从人类心智外化的视角对这一重大问题作些粗略的思考。

我们知道，人的心智虽然异常复杂，却是生物进化的自然产物。不过，人之所以为人，不仅仅在于他是生物进化的主体，更重要的是成为另一种进化方式的主体，即文化进化的主体。那么，这究竟是如何发生的？一个简单而又直观的回答是：这是人的心智运作外化的结果。

在自然条件下，心智的运作发生在个体层面，即只有在一个个具体的大脑（更确切地说在神经系统）中，各种认知功能和意识方可实现。人的心智能力是其超越其他物种最重要的特性，但实现这种超越的关键却是作为个体的人将自身心智运作的结果外化，即输出并记录到个体以外。对于人而言，心智建构的模型所表征和处理的信息具有语义，因而产生的结果承载内容。通常，我们把这样的结果叫作知识或思想。于是，心智运作结果的外化实际上就是知识或思想的外化。一旦将知识或思想传递给其他个体，或以符号的形式“下载”到自身以外的媒介，一种突变就发生了：外化的知识或思想形成一个新的亚世界，即文化世界。于是，人与自然环境、人与人之间的关系就发生了根本性的变化：一方面，个体可以将其所获得的知识或思想持续外化，从而导致文化世界的不断膨胀；另一方面，因为构成文化世界的内容包括自然的和社会的知识，所以，他人或后代便不必直接去与自然环境或社会环境发生作用，而只需凭借自身所具备的学习能力便可（间接地）获取有关的知识。

除了以符号的形式外化心智内容，人类还采用了另外一种非常基本和重要的外化方式，即依据心智所产生的内容，将外在的自然物转变成具有特定功能的器物，并利用这些器物获取可以满足自身生存的食物、能量和信息。以这样的方式外化心智的内容，其实就是技术。纵观技术发展的历史，我们不难发现，它实际上就是一部人类不断外化心智运作所生成的知识的历史。与其他符号化的知识不同的是，构成技术的知识是人的心智所“写成”的程序。这些程序通常具有特定的功能，并以内隐的方式物化在一定的系统（如机器）中，为人本身的生存和进化服务。

我们说，技术也是人类外化知识的活动，不过，在技术发展的不同时期，由其所外化的内容在性质上并不相同。在人类进化的绝大多数时间里，技术活动所外化的知识基本上属于心智运作的结果，而不是关于心智运作本身的知识或心智能力。那些物化了心智运作生成的程序的工具，替人类承担了输送物件、变换实物形态和转换能量形式等方面的功能，可以说，是将人的体力和肢体技能在机器中对象化了。在这一过程中，人类不断地增强控制和利用自然环境的能力，反过来，又使得这种对象化过程进一步升级，而其中，心智运作的能力是起核心作用的环节，不可缺少。

终于，文化进化发展到这样一个阶段：人不仅仅满足于将心智运作的结果外化，而且开始将处理和操作信息的认知能力外在化和对象化。由帕斯卡、莱布尼茨和巴贝奇等先辈所发明的加法器、乘法器和分析机是外化认知技能的早期代表。而最具革命性的事件当属20世纪40年代普适电子计算机的问世：它标志着人类进入了一个外化自身的新阶段，即心智运行模型能力的外化。从此，人类对世界的认识和文化进化均跃上了一个新台阶。就认识世界而言，人类获得的关于认知对象越来越多的科学知识，就不仅仅是人的心智运作的结果，还是人与计算机之间协同的产物。

不过，正如此前所述，如果只是停留在对计算模型的运行和展开的层面，而不具备建构模型的能力，那么，这样的计算机或人工系统就缺乏真正的理解力或智能。然而，出于进化动力的驱使，人类似乎并不想止步于心智运行模型能力的外化，更希望实现建模能力的外化，以便产生具备类人智能或者拥有超级智能（超越人的智能）的人工自主体。

如今，人工智能技术已经成为人们最为关注的科技热点之一。这是因为，基于深度神经网络的人工自主体具备了一定的学习能力。对人而言，所谓学习，就是将来自环境中对象的信息进行选择和登录（转化为数据），再基于这些数据建构模型；如果由模型所生成的信息（预测环境中对象）与来自对象的信息相匹配，则表明模型表征了对象，学习取得了成功；否则，再基于数据对模型进行训练和修改，直至产生理想的结果。由此可见，学习能力实质上就是选择信息和建模的能力，体现在神经网络中便是学习算法。

因此，我们可以理解，深度神经网络的学习能力，恰恰是人类心智的学习能力外化的表现，特别是，通过发明学习算法实现建模能力的外化。由此看来，对于人类而言，基于深度神经网络的机器学习一定程度上实现了人类建模能力的外化，表明文化进化又跃入了一个新的阶段。当然，目前的机器学习算法尚处于专门（适于特定的问题）、低效（需要大量的数据训练才能建构合适的模型）和低级（仅限于建构数据模型）的阶段，即使在预测蛋白质结构方面显得能力超强的AlphaFold亦是如此。但是，似乎并没有力量能阻止人类去发明更通用、高效和高级（如建构概念模型）的学习算法的欲望和热情，也没有什么科学理论排除了发明这样的新算法的可能性。

随着人工智能技术的不断发展，人工自主体的建模能力以及其他能力将会进一步提高。因此，可以预期，在未来的科学发展中，人工自主体所扮演的认知角色也将愈来愈重要，从而更加深刻地改变科学认知的面貌。

结语

在当代科学认知中，计算是除了理论和实验以外的第三种基本方式。基于深度神经网络的机器学习系统在科学研究中的应用，使得计算方式实现了从运行模型到建构模型的突破，从而导致科学认知的方式发生重大的改变。在科学研究中，具有自主学习能力的人工自主体的介入，引出了一系列基本且重要的哲学问题，如意向性问题和知识问题，有待我们进一步探索。从根本上说，人工智能的问世和发展是人类不断外化自身智能的自然结果，而这给未来的科学认知乃至人类的进化均带来巨大的机遇和挑战。

机器学习与科学认知的新方式*

一、科学认知的计算方式

二、从运行模型到建构模型

三、人工自主体的认知角色

四、心智建模能力的外化

结 语

结语