如何看待人工智能

2016-05-30 10:48危辉
科学 2016年3期
关键词:机器人工智能计算机

危辉

2016年3月,谷歌公司的计算机围棋程序AlphaGo以四比一的战绩在围棋人机大赛中获得胜利。一时间关于人工智能战胜了人类智能、机器将统治世界的言论成为各类媒体竞相报道的内容和民众关注的话题。那么AlphaGo究竟是怎样的一个程序?人工智能发展到今天已经完善了吗?机器智能究竟能不能代替人类智能呢?

最近人工智能有点热。2016年3月,谷歌公司的计算机围棋程序AlphaGo(有译阿尔法狗)以四胜一负的战绩战胜了近十年来赢得头衔最多的韩国围棋九段选手李世石。这是自1997年IBM公司的计算机国际象棋程序“深蓝”(Deep Blue)战胜苏联国际象棋大师卡斯帕罗夫之后的又一个标志性事件。其实在此之前的2008年,西洋跳棋程序已经成功实现“人类棋手只有在不犯错的情况下才能与它下平手”。这些成功案例使得人工智能下棋程序的研究变得炙手可热。

不仅在下棋方面,人工智能在自然语言理解领域也取得骄人成绩。继“深蓝”之后,IBM开发的“沃森”(Watson)系统在与人类选手的问答比赛中赢得了冠军。

上述成功具有瞩目的显示度和大众效应,一时间“人类从智慧皇冠上跌落”“人工智能将统治世界”“机器马上要代替人了”之类的言论在普通大众和媒体间广为流传。“人工智能”一词迅速占领报纸、杂志、电子媒体的头条,人们纷纷开始讨论出现在科幻电影《机械公敌》《终结者》《星球大战》中的场景是不是会很快发生。相较于学术界对人工智能理论与技术研究的谨慎态度,社会学家、哲学家和政治家开始呼吁公众要非常严肃地讨论是不是应该未雨绸缪,像对待克隆技术那样对人工智能或机器人研究的范围和深度进行立法。

人公智能的简史与研究分支

从图灵(A.Turing)提出图灵测试算起,人工智能发展到今天已有近80年,但人类对用机器代替人的研究远不止这些。按照时间顺序,人工智能先后对推理、问题求解、决策、规划、专家系统、自然语言理解、模式识别、学习等问题进行了研究,这些形成了人工智能最核心的研究分支。比如,用计算机来证明一个几何定理,属于推理研究;用计算机来解传教士与野人问题,属于问题求解的范畴;用计算机来决定何时抛售手中的股票,属于决策研究;用计算机制定一个作战计划,则是规划研究;设计一个计算机程序来代替工程师检测机器的故障,属于专家系统的范畴;用计算机实现语言翻译,是自然语言理解的范畴;设计机器来感知环境,属于模式识别的范畴;让一个程序能够从以往的经历中学到如何提升自身的性能,是机器学习研究的问题。这几个核心分支把心理学所定义的人的智能行为,包括决策、推理、问题求解、理解、学习都涵盖在内,它们使人工智能与心理学有了天然的联系,以至于一本普通心理学或认知心理学教材与人工智能教材在目录上有着高度的相似性。

目前,人工智能大致形成三个比较自成体系的学派。它们分别是逻辑主义学派、认知主义学派和连接主义学派。逻辑主义学派是用形式逻辑的方法来实现对思维过程的模拟,代表性成就是各种推理方法、归结反演方法等。认知主义学派的核心思想是从人的认知过程出发进行智能模拟,代表性成就是状态空间理论、专家系统方法等。连接主义学派的中心议题是如何模仿生物神经系统的工作原理,代表性成就是神经元的数学模型(MP模型)、并行分布式理论等。

尽管人工智能已取得了一些进展,但仍距离它原先的目标非常遥远。在1990年代,人工智能领域中的非单调逻辑研究曾经非常繁荣。人们似乎看到了突破传统经典推理手段的新途径,但是后来的发展证明事实远不如愿。人工智能学家德赖弗斯(H.Dreyfus)对此给出一个精辟的评论:如果声称非单调逻辑对人工智能是一个进步的话,就如同声称爬上一棵树是向着登上月球的目标迈进了一步。这样的昙花一现在人工智能界屡见不鲜,此前有人工神经元网络,之后有多智能体系统、面向对象知识表示。统计机器学习方法等,无一不是热过一阵子之后就回归了平静,颇有些“理想很丰满,现实很骨感”的味道。

随着多处理器计算机和网络计算环境日渐改善,近年来,人工智能在很多涉及大规模信息加工的应用上取得了一些进展,如数据挖掘技术对海量数据所蕴含规律的发现、大规模文本处理、网络数据分析等,但这些只是应用场合的拓展,从技术上来说类似于“产能扩张”,而非“产业升级”。

AlphaGo的成功秘诀

抛开广大大众媒体对AlphaGo象征意义的讨论,先从技术细节上来分析一下它获得成功的关键所在。严格来说,这一次AlphaGo的成功是因为用合适的技术解决了一个合适的问题。

中国有一句俗语叫做“柿子挑软的捏”,计算机下棋程序就是人工智能中的“软柿子”。二人博弈的棋盘游戏一般都具有棋子布局规整和下棋规则清晰明确两个特征,这属于规范的数据和理论上可预计的变化空间范畴,对计算机算法设计来说是非常容易完成的任务。表征和处理规范数据,按部就班推进状态变化是计算机擅长的工作。因此,计算机下棋程序成为人工智能领域最早进行研究的分支之一。通常用一个规范的数据结构来表征棋局的状态,用下棋规则来定义棋局状态的演变,便可以在理论上得到一个状态空间。然后用某种搜索算法在这个空间中进行搜索,逐一评价遇到的任何一个中间状态,以确定哪个中间状态更为有利。这个过程就如同“歧路寻羊”的过程。这一过程理论上并不复杂,真正的挑战是如何在计算机中实现高效率的状态表示,以及优选搜索路径的方法。不能简单地将可能性组合一一试过,因为这个天文数字往往会导致穷举搜索策略的彻底失败。

相较其他棋类,围棋有其特殊之处。一方面,它的落子和围死规则特别简单明了,这对于计算机来说,易于实现;而另一方面,它讲究的大局观和态势论极端复杂,以及号称3的状态空间规模使得围棋成为人工智能下棋研究中最难应对的任务。面对这项艰巨的任务,AlphaGo研究团队在有效表征棋局、评价候选走步的优劣,以及快速筛选三方面富有创新。该团队宣称采用了近几年来在人工智能界炙手可热的深度学习技术,笔者由此推测他们可能是把棋局当作一种图像模式,在该模式与当时的应对走步之间进行关联性学习,也就是从棋谱和左右手对弈的海量的训练集数据中形成从棋局布局模式到应对走步间的映射关系。这是人工智能机器学习领域最典型的处事方法。这一估计能够解释在专业围棋手眼中A1phaGo具有大局观,且随着棋局的深入会越下越好。

A1phaGo是根据布局模式进行决策的,不必在当前布局下逐个去试探每个可能的点,而是直接跳到似曾相识的走步,并且随着参考点数量的增加,它对模式的分类会越来越准确。这一过程又与人工智能的另外一个研究分支——基于实例的推理(或称“类比推理”)很相似。基于实例的推理将现今模式与既往模式进行匹配,从而找到当时的解题方法,并在此方法基础上试探若干种新的但是小的变化。这一方法可以大大提高找到可行走步的效率,且是在以往成功实践的基础上,因此失败的风险较小。此外,AlphaGo幕后由众多CPU支撑的并行计算使得它把与顶级围棋手下围棋这件只有极少数人才能实现的事情变成了“机械的记忆+机械的计算”。相比之下,人类的工作记忆容量非常有限,难以与AlphaGo比肩,此次仅凭一己之力来对抗庞大的机器,虽败犹荣。

在东方文化中,围棋一向被视为顶级智慧的标志性事物。AlphaGo研究团队此次针对这个看似很难用计算机处理的棋类问题,找准了技术切人点,最终大比分赢得比赛,引起轰动。但是,若把这次成功视为“人类智力的崩塌”未免太言过其实了。“炒菜”是基于实例的推理经常使用的例子,此次AlphaGo的胜利就如同从老菜谱中派生出一个新菜,本质上仍是同一个范畴内的改良,并非创新。它基于棋子布局模式进行匹配的工作方式不需要知道围棋的基本规则,甚至不需要理解“围”的含义,只要“记”下模式匹配的对应关系。从这一点上看,这种看似是便捷的方法实际上有着不求甚解的嫌疑。

实现人工智能的难点

人工智能系统或程序有不同的层次,最简单的比如解决一个汉诺塔问题的程序,最多有一两百行的计算机代码;最复杂的可以把目标定义为完全模仿人的思维,这个目标的实现至今还无头绪。

人工智能的难点理应是那些富有挑战性的任务。然而,人工智能“认为”的挑战性任务出乎人意料。通常认为只有专家或工程师等专业人士能解决的问题才是难题,普通大众都明了的一定是容易的。其实这个认知在人工智能领域却未必行得通,比如对人工智能而言,“根据化学成分的比例判断土壤样本所属的风化壳类型”恰恰很容易,而“理解一个比喻”是极为困难的。这两项任务的区别就在于前者所需要的背景知识是确定的,后者所需要的背景知识却是无法准确估计的。因为无法限定所解问题的范围,所以计算机程序就难以做到足够的近似。这就是为什么目前计算机可以解算很复杂的方程组,却难以完成理解自然语言、理解场景等看似平凡的任务。因此,人工智能面临真正的挑战不是实现AlphaGo这样的围棋程序,而是去准确模拟普通人在日常生活中的行为。

也许有人会提出异议,IBM的“沃森”不是在语言问答比赛中战胜了人类冠军吗?人工智能不是已经胜过人类了吗?仔细分析一下“沃森”的技术细节就可以发现,比赛中的问题属于知识性,与推理或问题求解关系不大;其次“沃森”的技术核心是利用关键词去匹配网络上海量的文本资源,找出最相似、最相关的句子来应答,而这些现成答案里并没有多少推理成分。其实关键词的匹配仅需要比较浅层的近义词或同义词知识,并不需要更深层的语义蕴含知识。

日常生活中,一个看似简单的问题求解可能会涉及很多复杂的概念关联,以下两个小故事很生动地对此作了诠释。故事一:一匹小马背着一袋盐过河时,不小心摔了一跤,起来后发现身上变轻了。后来,它又背了一袋棉花过河,根据上一次的经验,于是它故意摔一跤,结果发现没有得到预想的结果,身上的袋子反而更重了。故事二:在一个炎热的夏天,一群小动物跑到一棵树下躲避阳光,其中一个小动物提议把大树砍了,把树桩当作桌子,这样就可以在桌子上玩游戏了,砍树的结果是再也没有树阴可以为它们遮阳了。前一个故事涉及盐、棉花、水等概念以及它们的特性,而后者与树阴、阳光等概念密切相关。稍大一点的孩子就知道小马和那群小动物做法的欠妥之处,而“沃森”做不出这样的推理和分析,其本质与AlphaGo相近,都只是寻-找直接的映射。

人类智能的神奇之处在于总能想方设法应对不期而遇的问题,然后灵活应用自己的背景知识,用尽可能小的代价去逐步化解问题的难度。能如此游刃有余是由于人具有一个丰富内涵的概念系统,这是提高基于知识库的人工智能系统性能的关键。构建一个概念数量充足、语义关联丰富、适应多任务性、可发展的概念系统是人工智能的重大挑战之一,目前的人工智能技术还实现不了。

在1990年,人工智能界的许多学者回顾当时近半个世纪以来本领域所取得的成果,同时总结出五个人工智能所面临的核心科学问题。现在看来,这些问题的答案依然是很模糊的,甚至可以说此后的25年,人工智能界的主流力量在回避这些问题。人工智能早期发展阶段遗留下来的“封闭世界假设”至今还是衡量某个人工智能系统是否成功的保护伞。

谨慎看待人工智能相关的热门技术

随着互联网等技术的迅速普及,当下一些新概念层出叠现,那么这些新技术能够帮助人工智能解决那些悬而未决的问题吗?

大数据、云计算、量子计算能够解决人工智能问题吗?回答这个问题之前,先来看看早期的人类。自石器时代,人类开始发明创造器物,每个个体都在使用自己的智力进行生存,原始人通过观察地面的足印来判断眼前消失已久的动物的类型、数量、逃走方向和时间等,并迅速做出是否追击的决定。做出这些判断的大脑都是基于生物学机制的,来源于自然进化。可见,自然界在没有大数据分析、云计算、量子计算这些豪华手段的情况下,早已找到了另外一种实现智能的手段,而且经过600万年的人类进化史检验,证明是可行的。

尽管目前单人无法对太字节(TB)的数据进行数据挖掘,只有机器能够实现,但这不意味只有使用大量硬件资源才能实现人工智能,也许好算法能在更经济的环境下成功解决问题。所以,大数据、云计算、量子计算等手段在解决人无法应对的海量数据的问题上是必需的利器,但它们不是实现人工智能的关键途径。

机器学习能解决人工智能问题吗?机器学习可能是计算机科学领域当前最热门的研究分支,它几乎成了“圣餐杯”,有一种席卷所有应用领域的趋势。有人甚至表示“我认为人工智能的根本出路就是降维(一种机器学习手段)”。

机器学习方法大致可以分为三大类,一是符号学习方法,二是统计学习方法,三是人工神经元网络。前两类中的归纳学习、类比学习、基于解释的学习等有着明显的人类思维痕迹。第三类则不同,对于任何一种应用只要有一些输入数据和输出结果相对应的训练样本,几乎都可以套用统计机器学习算法,而不需要了解这个任务的中间环节究竟是怎样的。AlphaGo使用了属于第三种类型的深度学习技术,宣称学习过几千万局围棋的数据。机器学习方法中除第一种类型之外,其余两类都有点像排球中的“短平快”打法,它们不求中间的加工细节是否接近于真实过程,只求最后的输出结果成立。它们把所有应用都简化为“分类问题”,即把输人数据映射到它应该属于的那类中,而这个类别的标记已被赋予某种特殊意义。冈此,它们也被视为“黑箱操作”。机器学习看起来与人的学习过程有相似之处,但是它没有人类学习的低成本、高效率特性,“黑箱操作”的属性使得它无助于探索很多智能信息加工的任务内在机制。

自动驾驶技术能替代出租车司机的工作吗?现在自动驾驶技术也很热,甚至有人预计它会替代出租车司机的工作。其实这个预测把司机的职业素质过于简单化了。在运送客人的过程中,司机可能会频繁遇到以下问题:行车路线规划、交通信号与标志判别、路况判别、解答乘客的问询、导游/导购服务等,这些都是典型的人工智能问题。其中的任何一种在不做任何简化的情况下都是复杂的问题求解,更何况这些任务往往是交织在一起的,要顺利地完成任务就会涉及信息流的融合问题。

对人工智能而言,平凡的驾驶任务其实是一种全方位的挑战。试想一个司机要顺利将乘客送到目的地,需要先验知识(如地图、交通规则与指挥手势、当地的风土人情、驾车技能、解题步骤等),融合多通道的信息(如交通灯和道路的视觉刺激、喇叭和乘客语音的听觉刺激、驾车的本体感觉等),把知识和经验与当前的情景天衣无缝地整合到一起,最终高效推演出一个可行的解题方案。如果换成智能机器来充当司机,就会发现这个看似平常的任务所显示的难度是当前理论与技术手段都无法克服的,因为很显然,把传统人工智能中分立解决每个步骤的各种方法,如机器规划、模式识别、自然语言理解、推理、问题求解、搜索技术以及机器学习简单地集成在一起是不可能达到目的的,这些现成的方法在理论依据、所面向领域、问题描述、求解机制、知识采纳、系统表示体制等方面存在巨大的差异。目前,仅有汽车里外配备的一些“智能”设备,它们仅解决了有限环境下的驾驶问题。

人工智能未来的发展方向

人工智能中的一些深深植根于各分支领域,且为各分支共有的核心难题并没有取得突破,这妨碍了人工智能应用广度与深度的进一步拓展。现在普遍认为,人工智能的基础理论研究方面已陷入了低谷。人类应从更本源的角度来思考智能的机器模拟与实现问题,不应忽视人工智能研究除模拟智能之外的另外一个目标,即探求智能的本质。当前,机器智能与生物智能在“质”上的差距远超在“量”上的差距,这从计算机模拟任意一项需要多种智能行为参与协作才能完成任务的复杂程度就能看出,比如现在根本无法制造山一个称职的“秘书”。想当然地接受智慧带来的好处,而忽略其内在的机理,这皆源于长期自然选择的结果,智能的执行被高度自动化了,虽然具备极高的可靠性和通用性,但对外完全屏蔽了这个复杂巨系统,对脑功能熟视无睹。从本质上来说,绝大多数人工智能模型是“再现智能”的系统,而非“解释智能”的系统。

人工智能若要进一步发展,需要把对智能行为的模拟置于一个更为广泛的学科基础上进行考虑,对研究方法与模型在发展(渐进)性、系统性、整体性和相关性方面有严格要求。认知科学作为在深层次上融合神经科学、认知心理学、心理语言学、哲学、信息科学、数理科学的综合领域,为阐述“智能的突现”问题、“大脑的信息加工机制”问题、“神经信息处理”问题或“脑功能的细胞与分子基础”问题提供了唯一全面的方法。该领域中一些重大科学问题哪怕是非常细微的进展,都可能会给智能的机器模拟提供很不寻常的启示。基于信息加工“类脑”模型的机器智能新方法对传统人工智能的改变是全局性的。

已有的人工智能各类问题在描述、范型、方法上千差万别,这并不符合科学认识向统一的理论发展的规律。而这样的规律在物理学关于物质组成的研究,生物学关于生物进化的研究,天文学关于天体运行规律与宇宙起源的研究,化学关于化学元素的研究中都可以找得到。科学研究的进步在于发现简单性和统一性,达尔文也说过“寻找自然的、平凡的、单纯的原因”,若智能模拟机制五花八门,没有逻辑上的简单性就不能称之为找对了路。神经系统动力学过程可将智能行为无缝地、毫不牵强地一致化起来,达尔文的生物进化论已经证明生命形式可以由简单演化为复杂,有充分理由可以相信,复杂智能行为通过模拟手段至少是可逼近的。

在20年前,已有人工智能的发展遇到了瓶颈的说法。其实在笔者看来,这依然是对人工智能发展的过高评价。因为“遇到瓶颈”的潜台词是“我们把别的地方看得很通透”“我们还发现了出路在哪”“我们都临近了它的出口”。事实上,人工智能界并没有就“出路在哪”达成一致,因此瓶颈说还是人类不曾够到的境界。对人工智能现状更确切的描述应该是“瞎子摸象”,视角、技术路线等方面依然众说纷纭。

人工智能至今尚无类似于原子之于化学、细胞之于生物、力之于物理、DNA之于遗传学、达尔文主义之于生物进化、大爆炸假说之于天文学那样的核心概念或中心理论,这是非常严峻的形势。客观上认为,人工智能尚不能称为严格意义上的“科学”,其核心思想尚未取得统一,仍处于摸索阶段。人工智能甚至也不能称为够“技术”,因为在人工智能领域,按部就班、按图索骥不一定能成功,大多数方法在可移植性、稳定性方面都表现一般,似乎只有用对了某种“暗力量”才能成功。从上述角度看,人工智能更像是“艺术”,成功需要一点点运气和一点点灵感。

人工智能真正出路可能是表征,用复杂的表征加相对简单的算法,而不是反过来用简单的表征加复杂的算法,后者只会使得智能系统的融合性越来越差,分立性越来越强,复杂度越来越高。因此人工智能系统不是靠算法繁化,而是靠体系结构繁化来实现的。

(本文为作者2016年3月10日在上海科协大讲坛上的演讲,内容略有修改,经作者同意发表。)

猜你喜欢
机器人工智能计算机
机器狗
机器狗
计算机操作系统
基于计算机自然语言处理的机器翻译技术应用与简介
2019:人工智能
人工智能与就业
未来机器城
信息系统审计中计算机审计的应用
数读人工智能
下一幕,人工智能!