OpenAI推出一对虚拟机械臂,可通过相互训练变得更智能

2021-04-14 12:03
海外星云 2021年1期
关键词:多任务虚拟环境谜题

近日,两个由OpenAI的研究人员开发的一模一样的机械臂——爱丽丝和鲍勃,可以在模拟情景中通过对弈互相学习,而不需要人为输入文本。

其中一个虚拟机械臂已经学会解决各种不同的难题——堆积木、摆放桌子、排列国际象棋棋子,并且每项任务不需要进行再训练。这一切通过与另一个机械臂对弈得以实现。据了解,另一个机械臂经过训练后,会给原本的机械臂臂带来越来越难的挑战。

这些机器人采用的是强化学习算法,即在不同情况下,通过试错来训练人工智能,并采取不同行动来实现目标。游戏包括在虚拟桌面上移动物体。例如,通过以特定的方式排列物体,爱丽丝试图设置对鲍勃来说很难解决的谜题,而鲍勃会试图解决爱丽丝的谜题。随着它们的学习,爱丽丝会设置更复杂的谜题,而鲍勃也会越来越会解谜。

经过爱丽丝设置的积木谜题的训练后,鲍勃便可以通用于一系列任务,包括摆放桌子和排列象棋棋子。

通常在多重任务处理中,深度学习模型必须在任务间进行再训练。例如,AlphaZero(一款棋类AI,可以通过自我博弈来学习)会使用单一算法教自己下国际象棋、将棋和围棋——但每次只能下一盘棋。例如,下国际象棋的时AlphaZero不能下围棋,下围棋时的AlphaZero不能下将棋。因此,造出真正能同时处理多任务的机器,是走向更通用的人工智能道路上的一大未解难题。

训练AI同时执行多重任务时会遇到一个问题,即需要大量的例子。OpenAI则通过训练爱丽丝为鲍勃生成例子,用一个AI训练另一个AI来避免这个问题。经过训练,爱丽丝学会了设定目标,比如建造一座积木塔,然后把它捡起来并加以平衡。鲍勃学会了利用虚拟环境的属性,如通过摩擦力来抓取和旋转物体。

截至目前,虚拟现实的训练只在虚拟环境中进行,但OpenAI和其他机构的研究人员正在将虚拟环境中训练的模型转移到物理环境中,且越来越有起色。据悉,模拟环境可以让AI在短时间内处理大型数据集,然后研究人员会根据现实世界的环境再对其进行微调。

该团队的研究人员表示,他们的最终目标是训练这些机械臂去解决人类可能要求它做的任何任务。与GPT-3一样(GPT-3是一个能以各种不同方式使用语言的语言模型),这些机器人手臂是OpenAI打造多任务人工智能整体目标的一部分,而使用一个AI来训练另一个AI也许是其中的关键所在。■(摘自美《深科技》)

猜你喜欢
多任务虚拟环境谜题
数字时代的注意困境:媒体多任务的视角*
前庭刺激对虚拟环境三维空间定向的影响及与空间能力的相关关系
如何通过虚拟环境有效管理Python第三方库
面向多任务的无人系统通信及控制系统设计与实现
怪兽谜题
电影院谜题
教授的谜题
动画广告设计中虚拟环境的构建方法与运用
基于Reworks操作系统的信息交互软件设计
DSP多任务实时操作系统内核设计