李飞飞团队新作登《自然》子刊：如果AI有身体会更智能吗？

首页 / 计算机科学 / 正文

更新时间：2021-10-11

如果AI有身体，它会变得更智能吗？

答案是，会的。

近日，斯坦福大学教授李飞飞带领的团队研究发现，身体形态会影响虚拟生物Unimal在复杂环境的适应和学习能力，复杂环境也会促进形态智能的进化。

此项题为《通过学习和进化实现具身智能》（Embodied intelligence via learning and evolution）的研究登上了《自然·通讯》（Nature Communications）杂志。

“我们通常专注于AI是如何实现人类大脑中神经元的功能，然而将AI看作是具有物理实体的东西会是完全不同的范式，”李飞飞表示。

对于此项研究，论文第一作者Agrim Gupta告诉澎湃新闻“最终的目标将是拥有生活在一个‘由人类创造并且为了人类而创造’的世界的实体智能体。”

“现在，我们已经看到人工智能在视觉和语言方面的研究取得了巨大进展，并将降低在‘虚拟/网络’世界中做事的成本。但像帮助老年群体或帮人类做危险的工作这样真正以一种好的方式影响人类生活的技术，目前还是遥不可及的。所以当我们有了拥有物理实体的智能体，这个影响将是巨大的，并且很有希望让人类更好。”

研究团队创建了一个计算机模拟的“游乐场”，在那里，被称为“unimals”（通用动物的缩写，发音为“yoo-nimals”）的类节肢动物智能体学习并受到突变和自然选择的影响。

每个环境的模拟都从576个独特的unimals开始，它们由一个“球体”（头部）和一个“身体”组成，该“身体”由不同数量以各种方式排列的圆柱形肢体组成。每个unimal都以相同的方式感知世界，并以相同的神经架构和学习算法开始。换句话说，所有unimals都以相同的智能水平开始了他们的虚拟生活——只是他们的身体形状不同。

在学习阶段中，Unimal必须在多变的地形上将一个块状物移动到目标位置，地形有不同难度——平坦的地形、块状山脊、阶梯或光滑的山丘。

该团队采用一种锦标赛式的达尔文进化方案，在相同的环境/任务组合中接受过训练的每个unimal都与其他三个unimal一起参加比赛，获胜者被选中产生一个单一的后代。该后代在面临与其父母相同的任务之前，都要经历涉及肢体或关节变化的单一突变。所有的unimals（包括获胜者）都参加了多次比赛，只有随着新后代的出现才会老化。

在训练了4000种不同的形态后，研究人员结束了模拟。那时，每个环境幸存下来的unimal平均经历了10代进化，成功的形态多种多样，包括两足动物、三足动物和四足动物，有或没有手臂。

在每个环境中完成3次这样的进化（训练4000种不同的形态）后，研究团队再从每个环境中选择前10名表现最佳的动物，并从头开始训练它们执行八项全新任务，例如绕过障碍物、操纵球或推动一个盒子向上倾斜。

最后发现，在变化地形中的unimal进化地比平坦地形中的更好，在变化地形中操纵盒子的unimal表现最好。进化10代以后，最成功的unimal在形态上已经适应得非常好，他们学习同样任务的时间是最早一代的一半。

这也与美国心理学家詹姆斯·马克·鲍德温 (James Mark Ba??ldwin) 在19世纪后期提出的假设一致，他推测学习具有适应性优势（adaptive advantage）事物的能力可以通过达尔文的自然选择传递下去。Gupta解释，“自然会选择能更快地获得优势行为的身体变化”。

由于在更复杂环境中进化的智能体可以更快更好地学习新任务，Gupta和他的同事认为，允许模拟实体智能体（embodied agent）在日益复杂的环境中进化将为开发在现实世界中执行多项任务的机器人提供启示。

Gupta说，“人类不一定知道如何为奇怪的任务设计机器人身体，例如爬过核反应堆提取废物，地震后提供救灾，引导纳米机器人在人体内运动，包括做洗碗或折叠衣物等家务。也许唯一的出路是让进化来设计这些机器人。”

在面对这项研究将会如何具体帮助这些任务的实现的疑问，Gupta向澎湃新闻表示，“另一个看待此项研究的方式不再是创造了智能算法（intelligent algorithms），而是你可以有正确的物理形式，从而轻松完成手头的任务。从这个意义上说，理论上你可以优化折叠衣服的机器人的形式。”

对于下一步的研究计划，Gupta透露，当前的工作几乎只涉及了表面，现在的模拟环境和学习行为都还非常简单，“我们希望能扩大范围，同时，将现在的一个智能体扩展成多个智能体也是一个有趣的方向。”

来源：科学网

计算机科学新版尾.png