波士顿动力近期的一项技术革新引发了广泛关注:其研发的Atlas机器人已升级至全新的端到端AI版本,即Atlas MTS。这一突破性进展由波士顿动力携手丰田研究院共同推出,基于大型行为模型(LBM),赋予了Atlas前所未有的智能水平。
在最新的演示视频中,Atlas展现出了惊人的能力。当操作员故意合上箱子盖子或移动箱子位置时,Atlas不仅能迅速识别这些变化,还能自主规划动作,精准地打开箱子或找到新的位置。更令人赞叹的是,即便面对附近遗漏的装置,它也能准确发现并将其放入箱内。这一系列流畅的操作,展示了Atlas在自然语言理解、环境感知以及动作规划方面的卓越表现。
据官方介绍,Atlas MTS的实现得益于端到端的语言条件策略。这一策略通过四个关键步骤构建而成:收集具身行为数据、处理并标注数据、训练神经网络以及利用测试任务评估策略效果。尤为此次采用的大型行为模型融合了4.5亿参数的扩散Transformer模型,结合流匹配目标,能够将图像、人体感觉以及自然语言指令等输入信息转化为控制Atlas活动的精确动作指令。
Transformer模型在此扮演了“全局之眼”的角色,负责把控整体架构与动作细节的关联;扩散过程则负责将模糊的指令细化为精准的动作;而流匹配损失则确保了动作既符合现实情况,又能灵活适应多样化的场景。波士顿动力还将Atlas的模型预测控制器与VR界面相结合,从而覆盖了从精细的手指操作到全身伸展、移动等各类任务需求,使得远程操作员能够充分发挥机器人的性能。
值得注意的是,此次升级后的Atlas还具备了自主处理意外情况的能力。当遇到零件掉落或箱盖未关闭等问题时,它能够智能地做出反应,这一特性无疑为Atlas的实用性增添了重要的一笔。更令人惊喜的是,官方声称Atlas能够学习并模仿人类演示的任何动作,包括系绳子、折叠椅子和翻轮胎等复杂任务,其学习能力之强令人叹为观止。
回顾波士顿动力的研发历程,液压版Atlas的退役与全电动版本的迅速推出标志着其技术路线的重大转变。液压系统因成本高、响应慢且难以与AI系统集成而被逐渐淘汰,取而代之的是更为精确、能耗低且天然适配AI学习框架的电机驱动。自转向电驱动以来,波士顿动力不断推出新技术,从俯卧撑展示到全自动分装物件,再到具备3D空间感知和实时物体追踪能力的工业任务执行,每一次升级都让人眼前一亮。
此次大型行为模型的引入,不仅意味着波士顿动力在技术上迈出了重要一步,也预示着电驱机器人与AI算法融合的未来趋势。在国内市场,同样采用电驱技术的宇树机器人也展现出了强劲的发展势头,从四足机器狗到人形机器人系列,宇树以其“小而美”的电驱哲学和快速的迭代速度,在全球范围内赢得了广泛关注。