NYU研究颠覆认知:机器人灵巧操作训练,可预测性演示胜过复杂数据

发布日期:2026-06-08     浏览:10    

如何让机器人获得接近人类的灵巧操作能力,一直是机器人领域最具挑战性的课题。纽约大学坦登工程学院(NYU Tandon School of Engineering)与机器人与人工智能研究所(Robotics and AI Institute)的一项新研究发现,突破的关键或许不在于向机器人投喂更复杂的训练数据,而在于为它们提供更加一致、可预测的示范。这一发现可能显著改善机器人在涉及复杂手部动作、动态抓取和多肢体协调任务上的学习方式。

当前,许多机器人学习系统依赖模仿学习,通过复现人类操作来完成技能习得。然而,为高度灵巧的任务收集人类示范极其困难,因为传统的遥操作系统难以精准捕捉细微的手指运动和丰富的接触交互。为绕过这一瓶颈,研究者转向了运动规划算法,在物理仿真环境中自动生成虚拟示范,让机器人向由软件创建的示例学习。

研究团队很快发现了一个核心问题。被广泛使用的快速扩展随机树(RRT)算法生成的解在不同示范之间差异过大,导致机器人很难从这些高熵数据中辨识出应该模仿的行为模式。论文第一作者Huaijiang Zhu解释说:“这些规划器非常擅长找到解决方案,但每次解都大相径庭时,学习系统就难以理清该模仿什么行为。”这种随机性虽然在探索空间时具备优势,却显著削弱了模仿学习的效果。

为解决这一矛盾,团队开发了两种旨在产生更一致示范的规划方法:一种优先保障向目标状态的平稳推进,另一种则依赖预定义动作库来降低示范间的变异度。随后,研究者利用两项高难度操作任务对新方法进行了评估。第一项任务要求两个机械臂协同旋转一个大型圆柱体180度,并在此过程中反复调整抓取姿态;第二项任务则要求一只灵巧手机器人在手掌内转动方块,以匹配不同朝向。

结果显示,使用一致性更高的示范进行训练后,机器人的成功率远超基于标准RRT数据训练的对照组。在双臂协同任务中,仅用100个示范,系统便达到了近乎完美的表现;同样,在手掌内旋转方块的任务上,成功率也有大幅提升。更值得关注的是,这些在仿真中学到的策略被直接迁移到真实硬件上后,无须任何额外训练便实现了可靠的运行:双臂机器人在现实世界试验中成功率达90%,灵巧手完成了约62%的尝试。

这项工作凸显了机器人领域一个日益明确的趋势:传统运动规划与机器学习正走向深度融合。研究者不再将两者视为割裂的模块,而是让规划算法为学习系统生成高质量训练数据。这也为人工智能提供了一个更广泛的启示——更大的数据量并不总能带来更好的学习效果。在某些场景下,精心构建的示例比充满噪声或不一致的海量数据集更具价值。相关研究已发表于《IEEE Robotics and Automation Letters》。