大语言模型+ROS:新系统使机器人能将自然语言转化为物理动作

发布日期:2026-04-07     浏览:10    

机器人现在能够借助一种新型AI框架,将日常语言指令实时转化为物理动作。该框架由华为诺亚方舟实验室、达姆施塔特工业大学和苏黎世联邦理工学院的研究人员联合开发,首次将大语言模型与机器人操作系统(ROS)深度集成,使机器无需为每个任务单独编程即可理解并执行自然语言指令。

研究团队在发表于《自然·机器智能》的论文中指出:“能够将自然语言指令转化为可靠物理动作的自主机器人,仍是人工智能领域的核心挑战。我们证明,将大语言模型智能体连接到ROS,可以构建一个灵活的具身智能框架,并将完整实现以开源代码形式公开发布。”

该系统的核心在于将大语言模型的推理能力与ROS这一广泛使用的开源机器人控制平台相结合。系统能够将“拿起绿色积木,放到黑色架子上”这样的指令拆解为一系列可执行的步骤,并自动生成控制代码或行为树。行为树是一种结构化决策路径,能够在某一步骤失败时帮助机器人动态调整策略。

研究团队介绍,系统支持两种执行模式:一是生成直接控制机器人的小型代码片段,二是构建行为树以应对复杂任务和环境变化。这种双模式设计提升了机器人的灵活性与鲁棒性。实验表明,该系统在长时序任务、桌面物体重排、动态任务优化及远程监督控制等多样化场景中均表现出良好的可扩展性和适应性。

值得注意的是,所有实验结果均基于开源预训练大语言模型,未使用专有模型。系统还支持通过人类或环境反馈进行自动优化与反思式学习,使机器人能够持续改进动作执行效率,无需频繁重新编程。

研究人员表示,该框架将语言理解与物理执行相连接,有望加速机器人在家庭、工作场所和公共空间等动态环境中的部署。下一步工作将聚焦于扩展系统处理更复杂任务的能力,并适配更多类型的机器人平台。目前,完整代码已开源发布,供全球开发者使用。