智元机器人发布通用基座大模型GO-1,新人形机器人即将亮相!

   时间:2025-03-10 19:25 来源:天脉网作者:沈如风

在机器人技术的前沿探索中,一款革命性的新产品近日震撼发布。智元机器人公司推出了其首个通用具身基座模型——智元启元大模型Genie Operator-1(简称GO-1),这一创新成果标志着机器人在理解和执行人类指令方面迈出了重要一步。

GO-1的核心在于其创新的Vision-Language-Latent-Action(ViLLA)框架,该框架由多模态大模型VLM与混合专家MoE组成。这一组合使得GO-1不仅具备了强大的场景感知和理解能力,还能通过隐式规划器和动作预测器,实现动作的精细执行。VLM利用互联网上的大规模纯文本和图文数据,使机器人能够广泛理解通用知识和场景;而MoE则通过大规模人类操作和跨本体操作视频,以及高质量的仿真和真机数据,赋予机器人动作的理解和执行能力。

GO-1的发布,展现了其五大显著优势:采训推一体化,确保了数据采集、模型训练和模型推理的无缝衔接;小样本快速泛化,使机器人能够在极少数据甚至零样本的情况下,快速适应新场景和新任务;一脑多形,意味着GO-1可以作为一个通用机器人策略模型,轻松迁移至不同机器人形态;持续进化,通过智元的数据回流系统,机器人能够不断从实际执行中遇到的问题数据中学习进化;人类视频学习,使机器人能够结合互联网视频和真实人类示范,增强对人类行为的理解。

GO-1的构建基于具身领域的数字金字塔,从底层的大规模纯文本与图文数据,到人类操作/跨本体视频,再到仿真数据和真机示教数据,形成了全面而深入的知识体系。这使得GO-1能够轻松面对多种多样的环境和物体,快速学习新的操作。例如,当用户以日常对话的方式向机器人发出“挂衣服”的指令时,GO-1能够准确理解指令含义,通过学习过的人类操作视频和仿真数据,知道挂衣服的步骤和对应物体,最终精准完成整个任务。

在实际应用中,GO-1展现了其广泛的适用性。从家庭场景中的准备餐食、收拾桌面,到办公和商业场景中的接待访客、发放物品,再到工业等更多场景的其他操作任务,GO-1都能迅速适应并高效完成。在商务会议中,面对人类发出的“帮我拿一瓶饮料”或“帮我拿一个苹果”的语音指令,GO-1能够迅速响应,准确执行。

更令人印象深刻的是,GO-1具备持续进化的能力。通过数据回流系统,机器人能够不断从实际执行中遇到的问题中学习,从而不断提升其执行任务的准确性和效率。例如,当机器人在做咖啡时不小心把杯子放歪了,它就能从这次失败中学习,并在未来的任务中避免同样的错误。

GO-1的发布,无疑为机器人技术的发展注入了新的活力。它不仅解决了具身智能在场景和物体泛化、语言理解能力、新技能学习以及跨本体部署等方面的难题,更为机器人走向更多不同场景、适应多变的真实世界提供了可能。随着技术的不断进步和应用的不断深化,我们有理由相信,未来的机器人将更加智能、更加灵活,能够更好地服务于人类的生活和工作。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报