智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即

   时间:2025-03-10 21:14 来源:天脉网作者:江紫萱

近日,智元机器人在科技创新领域迈出了重要一步,正式发布其首款通用具身基座模型——智元启元大模型Genie Operator-1(简称GO-1)。这一突破性成果标志着机器人技术向更加智能化、通用化的方向迈出了坚实的一步。

GO-1的核心在于其创新的Vision-Language-Latent-Action(ViLLA)框架,该框架巧妙融合了VLM(多模态大模型)与MoE(混合专家)技术。VLM作为模型的主干网络,基于大规模互联网文本和图文数据训练,赋予了GO-1强大的场景感知与理解能力。而MoE则通过隐动作专家模型和动作专家模型,利用人类操作和跨本体操作视频以及高质量仿真和真机数据,使GO-1能够理解和执行复杂的动作。

GO-1展现了多项显著优势。首先,其采训推一体化设计,确保了数据采集、模型训练和推理的无缝衔接,极大地提升了效率。其次,GO-1具备小样本快速泛化能力,能够在极少数据甚至零样本的情况下,快速适应新场景和新任务。“一脑多形”的特性让GO-1能够轻松迁移至不同形态的机器人,实现跨本体应用。持续进化的能力则得益于智元的数据回流系统,使GO-1能够从实际执行中遇到的问题数据中不断学习进步。最后,GO-1还能通过人类视频学习,增强对人类行为的理解。

GO-1的构建基于具身领域的数字金字塔模型,从底层的互联网大规模纯文本与图文数据,到人类操作/跨本体视频、仿真数据,再到顶层的真机示教数据,形成了一个全面的知识体系。这一体系使GO-1能够接受全面的“基础教育”和“能力培训”,从而轻松应对各种环境和物体,快速学习新的操作技能。

在实际应用中,GO-1展现了出色的表现。用户只需通过自然语言指令,如“挂衣服”,GO-1就能根据所见的画面、学习过的数据和知识,拆解并执行任务。无论是家庭场景中的倒水、烤吐司,还是商业活动中的检票、发放物料,GO-1都能迅速响应并完成。在商务会议中,面对“帮我拿一瓶饮料”等指令,GO-1同样能够迅速执行,展现了其强大的指令泛化能力。

GO-1的持续进化能力同样令人瞩目。例如,当机器人在制作咖啡时不慎将杯子放歪,它能够从这一错误中学习,并在后续任务中避免类似问题,直至成功完成任务。这种不断学习和进步的能力,使GO-1在实际应用中更加可靠和高效。

智元机器人的GO-1无疑为具身智能的发展注入了新的活力。它不仅解决了具身智能在场景和物体泛化、语言理解、新技能学习以及跨本体部署等方面的难题,还为机器人走向更多场景、适应多变真实世界提供了强大的支持。随着技术的不断进步和应用场景的拓展,GO-1有望成为未来机器人领域的重要基石。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报