智元机器人发布通用基座大模型GO-1,新人形机器人亮相在即

   时间:2025-03-11 00:03 来源:天脉网作者:柳晴雪

在机器人技术的前沿探索中,一款名为智元启元大模型Genie Operator-1(GO-1)的通用具身基座模型于近日正式发布,标志着机器人智能化进程中的一大突破。

GO-1由智元机器人公司倾力打造,其核心在于创新的Vision-Language-Latent-Action(ViLLA)框架。这一框架融合了VLM(多模态大模型)与MoE(混合专家)技术,不仅实现了数据采集、模型训练与推理的一体化流程,更赋予了机器人小样本快速泛化、跨本体应用及持续进化的能力。

VLM作为GO-1的主干网络,继承了开源多模态大模型的权重,并通过互联网大规模文本与图文数据的学习,使机器人具备了广泛的场景感知与理解能力。而MoE中的隐动作专家模型与动作专家模型,则分别通过人类操作视频与高质量仿真、真机数据的训练,赋予了机器人动作理解与精细执行的能力。

GO-1的五大特性尤为引人注目:采训推一体的无缝衔接、小样本快速泛化的强大能力、一脑多形的跨本体适应性、持续进化的学习机制以及人类视频学习的独特方式。这些特性共同构成了GO-1在机器人领域的核心竞争力。

在知识数据吸纳方面,GO-1基于具身领域的数字金字塔构建,从底层的大规模纯文本与图文数据,到人类操作视频、仿真数据,再到顶层的真机示教数据,形成了一个完整的知识体系。这使得GO-1能够轻松应对多样化的环境与物体,快速学习并执行新操作。

ViLLA框架的引入,更是让GO-1实现了从多相机视觉信号与人类语言指令到机器人动作执行的无缝对接。与Vision-Language-Action(VLA)模型相比,ViLLA通过预测隐式动作标记,有效弥补了图像-文本输入与机器人执行动作之间的鸿沟。例如,当用户以自然语言向机器人发出“挂衣服”的指令时,GO-1能够迅速理解指令含义,拆解任务步骤,并精准完成整个挂衣过程。

GO-1的应用场景极为广泛。从家庭场景中的准备餐食、收拾桌面,到办公和商业场景中的接待访客、发放物品,再到工业等其他领域的操作任务,GO-1都能迅速适应并高效完成。GO-1还具备持续进化的能力,能够从实际执行中遇到的问题数据中不断学习,直至成功完成任务。

GO-1的发布,无疑为机器人技术的未来发展注入了新的活力。它不仅解决了具身智能在场景与物体泛化、语言理解、新技能学习及跨本体部署等方面的难题,更为机器人走向更多场景、适应多变真实世界提供了强有力的支持。随着技术的不断进步和应用场景的不断拓展,GO-1有望成为未来机器人领域的明星产品。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报