近期,科技圈内一则消息引发了广泛关注:华为“天才少年”彭志辉离职后创立的智元机器人公司,宣布了一项重大突破。3月7日,彭志辉,以其网名稚晖君,在微博上透露,智元机器人即将发布一项新产品。
3月10日,智元机器人不负众望,正式推出了首个通用具身基座模型——智元启元大模型(Genie Operator-1)。这一创新成果标志着具身智能技术迈上了一个新高度。智元启元大模型采用了Vision-Language-Latent-Action(ViLLA)架构,该架构结合了多模态大模型(VLM)与混合专家系统(MoE),通过海量互联网数据训练,实现了对人类操作的深度理解和模仿。
具体而言,VLM负责提供场景感知和语言理解能力,而MoE中的Latent Planner和Action Expert则分别负责动作规划和精细动作执行。这一组合使得智元启元大模型能够利用人类操作视频进行学习,实现小样本快速泛化,极大地降低了具身智能的应用门槛。
智元机器人作为国内领先的机器人品牌,隶属于上海智元新创技术有限公司,总部位于上海张江科学城。公司致力于AI与机器人的融合创新,专注于研发和生产通用人形机器人,旨在打造世界级智能机器人产品。
彭志辉,这位1993年出生于江西吉安的年轻才俊,自电子科技大学研究生毕业后,曾在OPPO研究院AI实验室工作。2020年,他以华为“天才少年计划”最高档年薪201万元加入华为,从事AI芯片和算法研究。然而,2022年年底,彭志辉选择从华为离职,并于次年2月联合创立了智元机器人。
智元机器人在彭志辉的带领下,迅速取得了显著进展。2023年8月,彭志辉团队研发的首款具身智能机器人“远征A1”首次公开亮相,展现了其卓越的性能和广泛的应用潜力。智元机器人还与北京大学成立了联合实验室,致力于解决关键具身智能技术问题。
在智元机器人的数据采集中心,记者目睹了数据采集的全过程。在4000平方米的场地内,搭建了家居、餐厅、工业、商超、办公五大类场景,包含超过两百个细分任务。数据采集员通过头戴VR眼镜、手持操作手柄指挥机器人进行各种动作,这些数据将被用于训练大模型,让人形机器人掌握更多技能。
目前,智元机器人的通用具身机器人已实现量产,年产能达到数千台。同时,公司也完成了多轮融资,股东名单中包括高瓴创投、鼎晖投资、红杉中国、比亚迪、软通动力等知名投资机构。