近期,全球科技巨头NVIDIA宣布了一系列创新技术,旨在推动人形机器人开发的突破性进展。NVIDIA创始人兼CEO黄仁勋在发布会上强调,通用机器人的时代已经拉开帷幕。借助全新的NVIDIA Isaac GR00T N1基础模型,以及革新的数据生成和机器人学习框架,全球机器人开发者正迈入人工智能时代的全新领域。
NVIDIA Isaac GR00T N1作为全球首个开源且可定制的基础模型,专门为人形机器人设计。该模型融合了具身推理和具身执行两大模块,受到人类认知原理的启发,采用了创新的双系统架构。系统1负责快速动作反应,基于人类演示数据和NVIDIA Omniverse平台生成的海量合成数据进行训练;系统2则专注于深度思考和决策制定,由视觉语言模型提供支持,能够规划行动路径。两个系统协同工作,将规划转化为精确、连续的机器人运动。
为了展示GR00T N1的实际应用潜力,NVIDIA与1X技术公司合作,通过NEO Gamma人形机器人展示了基于该模型构建的后训练策略在自主整理任务中的执行效果。这一合作不仅彰显了技术的落地价值,也为未来人形机器人的应用提供了无限可能。
在人形机器人开发过程中,大型、多样化且高质量的数据集至关重要,但获取成本高昂。NVIDIA提出了结合生成式AI(如扩散模型、神经辐射场等)与机器人学习的新思路,通过生成视频用于训练人形机器人具身大模型,为解决数据稀缺和训练成本高等问题开辟了新途径。
NVIDIA还推出了专为机器人开发构建的开源物理引擎Newton,以及个人AI超级计算机NVIDIA DGX Spark。这些工具将帮助开发者加速将GR00T N1的功能扩展到新机器人、任务和环境,大大降低了自定义编程的需求。
与此同时,国内科技企业也在人形机器人领域积极布局。索辰科技、海天瑞声、科大讯飞等企业纷纷推出相关技术和解决方案,共同推动人形机器人产业的发展。索辰科技专注于CAE核心技术的研究与开发,其机器人事业部致力于开发针对机器人行业的专业软件和解决方案。海天瑞声则提供全场景大模型数据解决方案服务,助力企业高效构建、训练和部署机器学习模型。
科大讯飞通过结合多模态大模型与具身智能,让人形机器人在复杂任务拆解、开放场景物体识别等方面取得显著提升。拓尔思则运用自然语言处理、深度学习等技术,为人形机器人提供自主学习和交互能力基础。中科创达、埃夫特、浪潮信息、利亚德等企业也在人形机器人操作系统、核心模组、算力支持、动作捕捉技术等方面发挥着重要作用。
随着国内外科技企业的共同努力,人形机器人领域正迎来前所未有的发展机遇。从NVIDIA的创新技术到国内企业的积极布局,人形机器人的未来充满了无限可能。