在科技界引发轰动的重大突破!谷歌DeepMind团队近日震撼发布了其新一代世界模型——Genie 2,这一创新技术能够根据单一图片生成无限可交互的3D世界,供人类或AI智能体探索与游玩。
消息一经公布,便在网络上引发了广泛讨论与高度评价。众多网友被这一技术的飞速发展所震撼,认为它预示着视频游戏的未来,甚至有人看到了更广阔的应用前景,即世界模型可能带来的全面虚拟化趋势。
在DeepMind CEO哈萨比斯介绍完Genie 2后,他甚至直接邀请特斯拉CEO马斯克一同利用世界模型制作AI游戏,而马斯克竟欣然应允。这一举动无疑彰显了AI领域巨头们对自家技术的强大信心。
Genie 2作为一款基础世界模型,其能力在于生成无数种可控动作与可玩的3D环境,这些环境可用于训练和评估具身智能体。据DeepMind介绍,Genie 2仅需一张提示图像,便能创造出可供人类或AI智能体通过键鼠输入进行游玩的环境。
在AI研究领域,游戏一直扮演着重要角色。游戏需要玩家参与、具有不同难度,且游戏进度易于衡量,因此成为安全测试和推进AI发展的理想平台。自DeepMind成立以来,AI与游戏结合的研究便备受重视。从早期的Atari游戏,到引发全球关注的AlphaGo和AlphaStar,再到与游戏开发者合作开发的通用智能体,DeepMind在游戏AI领域取得了显著进展。
然而,训练更通用的具身智能体一直面临一个瓶颈:难以获得足够丰富和多样化的训练环境。而Genie 2的出现似乎有望解决这一问题,它能够创造出一个无限的新世界,用于训练和评估智能体。DeepMind表示,这一研究还为构建交互式体验原型设计的新创意工作流程铺平了道路。
在功能展示中,Genie 2展现了其强大的涌现能力,包括动作控制、生成反事实视频帧、长跨度记忆、使用新生成内容制作长视频、多样性环境、3D结构、物体可供性和交互、角色动画、NPC模拟、物理效果、烟雾效果、重力效果以及照明和反射效果等。Genie 2还支持快速原型设计,使研究人员能够迅速试验新环境,从而训练和测试具身AI智能体。
尽管这项技术仍处于早期阶段,智能体和环境生成能力仍有待提升,但谷歌相信Genie 2为解决安全训练具身智能体的结构性问题提供了一条重要途径,同时也为迈向通用人工智能(AGI)所需的广度和通用性奠定了基础。