近日,一则关于索尼PlayStation团队正在开发《地平线:西之绝境》女主角埃洛伊AI驱动版本的爆料,在游戏圈内引起了广泛关注。这一消息源自外媒The Verge获得的一份匿名提供的内部视频。
在这段时长1分钟的演示视频中,玩家可以通过语音指令与游戏中的NPC(非玩家角色)进行实时对话。视频中,索尼互娱软件工程总监Sharwin Raghoebardajal亲自解说,展示了这一基于AI技术驱动的埃洛伊,不仅能够理解玩家的语音提问,还能通过合成语音和动态面部表情给予即时回应。
从技术展示中可以看出,这一AI角色在与玩家对话时,能够做出相应的嘴型和表情回应,显得栩栩如生。值得注意的是,该原型系统已经实现了与《地平线:西之绝境》实际游戏场景的融合。然而,索尼方面强调,这仅仅是与Guerrilla Games合作开发的原型内部技术验证演示。
据透露,索尼在开发这一技术时,采用了“语音识别-智能决策-语音合成-面部渲染”的四步走方案。首先,通过OpenAI的Whisper技术将玩家语音转为文字,然后调用GPT-4和Llama3双引擎进行决策和生成对话内容。接着,通过自研的情感语音系统(EVS)输出拟真声线,最终通过自研的Mockingbird技术将音频实时转化为角色面部动画。
尽管这次演示是在PC上运行的,但据索尼透露,该技术已经在PS5主机上完成了适配测试,且额外的运行效能损耗几乎可以忽略不计。事实上,索尼首次在内部展示这一技术是在一年前,并在去年的东京索尼技术交流展(STEF)上展示了更新版本。
这一技术的曝光,无疑引发了业界对AI技术颠覆传统游戏交互模式的关注。随着游戏行业的发展,AI技术正在逐渐改变游戏的面貌。除了索尼之外,一些大厂也在AI领域有所投入。例如,英伟达推出的ACE技术同样支持玩家与NPC自由对话,而微软也与Inworld AI联手,打造Xbox生态的生成式AI角色系统。
然而,AI技术的突飞猛进也加剧了游戏从业者的担忧。随着游戏行业裁员潮的持续,许多从业者开始担心AI技术会取代他们的工作。据2024年游戏开发者大会(GDC)的一项调查报告显示,49%的受访者表示其工作场所正在使用生成式AI工具,31%的受访者表示其个人也正在使用相关技术。
此次索尼技术泄露正值GDC大会前夕,无疑将在大会期间引发更多的相关技术讨论。尽管索尼对泄露视频保持沉默,但其版权代理已迅速下架了泄露视频。然而,这一事件已经引起了业界的广泛关注,AI技术在游戏领域的应用前景也成为了热议的话题。