近日,游戏界迎来了一场关于人工智能(AI)技术的重大曝光。据外媒报道,一份由未透露身份的提供者分享的索尼内部视频,意外揭示了PlayStation团队正致力于开发《地平线:西之绝境》女主角埃洛伊的AI驱动版本,这一消息迅速引起了业界的广泛关注。
在这段一分钟的演示视频中,玩家能够通过语音指令与游戏内的非玩家角色(NPC)埃洛伊进行实时对话。索尼互娱软件工程总监Sharwin Raghoebardajal亲自解说,展示了这一前沿技术的突破性成果。埃洛伊不仅能够理解玩家的语音提问,还能通过合成语音和动态的面部表情,给予即时的回应。
技术展示:角色与玩家实时对话,并做出相应的嘴型和表情回应
值得注意的是,这一原型系统已经成功融入了《地平线:西之绝境》的实际游戏场景中。然而,索尼方面强调,这仅仅是与Guerrilla Games合作开发的内部技术验证演示,目前还处于原型阶段。
在技术架构方面,索尼采用了“语音识别-智能决策-语音合成-面部渲染”的四步走方案。首先,利用OpenAI的Whisper技术将玩家的语音转换为文字,然后调用GPT-4和Llama3双引擎进行决策和对话内容的生成。接着,通过索尼自研的情感语音系统(EVS)输出逼真的声线,最后通过Mockingbird技术将音频实时转化为角色的面部动画。
尽管这次演示是在PC上进行的,但据透露,该技术已经在PS5主机上完成了适配测试,并且额外的运行效能损耗几乎可以忽略不计。索尼首次在内部展示这一技术是在一年前,并在去年的东京索尼技术交流展(STEF)上展示了更新版本。
索尼表示,这次演示仅仅是探索可能性的冰山一角,因为这项技术对于游戏的实际意义还在研究之中。例如,如果玩家在《地平线:西之绝境》中扮演的就是埃洛伊,那么与她对话的意义何在?或许,当玩家对着PS5喊出“埃洛伊,谈谈我们的使命”时,得到的不再是预设的台词,而是由大语言模型生成的独特回应。这引发了业界对于游戏NPC“意识”的规划、配音演员未来角色的深思。
除了索尼之外,其他大厂也在AI领域有所投入。英伟达推出的ACE技术同样支持玩家与NPC的自由对话,而微软也与Inworld AI联手,打造Xbox生态的生成式AI角色系统,并自研Muse AI模型,以辅助开发者快速构建游戏场景进行原型设计和构思。
英伟达ACE技术展示
随着游戏行业裁员潮的持续,AI技术的迅猛发展加剧了从业者的担忧。2024年游戏开发者大会(GDC)的一项调查报告显示,49%的受访者表示其工作场所正在使用生成式AI工具,31%的受访者表示其个人也正在使用相关技术。而此次索尼技术泄露正值GDC大会前夕,预计将在大会期间引发更多的相关技术讨论。