近日,一则关于索尼PlayStation团队正在探索AI技术新边界的消息在游戏圈内引起了广泛关注。据外媒报道,一段由匿名人士泄露的内部视频展示了《地平线:西之绝境》女主角埃洛伊的AI驱动版本,该版本能够与玩家进行实时语音对话。
在这段一分钟的演示视频中,玩家通过语音指令与游戏内的NPC(非玩家角色)埃洛伊进行互动,而埃洛伊则能够即时回应,不仅理解玩家的语音提问,还能通过合成语音和动态的面部表情做出反应。这一突破性成果由索尼互娱软件工程总监Sharwin Raghoebardajal亲自解说,他负责掌管的PlayStation Studios前沿技术部门涵盖了AI、计算机视觉等多个领域。
从视频中可以看到,埃洛伊与玩家的对话流畅自然,面部表情与语音内容完美同步,仿佛真的在与玩家进行实时交流。据索尼透露,这一原型系统已经成功与《地平线:西之绝境》的实际游戏场景相融合,但目前仍处于内部技术验证阶段,是与Guerrilla Games合作开发的成果。
在技术架构方面,索尼采用了“语音识别-智能决策-语音合成-面部渲染”的四步走方案。首先,通过OpenAI的Whisper技术将玩家的语音转换为文字,然后调用GPT-4和Llama3双引擎进行决策和对话内容生成。接着,利用自研的情感语音系统(EVS)输出逼真的声线,最后通过自研的Mockingbird技术将音频实时转化为角色的面部动画。
值得注意的是,虽然这次演示是在PC上运行的,但索尼表示该技术已经在PS5主机上完成了适配测试,并且额外的运行效能损耗几乎可以忽略不计。据悉,索尼首次在内部展示这项技术是在一年前,并在去年的东京索尼技术交流展(STEF)上展示了更新版本。
索尼方面表示,这次演示只是探索可能性的冰山一角,因为这项技术对于游戏的实际意义还在研究中。例如,如果玩家在《地平线:西之绝境》中扮演的就是埃洛伊,那么与她对话的意义何在?当NPC学会“思考”,游戏开发者将如何规划它们的“意识”?这些问题都引发了业界和玩家的广泛讨论。
除了索尼之外,英伟达和微软等大厂也在AI领域有所投入。英伟达推出的ACE技术同样支持玩家与NPC自由对话,而微软则与Inworld AI联手打造Xbox生态的生成式AI角色系统,并自研Muse AI模型以辅助开发者快速构建游戏场景。
随着AI技术的突飞猛进,游戏行业正面临着前所未有的变革。一方面,AI技术的应用为游戏带来了更加真实、自然的交互体验;另一方面,也引发了从业者对于就业前景的担忧。据2024年游戏开发者大会(GDC)的一项调查报告显示,近半数的受访者表示其工作场所正在使用生成式AI工具。
此次索尼技术泄露正值GDC大会前夕,无疑将在大会期间引发更多的相关技术讨论。尽管索尼方面对泄露视频保持沉默,并迅速下架了相关视频,但这一事件已经引起了业界的广泛关注。