近日,游戏界迎来了一场技术风暴,源自一份由匿名者泄露给外媒The Verge的索尼内部视频。该视频揭示了一个惊人的消息:PlayStation团队正致力于开发《地平线:西之绝境》中女主角埃洛伊的AI驱动版本,这一创新技术演示彻底颠覆了传统游戏交互模式的认知。
在这段一分钟的演示视频中,玩家可以通过语音指令与NPC进行实时对话,展现了AI技术在游戏领域的巨大潜力。视频中,索尼互娱软件工程总监Sharwin Raghoebardajal亲自上阵解说,他不仅是PlayStation Studios前沿技术部门的掌舵人,还亲自展示了这一突破性成果。基于AI技术的埃洛伊,不仅能理解玩家的语音提问,还能通过合成语音和生动的面部表情给予即时回应。
从技术展示来看,角色与玩家的对话流畅自然,嘴型和表情的同步效果令人惊叹。值得注意的是,这一原型系统已经成功融入了《地平线:西之绝境》的实际游戏场景中,尽管索尼方面强调,这仅仅是一个与Guerrilla Games合作开发的内部技术验证演示。
关于这项技术背后的架构,索尼采用了“语音识别-智能决策-语音合成-面部渲染”的四步方案。首先,通过OpenAI的Whisper技术将玩家语音转换为文字,然后利用GPT-4和Llama3双引擎进行决策和对话内容的生成。接下来,通过自研的情感语音系统(EVS)输出逼真的声线,最后通过Mockingbird技术将音频实时转化为角色的面部动画。这一整套流程不仅高效,而且实现了高度的真实感。
尽管这次演示是在PC上进行的,但据透露,该技术已经在PS5主机上完成了适配测试,且额外的运行效能损耗几乎可以忽略不计。索尼首次在内部展示这项技术是在一年前,而在去年的东京索尼技术交流展(STEF)上,他们又展示了更新版本的技术。
索尼方面表示,这次演示只是探索可能性的冰山一角,因为这项技术对于游戏的实际意义仍在深入研究中。例如,当玩家在《地平线:西之绝境》中扮演埃洛伊时,与她对话的意义何在?或许,未来的游戏中,玩家对着PS5喊出“埃洛伊,谈谈我们的使命”时,将不再听到预设的台词,而是由大语言模型生成的独特回应。这样的NPC仿佛学会了“思考”,这无疑给游戏开发者带来了新的挑战和机遇,同时也引发了关于NPC“意识”规划的讨论。
除了索尼,其他大厂也在AI领域积极布局。英伟达推出的ACE技术同样支持玩家与NPC的自由对话,其与Inworld AI合作的《Covert Protocol》曾多次进行可玩演示。微软也与Inworld AI联手,打造Xbox生态的生成式AI角色系统,并自研Muse AI模型,帮助开发者快速构建游戏场景,进行原型设计和构思。
随着游戏行业裁员潮的持续,AI技术的迅猛发展加剧了从业者的担忧。2024年游戏开发者大会(GDC)的一项调查报告显示,49%的受访者表示其工作场所正在使用生成式AI工具,31%的受访者表示个人也在使用相关技术。此次索尼技术泄露正值GDC大会前夕,无疑将在大会上引发更多关于相关技术的讨论。尽管索尼对泄露视频保持沉默,但版权代理已迅速下架了泄露内容。