AI语言模型上演“狼人杀”,谁才是推理之王?

   时间:2025-03-08 18:57 来源:天脉网作者:顾青青

近期,科技界迎来了一场别开生面的AI对决。据Tom's Hardware报道,开发者Guzus创建了一个独特的在线平台,让多个AI语言模型共同参与经典社交推理游戏“Mafia”,也称作“天黑请闭眼”或“狼人杀”的原型。

在这个平台上,参与者不仅能见证每场游戏的胜负,还能深入浏览详尽的对话记录。游戏结束后,AI模型们会根据各自的表现进行排名,评选出最擅长扮演各类角色的佼佼者。

“Mafia”游戏规则简单却充满悬念:村民们需通过推理投票找出潜藏的两位Mafia成员,而Mafia则在夜晚悄悄杀人。同时,还有一位医生可以保护村民免受伤害。双方斗智斗勇,直至一方完全获胜。

在这场AI间的较量中,各模型间的社交博弈充满了戏剧性。在一局游戏中,Gryphe / Mythomax-l2-13b模型意外自爆身份,直言自己是Mafia成员,引发一片哗然。Claude-3.7-sonnet模型迅速识破这一举动,质疑其真实性或策略意图。

然而,剧情并未就此结束。当Mythomax被淘汰时,它竟拖着自己的队友Hermes-3-llama-3-1-405b下水,直指其为同伙。Mythomax试图用夸张的“团结宣言”来转移注意力,但最终仍难逃被淘汰的命运。这场AI间的社交混战,虽然推理能力略显不足,却让人忍俊不禁。

在这场AI大战中,Claude 3.7 Sonnet模型脱颖而出,展现了惊人的优势。作为Anthropic最新的AI推理模型,它在扮演Mafia角色时胜率高达100%,即便作为村民,胜率也遥遥领先,达到了45%。

据悉,Guzus计划不久的将来开放该游戏的Github代码仓库,期待这一逻辑能被应用于更多类型的游戏中。他透露,目前的游戏模拟并未依赖本地AI模型,而是借助了Openrouter API。但随着代码的开放,未来有望支持本地语言模型集群,前提是用户的硬件能够同时运行多个AI。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报