AI宝可梦探险:Claude 3.7 Sonnet 在 Twitch 上的缓慢征途

   时间:2025-02-26 23:55 来源:天脉网作者:朱天宇

在周二下午的Twitch平台上,一场别开生面的直播吸引了大量观众的目光——Anthropic公司推出的“Claude玩宝可梦”直播活动。此次直播中,Claude 3.7 Sonnet,这一最新的AI模型,在《宝可梦红版》的世界中展开了一场引人入胜的探险。

一直以来,AI研究人员喜欢利用各类视频游戏作为新模型的测试平台,从《街头霸王》到《你画我猜》应有尽有。然而,这些尝试更多是为了增添趣味性,而非追求实用性。Anthropic公司却另辟蹊径,他们发现《宝可梦》系列游戏成为了Claude 3.7 Sonnet的有效试炼场,该模型在游戏中展现出了卓越的“思考”能力。

Claude 3.7 Sonnet与OpenAI的o3-mini和DeepSeek的R1有着相似之处,它们都能够通过“推理”来应对复杂的挑战,即便是专为儿童设计的电子游戏也不例外。尽管其前身Claude 3.5 Sonnet在游戏初始阶段就遭遇了挫折,连真新镇的家门都未能走出,但Claude 3.7 Sonnet却已经成功获得了三枚道馆徽章,展现了显著的进步。

然而,即便是新版Claude也未能一帆风顺。在直播进行数小时后,模型被一堵岩石墙阻挡了前进的道路,无论如何尝试都无法穿越。这一场景引发了观众们的热议,一位Twitch用户幽默地评论道:“到底是投入了数千小时编程的AI能够胜出,还是一堵简单的石墙更胜一筹?”幸运的是,Claude最终找到了绕过岩石墙的方法。

观看Claude像呆呆兽一样缓慢探索《宝可梦红版》的世界,每一步都显得深思熟虑,确实让不少观众感到焦急。但与此同时,这个过程也极具吸引力。直播画面巧妙地将Claude的“思考过程”展示在左侧,而右侧则是实时的游戏画面,让观众能够直观地感受到AI的决策过程。

在直播过程中,Claude曾试图在大木博士的实验室里找到博士本人,但却因场景中的其他NPC而感到困惑。它写道:“我注意到下方出现了一个新角色——一个黑发穿白大褂的角色,位于坐标(2, 10),这可能是大木博士!让我下去和他谈谈。”然而,Claude却错误地与一个已经交谈过多次的NPC进行了对话,而非博士本人。这一失误引发了Twitch聊天室内观众们的热议,但那些长期观看的观众则显得相对淡定。

“大家别急,”一位观众在聊天室内写道,“我们之前已经进出大木博士的实验室十几次了,才搞清楚该怎么继续。”

对于资深Twitch用户而言,Anthropic的这次直播格式或许勾起了他们的回忆。十多年前,一场名为“Twitch玩宝可梦”的在线社交实验曾风靡一时,数百万观众共同参与《宝可梦红版》的游玩。每个用户都可以通过Twitch聊天来控制角色,这一创新性的尝试自然导致了游戏过程的混乱与趣味并存。

事实上,“Twitch玩宝可梦”这一活动也启发了不少AI研究人员的工作。例如,西雅图软件工程师Peter Whidden曾在2023年10月发布了一段YouTube视频,详细介绍了他如何训练强化学习算法来玩宝可梦。他的AI花费了超过50,000小时才学会成功游玩这款游戏,其中一个显著的挑战是AI更倾向于欣赏像素化的游戏场景,而非专注于游戏本身。

如今,像Whidden和Anthropic这样的AI驱动的“Twitch玩宝可梦”重现虽然趣味十足,但也让人不禁感到一丝惆怅。原版直播之所以成为Twitch历史上的重要时刻,是因为它以一种意想不到的方式将人们紧密地联系在一起。大家仿佛成为了同一个团队,共同努力克服游戏中的难题,推动游戏进程。

然而,时至今日,我们似乎已经从昔日的队友变成了旁观者,静静地观看着AI模型尝试玩一个我们许多人在童年时期就已经熟练掌握的游戏。这一现象不仅反映了AI技术的飞速发展,也折射出一个更大的趋势:我们的在线体验正逐渐从共享的群体活动转变为更加孤独的个人行为。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报