AI宝可梦探险：Claude 3.7 Sonnet 在 Twitch 上的缓慢征途-天脉网

在周二下午的Twitch平台上，一场别开生面的直播吸引了大量观众的目光——Anthropic公司推出的“Claude玩宝可梦”直播活动。此次直播中，Claude 3.7 Sonnet，这一最新的AI模型，在《宝可梦红版》的世界中展开了一场引人入胜的探险。

一直以来，AI研究人员喜欢利用各类视频游戏作为新模型的测试平台，从《街头霸王》到《你画我猜》应有尽有。然而，这些尝试更多是为了增添趣味性，而非追求实用性。Anthropic公司却另辟蹊径，他们发现《宝可梦》系列游戏成为了Claude 3.7 Sonnet的有效试炼场，该模型在游戏中展现出了卓越的“思考”能力。

Claude 3.7 Sonnet与OpenAI的o3-mini和DeepSeek的R1有着相似之处，它们都能够通过“推理”来应对复杂的挑战，即便是专为儿童设计的电子游戏也不例外。尽管其前身Claude 3.5 Sonnet在游戏初始阶段就遭遇了挫折，连真新镇的家门都未能走出，但Claude 3.7 Sonnet却已经成功获得了三枚道馆徽章，展现了显著的进步。

然而，即便是新版Claude也未能一帆风顺。在直播进行数小时后，模型被一堵岩石墙阻挡了前进的道路，无论如何尝试都无法穿越。这一场景引发了观众们的热议，一位Twitch用户幽默地评论道：“到底是投入了数千小时编程的AI能够胜出，还是一堵简单的石墙更胜一筹？”幸运的是，Claude最终找到了绕过岩石墙的方法。

观看Claude像呆呆兽一样缓慢探索《宝可梦红版》的世界，每一步都显得深思熟虑，确实让不少观众感到焦急。但与此同时，这个过程也极具吸引力。直播画面巧妙地将Claude的“思考过程”展示在左侧，而右侧则是实时的游戏画面，让观众能够直观地感受到AI的决策过程。

在直播过程中，Claude曾试图在大木博士的实验室里找到博士本人，但却因场景中的其他NPC而感到困惑。它写道：“我注意到下方出现了一个新角色——一个黑发穿白大褂的角色，位于坐标(2, 10)，这可能是大木博士！让我下去和他谈谈。”然而，Claude却错误地与一个已经交谈过多次的NPC进行了对话，而非博士本人。这一失误引发了Twitch聊天室内观众们的热议，但那些长期观看的观众则显得相对淡定。

“大家别急，”一位观众在聊天室内写道，“我们之前已经进出大木博士的实验室十几次了，才搞清楚该怎么继续。”

对于资深Twitch用户而言，Anthropic的这次直播格式或许勾起了他们的回忆。十多年前，一场名为“Twitch玩宝可梦”的在线社交实验曾风靡一时，数百万观众共同参与《宝可梦红版》的游玩。每个用户都可以通过Twitch聊天来控制角色，这一创新性的尝试自然导致了游戏过程的混乱与趣味并存。

事实上，“Twitch玩宝可梦”这一活动也启发了不少AI研究人员的工作。例如，西雅图软件工程师Peter Whidden曾在2023年10月发布了一段YouTube视频，详细介绍了他如何训练强化学习算法来玩宝可梦。他的AI花费了超过50,000小时才学会成功游玩这款游戏，其中一个显著的挑战是AI更倾向于欣赏像素化的游戏场景，而非专注于游戏本身。

如今，像Whidden和Anthropic这样的AI驱动的“Twitch玩宝可梦”重现虽然趣味十足，但也让人不禁感到一丝惆怅。原版直播之所以成为Twitch历史上的重要时刻，是因为它以一种意想不到的方式将人们紧密地联系在一起。大家仿佛成为了同一个团队，共同努力克服游戏中的难题，推动游戏进程。

然而，时至今日，我们似乎已经从昔日的队友变成了旁观者，静静地观看着AI模型尝试玩一个我们许多人在童年时期就已经熟练掌握的游戏。这一现象不仅反映了AI技术的飞速发展，也折射出一个更大的趋势：我们的在线体验正逐渐从共享的群体活动转变为更加孤独的个人行为。

During the meeting, the "2024 Guangzhou Games Industry DevelopmentReport" was released, revealing that…

使用英雄之钥便可开启宝箱获取对应的碎片，尤其推荐其中的王者之影与王者之狱，一款为竞技神兵，另一款则是生化利器。关于钻石方面，游戏内有各种简单福利活动可以获取海量钻石，本次的二月钥匙礼盒就可以免费领取1000…

在之后的一年里，也是有另一款现象级的FPS，PUBG，成功将射击游戏的大逃杀模式给带火。这波操作可以说是劝退了大部分休闲娱乐玩家，老x我也是从这里开始，逐渐失去了玩Apex的热情。虽然后面重生再次修改了…

“陈某找到我说要打假赛的时候，想着能赚钱我就同意了……”英雄联盟电竞战队老板小叶，无力维系战队，竟和他人合谋打假赛，下注赚钱。小叶按照陈某的要求打了两场假赛，也顺利拿到了好处费并分给了队员们，暂时解决了…

根据《中国人口和就业统计年鉴2023》的数据，截至2022年，中国的单身人口已经超过了2.4亿，预计到2024年底突破3亿，相当于每4个人里面，就有一个属于单身。珍爱网发布的《2023年Q4单身人群调…

来源：检察日报 “电竞迷”小叶全资收购了一支英雄联盟职业战队所属公司的全部股份，正式成为了该战队的老板。接触一段时间后，小叶发现这个战队实力并没有想象的强，无法实现盈利。为了填补亏空，小叶答应陈某的要求，…

“陈某找到我说要打假赛的时候，想着能赚钱我就同意了……”英雄联盟电竞战队老板小叶，无力维系战队，竟和他人合谋打假赛，下注赚钱。小叶按照陈某的要求打了两场假赛，也顺利拿到了好处费并分给了队员们，暂时解决了资…

（点击上方小程序，开启Steam游戏之旅）万众期待的《怪物猎人：荒野》即将于2月28日发售，很多玩家早早购买了游戏，期待着时间一到就立刻开爽。但也有一些玩家不太开心，因为他们从第三方处购买的《怪物猎人：荒野…

（点击上方小程序，开启Steam游戏之旅）而索尼的其他游戏，包括《对马岛之魂》、《神秘海域》、《战神：诸神黄昏》、《最后生还者2》等，购买升级包均为原价，之前似乎也未有过升级包打折的先例。目前，PS4版《…

仅仅昨天一天时间之内，这场战局就又吸引来了4家明星大模型公司：先是阿里发布推理模型QwQ-Max-Preview预览版，接着Anthropic宣布推出全球首个“混合推理”模型Claude3.7 Sonne…

这位战士本赛季的登场率也是提升不少，孙策自带护甲并且有位移和回血效果，同时还可以打出控制，前期作战能力极强，大招的快速支援和霸体，能让孙策更快的支援队友，甚至可以打出先手开团的效果，但是孙策打吕布并不是很轻…

进入祖玛阁后，首先映入眼帘的是一片壮观的场景，四周都是闪烁的光芒，仿佛一切都在告诉你这里的非凡。总之，祖玛阁是一个充满挑战与机遇的地方，想要到达这里并不是简单的事情，但只要你认真准备，认真探索，就一定能找…