天脉网 | 天脉新媒体中心主办！
手机版
二维码

时事快闻

当前位置：首页 > 天脉资讯 > 游戏天地 > 正文内容

AI版《超级马力欧兄弟》：Claude系列领先，推理模型为何掉队？

时间：2025-03-04 16:54 来源：天脉网作者：江紫萱

加利福尼亚大学圣地亚哥分校的Hao人工智能实验室最近公布了一项引人入胜的研究，该研究将AI技术引入经典游戏《超级马力欧兄弟》中，以评估不同AI模型的性能。

在这次实验中，AI模型们并非面对1985年的原版游戏，而是游戏的一个模拟器版本。通过Hao实验室自主研发的GamingAgent框架，AI得以控制游戏主角马力欧。GamingAgent不仅向AI提供诸如“避开障碍物和敌人”的基本指令，还传输游戏内的实时截图。AI则通过生成Python代码来操控马力欧的行动。

实验结果令人惊讶。在参与测试的AI模型中，Anthropic的Claude 3.7表现最为抢眼，紧随其后的是Claude 3.5。而谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o则未能展现出令人满意的水平。值得注意的是，此次实验中，一些通常在基准测试中表现强劲的推理模型，如OpenAI的o1，并未能在游戏中展现出同样的优势。研究人员指出，这类模型在实时游戏中往往需要较长时间来做出决策，而《超级马力欧兄弟》中，时机把握至关重要。

游戏作为衡量AI性能的工具已有数十年历史。然而，一些专家对此持保留态度，认为游戏环境相对抽象和简单，可能无法准确反映AI在现实世界中的表现。游戏能为AI提供理论上无限的数据，这在现实场景中是无法实现的。

最近，一些游戏基准测试的结果也引发了业界的广泛讨论。OpenAI的研究科学家安德烈・卡帕西甚至在社交媒体上表示，他目前对如何评估AI的性能感到困惑，不知道这些模型到底有多好。

尽管存在这些争议，但观看AI玩《超级马力欧兄弟》仍然是一种有趣的体验。这项研究不仅展示了AI技术的最新进展，也引发了人们对AI性能评估方法的深入思考。

点赞 0反对 0举报 0 收藏 0

更多>同类天脉资讯

《拳皇》服务器状态全掌握！优化游戏体验的小技巧来啦

一般来说，游戏的高峰时段多是在晚上和周末，这时候玩家在线人数会明显增多，服务器的负担也会加重。可以通过一些网络测速工具，来测试你的网络速度和稳定性，如果发现网络不稳定，建议先进行调整，再去尝试登录游戏。在查…

03-04

名臣健康游戏新品日本市场表现符合预期，二次元赛道首战告捷

金融界3月4日消息，有投资者在互动平台向名臣健康提问：上线斩即获日本【免榜费第二名】驾驾驾在手高云集的日本二次元卷王赛道，新首年战告捷,这个成绩是否在公司的预期内。公司回答表示：如您所说，是的。公司游戏产品…

03-04

博彦科技透露：部分互联网客户涉足游戏业务，游戏技术支持服务引关注

证券之星消息，博彦科技(002649)03月04日在投资者关系平台上答复投资者关心的问题。投资者提问：请问公司的游戏相关技术支持服务于哪些游戏企业？在其游戏服务技术领域有哪些优势？博彦科技回复：尊敬的投资…

03-04

卡普空大动作！《怪物猎人》系列制作人辻本良三晋升为首席产品官

在SE进行人事变动之后，卡普空也宣布重要人事变动，负责《怪物猎人》系列的关键制作人辻本良三将于4月1日晋升为首席产品官，全面负责公司所有开发部门的监管工作。他最初参与了《Battle Circuit》和《Te…

03-04

《怪物猎人：荒野》纳塔角色引争议，玩家为何对这个小孩哥爱不起来？

特别是贯穿主线故事的角色纳塔，目前已经成为了“最被玩家讨厌”的角色。像是站在C位，拿着主角的台词鼓舞士气和指明前进方向，而玩家自己却已经摆出画面外了；明明年纪也不小，却还被看板娘搂在怀里安慰......这些细…

03-04

迅游科技微跌后市怎么走？游戏加速龙头面临哪些机遇与挑战

1、游戏加速领域绝对龙头,市占率达50%;受益于《绝地求生》火爆,公司海外加速需求迅速上升;2017年公司手游加速器收入4384万,实现了从零到一的突破,为王者荣耀内置网络加速器;18年2月,子公司速宝科技…

03-04

崩坏星穹铁道3.1版本抽卡攻略：萌新大佬XP党，如何精准规划卡池？

萌新要是缺限定生存位，抽个 0+0 的藿藿也能满足队伍一定的生存需求～要是有对能量需求高的主C，比如阿格莱雅，抽藿藿能有效提升队伍整体循环和输出能力，是很重要的抽取选择呢～总的来说，3.1 版本卡池角色抽…

03-04

网易股价走高，盘中涨2.42%报156.7元，多元业务助力业绩亮眼

3月4日，网易-S(09999)盘中上涨2.42%，截至14:36，报156.7元/股，成交6.56亿元。网易股份有限公司是一家主要从事互联网和游戏服务的供应商，专业研发并运营广受欢迎的手游和端游，并积极推…

03-04

《复仇者联盟5》概念图曝光，黑暗画风预示多元宇宙大战在即？

近日《复仇者联盟5：毁灭日》概念图遭偷跑，设计师MushkRizvi个人主页里曝光大量其在2022年-2024年创作的漫威电影概念图，信息量不少。奇异成了毁灭博士家臣，冬兵则被囚禁地牢。《复仇者联盟5…

03-04

《GTA 5增强版》今晚8点解锁，PC版新增光线追踪等特性！

IT之家 3 月 4 日消息，Steam 平台显示，R 星《GTA 5 增强版》将于北京时间今晚 8点解锁，玩家需要下载单独的游戏版本（点此访问），同时游戏已开启预载。 IT之家注意到，所有库中拥有《GTA…

03-04

美孚工业润滑油荣耀加冕，LubTop2024年度大奖再续辉煌篇章！

03-04

raven2渡鸦2手游攻略：小六云手机如何助你离线多开轻松搬砖？

小六云手机是前段时间上线的一款支持离线、多开、自动搬砖的手游工具，玩家们只要在前期部署好游戏以及自己需要打的材料、副本之后，就可以托管了，即便手机没电、没网的情况下，小六云手机也可以轻松帮助玩家拉满收益，十…

03-04

《双影奇境》Steam国区定档3月7日，售价198元，配置要求公布！

IT之家 3 月 4 日消息，《双人成行》开发商 Hazelight Studios 公布了新作《双影奇境》Steam 版的具体发售时间，该作Steam 版将在北京时间 3 月 7 日凌晨 0 点解锁，游戏…

03-04

国产单机游戏：崛起之路如何持续，发展“后劲”何在？

北京灵游坊网络科技有限公司负责人梁其伟说，《黑神话：悟空》获得“游戏界奥斯卡”The Game Awards（简称TGA）四项提名，并夺得年度“最佳动作游戏”和“玩家之声”，提升了中国游戏的国际地位，也向全球…

03-04

动视用AI生成“假游戏”广告，试探玩家对《吉他英雄》等新作的兴趣？

IT之家 3 月 4 日消息，据外媒 VGC今日报道，动视正在采用一种奇特的方式来测试玩家对《吉他英雄》《使命召唤》和《古惑狼》系列新作的兴趣：投放AI 生成的虚假游戏广告。近日，在动视的 Faceboo…