阿里Qwen2.5-Max大模型竞技场夺魁，网友：中国AI崛起势不可挡！-天脉网

国产大模型Qwen2.5-Max在Chatbot Arena榜单大放异彩

近日，在备受瞩目的大模型竞技场Chatbot Arena上，一款来自中国的AI模型Qwen2.5-Max凭借其卓越表现，成功跻身总榜第七名，超越了包括DeepSeek-V3在内的多个知名模型。这一消息在AI界引起了广泛关注。

Qwen2.5-Max由阿里巴巴打造，此次在Chatbot Arena上的表现尤为抢眼。特别是在编程和数学方面，该模型展现出了非凡的能力，与满血o1和DeepSeek-R1并列第一。这一成绩不仅彰显了Qwen2.5-Max的技术实力，也为中国AI技术的发展赢得了国际赞誉。

Chatbot Arena作为全球顶级大模型的竞技场，其权威性和重要性不言而喻。该平台通过模型两两组队交给用户盲测的方式，根据真实对话体验对模型能力进行投票。Qwen2.5-Max能够在此次评选中脱颖而出，足以证明其在实际应用中的优秀表现。

Qwen2.5-Max在新开的网页应用开发WebDev榜单上也冲进了前十名，进一步展示了其全面的能力。不少网友在亲身使用后表示，Qwen2.5-Max的表现稳定且出色，甚至有人认为它很快就会取代硅谷的所有普通模型。

在具体单项能力方面，Qwen2.5-Max同样表现出色。在逻辑性较强的数学和代码任务中，该模型的成绩超过了o1-mini，与满血o1和DeepSeek-R1并列第一。在数学榜单上并列第一的模型中，Qwen2.5-Max是唯一一个非推理模型，这更凸显了其在数学领域的卓越表现。

Qwen2.5-Max在复杂提示词任务中也表现出色，与o1-preview并列第二。在仅限英文的情况下，该模型甚至可以排到第一，与o1-preview、DeepSeek-R1等顶级模型平起平坐。同时，Qwen2.5-Max的多轮对话能力也与DeepSeek-R1并列第一，长文本处理能力排行第三，超过了o1-preview。

阿里巴巴在技术报告中还展示了Qwen2.5-Max在一些经典榜单上的表现。在指令模型对比中，该模型在Arena-Hard和MMLU-Pro等基准测试中，与GPT-4o和Claude 3.5-Sonnet处于近似或更高的水准。在开源基座模型对比中，Qwen2.5-Max的成绩也全面超过了DeepSeek-V3，并遥遥领先于Llama 3.1-405B。

Qwen2.5-Max上线后，吸引了大量网友前来实测。网友们发现，该模型在代码和推理等方面的表现尤为突出。例如，在让Qwen2.5-Max用Java写一个象棋游戏时，该模型不仅快速生成了简单易读的代码，还因为具备Artifacts功能，使得小游戏可以立刻开玩。在复杂提示词的推理问题上，Qwen2.5-Max也展现出了快速且准确的能力。

目前，Qwen2.5-Max已在Qwen Chat平台上线，可免费体验。企业用户也可以在阿里云百炼调用Qwen2.5-Max模型的API。感兴趣的用户不妨亲自上手实测，感受这款国产大模型的卓越魅力。

KONAMI公开《心跳回忆～Forever with you～Emotional》最新宣传片，并确定游戏将于5月8日发售，对应Switch平台。本作为《心跳回忆》的复刻版，加入了文字高清化、新版本立绘插图以…

SVG布局的工具条上可以设置动画各种参数同时可以设置宽高比，达到SVG层和布局内容的完美对齐 SVG布局的工具条上可以设置动画各种参数同时可以设置宽高比，达到SVG层和布局内容的完美对齐 SVG布局的工…

Super Citycon 是一款复古风格的城市建设游戏，专为热爱建造、创造和策略规划的玩家打造。 • 多种游戏模式：在沙盒模式中释放无限创意，使用地图编辑器设计属于自己的城市，挑战策略经营解谜…

此前，任天堂表示计划在今年晚些时候发布Switch 2游戏机，这推动其股价创下新高。尽管任天堂的销售额大幅下滑，但市场对新一代主机将提振销售的预期，加之投资者将游戏行业公司视为日本动荡的芯片板块的避风港，支撑…

Battlefield Labs 是开发团队与玩家一起测试概念和体验内容的地方。团队希望社区在《战地》的未来中发挥关键作用，将测试（几乎）所有内容。团队将从测试游戏的核心内容开始，例如核心战斗和破坏。然后过…

周一忱表示，自己从2024年7月开始制作这款游戏，原先是希望用游戏记录和奶奶的相处日常，“很快我就完成了80%的游戏内容，但总觉得还缺一些东西，因此迟迟没有结项。这其实也是他自己的遗憾，“有一次我推奶奶出去散…

在《奥力奥力世界》和《酷极轮滑》意外从Steam平台下架后，2K公司已确认这两款广受好评的游戏 “将重新上架”。尽管发行商并未详细说明游戏下架的原因，但它向媒体表示：“我们可以确认，2K目前正在发行这两款…

《漫威蜘蛛侠2》Steam版现已推出第二个热修复补丁。此热修复补丁——在《漫威蜘蛛侠2》于Valve平台收获“褒贬不一”评价之际发布——包含“多项崩溃修复与改动”，以提升游戏稳定性。更新说明中解释道：“该…

《刺客信条：影》未发布的故事及角色细节，通过一家成人卡通网站泄露了出去。其中有关于游戏中圣殿骑士反派的细节，尽管上个月《刺客信条：影》已开启试玩预览，但育碧至今仍对这些内容守口如瓶。在最近一次延期后，…

《巫术：疯狂领主的试验场》是1981年角色扮演游戏的重制版，其原声音乐由著名音乐家威妮弗雷德·菲利普斯创作，她曾为《战神》《刺客信条3》和《小小大星球》等作品创作配乐。Digital Eclipse开发了…

要是上个月《我的世界》添加了一堆新的猪变种时，你就已经兴奋得难以自持，那现在你可能得找个东西稳住自己了：Mojang带着全新的内容更新回归，开启公开测试，而这次的主角是牛。玩Java版快照的玩家还能认识新的萤…

如今游戏业除了众多知名大游戏工作室，还有更多默默无闻的独立游戏开发者们在奉献者海量有趣游戏，那么如何在众多游戏中脱颖而出被玩家们注意到是个难题，日前海外独游开发者忽然跟风15秒全力宣传，纷纷备注自己也属于Ou…

集英社游戏宣布，旗下收获特别好评新游《都市传说解体中心》《将制作同名漫画，于2月14日游戏正式推出后推出，敬请期待。《都市传说解体中心》以日本各式各样知名都市传说为主题的悬疑解谜冒险游戏。在游戏中，将会以…

任天堂音乐已经登陆iOS/Android平台，只面向Nintendo SwitchOnline会员服务，提供任天堂旗下游戏的经典名曲，并设置了防止剧透功能，以及改变音乐长度等功能，让玩家听的舒心。《超…

扔掉沿途找到的任何东西，选择卡牌来升级你的构建，改变游戏规则……不择手段赢得胜利。通过选择100多张具有不同等级和协同效应的卡牌，提升你的所有能力并改变游戏规则。在超过20张随机选择的地图上进行游戏，每张…