马斯克Grok 3模型亮相，能否超越DeepSeek成AI新标杆？-天脉网

在AI领域的竞技舞台上，一场前所未有的风暴正席卷而来。就在近日，科技巨头马斯克携其神秘AI团队xAI，正式揭晓了被誉为“地球上最聪慧的人工智能”——Grok 3。这场发布会，尽管延续了马斯克一贯的风格，略显姗姗来迟，却无疑点燃了全球科技爱好者的热情。

发布会历时一小时，马斯克携手xAI天团（其中包括两位华人成员），全方位展示了Grok 3的惊人实力。据称，该模型在多项性能指标上均超越了谷歌、OpenAI及DeepSeek等业界巨头的明星产品。直播结束后，网络上瞬间炸开了锅，部分幸运用户已抢先体验，其中不乏对Grok 3推理能力的高度评价，认为其可与o1-pro相媲美，甚至略胜一筹于DeepSeek R1和Gemini。

国内外媒体对Grok 3的报道铺天盖地，诸如“首个突破1400分（Imarena.ai竞技场得分）的模型”、“首个十万卡集群训练出的模型”等头衔，让人目不暇接。世超亦全程观看了这场发布会，虽不至于用“炸裂”形容，但Grok 3确实再次印证了AI领域“大力出奇迹”的规律。

目前，Grok 3仅对X平台部分Premium+会员开放。发布会上，xAI团队首先将Grok与GPT的模型迭代速度进行了直观对比，针对性十足。在模型性能方面，Grok 3更是展现出了与众多顶尖模型一较高下的决心。

Grok 3家族分为非推理模型和推理模型两大系列。非推理模型方面，Grok 3与Grok 3 mini在AIME '24数学竞赛、GPQA（研究生水平科学知识问答基准测试）及代码测试中，均大幅领先GPT-4o、Gemini 2.0 pro、DeepSeek V3及Claude 3.5 Sonnet等竞品。尽管Grok 3 mini与其他模型差距不大，但其牺牲部分准确性以换取更快回答速度的特点，同样引人注目。

推理模型方面，Grok 3 Reasoning Beta与Grok 3 mini Reasoning同样表现出色。在测试中，尽管未加时情况下与其他模型差距不大，但一旦增加思考时间，其优势便显而易见。现场演示中，Grok 3推理模型在2025年AIME数学竞赛上的表现，更是令人印象深刻。Grok 3还能生成3D动画代码及结合多种游戏规则的新游戏，其游戏制作能力若如演示般强大，将对游戏圈产生深远影响。

Grok 3的强大离不开马斯克提及的10万卡集群，该集群仅用122天便搭建完成，后扩展至20万卡，为Grok 3的诞生奠定了坚实基础。然而，尽管Grok 3看似无敌，但抢先体验的用户分享中也不乏与宣传不符的实际测试案例，部分测试中Grok 3的表现甚至不及o3 mini和Claude 3.5 Sonnet。

关于Grok 3是否开源的问题也备受关注。马斯克表示，xAI通常在新模型发布后再开源旧版本，因此即便开源，也将是Grok 2。此举似乎表明，马斯克的主要目标仍是与老对手（暗指OpenAI）竞争，而非回应开源阵营的压力。

】中国新能源汽车的技术无论从产品、技术还是产业链，应该说领先大概3—5年，只有开放创新，才能让世界感受到这种好的产品，才能共同发展。【宇树科技王兴兴：2025年人形机器人会达到“新量级”，现在的进化速度超…

发布前的几个小时，希冯·齐利斯（ShivonZilis）——Neuralink高管，同时也是和马斯克育有一对双胞胎的孩子妈，在X上大赞和Grok 3进行的对话，称“是我一生中最出乎意料、最值得的时光之一”，…

同时，财报电话会披露，在ToC产品方面，百度文库四季度订阅收入同比增长21%，2024年12月AI MAU达9400万，约为上季度两倍；百度搜索中已有22%结果页面包含AI生成内容，涵盖短视频、笔记、智能体…

除模型外，xAI还发布了首个AI智能体DeepSearch。他体验约2小时后表示，Grok 3加上深度思考模式与OpenAI最强推理模型o1 pro大致相等，并且略优于DeepSeek的推理模型R1和谷歌的推…

2月18日晚，百度（Nasdaq：BIDU，09888.HK）发布2024年第四季度及全年财报，显示2024年总营收达1331亿元，同比减少1%；归属百度净利润为237.6亿，同比增长17%，不按美国通用会…

雷递网乐天 2月18日百度创始人、董事长兼首席执行官李彦宏今日在电话会议上透露，文心大模型4.5将开源，4.5将是百度有史以来最强大的大模型，“希望客户和用户能比之前更方便地体验这款模型”。 “但我想强…

雷递网乐天 2月18日在百度2024年Q4及全年财报电话会上，百度创始人、董事长兼首席执行官李彦宏披露，智能云业务在四季度增长强劲，营收同比增长26%，经营利润率持续增长。据电话会，百度正在为国家电网…

在Grok 3发布的问答环节中，xAI还回答了观众关于最新AI模型的一些问题，比如问Grok是女孩还是男孩。而Grok 3的两个变体，Grok3 Reasoning和Grok 3 mini Reasoni…

2025年央视春晚《秧BOT》节目中，一群穿着花棉袄的机器人扭着“小腰”，娴熟地转手绢，这群炫酷的“显眼包”名为H1，是杭州宇树科技研发的。 2016年还没毕业就被大疆挖走，两个月后王兴兴辞去大疆工程师职位…

这样操作背后的原因，也许是董明珠觉得自己连任几乎没有疑问，她相信自己要长伴格力，所以把自己的IP和格力又锁死了一重。又或者，董明珠能否连任背后还有着博弈，于是把企业的品牌更深度地绑定在个人身上，也是博弈中…

据演示发布的数据，在Chatbot Arena这一用于众包人工智能基准测试的开放平台上，Grok 3也是第一个得分超过1400分的模型。他还透露，训练Grok-3所使用的算力远多于此前的版本，并使用了大量合…

其中，负责大中华区业务的唐仕凯将按计划于2025年7月31日正式退休，但其决定从2025年2月1日起担任梅赛德斯-奔驰集团股份公司董事会成员及中国事务特命代表全新职务，以推动全球第一大市场业务体系的综合转型。…

这是DeepSeek团队在稀疏注意力领域的创新性工作，结合了算法创新和硬件优化，旨在解决长上下文建模中的计算瓶颈。它不仅在性能上超越了传统的Full Attention 模型，更在效率方面实现了显著的提升，…

近年来，格力和董明珠二者的品牌关联度逐渐加深，从“董明珠的店”到“格力董明珠店”，再到如今“董明珠健康家”，伴随着格力电器线上渠道的推进，董明珠的个人印记似乎也愈发深刻。此外，记者在格力董明珠成都店的抖音直…

Grok 3是xAI对OpenAI的o3-mini和DeepSeek的R1等模型的回应，它可以分析图像和回答问题，并为X上的许多功能提供支持。不过，在上周的迪拜峰会上，马斯克却突然宣布，xAI将在一到两周…