马斯克Grok 3算力堆砌未超DeepSeek,低成本高效能路线受瞩目

   时间:2025-02-22 13:46 来源:天脉网作者:沈如风

近日,科技界迎来重大突破,埃隆·马斯克的人工智能初创公司xAI揭晓了其最新力作——Grok 3大模型,马斯克自豪地宣称其为“地球上最聪慧的人工智能”。

Grok 3是在20万块英伟达高端芯片的强大算力支持下训练而成,其运算能力较上一代跃升了十倍之多。在xAI的直播活动中,马斯克与三位工程师现场演示了Grok 3的实力,它在数学、科学和编程等多个基准测试中,力压群雄,包括谷歌的Gemini、DeepSeek的V3模型、Anthropic的Claude以及OpenAI的GPT-4。

据马斯克透露,Grok 3的训练基于海量合成数据,它具备自我检查与修正数据逻辑一致性的能力,能有效剔除错误数据。在AIME'24数学能力测试、GPQA科学知识评估以及LCB编程能力测试中,Grok 3均展现出卓越表现,其参数量高达万亿级别,并引入了“思维链”推理机制,能够像人类一样分解复杂任务。

尽管Grok 3在多项测试中拔得头筹,但其在数学和编程方面的高分并未与DeepSeek拉开显著差距。DeepSeek在中文理解和多模态交互方面表现稳健,已在多个实际应用场景中得到了验证。更重要的是,Grok 3的成本极为高昂,其训练成本据传高达30亿美元,xAI的超算中心算力也为此翻倍。

为了尽快推出Grok 3,马斯克决定自建数据中心,仅用时122天便启动了第一批10万个GPU,并在92天内实现了超算集群算力的翻倍,达到20万块GPU的规模。以英伟达H100为例,20万块GPU的硬件采购成本就高达60亿美元,加上服务器、网络设备、电力和冷却设施等,总成本可能突破百亿美元大关。

相比之下,DeepSeek的训练成本仅为600万美元,远低于GPT-4的7800万美元。DeepSeek通过创新的工程设计与高效的训练方法,以低成本模式展现了强大的竞争力,打破了美国科技巨头在AI算力上的主导地位,为全球其他国家自主发展AI带来了希望。

Grok 3的推出,虽然再次证明了马斯克在AI领域的雄心壮志,但也引发了关于算力投入与性价比的讨论。DeepSeek的成功,不仅吸引了英伟达、AMD等企业的接入,还获得了包括特朗普在内的多方点赞,其省成本、高效益的特点备受瞩目。在AI大模型发展日益成熟的今天,开源已成为提升竞争力的关键,而Grok 3若不开源,其商业模式或将面临挑战。

若特斯拉将Grok 3应用于其自动驾驶系统FSD,将极大提升其感知与决策能力,为新能源汽车行业的智能驾驶竞争增添新的变数。面对这一趋势,中国车企需做好充分准备,以应对即将到来的激烈竞争。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报