科技巨头马斯克的人工智能公司xAI近日宣布,其最新研发的人工智能大模型Grok 3已正式发布。马斯克自豪地宣称,这款模型是“地球上最聪明的人工智能”。
据悉,Grok 3是基于20万块英伟达芯片的强大算力训练而成,其运算能力相较于上一代提升了整整10倍。在xAI的直播演示中,马斯克与三位工程师共同见证了Grok 3在数学、科学和编程基准测试中的卓越表现。测试中,Grok 3成功击败了包括谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4在内的多个竞争对手。
马斯克透露,Grok 3的训练过程使用了大量的合成数据,并通过反复检查数据以确保逻辑一致性。在发现错误数据时,Grok 3能够自我反思并删除这些数据。在AIME'24数学能力测试、GPQA科学知识评估以及LCB Oct - Feb编程能力测试等多项测试中,Grok 3均取得了高于DeepSeek的成绩。Grok 3拥有1万亿级别的参数量和“思维链”推理机制,能够像人类一样逐步拆解复杂任务。
尽管Grok 3在多项测试中表现出色,但其在数学和编程方面的优势并未与DeepSeek拉开明显差距。而DeepSeek在中文理解和多模态交互方面一直表现稳定,并在实际应用场景中得到了广泛验证。Grok 3的成本极高,其训练量是前代Grok 2的10倍,训练成本据传高达30亿美元。xAI旗下的超算中心算力已经翻倍,以支持Grok 3的运行。
为了尽快推出Grok 3,马斯克决定自建数据中心。在短短四个月内,团队成功构建了第一批拥有10万个GPU的数据中心。随后,他们仅用92天就将超算集群的算力翻倍,达到了20万块GPU的规模。以英伟达H100为例,20万块GPU的硬件采购成本就高达60亿美元,这还不包括配套服务器、网络设备、电力和冷却设施等额外成本。
相比之下,DeepSeek的训练成本仅为600万美元,远低于GPT-4的7800万美元。DeepSeek凭借创新的工程设计与高效的训练方法,在实现与OpenAI模型同等性能的同时,仅需要对方5%的算力。这一低成本模式直接颠覆了美国科技巨头在AI领域的主导地位,为其他国家自主发展AI提供了希望。