埃隆·马斯克的人工智能企业xAI近期震撼发布了其最新一代人工智能大模型——Grok 3,这一创新成果被马斯克本人誉为“地球上最具智慧的人工智能”。
在xAI的直播活动中,马斯克携手三位工程师,通过一系列现场演示展现了Grok 3的强大实力。在数学、科学以及编程等多个基准测试中,Grok 3力压群雄,战胜了包括谷歌Gemini、DeepSeek的V3和R1模型、Anthropic的Claude以及OpenAI的GPT-4o在内的众多强劲对手。
据直播中发布的数据显示,在Chatbot Arena这一专注于人工智能基准测试的开放平台上,Grok 3以卓越的表现成为首个得分突破1400分的模型,再次证明了其在人工智能领域的领先地位。
xAI还宣布推出了一款名为Deepsearch的智能搜索引擎,其命名与近期备受瞩目的Deepseek有着异曲同工之妙。马斯克在介绍中表示,Grok 3的一大亮点在于其减少AI幻觉的能力,这得益于其独特的数据检查机制和逻辑一致性追求。
在算力方面,马斯克透露,Grok 3的训练使用了远超以往的庞大算力,并引入了大量合成数据。与DeepSeek通过算法优化路径不同,Grok 3的成功离不开xAI耗时8个月打造的Colossus超级计算机。这台由10万个英伟达H100 GPU驱动的超级计算机,为Grok 3的训练提供了高达2亿个GPU小时的算力支持,是Grok 2的十多倍。
回顾xAI的发展历程,自2023年7月成立以来,公司不断取得突破性进展。同年11月,xAI发布了首款大模型Grok-1,以3140亿参数的规模成为当时参数量最大的开源大语言模型。2024年8月,Grok-2的发布更是使其在性能上与ChatGPT的最新模型相媲美。这一系列大模型能够通过联网获取实时信息,并利用X平台(原推特)上的资讯,确保了信息获取的时效性和准确性。
然而,随着DeepSeek等中国大模型的崛起,业内也开始关注是否还需要像OpenAI或xAI这样通过“大规模堆芯片和算力”的昂贵方式来推进AI发展。OpenAI首席执行官奥尔特曼对此表示,DeepSeek的崛起缩小了OpenAI的领先优势,并指出OpenAI在开源模型和研究成果的问题上需要制定不同的策略。