埃隆·马斯克的人工智能企业xAI近期宣布了一项重大突破,其最新研发的人工智能大模型Grok 3正式面世,被誉为“地球智慧之巅”。
在xAI的直播活动中,马斯克携手三位工程师,通过现场演示展示了Grok 3的卓越性能。在数学、科学及编程领域的基准测试中,Grok 3力压群雄,超越了包括谷歌Gemini、DeepSeek的V3和R1模型、Anthropic的Claude以及OpenAI的GPT-4在内的众多强劲对手。
尤为在Chatbot Arena这一全球知名的众包人工智能基准测试平台上,Grok 3以超过1400分的优异成绩,成为首个突破这一分数大关的模型,再次证明了其无与伦比的智能水平。
xAI还推出了名为Deepsearch的智能搜索引擎,该引擎基于Grok 3的强大能力构建,旨在为用户提供更为精准、高效的搜索体验。尽管名字与近期备受瞩目的Deepseek有几分相似,但Deepsearch在技术和应用层面均有着独特的优势。
马斯克在直播中详细阐述了Grok 3的核心竞争力——其强大的逻辑一致性和数据校验能力,这大大减少了AI幻觉现象的发生。他透露,为了训练Grok 3,xAI投入了大量的算力资源,远超此前的版本,并采用了丰富的合成数据。而这一切的背后,是xAI耗时8个月打造的Colossus超级计算机,它由10万个英伟达的H100 GPU组成,为Grok 3的训练提供了前所未有的2亿个GPU小时,是Grok 2的十多倍。
回顾xAI的发展历程,自2023年7月成立以来,公司便以惊人的速度推进人工智能技术的研发。同年11月,xAI发布了首款大模型Grok-1,凭借3140亿参数的规模,一举成为当时参数量最大的开源大语言模型。而2024年8月发布的Grok-2,则在性能上与ChatGPT的最新模型不相上下。这一系列大模型不仅能够联网获取实时信息,还能浏览和使用X平台(原推特)上的资讯,确保了信息获取的时效性和广泛性。
然而,随着DeepSeek等大模型的涌现,业内也开始关注是否需要继续采用OpenAI或xAI这种“大规模堆芯片和算力”的昂贵模式来推动AI的发展。OpenAI的首席执行官奥尔特曼甚至表示,DeepSeek的出现已经缩小了OpenAI的领先优势,并认为在开源模型和研究成果的问题上,OpenAI需要制定不同的策略以适应新的形势。