特斯拉CEO马斯克的人工智能企业xAI近期宣布了重大进展,其旗舰人工智能模型Grok 3正式面世,同时推出了Grok的iOS和Web应用新特性。
Grok 3的问世,标志着xAI对业界领先模型如OpenAI的GPT-4o和谷歌的Gemini的正面回应。这款新型AI不仅能够分析图像并回答各类问题,还是马斯克社交网络X多个功能背后的技术支持。
经过数月的紧张开发,Grok 3原本预计于2024年发布,但最终未能如期问世。xAI在孟菲斯的数据中心为此次开发提供了关键支持,该中心配备了约20万个GPU,专门用于训练Grok 3。马斯克自豪地表示,Grok 3的计算能力相较于其前代Grok 2提升了“10倍”,训练数据集更是涵盖了包括法庭文件在内的广泛资源。
“Grok 3在性能上实现了质的飞跃,”马斯克强调,“它致力于追求最纯粹的真相。”
Grok 3实际上是一个包含多个版本的模型系列。其中,Grok 3 mini以其快速响应著称,尽管在准确性上略有妥协。尽管Grok 3及其相关功能尚未完全推出(部分仍处于测试阶段),但本周已开始逐步向公众开放。
xAI声称,在多项基准测试中,Grok 3表现优于GPT-4o,特别是在AIME(评估模型解决数学问题能力)和GPQA(评估模型解决博士级物理、生物和化学问题的能力)测试中。在Chatbot Arena这一众包测试中,Grok 3的早期版本也展现出了强大的竞争力,让用户在不同AI模型的回答中做出选择。
Grok 3系列新增了两个推理模型:Grok 3 Reasoning和Grok 3 mini Reasoning。这两款模型能够深入“思考”问题,与OpenAI的o3-mini和中国AI公司DeepSeek的R1等“推理”模型不相上下。
马斯克透露,Grok应用程序将在不久后增加“语音模式”,为Grok模型赋予合成语音功能。而Grok 3模型则计划在未来几周内通过xAI的企业API提供,同时还将引入DeepSearch功能。
关于开源计划,xAI表示将在未来几个月内开源Grok 2。马斯克解释说:“我们的惯例是,在新版本完全发布时,将开源上一版本。因此,当Grok 3成熟稳定后,我们可能会在几个月内开源Grok 2。”