在科技界掀起的一波巨浪中,埃隆·马斯克再次站在了舞台中央。近日,他通过X平台向全球观众直播,亲自揭晓了其人工智能公司xAI的最新力作——Grok 3旗舰AI大模型。
这场备受瞩目的直播吸引了超过200万在线观众,马斯克在直播中毫不吝啬地赞誉Grok 3为“地球上最聪慧的人工智能”。Grok 3此番推出了两个版本:标准版与迷你版(Grok 3 mini)。尽管Grok 3 mini在响应速度上更胜一筹,但其准确性相较于标准版略逊一筹。
为了直观展示Grok 3的实力,xAI团队在直播中公布了一系列对比测试结果。数据显示,Grok 3在AIME、GPQA及LCB等多个基准测试中,力压GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3及Gemini-2 Pro等知名模型,尤其在数学、科学及代码处理领域展现出卓越性能。
不仅如此,Grok 3的早期版本chocolate在Chatbot Arena这一国际大模型竞技平台上同样表现出色,分数遥遥领先。据xAI官方透露,Grok 3的训练计算量是前代Grok 2的十倍有余,这一巨大投入为其性能飞跃奠定了坚实基础。
Grok 3不仅在计算力上实现了突破,更解锁了测试时计算能力,使其推理功能得到显著提升。在对比测试中,Grok 3 Reasoning与Grok 3 mini Reasoning凭借更多测试时间计算,超越了o3 mini、o1及DeepSeek-R1等高配模型。
操作界面上,Grok 3与Grok 3 mini配备了DeepSearch、Think及BigBrain三大功能按钮,覆盖了研究、头脑风暴、数据分析、图像生成及代码生成等多重应用场景。Think模式让Grok系列能够深入思考问题,类似于OpenAI的o3 mini等推理模型;而Big Brain模式则专为解决复杂数学、科学及编程问题设计,提供更全面、细致的推理服务。
值得注意的是,Grok 3新增的DeepSearch功能,旨在与OpenAI的DeepResearch等功能一较高下。该功能能够深度搜索互联网及X平台信息,提供精炼摘要回答用户问题,进一步提升了用户体验。为了享受Grok 3的优先使用权,用户需订阅X Premium+服务;而SuperGrok订阅(每月30美元或每年300美元)则能解锁更多推理、深度搜索查询功能,并无限制使用图像生成服务。
马斯克透露,Grok 3即将增加语音模式,预计在未来一周左右上线。几周后,Grok 3模型将与DeepSearch功能一同整合至xAI的企业API中。他还承诺在几个月内将前代产品Grok 2开源,以回馈社区。
“我们习惯于在新版本发布时,将旧版本开源。”马斯克表示,“当Grok 3达到成熟稳定阶段,我们计划在几个月内将Grok 2开源。”随着Grok 3的强劲推出,其在教育领域的应用前景备受期待。然而,其实际效果仍需市场与用户的进一步检验。但可以肯定的是,这场AI军备竞赛正深刻影响着教育领域的发展。