近期,AI领域迎来了一次重大震动,由马斯克旗下的xAI公司推出的Grok-3模型,在多项基准测试中超越了DeepSeek和OpenAI等业界巨头,引发了广泛关注。
据悉,Grok-3采用了前所未有的大规模训练,动用了高达20万块GPU,其硬件成本据估算达到了惊人的30亿美元。这一豪赌式的投入,最终换来了市场信心的回归,英伟达的股价也随之反弹至DeepSeek-R1发布前的水平。
AI领域的专家们纷纷表示,Grok-3的成功证明了Scaling Law(规模定律)的活力依旧。在算力提升10倍的情况下,模型性能仍呈现出线性增长的趋势。尽管预训练的成本高昂,但其巨大的发展潜力不容忽视。
然而,Grok-3的辉煌并非没有争议。一方面,其闭源策略和每月30美元的收费引发了部分用户的不满;另一方面,其高昂的训练成本也让业界对其可持续性产生了质疑。相比之下,DeepSeek的开源策略和较低的训练成本,使其在生态上占据了一定的优势。
尽管如此,Grok-3在实际应用中的表现仍然令人瞩目。在用户的实测中,Grok-3不仅能够制作出类似马里奥的小游戏,还能帮助用户自学编程。在多项任务中,Grok-3都展现出了超越DeepSeek-R1的实力。
在一场由西北大学博士生王子涵发起的实测中,Grok-3虽然在初期对一些简单问题回答不佳,但在多次尝试后逐渐稳定下来,并在多项任务中超越了DeepSeek-R1。特别是在AI趋势分析、媒体合成和代码工作流等任务中,Grok-3展现出了强大的实力。
艾伦人工智能研究所的Nathan Lambert认为,Grok-3的发布标志着AI发展进入了一个新阶段。他指出,xAI公司几乎每天都在更新Grok-3,这种快速发布的策略将成为未来AI领域的主流趋势。在DeepSeek和Grok的竞争压力下,传统领先实验室将不得不加快产品发布节奏,以应对日益激烈的市场竞争。
尽管Grok-3在技术上取得了重大突破,但业界普遍认为,这并不意味着在模型高效训练领域的竞争格局发生了实质性改变。xAI虽然在追赶OpenAI、Anthropic和谷歌等巨头,但在模型训练效率方面,这些研究机构仍然处于领先地位。然而,这种竞争态势迫使这些机构将重点放在提升模型的绝对智能水平上,而非仅仅优化性价比。