AI大模型竞赛步入激烈阶段,行业焦点转向推理与数据战略
近期,AI领域的竞争愈发激烈,各大巨头纷纷加速布局,将战略重心转向推理能力与数据资源的争夺。引人瞩目的是,特斯拉CEO埃隆·马斯克对一篇深入分析AI模型竞争路线的推文表示了赞赏,并点评“分析精准”。就在此之前,马斯克旗下的xAI公司正式推出了Grok 3大模型。
这篇引发马斯克注意的推文由Gavin Baker撰写。Gavin指出,AI行业的变革步伐正在加快,OpenAI曾凭借先发优势占据领先地位,但目前这一优势正在逐渐减弱,微软也调整了策略,选择更为稳健的发展路径。
Gavin进一步预测,未来数据将成为AI竞争的核心要素。缺乏独特且有价值数据的前沿模型将面临迅速贬值的风险。meta等科技巨头通过数据垄断和庞大的算力规模构建起了坚固的竞争壁垒,而中小玩家则更加注重差异化部署和成本优化。
尽管竞争激烈,Gavin仍对xAI和OpenAI持乐观态度。他认为,如果OpenAI在未来五年内继续保持领先地位,这很大程度上得益于其先发优势、规模优势以及强大的产品影响力。
OpenAI的先发优势逐渐减弱,微软调整策略
Gavin在推文中详细阐述了当前AI领域的竞争格局。他指出,自ChatGPT在2022年11月横空出世以来,OpenAI凭借对Scaling Law的激进投入,在生成式AI领域建立了长达七个季度的统治地位。然而,这一优势正在被逐渐削弱。Google的Gemini、xAI的Grok-3以及Deepseek的最新模型均已达到了与GPT-4相当的技术水平。
据知情人士透露,微软内部备忘录显示,由于预训练边际效益递减,原计划投入160亿美元升级预训练基础设施的方案已被取消。微软转而专注于为OpenAI提供推理服务以获取收益。微软CEO纳德拉也表示,数据中心可能建设过剩,租赁优于自建,甚至考虑使用开源模型来支持CoPilot。这些变化预示着单纯依靠参数扩张建立壁垒的“预训练时代”即将结束。
独家数据资源成为新的竞争壁垒
Gavin强调,在模型架构日益趋同的背景下,独家数据资源将成为新的竞争壁垒。他多次引用Eric Vishria的观点,指出无法获得独特且有价值数据的前沿模型将面临迅速贬值的风险。蒸馏技术将进一步放大这一差距。如果前沿模型无法访问YouTube、X、TeslaVision、Instagram和Facebook等独特而有价值的数据资源,其投资回报率将大打折扣。
从这一角度来看,meta的CEO马克·扎克伯格的策略显得尤为明智。扎克伯格将meta的AI战略锚定在社交数据闭环上。据报道,Instagram用户的图像标注数据使meta的多模态模型训练效率提升了40%。
AI基础设施格局将发生颠覆性变化
这一变化也将对AI基础设施格局产生深远影响。Gavin预测,预训练算力方面,虽然需要超大规模集群(10万卡级),但参与者将缩减至2-3家,技术堆栈将追求极致性能。而推理算力方面,将出现6-10家较小的数据中心,分布式、低成本架构将成为主导。地理就近部署与能效比将成为关键因素,量化压缩技术将支撑低成本推理。
Gavin指出,推理模型对计算资源的需求极高,只有具备强大的计算能力,模型才能高效地完成推理任务。与之前预训练和推理阶段计算资源分配大致各占一半的情况不同,未来预训练将仅占5%,推理阶段将占据95%的比重。因此,卓越的基础设施将至关重要。
整体来看,未来AI行业可能呈现“预训练集中化,推理去中心化”的两极格局。数据将成为权力核心,巨头通过数据垄断和算力规模构建竞争壁垒,而中小玩家则更加注重差异化部署和成本优化。