近期,AI大模型领域迎来了一场震撼业界的革命,新兴公司DeepSeek凭借其开源模型R1,以极低的训练成本实现了与OpenAI旗舰模型o1相近的性能。这一“小力出奇迹”的壮举,不仅在全球范围内引发了广泛关注,也让人们对大型科技公司巨额的AI研发开支产生了新的质疑。
然而,尽管DeepSeek的冲击波让科技巨头们一时惊愕,但他们并未因此改变策略。相反,这些巨头们正挥舞着支票簿,企图通过疯狂的资金投入,重新夺回AI大模型的制高点。谷歌母公司Alphabet在最近发布的2024年第四季度财报中宣布,2025财年的资本支出将达到750亿美元,以加速其人工智能战略的扩展。这一数字远远超出了华尔街的预期,彰显了谷歌在AI领域的雄厚实力。
微软也不甘落后,宣布将在2025财年投资800亿美元建设AI数据中心,创下公司历史上的单笔投资最高纪录。社交网络巨头meta同样宣布了高达600亿至650亿美元的投资计划,旨在大幅扩张其AI团队,并推动meta AI服务覆盖10亿人,同时让Llama 4成为行业领先的大模型。OpenAI则携手软银、甲骨文、微软等企业,计划投资5000亿美元成立“星际之门”,专注于AI基础设施的建设与运营。
相比之下,国内科技巨头在AI大模型上的投入虽然规模较小,但也动辄数百亿元,并且增长迅速。百度、阿里、腾讯等公司在2024年前三季度的总资本开支约为867亿元人民币,预计到2027年,这一数字将达到1767亿元,年复合增长率超过26%。这些资金预计将有很大一部分流向AI大模型的发展。
尽管DeepSeek以其实力证明了“小力出奇迹”的可行性,但科技巨头们出于多种原因,仍然坚持“大力出奇迹”的路线。OpenAI最新发布的o3-mini模型,在物理推理等多项指标上已经超越了R1,而更强大的o3标准版也即将问世。这再次证明了“尺度定律”在AI大模型中的重要地位,而“小力出奇迹”并非普遍适用的法则。
面对DeepSeek的崛起,美国科技巨头们虽然在表面上对其技术赞叹不已,但在战略层面并未跟随其“小力出奇迹”的策略。相反,他们加大了资金投入的力度。谷歌不仅向AI明星创业公司Anthropic追加了投资,还在全球范围内扩展其AI基础设施。OpenAI则在发布o3-mini后,迅速宣布了“星际之门”计划,并在短时间内取得了显著进展。
在国内,字节、阿里、腾讯等公司也在AI大模型领域展开了激烈的竞争。字节近两年在AI领域投入重金,不仅在研发费用和人才成本上大幅增加,还在B端和C端同时烧钱,力图争夺更多企业和个人用户。阿里同样在AI基础设施上投入了大量资金,并投资了多家AI创业公司。腾讯则在过去六年中投入超过2850亿元用于研发,其中很大一部分投向了AI领域。
尽管DeepSeek的“小力出奇迹”并未改写科技巨头们大手笔投入AI大模型的局面,但它确实为行业带来了新的启示。越来越多的云服务厂商开始接入DeepSeek大模型,希望借助其流量和技术优势,为自己争取更多的关注度和新用户。同时,大厂们也开始尝试与DeepSeek等新兴公司合作,从中获得技术、产品等方面的启发。
然而,随着竞争对手以新一代模型反击,以及自身规模扩大带来的种种问题,DeepSeek正面临被全面反超的危险。产品上,DeepSeek的大模型幻觉问题频繁出现,严重影响了用户体验。同时,短时间内涌入的全球用户也让DeepSeek的基础设施承受了巨大压力。这表明,“小力出奇迹”或许可以节约模型训练的成本,但在模型投入使用后,必要的基础设施成本仍然无法压减。
总的来说,AI大模型领域的竞争远未分出胜负。DeepSeek的“小力出奇迹”虽然为行业带来了新的发展路径,但手握重金的科技巨头们仍然是AI大模型的主要参与者。高性价比路线与“大力出奇迹”路线之争仍将持续下去,并在互相借鉴和融合中,推动AI大模型不断迈向新的发展阶段。