随着人工智能领域的技术竞赛日益激烈,一场由DeepSeek R1引发的推理模型大战正全面展开,吸引了众多科技巨头的加入。
近期,这场战役再度升级,短短一天之内,四家知名大模型公司宣布加入战局。阿里巴巴率先发布了推理模型QwQ-Max-Preview的预览版,紧随其后,Anthropic推出了全球首个“混合推理”模型Claude 3.7 Sonnet。有消息称字节跳动也在小范围内测试其自研的深度思考型推理模型豆包。而DeepSeek方面,据路透社报道,正加速推出R2模型,原计划于5月初发布的计划或将提前。
香港科技大学校董会主席、美国国家工程院外籍院士沈向洋指出,大模型的研究焦点已从GPT模式转向Reasoner模式,这是一种全新的学习范式。DeepSeek R1无疑成为了这场范式变革的关键参考。在此之前,腾讯已上线了自研的深度思考模型“混元T1”,百度文小言也推出了深度搜索功能,马斯克的xAI则发布了具备深度思考能力的Grok 3新模型。连OpenAI都开放了自家推理模型o1和o3-mini的思维链,以应对DeepSeek带来的压力。
这场技术迭代的新浪潮,其影响力正逐渐波及全行业,与2023年各大厂商争相发布大模型以追赶ChatGPT的热潮颇为相似。当时,百度、阿里等科技大厂纷纷推出自家大模型,而王慧文携5000万美元开启了大模型创业热潮,吸引了杨植麟、王小川、李开复等创办明星大模型公司。然而,在ChatGPT时代稍显落后的字节跳动,在追赶DeepSeek的道路上似乎又慢了半拍。国内其他科技大厂已相继展示深度思考能力,而字节的自研推理大模型才刚刚进入灰度测试阶段。
尽管面临竞争压力,但DeepSeek R2可能提早发布的消息也给其他参与者带来了紧迫感。阿里的QwQ-Max-Preview预览版在LiveCodeBench编程测试中虽小幅超越OpenAI o1中档推理模型和DeepSeek R1预览版,但尚未推出正式版。QwQ-Max基于阿里的旗舰模型Qwen2.5-Max,后者在公开基准测试中性能超越DeepSeek V3。而Anthropic的Claude 3.7 Sonnet则是一个完整的模型,其表现超越了OpenAI o1和DeepSeek R1。
马斯克和阿里在模型尚未完备之际便急于推出,除了展示技术实力外,更重要的是抢在DeepSeek之前,利用其多模态尚不完善的时机,打出产品的差异化竞争优势。DeepSeek R1虽支持深度思考,但并非多模态推理大模型,不支持图片生成和语音模式。腾讯利用这一短板,在元宝内上线了图生文功能,通过自研模型的多模态能力加持,让DeepSeek也能理解图片内容。马斯克同样预告了Grok 3的语音模式,获得了Neuralink高管希冯·齐利斯的高度评价。
各大厂商坚持推出自家推理模型,背后是对用户市场的新一轮争夺。DeepSeek的崛起再次激发了大厂对AI to C的重视。阿里在发布QwQ-Max-Preview的同时,透露将推出Qwen Chat APP,优先考虑实时响应能力和生产力工具集成,旨在吸引全球受众。一旦成真,阿里将成为全球首个同时上线两款AI助手应用的科技大厂。而腾讯、百度则选择接入DeepSeek来争夺C端用户,但这一举措的潜在风险不容忽视。
为了彻底留住用户,自研大模型并在技术上带来体验突破成为最有效手段。这一策略同样适用于对B端开发者群体的争夺。各大厂商在自研大模型之余,相继发布了大模型服务平台,既做淘金者,又争当卖铲子的人,向AIGC时代的安卓梦想发起冲锋。包括腾讯、阿里、百度、字节在内,都表达了坚持大模型自研到底的决心,并加快了在开源上的进度。
DeepSeek方面,面对竞争对手纷纷开源的策略,选择了加码,相继开源了多个代码库和计算库,公开其低成本高性能的训练秘密。同时,关闭了20天的官方API充值服务也恢复正常,并发布特别提示,建议开发者在服务器资源相对空闲的时段进行API调用。
在这场推理模型竞赛中,唯一尚未对外大范围提供推理模型服务的科技大厂是字节跳动。对大模型技术演进路线的判断失误,或是其未能及时跟进推出新模型的原因之一。在ChatGPT爆火后,字节跳动也曾因对技术趋势判断不足而落后。不过,借助过去一年的大力补课,字节不仅在用户规模上取得了突破,而且在大模型性能和多模态布局上也追赶上了国内头部厂商。
如今,DeepSeek R1引发的推理模型热潮再次将追赶压力推到了字节跳动面前。而随着DeepSeek R2模型提早到来的消息传出,一众科技大厂都感受到了再被DeepSeek对比的紧张气氛,竞争愈发激烈。