在AI领域的竞技场上,一场由DeepSeek R1引发的推理模型大战正如火如荼地进行,吸引了众多科技巨头的加入,使得战局愈发激烈。
就在近日,这场战役再添新成员,四家知名大模型公司相继宣布加入。阿里巴巴率先推出了其推理模型QwQ-Max-Preview的预览版,紧随其后,Anthropic推出了全球首个“混合推理”模型Claude 3.7 Sonnet。同时,有消息称字节跳动也在小范围内测试其自研的深度思考型推理模型豆包。这一系列动作无疑为这场大战增添了更多看点。
而作为这场大战的焦点,DeepSeek也有了新动向。据路透社报道,DeepSeek正加速推出R2模型,原计划于5月初发布的计划或将提前。这一消息无疑为整个行业带来了新的期待与压力。
香港科技大学校董会主席、美国国家工程院外籍院士沈向洋指出,大模型的研究焦点已从GPT模式转向Reasoner模式,这是一种全新的学习范式。DeepSeek R1无疑成为了这场范式变革的重要参考对象。在此之前,腾讯、百度等科技大厂也已纷纷推出了自研的深度思考模型与功能,马斯克的xAI也发布了具备深度思考能力的Grok 3新模型。甚至连OpenAI也开放了自家推理模型的思维链,以应对DeepSeek带来的挑战。
这一波推理模型技术的迭代,其影响力正逐渐波及全行业,与2023年行业对ChatGPT的追捧颇为相似。当时,百度、阿里等大厂争相发布自家大模型,大模型创业热潮席卷全行业。然而,在ChatGPT时刻就稍显落后的字节跳动,如今在追赶DeepSeek的道路上似乎又慢了半拍。国内其他科技大厂已相继亮相深度思考能力,而字节的自研推理大模型才刚刚进入灰度测试阶段。
不过,尽管面临竞争压力,但字节并非孤军奋战。那些抢在字节前面发布推理模型的同行们,也并未能松一口气。阿里的新推理模型QwQ-Max-Preview目前仍只是预览版,在LiveCodeBench编程测试中,其表现也只是小幅超越OpenAI o1中档推理模型及DeepSeek R1预览版。而正式版将在后续推出。
与阿里不同,Anthropic发布的Claude 3.7 Sonnet则是一个完整的模型,其在指令遵循、通用推理、多模态能力以及智能体编码方面的表现均超越了OpenAI o1和DeepSeek R1。马斯克和阿里在模型尚未完备之际就急于推出,除了展示技术实力外,更重要的是抢在DeepSeek之前,利用其多模态尚不完善之际,打出产品的差异化竞争优势。
这场推理模型的竞赛,实质上是一场对用户的新争夺战。DeepSeek的崛起再次激发了大厂对AI to C的重视。阿里在发布推理模型的同时,还透露了将发布Qwen Chat APP的消息,旨在通过专用APP提供实时响应与先进AI功能,以吸引全球受众。
在自研大模型的同时,科技大厂们也纷纷推出了大模型服务平台,既做淘金者,又争当卖铲子的人。为了聚拢开发者生态,大厂们加快了开源进度。阿里宣布将以Apache2.0许可协议开源自家推理模型,百度也开始重新拥抱开源路线。腾讯、字节也在推动旗下垂类模型陆续开源。
面对竞争对手的开源策略,DeepSeek选择了加码,相继开源了多个代码库和计算库,将低成本高性能的训练秘密公之于众。同时,DeepSeek官方API充值服务也恢复正常,并提醒开发者在服务器资源相对空闲的时段进行API调用以获得更流畅的体验。
而DeepSeek R2新模型提速发布的消息,则成为了其应对这轮推理模型竞赛的新武器。目前,唯一尚未对外大范围提供推理模型服务的科技大厂,仅剩字节跳动。在大模型技术演进路线的判断上出现的失误,或许是字节未能及时跟进推出新模型的原因之一。字节跳动CEO梁汝波在内部会议上反思称,未能及时复现OpenAI o1的长链思考模式,错过了更早实现的机会。
尽管面临追赶压力,但借助大模型技术迭代趋缓的利好因素,字节跳动在过去一年大力补课,不仅在用户规模上取得了突破,而且在大模型性能和多模态布局上也追赶上了国内头部厂商。然而,随着DeepSeek R2模型的提早到来,一众科技大厂都面临着再被DeepSeek对比的紧张气氛。