在中国AI领域,一场关于大模型初创公司未来方向的深刻变革正在悄然上演。近期,市场传言称,被誉为“AI六小虎”的智谱AI、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰中,已有两家公司决定调整战略,逐步退出预训练模型的研发,转而聚焦AI应用领域。这一动态不仅揭示了当前AI行业的严峻挑战,也预示着大模型初创公司正面临前所未有的抉择。
预训练,作为AI模型构建的基础环节,其重要性不言而喻。它如同为模型打下坚实的语言和理解基础,使模型能够广泛学习语言的统计规律、语义知识等通用特征。这一过程类似于给一个孩子提供大量学习资料,让其通过广泛阅读和学习,积累丰富的知识储备。然而,预训练的高昂成本和不确定性,却让不少初创公司望而却步。据行业专家透露,当前顶级模型的训练成本已高达数亿甚至数十亿美元,且未来仍有上涨趋势。
对于资源丰厚的行业巨头而言,预训练是不可或缺的投入。马斯克为了提升自家xAI的Grok系列模型,不惜斥巨资购置了10万张GPU卡。然而,对于“AI六小虎”这样的初创公司来说,预训练的高门槛却成为了一道难以逾越的障碍。一方面,预训练需要强大的算力和高质量数据支持;另一方面,其复杂的算法和技术也对团队能力提出了极高要求。
预训练不仅是模型的地基,更是大模型公司技术实力的试金石。在预训练阶段,模型能够学习到广泛的语言理解能力和基础智能表现,为后续针对特定任务的微调提供坚实基础。GPT-3的成功便是一个典型例证,其通过海量数据的预训练,在自然语言处理任务中展现出了卓越的性能。然而,预训练的高成本和高门槛,也让不少初创公司开始重新审视自己的战略定位。
在“AI六小虎”中,智谱AI、零一万物、DeepSeek等公司凭借强大的技术实力和资源支持,继续在预训练领域深耕细作。智谱AI作为“清华系国家队”,在融资和算力方面得天独厚;零一万物则凭借李开复的深厚背景和AI Infra布局,在预训练领域取得了显著成果;DeepSeek背靠幻方量化,拥有上万张GPU资源,同样在预训练领域占据一席之地。然而,月之暗面、阶跃星辰、MiniMax等公司却开始逐步调整战略,转向AI应用领域。
在全球大模型竞技场(ChatBot Arena)等权威盲测平台上,零一万物的Yi-Lightning、智谱AI的GLM-4-Plus以及DeepSeek V2.5等模型取得了出色成绩,展现了中国大模型初创公司的技术实力。然而,月之暗面、MiniMax等公司却未在榜单上展现出显著进步,其基座模型的消息也显得颇为模糊。业内有声音指出,这些公司可能已转向利用开源模型进行调优和应用开发,以降低成本和提高投入产出比。
在当前行业基础模型过剩、破圈应用产品稀缺的背景下,不少初创公司开始重新审视预训练的价值。对于某些公司来说,利用开源模型进行调优和应用开发,或许是一个更为务实的选择。然而,这也意味着他们将放弃在预训练领域的竞争,将模型和应用的上限拱手让给开源模型。在这场关于预训练的豪赌中,什么样的玩家能够留在牌桌上,答案已经日渐清晰。
随着中美科技竞争的加剧,顶尖人才资源的争夺战也愈发激烈。多位猎头反馈称,自ChatGPT爆火之后,国内对于AI领域顶级研发人才的需求持续走高。字节跳动、零一万物等公司纷纷加大人才引进力度,以期在预训练领域取得突破。然而,随着竞争壁垒的不断提高,单靠挖角已难以解决根本问题。预训练人才的流动虽然频繁,但真正能够推动技术进步的,还是团队的整体实力和技术底蕴。
在这场变革中,中国大模型“小虎”们的道路已经出现分野。从预训练开始,技术领先者已经脱颖而出,而部分公司则开始寻找新的发展方向。无论是继续坚守预训练领域,还是转向AI应用开发,每家公司都在根据自己的实际情况和资源禀赋做出选择。在这场关乎未来的竞争中,谁能够笑到最后,还需拭目以待。