大模型预训练“狼人杀”，谁悄然落后成悬念？-天脉网

在中国AI领域，一场关于大模型初创公司未来方向的深刻变革正在悄然上演。近期，市场传言称，被誉为“AI六小虎”的智谱AI、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰中，已有两家公司决定调整战略，逐步退出预训练模型的研发，转而聚焦AI应用领域。这一动态不仅揭示了当前AI行业的严峻挑战，也预示着大模型初创公司正面临前所未有的抉择。

预训练，作为AI模型构建的基础环节，其重要性不言而喻。它如同为模型打下坚实的语言和理解基础，使模型能够广泛学习语言的统计规律、语义知识等通用特征。这一过程类似于给一个孩子提供大量学习资料，让其通过广泛阅读和学习，积累丰富的知识储备。然而，预训练的高昂成本和不确定性，却让不少初创公司望而却步。据行业专家透露，当前顶级模型的训练成本已高达数亿甚至数十亿美元，且未来仍有上涨趋势。

对于资源丰厚的行业巨头而言，预训练是不可或缺的投入。马斯克为了提升自家xAI的Grok系列模型，不惜斥巨资购置了10万张GPU卡。然而，对于“AI六小虎”这样的初创公司来说，预训练的高门槛却成为了一道难以逾越的障碍。一方面，预训练需要强大的算力和高质量数据支持；另一方面，其复杂的算法和技术也对团队能力提出了极高要求。

预训练不仅是模型的地基，更是大模型公司技术实力的试金石。在预训练阶段，模型能够学习到广泛的语言理解能力和基础智能表现，为后续针对特定任务的微调提供坚实基础。GPT-3的成功便是一个典型例证，其通过海量数据的预训练，在自然语言处理任务中展现出了卓越的性能。然而，预训练的高成本和高门槛，也让不少初创公司开始重新审视自己的战略定位。

在“AI六小虎”中，智谱AI、零一万物、DeepSeek等公司凭借强大的技术实力和资源支持，继续在预训练领域深耕细作。智谱AI作为“清华系国家队”，在融资和算力方面得天独厚；零一万物则凭借李开复的深厚背景和AI Infra布局，在预训练领域取得了显著成果；DeepSeek背靠幻方量化，拥有上万张GPU资源，同样在预训练领域占据一席之地。然而，月之暗面、阶跃星辰、MiniMax等公司却开始逐步调整战略，转向AI应用领域。

在全球大模型竞技场（ChatBot Arena）等权威盲测平台上，零一万物的Yi-Lightning、智谱AI的GLM-4-Plus以及DeepSeek V2.5等模型取得了出色成绩，展现了中国大模型初创公司的技术实力。然而，月之暗面、MiniMax等公司却未在榜单上展现出显著进步，其基座模型的消息也显得颇为模糊。业内有声音指出，这些公司可能已转向利用开源模型进行调优和应用开发，以降低成本和提高投入产出比。

在当前行业基础模型过剩、破圈应用产品稀缺的背景下，不少初创公司开始重新审视预训练的价值。对于某些公司来说，利用开源模型进行调优和应用开发，或许是一个更为务实的选择。然而，这也意味着他们将放弃在预训练领域的竞争，将模型和应用的上限拱手让给开源模型。在这场关于预训练的豪赌中，什么样的玩家能够留在牌桌上，答案已经日渐清晰。

随着中美科技竞争的加剧，顶尖人才资源的争夺战也愈发激烈。多位猎头反馈称，自ChatGPT爆火之后，国内对于AI领域顶级研发人才的需求持续走高。字节跳动、零一万物等公司纷纷加大人才引进力度，以期在预训练领域取得突破。然而，随着竞争壁垒的不断提高，单靠挖角已难以解决根本问题。预训练人才的流动虽然频繁，但真正能够推动技术进步的，还是团队的整体实力和技术底蕴。

在这场变革中，中国大模型“小虎”们的道路已经出现分野。从预训练开始，技术领先者已经脱颖而出，而部分公司则开始寻找新的发展方向。无论是继续坚守预训练领域，还是转向AI应用开发，每家公司都在根据自己的实际情况和资源禀赋做出选择。在这场关乎未来的竞争中，谁能够笑到最后，还需拭目以待。

2014年还在高盛就职时，郑其森和都是从事价值投资的基金经理和老同学廖展鹏喝酒聊天。郑其森也对这样的情况表现出了理性思考，年轻人对金融大模型的接受度也许更高，但他们的C端客户目标还是在经验更为丰富，同时付…

滴滴企业版也在本次峰会上公布了最新的产品能力图谱、内测中的智能商旅助手，并宣布十周年回馈礼：即日起至12月31日，与滴滴企业版签约商旅服务的新客户，符合条件可享机酒火90天服务费全免；持续加大技术资源投入，…

据介绍，华为深度参与了长安汽车数智工厂的建设，并培养了300多名专业人才。中国联通汽车制造军团军团长周华表示：“在长安汽车数智工厂，5G网络已经从外围辅助走向了生产核心，打造了行业首个C2M（用户直连制造…

如今，我们每天都能看到各种 AI 新成果出炉，尤其是生成式 AI 和大模型领域，几乎每隔几天就有更强大的模型问世。在企业 AI市场竞争日益白热化的背景下，包括微软、IBM 和谷歌在内的科技巨头正在加速推出…

近两个月，即时零售这把火越烧越旺，京东和美团也开始向对方的腹地进攻——京东发力奶茶咖啡的即时配送品类，美团则是一口气宣布了和好几个大家电品牌的即时零售合作公告。在今年Q2的财报中，商品收入（通过京东平台销…

或许是认识到今年“618”大促中极致比价、仅退款带来的负面效应，或许是行业大佬的商业共识终于从幕后走到台前，原本愈演愈烈的电商价格战，在今年“双十一”竟然有了“熄火”的迹象。但更重要的是，对电商平台而言，低…

三湘都市报10月22日讯（全媒体记者潘显璇）10月21日20时点，2024年天猫“双11”正式开售，品牌商品开局即迎来爆发，174个品牌成交破亿，超12000个品牌成交增速超100%，近6000个品牌增速超…

21日晚，本来是天猫“双11”预售付尾款的日子，但却被“双11退款”抢了“风头”。有消费者就对媒体表示，退货其实也是无奈之举，自己当时下单时明明感觉享受到了最低价，但收到货后却发现，好像还能通过更巧妙的优…

如今，类似的“降维打击”也同样发生在视频行业：6月以来，从换脸到拟声，从玄幻到仿真，Adobe、快手可灵、智谱清影等海内外AI视频模型迎来了密集的发布期，在成本方面对传统的视频行业形成了颠覆。其中，数据是训…

北京的90后上班族，唐妍在地铁上看了几眼手机，已经被跳转到淘宝抖音京东各几次，而单手玩手机误触广告的几率就会翻倍，她把手机揣回衣兜里，抬头发现地铁里也到处都是促销广告。不过，无论哪个主播再声称自己有“全网…

其次，昨晚Anthropic发布的3.5新版本操作computer，其实也是agent。更不用说，老黄在BG2上的对话，也提到“我们很快会看到可用的agent” o1这种reasoning model，…

这也意味着，阿里和京东这两大电商巨头，都要抛弃超市业态了。几年前，在新零售和O2O的热潮下，电商巨头热衷于线上线下结合，试图利用互联网改造实体行业，京东入股永辉，阿里控股大润发，巨头获得了线下支撑，超市有…

2023年，更是有部分用户联合起来并合并其他同类案件，以公司关于其摄像头产品的安全性和隐私特性声明不准确，存在虚假、误导性宣传为由提起诉讼，请求判令安克赔偿损失、停止非法行为等。 2023年，公司也曾因为产…

今年阿里国际站在跨境资金交易服务领域更是动作频频，与全球支付巨头万事达卡达成合作，面向美国市场推出首张B2B电商平台联名商务信用卡；面向欧美市场全覆盖欧美三大先买后付品牌（Klarna、 Afterpay、P…

正值双十一和秋冬换季的大背景，资深小红书用户小陆发现当自己在平台内搜完某服装品牌平替的关键词后，多个主打低价或代档口批发的服饰直播间便推送到她主页。新红数据显示，近15天，在单场直播涨粉数排名前10的服饰…