朱松纯谈AI：大模型丑陋，通用智能体需自主成长-天脉网

在人工智能领域的喧嚣中，朱松纯以其独特的视角成为了少数派的一员。

他深信，科学的真谛在于用简洁的模型揭示复杂现象的本质。诸如杨振宁、爱因斯坦等科学巨匠，他们构建的理论框架往往仅包含寥寥几个参数。反观当下的大模型，动辄拥有百亿、千亿级别的参数，且难以解释其运作机制。“从这一视角审视，它们的确显得相当笨拙。”朱松纯坦言。

然而，他也承认，从工程实践的角度来看，大模型在某些特定任务上确实能够取得不俗的表现。

近期，朱松纯与北京通用人工智能研究院（通研院）及北京大学的多位学者共同编纂了《通用人工智能标准、评级、测试与架构》一书，为通用人工智能领域提出了全面的标准、评级、测试与架构体系，该体系同样适用于大模型。

书中提出的评测体系对智能的定义更为严格。一个智能体不仅要能够完成任务，还需具备自主定义任务的能力。这意味着，智能体无法像在其他评测体系中那样，通过针对性地优化来“刷榜”。

回顾过去二十年，刷榜几乎成为了人工智能发展历程上的一个标签。朱松纯也曾是这一潮流中的一员。2004年，他与全球计算机领域的顶尖科学家沈向洋在湖北共同创立了莲花山研究院，成为最早大规模从事大数据标注的机构之一。

然而，随着对通用泛化任务理解的深入，朱松纯开始意识到，刷榜的方法可能是一条死胡同。因为通用泛化任务本质上是一个无穷无尽的任务集合。例如，训练一个机器人学会抓取杯子可能很容易，但一旦杯子的位置、重量或尺寸发生变化，机器人就可能无法识别。

在打破了对刷榜的迷信后，朱松纯开始探索新的道路。2017年，他提出了“小数据、大任务”范式，其核心在于“为机器赋予心灵”，让智能体能够自主地构建物理世界的感知。

在这一理论框架下，通研院仅用10张显卡就训练出了由价值和因果驱动的智能体“通通”。截至今年，“通通”的智商和情商已相当于一个五岁左右的小女孩，能够一定程度上理解周围环境，并拥有自己的个性，甚至会耍赖、撒谎。

相比之下，一些大模型在特定领域如司法考试、数学、编程、法律等方面的表现已接近人类博士的平均水平，甚至在医学考试中的正确率超过了大多数医学博士考生。然而，朱松纯认为，这些能力更多地属于专业能力而非通用泛化能力。大模型给出的答案可能是猜测、刷题或死记硬背的结果。而拥有认知架构的通用智能体，尽管目前可能显得幼稚，但却具备自主性和成长性。

朱松纯多次强调，中国需要形成自己的AI叙事，不能盲目追随硅谷的模式，仅仅依靠堆算力和数据。他呼吁中国要找到一条适合自己的路线，进行原创性研究。

在搜狐科技的采访中，朱松纯进一步阐述了他对大模型态度的转变。他表示，虽然从科学的角度来看，大模型显得笨拙且难以解释，但从工程实践的角度来看，它们确实能够产生一定的效果。

当被问及为何将大模型纳入评测体系时，朱松纯指出，评测体系需要涵盖所有类型的智能体。从目前的测试结果来看，大模型的效果并不理想。

针对“小数据、大任务”范式所遭受的质疑，朱松纯表示，这些质疑往往来自于习惯于刷榜的科研人员。他强调，追求简约和美的科学本质并未改变，这也是他们提出CUV架构（认知架构、价值函数和效用函数）的初衷。

某头部MCN机构运营总监透露，其旗下母婴类矩阵账号通过跨领域导流，单月涨粉量提升47%。某家居品牌实操案例显示，搭建包含1个主账号+6个子账号的矩阵体系后，三个月内自然流量占比从35%提升至68%，通过AI…

由于受众习惯俄语用户往往更信任本土中小网红，因此企业需要锚定中小型垂类达人，合作原生俄语网红/KOL/KOC，才能实现深度种草与精准渗透。

阿里通义万相宣布 “首尾帧生视频模型” 开源。在训练阶段，团队构建了专门用于首尾帧模式的训练数据，同时针对文本与视频编码模块、扩散变换模型模块采用并行策略，提升了模型训练和生成效率，保障了高分辨率视频生成效…

在不动产行业，我们也有一些初步的研究，抛砖引玉，按照华为AI实践经验来说，要围绕着企业BI生产业务流，从设计、勘察到施工、运营、物业管理等业务领域去找应用场景，我在设备预测维护、节能减排等领域也基于华为自身…

在谭待看来，基础信息处理能力的提升以及成本的下降让豆包大模型从去年到今年获得了快速增长，今年模型在深度思考能力上的突破又带来新的增长。其中，豆包UI-TARS模型将屏幕视觉理解、逻辑推理、界面元素定位和操作整…

该智能体基于视觉-语言模型构建，具备在虚拟世界中高效执行各类任务的能力，并较前代版本显著增强了高阶推理能力。 UI-TARS-1.5在字节跳动此前提出的原生智能体方案 UI-TARS 的基础上，引入了强化学…

从 Shawn 和柳毅的故事里，不难看出，能够精准地链接一批有需求的用户，是让这一批开发者留下来的直接原因。小红书相关负责人也在昨天的「独立开发大赛」颁奖现场透露了下一步计划，将搭建相关产品能力，简化…

。近日，上饶跨境电商生态大会暨上饶市跨境电子商务综合服务平台启动仪式在上饶高铁经济试验区举行。本次大会以“重构跨境电商生态·赋能数字产业升级”为主题，京东、谷歌、亚马逊、阿里巴巴等海内外知名跨境电商平台…

未来，随着抖音平台的不断发展和电商市场的日益壮大，裕庆嘉源将继续深耕抖音电商领域，不断创新服务模式，提升服务质量，为客户创造更大的价值。总的来说，四川裕庆嘉源商务信息咨询有限公司的抖音电商服务以其专业性、…

据悉，2026年4月15日起瓜瓜龙启蒙将停止服务，停止服务后将对用户的个人信息进行删除或匿名化处理。2024年10月，瓜瓜龙就曾宣布关停服务，但后续又取消了这一决定。从2024年10月发布关停通知后，就有…

Aifeex作为一家创新科技公司，在人工智能技术的深度应用上走在前沿，已经成功开发了一系列深度学习和自然语言处理的算法模型，在教育、数据分析、图像识别、自然语言理解等多个方面展现出了卓越的性能。相信随着技术的…

从今天的敦煌网、淘宝爆火，以及以往数据（SHEIN 全球年营收破 500 亿美元，美国市场占比近三成；Temu则在一年多内拿下美国折扣零售领域 17% 市场份额）来看，老外对便宜实惠的诱惑抵抗不了，卖家可…

2024年思恩客服务的项目中，有73%通过AI技术实现营销成本下降与效能提升的双重突破，凭借“品类延伸+AI工具提效”的创新实践，其打造的某生活方式互联网平台客户效果营销案例实现激活量环比提升102.3%，激…

在短剧刚刚从抖音、快手等短视频平台内部发芽之际，“优爱腾”等长视频平台多少有些不以为然，道理很简单，他们一致认为，低质量、套路化的短剧与精品长剧的受众分层明显，构不成竞对关系，内部虽有上线短剧内容，却也仅是防…

特别是欧洲市场对于高品质、个性化商品的需求日益增长，以及对于环保、可持续产品的偏好，为拥有本土发货能力和创新能力的卖家提供了前所未有的机遇。未来，随着欧洲市场的不断成熟和消费者需求的持续升级，拥有本土发货能力…