近期,人工智能领域再度掀起波澜,三大重要动态接连曝出,中国科技企业的声音愈发响亮。
阿里巴巴通义平台发布RL新模型
阿里巴巴通义平台如约在本周推出了全新的RL(强化学习)模型。这款32B参数的模型在性能上直逼DeepSeek R1的满血版本,尤其在AIME24数学能力评测集和LiveCodeBench代码能力评估中,其表现与DeepSeek-R1不相上下,远超o1-mini及同尺寸R1蒸馏模型。用户现已可通过通义APP及网页端亲身体验这一创新成果。
尤为此次RL模型的训练效率显著提升。据阿里内部人士透露,与传统奖励模型不同,该模型通过验证生成答案的准确性为数学问题提供即时反馈,大大缩短了训练周期。
高性能大模型的本地化部署门槛也进一步降低。如今,仅需一台配备4090显卡或内存超过24G的Mac mini(苹果架构下内存与GPU可共享)即可完成部署,且在国家补贴政策下,成本控制在四位数以内。
Mac Studio实现DS-R1本地化满血运行
另一边,苹果发布的Mac Studio以约7万元人民币的价格,实现了DS-R1模型的本地化满血运行,预计处理速度可达20token/s。这一变化标志着R1满血本地化门槛从70多万元大幅降至7万元左右,为更多用户提供了尝试高端AI模型的机会。
Manus AI团队打造的Agent引发热议
与此同时,由Monica团队打造的Manus AI Agent在社交媒体上广泛传播,尽管不乏营销痕迹,但无疑加深了市场对Agent能力的认知和期待。这一动态进一步提升了应用端对AI技术的渴求,算力需求随之激增。
这一系列事件无疑将重塑市场对AI的叙事格局。随着RL大规模强化学习scaling law的显现,以阿里巴巴为代表的中国科技企业正迎来新一轮的价值重估,预示着智能硬件能力的飞跃和应用需求的爆发即将到来。