斯坦福新突破：50美元打造AI推理模型s1，媲美业界顶尖-天脉网

人工智能领域近期迎来了一项重大进展，斯坦福大学与华盛顿大学的科研团队携手打造了一款名为s1的人工智能模型，该模型以不到50美元的云计算成本（按当前汇率换算约为364元人民币）展现了卓越的推理能力。

据悉，s1模型在数学与编程能力测试中，表现与OpenAI的o1、DeepSeek的r1等业界顶尖推理模型不相上下。更为引人注目的是，s1模型及其相关的训练数据和代码已在GitHub平台上全面开源，为全球开发者提供了一个宝贵的研究和使用资源。

s1团队透露，他们采用了“蒸馏”技术来创建这款模型。该技术通过让模型学习另一个AI模型的答案，从而提炼出其核心推理能力。具体而言，s1模型是从谷歌提供的Gemini 2.0 Flash Thinking Experimental模型中蒸馏而来。值得注意的是，上个月加州大学伯克利分校的研究人员也运用了相同的蒸馏方法，以约450美元的成本开发出了一款AI推理模型。

随着s1等类似模型的涌现，人工智能领域的商品化问题逐渐浮出水面。当有人能够以极低的成本复制出价值数百万美元的模型时，大型科技公司的竞争优势无疑受到了挑战。这一问题在业界引发了广泛的关注和讨论。

面对这一挑战，大型AI实验室纷纷表达了自己的担忧。例如，OpenAI曾指责DeepSeek不当获取其API数据用于模型蒸馏。而s1团队则专注于探索实现强大推理性能和“测试时扩展”的最简洁途径，这些正是OpenAI的o1模型所取得的突破。为了实现这一目标，s1团队采用了监督微调（SFT）方法，该方法使用较小的数据集来蒸馏推理模型，相较于DeepSeek用于训练R1模型的大规模强化学习方法，SFT更具成本效益。

谷歌通过其Google AI Studio平台免费提供Gemini 2.0 Flash Thinking Experimental模型的访问权限，但设有每日使用限制。然而，其使用条款明确禁止对模型进行逆向工程，以开发与谷歌自身AI产品竞争的服务。尽管如此，s1团队还是巧妙地利用了这一资源，基于阿里巴巴旗下中国人工智能实验室Qwen提供的一款小型、现成的免费AI模型，成功训练出了s1。

在训练过程中，研究人员精心策划了一个包含1000个问题及其答案的数据集，并收集了谷歌Gemini 2.0 Flash Thinking Experimental对每个答案背后“思考”过程的输出。他们使用了16个Nvidia H100 GPU，仅耗时不到30分钟便成功训练出了s1模型。据参与该项目的斯坦福大学研究员透露，目前租用这些计算资源的成本约为20美元，这一低廉的成本再次凸显了s1模型的性价比优势。

为了进一步提升s1的性能，研究人员还采用了一个创新的技巧：在推理过程中让s1“等待”。论文显示，在s1的推理步骤中添加“等待”一词，有助于模型获得更为准确的答案。这一发现为AI模型的优化提供了新的视角和思路。

青年AI科学家、上海交通大学人工智能学院谢伟迪副教授告诉《科创板日报》记者，如果仔细研究斯坦福s1的论文会发现，s1模型的神奇是以通义千问模型为基座进行微调，这1000个样本训练的作用更像是“锦上添花”，而…

小红书直播是面向博主和企业账号的实时互动工具，助力企业通过直播分享内容、增强粉丝粘性并实现变现。同时，要做好直播预告，可利用【瞬间】功能或撰写直播预告笔记提前2- 3天告知粉丝直播时间、主题和福利等信息，…

西方长期以来在科技领域的霸权思维，让他们妄图用技术封锁、贸易限制等手段，遏制中国科技企业的发展。这是对西方科技霸权的有力回击，是向全世界宣告：中国科技，不是那么容易被打倒的！因为他们在资金等条件上同样捉…

例如，生数科技依托百度百舸高效、稳定、混合多芯的能力，得以在短时间内完成了Vidu大模型的上线和开放API，其素材渲染加速效率提升3倍，数据拉取效率提升51倍；长安汽车通过与百度智能云的深度合作，让自动驾驶…

小红书在实时翻译、内容审核与管理等方面仍面临一定挑战,但平台已在积极推进相关工作,力求为海外用户提供更加便捷、高效的服务。 TikTok难民的转战为小红书带来了发展机遇,也为短视频产业链上的企业提供了更多投资…

今年1月21日，潮新闻就报道过，当天阿里拍卖平台上两套关注度很高的豪宅法拍房——一套是杭州上城区南星桥沿江板块的蓝色钱江，另一套是上城区江河汇板块的万科大都会79号（备案名：都会天际），都因为“当事人达成执…

春节营销场景，通常聚焦三类：一是春晚，作为春节顶级流量平台，曝光价值无可替代；二是春运，承载国人对节日团圆的执着、对家乡和亲人的思念等复杂情绪，适合品牌讲故事；三是拜年，在走亲访友、互道问候的场景中，品牌都…

作为一家AI研究和部署公司，OpenAI对具身智能也保持着高度关注，除了与FigureAI的合作，还投资了具身智能初创企业1X和Physical Intelligence。即使是低计算版本的 o3，其在基…

在零售、金融、物流、交通、工业等多个领域，通过解耦京东内部的智能体实践，京东云向产业输送了大量的AI生产力，助力更多企业实现数智化提效升级。京东云为其提供了包含办公场景和研测场景的多个开箱即用智能体和一站式智…

例如，某款产品的推广可能在某些市场表现出色，但在其他市场效果平平时，品牌应该根据数据分析的结果，调整KOL的选择和推广内容的风格，以便在不同地区优化效果。通过选择合适的KOL、制定具有吸引力的内容、跨平台联…

第四家，昊志机电，掌握了六维力矩传感器、无框力矩电机和谐波减速器等人形机器人核心零部件技术，预告净利润增长144.34%。最后一集实力更强，不便这里多讲，大家转移到蚣众号：市霏说，公司是国内行星滚柱丝杠的…

“AI智能体市场前景非常广阔，智能体衔接模型层与应用层，是现阶段AI大模型应用落地的重要补充，可以应用在多类场景。”“下一步我们会把星辰智能体平台结合星辰大模型一起落地到50个省、专公司，并进一步扩展到集团外…

新浪科技讯 2月6日上午消息，新浪科技独家获悉，全球顶尖人工智能科学家许主洪教授（StevenHoi）已加入阿里巴巴，出任阿里集团副总裁，负责AI To C业务的多模态基础模型及Agents相关基础研究与应…

天眼查App显示，近日，猩便利关联公司哦加哦网络科技（上海）有限公司发生工商变更，王兴、叶树蕻退出股东行列。该公司成立于2017年6月，法定代表人为司江华，注册资本5000万人民币，经营范围含计算机软硬件、…

针对企业在发展过程中已经沉淀下来的高质量资产，平台需要提供适当的方式来接入；此外，企业的专业开发人员应有办法为低代码应用定制高级功能。企业软件往往涉及到用户的敏感数据和信息，如个人身份信息、财务信息、医疗记录…