DeepSeek震撼AI界，谷歌等巨头为何仍坚持“氪金”之路？-天脉网

近期，AI大模型领域迎来了一场震撼业界的革命，新兴公司DeepSeek凭借其开源模型R1，以极低的训练成本实现了与OpenAI旗舰模型o1相近的性能。这一“小力出奇迹”的壮举，不仅在全球范围内引发了广泛关注，也让人们对大型科技公司巨额的AI研发开支产生了新的质疑。

然而，尽管DeepSeek的冲击波让科技巨头们一时惊愕，但他们并未因此改变策略。相反，这些巨头们正挥舞着支票簿，企图通过疯狂的资金投入，重新夺回AI大模型的制高点。谷歌母公司Alphabet在最近发布的2024年第四季度财报中宣布，2025财年的资本支出将达到750亿美元，以加速其人工智能战略的扩展。这一数字远远超出了华尔街的预期，彰显了谷歌在AI领域的雄厚实力。

微软也不甘落后，宣布将在2025财年投资800亿美元建设AI数据中心，创下公司历史上的单笔投资最高纪录。社交网络巨头meta同样宣布了高达600亿至650亿美元的投资计划，旨在大幅扩张其AI团队，并推动meta AI服务覆盖10亿人，同时让Llama 4成为行业领先的大模型。OpenAI则携手软银、甲骨文、微软等企业，计划投资5000亿美元成立“星际之门”，专注于AI基础设施的建设与运营。

相比之下，国内科技巨头在AI大模型上的投入虽然规模较小，但也动辄数百亿元，并且增长迅速。百度、阿里、腾讯等公司在2024年前三季度的总资本开支约为867亿元人民币，预计到2027年，这一数字将达到1767亿元，年复合增长率超过26%。这些资金预计将有很大一部分流向AI大模型的发展。

尽管DeepSeek以其实力证明了“小力出奇迹”的可行性，但科技巨头们出于多种原因，仍然坚持“大力出奇迹”的路线。OpenAI最新发布的o3-mini模型，在物理推理等多项指标上已经超越了R1，而更强大的o3标准版也即将问世。这再次证明了“尺度定律”在AI大模型中的重要地位，而“小力出奇迹”并非普遍适用的法则。

面对DeepSeek的崛起，美国科技巨头们虽然在表面上对其技术赞叹不已，但在战略层面并未跟随其“小力出奇迹”的策略。相反，他们加大了资金投入的力度。谷歌不仅向AI明星创业公司Anthropic追加了投资，还在全球范围内扩展其AI基础设施。OpenAI则在发布o3-mini后，迅速宣布了“星际之门”计划，并在短时间内取得了显著进展。

在国内，字节、阿里、腾讯等公司也在AI大模型领域展开了激烈的竞争。字节近两年在AI领域投入重金，不仅在研发费用和人才成本上大幅增加，还在B端和C端同时烧钱，力图争夺更多企业和个人用户。阿里同样在AI基础设施上投入了大量资金，并投资了多家AI创业公司。腾讯则在过去六年中投入超过2850亿元用于研发，其中很大一部分投向了AI领域。

尽管DeepSeek的“小力出奇迹”并未改写科技巨头们大手笔投入AI大模型的局面，但它确实为行业带来了新的启示。越来越多的云服务厂商开始接入DeepSeek大模型，希望借助其流量和技术优势，为自己争取更多的关注度和新用户。同时，大厂们也开始尝试与DeepSeek等新兴公司合作，从中获得技术、产品等方面的启发。

然而，随着竞争对手以新一代模型反击，以及自身规模扩大带来的种种问题，DeepSeek正面临被全面反超的危险。产品上，DeepSeek的大模型幻觉问题频繁出现，严重影响了用户体验。同时，短时间内涌入的全球用户也让DeepSeek的基础设施承受了巨大压力。这表明，“小力出奇迹”或许可以节约模型训练的成本，但在模型投入使用后，必要的基础设施成本仍然无法压减。

总的来说，AI大模型领域的竞争远未分出胜负。DeepSeek的“小力出奇迹”虽然为行业带来了新的发展路径，但手握重金的科技巨头们仍然是AI大模型的主要参与者。高性价比路线与“大力出奇迹”路线之争仍将持续下去，并在互相借鉴和融合中，推动AI大模型不断迈向新的发展阶段。

阿里内部系统显示，许主洪教授目前已被归类为管理层，尽管其直属团队尚未明确，但职级可能达到P10或P11级别。许主洪教授的加入，将为阿里巴巴在智能信息、机器学习和人工智能应用等领域带来新的技术创新和战略布局…

1）2010-2014年0-1纯主题投资：消息催化，涨幅空间1倍，沾边普涨（电池电机电控充电桩），特斯拉映射标的领涨；2）2015-2017年1-10初期放量行情：政策推动放量，涨幅2-3倍，供应紧缺环节…

近日，红星资本局注意到，DeepSeek爆火之后，社交平台上涌现出一批与之相关的培训课。红星资本局发现，DeepSeek爆火之后，社交平台上涌现出一批与之相关的培训课程。在DeepSeek培训课火热时，用户…

训练人工智能模型需要强大的计算能力，而英伟达GPU在这方面处理得更好。这款新处理器旨在与业界顶级人工智能芯片英伟达（Nvidia）的Blackwell B200竞争。它的成本效益战略和华为在硬件方面的进步可能…

首先，突破硬件扩展性瓶颈，如卡间互联的拓扑限制，避免通信带宽成为瓶颈；同时，围绕芯片及集群功耗，基于万卡规模常规方案功耗可达十兆瓦或更高，采用创新性散热方案，从而解决万卡集群的能效与散热问题；完善模型的分布…

作为货架电商的淘宝和京东，淘宝在巩固自身强大社交属性的基础上，进一步拓展了新的消费场景；京东则借助“回礼”“群送礼”功能，增强了平台的互动性和转化率，并且凭借其出色的物流服务，进一步强化了在消费者心中的品牌…

预告直播有两种方式，使用【瞬间】功能或撰写直播预告笔记，提前2 - 3天发布，明确直播时间、主题、内容亮点及观看方式，还可利用预约功能和私信群发（满足一定门槛）通知粉丝，在其他平台分享预告笔记唤醒老用户。直播…

数据显示，春节假期，来自异地用户的休闲玩乐订单同比增长近4成，成都、长沙、重庆、北京、沈阳、西安、武汉、天津、哈尔滨、上海位居异地用户玩乐消费TOP10城市。首个非遗中国年，“非遗手工体验”相关搜索量同比暴涨…

袁子弹对曹小芸的坚韧和创业精神深感敬佩，两人一见如故，逐渐在共同的事业中建立了深厚的信任和合作关系。加入深爱榜后，曹小芸不仅在商业发展和新闻报道方面发挥了重要作用，更带领团队在人工智能领域进行探索和创新。他…

每经AI快讯，天眼查App显示，近日，长春智象探微科技有限公司成立，法定代表人为温梦卿，注册资本100万人民币，经营范围含互联网数据服务、企业管理咨询、新鲜蔬菜批发、水产品批发、食用农产品零售、针纺织品及原料…

三、如何选择适合的跨境电商ERP平台选择适合的跨境电商ERP平台需要考虑多个因素，包括企业的规模、业务需求、预算等。芒果店长跨境电商ERP系统在这些方面表现出色，其稳定的运行环境和严格的数据保护措施，确保了…

其他模型同样成果显著，Kimi 1.5通过长上下文扩展等创新，在多模态和推理能力上表现卓越，其推理框架和Long2short技术优化了算力；阿里的Qwen2.5系列模型，经高质量数据集构建、上下文训练改进、扩…

月 5 日消息，据“超算互联网”公众号，DeepSeek-R1、V3、Coder等系列模型，已陆续上线国家超算互联网平台。国家超算互联网平台已正式上线 DeepSeek-R1 模型的 1.5B、7B、8B、…

在周二举行的公司 2024 年第四季度财报电话会议上，AMD 首席执行官苏姿丰表示，AMD 计划在本季度向“主要客户”提供 MI350的样品，并将产品量产发货时间“加速”至年中。 AMD 称，2024 年…

2024年，与日常生活紧密相关的搜索词汇在小红书上层出不穷，从画画技巧到减脂餐食谱，从大一新生开学必备物品到冲锋衣选购，再到火锅推荐和保温杯选择，这些热词共同描绘了一幅年轻人生活方式的画卷。各行业搜索词性…