近期,人工智能领域的一则新闻引起了广泛关注。中国新兴AI公司DeepSeek推出的V3和R1两款开源AI模型,以其独特的性能和成本效益,颠覆了业界对AI算力需求的传统认知。
DeepSeek的推理大模型DeepSeek-R1,不仅在性能上与OpenAI的o1模型相媲美,而且其训练成本仅为后者的约二十分之一。据悉,该模型仅使用了2048个H800 GPU,在两个月的训练时间内完成了全部工作,总花费约为558万美元。其API的定价也极具竞争力,仅为OpenAI对应产品的约二十八分之一,使用成本降低了约97%。这一成就不仅引发了业界的广泛讨论,也对美国的人工智能领导地位构成了潜在威胁。
面对DeepSeek的崛起,OpenAI的联合创始人兼CEO山姆·奥尔特曼(Sam Altman)在日本东京的一次媒体采访中透露,OpenAI并没有计划起诉DeepSeek。相反,他表示OpenAI将继续致力于提升产品和技术实力,以应对日益激烈的竞争。
尽管DeepSeek的成就引发了业界对未来AI芯片需求下滑的担忧,但美系云服务厂商并未因此削减对AI基础设施的支出。微软和meta在最近的财报会议上均强调,他们在AI领域的巨额支出是必要的。meta的CEO扎克伯格表示,2025年将投入600亿至650亿美元用于AI开发,而微软也重申其2025年的资本支出将持续增加,预计投资800亿美元建立AI数据中心。
与此同时,软银集团与OpenAI在日本东京举行了联合发布会,宣布成立合资企业SB OpenAI Japan,以向企业客户提供人工智能服务。该合资企业将由软银集团、OpenAI及日本国内电信部门共同所有,软银集团将每年支付30亿美元用于使用OpenAI的技术。
针对DeepSeek可能引发的算力需求下滑担忧,奥尔特曼表示:“世界将需要这么多的计算。”市场研究机构Gartner的最新研究报告也预测,受到人工智能需求的推动,到2025年,全球半导体收入将同比增长12.6%,达到7050亿美元。
值得注意的是,此前OpenAI曾对DeepSeek可能存在的对其模型进行不当“蒸馏”的行为进行调查。蒸馏是一种将大型模型的知识转移到较小模型的技术,但OpenAI的服务条款禁止用户使用通过蒸馏获得的数据来构建竞争性AI产品。然而,近日奥尔特曼的态度似乎发生了变化,他公开承认了OpenAI在开源策略上的不足,并表示正在讨论一个新的开源策略。
在软银集团与OpenAI的联合发布会上,奥尔特曼再次强调了OpenAI的竞争立场:“我们目前没有计划起诉DeepSeek,我们只会继续打造优异的产品,以模型实力引领世界。”他还表示:“DeepSeek的确是令人印象深刻的模型,但我们相信我们将继续向前沿推进,推出优异的产品。我们乐见出现对手,因为推动技术进步和保持领先符合所有人的利益。”