在兔年新春的热闹氛围中,硅谷和华尔街迎来了一位新兴的技术明星——DeepSeek。凭借其极具竞争力的价格与高度精准的算法,DeepSeek迅速走红,吸引了众多科技巨头的目光。
首当其冲的是微软。1月29日,微软宣布DeepSeek的R1模型已在Azure AI Foundry和GitHub平台上架,开发者可以借此新模型进行云应用的测试与构建。微软用户还能在Copilot+ PC上本地运行DeepSeek R1模型的精简版,享受更便捷的服务。
值得注意的是,尽管微软与OpenAI有着深厚的合作关系,但在AI模型的商业化道路上,微软选择了多元化策略。如今,Azure平台上不仅集成了OpenAI的GPT系列、meta的Llama系列以及Mistral的模型,还新增了DeepSeek这一强劲对手。
紧随其后,AWS也宣布在Amazon Bedrock和Amazon SageMaker AI两大平台上支持DeepSeek-R1模型的部署。这一举措无疑将进一步推动DeepSeek在AI领域的影响力。
英伟达也不甘落后,迅速宣布接入DeepSeek R1模型。英伟达官网透露,拥有6710亿参数的DeepSeek-R1模型已作为NVIDIA NIM微服务预览版在build.nvidia.com上提供。该微服务在单个英伟达HGX H200系统上每秒能处理多达3872个token,为开发者提供了强大的试验和构建平台。
开发者们可以通过应用程序编程接口(API)进行测试和试验,这一接口预计很快将以可下载的NIM微服务形式,成为英伟达AI Enterprise软件平台的一部分。
meta的CEO扎克伯格也在近期的一次分析师电话会议上提到了DeepSeek。他表示,meta正在深入研究DeepSeek的成果,并希望将其中的一些进步应用到自家的AI项目中。扎克伯格强调,meta将持续学习DeepSeek等技术,并发布开源免费的Llama AI模型,以推动整个行业的发展。
“我认为,从长远来看,大力投资资本支出和基础设施将是一种战略优势。”扎克伯格说道,“尽管未来可能会有变数,但现在下结论还为时过早。就目前而言,我坚信建设这种基础设施的能力将是一个巨大的优势。”