在DeepSeek席卷2025年春节前夕,昇腾已成为中国市场上一颗耀眼的明星,其成功不仅仅依赖于出货量。尽管数据显示,2023年华为海思(含昇腾系列)以24.8%的市场份额领跑国内AI芯片市场,领先第二名超10个百分点,但自2024年起,具体数据便不再公开。然而,业内人士对昇腾的信心并未因此减弱,反而日益增强,这背后主要得益于昇腾强大的技术能力。
昇腾在GPU制造的关键技术方面,实现了从指令集到软件栈的全栈自研。其中,CANN软件栈与英伟达的CUDA相媲美,使得昇腾单卡算力逼近英伟达A100。而DeepSeek绕过CUDA后展现出的惊人性能提升,更是激发了业界对昇腾全栈自研潜能的期待。
DeepSeek的出现,无疑给国内AI算力市场带来了巨大冲击,但昇腾似乎又一次走在了国产芯片的前列。近期,市场上出现了所谓的“满血版”DeepSeek和经过量化技术压缩的“蒸馏版”DeepSeek,后者在参数规模和使用体验上大打折扣。由于部署DeepSeek-R1需要耗费大量硬件资源,硬件成本高昂,一些厂商为了蹭热点,推出了“空壳”版本,用户体验大打折扣。
然而,作为DeepSeek推理服务的算力供应商,昇腾在这方面显然更具优势。昇腾是目前国内唯一一个从预训练、微调、强化学习全流程支持DeepSeek的AI训练平台。昇腾技术团队针对DeepSeek进行了多项技术优化,特别是在通信效率方面。通过伪EP混合并行算法,昇腾将DeepSeek-R1推理时的通信性能提升了30%,并对DeepSeek团队提出的强化学习算法Gpro进行了适配,进一步提高了性能和效率。
昇腾在通信优化方面的技术优势,一直是其强项。例如,昇腾超节点技术通过机柜级大带宽通信设计,将NPU节点从单机8卡拓展到机柜几十卡以上,大幅提高了带宽利用率,并实现了超大规模无收敛集群组网。这使得昇腾成为国内少有的具备超大规模集群组建能力的厂商,也促成了与华为、三大运营商、科大讯飞等企业的合作。
昇腾的技术优势和对DeepSeek的深度优化能力,正成为其撬动行业资源、形成统一阵地的关键。春节前,昇腾与硅基流动达成了深度合作,双方围绕DeepSeek的合作进展迅速。包括小鹏汽车董事长何小鹏、宇树科技创始人王兴兴在内的多位行业领袖,也前往华为拜访学习,并与任正非进行了交流。这一系列事件表明,围绕昇腾结成的“虚拟产业联盟”正在进一步加深交流和合作。
近期,大量基于昇腾构建的DeepSeek一体机密集发布,发布厂商包括华鲲振宇、宝德、神州鲲泰、长江计算等。DeepSeek一体机几乎成了产业合作的一个象征。数据显示,目前已有80多家企业基于昇腾快速适配或上线了DeepSeek系列模型,并在对外提供服务。预计未来两周内,还将有20多家企业完成上线。昇腾芯片的本地化服务和团队,对部署DeepSeek的效果影响显著。以万卡规模的数据中心为例,采用昇腾方案后,AI推理模块的TCO(总拥有成本)三年期下降了42%。