近期,一份关于2025年推理算力行业的深度报告引起了广泛关注。该报告全面剖析了推理算力行业的现状、竞争格局、发展趋势、产业链以及相关公司的深度梳理,为行业内外人士提供了宝贵的洞察。
推理算力作为AI技术应用中的关键环节,其重要性不言而喻。它负责利用已训练的模型对新数据进行实时预测或决策,是推动AI商业化落地的重要力量。报告显示,自2024年起,推理算力的需求呈现出爆发式增长,2025年被业界视为算力爆发的元年。例如,字节跳动豆包模型在2024年12月中旬的日均token使用量超过了4万亿,短短七个月内增长了33倍,这充分展示了AI技术广泛应用所带来的巨大算力需求。
在竞争格局方面,推理算力市场呈现出“一超多强”的态势。英伟达凭借其软硬件优势,在推理芯片市场中占据了主导地位,2022年在数据中心AI加速市场份额高达82%。然而,随着美国对高端芯片出口限制的加强,国内厂商如华为昇腾、寒武纪等正加快追赶步伐。在国产替代的趋势下,这些国内厂商有望进一步扩大市场份额。推理芯片供应商众多,除了主流厂商外,还有如Xilinx等公司提供特定场景下的高效解决方案。
推理算力产业链涵盖了芯片、AI服务器、云计算平台及应用领域等多个环节。在芯片方面,GPU在云端训练和推理中有不同的应用,而边缘端AI芯片种类多样,推理芯片的选择取决于任务的本质。AI服务器作为推理算力的主要载体,其推理负载占比持续提升。云计算平台为推理算力提供了基础设施支持,推动了AI应用的发展。推理算力的应用领域广泛,涉及科学研究、编程、办公、医疗健康、金融等多个行业。
国内多家公司也在积极布局推理算力领域。例如,寒武纪作为智算芯片的龙头企业,其产品涵盖了云、边、端,思元590性能出色,下一代产品更是对标英伟达H100。华为昇腾则致力于构建全场景AI基础设施方案,打造产业生态,提供多种场景化的解决方案。中科曙光依托中科院在高端计算领域的深厚实力,海光CPU和DCU产品性能优异。首都在线通过提供全球云网融合等服务,借助英伟达等合作伙伴开启了新的增长曲线。浪潮信息作为IT基础设施的领军企业,在算法、算力、数据存储和互联等方面取得了显著成果。
展望未来,报告指出推理算力的需求将远超训练算力。预计到2026年,中国智能算力的规模年复合增长率将达到52.3%。国产推理芯片有望在3至5年内凭借高性价比占据更大的市场份额。随着生成式AI的商用化进程加速,2025年推理芯片的需求可能达到600亿美元左右,且市场将朝着多样化的方向发展,各类芯片将在不同场景中发挥重要作用。