时事快闻

元脑®服务器第八代新品重磅发布！创新开放架构引领算力生态多元共进

时间：2024-10-25 19:02 来源：美通社作者：江紫萱

北京2024年10月25日 /美通社/ -- 10月24日，元脑®服务器第八代新品发布会在京举行。会上，浪潮信息重磅发布元脑®服务器第八代算力平台，基于开放架构设计，业界率先实现"一机多芯"，同一架构支持英特尔®至强®6处理器及AMD EPYC™ 9005系列处理器，在促进多元生态共进的同时，具备更全面的智能能力和更高能效，更好支撑AI大模型开发与应用创新。实测数据表明，在LLaMA2大模型AI推理场景中，整机性能较上代最大提升3倍。

元脑服务器第八代算力平台拥有23款新品，基于先进的计算、存储架构创新，在CPU总线互联带宽、内存带宽及容量上全面优化，单机核心数最多到576C，主频高达5.0GHz，内存带宽提升高达136%。元脑服务器第八代算力平台一经发布，就打破多项SPEC国际性能测试纪录。

浪潮信息、信通院、Intel、AMD、阿里云、国家新能源汽车技术创新中心、金山云代表共同发布

一机多芯，开放标准促进多元算力生态进化

随着大模型能力的持续提升，生成式人工智能在企业侧、行业侧的落地正在提速，智能应用不断涌现。日趋丰富的AI应用场景也衍生出新的算力挑战，不同AI应用的典型特征及系统需求存在差异，需要多元的算力生态予以满足。伴随着通用处理器在芯片架构、指令集等方面对AI的优化增强，在AI推理端的巨大应用潜力使得CPU在AI时代变得更加重要，需要系统创新释放通用算力在AI领域的应用价值。

元脑服务器第八代算力平台成为全面且强大算力生态的载体，源于浪潮信息的诸多创新系统架构设计，将通过共建开放标准的方式聚集更多生态力量，使能通用算力与AI算力共同支撑日益多样的AI工作负载，加速多元算力生态进化，推动开放多元算力标准落地。

在通用算力领域，浪潮信息积极参与的开放计算模组规范(OCM)，正在推动建立基于处理器的标准化算力模组单元，构建CPU的统一算力底座，解决多元CPU生态挑战问题，推动算力产业快速发展。会上发布首款基于服务器计算模组设计规范OCM的NF3290G8，整机全面解耦，以CPU、内存为核心构建最小算力单元，标准化高速/低速互联接口，实现处理器算力模组部件化，灵活支持多类型CPU，让不同算力共享统一平台，降低算力产业创新试错成本和推广适配成本，也让多元化的应用场景能够快速找到贴合的方案。

在AI算力领域，浪潮信息推动开放加速规范OAM的生态繁荣，大幅缩减国内外加速卡和服务器的适配周期，加速先进算力上线部署，支撑大模型及AI应用迭代成熟。目前，90%高端加速卡基于OAM规范设计。会上发布基于UBB2.0规范开发的元脑服务器NF5898G8，可以兼容符合OCP开放加速规范的多款OAM 2.0模组，通过全模块化的设计及极致的系统能效，满足算力的快速迭代需求，进一步加速算力融合创新。

智能增强，全面加速大模型开发与AI应用创新

元脑服务器第八代算力平台实现了全面的智能增强，通过搭载自研服务器操作系统KOS、AIOps智能运维管理平台以及AI软件堆栈，从服务器智能，到快速构建AI开发环境，到作业调度和资源统一纳管，乃至智算中心智能运维，提供全面的平台软件与工具软件支持。

新平台在预警、散热、管理等方面进行了全新的智能化升级。其中，在智能预警方面，全新升级内存故障智能预警修复技术MUPR，基于对上万台服务器故障数据的建模分析和AI模型算法的训练，实现内存故障提前预警、内存错误实时隔离、内存故障智能修复，降低内存导致宕机故障率80%。在智能管理方面，通过RTOS实时操作系统，实现开机3秒内智能管理调控风扇转速，降低30%的噪音，确保散热安全。

面向大模型部署难题，新平台与服务器操作系统KOS实现软硬协同优化，自研KOS AI定制版简单2步即可实现大模型训练环境搭建，200节点训练集群开发环境，采用AI定制版20分钟即可完成部署上线可用，极大提升了大模型开发部署效率。