北京2024年10月25日 /美通社/ -- 10月24日,元脑®服务器第八代新品发布会在京举行。会上,浪潮信息重磅发布元脑®服务器第八代算力平台,基于开放架构设计,业界率先实现"一机多芯",同一架构支持英特尔®至强®6处理器及AMD EPYC™ 9005系列处理器,在促进多元生态共进的同时,具备更全面的智能能力和更高能效,更好支撑AI大模型开发与应用创新。实测数据表明,在LLaMA2大模型AI推理场景中,整机性能较上代最大提升3倍。
元脑服务器第八代算力平台拥有23款新品,基于先进的计算、存储架构创新,在CPU总线互联带宽、内存带宽及容量上全面优化,单机核心数最多到576C,主频高达5.0GHz,内存带宽提升高达136%。元脑服务器第八代算力平台一经发布,就打破多项SPEC国际性能测试纪录。
浪潮信息、信通院、Intel、AMD、阿里云、国家新能源汽车技术创新中心、金山云代表共同发布
一机多芯,开放标准促进多元算力生态进化
随着大模型能力的持续提升,生成式人工智能在企业侧、行业侧的落地正在提速,智能应用不断涌现。日趋丰富的AI应用场景也衍生出新的算力挑战,不同AI应用的典型特征及系统需求存在差异,需要多元的算力生态予以满足。伴随着通用处理器在芯片架构、指令集等方面对AI的优化增强,在AI推理端的巨大应用潜力使得CPU在AI时代变得更加重要,需要系统创新释放通用算力在AI领域的应用价值。
元脑服务器第八代算力平台成为全面且强大算力生态的载体,源于浪潮信息的诸多创新系统架构设计,将通过共建开放标准的方式聚集更多生态力量,使能通用算力与AI算力共同支撑日益多样的AI工作负载,加速多元算力生态进化,推动开放多元算力标准落地。
在通用算力领域,浪潮信息积极参与的开放计算模组规范(OCM),正在推动建立基于处理器的标准化算力模组单元,构建CPU的统一算力底座,解决多元CPU生态挑战问题,推动算力产业快速发展。会上发布首款基于服务器计算模组设计规范OCM的NF3290G8,整机全面解耦,以CPU、内存为核心构建最小算力单元,标准化高速/低速互联接口,实现处理器算力模组部件化,灵活支持多类型CPU,让不同算力共享统一平台,降低算力产业创新试错成本和推广适配成本,也让多元化的应用场景能够快速找到贴合的方案。
在AI算力领域,浪潮信息推动开放加速规范OAM的生态繁荣,大幅缩减国内外加速卡和服务器的适配周期,加速先进算力上线部署,支撑大模型及AI应用迭代成熟。目前,90%高端加速卡基于OAM规范设计。会上发布基于UBB2.0规范开发的元脑服务器NF5898G8,可以兼容符合OCP开放加速规范的多款OAM 2.0模组,通过全模块化的设计及极致的系统能效,满足算力的快速迭代需求,进一步加速算力融合创新。
智能增强,全面加速大模型开发与AI应用创新
元脑服务器第八代算力平台实现了全面的智能增强,通过搭载自研服务器操作系统KOS、AIOps智能运维管理平台以及AI软件堆栈,从服务器智能,到快速构建AI开发环境,到作业调度和资源统一纳管,乃至智算中心智能运维,提供全面的平台软件与工具软件支持。
新平台在预警、散热、管理等方面进行了全新的智能化升级。其中,在智能预警方面,全新升级内存故障智能预警修复技术MUPR,基于对上万台服务器故障数据的建模分析和AI模型算法的训练,实现内存故障提前预警、内存错误实时隔离、内存故障智能修复,降低内存导致宕机故障率80%。在智能管理方面,通过RTOS实时操作系统,实现开机3秒内智能管理调控风扇转速,降低30%的噪音,确保散热安全。
面向大模型部署难题,新平台与服务器操作系统KOS实现软硬协同优化,自研KOS AI定制版简单2步即可实现大模型训练环境搭建,200节点训练集群开发环境,采用AI定制版20分钟即可完成部署上线可用,极大提升了大模型开发部署效率。
创新液冷设计,让AI更绿色更节能
随着AI算力需求的持续攀升,AI算力的高密度部署与功耗之间的矛盾日趋突出,AI+液冷的组合已是大势所趋。浪潮信息"All in 液冷"战略已实现全线元脑服务器产品支持冷板式液冷, 面向数据中心实现从核心部件到整体方案的全方位覆盖。
最新发布的两相液冷130kW液冷整机柜,基于两相冷板和负压液冷的创新,实现液冷整机柜安全、解耦、高密和标准化,提供更高效的解热能力、更灵活的节点支持、更安全的漏液防护以及标准化液冷部件,解热能力高达每平方厘米200w以上,以先进原生液冷技术支撑超大规模智算中心建设。
浪潮信息提供液冷数据中心全生命周期整体解决方案,具有从室外一次侧冷源到室内二次侧CDU、液冷连接系统、液冷服务器等全线布局,为用户全方位打造绿色节能数据中心交钥匙工程。
未来一切计算皆AI,所有计算设备都要具有AI的能力,每台服务器都要更好支撑AI应用。元脑服务器第八代算力平台全面拥抱AI,以"一机多芯"领先架构设计为客户提供多元算力,满足互联网、金融、通信、能源、交通等行业用户复杂多变的AI应用创新需求,加速智能涌现。