首页 科技 正文

中国AI服务器,刷新全球18项性能基准测试记录

允中 发自 凹非寺

量子位 编纂 | 公众号 QbitAI

美国东部时候10月21日,全球倍受谛视的权势巨头AI基准测试MLPerf发布本年的推理测试榜单,浪潮AI处事器NF5488A5一举缔造18项性能纪录,在数据中央AI推理性能上遥遥领先其他厂商产物。

MLPerf是当前全球最具影响力的AI较量争论基准评测组织,由图灵奖得主大年夜卫·帕特森(DavidPatterson)连络谷歌、斯坦福、哈佛大年夜学等单元配合成立,每一年组织全球AI演习和AI推理性能测试并发榜。此次MLPerf的AI推理基准测试有全球23家公司和单元参与,在数据中央及边缘等场景进行AI较量争论产物的性能比试。本年MLPerf演习榜单已于7月发布。

浪潮NF5488A5获数据中央AI性能绝对优势

此次浪潮NF5488A5一举缔造18项MLPerf推理性能纪录,成为创记录最多的AI处事器。本年的测试中,数据中央AI性能最受存眷,所有参与机构提交了507项性能测试数据。浪潮NF5488A5创下了数据中央22个赛项中的13项性能纪录以绝对优势领先,NVIDIA DGX获得了5项数据中央性能纪录。而在此前的MLPerf演习榜单中,NF5488A5在最焦点的Resnet50演习义务中也创下了性能纪录,单机性能高居榜首。

△浪潮NF5488A5缔造18项MLPerf推理性能新纪录

性能大年夜幅晋升3倍,全栈AI能力优势凸显

在此次基准测试中,浪潮AI处事器NF5488A5在开放优化(Open)和固定义务(Closed)的ResNet50基准性能测试中,均显露优异,比拟2019年MLPerf推理榜单的处事器最好性能晋升高达3倍。

20192020年 ResNet50推理性能比较

NF5488A5是浪潮自研的新一代AI处事器,是此次MLPerf全球比赛中唯一可以在4U空间内支持8块安培架构A100芯片实现NVLink高速互联的AI处事器。浪潮NF5488A5在系统拓扑上接纳了超低延迟设计,支持PCIe 4.0全链路极致优化,高频通讯单元接纳一级拓扑比来毗邻,最大年夜限度晋升措置器到AI芯片间的通讯性能。同时,颠末历程配置NUMA节点,确保每颗措置器与其直连的GPU之间通讯性能最优,最大年夜限度下降通讯延迟。别的,NF5488A5颠末历程深度优化系统布局设计,确保设备可在高温环境下不乱运行。

本次基准测试中,浪潮显现出了卓着的AI较量争论软硬件协同优化能力。在硬件层面,颠末历程对CPU、GPU硬件性能的邃密校准和周全优化,使CPU性能、GPU性能、CPU与GPU之间的数据通路均处于对AI推理最优状态;在软件层面,连络GPU硬件拓扑对多GPU的轮询调剂优化使单卡最多卡性能到达了近似线性扩大;在深度进修算法层面,连络GPU Tensor Core 单元的较量争论特点,颠末历程自研通道紧缩算法成功实现了模子的极致性能优化,在精度无损的环境下性能晋升近2倍。

△ 各处事器MLPerf AI推理性能比较(以浪潮NF5488A5为基准,越高越好)

浪潮是全球领先的AI较量争论向导厂商,其AI处事器在中国市场份额已一连三年贯穿连接在50%以上。浪潮致力于AI较量争论平台、资本平台和算法平台的研发创新,并颠末历程元脑生态与AI领先企业配合推动AI财产化和财产AI化历程。

非特殊说明,本文由原创资讯网原创或收集发布。

转载请注明本文地址:http://www.acewise.org/kj/1553.html