AMD+NVIDIA打造世界第一AI超算:1550万GPU核心

时间:2021-08-27 16:37:31       来源:快科技

为了冲击百亿亿次计算,美国官方准备了三套不同系统,分别由Intel、AMD、AMD+NVIDIA联合打造。现在看起来,AMD+NVIDIA的联合方案进展最快。

这套名为“Polaris”(北极星)的超算,隶属于美国能源部阿贡国家实验室ALCF(阿贡领先计算设施),主要为用户的算法和科学领域的超级规模的研究和探索提供支持,并对学术界、政府机构、行业研究人员开放使用。

它基于Cray Slingshot 10高能可扩展互连架构,惠与(HPE)负责建造,共有560个节点,每个节点配备两颗AMD EPYC 7532处理器、四块NVIDIA A100计算卡,合计1120颗处理器、2240块计算卡。

EPYC 7532拥有32核心64线程(Zen2机构),A100计算卡则有6912个CUDA核心(Ampere架构),因此这套超算总共有多达35840个CPU核心、15482880个GPU核心,只是不知道A100这里的显存是40GB还是80GB。

整套系统的FP64双精度浮点峰值能将达44PFlops(44千万亿次每秒),在当今全球超算TOP500榜单上可以排在第十位。

不过,它的理论AI能可以高达惊人的1.4EFlops(140亿亿次每秒),通过处理数据密集型和AI高能计算工作负载,将模拟和机器学相结合。

Polaris超算将在今年年内上线,明年3月份升级为Slingshot 11架构,处理器更换为Zen3架构的EPYC 7543,仍是32核心,但能将再上一个台阶。

AMD为美国能源部橡树岭国家实验室(ORNL)打造的百亿亿次超算名为“Frontier”,配备Zen4架构下代EPYC处理器、Instinct计算卡,合同价值6亿美元。

Intel中标的超算名为“Aurora”,基于其下代Sapphire Rapids至强处理器、Xe HPC Ponte Vecchio计算卡。

不过,AMD、Intel的新台都尚未发布,大部分都要到明年才会完成,超算系统也顺应延期,预计会在2022-2023年才会陆续上线。

关键词: AMD GPU 核心 处理器