教科研服务器杀手级CPU!AMD EPYC打破行业不可能实现“既要又要”。
“Gen-AI”时代的到来加快了全球数据中心的建设,整个市场盘子的增大也给各路玩家提供了新的机遇。
近年来,在服务器和数据中心等企业级市场,AMD无疑成为了表现最为抢眼的一家芯片巨头,不论是出货份额还是收入份额都呈现迅猛上升势头,其“Zen”架构持续更新迭代,基于Zen架构打造的EPYC系列处理器则成为AMD开拓市场的最强王牌。
2022年11月AMD推出第四代EPYC处理器EPYC 9004系列,其中基于Zen 4架构的Genoa系列将核心数提升至96核,后续基于Zen 4c的Bergamo则进一步将核心数推升至128核,EPYC 9004系列的诸多关键新特性的升级都打破了当时行业的“天花板”。
可以说,AMD是凭借实打实的技术优势一步步建立其当下的市场地位的。
其中AMD EPYC 9554处理器成为系列中“高核心高主频”的代表,在高达64核心的同时做到了单核基础频率3.10GHz,最大加速频率3.75GHz,可以很好地解决一些对频率和多核性能都十分敏感的应用负载,显著拓宽了其应用范围。
实际上,做到高核心数和高主频兼顾,是极具挑战的一件事。通常来说,服务器芯片核心数量通常较多,单核频率提升会带来显著的整体功耗增加,而高功耗带来的散热挑战是服务器建设面临的关键痛点。
这也就是行业面临的两难:在同一功耗限制下,核心数量越多,主频往往就越低,主频越高,核心就难做多。平衡多核心和高主频,需要芯片设计厂商在芯片架构、工艺制程、电路设计、散热设计、芯片堆叠等方面解决诸多复杂工程难题。
这也是EPYC 9554处理器的突破性之所在。所以AMD为何能够实现行业此前难以做到的“鱼和熊掌兼得”?AMD又是如何打通一道道技术难关实现高核心高主频兼顾的?本文将详细解密EPYC 9554背后的一系列关键“黑科技”。
01.
打破多核高频两难桎梏,架构、设计、工艺多方硬核技术创新是根本
第四代EPYC处理器在性能、能源效率、TCO表现、安全加密、生态系统等方面都表现出色。
当然,这话并不是没有来由的,比如EPYC 9554处理器在高性能计算、建模与仿真、非结构化数据库、云和虚拟化等诸多领域的基准测试中都表现优异。
EPYC 9554能够实现诸多佳绩,其最核心的突破是“同时实现了强大的多核性能和单核的高主频”,这颠覆了行业此前的“多核高频只能取其一”的认知。
为什么AMD可以做到高核心高主频兼顾?
首先,Zen 4架构功不可没。AMD在企业级产品和消费级产品上采用了同样的核心微架构,EPYC 9004系列处理器与桌面端的锐龙7000系列处理器都采用了Zen 4架构。
Zen 4架构重点提升了性能和能效比,IPC性能相比上代有着14%的提升,在前端、加载/存储、分支预测、执行引擎和缓存方面均有一定加强,整个架构的平均延迟也有所降低。
同时Zen 4架构还通过新的设计、5nm新工艺以及移动端一些技术的移植,实现了整个CPU动态功耗的降低。值得一提的是,EPYC 9004系列也是首个使用5nm工艺的企业级CPU产品。
这一系列架构新特性对于保持核心高频稳定性、降低高频功耗都非常关键。
在指令集方面,Zen 4实现了对AVX-512指令集的支持,值得一提的是,相比行业竞品的实现方式,AMD采用2个AVX 256合并执行1个AVX-512的方式可以节省晶体管资源,并且不需要降低频率来运行AVX-512。
根据AMD官方数据,在支持AVX-512后,EPYC处理器在NLP、图像识别以及物体检测的吞吐量测试中的表现都有3-4倍不等的提升。
根据MicroComputer测试数据,在各类服务器领域典型测试中,EPYC 9554都有不错的表现,比如在SPECrate 2017测试中,EPYC 9554的浮点运算性能同比提升幅度超过90%,整数运算性能提升了60%以上。
▲图表来源:MicroComputer
EPYC 9554双路系统在13个子项测试中相对于EPYC 7763双路系统的领先幅度最大超过了100%,平均提升超过51%。
除了Zen 4架构的大幅升级,如何解决高核心数带来的高能耗、高发热、多核互联数据传输等方面的难题,是实现高核心数和高主频之间兼顾的另一个关键方面。
这背后,AMD首先采用了创新的AMD小芯片架构,也就是我们常说的Chiplet。在芯片行业中,这并不是一个新鲜词汇,但要知道的是,AMD是行业内推动Chiplet技术发展最积极、最核心的厂商之一,也是最早一批拥抱这一技术的厂商。
简单来说,Chiplet就是一种混合多晶片SoC设计,可以显著提高芯片不同晶片之间的集成度与互联效率,在提升芯片性能的同时降低芯片制造的成本、提高良率。
Chiplet技术对于设计EPYC 9554这种多核心、高主频处理器来说至关重要。
当然,5nm工艺带来的显著能效优化也是重要一环,AMD与台积电之间长期保持密切合作,也让AMD在芯片工艺制程方面长期走在行业的第一梯队中。
除此之外,AMD独有的Infinity架构技术在x86性能、效率、安全功能和整体系统吞吐能力方面的突破也值得一提。
对于创建EPYC 9554这种混合多芯片架构的处理器,互连的性能至关重要,AMD Infinity架构重点提升的就是CPU之间、多芯片架构中不同组件之间、内存、PCIe以及安全机制等各部分之间的连接性能。
可以说,实现高核心、高主频兼顾,这些架构技术都功不可没。
当然,在高核心、高主频的基础上,EPYC 9554也实现了出色的I/O和内存带宽性能,这些特性都是相辅相成的。
EPYC 9554可以支持最高128条PCIe 5.0高速通道,支持12通道DDR5内存,单路处理器的内存带宽可以达到460.8 GB/s。相比上代的8通道DDR4内存,这一提升明显缓解了超多核心处理器内存带宽不足的问题,对于内存带宽敏感型应用是一大利好。
在互联技术方面,EPYC 9554还支持了CXL 1.1+协议扩展的内存寻址功能,进一步提高了性能和电源效率,降低了软件复杂性,同时也减少了数据移动次数。
根据MicroComputer测试数据,在综合性内存带宽实际性能测试Stream中,EPYC 9554处理器双路系统相比7763处理器双路系统内存性能直接翻倍,提升十分明显。
▲图表来源:MicroComputer
可以说,EPYC 9554处理器兼顾高主频、高核心数的背后,是AMD在CPU架构、互联、工艺、设计等多方面的硬核技术创新,而这些技术特性带给EPYC 9554的优势还远不止于此。
实际上,EPYC 9554还有诸多优势应用场景,例如其对HPC和模拟仿真等应用都十分适用,可以大幅提升效率,无疑是所在领域企业组建服务器时的更优选择。
02.
高核心高主频处理器成更多行业“刚需”,EPYC 9554或为教科研杀手级CPU
正如前文所说,AMD凭借自身技术优势实现了服务器CPU高核心高主频同时兼顾,实现了此前行业的“不可能”,以EPYC 9554为代表的处理器也正成为越来越多行业的刚需,尤其在教科研领域,这一点体现的尤为明显。
众所周知,在教科研领域,服务器需要处理器能够快速处理大量的数据、复杂的模型和仿真计算,这对于处理器的主频和核心数都有高要求。多核心与多线程性能可以保证服务器能同时处理多个任务和进程,适应教科研中多样化的应用场景和并行计算需求。
比如有限元显示动力学、有限元隐式动力学领域的研究会用到Radioss、OptiStruct等软件,其对于CPU主频和缓存都有较高要求,这些应用会随着核心数和频率的增加得到很好的扩展和性能提升。
此外,生信、量子化学等领域也会用到GATK、BWA、Quantum_Espresso等专业软件,其性能表现都可以极大受益于CPU主频和核心数的提升。
可以说,在物理学、生物信息及生命科学、化学等领域,EPYC 9554都大有用武之地。在这些领域,核心越多,并行计算能力越强,同时处理任务数量就多,主频越高,处理单个任务时候就更快。
EPYC 9554可以很好解决上述这些教科研领域的痛点,优化加速结果。
展望未来,随着计算需求的不断提升、需求和应用场景越来越复杂,兼顾高核心高主频的处理器一定会成为越来越多行业的“刚需”。历经四代进化的AMD EPYC系列处理器,也逐渐开拓出属于自己的核心市场。
根据市场调研机构Mercury Research近日发布的统计数据,2024年第一季度,AMD在全球x86数据中心CPU市场中继续稳定保持份额增长态势,服务器处理器出货份额达到了23.6%,收入份额更是飙涨至33%。市场份额同比提升均超过了5个百分点。
▲2024年Q1全球x86 CPU市场份额情况,数据来源:Mercury Research
可以说,如今的AMD EPYC系列服务器CPU在x86数据中心CPU市场中难逢对手,EPYC 9004系列以及其中高频多核的代表EPYC 9554处理器,都将继续在基础设施、数据分析、科学计算、HPC等专业领域帮助企业应对各种复杂的智能化数字化挑战。
03.
结语:AMD EPYC加速赋能千行百业,大模型时代更多创新可期
总体来看,从Zen 4架构、5nm工艺、Chiplet设计到Infinity架构,AMD EPYC 9554是一款技术规格和性能显著提升的产品,实现了高核心高主频集于一身,在教科研等领域成为“杀手级”存在,也在更多场景中展现出自己的独特竞争优势。
这背后,技术创新仍然是AMD最硬的王牌,也成为其在x86服务器CPU市场中不断开疆拓土的关键竞争壁垒。
面相未来,AMD的EPYC必然将会进入更多市场,行业竞争依然会十分激烈,面对大模型带来需求和场景的变化,更多新的机遇和挑战也在不断涌现。AMD还会给产业带来怎样的惊喜,值得期待。
内容转载自:芯东西