英特尔至强处理器的历史可以追溯到1998年,当时Intel推出了基于 Pentium Ⅱ架构的第一代至强(Xeon)处理器。这款处理器是为中、高档服务器、工作站所服务,拥有更大和更快的二级高速缓存、多重处理能力。[3]从1998年到2023年,Intel至强处理器经历了多次升级和改进,涵盖了多个不同的架构和代号,例如 Conroe 架构、Broadwell 架构、Skylake 架构、Tremont 架构、Sunny Cove架构和 Golden Cove 等。[5]在这个过程中,英特尔至强处理器不断提升了制程工艺、核心数量、缓存大小、指令集、加速器、内存技术、接口类型等方面的性能和功能,以适应不同的应用需求和市场竞争。[6][7][5]
英特尔2017年首次推出的至强可扩展处理器赋能数据分析、人工智能、高性能计算、网络转型等各类应用,以加速企业实现数据中心现代化及业务转型现。[8][9][10]其中,2023年推出的第四代英特尔至强可扩展处理器也被认为是英特尔在服务器市场上的重要突破和未来超级计算机和人工智能领域的重要推动力。[11]
1998年英特尔发布了 Pentium Ⅱ Xeon(至强)处理器。这款处理器根据英特尔公司的战略,为特定的市场细分设计和提供专有的处理器。 Pentium Ⅱ Xeon(至强)处理器专为满足中、高档服务器和工作站的苛刻要求而设计,并专门针对运行要求很高的商业应用的工作站和服务器进行了技术创新。这些商业应用包括国际互联网服务、企业数据仓库、数字化内容创新、以及电子和机械设计自动化等。Pentium Ⅱ Xeon(至强)处理器的系统可通过配置扩充至4个、8个甚至更多的处理器,拥有更大和更快的二级高速缓存、多重处理能力以及100 MHz 系统总线在当时 CPU 市场处于领先水平。[3][4]
在1999年,英特尔又发布了Pentium Ⅲ Xeon处理器。该处理器有 900 MHz 的超大缓存,带有2MB内置二级缓存,与当时现有的英特尔大型缓存服务器平台相比,这款处理器更快,频率与独特缓存设计将整体系统性能提高20%。该产品的发布使基于英特尔的高端4路和8路多处理系统服务器平台的性能跨上新台阶。[1]
2001年,英特尔宣布推出奔腾4采用同一核 Net Burst 架构的第一代英特尔至强(Xeon)处理器。但在命名上,英特尔一反至强家族传统的做法,将其命名为第一代英特尔至强处理器而不是奔腾4至强处理器。与基于奔腾Ⅲ至强处理器的系统相比,基于英特尔至强处理器的工作站性能提升可达30%~90%(视不同应用软件与配置而不同)。与之相应的860芯片组支持双通道 RDRAM,它对英特尔至强处理器的 400MHz 系统总线进行补充,数据处理速度最高可达每秒3.2G(3.2千兆)字节。[12]
2004年6月末,英特尔推出了最新的Xeon处理器—Nocona 处理器。Nocona 处理器采用了更先进的90nm制造工艺而不是 Xeon DP 的130nm,因而可以集成更多的晶体管,使用更低的驱动电压,频率达到3.6GHz(Xeon为 3.2GHz)。英特尔实际上是被迫回归,采用 了 AMD 为 Opteron 开发的 x86-64 指令,目的是向 Opteron 发起挑战。当时Nocona的特色吸引了许多眼球,但它是沿着Xeon的技术路线发展的, 在某些性能上,仍不及Opteron 处理器。[13]
2005年10月,英特尔凭借自己长久以来在封装技术上的优势,发布了其首枚双核心 Xeon DP(Paxville DP)。这款全新的处理器将可以帮助提高多线程服务器应用的性能并缩短响应时间。Paxville DP 是将两颗2MB二级缓存的“Irwindale”至强DP处理器,封装在一颗CPU中。这款全新双核至强处理器拥有2.80GHz的运行速度和800MHz系统总线,每个内核独享2MB二级高速缓存。由于每个内核都配置了高速缓存,所以系统总线上的数据量将大为减少,并使每个内核都可以更快地存取数据。此外,它还采用了英特尔64位内存扩展技术、超线程(HT)技术。[14][15]
2007年9月6日,英特尔公司在全球同步发布了业界首款专为多路(MP)服务器设计的四核英特尔至强7300系列服务器处理器。该处理器可满足服务器整合、数据库应用、企业资源规划和商务智能等高端企业环境和虚拟化环境对服务器提出的高性能、高可靠性和高可扩展性的需求。与英特尔前代双核产品相比,全新的四核至强7300系列处理器的性能和性能功耗比分别提升了两倍和三倍之多。高能效的至强7300系列产品包括主频2.93GHz、功耗130瓦的一款处理器,几款80瓦处理器以及一款针对四插槽刀片式服务器和高密度机架式服务器优化的50瓦功耗处理器。新的四核英特尔至强7300系列处理器具备的新特性为帮助用户获得更高的性能提供了保证。[16]
一直以来,至强系列产品都是服务器处理器,但在2013年前后,鉴于因为以至强 E3-1230 V3处理器为主的处理器凭借其“i5的价格i7的性能”在主流及中端用户中很是热销,通常被普通消费者用来组装个人台式机。英特尔至强E3-1230 V3处理器采用 Haswell 架构设计、22纳米工艺制程、原生四核心设计支持超线程技术,该处理器原生主频3.30GHz、LGA1150接口设计。和 Haswell 桌面级酷睿i7处理器几乎没有多大差别,在性能方面已经接近酷睿i7-4770的水平能抗衡超频后的酷睿i5-4690K,但价格比酷睿i5-4690K还便宜可谓十分超值,因此通常被普通消费者买来组装个人台式机。[17][18][19][20]
早在2017年,第一代英特尔至强可扩展处理器(代号为Skylake-SP)面世,全新的英特尔至强可扩展处理器不仅具备较强的性能和业务连续性,还采用创新的平台设计理念,提供铂金、金牌、银牌和铜牌四个品类、不同特点的产品系列。[8]例如在核心规格方面,英特尔至强可扩展处理器采用了全新的 Mesh 网格式架构设计取代以往环形总线,可以更高效将多达28个 CPU 核心以及功能模块组合,大大降低延迟 。另外在核心架构方面,Skylake相比于此前的 Broadwell 也有了大幅度的改进 ,包括分支预测、解码器、乱序窗口和缓存架构等都有了升级,尤其是针对数据中心应用。[9][8][10]
英特尔至强可扩展处理器前三代产品覆盖从单路到八路全部市场,能够为下到普通企业级服务器,上到超级计算机等有着不同算力需求的设备提供服务,是目前全球范围内最重要、性能最出色的企业级产品之一。[5]
不过,随着AMD EPYC系列处理器逐渐崛起并通过Chiplet的方式大幅扩张单插槽核心数量,尤其是AMD在2022年发布的EPYC 9004系列,将单插槽处理器核心数量扩大到96核心以后,英特尔在市场中的竞争压力骤增。2023年,英特尔正式发布了代号为“ Sapphire Rapids ”的第四代至强可扩展处理器。[5]据介绍,与前一代相比,第四代英特尔至强可扩展处理器通过内置加速器,可将目标工作负载的平均每瓦性能提升2.9倍,在对工作负载性能影响最小化的情况下,通过优化电源模式可为每个CPU节能高达70瓦,并降低52%到66%的总体拥有成本(TCO)。[21]
2023年9月,基辛格在2023英特尔on技术创新大会上透露,第五代英特尔至强处理器将于12月14日发布,届时,将在相同的功耗下为全球数据中心提高性能和存储速度。在本次大会上,英特尔还预览了下一代英特尔至强处理器。作为英特尔至强的重要演进,第五代英特尔至强处理器平台引入了全新的能效核(E-core)架构,与其已有的性能核(P-core)架构并存。分别以代号Sierra Forest 和 Granite Rapids 命名的这些新产品将为客户提供便捷性和灵活性,以及兼容的硬件架构和共享的软件堆栈,以满足诸如人工智能等关键工作负载的多元化需求。[22]
2017年,英特尔正式发布了全新至强可扩展系列处理器家族,英文名称为 Xeon Scalable Processor。此外英特尔还在至强可扩展处理器家族上彻底放弃了之前 ”E+数字”的命名方式,转而采用了一种更商业化的、更容易理解的命名,即将产品分为四个 “段位”:(1)最高端的至强 PIatinum(白金)家族提供最强性能、最多核心和最强大硬件扩展能力,支持最先进技术、最强安全性能和业务敏捷的处理器;(2)次高端的是至强 Gold(金牌)家族提供卓越性能 、快速的内存 、丰富的扩展能力和加速引擎接口的处理器;(3)至强 Silver(银牌)家族提供优秀的性能功耗比的处理器 ;(4)至强 Bronze(铜牌)家族提供入门级性能的处理器。[23]
产品规格上,以2023年最新发布的第四代英特尔至强可扩展处理器为例,这代处理器采用全新架构,每路配备多达 60 个内核。每个系统支持单路、双路、四路或八路配置。该平台还在内存和输入/输出(/O)子系统方面也做了相应改进,DDR5 内存提供的带宽和速度与 DDR4 相比提高多达 1.5 倍,速率达到 4,800 MT/s。此外,该平台还具有每路80条PCIe Gen5 通道的特点,与之前的平台相比,I/O得到显著提升。这些优势使得这些处理器具广泛应用于人工智能、云服务和深度学习等领域。[24]
部分产品型号
产品型号 | 发布时间 | 核心数 | 线程数 | 基础频率 | 睿频频率 | 支持内存类型 |
至强 Platinum 8490H 处理器[25] | 2023年第1季度 | 60 | 120 | 1.90GHz | 3.50GHz | UptoDDR54800MT/s1DPC UptoDDR54400MT/s2DPC |
至强 Gold 6438M 处理器[26] | 2023年第1季度 | 32 | 64 | 2.20GHz | 3.90GHz | UptoDDR54800MT/s1DPC UptoDDR54400MT/s2DPC |
至强 Silver 4410Y 处理器[27] | 2023年第1季度 | 12 | 24 | 2.00GHz | 3.90GHz | UptoDDR54000MT/s1DPCand2DPC |
至强 Bronze 3206R 处理器[28] | 2020年第1季度 | 8 | 8 | 1.90GHz | 1.90GHz | DDR4-2133 |
作为唯一一款基于x86的高带宽内存(HBM)处理器,英特尔至强 CPU Max 系列处理器采用了全新的微架构,支持一系列平台增强,包括更多内核、升级版I/O 和内存子系统,以及内置加速器等。在核心数量方面,英特尔至强 CPU Max 系列处理器拥有32-56个核心(旗舰产品为 Xeon Max 9480),且均为性能核。此外,所有 Xeon Max 都内置了64GB的高带宽内存[a](通过4个HBM2e 堆栈实现)。[29]根据英特尔的官方资料,相比其他竞品,英特尔至强 CPU Max 系列最高可以实现5倍的性能提升。此外,与其他CPU相比,使用 HBM 可将 Numenta AI 技术进行自然语言处理的性能提升高达20倍。[30]
部分产品型号
产品型号 | 发布时间 | 核心数 | 线程数 | 基础频率 | 睿频频率 | 支持内存类型 |
至强 CPU Max 9480 处理器[31] | 2023年第1季度 | 56 | 112 | 1.90 GHz | 3.50 GHz | Up to DDR5 4800 MT/s 1DPC Up to DDR5 4400 MT/s 2DPC |
至强 CPU Max 9462 处理器[32] | 2023年第1季度 | 32 | 64 | 2.70 GHz | 3.50 GHz | Up to DDR5 4800 MT/s 1DPC Up to DDR5 4400 MT/s 2DPC |
至强 CPU Max 9470 处理器[33] | 2023年第1季度 | 52 | 104 | 2.00 GHz | 3.50 GHz | Up to DDR5 4800 MT/s 1DPC Up to DDR5 4400 MT/s 2DPC |
至强 CPU Max 9468 处理器[34] | 2023年第1季度 | 48 | 96 | 2.10 GHz | 3.50 GHz | Up to DDR5 4800 MT/s 1DPC Up to DDR5 4400 MT/s 2DPC |
英特尔至强 W 系列处理器专为众多创意专业人士设计,主要是满足该类人员工作负载需求的工作站处理器。以英特尔至强 W-3400 处理器和英特尔至强 W-2400 处理器为例。这些处理器采用了 CPU 封装技术和嵌入式多芯片互连桥接 (EMIB) 技术,可在单个解决方案中精准地连接多个异构芯片,从而缓解处理瓶颈。并且处理器还可在单个插槽中支持多达 56 个内核,以管理计算密集型、高度线程化的工作流程。这些优势使得 W 系列处理器广泛用于复杂设计、仿真、大格式视频特效和 AI 工作负载。[35]
部分产品型号
产品型号 | 发布时间 | 核心数 | 线程数 | 基础频率 | 最大睿频频率 | 内存类型 |
至强 W-11955M 处理器[36] | 2021年第2季度 | 8 | 16 | 350MHz | 5.00GHz | Upto3200MT/s |
至强 W5-3425 处理器[37] | 2023年第1季度 | 12 | 24 | 3.20GHz | 4.60GHz | DDR5-4800(MT/s) |
至强 W-3375 处理器[38] | 2021年第3季度 | 38 | 76 | 2.50 GHz | 4.00 GHz | DDR4-3200 |
至强 W-11865MLE 处理器[39] | 2021年第3季度 | 8 | 16 | 1.50 GHz | 4.50 GHz | DDR4-3200 |
至强 D 处理器可在空间和电源受限的环境中提供工作负载优化的性能,从数据中心到智能边缘。这些创新的系统级芯片处理器支持高密度、单插槽网络、存储和云边缘计算解决方案,具有一系列集成安全性、网络和加速功能。主要面向网络和物联网应用。[40]
部分产品型号
产品型号 | 发布时间 | 核心数 | 线程数 | 基础频率 | 最大睿频频率 | 支持内存类型 |
至强 D-2798NX 处理器[41] | 2022年第3季度 | 20 | 40 | 2.10GHz | 3.10GHz | DDR4 |
至强 D-1749NT 处理器[42] | 2022年第1季度 | 10 | 20 | 3.00GHz | 3.50GHz | DDR4 |
至强 D-1748TE 处理器[43] | 2022年第1季度 | 10 | 20 | 2.30 GHz | 3.40 GHz | DDR4 |
至强 D-1715TER 处理器[44] | 2022年第1季度 | 4 | 8 | 2.40 GHz | 3.50 GHz | DDR4 |
至强E处理器为入门级服务器,解决方案提供必要的业务就绪型性能、可扩展性和可靠性。[45]
部分产品型号
产品型号 | 发布时间 | 核心数 | 线程数 | 基础频率 | 睿频频率 | 支持内存类型 |
至强 E-2176M 处理器[46] | 2018年第2季度 | 6 | 12 | 2.70GHz | 4.40GHz | DDR4-2666,LPDDR3-2133 |
至强 E-2388G 处理器[47] | 2021年第3季度 | 8 | 16 | 3.20GHz | 5.10GHz | DDR4-3200 |
至强 E-2378G 处理器[48] | 2021年第3季度 | 8 | 16 | 2.80GHz | 5.10GHz | DDR4-3200 |
至强 E-2278GE 处理器[49] | 2019年第2季度 | 8 | 16 | 3.30GHz | 4.70GHz | DDR4-2666 |
处理器是计算机的大脑,执行计算、任务和功能,第一代至强(Xeon)处理器是为中、高档服务器、工作站服务而推出的,长久以来英特尔(Intel)在 PC 与服务器市场都稳居首位。[50]总的来说,英特尔处理器主要有以下几方面提高服务器的效率。首先,内置 AI 加速的英特尔处理器可以帮助降低为自动化或分析部署 AI 的计算要求,尤其是当这些用例成为主流并且是保持竞争优势所必需的时候。其次,英特尔处理器的内置安全功能可以帮助在服务器启动期间建立信任根,并以低性能开销提供快速数据加密。最后,英特尔处理器支持纠错码 (ECC) 内存,有助于通过检测和纠正系统内存中的单比特数据损坏,提高服务器的正常运行时间。[51]
正如英特尔创作者和工作站解决方案副总裁兼总经理 Roger Chandler 所说,20多年来,英特尔一直致力于为全球专业电脑用户提供高质量的工作站平台。不管是初代 Pentium Ⅱ Xeon(至强)处理器还是2023年2月16日,英特尔宣布推出全新的至强 W-3400和至强 W-2400系列台式机工作站处理器(代号为 Sapphire Rapids),以及英特尔迄今为止功能最强大的台式机工作站处理器至强 w9-3495X,都旨在为媒体娱乐、工程和数据科学专业人士提供强悍性能。[4][52]
物联网应用正使世界变得更加智能、互联、高效,其边缘设备和分布式在各行各业的应用也在不断增加。但这些成果在带来翻天覆地的变化的同时,也带来了技术和业务上的挑战。如果希望通过物联网技术改变世界,安全、性能和成本是无法回避的关键问题。以第三代英特尔至强可扩展处理器为例,可有效提供多种重要功能,帮助满足不断增长的物联网需求。第三代英特尔至强可扩展处理器不仅可以使用速度更快的超级通道互连 (UPI),可以增强平台间的数据传输性能,还可以连接更多外围设备、固态盘和加速器,利用英特尔傲腾持久内存和英特尔傲腾固态盘,帮助将视频分析和存储的总体拥有成本保持在较低水平。[53]
在数据中心领域,除了对性能的极致追求,安全和算法隐私保护也需强化。第四代英特尔至强可扩展处理器的出现能够帮助用户实现零信任安全策略,通过先进的硬件安全技术为业务部署和风险洞察提供新的解决方案,相应的技术包括英特尔 SGX、英特尔TME、算法硬件加速等为客户提供全方位的安全防护。[54]
英特尔至强处理器内置人工智能高端功能,如英特尔深度学习加速(英特尔 DLBoost)、存储、虚拟化和网络,它们为具有大内存空间和 I/O 容量、IT/OT 融合以及边缘工作负载整合系统的多线程应用程序提供性能。[55]以在人工智能领域应用为例,英特尔至强可扩展处理器相比上一代产品,针对深度学习训练和推理可提供高达2.2倍的性能。结合可加快交付人工智能服务的软件优化,相比3年前未经优化的服务器系统,全新的处理器可实现113倍深度学习性能的提升。[56]
从基因组学到低温电子显微技术,再到分子建模,高性能计算 (HPC) 可帮助科学家利用更大的数据集和人工智能驱动型方法,加快科学发现的前进步伐。若传统仿真应用和融入了深度学习的工作负载都能提速,研究人员就能在满足关键时间节点的同时扩大研究范围。第三代英特尔至强可扩展处理器的出现为一系列学科的生命科学和生物信息应用提供强大支持,帮助科研团队更快获得重大发现。很多生物科学领域的应用都利用英特尔 AVX-512 技术来实现处理加速,内核数、内存带宽以及每时钟周期指令执行量的增加,也使一些工作负载的性能得到提升。使得算力研究人员可更快获得研究结果并能扩展数据驱动型研究的范围,业务负责人可缩短新治疗方案的上市时间,同时为实现更好、更快的诊断以及更好的治疗效果提供支持。[57]
英特尔至强处理器可应用在医疗保健领域中的高端成像系统、CAT 扫描、MRI 和 X 光等环节。[53]以乳腺癌为例,人工智能技术可以进行多模态影像数据融合,多维度、立体化进行数据融合分析,为乳腺癌的诊断及治疗提供全面的个体化的综合信息。针对来自多个医疗中心的海量影像数据,至强服务器提供高达768GB的超大内存,配合多核心多线程处理能力,对乳腺采集影像进行像素级别的特征识别。[58]
纵观英特尔数年来的架构设计,从2006年发布的 Conroe 架构开始,2014年发布的 Broadwell 架构,2015年发布的 Skylake 架构,2019年推出的 Tremont 架构、Sunny Cove架构等等,从核心微架构角度来看,英特尔的进步速度是比较快的。在之前的至强可扩展系列处理器上,英特尔所使用的架构往往不是同代架构,而要落后一代以上。比如2019年,Sunny Cove 对应的架构已经使用在第10代酷睿系列移动处理器中了,但是在2021年才应用在第三代至强可扩展处理器上。不过第四代至强可扩展处理器则同步使用了与目前第13代酷睿系列处理器一致的 Golden Cove。本文就以 Golden Cove 架构为例,介绍至强处理器的核心架构。[5][6]
Golden Cove架构解析从发展历程来看是 Willow Cove 的继承者,但是相比 Willow Cove,Golden Cove 是一个显然更宽、更深和更聪明的架构,英特尔宣称 Golden Cove 的设计目标就是实现更高速度、更低延迟和更优秀的单线程性能。其重要特点包括对大型代码和大数据量计算的优化、新增的AI协处理器以及新增的细粒度功率管理智能功耗控制器等。本文主要从以下几个部分来对 Golden Cove 架构进行解析。[5][6]
前端(指令拾取):首先,英特尔在Golden Cove 架构上再次增加了1个简单解码器,变成“1个复杂解码器+5个简单解码器”的设计。Golden Cove现在成功实现了6发射的前端。另外,英特尔在前端解码方面也并非全部依赖6宽度的解码器。在80%的时间内,前端解码器都受制于时钟门控。在这种情况下,微指令缓存起到决定性作用。考虑到前端更大、更宽,英特尔大幅度增加了微指令缓存的性能和宽度。最后再来看前端的指令TLB和指令缓存部分。对于4K TLB,新的设计可以容纳256条目,是之前128条目的两倍。对2M/4M较大的T L B,新的设计可以容纳32条目,也是之前16条目的两倍,尤其是2M/4M TLB 的改进,带来了较大代码效率的显著提升。[6][7][5]
乱序执行单元:在乱序执行窗口方面,Golden Cove 的重新排序缓冲区(ROB)容量从之前 Sunny Cove 的352大幅度提升至512,乱序执行的后端部分则是执行窗口,Golden Cove现在拥有12个执行窗口,相比之前的产品增加了2个。[6][7]
矢量引擎:在矢量单元方面,Golden Cove 在端口01和05上添加了2个新的 FADD 功能,相比之前的 FMA 单元,FADD 的效率更高且延迟更低。另外,FMA 单元现在可以支持 FP16 和复数计算了,05端口的FMA单元可以执行 AV X512计算。英特尔特别指出,FADD 执行浮点加法只需要3个周期,在一些背对背浮点计算(back-to-back floating-point)中,这个周期可以降低至2个。相比之下,上代执行浮点计算的FMA在端口00和01上有4周期延迟,05上有6个周期的延迟。[6][7][5]
标量引擎:在标量引擎方面,Golden Cove 新添加了10号端口用作ALU和LEA计算,因此现在有00、01、05、06、10五个端口可以实现标量计算。值得注意的是,所有这五个执行端口后的功能管道都是复合设计的。经过增加一个新的端口后,Golden Cove 的标量执行端口现在堪称x86中最宽的。[6][7]
全新的PM控制器:对于新的PM控制器,英特尔称它可以将监控的间隔从毫秒级提升至微秒级,并根据实际应用行为来加强功耗预算利用率,最终可以提升性能。这里展示出英特尔对处理器核心和内部结构更为精细的电源控制,能够在更短的时间内瞬间提升处理器部分结构的频率和电源供应,以实现更好的性能,这是智能化电源管理的重要突破。[6][7][5]
高级矩阵扩展(AMX):Sapphire Rapids 中引入的新加速引擎,可为深度学习算法核心的 Tensor 处理提供大幅加速。其可以在每个周期内进行 2000 次 INT8 运算和 1000 次 BFP16 运算,实现计算能力的大幅提升。使用早期的 Sapphire Rapids 芯片,与使用英特尔 AVX-512 VNNI 指令的相同微基准测试版本相比,使用新的英特尔 AMX 指令集扩展优化的内部矩阵乘法微基准测试的运行速度提高了 7 倍以上,为 AI 工作负载中的训练和推理上提供了显著的性能提升。[7][6]
内存单元:为了配合前端、中核和执行单元的改进,Golden Cove 的缓存与内存子系统也进行了改进,变得更宽和更深了。对L1缓存而言,新增的11号端口增加了一组AGU和读取单元,这样每周期可以加载的次数从两次提升到了3次,其中,对于256bit的数据也就是 AVX2 256,每周期可以加载3次,提升了50%;对于512bit的数据也就是 AVX 512,每周期可以加载两次。在L2的改进方面,由于英特尔的一个架构要同时面向消费市场和企业级市场,因此在L2的设计上存在一些差异。对于消费市场而言,L2缓存每核心为1.25MB,考虑到企业级市场对性能要求更为敏感,L2缓存提升至每核心2MB。在性能方面,L2缓存将并行处理的未命中指令数量从之前的32提升至48。在智能化处理方面,L2缓存现在加入诸如基于反馈的预取节流、全行写入带宽预测优化、基于多模式的路径预取器等功能。[6][7][5]
总的来说,Golden Cove相比Sunny Cove整体变化在于采用了更大的乱序窗口、排序单元、浮点计算单元、全新设计的缓存等,因此整个微架构的吞吐能力得到了显著的提升。[6][7]
本文以全新英特尔至强D系列处理器为例,介绍至强处理器特性。作为首款专门为网络和边缘而生的 SoC 芯片,英特尔至强D系列处理器是一个满足边缘计算需求的平衡系统,具备可扩展性、高度集成化以及复杂场景适用性等诸多特性;可以在复杂多变的应用场景和工作负载下,在最大程度上保证计算、内存和 IO 高性能以及最佳延迟的同时,提供节能特性。在可扩展性方面,全新英特尔至强 D 系列处理器最高支持4通道、频率3200Hz 的 DDR4 内存,以太网吞吐量高达100GbE,并有高达32/64个4.0 PCIe通道。其中D-1700可以从4核数扩展到10核数,D-2700则可从4核数扩展到20核数。在集成度方面,英特尔至强D系列处理器集成了以太网、QuickAssist 技术、英特尔软件防护扩展技术以及 AVX-512 指令集带来的AI加速功能,可以实现对各种需求的轻松支持。在复杂场景适用性方面,英特尔至强 D 系列处理器通过集成化的 SoC 封装方式,可以支持低至零下40度的扩展温度,是室内室外和各种复杂环境的紧凑型设计的理想选择。[59][60]
一直以来,英特尔在数据中心市场上占据主要份额,根据国际数据公司(IDC)的统计表明,在2000年第四季度交付的所有服务器中,基于英特尔的服务器所占份额超过84%。同期,基于英特尔的服务器出货量占4道中间层服务器出货量的69%。在增长最快的后端(5路至8路)服务器市场,基于英特尔的服务器所占份额为47%。[1]
同时,根据2021年前后的报道,英特尔也强调了当前第三代英特尔至强可扩展处理器(Ice Lake)的强劲发展势头,已向全球客户出货了近200万片第三代英特尔至强可扩展处理器,仅在2021年第四季度其出货量就已经超过100万。此外,英特尔至强处理器在2021年12月的总出货量超过了行业内同类单家厂商在2021年全年的服务器CPU总出货量。[61]
根据英特尔2023年最新数据显示,英特尔正式向全球数据中心客户推出第四代英特尔至强可扩展处理器(代号“Sapphire Rapids”)在产品发布后仅八周时间,采用该款产品的处理器设计数量创造了英特尔至强系列的历史纪录,其可用平台及出货平台数量也创下新高。[62]根据英特尔公布的数据,过去四代所有的至强处理器已经销售了约8500万颗,其中第三代产品在两年内销售了1500万颗。[63]
展开
[a]截至2023年
展开
[1]钟秀斌. 英特尔推出奔腾Ⅲ至强~(TM)处理器[J]. 互联网周刊, 2001, (11): 139.
[2]Access Denied.英特尔. [2023-11-29].
[3]英特尔推出奔腾Ⅱ至强处理器[J]. 英特尔推出奔腾Ⅱ至强处理器[J]. 上海微型计算机, 1998-07-15: 26. (2)
[4]用“芯”至强——国产基于Xeon的服务器和工作站初览[J]. 每周电脑报, 1998-07-08: 35. (2)
[5]徐昌宇(文/图), 袁怡男. 创新带来算力持续提升 第四代英特尔至强可扩展处理器解读[J]. 微型计算机, 2023, (3): 85-94.
[6]徐昌宇(文/图). 为下一个创新时代奠定基础 2021年英特尔架构日技术解读[J]. 微型计算机, 2021, (27): 90-98.
[7]Access Denied.英特尔. [2023-11-30].
[8]英特尔至强可扩展处理器使能数字未来[J]. 中国信息化, 2017-08-10: 41.
[9]最高28核56线程英特尔发布至强可扩展处理器[J]. 微型计算机, 2017: 41-41.
[10]王熙. 英特尔“至强”新品发布服务器市场进入“更新潮”[J]. 通信世界, 2017: 16. DOI:10.13571/j.cnki.cww.2017.20.006.
[11]美光DDR5为第四代英特尔至强可扩展处理器带来更强性能[J]. 单片机与嵌入式系统应用, 2023-04-01: 9.
[12]仝仁. Intel至强处理器更名换代[N]. 中国计算机报, 2001-05-28
[13]邵虞. Intel绝地反击首推64位Nocona[J]. 电子产品世界, 2004, (19): 43.
[14]Xeon发展历程之双核心的双路处理器Xeon DP.太平洋电脑网. [2023-11-29].
[15]林雨. 至强系列入主服务器潮流[N]. 民营经济报, 2006-07-03
[16]英特尔发布四路四核至强性能提升两倍,性能功耗比提升三倍[J]. CAD/CAM与制造业信息化, 2007-09-15: 68.
[17]至强E3-1230 V3持续降价 卖场仅售1380.中关村在线. [2023-11-30].
[18]wesd. 可搭配至强E3 1230处理器的Intel 6系列主板[J]. 微型计算机, 2011, (22): 137-137.
[19]E3至强“神教”重现江湖?民用消费级电脑是否还有至强的一席之地.今日头条. [2023-11-30].
[20]503 - Service Unavailable.太平洋电脑网. [2023-11-30].
[21]英特尔正式发布第四代至强可扩展处理器[J]. 高科技与产业化, 2023-01-31 : 6.
[22]英特尔预览第五代至强处理器:拥有288核,AI性能将提高3倍.新浪财经. [2023-11-30].
[23]袁怡男, 刘忆冰, 张山. 多云世界芯飞跃--2017英特尔至强可扩展处理器解析[J]. 微型计算机, 2017, 0(24): 102-108.
[24]第四代英特尔® 至强® 可扩展处理器.英特尔. [2023-12-04].
[25]Access Denied.英特尔. [2023-11-29].
[26]Access Denied.英特尔. [2023-11-29].
[27]Access Denied.英特尔. [2023-11-29].
[28]Access Denied.英特尔. [2023-11-29].
[29]不只是节省成本! 英特尔至强CPU Max系列凭借HBM显著提升HPC、AI负载性能.中关村在线. [2023-12-04].
[30]英特尔® 至强® CPU Max 系列.英特尔. [2023-12-04].
[31]Access Denied.英特尔. [2023-11-30].
[32]Access Denied.英特尔. [2023-11-30].
[33]Access Denied.英特尔. [2023-11-30].
[34]Access Denied.英特尔. [2023-11-30].
[35]Access Denied.英特尔. [2023-11-30].
[36]Access Denied.英特尔. [2023-11-29].
[37]Access Denied.英特尔. [2023-11-29].
[38]Access Denied.英特尔. [2023-11-30].
[39]Access Denied.英特尔. [2023-11-30].
[40]Access Denied.英特尔. [2023-11-30].
[41]Access Denied.英特尔. [2023-11-29].
[42]Access Denied.英特尔. [2023-11-29].
[43]Access Denied.英特尔. [2023-11-30].
[44]Access Denied.英特尔. [2023-11-30].
[45]Access Denied.英特尔. [2023-11-30].
[46]Access Denied.英特尔. [2023-11-29].
[47]Access Denied.英特尔. [2023-11-29].
[48]Access Denied.英特尔. [2023-11-29].
[49]Access Denied.英特尔. [2023-11-29].
[50]英特尔服务器市场根基深厚 霸主地位短期难撼.AET电子技术应用. [2023-12-01].
[51]服务器处理器:选择合适的服务器 CPU.英特尔. [2023-12-01].
[52]多任务性能提升120%!英特尔推出全新至强W系列工作站处理器.微型计算机. [2023-12-01].
[53]Access Denied.英特尔. [2023-11-30].
[54]英特尔第四代至强:七大算力协作众多产业场景快速发展.腾讯网. [2023-11-30].
[55]Access Denied.英特尔. [2023-11-29].
[56]英特尔至强可扩展处理器使能数字未来[J]. 中国信息化, 2017-08-10: 41.
[57]面向 HPC 的第三代英特尔® 至强® 可扩展处理器在生命科学领域大展拳脚.英特尔. [2023-12-01].
[58]赵玉娟. 驱动智慧医疗,从至强开始——英特尔,用人工智能解决大问题[J]. 中国医院院长, 2018, (22): 109.
[59]英特尔发布至强D系列处理器:三大特性加持 释放网络及边缘潜能.今日头条. [2023-11-29].
[60]向边缘而生,英特尔发布全新至强D系列处理器.通信世界网. [2023-11-30].
[61]英特尔至强单月总出货量超其他厂商全年服务器CPU总出货量.快科技. [2023-11-30].
[62]英特尔:第四代至强可扩展处理器可用平台及出货平台数量创新高.新浪财经. [2023-11-30].
[63]2022行业观察丨数据中心市场需求复苏 CPU、GPU芯片激烈角逐.21世纪经济报道. [2023-11-30].
该页面最新编辑时间为 2023年12月6日