
尽管生成AI和可预测的AI的浪潮越来越高,但这些类型的工作负载变得更加丰富和复杂,对AI服务器性能和能源效率的需求也会提高。每当我们谈论AI服务器,AI工作站,AI多合一设备和其他设备时,许多人都会以高计算强度对AI GPU加速器做出反应。它确实是整个AI系统的对手,并且执行了最糟糕的任务,但不要忘记GPU加速器不能仅靠整个系统,并且如果没有CPU处理器的位置,就无法完成任何计算系统。作为任何计算系统的中心和大脑,CPU处理器在AI系统中也起着不可替代的作用,但它们总是相对较低。如果GPU加速器是AI系统中显示其技能在舞台前面的Blamelaw Star,则CPU处理器是藏在幕后和安静的风险的管家,协调E的有效操作。NTIRE系统,特别是确保可以完全满足各种GPU加速器的需求,并且可以很好地放电。因此,目前,我们通常将CPU处理器称为“主控制CPU”。 Master CPU最合适和匹配用于生产良好的AI超速系统,以在工作负载绩效与总体总成本(TCO)之间达到完美的平衡。在AI的超速系统中,Master CPU通过提供出色的任务管理和出色的预处理性能来负责处理和使用资源的处理。这对于确保AI模型培训过程中的良好数据供应并保持完美的AI处理器操作状态非常重要。作为AI超速系统的“中心神经”,CPU的主要控制可以执行各种活动,例如管理,优化,预处理,处理和加载,从而提高系统性能和能源效率。英特尔的Xeon系列处理器E特别是最新一代的Xeon系列,可以说是基于各种AI基准或全球客户扩展的实际体验的强大和高效AI加速系统的大师CPU的绝佳选择。 NVIDIA的最新,最强的DGX B300系统选择了Intel的新Xeon 6776p作为主要CPU控制,而去年的MGX系统则使用Xeon 6767p和IBA,但Intel也是NVIDIA B300的唯一主要CPU控制伙伴。为什么XXI 6如此强大?我们可以从六个不同的方向查看AI加速度系统对主CPU的需求,以及Xeon 6系列6。1。Xeon 6系列可以支持多达96个PCIE 5.0频道,上一代增长了20%。双通道系统具有192个,因此带宽非常高,并且管数足够,因此可以使用不同的加速器和扩展卡进行弯曲。 2。AI加速度系统需要最高的单线程完美Ormance。 Xeon 6系列不仅最高128个性能核心和3级高速缓存为504MB,而且还具有强烈的孤独性能并支持涡轮加速度的项目文章。例如,PCT(优先核心涡轮频率)可以在较高频率下加速少数芯,以提供相应的GPU,该GPU支持多达8个核心。例如,SST可以为不同的基本调整提供不同的频率以具有不同的性能。 3。AI加速系统需要尽可能最大的内存和带宽容量。 Xeon 6系列不仅支持DDR5-6400的较高频率,而且仅支持MRDIMM内存,其频率高达8800MHz,带宽进一步增加了30%,这在上一代早些时候是2.3倍,这对于可灵敏的载荷特别有用。 Xeon 6系列最多可提供12个Chmemory Annel,可以提供无与伦比的带宽和内存能力,并具有一个支持高达3TB的系统。 NVIDIA DGX B300系统选择了每个通道的两个DIMM(2DPC)和5200MHz频率解决方案,主要是为了实现平衡,导致带宽,容量和成本的行业。此外,Xeon 6系列还支持CXL,可以保持CPU内存空间和AI加速器内存之间的一致性,实现高性能资源的共享并降低整体系统成本。 4。AI的超速系统需要CPU促进和安装数据。 Xeon 6系列支持AMX(高级矩阵扩展)指令,并增加了对FP16数据格式的支持,这适用于这项工作。尤其是在MOE模型和广泛的MLP的外观和普及,某些CPU工作的安装变得越来越流行。 5。AI超速系统需要强大的RAS。 RA是指可靠性,存在和维护。这是工作站,服务器和数据中心硬件的必要功能。 CoURSE,Xeon 6需要需要。这样,它可以大大减少大规模的停机时间并防止高损失。 RAS技术支持许多高级管理功能,包括遥测,平台监控,共享资源控制,实时固件更新等,它们汇集了平台合作伙伴的丰富专业知识和经验,ISV独立软件的开发人员以及解决方案的集成商。 6。AI的超速系统需要富裕的形式。 Xeon 6系列支持全球DC-MHS标准。如果是NVIDIA MGX或DGX,则双方共同努力。最新的是DGX B300,由双方共同创建,并进行了许多技术验证工作。在Xeon 6系列家族中,有三种专门为Master CPU设计的特殊型号。它们都是基于P核设计的,即性能核心。其中,NVIDIA DGX B300使用Xeon 6776p和双通道调整。 Xeon 6776p配备了64个核心(128个线),一个2.3GHz的参考频率,3.6GHz的全核涡轮频率和3.9GHz的最大涡轮频率。 PCT Turbo频率的运行量可以达到4.6GHz高达8个核心,在传统的SKU中,它再次增加到700MHz。此外,它配备了336MB缓存,支持八通道DDR5-6400和MRDIMM-8000内存,并可以提供88pcie 5.0通道,Thermal Design Exptument 350W。在这里,我们解释了许多不同的涡轮频率:所有核心涡轮是当所有芯子都活跃时可以运行的最高频率。它适用于虚拟机和其他情况。目前,每个核心都需要在性能上尽可能高。最大涡轮频率,尤其是最大涡轮增压频率,是传统SKU中可以达到的最高涡轮频率。它假设核心的一半是活跃的,另一半是休眠的,而活性核可以以较高的频率运行,即频率相应的to最大涡轮增压。优先核心管道意味着仅打开少量的核心,通常2-8,允许他们进一步加速较高的频率,以满足GPU,I/O等的刺激性需求,在具有较高性能并防止系统瓶颈的AI超速系统中。至于核心用于加速,您可以在启动前使用BIOS设置,也可以在操作过程中使用SST-TF工具实时设置它。单渠道Xeon 6774p也是64个核心。除了将参考频率提高到2.5GHz外,与Xeon 6776p的最大差异是它仅支持单渠道,但最多可提供136个IO通道,并且具有更强的扩展性能。 Xeon 6 AP平台的6962p具有72个核心,144个线,432MB缓存,参考频率为2.7GHz,全核涡轮频率也为3.6GHz,最大涡轮频率也为3.9GHz,PCT Turbo的频率Flowbo为4.4GHz。它还支持12个内存频道,可以提供96PCIE通道,热设计功耗达到500W。以上三个是针对所有客户,产品计划和路线图计划的开放产品。我刚刚提到了Xeon 6作为AI系统中的主要CPU控制。这是整体分析图。它属于高端DGX,是专门为AI培训等应用而设计的。它配备了双通道Xeon 6776p Master CPU处理器,该处理器与UPI高速总线交织在一起。每个通道最多具有8个PCT涡轮核心。客户可以根据需要在使用时自定义并根据需求为PCT涡轮增压的8、6、4或2个核心选择。在每个功能强大的6776p下,四个AI GPU由两张NIC高速网络卡连接。整个系统是八个AI GPU,它们与NVLink高速总线交织在一起。选择主要CPU时,该系统采用了相对平衡的设计,但其性能仍在领导该行业,其I/O性能,RAS,RAS,RAS表现等非常平衡,毫无疑问是一个不错的选择。当然,我们知道自发开发的GRACE CPU处理器被广泛用于NVIDIA AI加速系统中,以匹配AI GPU加速器。实际上,在市场上,许多AI系统提供商目前正在使用CPU开发的硕士学位来匹配AI GPU。从英特尔的角度来看,其服务方向是为客户提供更多选择,作为一个开放的系统,始终遵循明天的ITOMANGING,并为CPU基本控制提供最佳选择,以满足客户的各种需求。 NVIDIA DGX B300产品已选择Intel Xeon 6作为主要的CPU控制,它不是测试或测试产品,而是商业成人产品,这无疑是对Intel Xeon产品的性能和兼容性的强烈认识。 (来源:Kuai技术)