数据中心持续演进,性能、扩展性与运维效率,面临新一轮挑战,如何在有限空间内实现更强算力与灵活部署?作为戴尔科技面向核心场景打造的全新2U服务器,Dell PowerEdge R770首发支持Xeon 6处理器家族,并引入OCP DC-MHS模块化标准,这款“设计有变,性能有料”的重磅新品,在专业评测机构StorageReview的实测中表现如何?让我们一探究竟!
戴尔PowerEdge R7x0系列服务器长期以来一直是数据中心的核心设备,其以卓越的制造质量、周到的设计、性能、密度和可靠性以及多功能的2U外形而闻名。如今,随着戴尔PowerEdge R770的推出,该系列服务器实现了重大飞跃。
R770首次搭载英特尔全新至强6处理器系列,包括至强6500和6700P核心及E核心处理器。这标志着戴尔首次在其主流服务器产品线中全面采用OCP数据中心模块化硬件系统(DC MHS)标准。这两项改进共同预示着其性能和设计理念的重大革新。
满足现代数据中心需求
R770的推出正值数据中心面临多重挑战之际,工作负载变得愈发多样化和复杂化。数据的持续增长推动着对强大分析功能和数据库的需求。
与此同时,能源效率和总拥有成本(TCO)的优化也备受关注。此外,业界越来越倾向于开放标准,以促进创新、增强互操作性,并尽可能减少供应商锁定。R770配备全新处理器选项,并采用OCP DC MHS标准,旨在正面应对这些挑战。
模块化设计与OCP DC MHS的全面支持
PowerEdge R770在物理设计和组件架构方面实现了重大进步,采用了开放计算项目(Open Compute Project)的数据中心模块化硬件系统(OCP DC MHS)标准。
R770延续R7x0系列的优良传统,提供丰富的配置选项,以满足多样化部署需求。该系列的一大亮点是支持传统的后置I/O配置和前I/O冷通道可访问配置,从而为不同数据中心布局和可维护性需求提供更大灵活性。
存储选项同样丰富多样,从专注于计算且本地存储极少,或没有本地存储的节点,到支持40个E3.S硬盘的高密度配置,满足以存储为中心的工作负载。
为了满足日益增长的加速计算需求,R770拥有强大扩展能力。根据机箱和扩展槽配置,服务器最多可支持6个Gen5 x16全高全长PCIe插卡,并可安装两块双宽GPU,使其成为一个能够胜任各种任务的平台。通过OCP 3.0 Mezzanine插槽,还可选择x8或x16的网络适配器。
戴尔还实施了多项设计改进,旨在提高可维护性和可靠性。例如,BOSS(启动优化存储解决方案)卡从原先通过线缆连接并集成在PCIe扩展槽中的形式,升级为符合OCP标准的独立卡片,直接连接主板,减少了线缆复杂性。
这款新BOSS控制器配备了更快的NVMe M.2驱动器,并配备散热器,以确保启动设备在理想温度下运行。此外,在维护操作方面,从传统跳线更换为更易用的DIP开关,例如用于清除NVRAM。
最深远的架构变革是完全采用OCP DC MHS 标准。戴尔在上一代产品中已引入部分OCP元素(如OCP 3.0网络插槽),而R770进一步扩展。包括主板(HPM)、扩展槽(M-XIO接口)等关键组件都采用了OCP规范,提升了灵活性与可升级性。iDRAC(管理控制器)也以OCP DC-SCM(服务器控制模块)标准实现。
此外,R770引入了全新的PICPWR电源接口,用于为GPU和背板等外设供电。该接口显著简化了供电方案,并集成了在线功耗监控功能。这种深度集成使各个子系统的接口和外形尺寸标准化。
新一代iDRAC 10
戴尔PowerEdge R770在原有功能丰富、广受欢迎的iDRAC 9基础上,引入了新一代iDRAC 10,通过与数据中心安全控制模块(DC-SCM)的无缝集成,进一步增强了系统管理能力。
这种集成支持更高效的固件更新与配置管理,确保整个数据中心操作的一致性与可扩展性。iDRAC 10同时具备高级自动化与监控能力,使IT管理员能够在不牺牲性能或可靠性的前提下,高效管理大规模部署。
安全性是R770管理功能的基石,戴尔实施了强大的预启动和启动验证机制。借助基于硅的信任根技术,iDRAC 10确保包括BIOS与自身在内的所有固件在执行前均经加密验证。这种基于硬件的不可篡改的安全措施可防止恶意软件篡改和供应链攻击,为系统运行提供安全的基础。
此外,R770还集成了量子安全启动协议,以应对未来可能出现的加密威胁,进一步巩固关键基础设施的安全性。
戴尔对供应链安全的承诺在R770的设计中得到了充分体现。其采用完整的信任链认证流程,所有硬件组件在制造过程中嵌入加密签名,并在部署前进行验证,确保系统仅运行授权固件与正品部件,从而降低未经授权更改或仿冒部件带来的风险。
Dell PowerEdge R770性能测试
作为戴尔的旗舰主力服务器系统,R770将部署于众多不同的应用环境。因此,StorageReview对该平台进行了多项基准测试,以展示其在不同场景下的性能表现。在部分测试中,还加入了其他厂商服务器的对比数据,以体现高端E核与P核CPU在性能上的差异。
系统配置
CPU:2颗Intel Xeon 6787P(每颗86核)
内存:32xMicron64 GB双Rank DDR5 6400MT/s,总容量2TB
电源:2xDelta 1500W
GPU:1xNVIDIA L4
网卡:DELL BRCM 4P 25G SFP 57504S OCP网卡
BOSS卡:BOSS-N1 DC-MHS,磁盘0和1 为SK hynix 480 GB Dell NVMe ISE PE9010 RI M.2 SSD
磁盘:背板1上的磁盘槽位0-5配置为三星 6.4TB,Dell NVMe PM1745 MU E3.S SSD(6.4TB)
#01GPU Direct Storage(GDS)
GPU Direct Storage是一种绕过CPU和系统内存,在存储设备和GPU之间实现直接数据传输的技术。在传统的数据传输流程中,数据首先从存储中读取至CPU内存,再从CPU内存复制到GPU内存。这一过程涉及多次数据拷贝,带来延迟增加和性能下降的问题。而GDS通过允许存储设备直接访问GPU内存,有效消除了这一瓶颈。
StorageReview基于一个包含16块硬盘的存储系统进行了GDSIO负载分析,逐步增加参与的硬盘数量,以评估在R770平台上该系统的存储性能以及其对PCIe Gen5 GPU带宽饱和度的影响。
读取测试图表显示,随着所用KIOXIA CD8P SSD数量从1块增至4块,总读取吞吐量快速上升,最高达到约50.2GiB/s。这表明,仅需3至4块驱动器即可充分利用PCIe Gen5 x16链路带宽,满足GPU数据加载需求。而当硬盘数量超过5块后,总吞吐量趋于平台期,新增硬盘对性能提升效果不大。
与此同时,每块硬盘的平均读取吞吐量在前4块时保持稳定,但在继续添加硬盘后出现下降。这一现象的原因在于,更多的硬盘共享有限的PCIe总线带宽,导致单块硬盘的读取能力被分摊。
与读取相比,这些硬盘的写入性能偏低。在写入测试中,必须使用全部16块硬盘才能达到46.7GiB/s的写入带宽,而各硬盘的平均写入速度基本保持不变。这是因为所用的KIOXIA CD8系列属于较低写入性能容量版本,若采用大容量版本或其他PCIe Gen5 SSD,写入表现可能会更好。
#02HammerDB TPROC-C数据库
基准测试
StorageReview使用HammerDB的TPROC-C基准测试对四款流行的开源数据库进行了评估,分别是MariaDB 11.4.4、MySQL 8.4.4、MySQL 5.7.44和PostgreSQL 17.2。该测试模拟了覆盖500个仓库的OLTP(联机事务处理)工作负载。
在此次评测中,MariaDB表现最为出色,尤其是在双路处理器配置下,其可扩展性优秀,实现了最高的事务吞吐量。MySQL 8.4.4相较旧版的5.7.44有显著性能提升,体现了新版在性能优化方面的进步。PostgreSQL 17.2表现稳定,但略逊于MariaDB和MySQL 8.4.4。
在单路CPU情况下,MariaDB实现了315万TPM(每分钟事务数)在双路CPU配置中,MariaDB达到了580万TPM,在两个场景中都领先其他数据库。
尽管R770搭载了强大的硬件(每颗CPU配备86 个核心,包含性能核和效率核),但没有数据库在横跨双路CPU时表现出明显的性能增益。这也反映出开源数据库普遍更倾向于在单路处理器上运行,以获得更好的核心局部性(核心调度更贴近数据)和更低的内存访问延迟。
因此,根据测试结果,R770更适合在虚拟化环境中运行多个数据库实例,而不是横向扩展单个实例。其架构更适合支撑高密度、混合数据库的负载,能够有效利用性能核与效率核,实现多个实例的稳定吞吐。
#037-Zip基准测试
7-Zip是一款流行的压缩工具,它自带的内存基准测试可以评估系统在数据压缩与解压缩任务中的CPU和内存性能,反映系统对数据密集型工作负载的处理能力。
在此次测试中:
压缩性能方面,R770得分266.425 GIPS,并且CPU使用率略低,表现出更优的压缩效率。
解压缩性能方面,对比系统表现更强,得分288.457 GIPS,高于戴尔的256.154 GIPS,但CPU使用率也相对更高。
总体评分,戴尔系统以261.290 GIPS略高,展现出在压缩和解压缩任务中更均衡的效率表现。
#04y-cruncher性能测试
y-cruncher是一款广受欢迎的基准测试和压力测试工具,特别适合用于测试大核心数平台,并揭示单路与双路平台在计算能力上的差异。
本次y-cruncher基准测试结果显示:随着数据集规模扩大,R770(搭载性能核心P-core的CPU)与对比系统(采用能效核心E-core的CPU)之间的性能差距显著拉大。这不是简单比较哪台系统更强,而是更侧重展示不同CPU架构在此类计算负载下的表现差异。
在较小计算规模下,R770就已领先:计算10亿位圆周率时,仅用2.753秒,而对比系统耗时5.997秒,几乎是两倍。
工作负载继续扩大时,差距进一步扩大:在100亿位测试中,R770耗时34.873秒,而对比系统需要81.046秒,R770快了一半以上。
当计算规模达到500亿位时,R770用时221.255秒,对比系统则为476.826秒,R770快了53%。
最终,在1000亿位计算中,由于对比系统配置仅为512GB内存,无法完成测试;而内存达到2TB的R770系统则顺利完成任务,仅用491.737秒,展现出强大的内存容量和计算性能协同能力。
#05Blender OptiX性能测试
Blender是一款开源的3D建模与渲染应用。此次测试使用Blender Benchmark工具进行,测试结果以“每分钟采样数”计量,数值越高表示性能越好。
测试结果显示,在CPU渲染方面,R770相较对比系统具备明显的性能优势:
在Monster场景下,R770达到了1706.002 samples/min,比对比系统的1432.09 samples/min高出约19%。
在Junkshop场景测试中,R770为1169.370 samples/min,而对比系统仅为914.75 samples/min,差距扩大至28%。
在Classroom场景中,R770成绩为791.475 samples/min,对比系统为656.68 samples/min,领先20%。
值得注意的是,对比系统系统未配置GPU,因此无法参与基于GPU的渲染测试。而R770搭载的NVIDIA L4GPU在GPU渲染测试中表现如下:
Monster场景:1895.71samples/min
Junkshop场景:950.42samples/min
Classroom场景:968.43samples/min
R770不仅在CPU渲染方面表现出色,在GPU渲染方面同样具备强劲的能力,适合高负载的图形渲染场景。
#06Cinebench R23基准测试
Cinebench R23是一款评估系统CPU性能的工具,通过渲染复杂的3D场景来测试处理器的计算能力。它分别测量单核性能和多核性能,可全面反映CPU在3D渲染任务中的表现。
在Cinebench R23测试中,R770与对比系统在CPU性能上表现出明显差异,尤其是在核心数量方面:
多核测试中,对比系统搭载2颗Intel Xeon 6780E(每颗144核,共计288核),在多线程工作负载中占据优势,得分99266分,高于戴尔的74710分(R770配置为2颗Xeon 6787P,每颗86核,共172核)。显示出在多核测试中内核数量多少的重要性。
在单核测试中,R770表现更佳,得分为1272分,超越对比系统的894分,凸显了R770虽然核心数较少,但单线程效率却更胜一筹。
#07Cinebench 2024 基准测试
Cinebench 2024是Cinebench R23的扩展版本,新增了对GPU性能的评估,在延续CPU测试的基础上,加入了GPU加速渲染的测试项目。
GPU性能测试中,R770的GPU得分为12996分,展现出其处理GPU加速渲染任务的能力。而对比系统因未配置独立GPU,未参与此项测试。
CPU多核测试中,对比系统得分2884分,略高于R770的2831分,再次印证其在核心数量上的优势。
CPU单核测试中,R770依旧领先,得分71分,高于对比系统的53分,说明其在单线程任务上依然具备更高效的处理能力,适合对响应速度和单核性能要求较高的应用场景。
#08Geekbench 6基准测试
Geekbench 6是一款跨平台的系统性能测试工具,用于评估系统整体计算能力,并可通过Geekbench浏览器对比不同设备的表现。
测试结果显示,R770与对比系统在性能上存在明显差异:
CPU单核性能测试:R770得分1797,对比系统得分1173,R770领先53%,显示出其在单线程任务中的更强计算效率。
CPU多核性能测试:R770得分15880,高于对比系统的13868,拥有14%的优势,表明R770的Xeon 6787P处理器在多核任务中表现更优,适合并行计算场景。
GPU OpenCL测试:R770凭借NVIDIA L4 GPU取得148730分,对比系统未搭载GPU。
#09Blackmagic RAW视频编解码
性能测试
Blackmagic RAW Speed Test是一款用于评估系统在使用Blackmagic RAW编解码格式下处理高清视频能力的工具。它分别测试CPU与GPU解码视频时的帧率表现。
CPU视频解码测试:R770实现了141帧/秒(FPS),高于对比系统的120FPS,说明戴尔在基于CPU的视频处理任务上效率更高。
GPU视频解码测试:戴尔凭借NVIDIA GPU,取得了157FPS。对比系统未搭载GPU。
#10Blackmagic磁盘读写性能测试
Blackmagic Disk Speed Test专注于磁盘读写速度测试,常用于评估存储系统是否满足视频编辑对4K/8K内容流畅播放和剪辑的要求。
在该测试中,R770配备的BOSS卡(含两块SK hynix 480GB NVMe,构成镜像RAID)达到了:
读取速度:3010.3 MB/s
写入速度:976.3 MB/s
该成绩表明,R770在高分辨率视频工作流中具备出色的存储响应能力。
结 论
戴尔PowerEdge R770令人振奋,不仅因为其搭载了最前沿的硬件配置,更重要的是它全面采用了OCP数据中心模块化硬件系统(DC-MHS)标准。
这一标准的引入带来了诸多优势,包括:
● 更强的模块化设计
● 更便捷的运维能力
● 以及通过标准化带来的潜在成本降低
这种设计理念在系统的各个方面均有体现,从将iDRAC实现为OCP DC-SCM模块,到每一个接口的布局设计,无不体现出对开放性和高可维护性的高度重视。
R770在存储方面同样表现出色,单个2U机箱最多可支持40块E3.S硬盘,为高存储需求工作负载提供了理想选择。此外,其灵活的配置选项也为多样化的数据中心布局提供支持,例如支持前置I/O的冷通道可维护架构,进一步提升运维效率与部署适应性。
凭借对多款GPU的广泛支持以及搭载英特尔Xeon 6性能核心(Performance-core)处理器,R770可谓是一款集算力、灵活性与扩展性于一体的强大平台,非常适合用于应对现代数据中心中的多种场景需求,包括人工智能、HPC高性能计算,以及传统企业级工作负载。其领先的硬件架构、模块化设计理念与稳健的安全特性,使得PowerEdge R770成为企业部署新一代数据中心平台时极具吸引力的选择。