内存扩展CXL加速发展,繁荣AI存储

2024-08-18

(文/黄晶晶)CXL即Compute Express Link,是一种全新的互连协议,为各种处理器包括CPU、GPU、FPGA、加速器和存储设备提供统一接口标准,可以有效解决内存墙和IO墙的瓶颈。它通过PCI Express的物理层,提供低延迟和高带宽的连接,旨在支持下一代数据中心的高性能计算和内存密集型工作负载。

CXL主要有CXL.io、CXL.cache和CXL.memory三个子协议,分别处理I/O、缓存一致性和内存访问。PCIe物理层为CXL高效的数据传输提供技术底座,CXL.cache和CXL.memory子协议协调处理单元的内存一致性,内存池化和热插拔使得数据中心可以更灵活地分配和管理内存资源。

2019年至今,CXL已经发表了1.0/1.1、2.0、3.0/3.1五个不同的版本,主要针对内存池化、内存热插拔、内存共享和访问、以及互连通信能力等进行增强优化。CXL可扩展内存技术发展到3.1阶段,CXL 3.1是对CXL 3.0版本的渐进性的更新,新规范对横向扩展 CXL 进行了额外的结构改进、新的可信执行环境 ehnahcments 以及对内存扩展器的改进。

面对AI大模型对数据处理速度和响应时间的要求不断增长,在处理器、存储芯片、控制器、模组等厂商的推动下,CXL加速发展进程。

利用CXL内存扩展将DDR4 DIMMs“变废为宝”

今年7月Marvell 宣布推出其突破性的Structura CXL产品系列。该系列是业界首款支持四个内存通道、集成内嵌压缩并采用 5 纳米制造工艺的产品。包括Structera A CXL 近内存加速器,和 Structera X CXL 内存扩展控制器。前者是一类新型设备,它们集成了服务器级处理器核心和多个内存通道,以应对高带宽内存应用,例如深度学习推荐模型 (DLRM) 和机器学习。Structera X CXL 内存扩展控制器可以为通用服务器添加数TB的超大容量内存,应对高容量内存应用的需要,例如内存数据库。

内存扩展CXL加速发展,繁荣AI存储 (https://ic.work/) 推荐 第1张


Structera A 加速器集成了 16 个 Arm Neoverse V2 核心,优化了高内存带宽应用的性能,例如 DLRM和ML/AI任务。DLRM 同时具有稀疏和密集内存操作的特点。稀疏操作可能会遇到内存墙困境,即内存带宽不足以满足可用计算的需求。Structera A 2504 加速器是该系列的第一个产品,支持高达 200 GB/sec内存带宽和 4TB 的内存容量。

随着服务器的世代更替,预计在未来几年内,数百万个仍然具备使用功能的 DDR4 DIMMs 将成为电子废弃物,因为大部分客户开始使用具备 DDR5 内存模块的新服务器替换现有的服务器。而The Structera X 2404 使客户可以从退役的通用服务器中回收他们的 DDR4 DIMMs。

Marvell 表示,使用这些DDR4 DIMMs 来扩展这些服务器的内存容量可以降低每台通用服务器数千美元的资本支出。对退役的 DDR4 DIMMs 进行再利用还有助于实现数据中心的绿色可持续性目标。

Structera X 2404通过先进的CXL技术不仅重新利用DDR4内存条,还可帮助服务器制造商、数据中心运营们减少对更先进内存的依赖,既能降低采购成本又可扩充内存容量。DDR4内存再利用,也能够在一定程度上缓解当前DDR5内存供不应求的形势。

CXL内存模组陆续量产,有望下半年开始爆发

三星电子存储部门新业务规划团队董事总经理 Choi Jang-seok近日表示,CXL市场预计将在今年下半年蓬勃发展,到2028年CXL市场将迅速增长,CXL将成为存储器行业的主流。

早在2021年5月,三星电子开发出全球首款基于CXL的DRAM技术;2022年推出业界首款基于CXL 1.1的512GB CXL DRAM;2023年5月开发出支持CXL 2.0的128GB CXL DRAM;今年第二季度推出支持CXL 2.0的256GB CMM-D产品,计划今年年底之前批量生产。

今年3月,三星电子透露正研发 CMM-H 混合存储 CXL模组。该模组同时包含DRAM 内存和 NAND 闪存。原型 CMM-H 将配备基于 FPGA 的 CXL 1.1 控制器,采用 E3.L 2T 规格,最大容量 4TB,最大带宽 8GB/s。另外,三星第一代CMM-D搭载支持CXL2.0的SoC的,计划在2025年发布搭载第二代控制器、容量为128GB的新产品。

对AI服务器至关重要的技术是CXL,它能有效提升系统带宽和处理能力。SK海力士通过CXL Memory Module-DDR5 4(CMM-DDR5)充分展示了CXL产品的强大优势。与仅采用DDR5的系统相比,它能给系统带宽和容量带来极为显著的提升。

去年8月,美光宣布推出CZ120内存扩展模块,基于CXL2.0Type3标准,采用最新的PCIe5.0x8接口,并且外形符合E3.S2T规格。CZ120内存扩展模块内部搭载了Microchip的SMC2000微控制器,并使用了1α工艺节点生产的DRAM芯片。提供128GB和256GB两种容量选择。CZ120内存扩展模块具备出色的带宽性能,可以提供高达36GB/s的带宽。在特定的工作负载中,如数据库软件,CZ120内存扩展模块的优势更加明显。

内存扩展CXL加速发展,繁荣AI存储 (https://ic.work/) 推荐 第2张


另外,国内厂商方面,今年江波龙展出一款基于Compute Express Link (CXL)技术的创新内存扩展设备——CXL 2.0 AIC内存扩展卡。这款扩展卡采用非DRAM on-board封装设计,可兼容多种容量和规格的直插式内存条。它不仅支持CXL1.1标准,实现单个计算节点服务器线缆直连的直插式内存条扩展,还兼容CXL2.0标准,支持多个计算节点服务器集群与存储池线缆直连的直插式内存池化,从而满足多样化的应用场景需求。

小结:

Yole统计显示,全球CXL市场预计从2022年的170万美元增长2028年的150亿美元。处理器方面英特尔发布全新的至强6700E系列处理器,提供了对CXL 2.0技术的支持。CXL 2.0却新增了一系列面向安全、合规、高可靠方面的特性,更适合应用在数据中心。三星支持CXL 2.0的256GB CMM-D产品也将于今年底前量产。同时,各大厂商都在研发支持CXL3.0的处理器、CXL DRAM等产品,从而将内存扩展内存技术的更多特性带入数据中心,加速CXL的应用,毕竟AI对于存储的需求已时不我待。

文章推荐

相关推荐