生成式AI是最近行业最火的话题,作为存储芯片国际大厂的铠侠,对于闪存在生成式AI时代的技术和应用有着前瞻的理解和举措。与此同时,铠侠也一直引领着PCIe Gen5 SSD的落地发展。在2024中国闪存市场峰会期间,铠侠高管们发表演讲并接受媒体采访,分享了诸多对闪存技术和市场的洞见。
2024是PCIe Gen5 SSD重要的一年
铠侠于2022年开始推出E3.S的CD7 SSD,2023年推出E.3和U.2的CM7 SSD,2024年开始进行CD8P系列SSD的送样,持续加快PCIe Gen5 SSD的应用落地。铠侠预计,2024年将是PCIe Gen5在PCIe SSD中占据重要份额的一年。
铠侠CTO柳茂知先生表示,PCIe 5.0与4.0的部署情况相比面临着一些困难。柳茂知先生分析了EOM驱动器、系统、插槽问题, PCIe Gen5复位/速度变化循环测试问题,和Retimer PHY初始化时间设置不正确等。
他建议在PCIe 5.0系统设计时,不使用电缆,尽可能少地使用连接器,从而缩短PCIe信号线的长度,并最大限度地减少阻抗波动。针对PCIe 5.0应用的关键检查点,建议对CPU-I/ CPU-A BIOS、PCle Switch和Retimer固件、SSD固件、主板和背板PCle线路阻抗和串扰、Retimer选项和SSD及系统的日志进行检查。铠侠在PCIe 5.0系统设计中已取得许多重要突破,并不断积累PCIe 5.0研发经验。
QLC SSD取代NL HDD
柳茂知先生认为,QLC SSD取代NL HDD是必然的趋势,主要在于SSD存储密度、性能以及系统成本。
首先是随着闪存的快速发展,NAND的密度远远超过了HDD,2025年E3.L SSD的存储密度比将比3.5存HDD高出约10倍,到2026年两者密度比将达到16倍。
同时,SSD性能也远超NL HDD,相比NL HDD,QLC SSD顺序读取性能提高40倍,顺序写入性能提高8倍,随机读取性能提高8500倍,随机写入性能提高500倍。
柳茂知先生表示,去年由于库存过剩导致SSD价格下跌,但这并不完全是坏事,因为SSD和NL HDD之间的每GB价差缩小,同时NL HDD容量增长微乎其微,QLC SSD容量却在急剧增长。去年铠侠发布基于BiCS 8 Flash的QLC SSD,单die容量2Tb,其在E3.S规格最高容量可达60TB,U.2规格容量最高可达120TB。低价和高容量的闪存有助于市场需求由NL HDD向SSD转移。
另外,我们还看到应用QLC SSD能有效减少硬件和软件/服务的综合支出,其收益可补偿NL HDD切换为QLC SSD的成本。具体来说,普通通用服务器当中,存储成本基本上占TCO总体拥有成本)的15%,18-37%的成本主要来自CPU、内存等。如果采用HDD,它的高延时会让性能降低20%,而SSD不会降低性能。即使QLC SSD的成本是NL HDD的3倍,也可以通过降低CPU和DRAM的成本来补偿成本差异。同时,QLC SSD替换NL HDD可以节省占地面积,节省电力消耗。另外,软件和服务等成本是按CPU节点数收费,CPU减少相应的软件和服务成本也会下降。那么总体成本最终是下降的。
生成式AI给服务器、智能终端带来的新机会
一方面CPU处理数据量的增加要求更大容量更高性能的SSD。铠侠中国董事长兼总裁岡本成之表示,铠侠SSD业务一直与互联网厂商、运营商等保持着密切的合作。铠侠中国高级技术顾问户谷得之也谈到,很多AI服务器已经采用了铠侠的PCIe Gen4 SSD产品。
同时高速接口的发展能够带来闪存更高的速率。柳茂知表示PCIe3.0升级到4.0的更新换代速度很快,但是4.0到5.0由于信号质量、功耗等技术难题并没有那么快。不过PCIe 5.0/6.0以高速低延迟的性能更适合生成式AI时代数据中心的需求,相信会是一个长周期的代际规格。
现在闪存相关厂商都在积极研究如何将生成式AI的数据处理部分转移到闪存的解决方案,铠侠也不例外。户谷得之表示,目前AI训练主要使用HBM,铠侠正在研究RAID Offload技术,让SSD处理一部分数据,增加SSD的价值量的同时能够降低HBM使用的成本。
生成式AI不仅给数据中心、服务器带来机会,现在智能手机、笔记本电脑也开始大力发展AI。前不久,铠侠推出第二代UFS 4.0技术,相比第一代而言在顺序写入上提升了约18%,随机写入提升约30%,随机读取提升约13%。
铠侠中国闪存颗粒技术统括部总经理大久保贵史表示,UFS 4.0目前主要用于旗舰机型,为了满足生成式AI的高性能存储需求,铠侠已着手研发UFS 5.0规格的产品,另一方面UFS 4.0要向下普及到中端机型,那么铠侠也会适时推出QLC版本UFS4.0产品。
写在最后
NAND Flash已经来到了200+层,未来会如何发展呢,大久保贵史先生表示,以铠侠BiCS来说,主要是通过高堆叠垂直扩展即增加闪存的层数,密集存储孔横向拓展以及架构拓展的方向来演进。目前铠侠的BiCS 6到BiCS 8 Flash实现35%的密度提升,从QLC 1Tb到2Tb的单die密度提高15%,铠侠BiCS 8 2Tb QLC密度比上一代高出50%。
PCIe 5.0是今年铠侠重点推广的技术和应用,柳茂知先生表示PCIe 5.0是一个非常好的技术,生成式AI正在茁壮发展,也必将推动PCIe 5.0的加速落地。