寒武纪思元290及玄思1000参数解读

2021-02-24
近期,思元290系列产品的推出,使得寒武纪再度成为行业关注度的焦点。

思元290是国内人工智能芯片设计公司寒武纪科技在2021年1月21日推出的全新一代智能芯片及加速卡,同期还推出了落地量产的玄思1000智能加速器整机。思元290智能芯片是寒武纪的首颗训练芯片,采用台积电7nm先进制程工艺,集成460亿个晶体管,支持MLUv02扩展架构,全面支持AI训练、推理或混合型人工智能计算加速任务。综合来看,思元290的性能指标成为其最大亮点,但在性能背后,寒武纪围绕思元290还推出了一系列“保障协同”措施。

寒武纪思元290及玄思1000参数解读 (https://ic.work/) 推荐 第1张

思元290采用MLUv02扩展架构。当然这并不是MLUv02首次亮相,而是寒武纪MLU200全产品线共享,满足云、边、端三个场景的算力需求。云端训练对AI算力的要求更为苛刻,因此寒武纪对思元290的MLUv02架构进行了多项扩展,包括业内领先的MLU-Link™多芯互联技术、高带宽HBM2内存、高速片上总线NOC以及新一代PCIe 4.0接口。相比寒武纪思元270芯片,思元290芯片实现峰值算力提升4倍、内存带宽提高12倍、芯片间通讯带宽提高19倍。新架构结合7nm制程,思元290可提供更优性能功耗比,以及多MLU系统的扩展能力。

下一代AIDC要求更多智能芯片无缝协同、并行运行的同时,还能保持高计算效率,从而提供超级巨大的算力,以应对超大规模训练的需要。寒武纪玄思1000智能加速器重新思考了未来AIDC的基础架构,在内部和外部采用统一的MLU-Link™多芯互联技术进行通讯,使得思元290智能芯片的互联范围可以从单机扩展到POD乃至整个计算中心,重塑了基础架构。玄思1000支持8个400G MLU-Link™和2个200G网络接口,总带宽高达3600 Gbps,是传统异构服务器的2倍。

寒武纪思元290及玄思1000参数解读 (https://ic.work/) 推荐 第2张

玄思1000配置8个对外互联的MLU-Link™接口,支持跨系统互联构建MLU POD。标准配置支持MLU POD 16、24、32。在POD内部,所有290芯片均可通过MLU-Link™多芯互联技术进行通讯,在带宽和延时方面实现了突破;POD外部通过玄思1000内置的网卡与其他系统进行通讯,实现了AI训练集群性能、扩展性和鲁棒性的协同提升。
除了扩展架构外,寒武纪MLU-Link™多芯互联技术也成为亮点。寒武纪推出MLU-Link™多芯互联技术,并首次搭载于寒武纪思元290芯片,每颗思元290的多芯互联总带宽高达600GB/s。MLU-Link™具备丰富的互联特性,突破PCIe带宽和互联的瓶颈,相比思元270芯片通过PCIe并行的通讯方式,带宽提高19倍。MLU-Link™多芯互联技术支持多颗思元芯片无缝互联,支持跨系统互联,将纵向扩展能力整合到整个人工智能计算中心(AIDC),可以端到端加速大型AI模型训练。
文章推荐

相关推荐