关于英特尔Gaudi 3的“中国特供版” AI 芯片有了新进展。
钛媒体App 4月15日消息,芯片巨头英特尔(Intel)日前在官网发布一份24页的“Gaudi 3 AI加速器白皮书”中披露,英特尔将推出Gaudi 3在中国发售的两款“特供版”AI 芯片产品。
具体包括两种硬件形态加速卡:一款型号为HL-328的OAM兼容夹层卡(Mezzanine Card),预计将于今年6月24日推出;另一款是型号为HL-388的PCle加速卡,预计将于今年9月24日推出。而基于内核数量、工作频率、TDP等参数估算,相比Gaudi 3国际版,“中国特供版”HL-328芯片性能或降低约92%左右。
早前4月9日举行的美国Intel Vision 2024会议上,英特尔发布新一代Gaudi 3 AI 加速芯片,采用台积电5nm工艺,带来4倍(400%)的BF16 AI计算能力提升。同时,相比英伟达H100 GPU,英特尔Gaudi 3 AI芯片的模型训练速度提升40%,推理速度提升50%,平均性能提高 50%,能效平均提高40%,但成本却仅为H100的一小部分。
对于Gaudi 3中国特供版消息,钛媒体App已向英特尔美国总部发送邮件询问更多详细信息,但截至发稿前,英特尔方面并未回复。
据悉,过去一段时间,美国政府不断升级对华半导体、AI 芯片等领域的出口管制。
2022年8月9日,美国总统拜登签署总额高达2800亿美元的《芯片和科学法案》(以下简称“芯片法案”),通过527亿美元的巨额产业补贴和遏制竞争的条款,推动芯片制造“回流”美国本土。该法案禁止获得补贴的美国及其盟友伙伴的企业10年内在中国和其他关切的国家新建或扩大先进制程芯片厂。
2022年10月7日、2023年10月17日,美国商务部工业和安全局(BIS)连续两次发布对中国的先进半导体和计算设备的出口管制,旨在阻止中国进口 AI 半导体产品。同时,英伟达、AMD、英特尔的多款GPU和 AI 芯片产品已不能再出口到中国,就连高端游戏显卡RTX 4090都受到了限制。
2023年12月,美国商务部BIS宣布启动对成熟制程节点的半导体供应链展开调查,剑指中国芯片半导体产业。
2024年3月29日,BIS更新出口限制措施,其中包括美国对中国出口的 AI 半导体产品将采取“逐案审查”(case-by-case review)政策规则,包括技术级别、客户身份、合规计划等信息全面查验,以及部分 AI PC 芯片或纳入到出口管制措施当中,更大范围限制英伟达、AMD等先进 AI 芯片和半导体设备向中国销售,4月4日全面生效。
4月11日,美国商务部在“联合公报”(Federal Register)上更新了最新的实体清单(Entity List),将6家中国企业列入“实体清单”,其中包括英伟达在中国的最大 AI 芯片经销商思腾合力(天津)科技有限公司(SITONHOLY (Tianjin) Co., Ltd.)。
然而,钛媒体App了解到,英特尔Gaudi 2中国特供版仅销售几十张OAM产品。自去年BIS 1017新规更新后,由于英特尔Gaudi 2“中国特供版”产品性能高于出口管制措施,最终导致其产品再也没能继续销往中国市场。
基于此,去年12月前后,英特尔曾尝试研发Gaudi 2 HL-225B变体,内部称Gaudi 2C AI芯片,希望重新获得销往中国大陆的许可,但最后却等到今年3月BIS公布更新出口限制措施。
4月10日发布Gaudi 3之后,英特尔重新研发特供版产品,希望让5nm Gaudi 3 AI芯片未来全力争夺中国市场,旨在为 AI 和云客户提供英伟达产品的“替代选择”。
具体硬件规格方面,中国特供版的Gaudi 3 与原版相比,具有相同的96MB SRAM片上内存, 128GB HBM2e高带宽内存,带宽为 3.7TB/s,拥有PCIe 5.0 x16 接口和解码标准。但是,由于美国对于AI芯片的出口管制规则限制,使得这类高性能AI的综合运算性能(TPP)需要低于4800才能出口到中国, 这意味中国特供版的Gaudi 3 的16bit性能不能超过150 TFLOPS。
相比Gaudi 3 国际版达到的1835 TFLOPS(FP16/BF16),中国特供版Gaudi 3 需要大幅削减内核数量和工作频率,最终可能需要其AI性能降低约92%,才能符合美国的出口管制要求。
同时,由于中国特供版Gaudi 3产品的AI性能降低,这也将使得其TDP(热设计功耗)大幅降低,预计OAM卡和PCIe卡的TDP均为450瓦,而原版PCIe卡(HL-338)的TDP高达600瓦,原版OAM卡(HL-325L、HL-335)的TDP更是高达900瓦。
整体来说,英特尔专为中国市场推出的“特供版”Gaudi 3两款产品的 AI 性能,或将与英伟达“中国特供版”AI 加速卡H20水平相当,后者比H100的整体性能降低80%左右,达148 TFLOPS的FP16/BF16性能,略低于出口管制的150 TFLOPS的限制。
目前,英伟达H20 AI芯片已经向中国大陆客户送样,但国内百度、阿里等 AI 龙头对其反响平平。有行业人士对钛媒体App表示,主要原因是H20性能太低、价格太高,企业购买意愿降低了。
美国商务部长雷蒙多(Gina Raimondo)早前在一场公开论坛中表示,美国绝不能让中国得到这些最尖端的芯片,绝不能让中国芯片技术赶超美国。美国政府不允许英伟达向中国出售“最复杂、处理能力最高”的 AI 芯片,以防中国有能力训练前沿 AI 模型。
此外,有消息称,美国政府还正在制定一份禁止接收关键工具的中国先进芯片制造工厂名单,以便美国企业更容易阻止技术流入中国,这份名单可能会在未来几个月内公布。同时,美国正向包括荷兰、日本、德国和韩国在内的盟友施压加码,要求它们进一步收紧对中国获得半导体技术的限制措施。
针对于美方行动,外交部发言人毛宁在4月11日表示,“我们坚决反对美方滥用实体清单等出口管制工具遏制打压中国企业,敦促美方停止将经贸科技问题政治化、工具化、武器化。中方将采取必要措施坚决维护中国企业的合法权益。”