这场改变计算机行业以使机器能够更好地计算人工智能任务的战斗不断催生新的、有趣的潜在未来之星。
周一,加利福尼亚州圣何塞的 Ceremorphic 正式推出了两年来一直处于隐身模式的芯片工作,讨论了该公司声称将在功耗方面彻底改变 AI 计算效率的芯片。
该公司创始人兼首席执行官 Venkat Mattela 在通过 Zoom 接受 ZDNet 采访时表示:“这在今天是违反直觉的,但更高的性能意味着更低的功率。”
Mattela 认为,大量低功耗操作专利将使他公司的芯片能够以更少的计算工作量在机器学习的签名任务上产生相同的精度。
“我想做的不仅仅是构建半导体芯片,还包括数学和算法以减少工作量,”他说。 “如果一个工作负载需要一百次操作,我想把它减少到五十次操作,如果五十次操作比一百次消耗的能量更少,我想说我的系统是一个更高性能的系统。”
Mattela 正在涉足一个竞争激烈的市场,Cerebras Systems、Graphcore 和 SambaNova 等初创公司在这个市场上获得了巨额资金,尽管取得了所有成就,但它们仍在努力推翻行业巨头 Nvidia。
Mattela 倾向于放眼长远。 他的最后一家初创公司 Redpine Signals 从 2006 年开始成立,历时 14 年。该公司凭借其低功耗蓝牙和 Wi-Fi 芯片技术于 2020 年 3 月以 3.14 亿美元的价格卖给了芯片制造商 Silicon Labs。
在 Redpine 和现在在 Ceremorphic 的 17 年努力的教训是双重的:“我有很多耐心,”他笑着评价自己。 和“我不做渐进的事情。”
Mattela 争辩说,当他在芯片设计领域着手解决问题时,它会以有意义的方式领先于最先进的技术水平。 他说,Silicon Labs 购买的 Redpine 无线芯片技术与高通和博通等巨头公司在蓝牙和 Wi-Fi 领域的产品相抗衡。
Mattela 说:“我接受了一个巨大的挑战,我反对他们,但只有一个指标,超低能量无线,能量比业内最好的低 26 倍。”
现在,Mattela 相信他对功率的关注同样取得了成功,以及他认为在 AI 芯片市场中独一无二且对该学科至关重要的其他三种品质:可靠性、量子安全性以及在多个市场发挥作用的能力。
为了让这一切成为可能,Mattela 保留了在 Redpine 开发的微处理器资产,以形成 Ceremorphic 的基础,并保留了 18 名员工,他还雇佣了另外 131 名员工来补充这些员工。 公司在官方总部圣何塞和印度海得拉巴闪闪发光的新办公楼均设有办事处。
Mattela 有一份包含 26 项美国专利的有趣清单,上面有他的名字,还有一份同样有趣的清单,包含过去几年的 14 项美国专利申请。
Mattela 称之为“分层学习处理器”或 HLP 的东西包含一个以 2 GHz 频率运行的机器学习计算元件; 具有相同时钟频率的自定义浮点单元; 定制设计的多线程工作负载调度方法; 以及专门设计的 16 通道 PCIe gen-6 电路,用于将处理器连接到系统的主机处理器,例如 x86 芯片。
Mattela 声称,其中最后一个部分,即 PCIe 部分,几乎可以成为自己的公司。
MattelA 解释说:“目前,正在生产的是 PCIe-4,它是主导产品,而 PCIe-5 是去年才开始生产的。” “和我们一起,PCIe-6 将在 2024 年投入生产——我拥有这项技术。”
“如果你必须获得许可,那就是 1200 万美元,”他谈到 PCIe-6 时说。 “仅此一项对设计来说就是一件重要的事情。” 他说,PCIe 链接将使 Mattela 能够进一步优化整个系统的能耗。
该芯片优势的核心是位于数字之下的模拟电路。 一些公司广泛使用模拟电路进行 AI 处理,最著名的是初创公司 Mythic,该公司在 2020 年展示了一种可以将向量和矩阵相乘的芯片——机器学习的核心——不是数字乘法,而是连续相乘的组合 符合欧姆定律的能量波形,公司称之为模拟计算。
Mattela 告诉 ZDNet,Ceremorphic HLP 芯片将比 Mythic 更有选择性地使用模拟计算。
Mattela 解释说,在芯片功能的“层次结构的最低层级”,“我进行模拟计算”。 “但更高层次上,我不做模拟,因为我想让编程模型变得简单。”
这意味着通过 HLP 的微架构进行模拟乘法累加的“二十三种模式”。 他认为,模拟乘法将比数字乘法更有效地利用电压。
“在更高层次上,它看起来像是矢量处理和数据路径处理的结合。”
各种芯片特性将有助于实现 Mattela 所提倡的四种品质。
除了节能运行,还有可靠性。 Mattela 声称,AI 硅目前存在可靠性问题。
机器学习芯片已经比传统的微处理器大得多。 Nvidia 的“A100”GPU 已经相当庞大,按照经典标准,826 平方毫米。 但初创公司的新型芯片可能更大,例如 Cerebras 的 WSE-2 芯片,尺寸为 45,225 平方毫米,几乎是八英寸硅晶圆的整个表面。
“当你有更多的硅时,失败的可能性就更大,因为有 α 粒子,中子轰击,”Mattela 观察到。 “在过去的两年里,人们已经在说,我的系统在数据中心出现故障。”
Mattela 声称独特的硬件-软件组合将使他的芯片能够“预测故障并纠正它们”。
“可靠的性能计算工程是我们的主要贡献,”他说。
Mattela 强调的第三个品质是安全性,包括防止未来可能破坏传统数据安全性的量子系统。
“到目前为止,安全系统的设计都是为了对抗人类的黑客攻击,”Mattela 解释道。 “但展望未来,你不能假设计算能力将是有限的,并且需要两天时间才能打破它 [a system],你最好假设可能只有两分钟!”
Ceremorphic 芯片具有“抗量子随机数生成”功能,Mattela 说,“高性能计算机无法破解”。 Mattela 说,实际上,这意味着这样的系统可能需要一个月的时间才能破解,让客户有时间更改安全密钥以阻止攻击。
第四个属性是 Mattela 所说的缩放比例。 Mattela 的意思是用一个芯片解决多个市场。 该芯片将能够在深度学习、汽车应用、机器人技术、生命科学以及某种未来的 Metaverse 应用中发挥作用。
同一个 HLP 将用于训练和推理,这是机器学习的两个方面。
Mattela 声称,扩展到多个市场将使他的芯片比竞争对手的芯片更具相关性。 他认为,像 Cerebras 这样的初创公司令人印象深刻,但最终并没有那么重要。
“这是非常好的工程,是的,你总是可以做一些别人做不到的事情,但你的目的不是做一些没有人做过的事情,”Mattela 说。
“你的目的是创造一个人人都能赚钱的结果,它有影响,对市场有一定价值。”
当然,Cerebras 和其他公司正在出货,而 Mattela 甚至还没有生产样品。
为了让 Ceremorphic 的设计成为赢家,Mattela 有一个看起来像是他口袋里的王牌:台积电的 5 纳米芯片工艺,这是制造巨头的“先进技术”之一,这种芯片工艺并不是每个客户都可以使用的 使用权。
“当我对人们说我正在做 5 纳米时,他们会说,你怎么能得到 5 纳米,”Mattela 说,显然很高兴。 “其中一些拥有数亿美元资金的公司不在 5 纳米;他们在 7 纳米。”
一个原因是 Mattela 多年前在模拟芯片巨头 Analog Devices 工作时与 TSM 建立的密切关系。 更重要的是,他将 Redpine 出售给 Silicon Labs 提高了他的信誉。 他说,TSM 必须相信他能够见证他的产品取得成果,因为只有这样 TSM 才能得到全额报酬。
“这需要很多很多年,”Mattela 说,指的是生产过程。 “我必须花费 2 亿美元,我必须生产芯片,芯片必须工作,然后如果工作,他们 [TSM] 将在那个时候得到报酬。”
Mattela 的团队最初在所谓的穿梭运行中将芯片设计为原型,这是一小批芯片,采用稍微不那么复杂的 7 纳米工艺。 该公司今年将把它的穿梭运行批次扩大到 5 纳米。
他说,虽然 Ceremorphic 预计明年将向客户提供其芯片的首批样品,但 5 纳米的全面生产可能要到 2024 年才能实现。 Mattela 在时间表中观察到,对于 5 纳米等前沿工艺的设计来说,“这些都是非常激进的日期”。
门控因素是一种成本。 他指出,从穿梭运行转向完全使用晶圆——也就是所谓的全掩模——是 200 万美元和 1000 万美元以上的区别。
为此,Ceremorphic 将需要筹集更多资金。 到目前为止,Ceremorphic 是自筹资金,Mattela 和朋友和家人在 A 轮融资中筹集了 5000 万美元,相对于 SambaNova 等获得数十亿美元风险投资的 AI 芯片初创公司而言,这是一笔极小的资金。
他说,Mattela 未来融资的首选途径是通过合作伙伴关系,尽管 2023 年也有可能进行正式的 B 轮投资。
HLP 的第一个实例将是一个 PCI 卡,它将芯片在计算机系统中运行所需的功能捆绑在一起。 “典型的系统原始设备制造商是目标,”他说。 他相信,这条进入市场的途径将使他的机器得到更广泛的应用。
“每家公司都需要一台训练超级计算机,”他说。 “我想提供每个企业都用得起的培训超级计算机。”
与 Facebook 这样的庞然大物形成鲜明对比的是
用于 AI 的研究超级计算机——6,080 个 GPU 和 175 PB 的闪存——Ceremorphic PCI 刀片旨在使该技术更容易获得。
“如果我能在一个盒子里提供建筑尺寸计算机的十分之一,那就是最佳选择。”
虽然他的部分尚未出货,但 Mattela 已经预测 AI 芯片初创市场将迅速洗牌。 Graphcore 等挑战者筹集了大量资金,但收入却很少; 他推测,这只是 Nvidia 在 AI 中四分之一的收入的一小部分。
“今天有四到五家公司;他们今天 [筹集的资金] 接近 50 亿美元,这是很多钱,”Mattela 说。 但是,“排名第一的公司,每个季度赚 20 亿美元,”指的是 Nvidia 的数据中心收入。
“如果你连第一家公司的 1% 都没有,而且还在亏损,那就不是生意,”马泰拉说。
Mattela 预言,由于挥霍无度,洗牌迟早会到来。 “在当今火爆的市场中,他们去拿钱,这对他们有好处,但无论他们得到什么钱,我认为他们并没有真正想出如何花钱,因为花的钱是不正常的,”他说。
他坚称,初级工程师在 AI 初创公司获得了巨额报酬。 “如果一个应届生获得 20 万美元 [年薪],那是不可持续的,”他说,用技术行业的术语来形容最低级的职位,“因为这个人在两年后会很有成效,但到那时, 钱已经没了。”