当前,我国集成电路产业面临诸多严峻挑战,包括国际竞争加剧、技术封锁和供应链限制导致的外部压力,以及内部高端芯片设计与制造能力不足、关键设备和材料依赖进口、产业链协同不足等问题。同时,国内市场需求快速增长,供需矛盾突出,芯片自给率较低,加之高端人才短缺和研发投入不足,进一步加剧了发展难度。
在全球科技竞争加剧的背景下,我国需集中资源攻克“卡脖子”技术,加强产业链上下游协同,提升高端人才培养与技术创新能力,推动产业自主化发展,并通过国际合作与市场多元化降低风险,构建更具韧性的集成电路产业生态。
面对集成电路产业的诸多挑战,芯片设计上云和云平台的应用正成为破局之道。云平台通过灵活调用计算资源、降低成本、提升效率,为芯片设计提供了更高效、安全的解决方案,同时结合AI调度优化,显著加速设计进程。在ICCAD大会上,速石科技展示了其领先的融合智算研发平台,我们也有幸采访到了速石科技首席技术官张大成,深入探讨了这一领域的最新进展。
张大成指出,随着半导体产业的快速发展,芯片设计正从单一模块设计逐步迈向系统级设计。这一趋势对芯片设计企业提出了更高的要求,尤其是在EDA工具与CAE仿真工具逐步融合的背景下,研发平台的功能和交互方式需要进行重大革新。
以往EDA工程师更多专注于数字设计或模拟设计的流程,但在新的系统设计时代,设计工作需要同时考虑电磁、结构、电源完整性、功耗完整性等多维度因素。例如,在SOC与Chiplet的2.5D或3D封装中,结构仿真、电磁仿真和电源仿真等任务变得尤为重要。这种多学科融合的设计需求,对传统的工具流(flow)和设计流程提出了巨大挑战。
今年行业内出现了诸如Snowflake收购Streamlit和Cadence收购Beta CAE等重要并购事件,进一步印证了这一融合趋势的加速发展。速石科技敏锐地捕捉到这一行业变化,并推出了融合型研发设计平台。这一平台整合了芯片设计的前后端仿真、结构仿真和电磁仿真等功能,帮助企业客户实现从芯片到系统的一体化设计。
AI智算赋能,提升复杂仿真效能
在芯片的设计研发过程中,整个流程从定义产品的功能需求开始,经过一系列的设计、验证、仿真、调试、优化,最终实现高效完成。这其中,结合速石科技的AI模型调度和资源管理方案,能够确保整个流程更加智能和高效。
首先,整个研发流程起始于产品特性SPEC的定义。这个阶段,工程师根据市场需求和应用场景确定芯片的具体功能,比如需要设计GPU、CPU、MCU(微控制器)、DPU(数据处理单元)等核心模块,还可能涉及到WIFI、5G通信、蓝牙、存储卡、激光雷达、AI控制芯片、显示控制等关键功能模块。通过对产品功能需求的精确定义,这一步为后续设计提供了清晰的方向。
接下来进入研发管理阶段,这是整个流程的核心部分。研发管理环节包括多个技术复杂的子流程:
设计仿真是第一个重要环节,包括模拟、数字电路的设计和射频仿真,确保芯片在理论上可以实现所需功能。这一步依赖于一系列高精度设计工具,比如Virtuoso、Verdi、SpyGlass等,这些工具帮助工程师优化电路设计、检查逻辑错误。
随后是制造仿真,这是从芯片设计到物理实现的关键环节。工程师会进行物理建模、电磁场分析、结构力学分析,以及多物理场的综合分析,确保设计可以在实际的制造环境中实现。这一过程中,工具如CST、HFSS、COMSOL等被广泛应用,用于分析复杂的热、力学、电磁性能等。
在整个研发管理阶段,反复迭代、优化是关键,确保设计满足SPEC定义的所有要求。
由于研发流程中的计算任务极其复杂,特别是在仿真阶段需要消耗大量计算资源,这时速石科技提供的AI计算优化模型就派上用场了。速石科技通过一套专用的AI调度框架,实现研发任务的智能管理和资源优化。
“这个过程里面就是有一个自主训练的AI模型,跟EDA工具紧密结合。我们可以去学习他们的历史仿真任务和作业特性、任务的特性和产品类型的数据,编译成他们自己的模型,这个模型会应用到他们自己的研发平台里面,帮他们从顶端,设计源头告诉他们,你今天设计一个simulation,你做仿真的话,不需要再看这边多少机器资源,多少CPU,多少核可以用,完全不需要。”张大成解释到,“其实从底层的角度来看的话,我们还可以增加异构资源的一些管理,比如GPU卡,结合一些机器作为服务器,再结合速石科技的国产变速器,提供完整的解决方案,那AI这块儿就是在其中和EDA工具和业务的属性紧密结合的模式。”
据悉,速石的AI模型调度系统接入研发流程后,利用MLOps平台不断学习和优化模型,并将优化后的模型用于研发计算中的任务调度。这个调度系统主要由以下几个部分组成:
· 首先是Fsched资源配置,它能够智能地分配CPU、GPU、内存等计算资源,确保计算任务始终能够高效运行。
· 随后,Fsched任务调度实时调整任务的优先级,根据不同任务的重要性和资源需求灵活安排。
· 最后是Fsched任务监控,实时跟踪任务的状态,发现和解决运行中的瓶颈问题。
这些调度能力背后,依托于庞大的计算资源池,包括计算队列、CPU核心、GPU卡、内存以及硬件仿真器等,甚至可以灵活调用混合云计算的资源。这样,研发团队可以专注于芯片设计本身,而无需担心计算资源不足或调度效率低的问题。
最终,这套系统让整个研发流程从定义产品到完成验证的每一步都更加智能化和高效。通过优化资源分配、提升计算效率,速石科技的方案不仅加速了芯片研发进程,还显著降低了计算成本,为研发团队节省了时间和资金。
芯片上云的现状与未来:从“热度高涨”到“务实需求”
在芯片设计复杂度不断提升、研发成本居高不下的背景下,云仿真逐渐成为推动行业创新的重要技术手段。当前,尽管中国IC设计企业的整体数量未达预期,但对高精度设计和复杂研发的需求依然旺盛。特别是创新型IC设计公司,面临巨大的资源压力,如何以最小的投入完成高性能芯片的开发,成为关键问题。
近年来,云平台的使用模式也发生了显著变化。2021至2022年是芯片设计公司上云的高峰期,但经济环境的变化使企业的云计算使用从“高热度”转向“务实化”。如今,云仿真更多被用于解决突发性和紧急性的计算需求,通过灵活调用资源,企业能够以更低的成本快速完成仿真任务,并在紧迫的研发进度中获得及时反馈。张大成提到:“未来,云仿真的应用会更加务实,企业会专注于用云解决突发的高需求场景,以提升效率的同时严格控制成本。”
此外,芯片设计中日益增长的计算需求也催生了混合云架构的兴起。单机仿真能力已经无法满足大规模仿真任务的要求,而速石科技提出的混合云解决方案实现了本地平台与云端资源的无缝衔接。这一架构不仅能动态获取计算资源,还能够在计算完成后确保数据安全回归本地。具体而言,无论是高性能计算节点还是小型计算机,速石科技都能根据企业业务需求灵活调度资源,从而在成本与效率之间取得最佳平衡。这种混合云架构,特别适用于企业应对周期性高峰任务或突发性需求,成为芯片设计研发中的有力补充。
速石科技在自主研发上的成就也值得关注。其核心产品Fsched调度器,经过多年研发,已成为一款完全可控的国产调度器,能够替代国际主流产品RDM的功能。这不仅实现了调度器的自主可控,也填补了国产替代的技术空白,为芯片设计企业在研发中的成本优化和技术安全提供了保障。速石科技通过这一产品的落地,展现了其在国产化技术上的持续突破和深耕能力。“我们花了四五年时间研发Fsched,能够完全替代国际主流调度器,这是一种从无到有的努力,也是一种坚持,”张大成说道,“这款产品已经在国内被广泛验证,我们对国产化的未来充满信心。”
值得一提的是,近年来,速石科技携手深信服、芯启源、沐曦等国产硬件厂商,以及芯华章、芯和、阿卡思等工业软件厂商,深度合作打造了覆盖底层IT基础架构到上层应用软件的小型信创生态体系。通过整合国产工具链资源,速石科技为行业用户提供了全方位、一站式的信创解决方案,有力帮助客户应对当前地缘政治带来的技术和供应链挑战。
更重要的是,速石科技敏锐地捕捉到了芯片设计从单一设计向系统级设计转型的趋势。随着EDA工具与CAE仿真工具的逐步融合,芯片设计企业在进行SOC和Chiplet设计时,需要同时考虑电磁、结构、功耗完整性等多维度因素。速石科技通过一体化的技术平台,为企业提供从工具到系统的全面支持,助力客户应对复杂系统设计的挑战。“未来的设计平台一定是面向系统级设计的,这是整个行业发展的方向,”张大成强调,“速石科技希望通过技术能力帮助客户实现从工具到系统的全面升级。”
写在最后
速石科技的云仿真解决方案不仅满足了当前芯片设计企业对灵活性和成本控制的需求,还通过混合云架构的技术优势,为行业探索出了更高效的研发模式。在国产化背景下,速石科技的技术突破也为国内企业提供了一个重要的自主可控方向。从仿真到调度,从工具到系统,速石科技正在为芯片设计行业的未来注入新的动力。“云仿真与自主技术是芯片设计企业迈向未来的关键。”张大成总结到,“能多做一点,就多做一点。我们希望用自己的技术和方案,帮助企业走得更远。”