如今,人们对人工智能(AI)和神经网络的讨论,往往集中在生成式AI应用上。从图像、文本到视频创作,这些前沿技术仿佛成了话语的主旋律。但是,AI的力量远不止于此,它正悄然渗透到更加隐秘的领域,推动着工业和汽车的智能化变革。
随着工业和汽车领域对高性能微控制器(MCU)的需求日益增加。从实时控制,到故障检测的高精度需求,再到对系统稳定性和安全性的严格要求,已经成为这些行业程需解决关键痛点。
随着工业4.0的推进,传统工业设备正向智能化和自动化方向转型。这要求设备具备更高的算力、更强的实时处理能力以及支持AI算法的能力,以应对工业机器人、电机控制、预测性维护等复杂应用场景。
近年来越来越多的芯片厂商纷纷推出工业“MCU+AI”产品,MCU的算力持续提升,已经能够满足边缘端低算力人工智能的需求,将AI加速器集成在MCU上,实现端侧部署的单芯片解决方案正逐渐成为主流方案。
AI功能实现方式各异
采用Arm Helium™技术Arm Helium™是Arm公司在2019年推出的,为Armv8‑M架构的Arm
Cortex-M处理器提供的M-Profile矢量扩展技术,能够显著提升机器学习(ML)和数字信号处理(DSP)应用的性能。目前Arm
Cortex-M52、Arm Cortex-M55和Arm Cortex-M85支持Arm Helium技术。 过去一年,瑞萨电子推出的RA8x1
MCU以及RZ/V2H MPU等产品,均集成了专为AI应用设计的硬件加速引擎,能够满足工业市场的需求。
其中RA8x1 MCU属于瑞萨RA8系列,采用Arm Cortex-M55内核,高达480MHz,引入Arm Helium™技术,与基于Arm
Cortex-M7处理器的MCU相比,在DSP和ML应用层面实现高达4倍的性能提升。 极海半导体的G32R501系列实时控制MCU,采用Arm
Cortex-M52内核,同样引入了Arm
Helium™技术,大幅提升DSP和ML的性能,有效降低了MCU内核的实时负载,支持实时处理并减少延迟,从而降低了系统的整体复杂度和软件开发难度。
集成NPU2024年8月,国芯科技推出了CCR4001S系列MCU,基于国芯科技自主RISC-V架构C*Core CPU内核研发,内部配置了AI
NPU,支持智能控制算法与自适应变频控制算法。 2024年9月,恩智浦推出的i.MX RT700系列跨界MCU,集成了NXP自研的eIQ®
Neutron系列NPU AI/ML加速器。
其内核采用异构架构,包含有两个Arm
Cortex-M33,主频分别为325MHz和250MHz,包含两个DSP分别为HiFi-4和HiFi-1,以及包含一个基于开放式指令集架构的EZH-V
IO协处理器。 2024年12月,德州仪器业内率先推出具有NPU的TMS320F28P55x系列实时MCU,采用主频150MHz的32位C28x
DSP内核,内置单精度浮点单元、三角函数加速器,采用150MHz的可编程控制律加速器。
集成NPU+ Arm Helium技术2024年4月,英飞凌推出的PSOC Edge E8x系列产品,采用Arm Cortex-M55内核,支持Arm
Helium™ DSP并搭配Arm
Ethos™-U55的神经网络处理器,以及Cortex-M33内核搭配着英飞凌超低功耗NNLite(用于加速神经网络的专有硬件加速器)。
Arm
Ethos™-U55是Arm公司推出的首款面向Cortex-M系列的microNPU(微神经处理单元),专为在面积受限的嵌入式和物联网(IoT)设备中加速机器学习(ML)推理而设计。
2024年12月,意法半导体推出的STM32N6系列产品,采用Arm Cortex-M55内核,频率高达800MHz,是其首款引入Arm
Helium™向量处理技术的CPU,也是首款采用自研的嵌入式推理专用Neural-ART Accelerator™ NPU的产品。
其他方式除了集成NPU或Arm
Helium™技术之外,MCU也可以通过其他方式实现一定程度的AI功能。如:通过优化软件算法,MCU可以在其处理能力范围内执行简单的AI算法;集成DSP单元,DSP对于执行数字信号处理任务(如FFT、滤波等)非常高效,这些任务在AI算法中也很常见;配备其他类型的协处理器,如FPU(浮点处理单元)或特殊功能协处理器,这些协处理器可以在一定程度上加速AI算法的执行。
此外,MCU还可以通过外部接口连接专门的AI加速器芯片,AI加速器芯片可以处理复杂的AI算法,并将结果返回给MCU进行后续处理。
本土头部MCU厂商兆易创新在“MCU+AI”领域的布局也走在前列。2024年11月,兆易创新推出的GD32G5采用Arm
Cortex-M33内核,高达216MHz,内置高级DSP硬件加速器和单精度浮点单元,以及硬件三角函数加速器和滤波算法、快速傅里叶等多类硬件加速单元。2023年推出的高性能GD32H7系列芯片,同样可以为复杂运算、多媒体技术、边缘AI等高级创新应用提供强大的算力支撑,采用600MHz
Arm Cortex-M7高性能内核,支持多种硬件加速,新增了大量通用外设资源。
人工智能(AI)是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
但随着AI从云到边缘的发展,使得这一观点正在迅速改变,AI计算引擎使MCU能够突破嵌入式应用可能的极限,嵌入式设计已经能够提高网络攻击的实时响应能力和设备安全性。
支持AI的MCU
云计算推动了对具有AI功能的MCU的需求;它减少了数据传输所需的带宽,并节省了云服务器的处理能力。
配备AI算法的MCU正在应用包含对象识别,启用语音服务和自然语言处理等功能的应用程序。它们还有助于提高物联网(IoT),可穿戴设备和医疗应用中电池供电设备的准确性和数据隐私性。
那么,MCU如何在边缘和节点设计中实现AI功能?下面简要介绍了三种基本方法,这些方法使MCU能够在IoT网络边缘执行AI加速。
AI生态构建
随着边缘AI技术的发展和应用场景的不断落地,MCU厂商都在持续构建自身的生态。除了社区支持外,目前各大头部MCU厂商都在以“MCU+AI”硬件为基石,持续丰富升级自身的软件工具链,更好的助力客户产品落地。
MCU的一大特点是在有限的功耗预算内提供高效的计算能力。MCU的计算资源和存储空间比较有限,这使得在MCU上实现高算力的AI功能具有一定挑战性。如何平衡性能和功耗,一直是MCU集成AI/ML加速器的难点。提高加速器的主频,可以提高算力,但是带来的功耗提升是非常显著的。芯片厂商需要在保证MCU实现AI功能的同时,尽可能地控制对计算和存储资源的需求,从而减少功耗过高带来的影响。
瑞萨电子全球销售与市场副总裁、瑞萨电子中国总裁赖长青:“在MCU中集成AI加速器后,可以从两方面平衡性能和功耗问题。一方面,可通过提升制造工艺来减少功耗。另一方面,针对不需要持续执行AI计算的场景,在非必要运行场景下,可将AI计算单元挂起,仅保留可以维持触发条件的外设,以节省功耗。对于需要持续运行AI的边缘设备,则保持正常供电,通过优化算法或改进硬件效率来实现功耗降低。”
提升制造工艺来减少功耗。制造工艺的不断进步,芯片的功耗将进一步降低。例如,采用更先进的制程技术,可以在不增加芯片面积的情况下,提高晶体管的密度和性能,从而在降低功耗的同时,提升计算能力。
低功耗管理。当“MCU+AI”中某协处理器未被使用时,可通过MCU的电源管理单元将其置于休眠状态,在非必要运行场景下,可将其挂起以节省功耗,待满足触发条件时,再启用AI计算单元,重新恢复待机状态,以避免不必要的功耗开销。例如,Nordic的nRF54H系列产品采用了创新的工程设计,能够在执行AI任务时迅速返回超低功耗睡眠模式,从而显著降低能耗。
AI算法的适配与优化。AI加速器通常需要较高的算力,而诸如工业场景下的MCU又要求低功耗、长时间稳定运行,所以AI算法的适配与优化对MCU尤为重要。为了解决嵌入式系统资源有限的问题,一些MCU厂商采用了轻量级AI模型和硬件加速技术,使AI算法能够在MCU上高效运行。例如,TinyML(微型机器学习)技术的出现,使得AI算法能够在资源受限的MCU上高效运行。TinyML通过简化模型结构和优化算法实现,大幅降低了对计算资源和存储空间的需求,从而在保持低功耗的同时,实现了AI功能的集成。
此外,充分考虑内存读写和总线设计也格外重要。在AI/ML算法中,内存读写往往会成为瓶颈,值得一提的是,恩智浦研发的eIQ®
Neutron系列NPU,其算力覆盖了从低功耗MCU至高性能应用处理器,并且充分考虑了内存读写效率和总线设计,获取性能和功耗的平衡。
“MCU+AI”产品的解决方案在设计开发、端侧落地部署等环节中均面临数据安全风险,如何确保用户的数据安全和隐私保护是个至关重要的问题。
开发阶段数据隐私保护。在AI项目开发阶段中,客户为了训练AI模型实现特定的功能,需要准备大量的样本数据,应用这些数据样本的方法和AI建模过程可能涉及知识产权,并且获取这些数据样本也付出了巨大的成本,因此,如何保护这些数据资产不被意外流失,是很多客户关注的重点。
在开发阶段,MCU厂商需要重视用户数据的隐私保护。在导入和部署AI模型时,提供的算法和模型应仅限于技术支持,确保用户的数据始终由客户控制,避免任何潜在的数据泄露风险。
当前,MCU在技术层面呈现出三大发展趋势,分别为AI融合、集成度提升、架构创新与制程迭代,这也是各大企业技术竞争的关键焦点。
当前,在智能物联、智能工控、汽车电子等新兴领域的快速发展下,MCU的应用场景不断拓宽,市场需求不断提升。但这些新兴领域对于MCU的性能要求也在提升,包括更低的功耗、成本,更高的实时性、可靠性等。将边缘AI技术融入MCU就成了厂商解决这一难题的秘诀。
兆易创新MCU事业部产品市场总监陈思伟表示:“边缘计算的需求正在推动AI算法与MCU的深度结合。MCU不再局限于传统控制功能,而是逐渐集成AI推理能力,用于图像识别、语音处理、设备预测性维护等场景。”
边缘AI技术可以使MCU兼顾更高性能的数据处理任务,实现实时决策功能。例如,在智能工控领域,需要系统执行太阳能和储能系统中的电弧故障检测,以及用于预测性维护的电机轴承故障检测等功能,边缘AI帮助MCU对设备和传感器收集的数据进行实时分析和处理,提供更准确的决策,使系统实现更高的故障检测准确率。
因此,AI与MCU融合成为了当下MCU技术发展的核心趋势和重要突破点。