FPGA时序优化：精简MUXF映射，提升性能，吸引用户阅读。

2024-04-01

我们都知道，FPGA中的拥塞有：全局拥塞，短线拥塞和长线拥塞。
今天我们就来看短线拥塞的一种解决方案：Reduce MUXF Mapping。
UltraScale的CLB资源,在介绍Reduce MUXF Mapping，我们需要知道什么是MUXF，这就得从UltraScale的CLB说起。
我们都知道，在7系列的FPGA中，每个CLB有两个Slice；而在UltraScale系列中，每个CLB中只有一个Slice，Slice又分成了两种类型SliceL（Logic）和SliceM（Memory），其中SliceM中的LUT可以当作分布式RAM来使用。
每个Slice中包含>
6输入2输出LUT * 8，其中SliceM中的LUT可配置为512bits的Distributd RAM和256bits的Shift Registers,Flip-Flops * 16,Carry8 * 1,Wide Multiplexer，即MUXF*,MUXF7 * 4,MUXF8 * 2,MUXF9 * 1,什么是MUXF？,在Ultrascale系列的FPGA中，MUXF*是指MUXF7，MUXF8和MUXF9，需要注意的是：他们不是7选1，8选1和9选1的MUX，具体解释如下图>
FPGA时序优化：精简MUXF映射，提升性能，吸引用户阅读。 (https://ic.work/) 可编辑器件第1张
image-20240331202559121,我们再具体解释一下>
MUXF7有F7MUX_AB、F7MUX_CD、F7MUX_EF、F7MUX_GH这4个，每个MUXF7均可以与其后面的2个相邻的LUT构成一个8:1 MUX；,MUXF8有F8MUX_BOT和F8MUX_TOP，每个MUXF8均可以与其后面的邻近2个F7MUX以及后面的邻近4个LUT构成一个MUX16_1；,MUXF9只有一种就是F9MUX，可以与其后面的所有的F7MUX、F8MUX、LUT构成一个MUX32_1。
下面的图是由F8MUX_BOT，两个F7MUX和4个LUT构成的16：1的MUX，图中的D触发器是可选的，是为了减少时序收敛的难度。
FPGA时序优化：精简MUXF映射，提升性能，吸引用户阅读。 (https://ic.work/) 可编辑器件第2张
image-20240331204953352,MUXF在什么场景下有优势？,从上面的图中，我们可以看出来，如果实现一个16:1的MUX，在配合MUXF的情况下，只需要一个Slice就可以完成；在一个Slice中完成的逻辑，我们都可以当成是一个logic level；而如果完成由LUT来实现16:1的MUX，则需要多级logic level，因此MUXF的其中一个优势就是可以减少logic level。
MUXF的第二个优势就是节省功耗，在FPGA中，LUT本身的功耗就是要高一些，再加上对于wide multiplexer，所需要的LUT数量也比较多，因此采用MUXF的方式，对于功耗方面是有优势的。
MUXF在什么场景下有劣势？,既然MUXF可以减少logic level，那为什么vivado还有一个专门的选项muxf_remap来优化MUXF呢？,这是因为MUXF在布局时会与八个 LUT组合在一起，这种组合导致 CLB 输入的利用率很高，增加了路由需求，但是会在网表连接复杂时限制了布局的灵活性，从而可能导致更高的路由拥塞，导致时序不好收敛。
下面这个图就展示了将MUXF替换成LUT3之后的效果，需要注意的是，这种替换会增加功耗，仅在我们想收敛时序时使用。
FPGA时序优化：精简MUXF映射，提升性能，吸引用户阅读。 (https://ic.work/) 可编辑器件第3张
image-20240331210915847,如何使用该优化指令,在 Vivado 中，opt_design 命令提供了一个可选的 MUX 优化阶段，可以将 MUXF* 结构重新映射为 LUT原语以提高路由能力。我们可以使用 -muxf_remap 选项重新映射所有的 MUXF* 单元。或者，可以在拥塞区域的选择单元上设置 MUXF_REMAP 属性为 TRUE，以限制 MUX 重映射的范围。任何设置了 MUXF_REMAP 属性为 TRUE 的 MUXF* 单元将在 opt_design 期间自动触发 MUX 优化阶段，并被重新映射为 LUT。

文章推荐

FPGA时序优化：精简MUXF映射，提升性能，吸引用户阅读。

相关推荐

高效解决FPGA布局布线拥塞，有哪些绝招？快来了解！

FPGA片内PLL电磁抗扰及热应力研究测试分析，吸引你深入阅读。

泛AI时代，FPGA崛起，中低端型号成边缘部署核心力量。

太空级FPGA构建高灵活可扩展架构，引领未来科技新潮流。

低成本FPGA安防雷达设计如何实现？吸引你的安全新选择！

未来汽车设计，FPGA模块创新引领，简约高效，吸引你的目光。

FPGA双调排序技巧，方法二，简洁高效，速览！

"FPGA高效实现ARM系统处理：解析方案，助你快速上手"

中国FPGA市场竞争格局解析，洞察市场趋势，引领行业新风向。

FPGA上ADC与DAC并行Verilog实现，高效简洁，吸引技术爱好者阅读。

推荐

TrendForce集邦咨询: 预估2025年笔电品牌出货成长率将下修至1.4%

让英特尔再次伟大，新CEO推动18A提前量产，14A已在路上

晶振在网通应用增光添彩：中国移动实现数字乡村大升级

一文解析电磁场与电磁波的区别

黄仁勋中国行的背后，AI芯片暗战与英伟达生存博弈

国民技术发布国内首款Arm® Cortex®M7+M4双核异构MCU 面向具身智能机器人

北京机器人传感器公司金钢科技数千万元Pre

光子 AI 处理器的核心原理及突破性进展

详解CPU 的大小端模式

超详细解析！电阻在电路中的作用

最近更新

洲明科技再登“中国最具价值品牌500强”

帝奥微AMOLED显示屏电源管理芯片DIO53010简介

纳芯微LED线性恒流驱动NSL21610 汽车级40V/单通道具备散热加强功能

极海半导体GALT61120汽车前灯LED矩阵控制芯片荣获AEIF 2025 金芯奖

使用恩智浦FRDM LCD模组

【CW32模块使用】1.8寸彩色触摸屏

正方科技欧荷18S30AH智能电池在大载重无人机中的应用

广和通发布5G模组FG390系列

2025年OBC的新趋势：单级拓扑

谷歌I/O 2025大会前透露：Android 16接入Gemini，智能手机、XR设备升级