ASIC到FPGA存储器移植实战经验分享

Terminucia

1. ASIC到FPGA的存储器移植实战

在数字电路设计中，ASIC和FPGA是两种常见的实现方式。ASIC（专用集成电路）追求极致的面积和功耗优化，而FPGA（现场可编程门阵列）则更注重灵活性和开发效率。当我们需要将ASIC设计移植到FPGA平台时，存储器的处理是一个需要特别注意的环节。

我最近完成了一个将ASIC设计移植到FPGA的项目，其中ROM和RAM的改造是工作量最大的部分之一。通过这次实践，我总结出了一些实用的经验，特别是关于如何高效地将ASIC中的存储器结构适配到FPGA平台。

2. ASIC中的ROM实现特点

2.1 ASIC ROM的典型结构

在ASIC设计中，ROM的实现通常非常"抠门"。为了最大限度地节省芯片面积，工程师们会采用多个小容量ROM拼接的方式，而不是直接使用一个大ROM。这种设计思路源于ASIC对面积的极致追求。

举个例子，如果你的代码编译后大小是381KB，ASIC设计可能会使用三个128KB的ROM来组成384KB的总容量，刚好满足需求。这种精确控制的做法在ASIC设计中非常常见。

verilog复制rom_0_domain u_rom0(
     .hclk_main        (hclk    ),
     .rom_0_cs    (rom_0_cs    ),
     .rom_addr    (rom_addr    ),
     .rom_rdata    (rom_rdata    )
);
rom_1_domain u_rom1(
    .hclk_main        (hclk    ),
    .rom_1_cs    (rom_1_cs    ),
    .rom_addr    (rom_addr    ),
    .rom_rdata    (rom_rdata    )
);
rom_2_domain u_rom2(
    .hclk_main    (hclk    ),
    .rom_2_cs    (rom_2_cs    ),
    .rom_addr    (rom_addr    ),
    .rom_rdata    (rom_rdata    )
);

2.2 片选信号的处理

ASIC设计中，多个ROM的协同工作需要精细的片选(CS)控制。通常，高位地址线会被用来生成各个ROM的片选信号：

verilog复制assign rom_0_cs=(rom_addr[x+n:x] ==2'b00) ? rom_cs :1'b0;
assign rom_1_cs=(rom_addr[x+n:x] ==2'b01) ? rom_cs :1'b0;
assign rom_2_cs=(rom_addr[x+n:x] ==2'b10) ? rom_cs :1'b0;

数据输出则通过多路选择器实现：

verilog复制assign rom_rdata[31:0]=rom_2_cs_latch?rom_2_rdata:rom_1_cs_latch?rom_1_rdata:rom_0_rdata;

2.3 时序控制要点

ASIC设计中，ROM的时序控制也很关键。通常会在时钟边沿锁存片选信号，确保数据稳定：

verilog复制always @(negedge hrestn or posedge hclk)
if (!hrestn_main)
begin
    rom_0_cs_latch <= 1'b0;
    rom_1_cs_latch <= 1'b0;
    rom_2_cs_latch <= 1'b0;
end
else
begin
    rom_0_cs_latch <= rom_0_cs;
    rom_1_cs_latch <= rom_1_cs;
    rom_2_cs_latch <= rom_2_cs;
end

这种设计在ASIC中非常高效，但在移植到FPGA时就需要进行调整。

3. FPGA中ROM的移植策略

3.1 合并多个ROM为一个

FPGA与ASIC最大的区别之一就是资源特性。FPGA中有丰富的Block RAM资源，而且这些资源通常是以较大的块(如36Kb)组织的。因此，在FPGA中，我们会把ASIC中的多个小ROM合并为一个大ROM。

这样做有几个好处：

简化了地址解码逻辑
减少了片选信号带来的时序复杂度
更高效地利用FPGA的Block RAM资源

3.2 FPGA ROM的实现示例

在FPGA中，ROM的实现通常使用厂商提供的IP核。以Xilinx为例，ROM的实现可以这样写：

verilog复制ROM_AW_sram_bus_wrapper_x32 #( .AW(17) ) u_rom_0(
    .Q(rom_0_rdata),
    .ADR(rom_addr),
    .ME(1),
    .CLK(clk),
    .LS(1'b0),
    .WEN(1),
    .D()
);

重要提示：在FPGA实现中，通常会将存储器使能信号(ME)直接拉高，不再使用片选信号。这是因为FPGA的Block RAM在使能信号为低时，输出会保持上一次的值，而不是像ASIC那样完全关闭。

3.3 地址位宽的调整

由于ASIC中的ROM容量通常很紧凑，而FPGA中的Block RAM有固定的大小，因此地址位宽往往需要调整。例如：

ASIC中可能使用3个128KB ROM，地址位宽为17位(2^17=128K)
FPGA中合并为1个384KB ROM，地址位宽需要增加到19位(2^19=512K，取最接近的2的幂次方)

这种调整需要在代码中明确体现，通常通过参数化设计来实现：

verilog复制parameter ROM_AW = 19;  // FPGA中需要的地址位宽

4. RAM的移植方法

4.1 RAM移植相对简单的原因

相比ROM，RAM在ASIC到FPGA的移植通常更简单，主要是因为：

RAM容量通常会有一定余量，不会像ROM那样精确控制
RAM的接口标准相对统一
FPGA厂商对RAM的支持很好，IP核成熟稳定

4.2 FPGA中RAM的实现

FPGA中RAM的实现也使用厂商提供的IP核。不同厂商的接口可能略有不同，但核心信号基本一致：

verilog复制RAM_IP u_ram(
    .clk(clk),
    .addr(ram_addr),
    .din(ram_wdata),
    .dout(ram_rdata),
    .we(ram_wen),      // 写使能，注意有效电平
    .en(ram_cs)        // 片选信号，通常可以直接拉高
);

4.3 需要注意的细节

有效电平：不同厂商的IP核可能对写使能(WE)的有效电平定义不同，有的是高有效，有的是低有效，必须仔细查阅文档。
时序特性：FPGA的Block RAM通常有固定的流水线级数，这与ASIC中的自定义RAM可能不同，需要调整设计中的时序预期。
初始化：ASIC中的RAM可能有特殊的初始化要求，而FPGA的RAM初始化方式可能不同，需要特别注意。

5. 实际移植中的经验分享

5.1 调试技巧

在移植过程中，存储器相关的问题往往比较隐蔽。以下是我总结的几个调试技巧：

地址映射检查：使用逻辑分析仪或嵌入式逻辑分析仪(如Xilinx的ILA)检查地址是否正确映射。
数据比对：在仿真阶段，建立ASIC和FPGA版本的黄金参考模型，进行逐周期比对。
时序分析：特别注意跨时钟域的情况，FPGA中的时钟网络与ASIC可能不同。

5.2 性能优化

FPGA中的存储器性能可以通过以下方式优化：

合理使用流水线：FPGA的Block RAM通常支持输出寄存器，合理使用可以提高时序性能。
宽度转换：如果数据位宽不匹配，可以使用FPGA提供的宽度转换功能，而不是自己实现。
Bank选择：对于大容量存储器，合理分布在不同Bank可以改善布线拥塞。

5.3 常见问题及解决方案

问题： FPGA实现中存储器内容不正确
- 检查： 确认初始化文件是否正确加载
- 解决： 使用厂商工具重新生成存储器初始化文件
问题： 时序违例
- 检查： 分析关键路径，特别是地址和数据路径
- 解决： 增加流水线级数或调整时钟约束
问题： 功能仿真通过但硬件不正常
- 检查： 确认时钟和复位信号的质量
- 解决： 添加适当的时钟缓冲和复位同步电路

6. 代码对比实例

6.1 ROM代码对比

ASIC版本：

verilog复制// 多个小ROM拼接
rom_0_domain u_rom0(...);
rom_1_domain u_rom1(...);
rom_2_domain u_rom2(...);

// 复杂的选择逻辑
assign rom_rdata = rom_2_cs ? rom_2_rdata : 
                  rom_1_cs ? rom_1_rdata : rom_0_rdata;

FPGA版本：

verilog复制// 单个大ROM
ROM_AW_sram_bus_wrapper_x32 #( .AW(19) ) u_rom(
    .Q(rom_rdata),
    .ADR(rom_addr),
    .ME(1'b1),  // 常使能
    .CLK(clk),
    .LS(1'b0),
    .WEN(1'b1),
    .D()
);

6.2 RAM代码对比

ASIC版本：

verilog复制custom_ram u_ram(
    .clk(clk),
    .addr(ram_addr),
    .wdata(ram_wdata),
    .rdata(ram_rdata),
    .wen(ram_wen),  // 低有效
    .cen(ram_cs)    // 复杂的片选逻辑
);

FPGA版本：

verilog复制RAM_IP u_ram(
    .clk(clk),
    .addr(ram_addr),
    .din(ram_wdata),
    .dout(ram_rdata),
    .we(ram_wen),  // 注意有效电平可能不同
    .en(1'b1)      // 通常常使能
);