在光通信领域,高速串行器(SERDES)是实现电光信号转换的核心芯片。2009年富士通实验室发表的这篇论文,展示了当时最先进的65nm CMOS工艺40Gb/s串行器设计。这个设计最引人注目的特点是同时支持双20Gb/s和单40Gb/s两种工作模式,完美适配SONET OC-768、SDH STM-256和ITU G.709等通信标准。
作为芯片设计工程师,我特别欣赏这个设计的几个创新点:首先是采用了SFI-5.2接口标准,这在当时是非常前沿的选择;其次是巧妙地将两种输出模式集成在单一芯片中;最后是通过创新的电路设计克服了65nm工艺下实现40Gb/s速率的挑战。实测结果显示,这款芯片在两种模式下都能实现低于10^-11的误码率,而功耗控制在令人惊艳的1.8W(40G模式)和1.6W(20G模式)。
这款串行器IC的设计目标非常明确:为40Gb/s光模块提供高集成度、低功耗的解决方案。图21.2.1展示了它在光模块中的位置 - 作为调制器驱动电路的前端,负责将多路低速并行数据转换为高速串行信号。
芯片内部架构(图21.2.2)包含几个关键模块:
这种架构设计充分考虑了光模块的实际需求。例如,双20Gb/s输出模式专门为RZ-DQPSK调制设计,而单40Gb/s模式则支持传统的NRZ调制方式。这种灵活性使得同一芯片可以适配不同的光通信系统需求。
在65nm CMOS工艺下实现40Gb/s速率面临着多重挑战:
时序收敛问题:在40Gb/s速率下,每个单位间隔(UI)仅有25ps,任何微小的时序偏差都会导致采样错误。特别是在PVT(工艺、电压、温度)变化下,保持稳定的时序关系尤为困难。
时钟生成与分配:需要生成纯净的20GHz时钟信号,并将其低抖动地分配到芯片各处。传统CMOS PLL在这个频段很难同时满足低功耗和低抖动要求。
信号完整性:40Gb/s信号的上升/下降时间极短(约10ps),传输线效应、阻抗匹配等问题变得非常关键。
功耗控制:光模块对功耗极为敏感,必须在保证性能的前提下将功耗控制在可接受范围内。
论文中提到的几个创新设计正是针对这些挑战提出的解决方案,我们将在后续章节详细分析。
SFI5.2接收端采用了5个独立的5GHz CDR电路,每个通道都有自己的时钟恢复单元。这种分布式架构相比共享式CDR有几个优势:
CDR的核心是相位插值器(PI)技术。图21.2.3展示了其工作原理:PI通过混合多个时钟相位,可以产生分辨率远高于原始时钟周期的采样时钟。在这款设计中,PI实现了亚UI级别的时序校准,这对于40Gb/s信号(UI=25ps)的可靠采样至关重要。
实际操作中,工程师需要注意几个关键点:
时钟生成采用了LC-VCO结构的PLL,频率覆盖19.9-22.3GHz。这个设计有几个亮点:
数字辅助的模拟PLL:如图21.2.4所示,PLL采用了混合架构 - 核心是模拟电荷泵PLL,但增加了数字状态机进行粗调。这种设计既保持了模拟PLL的优良噪声性能,又通过数字辅助扩展了频率范围。
智能的频带切换算法:状态机通过监测控制电压VCNTL在三个阈值(VLO, VMID, VHI)的比较结果,决定如何调整7位电容阵列。这种设计确保了频带切换的可靠性和效率。
锁定检测机制:通过统计连续"up"或"down"信号的次数(MAXCNT参数),可以可靠地判断PLL是否锁定。这种数字方法比传统的模拟锁定检测更可靠。
在实际应用中,这类PLL需要注意:
40Gb/s输出缓冲器采用了创新的三重谐振放大器拓扑(图21.2.5a)。这种设计通过巧妙地利用片上电感和寄生电容的谐振特性,实现了几个优势:
带宽扩展:通过多个谐振峰叠加,有效扩展了放大器的-3dB带宽,使其能够支持40Gb/s信号。
功耗优化:相比传统的级联放大器,谐振结构可以在更少的级数下实现相同的增益,显著降低功耗。
阻抗匹配:增加的共栅晶体管改善了S22参数,使输出阻抗更稳定,减少了PVT变化的影响。
对于20GHz时钟缓冲器,设计者采用了反向三重谐振放大器(RTRA)结构(图21.2.5b)。这种设计的巧妙之处在于:
在实际版图设计中,这类高频电路需要特别注意:
这款串行器IC采用65nm数字CMOS工艺实现,工艺特性包括:
芯片尺寸为4.2×4.2mm²,这个面积在当时的工艺条件下相当紧凑。图21.2.7的芯片显微照片显示了良好的模块划分:
电源设计采用了1.2V(核心)和3.3V(I/O)双电压域,既满足了高速电路的低电压需求,又提供了足够的输出摆幅。
测试方案设计得非常全面:
眼图测试:使用高带宽示波器直接观测输出信号质量。图21.2.6展示了实测眼图:
误码率测试:使用外部解串器(SHF 423和NEL CI0008B)将高速信号降频后,用BERT进行误码检测。两种模式下BER都优于10^-11,满足通信标准要求。
功耗测试:
PVT测试:验证了在工艺角(2σ慢-3σ快)、电压(±10%)、温度(0-90°C)变化下的稳定性。
通过这个项目,团队总结出几个宝贵的经验:
混合信号协同设计:高速串行器设计需要数字和模拟团队的紧密合作。例如,数字控制的状态机需要与模拟PLL完美配合。
系统级仿真必不可少:在40Gb/s速率下,封装和PCB的影响变得非常显著。建议在设计早期就进行完整的通道仿真(包括封装模型)。
测试方案要提前规划:高速信号测试需要特殊设备和技巧。例如,在这个项目中,团队专门开发了基于模式识别的自动相位校准算法。
功耗预算管理:通过架构优化(如分布式PLL)和电路创新(如谐振放大器),可以在不牺牲性能的情况下显著降低功耗。
虽然这篇论文发表于2009年,但其中的设计理念至今仍有参考价值。随着工艺进步,现代高速串行器设计也出现了一些新趋势:
工艺选择:当今的112Gb/s+设计多采用16/7nm FinFET工艺,但65nm节点仍然是许多中等速率应用的性价比之选。
架构演进:DFE(判决反馈均衡)和CTLE(连续时间线性均衡)等新技术被广泛采用,以补偿信道损耗。
封装创新:硅光子和2.5D/3D封装技术正在改变光模块的架构,使得TIA、Driver和Modulator可以更紧密集成。
标准化进展:新的接口标准如400ZR和OpenROADM正在定义更高效的互操作规范。
对于资源有限的团队,可以考虑这些替代方案:
这个65nm设计最值得借鉴的是其系统级的优化思路 - 不是单纯追求某个指标的突破,而是在性能、功耗、成本和可靠性之间找到最佳平衡点。