Linux MDIO子系统架构与PHY通信实践-嵌云网-嵌入式AI开发资源站

Linux MDIO子系统架构与PHY通信实践

大威天龙ASURA

1. Linux MDIO子系统架构解析

1.1 MDIO总线硬件基础

MDIO总线作为以太网MAC与PHY之间的管理通道，其硬件实现堪称"简约而不简单"。我曾在多个嵌入式网络设备开发项目中与这种两线制接口打交道，它的设计哲学充分体现了硬件工程师的智慧——用最少的信号线实现最关键的功能。

MDC时钟线通常由MAC端控制器驱动，频率范围在1MHz到2.5MHz之间。这个看似简单的时钟信号其实暗藏玄机：在实际电路设计中，必须注意时钟信号的边沿斜率(slew rate)和抖动(jitter)控制。过大的时钟抖动会导致PHY设备采样失败，我在某次四层板设计中就曾因为MDC走线过长导致通信不稳定，后来通过缩短走线距离并添加终端电阻解决了问题。

MDIO数据线的双向特性带来了电路设计上的特殊考量。当MAC端驱动MDIO时，需要确保驱动强度足够克服PHY端的输入电容；而当PHY端驱动时，MAC端必须及时切换为高阻态。有些SoC厂商的MDIO控制器在这方面的切换时序不够理想，会导致数据采样窗口过窄。我的经验是，在驱动代码中适当调整MDIO方向切换的延时参数可以显著提高通信可靠性。

1.2 MDIO协议标准演进

Clause 22协议作为MDIO的初始规范，定义了基本的帧结构：

前导码(32位1)
ST码(01)
操作码(2位，读/写)
PHY地址(5位)
寄存器地址(5位)
TA周期(2位)
数据(16位)

这种帧结构在10/100M以太网时代完全够用，但随着千兆以太网的普及，其局限性逐渐显现。最突出的问题是5位寄存器地址只能寻址32个寄存器，而现代PHY芯片的功能越来越复杂，需要配置的寄存器数量远超这个范围。

Clause 45协议通过引入"设备类型"和"地址扩展"机制解决了这个问题。它的帧结构包含：

前导码(32位1)
ST码(00)
操作码(2位)
设备类型(5位)
设备地址(5位)
地址/数据标识(1位)
地址/数据(16位)
TA周期(2位)
数据(16位)

在实际驱动开发中，我发现Clause 45的地址阶段和数据阶段分离设计带来了更好的灵活性。例如，某款Marvell的88E1512 PHY芯片就需要通过Clause 45访问其扩展的SerDes配置寄存器。不过需要注意的是，许多老款PHY芯片只支持Clause 22，因此在编写通用驱动时最好先尝试Clause 22访问，失败后再回退到Clause 45。

2. Linux内核中的MDIO实现

2.1 内核对象模型

Linux MDIO子系统采用了经典的总线-设备-驱动模型，这个设计我在多个内核版本(从3.x到5.x)的移植过程中都感受到了其稳定性。核心数据结构包括：

struct mii_bus：表示一个物理MDIO总线控制器

c复制struct mii_bus {
    const char *name;
    char id[MII_BUS_ID_SIZE];
    void *priv;
    int (*read)(struct mii_bus *bus, int addr, int regnum);
    int (*write)(struct mii_bus *bus, int addr, int regnum, u16 val);
    /* ...其他成员省略... */
};

struct phy_device：描述一个PHY设备

c复制struct phy_device {
    struct mdio_device mdio;
    u32 phy_id;
    struct phy_driver *drv;
    int addr;
    /* ...其他成员省略... */
};

struct phy_driver：PHY设备驱动

c复制struct phy_driver {
    u32 phy_id;
    char *name;
    int (*config_init)(struct phy_device *phydev);
    int (*read_status)(struct phy_device *phydev);
    /* ...其他成员省略... */
};

在具体开发中，注册一个MDIO总线控制器的典型流程是：

分配mii_bus结构体：mdiobus_alloc()
设置读写方法：bus->read = xxx_mdio_read;
注册总线：mdiobus_register(bus)

我曾遇到过的一个典型问题是忘记设置bus->parent设备指针，导致sysfs中的设备链接关系不正确，影响了udev的设备管理。

2.2 PHY设备探测机制

MDIO子系统的设备探测过程堪称Linux设备模型的经典案例。当mdiobus_register()被调用时，内核会扫描该总线上的所有可能地址(0-31)，通过读取PHY ID寄存器来识别设备。

PHY ID由两个16位寄存器组成：

ID寄存器1(地址2)：OUI的高16位
ID寄存器2(地址3)：OUI的低6位 + 型号/版本号

识别到PHY后，内核会：

创建phy_device实例
根据PHY ID匹配对应的phy_driver
调用驱动的config_init方法初始化PHY
将phy_device与对应的net_device关联

这里有个实际开发中的经验：某些PHY芯片在上电后需要较长时间才能响应MDIO访问。我在处理某款Realtek PHY时，就不得不在探测循环中添加了额外的延时，否则会误判该地址无设备。

3. MDIO总线操作实践

3.1 寄存器访问基础

MDIO最基本的操作就是寄存器读写。Linux内核提供了不同层次的访问接口：

底层总线访问：

c复制int mdiobus_read(struct mii_bus *bus, int addr, int regnum);
int mdiobus_write(struct mii_bus *bus, int addr, int regnum, u16 val);

PHY设备访问：

c复制int phy_read(struct phy_device *phydev, u32 regnum);
int phy_write(struct phy_device *phydev, u32 regnum, u16 val);

封装好的功能接口：

c复制int phy_restart_aneg(struct phy_device *phydev);
int phy_start_aneg(struct phy_device *phydev);

在实际开发中，我建议尽量使用phy_*系列的接口，因为它们已经处理了PHY的状态管理和锁保护。直接使用mdiobus_*接口时需要自行处理并发访问问题。

3.2 Clause 45访问实现

对于需要Clause 45访问的PHY，内核提供了专门的接口：

c复制int phy_read_mmd(struct phy_device *phydev, int devnum, u32 regnum);
int phy_write_mmd(struct phy_device *phydev, int devnum, u32 regnum, u16 val);

这些函数内部会自动处理Clause 45的地址阶段和数据阶段。我在调试某款支持10G以太网的PHY时，发现其SerDes配置寄存器只能通过MMD(Management MDIO)访问，这些接口大大简化了开发工作。

一个实用的调试技巧是：当PHY行为异常时，可以编写一个内核模块遍历所有寄存器并打印其值。这比手动一个个寄存器查看高效得多。示例代码片段：

c复制for (reg = 0; reg < 32; reg++) {
    val = phy_read(phydev, reg);
    printk(KERN_INFO "reg 0x%02x: 0x%04x\n", reg, val);
}

4. 常见问题与调试技巧

4.1 典型问题排查

MDIO通信失败：
- 检查硬件连接：MDC/MDIO线是否接反
- 用示波器观察信号质量：时钟频率是否合适，数据线是否有毛刺
- 确认PHY地址配置：有些PHY的地址需要通过硬件引脚设置
PHY无法识别：
- 确认电源和复位信号正常
- 检查PHY ID读取是否正确
- 某些PHY需要先配置特殊寄存器才能响应MDIO
自动协商失败：
- 检查广告能力寄存器(ADVERTISE)设置
- 确认链路伙伴的配置
- 某些PHY需要手动重启自动协商过程

4.2 性能优化建议

减少MDIO访问频率：
- 缓存常用寄存器值
- 使用PHY的中断功能代替轮询
- 批量读取多个寄存器
合理配置PHY：
- 根据实际需求关闭未用功能
- 调整LED显示模式减少干扰
- 优化电源管理设置

驱动优化技巧：

c复制/* 预取常用寄存器值 */
phy_read_status(phydev);
/* 使用内核提供的工作队列处理PHY状态变化 */
phy_start_machine(phydev);

在某个高密度网络设备项目中，我们通过优化MDIO访问模式，将PHY配置时间缩短了70%。关键是将顺序的单寄存器访问改为批量读取，并充分利用PHY的状态变化中断。