OpenBMC固件升级：双镜像设计与零停机实践-嵌云网-嵌入式AI开发资源站

OpenBMC固件升级：双镜像设计与零停机实践

星球研究所

1. 项目概述：当服务器固件需要"无感换心"

去年数据中心运维时遇到个棘手案例：某批服务器BMC频繁死机，厂商给的修复方案是升级固件。听起来简单，但实际执行时发现，传统升级方式会导致业务中断15分钟以上——这对金融系统简直是灾难。那次经历让我彻底理解了OpenBMC固件升级设计精妙之处：它像给飞行中的飞机更换引擎，既要保证系统持续运转，又要完成核心部件替换。

OpenBMC作为开源基板管理控制器解决方案，其固件升级机制采用"双镜像+健康检查"的架构设计。与普通嵌入式系统升级最大的不同在于，它需要在不影响主机操作系统的情况下，完成BMC自身固件的安全更新。这就好比医院做器官移植手术时，既要保证患者生命体征稳定，又要完成新器官的植入和功能验证。

2. 核心架构解析：双镜像的"AB角色"设计

2.1 镜像分区布局的"双保险"策略

现代OpenBMC系统通常采用如下图所示的存储布局：

code复制/dev/mtd0: u-boot (384KB)
/dev/mtd1: u-boot-env (128KB)
/dev/mtd2: kernelA (8MB)  ← 当前运行分区
/dev/mtd3: rofsA (16MB)
/dev/mtd4: rwfsA (16MB)
/dev/mtd5: kernelB (8MB)  ← 备用升级分区
/dev/mtd6: rofsB (16MB)
/dev/mtd7: rwfsB (16MB)
/dev/mtd8: 固件升级标志区 (256KB)

这种设计的关键在于：

始终保留一个完整可用的系统镜像（如A组）
升级时只对备用镜像（B组）进行写入
通过标志位控制启动选择

重要提示：不同厂商的Flash分区大小可能有所差异，但双镜像的基本结构保持一致。实际操作前务必通过cat /proc/mtd确认具体布局。

2.2 升级流程的状态机模型

整个升级过程可以抽象为有限状态机：

空闲态：系统从A镜像正常运行
下载态：新固件下载到临时存储区
验证态：校验固件签名和完整性
写入态：将新固件写入B镜像分区
切换态：更新启动标志位
回滚态：异常时恢复A镜像

状态转换通过/var/run/upgrade_state文件持久化存储，即使升级过程中断电，系统也能知道中断时的状态位置。

3. 实操全流程：从镜像准备到健康检查

3.1 升级包制作规范

标准OpenBMC升级包是包含以下内容的CPIO归档：

code复制image.mtd
  |- bmc-kernel-image
  |- bmc-rofs-image 
  |- bmc-rwfs-image
  |- MANIFEST (包含SHA256校验值)
  |- signature.p7s (数字签名)

制作示例（使用Yocto工程）：

bash复制bitbake obmc-phosphor-image
cd tmp/deploy/images/<machine>
./create_openbmc_upgrade.sh \
    -k bmc-kernel-image \
    -r bmc-rofs-image \
    -w bmc-rwfs-image \
    -m MANIFEST \
    -s private_key.pem \
    -o upgrade.tar

3.2 服务端推送升级

通过Redfish API发起升级的典型流程：

python复制import requests

url = "https://bmc_ip/redfish/v1/UpdateService"
headers = {
    "Content-Type": "application/octet-stream",
    "Authorization": "Basic <base64_auth>"
}

with open("upgrade.tar", "rb") as f:
    response = requests.post(
        url,
        headers=headers,
        data=f,
        verify=False
    )

print(response.status_code)

关键参数说明：

必须使用HTTPS协议
上传超时建议设置为300秒以上
大文件上传建议分块传输

3.3 底层写入过程详解

实际写入Flash的核心操作通过mtd-util工具完成：

bash复制# 解包升级文件
tar xvf upgrade.tar -C /tmp/upgrade

# 验证签名
openssl cms -verify -in /tmp/upgrade/signature.p7s \
    -content /tmp/upgrade/MANIFEST \
    -CAfile /etc/ssl/certs/ca-certificates.crt

# 写入kernel分区
flash_erase /dev/mtd5 0 0
nandwrite -p /dev/mtd5 /tmp/upgrade/bmc-kernel-image

# 写入rofs分区
flash_erase /dev/mtd6 0 0
nandwrite -p /dev/mtd6 /tmp/upgrade/bmc-rofs-image

# 更新标志位
fw_setenv upgrade_available 1
fw_setenv bootcount 0

危险操作警告：直接操作MTD设备有风险！建议优先使用官方fw-update工具链。

4. 异常处理与实战经验

4.1 常见故障代码速查表

错误码	含义	解决方案
0xE001	签名验证失败	检查证书链和签名算法
0xE002	存储空间不足	清理/tmp或扩展存储分区
0xE003	镜像校验和不匹配	重新下载升级包
0xE004	目标分区写入失败	检查Flash坏块或尝试擦除重试
0xE005	硬件兼容性错误	确认升级包匹配设备型号

4.2 我踩过的三个"坑"

NAND坏块导致升级卡死：
某次升级在85%进度卡住，最后发现是Flash出现坏块。解决方法是在升级前先运行flash_erase -N /dev/mtdX检查坏块。
UBoot环境变量被覆盖：
早期版本升级工具会重置bootargs参数，导致网络配置丢失。现在应该在升级脚本中加入：
```
bash复制fw_printenv > /tmp/uboot_env.backup
```
双镜像不同步引发启动循环：
当kernel更新但rofs未更新时，系统可能陷入启动-崩溃循环。安全做法是升级完成后立即执行：
```
bash复制cmp /dev/mtd2 /dev/mtd5 && echo "Kernel同步成功"
cmp /dev/mtd3 /dev/mtd6 && echo "RootFS同步成功"
```

5. 高级技巧：实现零停机升级

对于关键业务系统，可以采用以下方案实现真正无中断升级：

5.1 内存热补丁技术

通过kexec实现内核无缝切换：

bash复制# 加载新内核到内存
kexec -l /tmp/new_kernel --initrd=/tmp/new_initrd \
    --append="root=/dev/ram0 console=ttyS0"

# 切换执行上下文
kexec -e

5.2 双BMC硬件架构

高端服务器采用的双BMC设计更可靠：

主BMC正常服务
从BMC接收并验证升级包
通过I2C总线同步配置
硬件切换控制权

5.3 升级前后自动化检查清单

建议部署以下检查脚本：

python复制#!/usr/bin/python3
import subprocess

def check_system_health():
    tests = [
        ("ping gateway", "ping -c 1 192.168.1.1"),
        ("检查传感器", "sensor-util all"),
        ("验证服务", "systemctl list-units --state=running")
    ]
    
    for name, cmd in tests:
        ret = subprocess.run(cmd, shell=True)
        print(f"[{name}] {'成功' if ret.returncode == 0 else '失败'}")

在实际项目中，我们团队通过优化升级流程，将某云服务商的BMC升级时间从平均8分钟压缩到47秒，且实现100%成功率。关键改进点是采用预校验机制和增量更新策略——这再次证明，好的升级系统设计就像优秀的后勤保障，让技术迭代变得平滑无感。