嵌入式开发中的中值滤波：原理、优化与实践

王怡蕊

1. 嵌入式脉冲噪声过滤的痛点与中值滤波的价值

做嵌入式开发的朋友们一定遇到过这样的场景：传感器在实验室测试时数据完美无缺，一到现场就频频出现"抽风"现象。温度传感器突然蹦出个80℃的异常值，加速度计莫名其妙来个尖峰信号。这些"捣蛋鬼"就是脉冲噪声，专业点说也叫椒盐噪声或尖峰噪声。

脉冲噪声的危害可不容小觑。我去年做过一个工业温度监控项目，就因为几个异常温度值导致控制系统误判，差点引发产线停机。当时尝试过最简单的移动平均滤波，结果发现它不仅没滤掉异常值，反而把正常信号也"平均"得面目全非。这就是典型的用错工具——移动平均对付随机噪声还行，遇到脉冲噪声就完全没辙。

中值滤波（Median Filter）就是专门为解决这个问题而生的。它的核心思想特别直观：把一段时间内的采样数据排序，取中间那个值作为输出。因为脉冲噪声通常都是突然出现的极大或极小值，排序后自然就被挤到两端，取中值时就自动被过滤掉了。这种"去两头取中间"的做法，既保留了信号的真实趋势，又完美避开了异常干扰。

在嵌入式系统中，中值滤波有三大不可替代的优势：

针对性去除脉冲噪声：对零星出现的异常值过滤效果极佳
保留信号边缘特性：不像移动平均会让信号变得"圆滑"
算法简洁高效：特别适合资源有限的MCU环境

2. 中值滤波的核心原理与实现机制

2.1 滑动窗口的工作机制

中值滤波的核心是一个"滑动窗口"的概念。假设我们设置窗口大小为5（通常取奇数，原因后面会解释），那么这个窗口就像个移动的观察框，每次处理当前时刻及其前4个历史数据。

窗口滑动的过程可以这样理解：

code复制时刻1: [D1, _, _, _, _]  ← 刚启动，只有1个数据
时刻2: [D1, D2, _, _, _]
...
时刻5: [D1, D2, D3, D4, D5] ← 窗口首次填满
时刻6: [D2, D3, D4, D5, D6] ← 窗口滑动，丢弃D1，加入D6

2.2 排序取中值的数学原理

为什么取中值能有效过滤脉冲噪声？这要从统计学角度解释。对于一组包含脉冲噪声的数据，其概率密度函数会出现两个"峰"：一个对应正常信号，一个对应异常值。中值对异常值的鲁棒性远高于均值，因为：

均值：受所有数据影响，异常值会显著拉偏结果
中值：只与数据排序位置有关，异常值只要不超过半数就不会影响结果

举个例子，假设窗口内有5个温度值：[25.1, 25.3, 88.9, 25.2, 25.4]，其中88.9是明显的脉冲噪声。排序后为[25.1, 25.2, 25.3, 25.4, 88.9]，中值25.3完全不受异常值影响。如果用平均值，结果将是37.78℃，完全失真。

2.3 窗口大小的影响分析

窗口大小N的选择是个权衡艺术：

N太小（如3）：实时性好但可能漏掉连续异常
N太大（如9）：滤波效果好但延迟增加

根据我的工程经验，推荐以下选型原则：

轻度噪声（异常值<10%）：N=3或5
中度噪声（10-20%）：N=5或7
重度噪声（>20%）：考虑组合滤波方案

特别要注意的是，窗口大小与信号延迟直接相关。对于采样周期T的系统，N点窗口会引入(N-1)*T/2的理论延迟。比如10Hz采样（T=0.1s）时，N=5的延迟就是0.2s。

3. 嵌入式优化的排序算法实现

3.1 简化冒泡排序优化

传统冒泡排序需要对整个数组完整排序，但中值滤波只需要中间那个值。基于这个观察，我们可以优化出一个"部分排序"版本：

c复制// 仅排序到中值位置即可停止
for(int i=0; i<=median_pos; i++){
    for(int j=len-1; j>i; j--){
        if(buf[j] < buf[j-1]){
            swap(&buf[j], &buf[j-1]);
        }
    }
}
return buf[median_pos];

这个优化能减少约50%的比较次数。实测在STM32F103上，N=5时的排序时间从4.2μs降到了2.3μs。

3.2 插入排序的增量优化

插入排序有个独特优势：可以利用滑动窗口的特性做增量更新。因为每次窗口滑动只是去掉最旧数据、加入最新数据，其他数据已经是有序的：

c复制// 1. 移除最旧数据（整体前移）
for(int i=0; i<len-1; i++){
    buf[i] = buf[i+1];
}

// 2. 将新数据插入有序部分
float new_data = input;
int j = len-2;
while(j>=0 && buf[j]>new_data){
    buf[j+1] = buf[j];
    j--;
}
buf[j+1] = new_data;

return buf[median_pos];

这种实现方式在N=7时比简化冒泡还要快15%左右。

3.3 算法选择建议

根据我的实测数据，给出以下选型建议：

窗口大小	推荐算法	执行时间(72MHz MCU)
N=3	任意	<1μs
N=5	简化冒泡	2.3μs
N=7	插入排序	3.8μs
N≥9	考虑其他方案	>6μs

重要提示：当N>9时，建议重新评估是否真的需要这么大窗口，或者考虑组合滤波方案。

4. 嵌入式实现的工程细节

4.1 内存管理策略

嵌入式系统内存有限，必须精心设计缓冲区：

静态分配优于动态分配：提前定义好固定大小的数组
使用环形缓冲区：减少数据搬移开销
数据类型选择：
- 整数运算更快：如果原始数据是ADC的12位结果，直接用uint16_t
- 浮点运算更直观：但要注意STM32的FPU支持

示例代码片段：

c复制#define WINDOW_SIZE 5
typedef struct {
    float buffer[WINDOW_SIZE];
    uint8_t index;
    bool is_full;
} MedianFilter;

float median_filter_update(MedianFilter* filter, float input){
    filter->buffer[filter->index++] = input;
    if(filter->index >= WINDOW_SIZE){
        filter->index = 0;
        filter->is_full = true;
    }
    // ...排序逻辑...
}

4.2 实时性保障技巧

在实时控制系统中，滤波算法的执行时间必须严格控制：

定时器中断触发：确保采样间隔精确
DMA配合：对于高速ADC采样，使用DMA搬运数据
优先级管理：滤波计算任务优先级应低于关键控制任务

我曾经在一个电机控制项目中，因为滤波计算时间不稳定导致PWM输出抖动，后来通过以下方式解决：

将滤波计算移到低优先级任务
使用双缓冲区：一个用于采集，一个用于处理
限制最大执行时间，超时则跳过本次滤波

4.3 固定点数优化

对于没有FPU的MCU，可以考虑定点数运算。例如将温度值放大10倍用int16_t表示：

c复制int16_t temp_raw = (int16_t)(DS18B20_Get_Temp() * 10);

这样排序时全部使用整数运算，速度能提升3-5倍。

5. 典型应用场景与参数调优

5.1 温度传感器抗干扰

DS18B20等温度传感器容易受到电磁干扰。典型参数：

采样率：1-10Hz（温度变化慢）
窗口大小：N=5
异常检测：配合±5℃的阈值判断

实际案例：某烘箱温度控制，采用N=5中值滤波后，误报警次数从每天20+次降为0。

5.2 加速度计峰值过滤

ADXL345等加速度计在机械振动中会产生假峰值。推荐配置：

采样率：100-500Hz
窗口大小：N=3（兼顾实时性）
组合策略：先中值滤波，再低通滤波

5.3 工业电流检测

CT电流传感器易受电网瞬态干扰。特殊处理：

窗口动态调整：正常时N=3，检测到异常自动切换到N=7
多级滤波：电流值→中值滤波→RMS计算→移动平均
硬件配合：在ADC输入端增加RC滤波

6. 进阶技巧与常见问题排查

6.1 组合滤波策略

当单一中值滤波效果不足时，可以考虑：

中值+移动平均：先去除脉冲，再平滑随机噪声
中值+卡尔曼：适合动态系统状态估计
多级中值滤波：不同窗口大小级联

示例代码框架：

c复制float sensor_pipeline(float raw){
    float stage1 = median_filter(raw);  // N=3
    float stage2 = moving_avg(stage1);  // N=5
    return stage2;
}

6.2 窗口大小的动态调整

智能调整窗口大小的启发式规则：

连续检测到异常时增大窗口
长时间无异常时减小窗口
根据信号变化率自适应

实现示例：

c复制if(consecutive_anomaly > 3 && window_size < MAX_WINDOW){
    window_size += 2;
    reset_filter();
}

6.3 典型问题排查指南

问题现象	可能原因	解决方案
滤波后仍有异常	窗口太小或异常连续	增大窗口或增加阈值判断
信号延迟明显	窗口过大	减小窗口或改用预测算法
MCU负载高	排序算法效率低	改用插入排序或减小窗口
初始输出异常	缓冲区未初始化	上电时清空缓冲区
浮点精度问题	多次累积运算	改用定点数或增加归一化

7. 性能优化与资源受限场景适配

7.1 超低功耗设计

对于电池供电设备：

减少采样频率
使用N=3的最小窗口
优化排序算法减少CPU唤醒时间

实测数据（基于STM32L4）：

N=3简化冒泡：每次滤波消耗12μA @1MHz
N=5插入排序：消耗28μA @1MHz

7.2 无FPU的MCU优化

对于Cortex-M0等无浮点单元：

使用Q格式定点数
查表法替代浮点运算
汇编优化关键排序代码

Q15格式示例：

c复制int16_t temp_q15 = (int16_t)(temp * 32768.0f / 100.0f);  // -100~100℃映射到Q15

7.3 多传感器融合场景

当需要同时处理多个传感器时：

为每个传感器维护独立滤波器实例
共用排序算法函数减少代码体积
错开处理时间避免CPU峰值负载

结构体设计示例：

c复制typedef struct {
    float *buffer;
    uint8_t size;
    uint8_t index;
    // 其他状态变量...
} SensorFilter;

void process_all_sensors(){
    static SensorFilter temp_filter, accel_filter, current_filter;
    // 分别更新各个滤波器
}

8. 从理论到量产的实际考量

8.1 生产测试中的滤波器验证

量产阶段需要特别关注：

边界值测试：输入最大值/最小值验证不会溢出
异常注入测试：模拟各种脉冲噪声场景
长期稳定性测试：连续运行72小时检查内存泄漏

建议的测试用例：

c复制TEST(MedianFilter, ExtremeValues){
    float test_data[] = {FLT_MAX, 0.0f, FLT_MIN};
    // 验证处理极端值不会导致异常
}

8.2 现场问题诊断技巧

当现场出现滤波问题时：

数据日志记录：保存原始和滤波后数据对比
参数远程配置：支持OTA调整窗口大小
性能监控：记录每次滤波的执行时间

我在一个物联网项目中实现了这样的诊断框架：

c复制void filter_debug_log(float raw, float filtered){
    if(debug_mode){
        printf("[Filter] Raw:%.2f, Out:%.2f\n", raw, filtered);
    }
}

8.3 长期维护建议

为了代码可持续性：

完善的文档说明滤波算法选择依据
版本控制记录所有参数变更
单元测试覆盖各种边界条件

示例文档注释：

c复制/**
 * @brief 中值滤波更新函数
 * @param input 新采样值
 * @return 滤波后值
 * @note 使用N=5窗口，基于简化冒泡排序
 *       变更记录：
 *       - 2023-01: 初始版本
 *       - 2023-06: 优化排序提前终止
 */