基于STM32与OpenMV的低成本嵌入式目标检测方案

倔强的猫

1. 项目概述：低成本嵌入式目标检测方案设计

在工业流水线质检、农业病虫害识别等边缘计算场景中，我们常常需要一种既经济实惠又能满足实时性要求的视觉检测方案。传统工控机+摄像头的组合虽然性能强大，但成本高昂且体积庞大。而基于STM32与OpenMV的协同方案，能以不到百元的硬件成本实现轻量级目标检测功能。

这个方案的核心设计理念是"各司其职"：OpenMV负责图像采集和轻量化模型推理，STM32作为主控单元处理逻辑控制和设备交互。两者通过UART串口通信，形成一个完整的嵌入式视觉系统。我曾在一个农产品分拣项目中实测，这套系统在检测小目标时帧率能达到8-10FPS，完全满足大多数边缘场景的实时性需求。

2. 硬件选型与成本控制

2.1 核心硬件配置解析

OpenMV选型建议：

OpenMV H7（推荐）：配备480MHz的STM32H743VI处理器，内置32MB RAM和1MB Flash，支持RGB565和灰度图像处理
OpenMV M7（备选）：216MHz的STM32F765VI处理器，性能稍弱但价格更低

注意：务必选择带镜头模组的套装，单独购买主板可能无法直接使用

STM32主控选择：

基础款：STM32F103C8T6（蓝板），72MHz主频，20KB RAM，64KB Flash
增强款：STM32F401CCU6，84MHz主频，64KB RAM，256KB Flash
实测发现F103系列已能满足大多数控制需求，除非需要复杂算法才考虑F4系列

外设搭配技巧：

显示：0.96寸OLED（SSD1306驱动）性价比最高，I2C接口仅需4根线
报警：有源蜂鸣器（5V驱动）比无源蜂鸣器更节省IO资源
扩展：建议预留1-2个GPIO接光电传感器作触发信号

2.2 硬件连接示意图

code复制OpenMV Cam      STM32
   UART3_TX ---- PA10(RX)
   UART3_RX ---- PA9(TX)
   GND -------- GND
   
STM32外设连接：
OLED: PB6(SCL), PB7(SDA)
蜂鸣器: PA0
LED指示灯: PA1

3. 软件环境搭建

3.1 OpenMV端开发环境

安装OpenMV IDE（支持Win/Mac/Linux）
固件升级到最新版本（确保支持TensorFlow Lite）
安装必要库：

python复制# 在OpenMV IDE的终端执行
import upip
upip.install('tensorflow')
upip.install('ulab')

3.2 STM32开发环境

推荐使用STM32CubeIDE：

安装STM32CubeMX生成初始化代码
配置UART1（115200bps, 8N1）
启用I2C1（OLED显示）
生成代码后添加业务逻辑

4. YOLOv7模型轻量化改造

4.1 模型训练关键参数

python复制# 训练命令示例
python train.py \
  --weights yolov7-tiny.pt \
  --data custom_data.yaml \
  --batch-size 16 \
  --img-size 224 224 \  # 必须为32的倍数
  --device 0 \
  --epochs 100 \
  --quant \  # 启用训练后量化
  --hyp data/hyp.scratch.tiny.yaml

参数选择依据：

输入尺寸：224x224是精度与速度的最佳平衡点
Batch Size：根据GPU显存调整，太大容易OOM
量化训练：必须开启以适应OpenMV的整数运算单元

4.2 模型转换流程

导出ONNX格式：

bash复制python export.py --weights best.pt --img-size 224 --include onnx

转换为TFLite（含量化）：

bash复制tflite_convert \
  --output_file=yolov7-tiny-int8.tflite \
  --saved_model_dir=./ \
  --inference_type=QUANTIZED_UINT8 \
  --mean_values=128 \
  --std_dev_values=127 \
  --default_ranges_min=0 \
  --default_ranges_max=255

踩坑记录：OpenMV对TFLite模型有严格限制，输入输出tensor必须为int8/uint8格式，浮点模型无法运行

5. OpenMV端推理实现

5.1 模型部署代码

python复制import tf, image, time

# 初始化模型
net = tf.load("yolov7-tiny-int8.tflite", load_to_fb=True)
labels = ['class1', 'class2', 'class3']  # 替换为实际类别

def detect(img):
    # 预处理
    img = img.resize(224, 224)
    img = img.to_grayscale(copy=False)
    
    # 推理
    outputs = net.classify(img)
    
    # 后处理
    boxes = []
    for i, score in enumerate(outputs[0]['output']):
        if score > 0.5:  # 置信度阈值
            y, x, h, w = outputs[0]['output_1'][i]
            boxes.append((x-w/2, y-h/2, x+w/2, y+h/2, labels[i], score))
    
    return boxes

5.2 性能优化技巧

内存管理：

使用load_to_fb=True将模型加载到帧缓冲区
图像处理尽量在原图上操作（copy=False）

帧率提升：

关闭IDE的图像预览可提升20%性能
适当降低分辨率（160x160）可获得更高FPS

功耗控制：

设置pyb.freq()降低主频
使用machine.sleep()在空闲时休眠

6. STM32与OpenMV通信协议

6.1 串口协议设计

采用简单的ASCII协议便于调试：

code复制# 检测结果格式
[class],[x],[y],[w],[h],[score]\n

# 示例
2,120,80,40,60,0.82\n
1,200,150,30,50,0.76\n

6.2 STM32接收处理

c复制// 串口中断服务函数
void HAL_UART_RxCpltCallback(UART_HandleTypeDef *huart) {
    static char rx_buffer[64];
    static uint8_t idx = 0;
    
    if(rx_char == '\n') {
        rx_buffer[idx] = '\0';
        parse_detection(rx_buffer);  // 解析检测结果
        idx = 0;
    } else {
        rx_buffer[idx++] = rx_char;
    }
    HAL_UART_Receive_IT(huart, &rx_char, 1);
}

7. 典型应用场景实现

7.1 工业流水线计数

c复制// STM32逻辑示例
if(detected_class == TARGET_CLASS) {
    counter++;
    if(counter % 100 == 0) {
        OLED_ShowNumber(0, 0, counter);
        Buzzer_Beep(100);  // 每100个提示一次
    }
}

7.2 农业虫害预警

python复制# OpenMV端实现
for obj in detections:
    if obj[4] == 'locust' and obj[5] > 0.7:
        uart.write("ALARM,1\n")  # 触发STM32报警
        break

8. 常见问题排查指南

现象	可能原因	解决方案
OpenMV无法加载模型	模型格式不兼容	检查是否为int8量化的TFLite模型
检测结果错乱	输入尺寸不匹配	确保训练和推理的img-size一致
串口通信丢失	波特率不匹配	检查两端均为115200bps
帧率过低	图像预处理耗时	改用灰度图像减少计算量
STM32无法解析数据	协议格式错误	添加数据校验和帧尾标识