Cortex M分散加载文件(scatter file)配置与应用详解-嵌云网-嵌入式AI开发资源站

Cortex M分散加载文件(scatter file)配置与应用详解

芳奎

1. Cortex M系列分散加载文件深度解析

在嵌入式开发中，特别是使用Keil MDK进行Cortex M系列开发时，分散加载文件(scatter file)是一个强大但常被忽视的工具。它允许开发者精确控制代码和数据在内存中的布局，这在以下场景中尤为重要：

需要将关键函数固定在Flash特定地址（如Bootloader跳转接口）
要求部分函数在RAM中运行以提高执行速度
系统存在多块非连续内存需要分别利用
需要规避Flash擦写期间的取指冲突

提示：分散加载配置不当可能导致程序无法启动或运行异常，建议在修改前备份工程并熟悉验证方法。

1.1 内存基础概念梳理

在深入分散加载前，需要明确几个关键概念：

装载域(Load Region)：程序镜像最初存储的位置，通常是Flash
执行域(Execution Region)：代码/数据实际运行时的位置
输入段(Input Section)：编译器生成的代码/数据块，如.text、.data等
分散加载过程：启动时将需要移动的代码/数据从装载域复制到执行域

典型的内存分配关系如下：

内存类型	存放内容	运行时位置
Flash	代码(Code)、只读数据(RO)	原地执行
RAM	变量(RW/ZI)	必须RAM
RAM	需加速的代码	需搬运

1.2 分散加载工作流程

当使用分散加载文件时，系统启动流程如下：

芯片复位后执行Reset_Handler
跳转到__main（不是用户的main函数）
__main调用__scatterload执行搬运：
- 将RW数据从Flash复制到RAM
- 将需要在RAM运行的代码段复制到指定位置
- 清零ZI数据区
跳转到用户main函数

这个过程中，__scatterload的行为完全由分散加载文件(.sct)指导。

2. 分散加载文件语法详解

2.1 基本结构剖析

一个完整的分散加载文件包含若干加载域，每个加载域又包含若干执行域。基本结构如下：

scatter复制LR_1 0x08000000 0x00100000 {   // 加载域定义
    ER_1 0x08000000 0x000800 { // 执行域1
        *.o (RESET, +First)
        *(InRoot$$Sections)
    }
    
    ER_2 0x20000000 0x000100 {
        *.o (RAM_CODE)
    }
}

关键元素说明：

LR_x：加载域名称，通常从Flash开始
- 起始地址：如0x08000000
- 大小：如0x00100000(1MB)
ER_x：执行域定义
- 执行地址：运行时内存位置
- 属性：如FIXED表示装载=执行
- 大小：该区域容量限制
输入选择器：决定哪些内容放入该域
- *.o (section_name)：匹配特定段
- .ANY (+RO)：匹配任意只读内容

2.2 特殊区域处理

2.2.1 根区域(Root Region)

必须包含的特殊执行域，存放启动关键代码：

scatter复制ER_ROOT 0x08000000 0x000800 {
    *.o (RESET, +First)      // 中断向量表
    *(InRoot$$Sections)      // 库初始化代码
}

注意：RESET段必须放在Flash起始处，且使用+First保证优先放置。

2.2.2 固定地址区域

使用FIXED属性定义固定执行地址：

scatter复制ER_FLASH_API 0x0800F000 FIXED 0x1000 {
    *.o (FLASH_API)
}

这会将FLASH_API段的内容固定在0x0800F000执行，且装载地址相同。

2.2.3 RAM执行区域

需要搬运到RAM的代码区域：

scatter复制ER_RAM_CODE 0x20000000 0x2000 {
    *.o (RAM_CODE)
}

这类区域不加FIXED，表示：

装载地址：由链接器决定（通常在Flash）
执行地址：0x20000000（RAM）
启动时自动搬运

2.3 输入段匹配规则

2.3.1 基础匹配模式

精确匹配：*.o (section_name)
- 匹配特定目标文件的特定段
- 例：main.o (.text)
通配匹配：.ANY (+attr)
- +RO：只读代码/数据
- +RW：可读写数据
- +ZI：未初始化数据
- +XO：仅执行代码

2.3.2 优先级规则

链接器按顺序处理规则，因此应该：

先写特定段规则
最后写.ANY兜底规则

错误示例：

scatter复制ER_1 0x08000000 {
    .ANY (+RO)  // 会捕获所有代码
    *.o (SPECIAL) // 永远不会生效
}

正确顺序：

scatter复制ER_1 0x08000000 {
    *.o (SPECIAL) // 优先匹配
    .ANY (+RO)    // 剩余代码
}

3. 实战：双区域RAM运行配置

3.1 硬件环境

以STM32F407为例，内存资源：

Flash：0x08000000-0x080FFFFF (1MB)
SRAM1：0x20000000-0x2001BFFF (112KB)
SRAM2：0x2001C000-0x2001FFFF (16KB)

目标：

将关键算法func1放在SRAM1(0x20000000)
将通信协议func2放在SRAM2(0x2001C000)
其余代码在Flash运行

3.2 代码标记

在C源文件中使用section属性：

c复制// 在SRAM1运行的函数
__attribute__((section("RAM1_CODE"), noinline))
void func1(void) {
    // 关键算法实现
}

// 在SRAM2运行的函数 
__attribute__((section("RAM2_CODE"), noinline)) 
void func2(void) {
    // 通信协议处理
}

注意：noinline防止编译器内联优化，确保函数独立存在

3.3 分散加载配置

对应的scatter文件内容：

scatter复制LR_1 0x08000000 0x00100000 {
    // 根区域
    ER_ROOT 0x08000000 0x000800 {
        *.o (RESET, +First)
        *(InRoot$$Sections)
    }
    
    // SRAM1代码区
    ER_RAM1_CODE 0x20000000 0x10000 {
        *.o (RAM1_CODE)
    }
    
    // SRAM2代码区
    ER_RAM2_CODE 0x2001C000 0x04000 {
        *.o (RAM2_CODE)
    }
    
    // Flash主程序区
    ER_FLASH 0x08000800 FIXED 0x0F8000 {
        .ANY (+RO)
    }
    
    // 数据区
    RW_IRAM1 0x20004000 0x18000 {
        .ANY (+RW +ZI)
    }
}

3.4 关键点说明

地址对齐：确保各区域起始地址和大小符合芯片内存布局
大小预留：为每个区域预留足够空间，可通过map文件检查
FIXED使用：Flash区域使用FIXED避免地址冲突
数据区隔离：RAM代码区与数据区地址不重叠

4. 固定地址接口实现

4.1 应用场景

固定Flash地址特别适合以下需求：

Bootloader跳转接口：

c复制// 固定在0x0800F000
__attribute__((section("BOOT_API")))
void JumpToApp(uint32_t appAddr) {
    // 跳转逻辑
}

固件标识信息：

c复制// 固定在0x0800FF00
__attribute__((section("FW_INFO")))
const struct {
    char version[16];
    uint32_t crc;
} firmware_info = {"V1.2.3", 0x12345678};

4.2 配置实例

实现0x0800F000固定接口：

scatter复制LR_1 0x08000000 {
    // ...其他区域...
    
    ER_BOOT_API 0x0800F000 FIXED 0x1000 {
        *.o (BOOT_API)
    }
    
    ER_FLASH_MAIN 0x08001000 FIXED 0x0E000 {
        .ANY (+RO)
    }
}

重要：主Flash区域必须从0x08001000开始，为Boot API预留空间

4.3 验证方法

查看map文件，确认符号地址：

code复制BOOT_API           0x0800f000   Section   16  jump.o(BOOT_API)

使用调试器读取内存：

bash复制# 使用J-Link Commander
mem32 0x0800F000 4

反汇编验证：

bash复制fromelf -c -a image.axf > disasm.txt

5. 高级技巧与问题排查

5.1 多文件section管理

当多个文件需要共用section时，推荐使用头文件统一定义：

c复制// mem_layout.h
#pragma once

#define RAM1_FUNC __attribute__((section("RAM1_CODE"), noinline))
#define RAM2_FUNC __attribute__((section("RAM2_CODE"), noinline))
#define FLASH_API __attribute__((section("FLASH_API"), noinline))

5.2 函数调用关系处理

RAM函数调用其他函数时需注意：

被调用的子函数也需放在RAM：

c复制RAM1_FUNC void helper() { /*...*/ }

RAM1_FUNC void main_func() {
    helper(); // 必须也在RAM
}

或者使用绝对地址调用：

c复制typedef void (*func_t)(void);
#define FLASH_FUNC_ADDR 0x08001000

RAM1_FUNC void call_flash_func() {
    func_t func = (func_t)(FLASH_FUNC_ADDR | 1); // Thumb模式
    func();
}

5.3 常见问题排查

问题1：函数没有按预期放置

现象：map文件中函数不在指定区域

排查步骤：

检查section拼写是否一致
确认没有内联优化（使用noinline）
检查.ANY规则是否提前捕获了函数

问题2：程序运行崩溃

可能原因：

RAM区域大小不足
地址重叠冲突
搬运未完成就调用RAM函数

验证方法：

检查map文件各区域大小
在启动代码__main前后设置断点
查看RAM区域内容是否已搬运

问题3：性能未提升

可能原因：

频繁调用的子函数仍在Flash
缓存未正确配置
内存访问冲突

优化建议：

使用--info=inline查看内联情况
检查分支预测和缓存配置
分析函数调用热路径

6. 工程实践建议

6.1 版本兼容性处理

不同Keil版本对分散加载的支持略有差异，建议：

在工程文档中记录MDK版本

对复杂配置添加版本检查：

c复制#if __ARMCC_VERSION < 6000000
#error "Requires ARM Compiler 6 or later"
#endif

6.2 自动化验证脚本

创建脚本自动检查关键地址：

python复制# check_addr.py
import re

with open('project.map') as f:
    map_content = f.read()
    
def check_symbol(symbol, expected_addr):
    match = re.search(fr'{symbol}\s+(0x[0-9a-f]+)', map_content)
    if match:
        addr = match.group(1)
        assert addr == expected_addr, \
            f"{symbol} at {addr}, expected {expected_addr}"
    else:
        raise Exception(f"{symbol} not found")

check_symbol("func1", "0x20000000")
check_symbol("func2", "0x2001c000")

6.3 内存布局可视化

使用Graphviz生成内存布局图：

dot复制digraph memory {
    rankdir=LR;
    node [shape=record];
    
    flash [label="Flash|0x08000000|{向量表|启动代码}|...|{API\n0x0800F000}|..."];
    sram1 [label="SRAM1|0x20000000|{func1}|...|数据区"];
    sram2 [label="SRAM2|0x2001C000|{func2}"];
    
    flash -> sram1 [label="搬运"];
    flash -> sram2 [label="搬运"];
}

7. 扩展应用场景

7.1 双Bank Flash切换

在支持双Bank Flash的芯片上（如STM32H7），可以实现无缝固件更新：

scatter复制LR_1 0x08000000 0x00200000 {
    // Bank1运行程序
    ER_BANK1 0x08000000 0x00100000 FIXED {
        *.o (RESET, +First)
        *(InRoot$$Sections)
        .ANY (+RO)
    }
    
    // Bank2下载区
    ER_BANK2 0x08100000 0x00100000 FIXED {
        *.o (UPDATE_TARGET)
    }
}

7.2 多核系统内存分配

对于多核Cortex-M（如STM32H7双核）：

scatter复制// CM7核
LR_CM7 0x08000000 {
    ER_CM7_FLASH 0x08000000 FIXED {
        *.o (RESET, +First)
        cm7_*.o (+RO)
    }
    
    ER_CM7_RAM 0x20000000 {
        cm7_*.o (+RW +ZI)
    }
}

// CM4核 
LR_CM4 0x08100000 {
    ER_CM4_FLASH 0x08100000 FIXED {
        cm4_*.o (+RO)
    }
    
    ER_CM4_RAM 0x10000000 {
        cm4_*.o (+RW +ZI)
    }
}

7.3 安全隔离实现

通过分散加载实现TEE（可信执行环境）：

scatter复制LR_1 0x08000000 {
    // 安全区域
    ER_SECURE 0x0C000000 FIXED {
        secure_*.o (+RO)
    }
    
    // 非安全区域
    ER_NONSECURE 0x08000000 {
        *.o (RESET, +First)
        app_*.o (+RO)
    }
    
    // 安全RAM
    ER_SECURE_RAM 0x30000000 {
        secure_*.o (+RW +ZI)
    }
    
    // 非安全RAM
    ER_NS_RAM 0x20000000 {
        app_*.o (+RW +ZI)
    }
}

在实际项目中，分散加载文件的复杂度往往随着系统需求增长而增加。建议采用模块化方式管理，例如：

基础内存布局：定义芯片固有内存区域
应用模块分区：按功能划分独立section
安全隔离规则：添加访问权限控制
版本特定配置：通过条件编译实现

通过合理使用分散加载机制，开发者可以充分发挥Cortex-M系列芯片的性能潜力，实现高效可靠的内存布局方案。