ARM链接器(armlink)核心概念与内存映射实战

云山雾村

1. ARM链接器核心概念解析

在嵌入式开发领域，链接器作为编译工具链的关键环节，承担着将分散编译的目标文件整合为可执行映像的重要职责。ARM链接器(armlink)专为ARM架构设计，其独特之处在于提供了精细化的内存控制能力，这对于资源受限的嵌入式系统尤为重要。

链接过程本质上解决两个核心问题：符号解析（确定每个符号的最终地址）和重定位（修正代码中的引用地址）。armlink在此基础上进一步扩展，通过区域(Region)、节(Section)和区(Area)的三级结构组织内存空间：

区域(Region)：最高层级的连续内存块，分为加载域(Load Region)和执行域(Execution Region)。一个加载域可包含多个执行域，但执行域不能跨加载域存在。
节(Section)：具有相同属性的区(Area)的集合，例如RO(只读)、RW(读写)、ZI(零初始化)三种基本类型。在简单映像中，这三种节默认按顺序排列。
区(Area)：最小的可定位单元，对应源代码中通过AREA伪指令定义的代码或数据块。例如中断向量表、函数实现或全局变量都位于特定区中。

这种层级结构为内存映射提供了灵活的控制粒度。开发者既可以通过简单的命令行参数（如-ro-base）快速配置基础布局，也能借助分散加载文件(scatter file)实现多区域复杂映射，满足ROM固化、RAM运行等典型嵌入式场景需求。

2. armlink命令行参数深度解析

2.1 基础语法结构

armlink的标准调用格式如下：

bash复制armlink [选项] 输入文件列表

其中核心选项可分为五类：

输出控制：
- -output <file>：指定输出文件名
- -elf/-aif/-bin：选择输出格式（ELF为默认格式）
- -map：生成内存映射报告文件
调试信息：
- -debug：保留所有调试信息（默认）
- -nodebug：移除调试信息以减小体积
内存布局：
- -ro-base <address>：设置RO节执行地址
- -rw-base <address>：设置RW节执行地址
- -scatter <file>：指定分散加载描述文件
符号处理：
- -entry <address>：设置入口点
- -first <area>：强制某区位于节起始位置
- -unresolved <symbol>：处理未定义符号
信息输出：
- -info sizes：显示代码/数据尺寸统计
- -symbols <file>：输出符号表
- -xref：生成交叉引用报告

2.2 关键参数详解

2.2.1 内存基址配置

-ro-base和-rw-base是最常用的内存控制参数：

bash复制armlink -ro-base 0x8000 -rw-base 0x20000000 ...

-ro-base：设置只读区域（通常包含代码和常量）的执行地址，同时也是其加载地址。在ROM系统中，此地址对应ROM的实际物理地址。
-rw-base：设置读写区域（通常包含已初始化的全局变量）的执行地址。其加载地址默认紧随RO区域之后，运行时需由启动代码将其拷贝到指定RAM地址。

注意：当仅指定-ro-base时，链接器生成单区域映像，所有内容（RO+RW+ZI）在运行时位于连续地址空间。这在纯RAM调试时常用，但不适合ROM固化场景。

2.2.2 入口点设置

入口点指定程序开始执行的第一条指令位置，有两种指定方式：

bash复制# 绝对地址形式
-entry 0x8000

# 符号偏移形式（更常用）
-entry 8+startup(C$$code)

后一种形式中：

startup：目标文件名
C$$code：区名（ARM标准运行时使用此名称）
8：偏移量（常用于跳过向量表）

2.2.3 特殊区定位

嵌入式系统常需要精确控制特定区的位置：

bash复制# 将中断向量表放在起始位置
-first vectors.o(vectors)

# 将校验和区放在末尾
-last checksum.o(checksum)

这些定位需求在分散加载文件中可通过+FIRST和+LAST属性实现更灵活的控制。

3. 分散加载(Scatter Loading)高级配置

3.1 分散加载文件结构

当默认的两区域（RO+RW）模型无法满足需求时，需使用分散加载文件。典型结构如下：

code复制ROM_LOAD 0x0000 0x4000   ; 加载域定义
{
    ROM_EXEC 0x0000 0x4000 ; 执行域1
    {
        startup.o (vectors, +FIRST) ; 向量表必须位于0地址
        * (+RO)              ; 其余只读内容
    }
    
    RAM_EXEC 0x10000000 0x2000 ; 执行域2
    {
        * (+RW, +ZI)        ; 所有读写数据
    }
    
    STACKS 0x20000000 UNINIT ; 未初始化区域
    {
        stack.o (+ZI)       ; 堆栈区
    }
}

3.2 关键语法元素

加载域定义：
```
text复制名称 基址 [最大长度]
```
- 最大长度可选，超限会报错
- 多文件输出格式中，名称用作文件名前缀
执行域定义：
```
text复制名称 基址 [属性]
{
    模块选择模式 (区选择器)
}
```
基址可指定为：
- 绝对地址：0x1000
- 相对偏移：+0x200（前一个域结束后的偏移）
区选择器：
- +RO/+RW/+ZI：按属性选择
- *(.text)：按名称通配
- startup.o (vectors)：精确匹配

3.3 典型应用场景

场景1：多存储介质系统

text复制FLASH 0x08000000 0x100000
{
    FLASH_EXEC 0x08000000
    {
        *.o (RESET, +FIRST)
        * (+RO)
    }
    
    SRAM 0x20000000 0x20000
    {
        * (+RW)
        * (+ZI)
    }
    
    EEPROM 0x4000 UNINIT
    {
        eeprom.o (+ZI)
    }
}

此配置将：

代码固化在FLASH（从0x08000000执行）
变量放在SRAM
EEPROM模拟区单独管理

场景2：内存映射外设

text复制LOAD_REG 0x0000
{
    VECTORS 0x0000
    {
        vectors.o (+RO)
    }
    
    CODE 0x8000
    {
        * (+RO-CODE)
    }
    
    PERIPH 0x40000000 UNINIT
    {
        peripherals.o (+RW)
    }
}

这种布局确保外设寄存器区（如0x40000000开始的GPIO）不会被初始化代码覆盖。

4. 内存映射实战技巧

4.1 启动代码适配

使用分散加载时，启动代码需配合完成：

c复制/* 分散加载生成的符号声明 */
extern unsigned char Image$$ROM_EXEC$$Base[];
extern unsigned char Image$$RAM_EXEC$$RW$$Base[];
extern unsigned char Image$$RAM_EXEC$$ZI$$Base[];
extern unsigned char Image$$RAM_EXEC$$ZI$$Limit[];

void __main(void)
{
    /* 拷贝RW数据到RAM */
    unsigned int rw_size = (unsigned int)Image$$RAM_EXEC$$ZI$$Base - 
                          (unsigned int)Image$$RAM_EXEC$$RW$$Base;
    memcpy(Image$$RAM_EXEC$$RW$$Base, 
           Image$$ROM_EXEC$$RW$$Base, 
           rw_size);
           
    /* 清零ZI区域 */
    unsigned int zi_size = (unsigned int)Image$$RAM_EXEC$$ZI$$Limit - 
                         (unsigned int)Image$$RAM_EXEC$$ZI$$Base;
    memset(Image$$RAM_EXEC$$ZI$$Base, 0, zi_size);
}

4.2 常见问题排查

地址对齐错误：

错误：Error: L6220E: Execution region RAM_EXEC overlaps with ...

解决方案：
- 检查所有域基址是否4字节对齐
- 在分散文件中添加ALIGN 4修饰
区重复包含：

现象：同一区被多个执行域引用

解决方法：
- 使用-remove移除未引用区
- 在分散文件中精确指定模块路径
ZI区未初始化：

现象：全局变量值随机

检查点：
- 确认启动代码正确清零ZI区
- 检查分散文件中ZI区属性标记

4.3 性能优化技巧

热代码段放置：
```
text复制ITCM 0x00000000 0x10000
{
    critical.o (+RO-CODE) ; 关键性能代码
}
```
将性能敏感代码放入紧耦合内存(TCM)提升执行速度。

数据缓存友好布局：

text复制RAM 0x20000000
{
    .data 0x20000000
    {
        * (+RW-DATA)
    }
    
    .bss ALIGN 32 ; 按缓存行对齐
    {
        * (+ZI)
    }
}

对齐数据减少缓存抖动。

压缩RO段：
```
bash复制fromelf --bin --output=image.bin --compress image.axf
```
使用fromELF工具压缩映像减小存储空间。

5. 工程实践建议

版本兼容性：
- 新版工具链默认只生成ELF格式
- 遗留项目使用-aif/-bin时需通过fromELF转换
调试支持：
```
bash复制armlink --debug --map --symbols=sym.txt ...
```
保留调试信息时，建议同时生成映射文件和符号表

自动化集成：

makefile复制LDFLAGS := --scatter=scatter.scat \
           --info=sizes,totals \
           --list=map.txt
           
%.axf: %.o
    armlink $(LDFLAGS) $^ -o $@

在构建系统中封装常用链接选项