AArch64虚拟内存管理：两阶段地址转换与页表机制详解

laforet

1. AArch64虚拟内存管理概述

虚拟内存是现代计算机体系结构的核心机制之一，它通过地址转换将程序使用的虚拟地址（VA）映射到实际的物理地址（PA）。AArch64架构作为ARMv8和ARMv9指令集的重要组成部分，其虚拟内存管理系统设计精巧且功能强大。

在AArch64中，虚拟地址到物理地址的转换通常涉及两个阶段：

阶段1（Stage 1）：将VA转换为中间物理地址（IPA），由MMU完成
阶段2（Stage 2）：将IPA转换为最终PA，由SMMU完成

这种两阶段转换机制为虚拟化提供了硬件支持，允许hypervisor管理多个操作系统的内存空间。每个阶段都使用独立的多级页表结构，支持4KB、16KB和64KB等多种页大小配置。

2. 地址转换核心机制解析

2.1 页表基本结构

AArch64采用多级页表结构实现地址转换，页表项主要分为三种类型：

表描述符（Table Descriptor）
- 指向下一级页表的基地址
- 包含访问权限和内存属性等控制信息
- 典型位字段：
```
code复制[63:12]：下一级页表基地址
[11:2]：保留
[1]：类型标识（1表示有效项）
[0]：有效位
```

块描述符（Block Descriptor）

直接映射大块内存区域（如1GB、2MB等）
包含输出地址和属性信息

典型位字段：

code复制[47:30]：输出地址的高位
[29:12]：内存属性控制
[11:2]：保留
[1]：类型标识（0表示块描述符）
[0]：有效位

页描述符（Page Descriptor）
- 映射单个页大小的内存区域
- 结构与块描述符类似但粒度更细

2.2 地址转换流程

地址转换的核心流程在伪代码函数AArch64_TranslateAddress中体现：

c复制func AArch64_TranslateAddress(va, accdesc, aligned, size) {
    if (特殊计数器采样中) {
        启动性能计数器();
    }
    
    // 完整地址转换
    var result = AArch64_FullTranslate(va, size, accdesc, aligned);
    
    if (!IsFault(result) && 不是指令获取) {
        // 检查调试相关权限
        result.fault = AArch64_CheckDebug(va, accdesc, size);
    }
    
    if (支持RME扩展) {
        // 执行颗粒保护检查
        result.fault.gpcf = GranuleProtectionCheck(result, accdesc);
    }
    
    if (特殊计数器采样中) {
        停止性能计数器();
    }
    
    // 更新虚拟地址信息
    result.vaddress = ZeroExtend(va);
    return result;
}

3. 页表遍历深度解析

3.1 阶段1页表遍历

阶段1遍历的核心函数是AArch64_S1Walk，其主要流程如下：

初始化遍历状态

c复制var walkstate = AArch64_S1InitialTTWState(walkparams, va, regime, ss);

层级遍历循环

c复制repeat {
    // 获取当前层级的页表项
    (fault, descriptor) = FetchDescriptor(ee, walkaddress, walkaccess, fault);
    
    // 解析描述符类型
    desctype = AArch64_DecodeDescriptorType(descriptor, walkparams);
    
    switch(desctype) {
        case Table:
            // 准备下一级遍历
            walkstate = AArch64_S1NextWalkStateTable(...);
            break;
        case Leaf:
            // 找到最终映射
            walkstate = AArch64_S1NextWalkStateLeaf(...);
            break;
        case Invalid:
            // 触发页错误
            fault.statuscode = Fault_Translation;
            break;
    }
} until 找到最终映射或出错;

后处理检查
- 连续位检查
- 地址范围检查
- 访问标志检查

3.2 阶段2页表遍历

阶段2遍历与阶段1类似，但有一些关键差异：

初始化不同

c复制if (安全状态) {
    walkstate = AArch64_SS2InitialTTWState(walkparams, ipaspace);
} else {
    walkstate = AArch64_S2InitialTTWState(ss, walkparams);
}

属性处理差异
- 阶段2使用独立的属性编码
- 支持特殊的FWB（强制写回）属性

输出地址空间处理

c复制if (安全状态) {
    baseaddress.paspace = AArch64_SS2OutputPASpace(walkparams, ipaspace);
}

4. 权限与属性检查机制

4.1 权限检查流程

权限检查贯穿整个地址转换过程，主要包括：

访问标志（AF）检查

c复制if (descriptor[10] == '0' && walkparams.ha == '0') {
    fault.statuscode = Fault_AccessFlag;
}

权限位检查
- AP[2:1]：访问权限控制位
- PXN/UXN：执行权限控制
- DBM：脏位监控

特殊权限检查

c复制if (支持颗粒保护) {
    result.fault.gpcf = GranuleProtectionCheck(result, accdesc);
}

4.2 内存属性处理

内存属性控制内存访问行为，主要包括：

属性索引解析

c复制if (walkparams.aie == '1') {
    attrindx = descriptor[5:2];  // 扩展属性索引
} else {
    attrindx = '0'::descriptor[4:2];
}

MAIR寄存器映射

c复制attr = AArch64_MAIRAttr(UInt(attrindx), walkparams.mair2, walkparams.mair);

最终属性解码

c复制memattrs = S1DecodeMemAttrs(attr, sh, s1aarch64, walkparams, accdesc.acctype);

5. 特殊功能支持

5.1 标签内存支持

AArch64支持内存标签扩展（MTE），相关转换函数：

c复制func AArch64_TranslateTagAddress(va, accdesc_in, aligned, size) {
    accdesc.datafortagaccess = TRUE;
    daddrdesc = AArch64_TranslateAddress(va, accdesc, aligned, size);
    
    if (daddrdesc.memattrs.tags == MemTag_AllocationTagged) {
        tva = S1VirtualTagAddress(va, accdesc.el, accdesc.ss);
        taddrdesc = AArch64_TranslateAddress(tva, taccdesc, taligned, tsize);
        return (daddrdesc.memattrs.tags, taddrdesc);
    }
}

5.2 连续位优化

连续位（Contiguous bit）支持大块内存映射优化：

c复制func AArch64_ContiguousBit(tgx, d128, level, descriptor) {
    if (特殊配置要求忽略连续位) {
        return '0';
    }
    
    // 不同页大小配置下的连续位位置
    if (d128 == '1') {
        return descriptor[111];
    } else {
        return descriptor[52];
    }
}

5.3 颗粒保护检查

RME扩展引入的颗粒保护检查：

c复制if (IsFeatureImplemented(FEAT_RME)) {
    result.fault.gpcf = GranuleProtectionCheck(result, accdesc);
    if (result.fault.gpcf.gpf != GPCF_None) {
        result.fault.statuscode = Fault_GPCFOnOutput;
    }
}

6. 性能优化与实现考量

6.1 TLB优化策略

ASID和VMID使用
- 地址空间标识符减少TLB刷新
- 虚拟机标识符支持虚拟化环境

预取优化

c复制if (SPESampleInFlight) {
    SPEStartCounter(SPECounterPosTranslationLatency);
}

6.2 层级选择策略

起始层级由地址范围和配置决定：

c复制func AArch64_S1StartLevel(walkparams) {
    if (VARange == LOWER && walkparams.t0sz > walkparams.t1sz) {
        return 0;  // 从第0级开始
    } else {
        return 1;  // 从第1级开始
    }
}

6.3 混合页大小支持

系统可同时支持不同大小的页：

c复制func AArch64_BlockDescSupported(d128, ds, tgx, level) {
    case tgx of
        when TGx_4KB: 
            return ((level == 0 && (ds == '1' || d128 == '1')) || level == 1 || level == 2);
        when TGx_16KB:
            return ((level == 1 && (ds == '1' || d128 == '1')) || level == 2);
        when TGx_64KB:
            return ((level == 1 && (d128 == '1' || PA最大位数 >= 52)) || level == 2);
    end;
}