DTI-TBU协议寄存器访问与缓存机制详解

不胖的羊

1. DTI-TBU协议中的寄存器访问机制解析

在计算机体系结构中，寄存器访问是最基础也是最关键的操作之一。DTI-TBU协议定义了一套完整的寄存器访问机制，用于实现硬件模块间的信息交互与控制。这套机制在设计上兼顾了灵活性和安全性，是理解现代SoC设计中硬件加速器通信的基础。

1.1 寄存器空间架构设计

DTI主设备（DTI master）提供了"实现定义"（IMPLEMENTATION DEFINED）的寄存器，这些寄存器通过特定的消息组进行访问。协议明确规定了几项关键设计原则：

位宽限制：仅支持32位寄存器访问。如果系统实现了64位寄存器，必须通过多个32位访问来完成更新。这种设计主要考虑到与旧系统的兼容性，同时也简化了硬件实现。在实际操作中，对64位寄存器的写入需要特别注意原子性问题，通常建议采用锁机制确保高低32位的写入连续性。
地址空间分配：DTI主设备可以在安全状态（Secure）和非安全状态（Non-secure）下各实现最多128KB的寄存器空间。这个空间被划分为两个64KB的页面：
- 上部64KB页面（地址较高部分）：专用于存放SMMUv3性能监控计数器组寄存器文件的Page 1
- 下部64KB页面（地址较低部分）：用于所有其他寄存器

这种划分方式使得性能监控相关的寄存器可以集中管理，同时也为其他功能寄存器留出了充足的空间。在系统初始化时，软件需要根据这个映射关系正确配置寄存器访问路径。

1.2 寄存器访问消息类型

DTI-TBU协议定义了五种核心消息类型来实现可靠的寄存器访问：

1.2.1 DTI_TBU_REG_WRITE（寄存器写入请求）

这是由DTI从设备（DTI slave）发起的写寄存器请求。消息格式包含以下关键字段：

markdown复制| 比特位   | 字段名称        | 描述                                                                 |
|----------|-----------------|----------------------------------------------------------------------|
| [63:32]  | DATA            | 要写入的数据                                                         |
| 23       | NS              | 安全等级指示：0=安全(Secure)，1=非安全(Non-secure)                   |
| [20:6]   | ADDR            | 寄存器地址，对未实现寄存器的写入必须被忽略                            |
| [3:0]    | SLV_MSG_TYPE    | 消息类型标识，固定为0110表示DTI_TBU_REG_WRITE                        |

重要提示：从设备在发起写请求前必须确保没有未完成的寄存器读写操作，否则可能导致状态不一致。在实际硬件设计中，通常需要实现写请求队列和状态机来管理这一约束。

1.2.2 DTI_TBU_REG_WACK（写入确认）

这是主设备对写请求的确认响应，表示写入操作已生效。这个消息非常简单，主要包含消息类型标识（固定为0110表示DTI_TBU_REG_WACK）。从设备只有在收到这个确认后，才能认为写入操作真正完成。

1.2.3 DTI_TBU_REG_READ（寄存器读取请求）

从设备发起的读寄存器请求，格式与写请求类似但有以下区别：

markdown复制| 比特位   | 字段名称        | 描述                                                                 |
|----------|-----------------|----------------------------------------------------------------------|
| 23       | NS              | 安全等级指示                                                         |
| [20:6]   | ADDR            | 寄存器地址，对未实现寄存器的读取必须返回0且无其他副作用               |
| [3:0]    | SLV_MSG_TYPE    | 消息类型标识，固定为0111表示DTI_TBU_REG_READ                         |

与写操作类似，从设备在发起读请求前也必须确保没有未完成的读写操作。这是防止状态混乱的重要约束条件。

1.2.4 DTI_TBU_REG_RDATA（读取数据响应）

主设备返回的读取数据响应，包含以下关键字段：

markdown复制| 比特位   | 字段名称        | 描述                                                                 |
|----------|-----------------|----------------------------------------------------------------------|
| [63:32]  | DATA            | 读取到的寄存器数据                                                   |
| [3:0]    | MST_MSG_TYPE    | 消息类型标识，固定为0111表示DTI_TBU_REG_RDATA                        |

1.2.5 寄存器访问中的死锁避免

协议特别强调了死锁避免机制：DTI主设备必须能够在不依赖下游事务完成或其他DTI事务进展的情况下响应寄存器访问消息。这意味着：

寄存器访问路径必须与常规数据路径分离
不能因为等待其他资源（如总线带宽、缓冲区空间）而阻塞寄存器访问
需要独立的流控机制确保及时响应

在实际芯片设计中，这通常通过以下方式实现：

为寄存器访问分配专用硬件资源
实现优先级仲裁机制
确保寄存器访问路径不依赖可能被阻塞的共享资源

2. DTI-TBU缓存模型深度解析

缓存模型是DTI-TBU协议中最复杂的部分之一，它直接影响到系统性能和一致性管理。该模型采用分层设计，通过多级缓存优化地址翻译效率。

2.1 缓存层次结构与查找流程

TBU（Translation Buffer Unit）实现了三级缓存结构，查找顺序严格固定：

全局条目缓存（Global entry cache）：用于翻译全局禁用的情况
配置缓存（Configuration cache）：存储影响特定上下文所有事务的翻译信息
TLB（Translation Lookaside Buffer）：存储页表翻译结果

这种分层设计允许快速判断翻译是否全局禁用，然后逐步细化查找范围。协议允许实现上的灵活性——可以物理上合并多个缓存，只要满足以下条件：

逻辑查找顺序保持不变
无效化操作仍按描述的顺序生效

每个缓存条目都包含三个关键部分：

Tag：用于与后续事务或无效化操作匹配
Scope：控制需要匹配的tag部分范围
Data：用于实际事务翻译的数据

2.2 全局条目缓存详解

全局条目缓存是最顶层的缓存，最多包含三种条目：

安全事务的GlobalBypass或GlobalDisabled条目
非ATS翻译的非安全事务的GlobalBypass或GlobalDisabled条目
ATS翻译的非安全事务的GlobalBypass或GlobalDisabled条目

这些条目通过DTI_TBU_TRANS_REQ.SEC_SID和DTI_TBU_TRANS_REQ.ATS字段组合索引。

2.2.1 GlobalBypass缓存条目

当翻译被全局绕过时使用的条目，包含以下字段：

Tag字段：

SEC_SID：安全状态和流ID
ATS：是否ATS翻译

Scope字段：

TRANS_RNG：翻译范围

Data字段：

包括NSOVR、ALLOCCFG、NS、PRIVCFG等多个配置字段

2.2.2 GlobalDisabled缓存条目

当翻译被全局禁用时使用的条目，结构更简单：

Tag字段：

SEC_SID
ATS

Scope和Data字段：无

当事务匹配GlobalDisabled条目时，事务必须被中止。这种设计为系统提供了全局禁用翻译的快速路径。

2.3 配置缓存工作机制

配置缓存是连接流上下文和TLB的关键桥梁，主要功能包括：

将输入的翻译上下文字段映射到页表使用的TLB标签
存储影响特定上下文所有事务的翻译信息
包含StreamDisabled条目（当某些流的翻译被禁用时）

配置缓存的条目结构如下：

Tag字段：

SEC_SID、ATST、SID、SSV、SSID等

Scope字段：

CONT（连续性）
ALLOW_NSX（允许非安全执行）

Data字段：

包括BYPASS、STRW/BP_TYPE、DRE、DCP等大量配置信息

特别值得注意的是BYPASS字段，当该字段为1时表示这是StreamBypassNoSSV条目，即该流的翻译被绕过。

2.4 TLB设计与权限检查

TLB（Translation Lookaside Buffer）是缓存模型的最后一级，也是性能最关键的部分。它使用配置缓存提供的信息来查找保存的指令翻译。

TLB条目包含：

Tag字段：

ATST、SEC_SID、IA（输入地址）、STRW、ASET、VMID、ASID等

Scope字段：

TBI（Tagged Block Identifier）
GLOBAL（是否全局）
TRANS_RNG（翻译范围）
多种权限控制字段（ALLOW_UR、ALLOW_PW等）

Data字段：

NS、OA（输出地址）、ATTR、SH等

TLB查找的特殊之处在于权限检查：即使TLB命中，TBU也必须确保存储的翻译满足新事务的权限要求。如果权限检查失败，则必须请求新的翻译。这种设计确保了即使缓存中存在翻译，也不会绕过权限检查。

3. DTI-ATS协议关键消息解析

ATS（Address Translation Services）是现代I/O设备高效访问内存的关键技术。DTI-ATS协议定义了完整的消息组来实现PCIe设备与SMMU之间的地址翻译服务。

3.1 连接与断开消息组

ATS通道的状态管理通过连接与断开消息组实现，这是所有ATS操作的基础。

3.1.1 DTI_ATS_CONDIS_REQ（连接/断开请求）

主设备发起的连接状态变更请求，关键字段包括：

markdown复制| 比特位   | 字段名称        | 描述                                                                 |
|----------|-----------------|----------------------------------------------------------------------|
| [23:20]  | TOK_INV_GNT     | 授予的无效化令牌数（值+1）                                           |
| [19:12]  | TOK_TRANS_REQ   | 连接时为请求的翻译令牌数，断开时为返回的翻译令牌数                     |
| [11:8]   | VERSION         | 请求的协议版本（目前仅支持DTI-ATSv1）                                 |
| 4        | STATE           | 0=断开请求，1=连接请求                                               |
| [3:0]    | MST_MSG_TYPE    | 消息类型标识，固定为0000                                             |

断开请求有严格条件：通道必须处于CONNECTED状态，且没有未完成的翻译请求、页面请求，所有下游事务必须完成，所有ATC必须禁用并无效化。

3.1.2 DTI_ATS_CONDIS_ACK（连接/断开确认）

从设备对连接状态变更请求的响应，关键字段包括：

markdown复制| 比特位   | 字段名称        | 描述                                                                 |
|----------|-----------------|----------------------------------------------------------------------|
| [24:21]  | OAS             | 输出地址大小（32位到52位）                                           |
| 20       | SUP_PRI         | 是否支持PCIe ATS PRI消息                                             |
| [19:12]  | TOK_TRANS_GNT   | 授予的预分配翻译令牌数（值+1）                                       |
| [11:8]   | VERSION         | 授予的协议版本                                                       |
| 4        | STATE           | 新连接状态（0=DISCONNECTED，1=CONNECTED）                            |
| [3:0]    | SLV_MSG_TYPE    | 消息类型标识，固定为0000                                             |

OAS字段特别重要，它定义了翻译后地址的最大位数，直接影响系统能支持的内存大小。

3.2 翻译请求消息组

这是ATS协议最核心的部分，实现了PCIe设备的地址翻译请求流程。

3.2.1 DTI_ATS_TRANS_REQ（翻译请求）

主设备发起的翻译请求，关键字段包括：

markdown复制| 比特位   | 字段名称        | 描述                                                                 |
|----------|-----------------|----------------------------------------------------------------------|
| [159:108]| IA              | 输入地址（IA[63:12]）                                               |
| [95:76]  | SSID            | 子流ID（当SSV=1时有效）                                             |
| [63:32]  | SID             | 流ID                                                                 |
| 21       | SSV             | 子流ID是否有效                                                       |
| 19       | nW              | 是否只读访问（0=读写，1=只读）                                       |
| 18       | InD             | 是否指令访问                                                         |
| 17       | PnU             | 权限级别（0=非特权，1=特权）                                         |
| [15:8]   | TRANSLATION_ID  | 翻译ID（必须唯一）                                                   |
| [7:4]    | QOS             | 服务质量优先级                                                       |
| [3:0]    | MST_MSG_TYPE    | 消息类型标识，固定为0010                                             |

这个请求将输入地址（IA）和流上下文信息发送给TCU（Translation Control Unit）进行翻译。

3.2.2 DTI_ATS_TRANS_RESP（翻译响应）

从设备返回的翻译结果，关键字段包括：

markdown复制| 比特位   | 字段名称        | 描述                                                                 |
|----------|-----------------|----------------------------------------------------------------------|
| [159:108]| OA              | 输出地址（OA[63:12]）                                               |
| [83:80]  | TRANS_RNG       | 翻译有效范围（当BYPASS=0）或系统最大地址大小（当BYPASS=1）           |
| 72       | GLOBAL          | 是否适用于所有子流ID                                                 |
| 66       | ALLOW_X         | 是否允许指令读取                                                     |
| 65       | ALLOW_W         | 是否允许数据写入                                                     |
| 64       | ALLOW_R         | 是否允许数据读取                                                     |
| 17       | BYPASS          | 是否绕过翻译（0=正常翻译，1=绕过翻译，VA=PA）                        |
| 12       | UNTRANSLATED    | 是否应使用ATS翻译（影响PCIe ATS完成消息中的U位）                     |
| [11:4]   | TRANSLATION_ID  | 对应的翻译请求ID                                                     |
| [3:0]    | SLV_MSG_TYPE    | 消息类型标识，固定为0010                                             |

TRANS_RNG字段特别关键，它定义了翻译的有效范围（4KB到128TB不等），直接影响翻译粒度选择。

3.2.3 DTI_ATS_TRANS_FAULT（翻译错误）

当翻译过程中出现错误时返回的消息，关键字段包括：

markdown复制| 比特位   | 字段名称        | 描述                                                                 |
|----------|-----------------|----------------------------------------------------------------------|
| [18:17]  | FAULT_TYPE      | 错误类型（00=InvalidTranslation，01=CompleterAbort，10=UnsupportedRequest） |
| [11:4]   | TRANSLATION_ID  | 对应的翻译请求ID                                                     |
| [3:0]    | SLV_MSG_TYPE    | 消息类型标识，固定为0001                                             |

不同的错误类型会导致PCIe端点收到不同的翻译完成状态，影响后续处理流程。