DynamIQ共享单元(DSU)是Arm新一代多核处理器架构的核心组件,作为连接处理器集群与系统互连的桥梁。DSU-120T是其最新实现版本,采用模块化设计支持1至12个Cortex-A系列核心的动态组合。与传统的CCI/CCN互连方案相比,DSU-120T通过集成CHI协议控制器和可配置AXI主端口,实现了更高效的缓存一致性和内存访问管理。
在典型配置中,DSU-120T包含以下关键模块:
重要提示:DSU-120T的L3缓存采用bank化设计,实际可用带宽与配置的slice数量直接相关。在8-slice配置下,实测带宽可达32GB/s@2GHz。
CHI协议作为AMBA 5的核心组件,采用分层事务模型实现系统级缓存一致性。DSU-120T的CHI主接口支持两种基础配置模式:
| 配置类型 | 缓存策略 | 支持事务类型 |
|---|---|---|
| 非一致性模式 | 无缓存或不可见系统缓存 | 基础读写、原子操作 |
| 一致性模式 | 可见系统缓存 | 缓存维护、侦听、一致性请求 |
关键通道功能实现:
c复制// 典型CHI事务流程示例(L3缓存命中场景)
1. Core发起ReadUnique请求 → TXREQ通道
2. SCU检查L3 Tag → 命中
3. 从L3 Cache返回数据 → RXDAT通道
4. 更新核心L1缓存状态为Unique
DSU-120T通过专用信号控制TLB失效广播:
BROADCASTTLBIINNER:控制Inner Shareable域广播BROADCASTTLBIOUTER:控制Outer Shareable域广播信号组合逻辑真值表:
| INNER | OUTER | 效果描述 |
|---|---|---|
| LOW | LOW | 不广播任何TLBI事务 |
| LOW | HIGH | 仅广播TLBI{OS}事务 |
| HIGH | HIGH | 广播TLBI{IS}和TLBI{OS}事务 |
实测数据:在4核Cortex-A78配置下,全广播模式TLBI延迟约120周期,相比单核TLBI操作节省约65%的无效化时间。
DSU-120T的事务处理能力与L3缓存配置强相关:
math复制最大未完成事务数 = NUM_LTDBS × NUM_L3_SLICES
典型配置性能指标:
事务ID分配特点:
DSU-120T支持灵活的AXI主端口配置,通过地址目标组(Address Target Group)实现事务分发:
| 主端口数量 | 地址目标组数 | 典型应用场景 |
|---|---|---|
| 1 | 2 | 低功耗移动设备 |
| 2 | 4 | 主流消费电子 |
| 4 | 8 | 高性能计算 |
事务路由决策流程:
DSU-120T采用可配置的哈希算法实现负载均衡:
2组配置:
python复制group_bit[0] = XOR(PA[39:6] & MASTERINTERLEAVE0[39:6])
4组配置:
python复制group_bit[0] = XOR(PA[39:6] & MASTERINTERLEAVE0[39:6])
group_bit[1] = XOR(PA[39:6] & MASTERINTERLEAVE1[39:6])
6组配置(特殊场景):
python复制group[2:0] = (PA[base+0:2] + PA[base+3:5] + PA[base+6:8] + top_bits) % 6
工程经验:哈希掩码应选择地址中熵值较高的位段,通常建议使用PA[12:6]作为基础掩码区域。
AXI接口属性支持情况:
| 属性 | 支持情况 | 备注 |
|---|---|---|
| Multi_Copy_Atomicity | 是 | 需要互连支持 |
| Exclusive_Accesses | 是 | 用于实现原子操作 |
| Max_Transaction_Bytes | 64 | 匹配缓存行大小 |
| MTE支持 | 可选 | 需配置BROADCASTMTE信号 |
实测带宽数据(4端口配置):
DSU-120T支持多层次一致性管理:
典型拓扑示例:
code复制[CPU Cluster]--CHI-->[DSU-120T]--AXI-->[ICN-400]
│
└──[ACP]-->[Accelerator]
缓存配置建议:
互连调优参数:
yaml复制# 典型配置示例
axi_params:
outstanding_writes: 32
outstanding_reads: 64
qos_level: 3
chi_params:
rx_credits: 4
tx_credits: 15
常见问题排查指南:
| 现象 | 可能原因 | 解决方案 |
|---|---|---|
| 事务超时 | 信用计数不匹配 | 检查RX/TX credit初始值 |
| 一致性错误 | 侦听过滤器配置错误 | 验证Evict事务生成情况 |
| 带宽低于预期 | 地址哈希冲突 | 调整MASTERINTERLEAVE掩码 |
| ACP性能瓶颈 | LPID分配冲突 | 检查ACP接口ID配置 |
PMU监控关键事件:
DSU架构的持续演进呈现三大方向:
在5nm工艺节点下的实测数据显示:
未来随着CXL协议的引入,DSU架构预计将进一步扩展为异构计算统一互连平台。