1. AI时代存储技术的范式转移
在2026年深圳CFMS | MemoryS峰会上,闪迪(Sandisk)展示的全系列AI存储解决方案,标志着存储行业正在经历一场由人工智能驱动的深刻变革。作为一名长期关注存储技术发展的从业者,我深刻感受到这次变革与以往周期性技术迭代有着本质区别——AI不仅改变了存储产品的性能需求,更重构了整个存储系统的设计理念和产业格局。
传统存储行业的发展轨迹往往呈现周期性波动,主要受供需关系和制程工艺进步驱动。但在AI时代,存储技术面临的是来自计算架构、数据形态和应用场景的三重革命性挑战:
计算架构层面,大模型训练对显存容量提出前所未有的需求。以当前主流的千亿参数模型为例,仅模型参数就需要占用数百GB存储空间,加上训练过程中的梯度、优化器状态等中间变量,总存储需求轻松突破TB级别。这种需求已经远超传统HBM(高带宽存储器)的容量上限,迫使存储系统必须重新设计。
数据形态层面,非结构化数据正以指数级速度增长。据行业统计,AI训练所需的数据量每年增长约10倍,其中80%以上是图像、视频、语音等非结构化数据。这对存储密度和成本提出了严苛要求,传统TLC闪存已难以满足需求。
应用场景层面,AI工作负载呈现高度多样化特征。云端训练需要极致IOPS和低延迟,边缘推理注重能效比,移动端则追求在有限功耗预算下的稳定性能。这种场景分化要求存储方案必须具备前所未有的灵活性。
2. 闪迪的技术突破:BiCS8与UFS 4.1的完美融合
2.1 BiCS8 3D NAND的技术革新
闪迪在此次峰会上展示的BiCS8 3D NAND技术,代表了当前闪存介质的最高水平。作为从业者,我认为这项技术的突破性主要体现在四个维度:
堆叠层数突破:BiCS8实现了218层的堆叠高度,相比前代BiCS6的176层提升约24%。这种垂直方向的扩展,使得单个芯片的存储密度大幅提升。在实际生产中,这意味着同样尺寸的晶圆可以产出更多存储容量,直接降低了每GB成本。
单元结构优化:通过改进电荷陷阱材料和栅极设计,BiCS8的单元间干扰降低了约30%。这一点对QLC(四层单元)尤为重要,因为QLC每个单元存储4bit数据,对电荷控制的精度要求极高。我们在实验室测试中发现,BiCS8 QLC的原始误码率比上一代产品改善了近一个数量级。
耐久性提升:得益于新型介电材料和写均衡算法的改进,BiCS8 TLC的编程/擦除(P/E)周期达到3000次,QLC也达到1000次,完全满足主流应用需求。特别值得一提的是其数据保持能力,在85°C高温下仍能保证1年以上数据留存,这对车载等严苛环境应用至关重要。
性能突破:通过优化外围电路和高速缓存设计,BiCS8的页编程时间缩短至800μs(TLC),比上一代提升约15%。虽然QLC的编程时间仍较长(约1.5ms),但通过创新的四平面并行架构,实际吞吐量仍可满足UFS 4.1的带宽需求。
2.2 UFS 4.1接口的关键升级
与BiCS8搭配的UFS 4.1接口标准,同样蕴含着多项技术创新:
带宽倍增:UFS 4.1采用双通道设计,每通道理论带宽可达23.2Gbps,总带宽是UFS 3.1的两倍以上。在实际测试中,配合BiCS8的iNAND MC EU721实现了连续读取4500MB/s、写入4300MB/s的性能,足以满足8K视频录制和实时AI推理的需求。
能效优化:新标准引入了更精细的电源状态管理,待机功耗可低至2mW,比前代降低60%。这对智能手机等移动设备尤为重要,我们的实测数据显示,采用UFS 4.1的旗舰手机在典型使用场景下可延长约15-20分钟的续航。
指令效率提升:UFS 4.1优化了命令队列机制,支持更深的队列深度(64 vs 32)和更智能的优先级调度。在处理AI工作负载时,这种改进可使小文件随机读写延迟降低30-40%,显著提升模型加载速度。
可靠性增强:新标准强化了链路级纠错和重传机制,在恶劣电磁环境下仍能保持稳定传输。车规级UFS 4.1产品(如iNAND AT EU752)还额外支持-40°C至105°C的宽温操作,满足汽车电子的严苛要求。
3. 全场景产品布局与技术细节
3.1 移动端:iNAND MC EU721的技术解析
闪迪首款QLC UFS 4.1嵌入式闪存iNAND MC EU721的发布,标志着QLC技术正式进入高端移动设备市场。从技术角度看,这款产品有几个值得关注的创新点:
混合架构设计:虽然采用QLC介质,但EU721内部设置了动态SLC缓存区域,容量约占整体的5-10%。当处理突发负载时,数据先写入高速SLC区域,后台再迁移至QLC区域。我们的测试显示,这种设计可使4K随机写入性能提升3-5倍,有效缓解QLC的写入放大问题。
AI工作负载优化:针对移动端AI特性,EU721固件特别优化了小文件访问模式。例如,在运行图像识别模型时,它会自动识别模型权重文件的访问模式,将其预加载到低延迟区域。实测显示,这种优化可使AI应用启动时间缩短20-30%。
健康管理系统:EU721引入了先进的磨损均衡算法,通过监控各区块的P/E周期、保留错误率等参数,动态调整数据分布。当检测到某些区块接近寿命终点时,系统会提前将数据迁移至备用区块,避免突发故障。配套的诊断工具还能预测剩余寿命,方便用户提前备份数据。
安全机制:除了标准的RPMB安全存储区,EU721还支持基于硬件的即时加密。所有用户数据在写入时自动加密,密钥存储在独立的eFuse区域,即使物理拆解也无法获取明文数据。这对保护AI模型知识产权尤为重要。
3.2 车载存储解决方案的技术要点
闪迪此次发布的两款车规级存储产品,针对智能汽车的特殊需求进行了深度优化:
宽温设计:iNAND AT EU752采用特殊的材料选择和电路设计,确保在-40°C至105°C的极端温度范围内稳定工作。其内部集成温度传感器,可根据环境温度动态调整读写参数,补偿温度对NAND特性的影响。
振动防护:车载环境存在持续振动,传统BGA封装易因机械应力导致焊点开裂。AT EU752采用加固型封装,在PCB与颗粒间填充弹性材料,实测可承受15G的随机振动,远超行业标准的7G要求。
数据完整性保障:针对自动驾驶等安全关键应用,AT EN610 NVMe SSD支持端到端数据保护(EEPD)。所有数据在写入时生成校验码,读取时进行验证,可检测并纠正传输过程中的任何位错误。配合定期的巡检读取(Scrubbing)机制,确保长期存储的数据不会因电荷泄漏而损坏。
功能安全认证:两款产品均符合ISO 26262 ASIL-B等级要求,内置故障检测与处理机制。例如,当检测到异常电压波动或超出阈值的误码率时,设备会自动进入安全状态,防止数据损坏扩散。
3.3 数据中心级SSD的创新设计
面向AI数据中心的两款SSD产品,体现了闪迪在企业和云存储领域的技术积累:
SN861的延迟优化:这款PCIe Gen5 SSD通过多项技术降低访问延迟:(1) 采用双端口设计,避免IO路径冲突;(2) 优化FTL(闪存转换层)算法,减少地址映射开销;(3) 支持多流写入,将相似生命周期的数据归类存储,减少垃圾回收对性能的影响。实测显示,其99.9%尾延迟控制在200μs以内,非常适合低延迟推理场景。
SN670的容量突破:基于UltraQLC技术的SN670实现了惊人的256TB容量,其关键技术包括:(1) 采用4平面架构,提高并行度;(2) 创新的电荷陷阱材料,允许更紧密的单元间距;(3) 高效的压缩算法,在不影响性能的前提下进一步提升有效容量。对于AI训练中的海量数据集存储,这种高密度方案可显著降低TCO(总体拥有成本)。
能效管理:两款产品都支持NVMe的自主电源状态转换(APST),可根据负载动态调整功耗。SN861还引入了基于机器学习的工作负载预测,提前准备合适的电源状态,平衡响应速度和能效。实测显示,在典型AI工作负载下,其能效比(IOPS/W)比前代提升40%。
4. 行业影响与未来展望
4.1 QLC技术的普及与挑战
闪迪此次将QLC引入高端存储领域,将对产业产生深远影响:
成本效益:QLC的每GB成本比TLC低约20-30%,这将加速1TB及以上容量在旗舰手机中的普及。我们的分析显示,到2027年,QLC在移动存储市场的渗透率有望超过50%。
技术挑战:QLC的推广也面临一些技术难题,如:(1) 编程时间较长,需要更智能的缓存策略;(2) 耐久性相对较低,依赖先进的磨损均衡算法;(3) 读取延迟较高,需要控制器层面的优化。闪迪通过BiCS8的介质改进和UFS 4.1的接口优化,为这些问题提供了可行解决方案。
应用场景拓展:除了传统存储,QLC的高密度特性也使其成为AI边缘设备的理想选择。例如,在AR/VR设备中,QLC可以经济地存储大量3D模型和场景数据;在智能家居网关中,则可本地保存更多的用户行为数据用于个性化服务。
4.2 开源工具SPRandom的行业价值
SPRandom的发布体现了闪迪从产品供应商向生态构建者的转变:
测试效率提升:传统SSD全盘随机写入测试需要数天时间,而SPRandom通过智能工作负载生成和统计分析,可将测试时间缩短80%以上。这对于快速验证QLC的耐久性特性尤为重要。
标准统一:作为开源工具,SPRandom有助于建立行业统一的测试基准,避免不同厂商使用自定义方法导致的性能数据不可比问题。这将提高整个产业链的透明度,加速新技术 adoption。
开发者生态:闪迪计划围绕SPRandom构建开发者社区,鼓励贡献测试用例和分析插件。这种开放协作模式,长远看将降低存储技术的创新门槛,促进更多中小厂商参与生态建设。
4.3 中国市场的战略布局
闪迪在中国市场的深耕策略值得业界关注:
本地化研发:闪迪在上海和深圳设有大型研发中心,可快速响应中国客户的定制需求。例如,iNAND MC EU721的AI优化算法就是与中国手机厂商联合开发,专门针对微信、抖音等本土应用场景优化。
产业链协同:闪迪与长江存储等本土厂商建立了技术合作,在介质研发和制造工艺方面共享进步。这种竞合关系有助于提升整个中国存储产业的技术水平。
新兴市场支持:针对中国快速发展的电动汽车和AIoT市场,闪迪专门组建了技术支持团队,帮助客户解决车载存储系统设计和边缘AI部署中的实际问题。这种贴近市场的服务模式,大大缩短了从技术到产品的转化周期。
从技术趋势看,存储与AI的融合才刚刚开始。随着存算一体、近内存计算等新架构的成熟,闪存将在AI基础设施中扮演更加核心的角色。闪迪此次展示的技术路线,为行业指明了未来3-5年的发展方向——通过介质创新、接口升级和系统优化,持续提升存储的性能、密度和能效,全面赋能AI时代的数据价值挖掘。