对于SSD controller或者SSD drive研发中心来讲,设计LDPC纠错算法的前提需要事先了解所支持的NAND的特性。NAND在不同的温度下的特性往往差异较大,尤其在实际工作环境中往往受到周围环境(例如控制器)影响会导致温度过高,所以这类特性测试往往需要在NAND支持的最大速率(1.6GT, 2.0/2.4GT)以及加温下,针对NAND进行非常细致的测试才能了解这些特性。
参加下图,我们可以很清晰地看出该颗NAND在30度,50度,以及70度的时候的BER的变化曲线差异很大。
意大利公司NplusT从2002年起专注于Memory测试,其针对研发中心的NAND特性分析设备获得业内众多SSD Controller公司以及科研院所和高校的青睐,国内的控制器厂商如Alibaba,平头哥,Tenafe,Yeestor,Dapu,浪潮,华芯,大学包括清华大学,复旦大学,南京大学,山东大学,另外还有中芯国际等芯片制造企业等等。
NplusT提供的针对测试数据的后处理大数据分析软件也得到了众多应用。该NAND特性分析设备支持业内常用的Kioxia, Micron, Sandisk, WDC, YMTC等NAND。
NAND 闪存技术 (ONFI5) 正在快速发展,以跟上大容量、高性能、高可靠性的存储需求:
100 多层 3D TLC 和 QLC NAND 设备在数据、信号和电源完整性方面对 SSD 设计人员提出了挑战。
有关endurance, retention and disturb sensitivity的知识对于优化介质的管理算法至关重要,这对于 3D 结构和拓扑的复杂性增加至关重要。
对于高效的系统级电源完整性解决方案,设计人员需要了解各种操作模式下的 NAND 电源功耗的概况分析。下面,作为一个例子,它显示了 NAND 电流分布以及plane和活跃的die数量的影响。
总的来说,并行多芯片测试对于以下方面很重要:
传统的 NAND 特性测试工具显示出它们的局限性:需要通过集成的实时功率波形捕获全速进行特性分析,以在各种操作条件(温度、老化、操作并行性)下监控 NAND 数据、功率和信号完整性 - 以复制 NAND 在 SSD 或类似目标应用程序中的工作方式,以满足产品规格、质量和可靠性。
此外,如果测试和特性分析工具是基本的并且不支持并行性和完整 I/O,那么开发测试程序/脚本并在 NAND 设备上执行它们所需的工作量可能会非常高,并且会消耗大量的时间和资源速度。
NplusT 新一代 NanoCycler NAND 特性测试工具的主要目标是能够在多个 NAND 设备上同时执行特性测试程序,以实时生成和提取大量读出和功率数据。
NanoCycler HS 是用于 NAND 测试和深入表征性能和可靠性的可扩展平台。与传统市场其它产品不同,NanoCycler 以全 I/O 速度执行 NAND 并行测试。该系统支持高达ONFI 5.0, 2.4GT/s。
NanoCycler 系统可扩展性允许对每个系统最多 84 个 NAND 设备执行同时测试。
可以级联多个系统以将并行度扩展到 84 位以上。
NanoCycler 系统架构支持不同类型的并行测试操作:
由于每个Tester Unit直接连接一个NAND设备,一个NAND设备最多包含16个die(HDP封装),NanoCyler全系统配置最多可以同时测试1344个NAND die。
这导致系统的 NAND 测试数据总带宽约为240 GT/s,假设 NAND I/O 速度为 1.6GT/s,I/O 吞吐量利用率为 90%。多个 NanoCyler 系统可以级联,以进一步增加总系统容量和数据吞吐量。以全 I/O 速度运行 NAND 对于支持 NAND 设备内的芯片并行操作至关重要。
下表显示了 NanoCycler 可以并行测试执行 NAND 读取操作的芯片数量,例如提取 NAND 原始误码率。
NanoCycler 专有测试控制器基于与被测 NAND 器件紧密耦合的高性能 FPGA。它可以控制和监控测试条件(温度、电压、功率)、生成测试数据模式、对封装中的每个芯片应用背对背命令、传输数据并实时计算原始误码率数据,全速工作,并且没有开销。
总之,NplusT 的 NanoCycler 性能和能力完全符合 NAND 技术的发展。它可以符合当今实际 NAND 应用条件的全速和并行性测试测试并且分析待测NAND特性。同时,其经过验证的架构、硬件和软件可扩展性使不受限制的数量的 NAND 芯片能够同时独立地进行测试。
面向SSD开发的NAND特性分析
NAND是SSD中的存储介质,就像磁盘于HDD一样。
与 HDD 磁盘一样,NAND 也是一种“不完美”的介质,会产生数据错误从而需要对于读取错误机型纠正。 NAND 介质的不同之处和挑战在于,错误会随着时间增加,包括 NAND 磨损、多次读取相同数据、超过数据保留时间,以及在不同温度条件下。
随着 TLC,QLC以及未来 PLC 的每个单元的位数增加,“缺陷”的影响随着 3D-NAND 的代际更迭变得越来越具有挑战性。
同时,更高的性能、更高的速度、更高的功率和电流尖峰(Spike)进一步挑战了 NAND 信号和电源的完整性。
设计高性能、高容量、高可靠性的 SSD,了解和解决所有这些方面的问题对于交付在整个生命周期内满足可靠性、数据完整性和性能一致性的产品至关重要。
在和最终应用将要运行的相同条件下,适当的 NAND 特性分析对于以下方面的设计和验证至关重要:
需要特别注意的 NAND特性分析的关键是:
Vt 分布的重叠尾部(TLC 为 7,QLC 为 15)是读取错误的根源。当太多单元位于读取阈值的错误一侧时,大量错误读取的位需要极大的努力才能执行纠错,或者甚至超出 SSD本身的 纠错能力。
在与最终应用类似的操作条件下对于Vt 分布的特性分析,随着使用寿命、磨损、数据保留时间、读取干扰、温度等方面,对于了解错误行为、设计读取级别放置的策略和算法以及设计和调整 SSD 纠错 (LDPC)的至关重要。了解这些特性如何变化,以及 SSD 控制器的跟踪/预测策略和纠错系统,对于提供高数据可靠性、稳定的性能和良好的 QoS(SSD 存储应用程序的关键参数)非常关键。
SSD 容量和速度增加带来的第二个挑战是确保电源和信号完整性。 NAND 编程、擦除和读取内部操作会产生比平均电流值高几倍的电流尖峰。多个 NAND 裸片的并行和同步操作,通常在多(8 到 16 个及更多)SDD 闪存通道中会导致 SSD 级别的极端电流尖峰。
了解 NAND 时序和电流分布对于设计、仿真、调整大小、校准电源调节器以及制定策略来限制和避免这些电流尖峰的对齐至关重要。
除了电源完整性之外,SSD 设计还必须处理信号完整性:由于 I/O 数据走线在超过 1GT/s 数据速率时变成传输线,因此 PCB 设计必须越来越准确,并且需要特定的培训和校准程序来设置NAND 和 SSD 控制器 I/O 参数。
提供可靠结果的高效特性分析需要强大的测试环境。 NanoCycler 是一个专门为 NAND 特性分析而创建的测试系统,支持 SSD 开发人员进行 NAND 探索。NanoCycler支持如下功能:
NanoCycler 提供了一个开发环境来提高测试工程师的效率,通过一个测试库能够:
NanoCycler 的专业软件:
下面是一些nanocycler GUI的主界面展示:
如果没有可靠的高性能 NAND 特性测试工具,就无法构建可靠的高性能 SSD。
对于需要了解其 NAND 特定特性的 SSD 开发人员来说,NanoCycler 是必不可少的帮助。 NanoCycler 与 ONFI 技术路线图保持同步,确保此类投资的长期有效性。
Nanocycler产品图片
高密度12槽位设备(12-TU)
该新设计提供单台(shelf)提供12个TU (Tester Unit),单个集成机架提供7台shelf总计可以达到84个TU,可以同时测试84个NAND Flash,非常适合于批量测试。
下图是单台12-TU shelf图片。该shelf可以单独使用,也可以安装在机架里面,下面呈现的是从机架中抽出的图片。
目前提供三种型号设备供选择:
产品功能 |
STD800 (Standard 800M) |
HS16 (High Speed 1.6GT) |
HS24 (High Speed 2.4GT) |
支持协议 |
- NV-SDR - NV-DDR - NV-DDR2 - NV-DDR3 |
||
支持的NAND封装 |
BGA 152/132 |
BGA 152/132 |
BGA 154/152/132 |
支持的最大速度 |
800 MT/sec |
1.6 GT/sec |
2.4 GT/sec |
Timing Modes模式 |
Mode 0 - Mode 10 |
Mode 0 - Mode 15 |
Mode 0 - Mode 19 |
Pattern发生器 |
- 高质量伪随机码 - 0开销 - 全0, 全1, 替换轮流 - 用户从指定文件导入的pattern |
||
数据采集 |
- 每chunck或者每page的0开销的fail bit计数 - 完整的bitmap上传到管理电脑硬盘 |
||
时序分析 |
- 1us 信号捕获 |
- 1ns edge placement - 20ns信号捕获 |
|
电压拉偏功能 |
- 通过跳线设定 - 支持编程打开/关闭 |
- 支持API编程 - 支持编程打开/关闭 - Vccq: 0.95V~1.9V, 1000mA - Vcc: 1.0V~3.8V, 500mA - Vpp: 10V~15V, 100mA |
|
电流测量 |
分流电阻到外置探针进行测量 |
- 波形抓取 - 峰值和平均值捕获 - 2k的采样buffer空间 - 硬件实现平均值计算 50ns采样率 1mA分辨率 |
|
温度控制 |
- 支持室温,例如25°C~125 °C (可以放置在 0°C的温箱里面) - 1°C的精准度 - 从室温加热到125度大概5分钟,然后再降温到室温约3分钟,总计大概8分钟 |
||
产品架构 |
- 开发平台(单socket) - 桌面系统(6个socket) - 机架系统(24或者48个socket,通过4或者8个桌面系统堆叠) - 高密度系统(84个socket,7个12 socket的桌面系统堆叠) - 每个socket可以运行独立的测试:不同的测试脚本,nand类型,温度访问,异步运行和停止 - NAND的追踪信息再多个系统间共享 |