NAND特性研发分析方案
2020-11-20 15:29:05

对于SSD controller或者SSD drive研发中心来讲,设计LDPC纠错算法的前提需要事先了解所支持的NAND的特性。NAND在不同的温度下的特性往往差异较大,尤其在实际工作环境中往往受到周围环境(例如控制器)影响会导致温度过高,所以这类特性测试往往需要在NAND支持的最大速率(1.6GT, 2.0/2.4GT)以及加温下,针对NAND进行非常细致的测试才能了解这些特性。

参加下图,我们可以很清晰地看出该颗NAND在30度,50度,以及70度的时候的BER的变化曲线差异很大。

 

意大利公司NplusT从2002年起专注于Memory测试,其针对研发中心的NAND特性分析设备获得业内众多SSD Controller公司以及科研院所和高校的青睐,国内的控制器厂商如Alibaba,平头哥,Tenafe,Yeestor,Dapu,浪潮,华芯,大学包括清华大学,复旦大学,南京大学,山东大学,另外还有中芯国际等芯片制造企业等等。

NplusT提供的针对测试数据的后处理大数据分析软件也得到了众多应用。该NAND特性分析设备支持业内常用的Kioxia, Micron, Sandisk, WDC, YMTC等NAND。

 

NAND 闪存技术 (ONFI5) 正在快速发展,以跟上大容量、高性能、高可靠性的存储需求:

  • 同一封装中的die数量、LUN 和plane数量的增加;
  • 层数的增加;
  • I/O 速度达到或超过 6 GT/sec;
  • 更短的program和read时间;
  • 具有极高峰值的更高的平均内核core和IO电流。

 

100 多层 3D TLC 和 QLC NAND 设备在数据、信号和电源完整性方面对 SSD 设计人员提出了挑战。

有关endurance, retention and disturb sensitivity的知识对于优化介质的管理算法至关重要,这对于 3D 结构和拓扑的复杂性增加至关重要。

对于高效的系统级电源完整性解决方案,设计人员需要了解各种操作模式下的 NAND 电源功耗的概况分析。下面,作为一个例子,它显示了 NAND 电流分布以及plane和活跃的die数量的影响。

总的来说,并行多芯片测试对于以下方面很重要:

  • 减少从大量die中收集数据的测试时间;
  • 模拟SSD 控制器的行为,该控制器同时执行不同die 的操作;
  • 提取和优化总功耗曲线并最大限度地减少尖峰和峰值;
  • 验证不同die之间操作的干扰/干扰;
  • 了解并减轻多芯片堆栈的热影响:堆栈中的温度变化、热分析和提高数据可靠性的方法;
  • 测量高速接口对不同 NAND 通道的影响。

 

传统的 NAND 特性测试工具显示出它们的局限性:需要通过集成的实时功率波形捕获全速进行特性分析,以在各种操作条件(温度、老化、操作并行性)下监控 NAND 数据、功率和信号完整性 - 以复制 NAND 在 SSD 或类似目标应用程序中的工作方式,以满足产品规格、质量和可靠性。

此外,如果测试和特性分析工具是基本的并且不支持并行性和完整 I/O,那么开发测试程序/脚本并在 NAND 设备上执行它们所需的工作量可能会非常高,并且会消耗大量的时间和资源速度。

NplusT 新一代 NanoCycler NAND 特性测试工具的主要目标是能够在多个 NAND 设备上同时执行特性测试程序,以实时生成和提取大量读出和功率数据。

NanoCycler HS 是用于 NAND 测试和深入表征性能和可靠性的可扩展平台。与传统市场其它产品不同,NanoCycler 以全 I/O 速度执行 NAND 并行测试。该系统支持高达ONFI 5.0, 2.4GT/s。

NanoCycler 系统可扩展性允许对每个系统最多 84 个 NAND 设备执行同时测试。

可以级联多个系统以将并行度扩展到 84 位以上。

NanoCycler 系统架构支持不同类型的并行测试操作:

 

  • 可以在所有测试单元上执行相同的测试程序,以拥有大量 DUT 并收集具有统计代表性的数据;
  • 可以在具有不同测试参数(例如时序、数据模式等)或测试条件(温度、电压)的每个测试仪单元上执行相同的测试程序,以识别相关性、相关性、裕度;
  • 不同的测试单元可以执行不同的测试程序,以减少总表征时间。

 

由于每个Tester Unit直接连接一个NAND设备,一个NAND设备最多包含16个die(HDP封装),NanoCyler全系统配置最多可以同时测试1344个NAND die。

这导致系统的 NAND 测试数据总带宽约为240 GT/s,假设 NAND I/O 速度为 1.6GT/s,I/O 吞吐量利用率为 90%。多个 NanoCyler 系统可以级联,以进一步增加总系统容量和数据吞吐量。以全 I/O 速度运行 NAND 对于支持 NAND 设备内的芯片并行操作至关重要。

下表显示了 NanoCycler 可以并行测试执行 NAND 读取操作的芯片数量,例如提取 NAND 原始误码率。

NanoCycler 专有测试控制器基于与被测 NAND 器件紧密耦合的高性能 FPGA。它可以控制和监控测试条件(温度、电压、功率)、生成测试数据模式、对封装中的每个芯片应用背对背命令、传输数据并实时计算原始误码率数据,全速工作,并且没有开销。

总之,NplusT 的 NanoCycler 性能和能力完全符合 NAND 技术的发展。它可以符合当今实际 NAND 应用条件的全速和并行性测试测试并且分析待测NAND特性。同时,其经过验证的架构、硬件和软件可扩展性使不受限制的数量的 NAND 芯片能够同时独立地进行测试。

面向SSD开发的NAND特性分析

NAND是SSD中的存储介质,就像磁盘于HDD一样。

与 HDD 磁盘一样,NAND 也是一种“不完美”的介质,会产生数据错误从而需要对于读取错误机型纠正。 NAND 介质的不同之处和挑战在于,错误会随着时间增加,包括 NAND 磨损、多次读取相同数据、超过数据保留时间,以及在不同温度条件下。

随着 TLC,QLC以及未来 PLC 的每个单元的位数增加,“缺陷”的影响随着 3D-NAND 的代际更迭变得越来越具有挑战性。

同时,更高的性能、更高的速度、更高的功率和电流尖峰(Spike)进一步挑战了 NAND 信号和电源的完整性。

设计高性能、高容量、高可靠性的 SSD,了解和解决所有这些方面的问题对于交付在整个生命周期内满足可靠性、数据完整性和性能一致性的产品至关重要。

 

在和最终应用将要运行的相同条件下,适当的 NAND 特性分析对于以下方面的设计和验证至关重要:

  • NAND 管理算法通常称为“NAND 策略
  • SSD 控制器纠错(LDPC)
  • SSD 信号和电源完整性。

 

需要特别注意的 NAND特性分析的关键是:

  • 闪存Cell Vt 分布重叠,导致内存数据读取错误增加;
  • 编程/擦除周期、读操作干扰、数据保留时间、温度条件下的Vt分布变化;
  • 影响正常NAND 功能和数据完整性的电流尖峰(Spike)
  • 来自时序、端接、驱动强度、PCB 布局的I/O 信号完整性;
  • 闪存Cell在生命周期内的退化导致的硬故障。

 

Vt 分布的重叠尾部(TLC 为 7,QLC 为 15)是读取错误的根源。当太多单元位于读取阈值的错误一侧时,大量错误读取的位需要极大的努力才能执行纠错,或者甚至超出 SSD本身的 纠错能力。

在与最终应用类似的操作条件下对于Vt 分布的特性分析,随着使用寿命、磨损、数据保留时间、读取干扰、温度等方面,对于了解错误行为、设计读取级别放置的策略和算法以及设计和调整 SSD 纠错 (LDPC)的至关重要。了解这些特性如何变化,以及 SSD 控制器的跟踪/预测策略和纠错系统,对于提供高数据可靠性、稳定的性能和良好的 QoS(SSD 存储应用程序的关键参数)非常关键。

SSD 容量和速度增加带来的第二个挑战是确保电源和信号完整性。 NAND 编程、擦除和读取内部操作会产生比平均电流值高几倍的电流尖峰。多个 NAND 裸片的并行和同步操作,通常在多(8 到 16 个及更多)SDD 闪存通道中会导致 SSD 级别的极端电流尖峰。

了解 NAND 时序和电流分布对于设计、仿真、调整大小、校准电源调节器以及制定策略来限制和避免这些电流尖峰的对齐至关重要。

除了电源完整性之外,SSD 设计还必须处理信号完整性:由于 I/O 数据走线在超过 1GT/s 数据速率时变成传输线,因此 PCB 设计必须越来越准确,并且需要特定的培训和校准程序来设置NAND 和 SSD 控制器 I/O 参数。

提供可靠结果的高效特性分析需要强大的测试环境。 NanoCycler 是一个专门为 NAND 特性分析而创建的测试系统,支持 SSD 开发人员进行 NAND 探索。NanoCycler支持如下功能:

  • 能够针对每个NANDSocket运行独立的测试,优化多个测试条件下的统计数据生成;
  • 具有根据每个测试Socket进行准确、快速的温度控制;
  • 可从单NAND Socket开发测试平台完全扩展至多个84 插槽机架;
  • 以与NAND SSD 中运行相同的速度执行数据传输,最高可达0GT/sec(即将推出2.4GT/sec);
  • 以零开销生成写入和验证数据,包括完美随机模式;
  • 支持从/到被测设备的快速位图数据传输;
  • 使用智能滤波算法检测平均和峰值电流,捕获电流波形以增加对设备内部操作的可见性;
  • 提供内置的、可定制的界面训练算法,时间分辨率只有几皮秒ps

 

NanoCycler 提供了一个开发环境来提高测试工程师的效率,通过一个测试库能够:

  • 支持各大厂商的最新设备;
  • 在单个LUN 或多个LUNdieCE、通道上执行操作;
  • 使用多种预定义和自定义模式运行由ONFI 标准定义的命令;
  • 接受具有任意信号时序、命令代码等等的定制、供应商特定命令序列;
  • 生成易于后处理的数据日志。

NanoCycler 的专业软件:

  • 为测试执行和高级测试流程定义提供易于使用的图形用户界面;
  • 配备多个测试系统共享的高效数据采集系统;
  • 使用流行的Python 语言实现测试流程和算法;
  • 包括调试工具,如可视化信号序列显示,使故障排除更加容易。

 

 

下面是一些nanocycler GUI的主界面展示:

  • 创建NAND测试序列

 

  • NAND测试过程中各种主要特性的图形输出

如果没有可靠的高性能 NAND 特性测试工具,就无法构建可靠的高性能 SSD。

对于需要了解其 NAND 特定特性的 SSD 开发人员来说,NanoCycler 是必不可少的帮助。 NanoCycler 与 ONFI 技术路线图保持同步,确保此类投资的长期有效性。

Nanocycler产品图片

高密度12槽位设备(12-TU)

该新设计提供单台(shelf)提供12个TU (Tester Unit),单个集成机架提供7台shelf总计可以达到84个TU,可以同时测试84个NAND Flash,非常适合于批量测试。

下图是单台12-TU shelf图片。该shelf可以单独使用,也可以安装在机架里面,下面呈现的是从机架中抽出的图片。

传统6槽位测试设备(6-TU)

 

 

 

目前提供三种型号设备供选择:

 

  • Nanocycler Standard标准版
  • Nanocycler HS 高速版 (比标准版速度更高,6GT vs 800MT;提供电压拉偏和电流监控)
  • Nanocycler FDE版本 (主要用于ECC/LDPC算法优化的部门)

Nanocycler Standard和HS版本技术指标

产品功

STD800 (Standard 800M)

HS16 (High Speed 1.6GT)

HS24 (High Speed 2.4GT)

支持协议

- NV-SDR

- NV-DDR

- NV-DDR2

- NV-DDR3

支持的NAND封装

BGA 152/132

BGA 152/132

BGA 154/152/132

支持的最大速度

800 MT/sec

1.6 GT/sec

2.4 GT/sec

Timing Modes模式

Mode 0 - Mode 10

Mode 0 - Mode 15

Mode 0 - Mode 19

Pattern发生器

- 高质量伪随机码

- 0开销

- 全0, 全1, 替换轮流

- 用户从指定文件导入的pattern

数据采集

- 每chunck或者每page的0开销的fail bit计数

- 完整的bitmap上传到管理电脑硬盘

时序分析

- 1us 信号捕获

- 1ns edge placement

- 20ns信号捕获

电压拉偏功能

- 通过跳线设定

- 支持编程打开/关闭

  - 支持API编程

 - 支持编程打开/关闭

 - Vccq: 0.95V~1.9V, 1000mA

 - Vcc: 1.0V~3.8V, 500mA

 - Vpp: 10V~15V, 100mA

电流测量

分流电阻到外置探针进行测量

- 波形抓取

- 峰值和平均值捕获

- 2k的采样buffer空间

- 硬件实现平均值计算

50ns采样率

1mA分辨率

温度控制

- 支持室温,例如25°C~125 °C (可以放置在 0°C的温箱里面)

- 1°C的精准度

- 从室温加热到125度大概5分钟,然后再降温到室温约3分钟,总计大概8分钟

产品架构

- 开发平台(单socket)

- 桌面系统(6个socket)

- 机架系统(24或者48个socket,通过4或者8个桌面系统堆叠)

- 高密度系统(84个socket,7个12 socket的桌面系统堆叠)

- 每个socket可以运行独立的测试:不同的测试脚本,nand类型,温度访问,异步运行和停止

- NAND的追踪信息再多个系统间共享

 

Nanocycler FDE版本技术指标

 

 

 

Nanocycler标准版基本功能

  • Straightforward management
  • Easy test setup supported by a large set of built-in experiments
  • Integrated data collection
  • Desktop installation
  • Large number of independent experiments in parallel
  • Per package thermal control
  • Independent test per package
  • Available in 1, 6, 12, 24 and 48 package configurations
  • ONFI Compatible
  • BGA-152 and BGA-132 packages
  • Dual-channel multi-die testing
  • Up to 800 MT/sec

BarnieMAT后处理分析软件

BarnieMAT后处理分析基本功能

  • Worldwide N1 bitmap analysis software
  • Very fast array data processing engine
  • Easy adaptation for new device types / technologies
  • Python programmability
  • Reporting and charting tools
  • Post-processing
  • Injected in the BarnieMAT data analysis platform
  • “Quite Big Data”
  • AI experimental platform