工业级 SSD 的垃圾回收:你需要知道的事

工业级 SSD 的垃圾回收:你需要知道的事

工业级 SSD 垃圾回收可让 SSD 保持高速与可靠。了解 GC 与 TRIM 如何降低写入放大、提升全天候工作负载下的耐用性
工业级 SSD 的垃圾回收:你需要知道的事

ssd-solid-state-drive

什么是 SSD 垃圾回收(GC)?

SSD 内部的隐藏备用空间

SSD 中的垃圾回收是控制器的静态清理工作。它将仍然有效的页面压缩到新空间,并抹除现在大多是垃圾的区块。这听起来很奇怪,直到您记起 NAND 闪存无法覆写已编程的页面。它必须先抹除,而抹除是在区块层级进行,而非每个页面。因此,更新变成「先写到别处,之后再清理」。

为了让您更了解粒度不匹配的情况,装置可能以 4,224 字节的页面编程数据,但只能在 256 KB 加上 8 KB 的区块(64 个页面)中抹除。这就是为什么 SSD 固件需要重新定位数据并清除相当大块的空间。

HDD 不是这样运作的。它们可以就地覆写相同的扇区,而且没有内部的重新定位与抹除循环。当 GC 效率低下时,它在清理期间会复制太多有效数据。这会膨胀写入放大,而您会感受到的是持续写入下的抖动延迟和不稳定吞吐量。当它调校良好时,SSD 中的垃圾回收大多保持在背景执行,保持放大率低,而您的稳态性能是可预测地平稳。

想要更稳定的工业稳态行为?查看威刚工控 IM2P41B8P

  • 一款为严苛、重度写入部署打造的 NVMe 1.4 / PCIe Gen4x4、M.2 2280 SSD。
  • 断电保护(PLP)加上额外电容器以提供短路保护。
  • DRAM 缓冲区和控制器端完整性功能,如 LDPC ECC、RAID 引擎。
  • 端到端数据路径保护
  • 它还支持 TRIM、SLC 缓存、S.M.A.R.T. 监控和热节流。
  • 规格列出 256GB-4TB、最高 4900/4200 MB/s 顺序读取/写入、3.3V、6.3W,以及坚固性评级如 1500G 冲击和 20G 振动。

SSD 垃圾回收如何运作

挑选「受害者」区块

SSD 垃圾回收始于控制器寻找「混合」的区块。有些页面仍然有效,其他页面已经陈旧。固件使用其对应元数据来评分候选者,并偏好具有大量无效页面的区块,这样清理工作就很小。

迁移活动页面,然后回收区块

之后,它只将有效页面重新定位到新鲜的区块。然后,它更新逻辑到实体的指标,让主机仍然看到相同的 LBA。只有在指标安全后,控制器才会抹除原始区块并将其返回到可用池。

安排 GC 时间以回避延迟,以及为什么「太多」会造成伤害

理想情况下,控制器在离峰或闲置窗口执行 GC,因此前景 I/O 不会停滞。但当可用空间变紧时,GC 可能变得紧急并与写入同时执行。当 SSD 垃圾回收变得太积极时,那些额外的页面移动变成额外的内部写入,这会提高写入放大并更快消耗 P/E 周期。

真实世界中的工业固件调校

这就是工业级 SSD 试图变聪明的地方。固件选择决定 GC 运作的程度与它保护耐用度的程度。它还必须尊重热限制和功耗,因此,政策可能会根据温度和工作负载压力进行调整。

我们的 IM2P41E4 是为持续写入而设计,具有围绕受控 GC 行为的固件功能。

  • 一款 PCIe Gen4x4 / NVMe 1.4、M.2 2242 固态硬盘,具有 112 层 3D TLC、3K P/E 评级,以及固件可见的建构区块,包括垃圾回收、磨损均衡、TRIM、SLC 缓存、热节流和 S.M.A.R.T.。
  • 完整性保护(LDPC ECC、RAID 引擎、端到端数据路径保护)和主机内存缓冲区,以在无 DRAM 设计上获得更好的随机行为。
  • 规格概述 128GB-2TB 和最高 5000/4200 MB/s 顺序读取/写入。

TRIM 与垃圾回收之间的关系

TRIM 是来自主机的「解除分配」提示

当您删除档案时,大多数档案系统只会更新元数据。NAND 页面不会被触碰。因此,SSD 无法自行判断那些 LBA 已经失效。TRIM(及其同类如 SCSI UNMAP 或 NVMe Deallocate)是主机在说:「这些范围不再使用。」

TRIM 将清理从猜测变成规划

一旦 SSD 知道,它就可以在其对应表中将相关实体页面标记为无效。这意味着较少的「可能仍然需要」页面被携带前进。它让 SSD 中的垃圾回收更快,因为控制器跳过复制主机已经丢弃的数据。

没有 TRIM 意味着更慢的写入和更多的闪存磨损

没有 TRIM,陈旧页面对 SSD 来说仍然看起来有效。这就是为什么在清理期间,它可能会保留它们「以防万一」,然后稍后才发现它们是无用的。那些额外的内部编程和抹除会消耗耐用度,并随着时间推移拖累持续写入速度。

TRIM + GC 是系统级可靠性基线

关键思维是 TRIM 是上游真相,而 SSD 中的垃圾回收是下游执行。如果 TRIM 被 VM、RAID 或精简配置堆叠阻挡,SSD 会失去那个真相,而可靠性会受损。因此,对于长寿命部署,请确保 TRIM 端到端通过。

为什么垃圾回收对工业级 SSD 很重要

Stack of External Hard Drives on Table

永不停机的写入让「稳定行为」成为真正的规格

在工厂和 AIoT 网关中,写入从未真正停止。日志、缓冲区、检查点和本地缓存不断涌入。这就是为什么工业级 SSD 的垃圾回收必须在永久压力下保持可预测,而不仅仅是在短期基准中看起来很快。请注意,SNIA 的耐用度指引(基于 JEDEC JESD218B.01)比较「客户端」假设的每天 8 小时活跃使用于 40°C,与「企业级」假设的每天 24 小时于 55°C,这更接近工业自动化和嵌入式部署的永不停机现实。

GC 需要支援团队:磨损均衡和超额配置

威刚工控 SSD 不只依赖 GC。磨损均衡将编程/抹除负载分散到整个 NAND,一个热门区域不会过早老化。超额配置保留备用闪存,让控制器有空间旋转数据而不会「刮到底」,同时降低长期写入压力。因此,工业级 SSD 的垃圾回收是可持续的。

PLP 和 S.M.A.R.T. 将耐用度变成您可以管理的东西

PLP 是当电压骤降发生在写入中途时的安全网。它有助于保护传输中数据和控制器元数据,而硬盘会干净地回来而不是跛行。同时,S.M.A.R.T. 让您能够看到健康趋势,让您可以在装置在现场故障之前进行维修。

严苛条件是消费级硬盘悄悄崩溃的地方

工业设备与热循环、振动和 24/7 值班共存。那种环境惩罚薄弱的热控制和脆弱的边距。因此,您想要一款明确评级为宽温和机械应力的硬盘,并针对那些条件进行验证。

如果您需要一款用于持续工业工作负载的 SATA 主力,我们的 ISSS31AP 是理想的。

  • 一款具有 112 层 3D TLC(BiCS5)和 4TB / 8TB 选项的 2.5" SATA III 6.0Gbps SSD。
  • 评级最高达 550/520 MB/s 顺序读取/写入。
  • PLP 加上钽聚合物电容器以提供短路保护。
  • S.M.A.R.T.、热节流、LDPC ECC、SLC 缓存和磨损均衡。
  • 它指定为 0°C-70°C(标准)或 -40°C-85°C(工业级),以及最高 3.3W 最大功率的 1500G 冲击和 20G 振动耐受度。

与威刚工控 SSD 建立长期可靠性

在威刚工控,我们相信可靠性是一个系统,而非单一功能。我们调校固件,让垃圾回收、TRIM、磨损均衡和超额配置作为一个回路运作,同时有足够的备用空间来清理和足够的政策控制来避免耐用度消耗。

我们还使用数据完整性保护和平台安全行为,如热控制和健康遥测。因此,当条件漂移时,性能总是稳定的。然后,我们通过包含功能测试和可靠性验证的 SSD 验证流程来验证它。这就是我们为无法暂停的嵌入式和工业部署提供可靠工业级 SSD 的方式。

同时,为您的工作负载挑选正确的硬盘:

e-Catalog

e-Catalog

联络我们

联络我们