现有测试表明,在相同硬件条件下,Windows 11并未必优于Windows 10。例如Tom’s Hardware一项使用相同老旧硬件(ThinkPad X220 i5+HDD)的测试发现,Win11在绝大多数项目中最慢,仅在“文件传输”这一项排名第二,仅次于Win10。这说明Win10在文件复制上略占优势。微软内部测试偏向高端配置,但用户实际对比也发现Win11对随机/小文件写入有明显拖慢:微软技术社区和十一(Eleven)论坛用户反馈,某Win11系统复制大文件时CPU飙高却速率骤降;而相同平台在Win10下并无此问题。微软支持论坛和用户报告均指出,“Windows 11中出现这种随机写入速度下降问题,而同机型的Windows 10没有”。这表明Win11对NVMe设备或文件系统的管理更保守或复杂。另一方面,Win11 24H2在ReFS文件系统引入了“Block Cloning”特性:官方称在ReFS卷上复制大文件可提速18%–94%。这表明文件系统本身优化潜力巨大,但常见笔记本多用NTFS或FAT格式。
以复制单个大文件为例,假设源文件路径为 C:\TestData\bigfile.dat(10 GB),目的地为 D:\Backup\bigfile.dat,使用Windows资源管理器(或 robocopy)执行拷贝。对于最新的Windows 11旗舰机(Intel Ultra 7 + 32GB + PCIe 4.0 NVMe),实测中前几秒速度可达3–4 GB/s(利用SSD SLC缓存),但随着写入继续,“速度骤降到仅约150–500 MB/s”并稳定在该水平。此时CPU占用率往往不低(部分线程满载),因为操作系统需要频繁刷新缓存与写元数据。原因在于现代SSD使用伪SLC缓存来加速写入,一旦SLC缓存写满,就会出现“悬崖式”掉速:如分析所示,速度常从GB/s级别骤降到几百MB/s。相比之下,同样任务在7年前的Win10笔记本(2018年i7 + 16GB + PCIe 3.0 NVMe)上,虽然写入速度相对比读取速度要慢,但稳定写入速率可能能持续在800MB/s–1GB/s左右,且CPU占用可能更低一些,因为该平台对并发缓存机制略简单。举例数据:一个实际案例中,Win11机完整复制6.7GB文件耗时约7秒后速率骤降到最终极慢,而某旧款Win10机同样拷贝可能保持在1GB/s,耗时长但更平稳。对于小文件拷贝(如1万+个1 MB文件),资源管理器会为每个文件逐一操作(分配空间、写入数据、更新MFT和日志、计算进度等),开销巨大,整体吞吐往往只有数十MB/s,且CPU几乎100%忙于处理目录和安全扫描。同时,不同驱动影响也不可忽视:例如使用Intel RST驱动的模式在Win10下可能与Windows内置NVMe驱动(Win11推荐方案)性能略有差异;SSD厂商白皮书通常给出不同驱动下的性能测试数据。测试方法建议列出:单线程拷贝(Explorer或 robocopy/MT:1),记录总耗时和平均速度;对比多线程并发拷贝任务;拷贝前后使用 fsutil behavior queryDisableDeleteNotify 确保TRIM已启用;关闭Defender或实时扫描以免干扰(可观察见);在固定电源计划下(详见下文)进行测试。如源文件与目标卷都支持NTFS/ExFAT,则按需分别测试单大文件和许多小文件情况,记录吞吐和延迟(可用资源监视器或 perfmon 计量)。
合成基准工具(如CrystalDiskMark、ATTO、AS SSD等)测量的主要是SSD在理想条件下的峰值性能,而非文件复制中的真实表现。例如,CrystalDiskMark默认使用单方向、大块(1MiB)、高队列深度(QD=8)*测试:它只读或只写,不涉及NTFS元数据更新;其 SEQ1M Q8T1 测试往往完全跑在SSD的SLC缓存内,因此可以轻易达到官方标称速度(几GB/s)。但Windows资源管理器的复制操作是*读写并行的(源读+目标写),并且单线程(QD=1)、固定小缓冲区,还要不断更新文件系统索引、NTFS日志及计算进度。这意味着实际文件复制的速率往往远低于CDM或ATTO的高分值。例如Brent Ozar说明:CDM的“SEQ1M Q8T1”意味着8个并行队列请求,能够充分填满NVMe队列;而实际文件复制更类似于“SEQ1M Q1T1”。AS SSD通常使用QD=1顺序读写,也更贴近单流表现;ATTO则只测序列读写(一般QD=1)。但这些工具仍然缺乏文件系统开销和缓存耗尽后的表现。综上所述,真实用户体验反映在实际文件拷贝中更接近于低队列、持续写入下的表现,如果结果远低于合成测试要属正常。建议测试流程:使用 robocopy或专门工具(如DiskBench)实际拷贝大文件并测量速度,同时使用CrystalDiskMark的低队列单线程(SEQ1M Q1T1)和AS SSD Seq测试对比,观察SLC缓存耗尽前后的速率,以此了解SSD的持续性能和OS开销。ATTO和CDM可用于验证硬件“最大理论值”,但评测拷贝问题时更应关注单线程、实际文件测试结果。
即使都是PCIe 4.0接口,主控厂商、NAND类型和DRAM缓存的不同会导致性能差异巨大。下表列出几款具有代表性的PCIe 4.0 M.2 SSD,以及其控制器、NAND工艺、DRAM配置和性能指标(部分数据来自官方及评测):
说明:以上读写和IOPS数据多为厂商标称峰值或评测Peak值;实际持续写入速度通常低于峰值,受SSD容量、热节流和SLC缓存大小等影响。如Corsair MP600 LPX在2TB下标称顺写6800MB/s,但大量测试发现SLC缓存满后可降至几百MB/s。此外表中未列出的控制器(如Phison E18、Silicon Motion SMI等)和新型164层、232层NAND也存在类似差异,选择SSD时务必参考最新评测。
对于笔记本M.2 SSD问题,有条件的话可以使用Saniffer推荐的一些工具进行深入分析:
下图以流程图形式展示一个诊断“复制慢”问题的思路:
此流程首先根据表现区分热节流与电源管理问题,然后利用SerialTek+Quarch PAM判断PCIe链路和功耗变化(如L1.2唤醒时的延迟和功率峰值)。如确认为L1.2问题,可按建议关闭NVMe ASPM;如为热力学问题,则需改善散热。对疑难信号问题还可用Quarch Breaker注入信号干扰或复位脉冲,用PPM测试SSD对电压变化的敏感度。以上工具均来自NVMe/PCIe测试行业,能检测信号完整性、协议错误和电源异常。例如如果抓包发现NVMe命令重传或死锁,就可能是固件BUG或驱动兼容问题,此时尝试更新固件或回退驱动;如果PAM记录到未预期的功耗抖动,则可能是主板供电不足或电压调节器问题。
典型的PCIe M.2 SSD故障和对策包括:
PCIe L1.2是一种链路低功耗状态,当NVMe设备闲置一定时间后进入。由于链路深度睡眠,每次恢复通信需要“唤醒”过程,这会造成高延迟:如上所述,Windows 平衡电源计划默认开启L1.2,使第一次I/O延迟增加8–12ms。症状表现为每次复制停顿(特别是在文件复制间隔出现的阵发性停顿)和第一个IO延时。重现方法:在执行复制过程中故意等待数百毫秒,再观测后续写入延迟;或用十字网卡并行测试。可用SerialTek检查PCIe信号:如果长时间无数据后链路进入L1.2,可在链路状态指示和Quarch PAM记录中观察到电压下降。要确认此问题,可对比在“平衡”与“高性能”计划下的复制速度,通常高性能计划(禁用L1.2)可以显著减少停顿。Windows上,解决方案包括在高级电源选项中找到“PCI Express – 链路状态电源管理”将其设为“关”,或修改注册表/组策略禁用NVMe节能(见《技评》)。在Linux系统,则通过修改 /etc/modprobe.d 禁用 NVMe 省电策略。测量工具:可以使用 perfmon 或 Windows API 观察 NVMe 寄存器功耗状态(如 NVMe Capabilities 的 PS Max Latency),或用SerialTek+PAM抓取低功耗进入时的功率下降及唤醒上的功率尖峰,以验证链路进入/退出L1.2的时序。
robocopy/J(无缓冲)或 dd式工具拷贝一个大文件(如10–20 GB),记录平均速度和CPU占用。再运行CrystalDiskMark的SEQ1M Q8T1和SEQ1M Q1T1测试,以及AS SSD顺序读写测试,对比理想和实际值。建议也用并发小文件复制(例如脚本创建大量1MB文件)测试小文件场景。hwinfo64检查NVMe控制器所连接的PCIe版本)。如果存在NVMe共享或节能选项,可尝试调整或禁用。为SSD增加散热(贴金属散热片或购买带散热片版本),避免长时间满载时热降速。PerformanceCounter 或系统监视器可记录文件复制过程的延迟和CPU负载。对于开发者,可尝试DiskBench等专用软件,更贴近日常文件操作场景。通过以上分析和测试,可以帮助用户和评测人员定位Windows文件复制性能瓶颈,并采取针对性的优化措施。最后建议:仅参考合成成绩容易导致误判,应以实际场景测试为准;同时密切关注系统更新和SSD厂商的技术公告,以获取最新的性能修复和优化提示。
更多关于PCIe 5.0/6.0,CXL, SSD等的测试工具和技术,可以查看Saniffer公司2026.2.24最新更新的白皮书15.1版本,我们已经整理收录在Saniffer公众号的【白皮书】菜单中。
欢迎关注Saniffe公众号,点击底部菜单栏即可免费获取。如有任何技术问题,也可直接在公众号内留言交流。