1

不用去重功能基本不影响。 除非你一个月一直没读写,ARC 缓存不更新导致比特翻转可能发生, 从而读取异常数据

2 周重启一次比较稳妥

如一楼所说,dup 不开,你这一生估计都不会用到 ecc ,不要焦虑。
我的 zfs 跑一年都重启不到一次,既然是 NAS 肯定会不停读写,下几个电影,这时候你的内存的缓存区会不断被汰换,所以里面的数据出错的概率极低;如果你的内存中会有大量驻留数据,这时候你才会要考虑重启。
之所以说 dup 不开就不要紧,因为 dup 需要做前后比对,所以只有占用内存,而且是长期占用。这时候你就要重启了。

如果内存运行 2 周就因为没有 ECC 而出错,那么这个内存基本可以说报废了!

raidz2 ,非 ecc ,上次重启是 70 天前 /t/979429
个人用途随便重启无所谓的,我习惯人在机器旁边手动重启,因为曾经 apt upgrade 升级了 zfs 版本导致 pve reboot 挂了

PS:如果你用的是 DDR5 消费级内存不管商家是否标注 ECC ,不建议搭配 ZFS 使用,极其容易嗝屁
因为 DDR5 本身特性就是数据存储非常不稳定,黑心商家标注的 ECC 不是你认为的那个 ECC

感谢各位的回复。
ddr4 消费级内存
明白了,我应该是用不到这个功能。

不需要,你的手机、笔记本、台式机也没哪个是 ecc 的,而且内存压力和频率都比家用 nas 大多了,如果内存这么脆弱你的终端设备应该不断的在写入错误数据而且每天都在死机重启。第一步需要把他们全换成 ecc 设备

ecc 在服务器的价值是快速定位坏掉的内存,没有 ecc 根本没法确定上万台设备组成的集群里什么玩意儿坏了。家用的话……死机两次你自己跑个 memtest ,内存坏了直接全换掉完事

家用 zfs 是否需要使用 ecc 前几年在 truenas (以前是 freenas)那吵的火热,反正绝大多数的观点和论证都表明家用环境 ecc 意义不大...,认为需要的观点主要也集中在大规模存储上

ECC 和重启时间本身也没很大关系啊。

不用重启,因为重启并不会解决普通内存条的问题。但你要明白,当你选择非 ECC 内存,你就默认了上面的数据不重要。

假如你很关心 bit rot ,然而硬件上又没有 ecc 内存,还有一个替代方案。

这个方案是利用 intel/amd cpu 自带的内存加密技术,intel 这边叫 Total Memory Encryption TME ,amd 叫作 Transparent Secure Memory Encryption TSME 。大概 intel 是在 11 代消费级 cpu 上开始支持,amd 大概 3000 系就有了,但是具体还要看主板 bios 是否有对应开启选项。

这个功能的原理是 cpu 内部在每次启动后自动生成一个 aes 密钥,对内存数据进行透明加密,单个加密块的大小为 512bits/64Bytes 。

当发生 bit rot 的时候,1 bit 的变化最多会造成 512bit 的数据变化,极大概率会造成 crash 或者用户可见的数据异常。

搞不懂你的逻辑,二极管非好即坏是吧?
麻烦重新看一遍,说的不是内存连续运行两周因为没有 ECC 就一定会出错,而是消费级内存如果拿去做需要 ECC 的硬件用途而选择两周重启一次比较稳妥,你能看懂这个逻辑关系吗?

从实践来说他说的其实没啥错,因为内存要不然就完全不坏,稳定地几天/几周出错一次的情况极其罕见,如果几周就会出一个 error 的话那这个内存大概率已经坏了,出错频率也会很高,你不需要重启也会自己死机,相反重启只会隐藏问题(就跟写程序直接把所有 exception catch 了一样)

是的 有问题的内存要出错 总是会出错 跟你重启不重启没有关系 因为根本上就无法保证有问题的内存重启后不会很快出错 况且周这个时间单位都感觉扛不住要重启 闹着玩呢

重启能暂避的问题只能是软件层面上的问题

所以 zfs 不是软件层面?你们不看 op 说啥?真小丑

你可能真的听不懂别人在说啥,缺乏相关的基本知识或者基本的逻辑能力。。。

我回答的是 op 的问题,有人缺乏逻辑理解能力歪楼到硬件损坏上,你也只不过是歪楼的一部分。所以很难想象你还在这里指出别人缺乏能力,究竟是谁缺乏能力?

就算是软件 bug 爆内存,重启能稳定用,那么提 issue 修 bug 之前,难道,定时重启不是最稳妥的方案?

指鼠为鸭是被你们玩明白了。

op:消费级非 ecc 内存使用 zfs 文件系统需要定时重启吗?
#2:2 周重启一次比较稳妥
#4:如果内存运行 2 周就因为没有 ECC 而出错,那么这个内存基本可以说报废了!

我不理解了,你们机器是空跑 zfs 吗?没考虑过其他服务/硬件/驱动导致的错误?对,一切都是内存的硬件有问题。这个世界只有内存有问题。

两周重启一下很有逻辑

重启治百病

你赢了