Estou usando o btrfs há mais de um ano e observei relatórios de muitos erros nos logs, mas sem problemas. Um scrub recente encontrou números ENORMES de erros de csum, por enormes quero dizer 85 milhões, no entanto esfregar todos eles. As estatísticas do BTRFS reportam muitos erros de gravação e leitura do io em 2 das unidades (zero no terceiro, estamos em uma invasão de 3 unidades 1).
Isso pareceria uma solicitação de substituição imediata das duas unidades com os erros, mas não há sinais de erros em nenhum outro registro, e o smartctl reporta zero erros de leitura bruta ou setores realocados nessas unidades, como eles são limpo e feliz.
São apenas muitos erros no btrfs para ter zero das outras ferramentas (e zero problemas). O que dá? Claro, é melhor prevenir do que remediar, mas isso é 7tb para substituir, possivelmente sem motivo.
[/dev/sde2].write_io_errs 556986
[/dev/sde2].read_io_errs 4
[/dev/sde2].flush_io_errs 278
[/dev/sde2].corruption_errs 85489893
[/dev/sde2].generation_errs 0
[/dev/sdd].write_io_errs 1814862
[/dev/sdd].read_io_errs 1280445
[/dev/sdd].flush_io_errs 5327
[/dev/sdd].corruption_errs 63
[/dev/sdd].generation_errs 119
[/dev/sda2].write_io_errs 0
[/dev/sda2].read_io_errs 0
[/dev/sda2].flush_io_errs 0
[/dev/sda2].corruption_errs 0
[/dev/sda2].generation_errs 0
De sde:
1 Raw_Read_Error_Rate PO-R-- 100 100 016 - 0
7 Seek_Error_Rate PO-R-- 100 100 067 - 0
198 Offline_Uncorrectable ---R-- 100 100 000 - 0
199 UDMA_CRC_Error_Count -O-R-- 200 200 000 - 0
De sdd
1 Raw_Read_Error_Rate POSR-K 200 200 051 - 0
7 Seek_Error_Rate -OSR-K 100 253 000 - 0
198 Offline_Uncorrectable ----CK 200 200 000 - 0
199 UDMA_CRC_Error_Count -O--CK 200 200 000 - 0
200 Multi_Zone_Error_Rate ---R-- 200 200 000 - 0