da21 has 1 CKSUM fail every ~2 weeks. Do i need to replace it already, or should i wait till there are more errors? I am rather on the cautious side, but don't want to replace a perfectly healthy disk either.
Eu primeiro substituo o cabo e verifico se o problema persistir em outro compartimento / outro gabinete / outro controlador (se possível em sua configuração). Eu tive mais erros de soma de verificação em uma dessas situações. Geralmente, os discos com falha mostram-se com erros de leitura ou gravação.
Também seria essencialmente livre em comparação com outra substituição de disco completa, que você ainda pode fazer se os erros persistirem (especialmente em Z2 ou Z3, onde a pressão para agir é muito menor). Claro, se você não pode correr o menor risco, você não deve fazer isso - mas neste caso, você já usaria Z3 ou vários espelhos, não é? E você ainda tem um backup atual e verificado pronto, então o risco é muito pequeno.
Can I do this during a scrub, or should i wait for the scrub to finish/stop it?
Se houver tempo, eu sempre esperarei o matagal. Você pode ter certeza de que outros discos no vdev também não exibem erros ocultos que podem levar a sérios danos se não forem encontrados antes de remover o disco (dependendo do nível de discos adicionais).
Se não houver tempo, simplesmente cancele o scrub com zpool scrub -s <poolname>
.