Eu tenho visto degradações de desempenho semelhantes no meu servidor aqui em casa (rodando o RAID-6 com o Btrfs no topo). Provou uma das unidades em três ocasiões.
A primeira coisa que faço é executar smartctl
para cada unidade. Então, para a unidade com falha, noto o número de erros brutos:
smartctl -x /dev/sdf | fgrep Raw
para acompanhar esses. Eu tenho uma unidade que uma vez mostrou alguns erros, mas tem sido estável nos últimos 9 meses após redefinir o cabeamento. Não tenho certeza porque, mas eu considero que um "ainda não morreu".
Se a contagem de erros aumentar novamente, removo a unidade e trago a substituição (posso viver com o risco de uma das duas unidades extras no meu RAID-6 ficar fora da linha por meio dia).