Eu tenho um servidor Ubuntu com md RAID6 em 6 HDDs de 1 TB conectados diretamente à placa-mãe. Nos últimos dois dias, smartctl-monitor
tem vomitado avisos. Aqui está minha saída syslog
e smartctl -a /dev/sd{ac}
.
As temperaturas estão entre 29 ° C e 34 ° C. Além dos erros, tudo parece estar funcionando bem.
Quão fracassados são esses discos? Existe alguma maneira de descobrir qual é o problema real? É uma situação de "substituir todos eles imediatamente"? Tudo é copiado para o CrashPlan, por isso não há perigo de perda de dados.
O erro é ATA bus error
, o que aparentemente significa um erro de barramento de dispositivo "chip" < - > ". Qual é a probabilidade de indicar cabeamento em vez de, digamos, a unidade não responder? Estou presumindo que os modos de falha mais comuns são mecânicos.
Tags hard-drive