Eu recomendaria a instalação do smartmon ( link ) em sua máquina. Este é um software que pode verificar a saúde de seus discos, caso contrário, serão verificados / var / log / messages ou / var / log / syslog para quaisquer menções de erros scsi
Qual é a melhor maneira de verificar os erros do disco rígido e os primeiros sinais de falha no CentOS?
Eu recomendaria a instalação do smartmon ( link ) em sua máquina. Este é um software que pode verificar a saúde de seus discos, caso contrário, serão verificados / var / log / messages ou / var / log / syslog para quaisquer menções de erros scsi
dmesg
O kernel registrará quaisquer mensagens de diagnóstico sobre dispositivos de E / S, para que você possa verificar essas mensagens com o comando dmesg.
Você pode executar o fsck no dispositivo para verificar erros.
Como Paul diz, os registros SMART são um bom lugar para verificar.
Também recomendo executar BadBlocks . Se você tem um cartão RAID, pode ser necessário usar o monitoramento.
O monitoramento SMART é um bom caminho. Como root, smartctl -a /dev/hda
, onde hda é a unidade que você quer ... pode ser hdb, sda, etc. Também recomendamos configurar seu endereço de e-mail em / etc / aliases como a pessoa que deve receber o e-mail root.
Essa é uma resposta muito vaga. Se você tiver um servidor feito por qualquer um dos grandes fabricantes (Dell, HP, etc.), é provável que haja melhores recursos de monitoramento disponíveis.
Você pode tentar a verificação completa da partição / dev / sda1 (por exemplo) como
fsck -f /dev/sda1
ou, tente o teste não-descritivo completo de leitura de determinada partição
badblocks -vn /dev/sda1
Tags hard-drive centos corruption