Com que freqüência verificar erros / falhas de hardware?

0

Acabei de descobrir este excelente post: link

e tem se perguntado com que freqüência é típico verificar se há falhas / falhas no hardware? Eu gostaria de o mais cedo possível, se algo sair, mas também não quiser sugar todo o poder computacional da máquina, apenas para que a máquina cheque sozinha. Eu tenho uma versão modificada da linha sugerida em um script de shell, CheckHardware.zsh que eu quero adicionar como um cronjob:

#!/bin/zsh
[ $(grep -c "hardware error" /var/log/mcelog) -gt 0 ] && echo "Hardware Error Found On $(hostname) @ $(date)" | ssmtp [email protected]

Eu também não estava claro se o utilitário de linha de comando (mcelog) tinha que ser executado como um cronjob com muita frequência também? Ou seja, eu tenho que ter dois cronjobs? executar mcelog e, em seguida, verifique o arquivo mcelog para qualquer conteúdo com "erro de hardware"?

Agradeço antecipadamente por qualquer ajuda que você possa oferecer.

    
por tarabyte 21.02.2013 / 07:31

1 resposta

0

Eu acho muito melhor que checar se algum intervalo está sendo alertado se algo quebrar.

Uma ferramenta popular para isso é, por exemplo, o link e se você pesquisar no Google, há muito mais.

Essas ferramentas podem enviar alertas por e-mail quando houver algo errado. Então você poderia, por exemplo, usar o script que você postou e com algumas pequenas modificações integrá-lo ao nagios para fazer o nagio alertá-lo se o script detectar um problema.

    
por 21.02.2013 / 08:36