Como ignorar um erro específico da SMART

2

Recebo um email sobre o mesmo erro SMART todos os dias. Eu gostaria de configurar o daemon do SMART para ignorar este erro específico, mas apenas isso, pois eu ainda quero agora se alguma coisa muda ou fica pior.

This email was generated by the smartd daemon running on:

 host name: jon
DNS domain: [Unknown]
NIS domain: (none)

The following warning/error was logged by the smartd daemon:

Device: /dev/sdb [SAT], 11 Currently unreadable (pending) sectors


For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
The original email about this issue was sent at Sun Nov 25 02:30:45 2012 CET
Another email message will be sent in 24 hours if the problem persists.

Quando isso aconteceu, o número de setores ilegíveis estava aumentando lentamente, então fiz um backup e tentei muitas coisas descritas neste tópico: link

Como você pode ver no e-mail, isso foi há 1.5 anos, então não lembro exatamente o que tentei e o que não. No entanto, o disco permanece estável e funcionando desde então, então não vejo nenhum motivo para alterar nada. (Sim, eu regularmente faço backups.)

Eu só consigo pensar em uma solução alternativa, que seria ignorar todas as mensagens contendo esse texto exato, mas isso seria apenas tratar os sintomas, não a causa.

Editar:

Sei que muitos ou a maioria de vocês me dará o conselho "substitua o disco", que em geral é o melhor conselho possível para uma pergunta como "recebo este erro, o que devo fazer?"

Mas por favor, por favor aceite que estou ciente do risco e faço uma pergunta muito específica sobre o daemon do SMART. Não encontrei nada nos documentos que indicasse que é possível fazer o que eu quero, mas queria verificar aqui primeiro antes de ir com a minha solução alternativa.

Atualização:

Cerca de uma semana atrás, o contador desceu para 1 novamente. Eu não tenho ideia do que causou isso, eu não fiz nenhum trabalho de manutenção naquela máquina. Depois de mais de dois anos, 11 setores ficaram bem novamente. Isso é muito estranho.

    
por Sentry 25.07.2014 / 14:27

3 respostas

2

A maneira mais simples de fazer a mensagem parar sem substituir o disco é forçar o disco a marcar os setores como bons ou ruins, em vez de "talvez possivelmente ruim", que é o que significa "pendente". Você pode fazer isso forçando uma leitura completa do disco:

sudo dd if=/dev/sdb of=/dev/null bs=64K conv=noerror

Isso lerá todos os setores do disco e ignorará erros, forçando o disco a verificar novamente cada setor pendente e informar se os setores estão realmente ruins ou não.

Note que, enquanto isso limpará os atuais 11 setores pendentes, ele poderá descobrir novos setores potencialmente ruins no processo (resultando em uma contagem do setor pendente diferente de zero). Execute isso novamente até que não haja mais setores pendentes.

    
por 25.07.2014 / 18:10
2

você precisa alterar a configuração /etc/smartd.conf

adicione argumentos à sua configuração:

-t -I 197  

Ignora o atributo 197 - Setores pendentes

assim (exemplo):

/dev/ad0 -H -l error -l selftest -t -I 197
    
por 14.09.2018 / 11:58
1

Hmm ... Eu não sei como você pode reconfigurar o smartd, mas agora que você pode fazer o OMD [1] ignorar certos erros SMART (uma vez fiz isso com uma contagem de setor realocada estabilizada). Talvez seja também uma opção para você monitorar mais parâmetros da sua caixa do que apenas as leituras SMART.

    
por 25.07.2014 / 16:51