smartd somente envia um e-mail sobre a mudança de atributo

1

Eu configurei o smartd para enviar relatórios de e-mail caso meus discos falhem. Infelizmente, estou sendo spam a cada dia pelo mesmo atributo com o mesmo valor (sem alteração):

The following warning/error was logged by the smartd daemon:

Device: /dev/sdb [SAT], 1 Offline uncorrectable sectors

Device info:
ST32000542AS, S/N:XXXXX, WWN:5-XXXXXX-XXXXXXXX, FW:XXXX, 2.00 TB

Eu estou totalmente ciente dos perigos implícitos em um disco com setores incorrigíveis. (Este disco é usado em uma configuração RAID10)

Eu só não quero receber o mesmo e-mail todos os dias, só quero receber um e-mail se um valor mudar / aumentar.

Esta é a configuração atual do meu /etc/smartd.conf :

DEVICESCAN -d removable -n standby -t -m root -M exec /usr/share/smartmontools/smartd-runner

O que eu tenho que mudar para alcançar o comportamento desejado do smartd?

    
por Flatron 26.09.2018 / 07:14

2 respostas

1

Você está usando -M exec e smartd-runner , que aparentemente é uma especialidade do Debian.

Package Maintainers and system administrators can put scripts to be run
when smartd detects an error into /etc/smartmontools/run.d. These
scripts will be run by smartd-runner using run-parts(8). The script will
receive the filename of the file containing the errormessage as first
parameter. See /etc/smartmontools/run.d/10mail for an example.

O objetivo principal deste runner parece estar tornando o envio de email opcional (dependendo se um mailer é instalado em primeiro lugar) e separadamente, ele parece acionar uma notificação pop-up em um desktop (se o notificador for instalado).

Então, eu acho que você poderia modificar esse script 10mail para filtrar e-mails duplicados.

A alternativa seria executar o smartd com a opção --savestates e, em seguida, usar -M once no smartd.conf - isso é descrito em mais detalhes na página do manual smartd.conf, para resumir:

          once - send only one warning email for each type of disk problem

          daily - send additional warning reminder emails, once  per  day,

          diminishing - send additional warning reminder emails,  after  a
          one-day  interval,  then  a  two-day  interval,  then a four-day

          test - send a single test email immediately upon smartd startup.

          exec PATH - run the executable PATH instead of the default  mail

E se isso não funcionar, você terá que conviver com isso ou escrever sua própria lógica de execução de manipulador de e-mail, que filtra de acordo, afinal.

I am fully aware of the dangers implied with a disk with uncorrectable sector(s). (This disk is used in a RAID10 configuration)

Eu ainda recomendo substituir essas unidades imediatamente. Quaisquer promessas feitas pelo RAID em relação à redundância só são válidas desde que cada unidade esteja em 100% de funcionamento.

Quando a unidade for substituída, você poderá fazer um teste de gravação completo na unidade removida sem arriscar a perda de dados - e dependendo de como a unidade faz esse teste, você pode tomar uma decisão muito mais informada se continuar usando essa unidade raid) ou não.

Você não sabe como o seu drive está realmente quebrado até que você o coloque em teste - e o seu smartd.conf não parece que você está executando auto-testes regulares, então os erros podem permanecer indetectáveis por um longo tempo . E é assim que os RAIDs morrem durante a reconstrução.

    
por 26.09.2018 / 10:26
1

O comportamento padrão quando a persistência de estado está habilitada, que eu acho que é o padrão no Debian, é enviar um email diariamente quando um evento crítico é registrado (ou melhor, quando um evento crítico é registrado, se nenhum email correspondente foi enviado em pelo menos um dia, um email é enviado). Você pode alterar esse comportamento usando a opção -M ; adicione

-M once

para o seu smartd.conf , e os eventos críticos só resultarão em um único e-mail, sem repetições.

(A opção -M once é adicional à opção -M exec .)

Para verificar se a persistência de estado está realmente ativada, verifique o conteúdo de /var/lib/smartmontools ; você deve ver arquivos de estado para todas as suas unidades, atualizadas recentemente.

    
por 26.09.2018 / 10:31