O melhor plugin nagios para SMART? [fechadas]

4

Eu tentei o melhor plugin para nagios para o monitoramento SMART. Existem alguns, mas apenas monitorando a temperatura. Mas com o smartctl podemos encontrar mais dados. Você tem alguns plugins melhores com todos os dados do smart?

    
por Rafał Kamiński 09.11.2012 / 15:51

2 respostas

11

O plug-in check_ide_smart faz parte do grupo de plug-ins nagios padrão. Apesar da parte "ide" do nome, ele usa smartctl para verificar qualquer drive que o smartctl suporte.

Ele pode retornar a saída adequada do nagios, por exemplo:

$ ./check_ide_smart -n -d /dev/sda
OK - Operational (17/17 tests passed)

Ou o status completo do SMART:

$ ./check_ide_smart -d /dev/sda
Id=  1, Status=11 {PreFailure , OnLine }, Value=100, Threshold= 16, Passed
Id=  2, Status= 5 {PreFailure , OffLine}, Value=100, Threshold= 50, Passed
Id=  3, Status= 7 {PreFailure , OnLine }, Value=120, Threshold= 24, Passed
Id=  4, Status=18 {Advisory    , OnLine }, Value=100, Threshold=  0, Passed
Id=  5, Status=51 {PreFailure , OnLine }, Value=100, Threshold=  5, Passed
Id=  7, Status=11 {PreFailure , OnLine }, Value=100, Threshold= 67, Passed
Id=  8, Status= 5 {PreFailure , OffLine}, Value=100, Threshold= 20, Passed
Id=  9, Status=18 {Advisory    , OnLine }, Value= 96, Threshold=  0, Passed
Id= 10, Status=19 {PreFailure , OnLine }, Value=100, Threshold= 60, Passed
Id= 12, Status=50 {Advisory    , OnLine }, Value=100, Threshold=  0, Passed
Id=192, Status=50 {Advisory    , OnLine }, Value= 99, Threshold= 50, Passed
Id=193, Status=18 {Advisory    , OnLine }, Value= 99, Threshold= 50, Passed
Id=194, Status= 2 {Advisory    , OnLine }, Value=144, Threshold=  0, Passed
Id=196, Status=50 {Advisory    , OnLine }, Value=100, Threshold=  0, Passed
Id=197, Status=34 {Advisory    , OnLine }, Value=100, Threshold=  0, Passed
Id=198, Status= 8 {Advisory    , OffLine}, Value=100, Threshold=  0, Passed
Id=199, Status=10 {Advisory    , OnLine }, Value=200, Threshold=  0, Passed
OffLineStatus=0 {NeverStarted}, AutoOffLine=No, OffLineTimeout=30 minutes
OffLineCapability=91 {Immediate Auto SuspendOnCmd}
SmartRevision=16, CheckSum=23, SmartCapability=3 {SaveOnStandBy AutoSave}
    
por 09.11.2012 / 18:27
2

Eu usei o plug-in: check_ide_smart; no entanto, acabei descobrindo que ele não me notificou sobre erros no registro inteligente no disco.

O bug do problema aparentemente ainda está aberto após 5 anos?

# 473 check_ide_smart ignora os erros da SMART! link

Agora estou ativando um daemon smartd mais detalhado em cada sistema. Eu então terei nagios me avisar se esse processo parar. Eu posso ter outra verificação e reiniciar se não estiver em execução no cron.

A partir do smartd.conf:

Primeiro disco rígido ATA / IDE principal. Monitore todos os atributos, ative    coleta de dados on-line automática, autosave de atributo automático e    iniciar um auto-teste curto todos os dias entre as 2h e um auto-teste longo    Sábados entre 3-4 am.    relatar alterações de temperatura bruta > = 5 Celsius

smartd.conf

DEVICESCAN -H -m raiz -a -o on -S on -s (S /../.././ 02 | L /../../ 6/03) -W 5

    
por 21.01.2015 / 21:58