Alertas de latência de disco do Munin

1

Configurei meu servidor e alertas Munin e testei-os também. Eu configurei os alertas para uso do disco como abaixo:

df._dev_mapper_centos_root.warning 90
df._dev_md126p2.warning 90
df._dev_md126p1.warning 90
df._dev_mapper_centos_home.warning 90

Recebi o alerta acima (para testes mantive os valores mais baixos) no meu email:

>  sha :: Server2 :: Disk usage in percent
>         WARNINGs: /boot is 33.48 (outside range [:33]), / is 17.95 (outside range [:17]), /boot/efi is 4.73 (outside range [:4]).
> 
> sha :: Server1 :: Disk usage in percent
>         OKs: /boot is 33.48, / is 17.95, /boot/efi is 4.73

O problema que estou enfrentando agora é que estou recebendo Alertas de Latência de Disco e não consigo encontrar nenhum valor para alterar os alertas. Aqui estão alguns alertas desencadeados por Munin:

> sha :: Server1 :: Disk latency per device :: Average latency
> for /dev/centos/swap
>         WARNINGs: Write IO Wait time is 4.89 (outside range [0:3]).
> 
> sha :: Server1 :: Disk latency per device :: Average latency
> for /dev/centos/home
>         WARNINGs: Write IO Wait time is 10.64 (outside range [0:3])

.

Embora o gráfico de latência de disco por dispositivo esteja presente para este servidor, mas quando eu faço telnet para o nó, não recebo nenhum plug-in para que ele obtenha o valor:

telnet 192.168.10.252 4949
Trying 192.168.10.252...
Connected to 192.168.10.252.
Escape character is '^]'.
# munin node at localhost.localdomain
list
acpi cpu df df_inode entropy exim_mailqueue forks fw_conntrack 
fw_forwarded_local fw_packets hddtemp_smartctl if_enp2s0 if_err_enp2s0 
interrupts irqstats load memory netstat open_files open_inodes 
postfix_mailqueue proc_pri processes swap threads uptime users vmstat

Eu não tenho certeza se expliquei corretamente ou não, e desculpe se você acha que é uma pergunta boba. Eu só quero parar esses alertas completamente ou definir o valor alto. Espero receber ajuda aqui.

    
por Daud Zeb 09.05.2017 / 17:26

1 resposta

1

É provavelmente o plug-in diskstats_latency , tente o seguinte:

diskstats_latency.centos_home.avgwrwait.warning 0:15
diskstats_latency.centos_home.avgrdwait.warning 0:15
diskstats_latency.centos_swap.avgwrwait.warning 0:15
diskstats_latency.centos_swap.avgrdwait.warning 0:15

Por favor, note que isto é para a latência write ( avgwrwait ) e leitura ( avgrdwait ).

Defina o intervalo para 0:15, o que desativa quase completamente os avisos que você deseja.

Não se esqueça de reiniciar o daemon munin

systemctl restart munin-node
    
por 20.06.2017 / 09:12