Alerta do AWS CloudWatch para métrica de espaço em disco interrompida após a reinicialização

1

Tenho notado que, ao criar um alarme para o monitoramento de uso de disco de um volume de ebs montado com o nvme nos tipos de instância ec2 mais recentes, o "dispositivo" é enviado como uma dimensão métrica. O problema é que o nome do dispositivo nvme pode mudar quando a instância do ec2 é reinicializada, então o alarme de configuração anterior não está mais monitorando os dados da métrica correta.

Estou usando o CloudWatch Agent para enviar as métricas da instância ec2 link em um servidor ubuntu 16.04, as dimensões anexadas à métrica para disk_used_percent são:

"path", "/home", "host", "ip-xxx-xxx-xxx-xxx", "device", "nvme1n1", "fstype", "ext4"

Descobri que omitir qualquer uma dessas dimensões do alarme não associou o alarme à métrica, portanto, suponho que todas elas sejam necessárias para que um alarme seja vinculado à métrica correta.

Quando eu reiniciar o servidor, as dimensões podem mudar para:

"path", "/home", "host", "ip-xxx-xxx-xxx-xxx", "device", "nvme3n1", "fstype", "ext4"

O dispositivo foi alterado e o alarme dessa métrica não está mais associado a nenhuma métrica, pois as dimensões não são mais correspondentes.

Eu examinei a configuração do agente para ver se existe uma maneira de alterar as dimensões que são enviadas, mas não consigo encontrar nenhuma maneira de fazer isso link

Ele realmente precisa apenas que as dimensões path e host sejam enviadas para que sejam exclusivas, de modo que eu possa omitir as dimensões device e fstype , se possível.

Como posso ter um alarme capaz de persistir nas reinicializações da instância ec2 sem precisar ser reconfigurado?

    
por JamieD 21.11.2018 / 11:39

0 respostas