Como posso fazer um alerta por código de resposta no Datadog?

1

A ajuda é necessária. Eu quero fazer alarmes se o site der erros 401 502 e assim por diante. No servidor é um agente que envia peças diferentes no datadog. Há tal módulo http_check, e assim como existe tal função.

http_response_status_code - A string or Python regular expression for an HTTP status code. This check will report DOWN for any status code that does not match. This defaults to 1xx, 2xx and 3xx HTTP status codes. For example: 401 or 4\d\d

Aqui está o meu http_check.yml

init_config:
instances:
  - name: My first service
    url: https://example.com
    collect_response_time: true
    timeout: 1
    skip_event: true
    http_response_status_code: 502
    check_certificate_expiration: true
    disable_ssl_validation: false
    days_warning: 7
    days_critical: 3
    tags:
      - url:example.com
      - env:production

Na verdade, tento desligar o nginx e observar que ele enviaria o status. Eu não vejo nada. A tarefa em geral é monitorar os sites e alertar se algo caiu.

    
por James M 04.05.2017 / 09:59

2 respostas

1

Desenvolvedores do datadog conhecem esse problema. Para resolver essa tarefa, precisamos usar uma verificação personalizada como essa - link

Em seguida, precisamos reiniciar o agente no host e imitar um erro. No datadog de eventos, veremos http://example.com returned a status of 503 after 30.0 seconds

Depois disso, podemos criar alertas. Esta verificação personalizada envia todos os códigos, exceto 200.

    
por 05.05.2017 / 17:38
0

Você pode usar (4 | 5) \ d \ d para http_response_status_code.

    
por 05.05.2017 / 07:46