Postgres 9.0 bloqueando, 100% da CPU

2

Estamos com um problema em que nosso servidor Postgres 9.0 ocasionalmente trava e mata nossa aplicação web. Reiniciar o Postgres resolve o problema.

Veja o que consegui observar:

  • Primeiro, o uso de uma CPU aumenta para 100% por alguns minutos
    • As operações de disco caem para ~ 0 durante esse tempo
    • As operações do banco de dados caem para 0 (blocos e tuplas por segundo)
    • Registros são exibidos durante esse período:
      • AVISO: o trabalhador demorou muito para começar; cancelado
      • AVISO: o trabalhador demorou muito para começar; cancelado
      • Nenhuma consulta nos logs (somente aqueles com mais de 200ms são registrados)
    • Nenhuma consulta incomumente demorada registrada antes ou durante
  • Então a segunda CPU pula para 100%
    • O número de processos postgres salta dos usuais 8-10 para ~ 20
    • Corresponde a um pico nos Blocos de Postgres por segundo (cerca de duas vezes normais)
    • Logs mostram
      • LOG: não foi possível aceitar a conexão SSL: EOF detectado
      • As consultas estão em execução, mas são lentas
  • Reiniciar postgres retorna tudo ao normal

Configuração:

Server: Amazon EC2 Large
Ubuntu 10.04.2 LTS
Postgres 9.0.3
Dedicated DB server

Alguém tem alguma ideia do que está causando isso? Ou alguma sugestão sobre o que mais eu deveria estar verificando?

    
por Jake 05.07.2012 / 03:29

1 resposta

0

Certifique-se de que você não está ficando sem memória e causando problemas de remoção de disco.

Se você tiver bastante memória aberta, vá diretamente para o PostgreSQL e procure por uma consulta incorreta.

SELECT * FROM pg_stat_activity;
    
por 02.06.2015 / 05:21

Tags