apache2 com mod_fcgid aleatoriamente trava

1

Eu tive esta configuração em execução no Ubuntu 11.10 por mais de um ano. Eu tive que mover o serviço para um servidor maior, então fiz uma cópia completa do disco do os com o clonezilla e o restaurei para o novo servidor. Eu atualizei o sistema operacional no novo servidor para 12.04. Todas as outras coisas são idênticas nos dois sistemas.

Meu problema é este: O Apache corre bem e está longe do limite de maxclients. De repente, o php5-cgi gera mais e mais processos, eles estão todos em estado "funcionando", e o apache não pode mais receber solicitações do servidor. Todas as solicitações do apache se transformam no estado "W" e ficam lá, enquanto novas solicitações estão chegando e, eventualmente, todas as solicitações se acumulam na configuração maxclients. 1 minuto depois todos os processos fcgi repentinamente transformam seu estado em "pronto" e tudo volta ao normal.

Durante o tempo que isso acontece, o Apache não server o site. Parece que o fcgi simplesmente trava e pára de responder. "top" não mostra nada, tudo parece bem, nenhum processo no estado D ou qualquer coisa. O log de erros do Apache diz que o fcgid não pode aplicar o slot do processo, quando isso acontece. Mas eu não entendo porque de repente isso começou. Meu único pensamento seria que algo está quebrado durante a atualização de 11,10 para 12,04. Mas por que isso acontece tão aleatoriamente, independentemente do uso, da carga ou de qualquer outra coisa?

Apreciará muito qualquer ajuda!

Dito tudo isso, quero perguntar se alguém sabe por que a configuração quebrou?

    
por Klein 26.01.2014 / 14:45

1 resposta

0

Embora possa ser fascinante descobrir exatamente por que essa combinação depende de sua situação específica, é uma situação bastante incomum (sistema operacional antigo, clonado em uma máquina diferente e depois com upgrade de distro) e pode até não ser nada disso. história que é o problema.

Uma abordagem mais pragmática seria instalar o 12.04 a partir do zero e reinstalar tudo o que você precisar para descartar a história longa e colorida do sistema operacional como a causa do problema.

É aqui que um sistema de gerenciamento de configuração como o Puppet, o CFEngine ou o SaltStack, ou qualquer um de uma dúzia de outros, ganha seu sustento.

    
por 26.01.2014 / 17:38