Estamos tendo um problema com um VPS executando o plesk 9.5 no ubuntu 8.04
Em intervalos aparentemente aleatórios, o Apache desaparecerá e precisará ser iniciado manualmente.
Verifiquei o log de erros do apache, / var / log / messages, arquivos de erro individuais do apache do host virtual e não consigo encontrar nada que coincida com o tempo da falha. O dmesg está vazio, o que é um pouco estranho.
Também tivemos o serviço psa sem nenhum motivo aparente, mas o apache permanece.
Não consigo diagnosticar isso porque todos os arquivos de log que eu posso encontrar não apontam para nenhum problema. Há outros que eu possa olhar?
O uso da memória fica em torno de 55% (de 400MB) e não é um servidor com tráfego particularmente alto.
Qualquer indicação de onde mais eu possa descobrir o que está acontecendo seria muito apreciada.
Nick
Atualização:
Eu tenho estado vigiando há algum tempo e isso está reiniciando processos quando eles caem. Infelizmente, muitas vezes é mais do que o apache que desce (embora às vezes seja apenas um apache). Parece não haver um padrão para isso. Nós também recebemos correio e qmail indo para baixo.
De qualquer forma, eu aumentei o nível de registro para o apache e notei o seguinte
[Mon Mar 07 16:46:14 2011] [info] server seems busy, (you may need to increase StartServers, or Min/MaxSpareServers), spawning 8 children, there are 0 idle, and 21 total children
[Mon Mar 07 16:49:56 2011] [info] server seems busy, (you may need to increase StartServers, or Min/MaxSpareServers), spawning 8 children, there are 0 idle, and 12 total children
[Mon Mar 07 16:50:08 2011] [info] server seems busy, (you may need to increase StartServers, or Min/MaxSpareServers), spawning 8 children, there are 0 idle, and 28 total children
[Mon Mar 07 16:50:09 2011] [info] server seems busy, (you may need to increase StartServers, or Min/MaxSpareServers), spawning 16 children, there are 0 idle, and 36 total children
[Mon Mar 07 16:50:14 2011] [info] [client ipaddressofserver] (32)Broken pipe: core_output_filter: writing data to the network
[Mon Mar 07 16:50:14 2011] [info] removed PID file /var/run/apache2.pid (pid=9556)
[Mon Mar 07 16:50:14 2011] [notice] caught SIGWINCH, shutting down gracefully
[Mon Mar 07 16:50:18 2011] [emerg] (22)Invalid argument: mod_fcgid: can't get lock, pid: 9557
[Mon Mar 07 16:50:24 2011] [info] Init: Seeding PRNG with 0 bytes of entropy
Eu já estive aumentando os minmaxspareservers, mas lentamente e mantendo um olho no uso da memória. Certamente isso não pode estar causando falha no apache, no correio e no qmail?
Qualquer ajuda sobre as entradas de log e o que eles indicam seria apreciada
Felicidades
Nick