O servidor Ubuntu trava por 5 segundos com frequência

2

Eu tenho um servidor que fica pendurado por um total de 5 segundos a cada 2 a 5 minutos no horário de pico. O horário de pico será de 6 ou mais horas.

As especificações do servidor são:

Ubuntu Linux:    12.04.1
Kernel and CPU:  Linux 3.0.0-17-server on x86_64
Processor info:  Intel(R) Xeon(R) CPU E31230 @ 3.20GHz, 8 cores
Ram: 6GB only 1.20GB used at peak

Estou executando o pacote LAMP mais recente com o PHP-APC. O servidor está localizado atrás de um proxy protegido. Quando executo netstat -anp | grep 'tcp\|udp' | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n , recebo 18099 , o que é normal para a natureza do site. Todos eles são conexões legítimas que atingem o servidor a partir de 1 IP.

Eu tenho o apache.conf prefork_module ajustado e mudei muitas vezes sem nenhum efeito de resolver o problema.

Eu assisti todo o processo para ver se algum pico, nenhum deles. O disco IO no pico é 67% idle . Eu tenho bastante memória RAM disponível e nunca troca. O servidor funciona muito bem, então ele age como se quisesse dar um intervalo de 5 segundos e quando ele retorna, ele pode lidar com o que ele perdeu durante os 5 segundos.

Não há nada no apache error.log que sugira qualquer coisa.

Sinto que algo está ficando limitado e não posso apontar o que é. Eu meio que quero dizer que é algo com a quantidade de conexões que tenho como se estivesse atingindo algum tipo de limite de conexão. Eu queria saber se vocês tinham alguma ideia do que poderia ser ou algo que eu pudesse correr para ver.

Atualizar

O servidor responde bem quando o visita diretamente via IP, não através do domínio. Então, quando eu testo ao mesmo tempo quando ele fica paralisado por 5 segundos, o domínio não responde, mas o IP responde bem, então isso me faz pensar que é o sistema operacional do servidor fazendo isso

Eu consegui ver [apache2] <defunct> apenas um ou dois lá não tenho certeza se isso é o suficiente para causar o travamento, mas ele só aparece quando ele dá e apache não me dá nada sobre isso no log de erro .

Atualização 1/20/2013

Meu datacenter construirá um novo servidor e fará com que eu mude. Eu tenho dois outros servidores idênticos no mesmo rack mesma configuração mesma quantidade de tráfego e isso é o único me dando um problema.

    
por Abby E 19.01.2013 / 22:19

3 respostas

1

Isso soa suspeitamente como uma falha na unidade. Puxe um relatório inteligente para suas unidades e substitua qualquer um que tenha um grande número de setores realocados ou outros erros.

    
por 19.01.2013 / 23:00
1

Eu tive um problema como este há cerca de 5 anos. A máquina inteira ficaria incrivelmente dura por 5 segundos (e você não poderia fazer nada naquele momento). Descobriu-se que algo na placa-mãe havia corrido mal e a garantia ainda estava ativa, então não olhei mais para ela. De qualquer forma, você pode querer verificar lá, se a unidade não é o problema.

    
por 19.01.2013 / 23:52
0

Uma possibilidade é um problema de servidor de nomes (o apache, entre outros, pode fazer pesquisas de DNS para fins de registro e falhar silenciosamente)

Verifique se os servidores DNS estão configurados corretamente e o servidor pode fazer pesquisas de DNS. Se os servidores DNS estiverem indisponíveis, verifique se a configuração do apache2 usa pesquisas de DNS.

    
por 20.01.2013 / 02:01

Tags