ubuntu sair com esta mensagem: bloqueado por mais de 120 segundos

3

Estou executando um virtualMachine no ESXi - Ubuntu como um servidor da web - (apache2 com nginx como proxy, php, mysql) e os serviços ficam suspensos / congelados, fazendo com que o servidor inteiro não responda. Não é possível conectar-se a ele pelo ssh, basicamente requer uma reinicialização do vSphere para voltar a ficar on-line.

Descrição: Ubuntu 10.04.1 LTS Release: 10.04 Codename: lucid

no vSphere Eu vejo esta mensagem quando meu servidor está inacessível :: INFO: task: apache2 (ou mysql ou nginx) bloqueado por mais de 120 segundos. "echo 0 > / proc / sys / kernel / hung_task_sys_timeout_secs" desativa esta mensagem

Eu acho que provavelmente isso acontece em alto tráfego em meus sites, o que eu poderia fazer?

obrigado

    
por m mov 22.10.2012 / 08:14

1 resposta

1

Você está atingindo o tempo limite de uma tarefa suspensa, enquanto o sistema está aguardando pela conclusão de alguns recursos (talvez E / S completos) que não estão disponíveis no momento. Eu recomendaria primeiro coletar alguns dados de verificação com quaisquer dados do sar ou usar ferramentas como iostats e vmstat para identificar as cargas e os tempos em que o congelamento / travamento ocorre. Você poderia escrever um pequeno cron job para isso.

ex: sar -A 1 30 > /tmp/sar_-A.out.txt & vmstat 1 30 > /tmp/vmstat.out.txt & iostat -tkx 1 30 > /tmp/iostat_-x.out.txt & ps aufx > /tmp/ps_aux.out.txt &

Obtenha também um dump de thread do kernel usando: "echo t | sudo tee / proc / sysrq-trigger", pois isso ajudaria a determinar, até certo ponto, o que o processo do apache está aguardando.

Como alternativa, você pode configurar crashdump quando seu sistema estiver em estado suspenso e obter um arquivo vmcore, se você são mais aventureiros para fazer uma análise de despejo.

    
por askb 13.05.2014 / 13:38