Por que este servidor está falhando? [fechadas]

1

Meu servidor falhou três vezes, (duas vezes menos de 24 horas atrás) e uma vez há uma semana. Cada vez, o servidor não era pingável, até o host reinicializar a máquina. É um servidor dedicado na ServerPronto com 4 GB de RAM, dual ou quad cpu com 3.1 ghz, localizado na Flórida, eu acho. Mais poder suficiente para lidar com a carga com toneladas de cpu de sobra. O buffer pool Innodb possui memória suficiente (1.3gb) para ter toda a tabela mysql na memória com espaço extra. A APC tem mais memória suficiente também.

Eu tenho o New Relic instalado no meu servidor. Cada uma das 3 vezes, verifiquei o uso da CPU, uso de memória, espaço em disco, IO de rede e todos eles eram completamente estáveis. Eu olhei para os tempos de resposta para pedidos e eles eram todos minimamente normais. Meu servidor recebeu 500 solicitações por minuto, durante a hora que levou à falha: isso é muito normal para o meu servidor. Então, de repente, sem picos, os pedidos por minuto caíram para 0! A média de carga foi de 0,05 (muito pequena, mas normal para o meu servidor), o uso de memória foi de 30%, também normal, a rede IO estava em 400 KB / seg, também normal. O disco IO estava em 1-2%, também normal. O arquivo de log deve estar funcionando porque vejo os avisos padrão nos arquivos de log do apache, mas não há erros antes da falha.

O último desligamento ocorreu durante um período em que meu tráfego recebe uma quantidade mínima de tráfego da web.

Além disso, não há trabalhos agendados em execução no momento dos incidentes. Não há erros ou avisos nos logs de erros, logs do PHP / mysql no momento do desligamento. Nenhum IDEs ou conexões SSH foram abertos para o servidor no momento do desligamento.

Cada vez que ele cai, assim que o reinício acontece, tudo funciona novamente.

Estou usando o mesmo software há 2,5 anos em dois dos meus hosts anteriores e não tive esse tipo de problema. Além disso, não fiz alterações de código no último mês (para o aplicativo atualmente em execução).

Quando eu configurei esta máquina pela primeira vez com o serverPronto há cerca de um mês, eles tiveram algum problema de hardware com o cabo na minha máquina: Não é um bom começo. Mas eles consertaram isso, e eu não tive nenhum problema por cerca de 4 semanas (exceto por uma interrupção de 10 minutos que não exigiu a reinicialização do servidor)

Considerando todas essas informações, isso significa que o ServerPronto (meu host) está tendo um problema / problema de hardware atualmente? ou existe outra possibilidade?

    
por Pascal Aschwanden 31.12.2013 / 19:54

1 resposta

4

When I first set up this machine with serverPronto about 1 month ago,

Más notícias. Eles ainda têm problemas de hardware. Simples assim.

Se você tem os drivers corretos instalados, a resposta é trivial - há hardware quebrado envolvido.

    
por 31.12.2013 / 19:58