Eu olharia meus logs e entraria em contato com a Linode para ajuda.
Atualmente, estou gerenciando alguns servidores para um cliente que executa cerca de 40 sites, sendo quase metade deles sites do WordPress. Atualmente, estamos usando 4 VPS da Linode com os sites distribuídos pelos quatro servidores de maneira relativamente uniforme. Os servidores estão executando a versão mais recente do CentOS e têm cerca de 1 GB de ram cada.
Temos encontrado interrupções recorrentes, mas a interrupção da noite passada foi a mais estranha. Os sites caíram, então eu entrei no Webmin e nosso servidor, servidor de banco de dados, servidor DNS, etc estavam todos para baixo. Eu iniciei o backup e efetuei login via SSH apenas para descobrir que o servidor estava rastreando. A execução do TOP mostrou que nada estava atingindo o servidor com dificuldade e não parecia ter poucos recursos. Olhando para os gráficos do Linode, tudo estava bem antes da interrupção (pelo que pude ver), então houve uma queda acentuada na CPU%, IO, atividade de rede, etc. Logo antes disso, o disco IO era muito alto desde nossos backups noturnos estavam sendo feitos, mas essa era a única atividade importante.
Eu estou um pouco em uma perda com onde eu deveria continuar daqui. O cliente está muito frustrado e com razão.
Quais sugestões você tem para ajudar a solucionar e resolver isso?
Sua ajuda é muito apreciada.
Eu olharia meus logs e entraria em contato com a Linode para ajuda.
Você olhou para troncos?
Talvez a memória tenha acabado, e o assassino da OOM os tenha finalizado. Verificação rápida: executar dmesg
, deve ser visto facilmente nisso.
Em uma nota lateral eu realmente não entendo por que você executaria 4 VPS, cada 1GB grande, em vez de um único VPS com 4GB de RAM.