Diagnosticando a conectividade de rede perdida no Ubuntu

1

Minha primeira pergunta aqui, por favor, seja gentil. :) Eu tenho um Linode rodando o Ubuntu 14.04, com uma pilha gerenciada pelo ServerPilot.io.

Apenas a modificação real é que estou executando o HHVM de maneira limitada.

Hoje à noite nós tivemos uma ocorrência estranha. Recebi uma notificação de que os sites estavam inativos. Após a investigação, não consegui me conectar ao servidor em todo o SSH e pings não foram retornados.

Eu entrei através do console de suprimentos Linode e tudo parecia normal. Todos os serviços esperados estavam ativos, mas não consegui me conectar a nenhum host externo via ping, telnet, etc.

Basicamente, parece que a rede foi desligada.

Já faz alguns anos desde que eu fiz a administração do sistema * nix, então depois de procurar em todos os logs que eu encontrei, eu desisti e reiniciei o servidor e tudo está bem novamente.

Estou curioso para saber se alguém pode me apontar para os logs que eu deveria estar vendo na próxima vez que isso acontecer, para que eu possa determinar porque isso aconteceu, consertá-lo e impedir que isso aconteça novamente:)

Qualquer experiência que você tenha tido com esse tipo de coisa seria muito apreciada!

P.S. A única outra coisa digna de nota foi que a CPU e o tráfego de rede aumentaram consideravelmente antes da interrupção. Os gráficos estão aqui: link

    
por clifgriffin 07.11.2014 / 06:29

1 resposta

1

No seu caso, eu teria tentado obter o backup da rede emitindo:

ifdown eth0
ifup eth0

e só reinicializar depois disso não funcionaria.

Como não consigo ver se o tráfego da rede estava saindo ou entrando, nem se você indica o que está realmente sendo executado nos servidores, é difícil dizer o que aconteceu.

Você pode ver nos logs se algumas solicitações http dispendiosas (com uso da CPU) estavam sendo feitas?

Pode ser que o sistema tenha sido "desativado" pelo seu provedor devido à quantidade excessiva de tráfego e que a rede não tentou se reconectar depois que sua conexão com a Internet foi restabelecida.

Existe, é claro, uma chance de o sistema estar comprometido. Espero que você tenha mantido atualizado com os patches de segurança.

    
por 07.11.2014 / 12:05