O servidor parece estar ativo, mas não aceita conexões alguma

2

Eu tenho um problema com um servidor baseado em Debian, infelizmente alojado em um local remoto. Dois dias atrás, foi de repente para baixo e completamente inacessível. Depois de alguém ter reiniciado, funcionou por cerca de um dia, depois pareceu estar de volta.

Desta vez, no entanto, foi diferente:

-O servidor reage a pings

-É scannable, e todas as portas relevantes estão abertas Mas:

- As cápsulas abertas foram imediatamente bloqueadas e nenhum aviso foi mostrado

-Não é possível abrir nenhuma conexão - o handshake TCP / IP parece ter alguns problemas:

Aperto de mão SSH

Como este é um servidor privado de uma pequena comunidade, não temos recursos para pagar um técnico para corrigir o problema para nós, portanto, quaisquer dicas de como corrigir o problema após a próxima reinicialização serão muito apreciadas. .

    
por Rnatau 11.01.2011 / 13:40

4 respostas

2

Parece que algum processo na máquina está saindo do controle e consumindo tantos recursos que o resto do sistema não pode funcionar. (RAM, CPU, disco IO). (Ou, como outros salientam, pode ser um problema de firewall. Ou algo na rede entre eles).

Mas agora você não tem visibilidade do que está acontecendo. Você precisa disso.

Você deve:

  • configurar o log remoto com o syslog
  • configurar um sistema de monitoramento remoto de algum tipo

E, como o problema parece estar acontecendo rapidamente e atualmente, você também pode adotar uma abordagem ad hoc: execute top remotamente via ssh e deixe-a aberta. Veja o que acontece quando o sistema morre em seguida. Mas, no final das contas, você se beneficiará do registro remoto de qualquer maneira, assim também pode configurar isso.

    
por 11.01.2011 / 14:13
1

Se você tiver acesso fora de banda ao servidor, como console serial ou KVM; você deve entrar e diagnosticar o servidor a partir daí.

Para mim, parece que ou todo o sistema é enforcado (mas o ping é tratado em um nível baixo pelo kernel, e por isso ainda funciona) ou você tem um firewall que está bloqueando você.

    
por 11.01.2011 / 14:55
1

Parece um problema com o firewall. 1. cliente- > Sincronização do servidor 2. servidor- > cliente syn, ack 3. cliente- > ack

A partir da captura de tela, parece que o seu ACK na etapa 3 não está sendo reconhecido pelo servidor. Eu acho que você firewall não permite conexões relacionadas. Você precisaria de uma regra semelhante em seus iptables.

-A INPUT -m state - estado RELACIONADO, ESTABELECIDO -j ACCEPT

    
por 11.01.2011 / 15:32
0

mattdm, ele realmente estava entupido, e com suas dicas eu consegui diagnosticar o script com falha rápido o bastante - um script runsv combinado com um pacote de software atualizado, mas incompatível, levou à criação de milhares de tarefas. .

No entanto, eu ainda estou espantado com o efeito que isso teve: - /

    
por 11.01.2011 / 20:51