Eu tenho tentado configurar um novo servidor Ubuntu sem cabeça e tenho tido todos os tipos de problemas com falhas e servidores que não estão mais disponíveis. Inicialmente, pensei que eram problemas de hardware e que o servidor estava falhando - como a máquina fica sem cabeça quando não responde ao ssh ou ao ping, não há muito o que fazer.
Agora acredito que se trata de um problema de rede.
Eu tenho 3 servidores Ubuntu conectados a um único switch conectado a um ponto do Google Wifi. Eles são todos equipamentos de mineração, mas não acho que isso seja relevante.
Em intervalos aleatórios (pode ser de 30 minutos após a inicialização ou 9 horas), todas essas três máquinas param de responder a solicitações pings ou ssh ao mesmo tempo.
O restante da minha rede (em outros dois nós do Google Wifi) está bom e não parece ser afetado.
Existe uma grande quantidade de tráfego no switch que conecta as 3 máquinas (apenas adivinhou observando as luzes no switch).
Quando eu desconecto uma das máquinas do switch, as outras 2 imediatamente começam a responder pings e ssh novamente, quando eu reconecto a máquina depois de 30 segundos todos eles morrem novamente.
Ao tentar depurar o que está acontecendo aqui, tentei várias coisas.
Quando a rede está nesse estado, posso fazer ping em um endereço do meu laptop que está em wi-fi, quando conecto esse laptop ao switch de rede afetado, ele não consegue fazer ping em nada - as 3 máquinas ubuntu ou qualquer outra coisa o resto da rede.
A única exposição que essas máquinas tiveram à Internet pública é ter uma porta não padrão (na faixa 3000) encaminhada para a porta 22 para ssh.
O acesso por senha para ssh está desativado e o acesso é concedido somente por meio de chave pública / privada.
Todas as máquinas foram criadas recentemente na última semana e são o Ubuntu Server 16. Eu não instalei muito sobre elas:
Eu acho que é sobre isso
Eu realmente não sei aonde ir com isso. Estou começando a suspeitar que algo malicioso entrou em uma das máquinas e está participando de algum ataque de DDOS ou algo assim - pela minha velocidade de internet não parece ter sido afetada.
Alguém pode sugerir o que está acontecendo aqui ou como posso depurar ainda mais ou resolver esse problema?
Muitos agradecimentos