problema muito estranho de falha / rede do servidor

0

TLDR

Eu tenho 3 caixas de linux. Eles estavam correndo sem problemas por 9, 6 e 3 horas aproximadamente. Todos eles pararam de responder ao ssh e pings ao mesmo tempo.

Reiniciar / verificar a rede não resolveu nada.

Reiniciado caixa C, tem a start job is running for raise network interfaces mas ainda não pings

Reiniciado caixa B - começou a receber pings em A e C

Como a caixa B pode parar a caixa A e C respondendo. O resto da minha rede estava bem.

Atualização:

Também aconteceu na manhã seguinte. Todas as 3 caixas caíram ao mesmo tempo. Eu desliguei a caixa B e as outras 2 tornaram-se responsivas novamente.

Eu também tentei executar um cabo de rede física para as máquinas e isso também não ajudou.

História Completa

Tenho tido muitos problemas com confiabilidade em minhas caixas de linux que estou tentando configurar. Eu tenho 2 máquinas, A, B e C.

Essas caixas são plataformas de mineração e estou tentando restringir onde o problema de hardware está em um deles, que o impede de reiniciar / deixar de responder.

No entanto, acho que agora isso pode ser um problema de rede. Os sintomas são que eles não respondem completamente ao ssh - não consigo nem sair do meu cliente e tenho que fechá-lo com força.

Eu tinha assumido que isso acontecia porque a máquina tinha caído (todas as três máquinas estão sem cabeça, então não posso olhar na tela para ver o que está acontecendo).

Hoje à noite eu estava rodando as máquinas o dia todo para garantir que a atual configuração de hardware cortada fosse estável. As máquinas estavam funcionando por 9 horas, 6 horas e 3 horas - ou algo assim.

Eu recebi o problema do ssh sem resposta exatamente ao mesmo tempo nas três máquinas. Eu também não pude fazer ping nas máquinas.

Neste ponto, assumi um problema de rede e, se eu reiniciei a rede, os pings voltariam.

Eu verifiquei a rede (Google WiFi) e tudo parecia bem, mas eu reiniciei mesmo assim e não consegui nada.

Eu reiniciei a caixa C. Eu assisti a inicialização e ficou preso em

a start job is running for raise network interfaces

e esperei 5 minutos antes de concluir a inicialização, e ainda não consegui fazer o ping.

Eu reiniciei a caixa B

No ponto em que comecei a receber pings da caixa A e C novamente ..... !!!

O que está acontecendo aqui? Como a caixa B pode acabar com todas as comunicações de rede na caixa A e C!

Estou totalmente desorientada!

As caixas são todas a versão mais recente do Ubuntu Server (16 algo)

    
por Roaders 07.01.2018 / 23:57

0 respostas