Os sintomas são que, após um determinado período de tempo (digamos, de 30 minutos a 10 horas), todas as três de minhas máquinas conectadas ao mesmo switch param de responder a pings ou ssh.
Eu finalmente descobri que isso ocorre porque uma das máquinas (e a máquina que causa isso pode mudar) de repente começa a inundar a rede com os seguintes pacotes:
20:10:26.441796 MPCP, Opcode Pause, length 46
20:10:26.442321 MPCP, Opcode Pause, length 46
20:10:26.442845 MPCP, Opcode Pause, length 46
Isso interrompe absolutamente todas as atividades da rede e, como essas três máquinas estão sem cabeça, foi muito difícil descobrir isso.
Todas as 3 máquinas são idênticas do Ubuntu Server 16.4, sem muita instalação nelas. Motherboard (que eu suspeito que seja a raiz do problema) é a ASRock H110 Pro BTC +
Eles são todos equipamentos de mineração, então, basicamente temos os drivers tmux, nano, nvidia, software de mineração (Claymore), node, git, ssh e isso é tudo.
Eu re-instalei todas as 3 máquinas e o problema se repete em uma nova instalação.
Atualizei e atualizei todos os pacotes.
Agora que descobri o que está quebrando a rede, REALMENTE espero que alguém possa me ajudar com uma solução!
De joelhos implorando !!
Obrigado