Rede externa (eth0) aleatoriamente congelada, tem que ifdown && ifup

2

A interface de rede externa (eth0) em um de nossos servidores está congelando periodicamente. Ele também tem uma interface de rede local (eth1), então eu posso conectar ao servidor através de um dos outros servidores na mesma rede. Todas as conexões através da rede externa - como o SSH da minha máquina local, o ping da minha máquina local, o SSH de um servidor de desenvolvimento em uma rede diferente - todo o tempo limite. Ao conectar-se através de um dos outros servidores em sua rede local, posso executar sudo ifdown eth0 && sudo ifup eth0 e a interface funciona magicamente novamente. Se eu tentar o comando ifup primeiro, em vez de desativar a interface, será exibida uma mensagem de erro informando que a interface já está ativa.

Como solução alternativa, tentei adicionar a seguinte linha ao meu crontab raiz:

55 1 * * * ifdown eth0 && ifup eth0 &> /dev/null

Confusamente, isso não resolve o problema. Um trabalho de backup executado 5 minutos depois não pode copiar os arquivos para uma máquina fora da rede local.

Você pode ver a saída de sudo dmesg aqui .

O servidor é um HP ProLiant DL360 G5 com o Ubuntu Lucid (10.04). Agradecemos antecipadamente por qualquer ajuda sobre como rastrear este problema e resolvê-lo!

    
por Brandon Konkle 15.11.2010 / 16:48

1 resposta

2

1- Você pode monitorar o tráfego nesta interface usando o comando:

sudo tcpdump -i eth0 -s 1518 -XX -vv -n -w /tmp/trace_file.pcap

Tente se conectar e ver se a interface recebe algum tráfego.

2- Verifique se você pode acessar outras máquinas a partir deste servidor que não seja para este servidor usando eth0.

3- Verifique o status da interface usando: ethtool eth0 .

4- Verifique o status da interface usando os arquivos sys em /sys/class/net/eth0/*

5- Verifique o status do seu firewall (ativo ou inativo) e verifique as regras, se houver.

6- Verifique as mensagens de depuração do kernel usando dmesg e verifique o arquivo de log do sistema / var / log / messages em busca de erros / avisos.

Espero que isso ajude!

    
por 15.11.2010 / 17:03