Servidor inacessível, a melhor maneira de descobrir a causa?

1

Estou executando o debian squeeze em um servidor dedicado alugado e, nos últimos tempos, o servidor fica mais inacessível de um momento para o outro com qualquer serviço externo.

Durante este tempo de inatividade, os crontabs etc. estão funcionando normalmente e eu não consegui encontrar nenhum clou de uma falha ou relacionado em nenhum logfiles.

Para recuperar o controle, basta reiniciá-lo pela interface da web do meu provedor.

Com relação a este tópico: travamento da rede do Linux: melhores passos para descobrir a causa? Eu enfrentei meu provedor com este problema, mas eles não conseguiram encontrar nenhum problema com o NIC ou com a placa de rede, mas eles mudaram completamente o hardware do servidor (exceto o HDD).

Como eu poderia me aproximar da fonte que causou essas interrupções?

Infelizmente, não tenho acesso ao servidor quando ele está inacessível externamente, para fazer qualquer teste.

Enquanto o servidor estiver inacessível, "arp -na" retornará "em < incompleto > em eth0". (Eu fiz um crontab simples que verifica esse estado) No syslog não consigo encontrar nenhuma informação relacionada a este problema.

puck:/home# route -n
Kernel-IP-Routentabelle
Ziel            Router          Genmask         Flags Metric Ref    Use Iface
xx.xx.xxx.xxx   0.0.0.0         255.255.255.192 U     0      0        0 eth0
0.0.0.0         xx.xx.xxx.xxx   0.0.0.0         UG    0      0        0 eth0

puck:/home# arp -na
? (xx.xx.xxx.xxx) auf 00:00:5e:00:01:01 [ether] auf eth0

puck:/home# ethtool eth0
Settings for eth0:
        Supported ports: [ TP MII ]
        Supported link modes:   10baseT/Half 10baseT/Full
                                100baseT/Half 100baseT/Full
                                1000baseT/Half 1000baseT/Full
        Supports auto-negotiation: Yes
        Advertised link modes:  10baseT/Half 10baseT/Full
                                100baseT/Half 100baseT/Full
                                1000baseT/Half 1000baseT/Full
        Advertised pause frame use: Symmetric Receive-only
        Advertised auto-negotiation: Yes
        Speed: 100Mb/s
        Duplex: Full
        Port: MII
        PHYAD: 1
        Transceiver: external
        Auto-negotiation: on
        Supports Wake-on: g
        Wake-on: g
        Current message level: 0x000000ff (255)
        Link detected: yes

Minhas interfaces:

auto lo
iface lo inet loopback

# ethernet interface

auto eth0
iface eth0 inet static
  address xxx.xxx.xxx.xxx
  network xxx.xxx.xxx.yyy
  netmask 255.255.255.yyy
  broadcast xxx.xxx.xxx.255
  gateway xxx.xxx.zzz.zzz

# virtual interfaces

auto eth0:1
iface eth0:1 inet static
address xxx.xxx.xxx.xxx
netmask 255.255.255.255

auto eth0:2
iface eth0:2 inet static
address xxx.xxx.xxx.xxx
netmask 255.255.255.255


auto eth0:3
iface eth0:3 inet static
address xxx.xxx.xxx.xxx
netmask 255.255.255.255
    
por heuri 28.07.2012 / 19:57

1 resposta

1

tente adicionar mais trabalhos agendados que sejam executados a cada minuto e faça o login:

  • verdade que o trabalho é executado [date > > log]
  • conteúdo da tabela arp, configuração ip [arp -n > > registro; ip a > > log]
  • estado da interface de rede [ethtool -i eth > > log]
  • as mensagens de log também não afetarão você [dmesg -c > > log]
  • resultado do ping para o roteador, ping para alguns hosts 'vizinhos' da mesma sub-rede.
  • forçar a sincronização para uma boa medida

isso deve ajudá-lo a determinar se essa é a máquina inteira que congela ou apenas os problemas de rede e, em caso afirmativo, onde eles começam.

cam será conflito de endereço ip ou melhor caso de mac duplicate no mesmo segmento?

    
por 28.07.2012 / 21:35

Tags