Linux: o programa ip neigh diz “FAILED”. O que pode ser a causa?

6

Eu corro um servidor Linux em uma sub-rede que não está sob meu controle. De tempos em tempos, o servidor não pode ser acessado de fora (a Internet) por alguns segundos. Estou tentando descobrir por que e comecei a dar uma olhada na saída de ip neigh show (gravada em um arquivo regularmente com uma tarefa cron).

Na próxima vez em que aconteceu, olhei o arquivo e ele leu:

fe80::1 dev eth0 lladdr 00:22:64:b6:10:5c router STALE
192.168.14.1 dev eth0  FAILED

Para mim, isso parece que o gateway (que é 192.168.14.1) não responde em solicitações ARP feitas pelo servidor. Está correto?

Eu estava tentando encontrar mais informações, principalmente no código-fonte iproute2 , mas não localizei sob qual condição ele seria escrito como FAILED. Mas talvez seja porque eu não sou um desenvolvedor C.

    
por Daniel 13.02.2013 / 14:17

2 respostas

3

Uma saída de FAILED no cache de arp indica que seu servidor não conseguiu acessar o gateway. Você pode testar isso em sua LAN, mas pingar qualquer PC em sua LAN, verificar o status do arp, desconectar o PC e verificar o status do arp. Você notará a mudança de estado de REACHABLE para FAILED. Da mesma forma, se você enviar uma solicitação icmp e o gateway responder, o endereço MAC do gateway será incluído na saída quando você executar o comando ip neigh show ou arp -a . O estado será REACHABLE no início, mas se houver um problema na conectividade, poderá alterar o estado para FAILED . Você pode notar estados intermediários de DELAY e PROBE enquanto tenta alcançar o gateway antes de rotulá-lo como com falha.

Para identificar a causa, você precisa de ping de vários hosts em sua sub-rede e verificar seu status de cache de arps conforme ocorre o problema de conectividade. Se apenas o gateway for exibido como com falha, enquanto os outros hosts estiverem ok, o problema estará entre o servidor e o gateway. Se todos os hosts forem mostrados como defeituosos, o problema poderia ser a conectividade entre o servidor e o switch ou apenas um problema no cabo.

    
por 13.02.2013 / 16:35
1

Isso pode ser um problema com seu sistema, com o gateway ou com a própria conexão. Você pode alcançar outros sistemas nessa sub-rede? Se eles estiverem acessíveis enquanto o gateway não estiver, isso é uma dica de que algo é recarregado no gateway (devido a atualizações do firewall / tc ou qualquer outra coisa). Talvez as reconfigurações do switch (VLAN, por exemplo) possam causar isso também, mas a conectividade com todos os sistemas deve ser afetada.

    
por 13.02.2013 / 17:50