O que os logs do sistema podem me informar se um servidor perdeu sua conexão com a Internet?

1

Eu tenho um servidor:

CentOS Linux release 7.3.1611 (Core)
3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux

Eu acho que o seu recorte de conexão de rede em um ponto (está de volta agora). Eu não consegui encontrar nada em / var / log / messages- talvez eu não saiba o que procurar?

Hoje eu estou procurando duas coisas: Se houve um problema com o nic, Se o servidor perdeu sua conexão com a internet.

O segundo é obviamente mais difícil de descobrir (talvez impossível?). Obviamente, eu deveria ter alguma solução de monitoramento externo, mas de uma perspectiva educacional, onde você procuraria (localmente no host) para resolver esse mistério?

    
por user1028270 13.01.2017 / 16:21

2 respostas

2

Verifique o buffer do kernel em anel ( dmesg ) - você deve ver informações sobre eventos de conectividade de rede.

    
por 13.01.2017 / 16:37
1

Seus logs do kernel (os mais recentes visualizados por dmesg , mais antigos por journalctl -k ou onde quer que estejam configurados em /etc/rsyslog.conf ) provavelmente conterão mensagens se uma NIC perder seu link. E, claro, você pode facilmente encontrar o que essas mensagens parecem desconectando o cabo. Exemplo:

Jan 13 11:16:33 Zia kernel: r8169 0000:07:01.0 lan: link down

A perda de conectividade com a Internet é mais difícil e, normalmente, você configurava algo para detectar isso (monitoramento externo ou monitoramento de máquinas externas da sua máquina). Também não é realmente um estado binário - você pode ter conectividade parcial à Internet (pode alcançar alguns hosts, mas não todos). Você pode procurar por pistas, no entanto:

  • mensagens do NTP no diário / registros (por exemplo, sobre a perda de pares) ou verifique as estatísticas de pares do NTP (se ativadas).
  • mensagens no diário / registros sobre conexões de rede com falha (por exemplo, se você tivesse o fetchmail sendo executado rotineiramente, reclamaria que não poderia se conectar ao seu servidor POP3)
  • conexões VPN sendo desativadas (recebo muitos logs do OpenVPN quando a conexão com a Internet é interrompida).
  • servidores súbitos de carga zero na Web (etc.). Muitos servidores registram todas as solicitações recebidas em algum log específico do servidor.
  • da mesma forma, se você registrar o carregamento do sistema (média de carga, fila de execução, etc.), a queda rápida para 0 será uma pista.
  • falta de ruído nos logs do firewall (pelo menos, se você registrar pacotes bloqueados)
  • falta súbita de ataques de worm aleatórios (recebo muitas mensagens de autenticação com falha de vários serviços que estou executando e não recebo nenhum por horas seria uma boa pista de que não havia conectividade com a Internet)
  • níveis de tráfego, se você estiver monitorando (por exemplo, usando Cactos, MRTG, collectd etc.). Se você não é, provavelmente é o seu ISP - talvez eles estivessem dispostos a compartilhar?
  • se você tiver outras máquinas que conversam com essa máquina, verifique os registros da máquina. Pode haver mensagens de falha
  • se você oferecer serviços a outras pessoas, elas poderão ter registros.
  • se você tem um suporte técnico, eles provavelmente sabem (de todas as chamadas que receberam).

Basicamente, você está fazendo um trabalho de detetive: você precisa procurar por pistas. Sem monitoramento, não haverá uma mensagem de log o Interwebs is down .

    
por 13.01.2017 / 17:35