Solução de problemas com perda de pacotes no pfSense + Ubiquiti UniFi (Wireshark talvez?)

4

Estou lidando com uma situação chata em uma pequena rede em minha igreja, a qual eu sou a principal cuidadora de TI voluntária, com cerca de 20 PCs, dar ou receber.

Estamos em Chattanooga, lar da Internet Gigabit, por isso temos muita largura de banda (conexão de 100MB).

O hardware do pfSense é, de acordo com o painel do pfSense:

Intel(R) Atom(TM) CPU D525 @ 1.80GHz
4 CPUs

Ambas as NICs (WAN + LAN) são portas gigabit. Essa coisa tem 2GB de RAM.

Temos um laboratório de informática / programa de reforço escolar, então estou usando o pfSense para filtragem de conteúdo com Squid e Squidguard.

Uma semana & meio atrás, sem que eu soubesse, outro cara de TI entrou e reorganizou um monte de equipamentos de TI e montou algumas coisas na parede do armário da rede sem falar comigo primeiro.

Esse foi o mesmo fim de semana que uma grande tempestade soprou pela cidade.

Desde então, a internet tem sido irregular. Múltiplas vezes ao longo do dia, a internet começa a desacelerar e continua desacelerando até que seja inutilizável, e então a maioria (se não todas) das pessoas relatam que está totalmente quebrada sem acesso ao mundo exterior.

Como não estou no local com muita frequência, é difícil para mim solucionar o problema quando realmente acontece. A solução (que eu realmente não gosto, mas funciona) foi extrair o poder de tudo no armário da rede (pfSense + 1 dos Ubiquiti APs, o Cisco SG-100 e o equipamento do ISP) , conecte tudo de volta, e tudo volta à velocidade máxima.

No entanto, às vezes em que posso estar no local, notei que não é possível efetuar ping no gateway (pfSense) sempre que a Internet fica inativa (10.0.0.1) , enquanto eu sou capaz de executar ping em outros dispositivos internos, como a impressora localizada em 10.0.0.2.

Revendo o painel do pfSense, nunca vi tráfego ficar saturado. Nós temos uma conexão de 100MB, então temos abundância de largura de banda. Nenhum servidor e nenhum aplicativo de alta largura de banda estão no local.

Os sintomas para mim soam exatamente como um problema da Spanning Tree (não temos nenhum switch inteligente, embora eu tenha um Cisco SG-100 no núcleo da rede.

Eu verifiquei todos os nossos switches (só temos 3 em todo o edifício - nenhum com mais de 8 portas) e traçamos todos os cabos manualmente para garantir que não haja loops físicos e certifique-se de que os switches não estejam conectados entre si várias vezes.

Então atualizei o hardware do pfSense de 2.1.3 para 2.1.5 e atualizei o firmware em todos os 4 de nossos APs sem fio Ubiquiti UniFi. Eu também não tinha um controlador sem fio funcionando continuamente, então eu instalei o software em um dos PCs da equipe que está quase sempre ligado, para que o controlador permaneça presente.

(Se você sabe alguma coisa sobre a Ubiquiti UniFi, você não precisa ter o controlador rodando continuamente, mas eu achei que não iria doer)

Correndo muitos pings hoje cedo do meu próprio PC (Ubuntu) quando a internet estava lenta, eu vi MUITAS perdas de pacotes. Notei que, como eu faria um ping para um determinado endereço IP externo, haveria muitas perdas de pacotes no começo, mas quanto mais eu deixasse o ping rodar, mais rápidas as respostas do ping (e mais consistente / confiável) .

Revendo a configuração do Filtro de Proxy no firewall, observei na seção Gerenciamento do Cache do Servidor Proxy que o Tamanho do Cache de Memória era 32 mb, enquanto o Tamanho Máximo do Objeto na RAM estava definido em 64mb. Percebendo isso pode causar um problema, eu aumentei o tamanho do cache de memória até 256MB, e desliguei completamente o cache do disco rígido.

Espero que isso ajude, mas assistiremos a rede nas próximas 24 ou 48 horas.

(Update: Isso não parece ajudar. 5 minutos depois que eu saí, recebi uma ligação dizendo que a internet estava inativa. Então eu voltei e troquei o dispositivo pfSense por um roteador temporário Cisco Linksys, e nós vai ver o que acontece).

Há alguma outra sugestão ou coisa que eu deva investigar para solucionar esse problema em andamento? Eu acho que o cara que moveu todo o equipamento de rede sem me perguntar primeiro poderia ter beliscado um cabo. Eu troquei o cabo do dispositivo pfSense para LAN, mas isso não ajudou. Outro pensamento que eu tenho é que poderia ter havido uma onda de algum tipo por causa da tempestade, mas tudo no armário da rede está por trás de um protetor contra surtos da APC. Independentemente disso, foi quando os problemas começaram.

Eu tenho WireShark, mas não tenho certeza do que procurar em um pacote de captura. Talvez algumas dicas sobre o que fazer com uma captura de pacotes também sejam úteis.

    
por David W 23.10.2014 / 22:30

0 respostas