É realista solucionar remotamente problemas de rede?

1

Eu tenho uma pequena organização sem fins lucrativos que ajudo com uma rede de fibra hub e spoke em switches Netgear gerenciados. Eles têm ambos T1 e amp; Conectividade DSL, separada por VLAN com um sistema VoIP simples em execução. Há coisas estranhas acontecendo e, periodicamente, a rede desacelera e depois fica congestionada. Andar de bicicleta a energia no equipamento principal restaura a funcionalidade até a próxima vez (geralmente alguns dias depois). A rede é realmente bastante simples (atende a cerca de 15 usuários) e eles não têm um cara de TI dedicado, embora um dos funcionários mais tecnicamente ocupados faça a maioria das coisas de TI comuns.

A organização tem uma localização rural e teve dificuldade em encontrar apoio local com conhecimento suficiente para diagnosticar o problema (sugerindo que eles sistematicamente substituam todos os equipamentos até que o problema desapareça não seja um diagnóstico IMHO).

Todos os switches são gerenciados e poderíamos configurar uma máquina de sniffing de pacotes para conectar diretamente a uma configuração de porta para monitoramento. É realista pensar que um guru da rede, fazendo login remotamente, provavelmente seria capaz de fazer o trabalho de detetive para localizar a origem do problema?

Supondo que seja viável, qualquer direção em sites para procurar gurus também será apreciada. Além disso, se algum dos geeks da rede estiver lendo algo a preços razoáveis, por favor, comente.

    
por Stuart 13.08.2009 / 17:23

5 respostas

0

Is it realistic to think that a network guru, logging in remotely would likely be able to do the detective work to locate the source of the issue?

A maioria tem que fazer isso como um todo. Poucas organizações têm esse conhecimento em todos os locais e até as visitas não resolvem os problemas com facilidade, já que os problemas costumam ser intermitentes ou imprevisíveis.

Por exemplo, monitorar o tráfego em portas e hosts de comutadores (por exemplo, entrada / saída de bytes, entrada / saída de pacotes, entrada / saída de difusão seletiva, entrada / saída de erros) pode fornecer uma visão geral do comportamento normal e quaisquer alterações durante condições de falha. Intervalos típicos seriam a cada 5 minutos e agregados em períodos mais longos, idealmente exibidos em páginas da web. Os dados precisam ser armazenados localmente, bem como remotamente, caso o acesso seja perdido quando uma falha estiver em andamento.

Os alertas SNMP são úteis para coletar.

Além dos rastreamentos de rede levados para uma máquina, geralmente baseados em BSD orGNU / Linux, normalmente conectados a uma ou mais portas span em switche (es), são úteis, se não forem filtrados de maneira restrita, podem ser enormes. Diversas fontes podem ser necessárias (por exemplo, tráfego para / de servidores locais; para / de conexões WAN). É útil se vários rastreios puderem ser executados simultaneamente.

Tudo isso pode ser visto e interpretado remotamente, embora seja necessário um entendimento razoável da rede examinada e alguns dos volumes de dados (especialmente traços ou traçados brutos ao longo do tempo aguardando uma falha) podem ser enormes.

Uma avaliação de risco será necessária antes de permitir que um terceiro acesse as redes ou envie rastreamentos de rede fora do controle de sua organização. Um rastreamento de rede completo permite a reconstrução de qualquer conteúdo não criptografado. Mesmo que os dados sejam criptografados e o rastreamento exclua a maior parte do conteúdo, um registro completo de volumes com fontes e coletores ainda estará disponível. Pode também incluir sites e páginas acessadas e por quem, por exemplo. Criptografar discos de informações de rastreamento enviadas por email seria uma proteção mínima e você desejaria um nível de confiança correspondente em quem quer que fosse. Um acesso dado por uma parte externa pode precisar de senhas de equipamento: certifique-se de que você sabe quais podem ser alteradas e a consideração dada ao equipamento de auditoria que teve acesso externo. O acesso externo on-line deve ser feito em canais seguros (por exemplo, usando ssh), se possível.

    
por 13.08.2009 / 17:49
2

Eu começaria com o monitoramento. Se você está com problemas intermitentes que não desaparecem sozinhos, mas a reinicialização resolve isso, verifique seus níveis de recursos. Isso é um sinal de que / algo / está gastando seus recursos livres de algum tipo.

    
por 13.08.2009 / 17:30
1

Você pode configurar o switch gerenciado para ser monitorado em busca de alertas ou comportamentos estranhos via SNMP (configure uma máquina Linux dedicada temporariamente em sua rede com acesso SSH, se necessário), mas para responder sua pergunta, isso depende ...

Quando eles têm problemas de rede, são lentos , ou estão mortos?

É muito lento para o acesso remoto funcionar corretamente?

Se a rede ainda funcionar, você pode configurar o acesso de fora para a máquina Linux mencionada acima para tentar acessar o switch e ver o que o switch diz. Eu não sei a funcionalidade completa desse switch, então eu não sei o que ele faz ou não alerta e registra, mas isso daria algum ponto de acesso para você monitorar o tráfego de rede, bem como entrar no switch (eu d configure-o para acessar em uma porta a partir do exterior, exceto 22).

Se você pudesse, você poderia simplesmente desligar o interruptor temporariamente com uma unidade temporária (eu sei o que você disse sobre não ser um diagnóstico), mas se ligar e desligar a energia para o interruptor resolver o problema, pode diminuir muito o problema para você, mas somente se você tiver a habilidade de colocar suas mãos em algum equipamento de substituição temporário.

Caso contrário, algo pode estar sobrecarregando o switch ou o roteador. Eles estão executando o firmware mais recente?

    
por 13.08.2009 / 17:45
1

Muitos switches suportam uma rede de "gerenciamento" que pode ser completamente isolada de sua rede de produção. Isso permite que você faça o login em seus sistemas por meio de alguma interface fora de banda, como um modem conectado a um host bastião. Depois, você pode acessar todos os seus dispositivos de rede pela rede de gerenciamento e realizar seus diagnósticos.

Dito isso, isso geralmente não é feito porque duplica o número de redes que você precisa suportar e testar, mas, quando feito corretamente, pode tornar a administração remota quase tão eficaz quanto a solução de problemas ao vivo.

    
por 13.08.2009 / 22:38
0

Configure o monitoramento local (SNMP dos switches, talvez) que deve continuar a operar quando a rede estiver em mau estado. Após a próxima reinicialização da engrenagem ofensora, faça o controle remoto e analise os registros da hora em questão.

Sim, um bom cara da rede deve ser capaz de descobrir alguma coisa dessa forma, eventualmente, embora possa ser mais lento do que se ele fosse local para os sistemas.

    
por 13.08.2009 / 18:07