Descobrir a causa raiz de um problema depende do problema - Seu instinto inicial de examinar os arquivos de log / sysinternals tools / packet sniffers está geralmente correto.
Eu adicionaria a ferramenta de remoção de malware mal-intencionado do MS e um bom programa antivírus em sistemas Windows (e garantiria que eles não tivessem algo como o CyberDefender ou outro malware de trojans-AV.
O pessoal da Stack Exchange é defensor do método "5 Porquês" ( link , também esse pequeno PDF curto que mostra isso em ação . É uma ferramenta muito valiosa para fazer análise de causa raiz.
Além disso, vou pintar duas grandes categorias e algumas das perguntas que geralmente faço / coisas que verifico:
Comportamento misterioso não relacionado à rede
por exemplo. "O Word continua batendo em mim"
Perguntas básicas a serem feitas:
- O que mudou?
(Não tome "nada" como resposta - é a primeira mentira. Novos softwares, patches, etc. contam.) - O que você estava fazendo quando teve o problema?
(Tente extrair o máximo de detalhes possível aqui - no meu exemplo acima "Eu apertei a tecla de atalho para inserir as iniciais e o programa caiu") - Já funcionou antes?
(Se sim, comece a ver as coisas de (1) acima) - Você pode reproduzir o problema no seu sistema?
(Se isso é um bom sinal: uma chamada de suporte técnico para o fornecedor pode ajudar. Se não, você precisará examinar o sistema do usuário para o restante dessas perguntas.) - O que é diferente no ambiente do usuário do que no seu ambiente?
- O hardware do usuário é suspeito (execute um teste de memória, procure por erros SMART do disco rígido, etc.)
- Se você chegou até aqui (verificações de hardware, verificações de software, nenhum vírus, nenhum malware), visite o usuário por um dia. Observe seus hábitos de trabalho.
Minha empresa já teve um misterioso bloqueio de sistema relacionado a clicar no mouse em uma frequência específica (ainda não sabemos por quê, mas tivemos que assistir a um usuário fazendo isso e praticar por um dia para poder reproduzir com segurança)
Problemas relacionados à rede
Muito disso é semelhante, mas com orientação mais específica.
- O que mudou?
(Sim, você sempre começa por aí) - O que está quebrado?
- Você consegue acessar páginas da web? É apenas um que está em baixo? Se assim for É para baixo para todos ou apenas você ?
- Você pode pingar coisas na internet pelo nome?
Como cerca de IP? Até que ponto o traceroute fica?
- Quando está quebrado?
- sempre na mesma hora do dia?
- Por um breve período a cada N dias?
- Aleatoriamente (é REALMENTE aleatório? Plotá-lo em um calendário ...)
- Existe algo estranho no site remoto?
- Olhe para o DNS - Se houver um round robin'd, pode haver uma quebra no lado remoto
- Estamos falando do outro lado de uma VPN? O que há com a VPN (logs!)?
- Há algo estranho no site local?
- Verifique seu firewall local
- Verifique qualquer "software de filtragem"
- Verifique com seu ISP para ver se há algum problema conhecido
- Verifique sites como link para problemas conhecidos em toda a rede
- Confira a máquina do usuário
(Configurações de TCP, etc. - geralmente não é o problema, mas às vezes.)