Auditoria do sistema de arquivos, rede, CPU do disco io e monitoramento de desempenho de memória. Como isso aconteceu quando você começou a compartilhar mais arquivos, uma dessas métricas provavelmente o achará o culpado.
Temos um servidor de rack IBM Windows 2003 comprado em 2008.
Xeon de 2 x 2 núcleos, RAM de 4 Gb, RAID 1 de hardware para sistema e RAID 5 para dados.
Software antigo, hardware não tão antigo. Tudo correu bem até recentemente.
Este computador serviu muito poucas coisas. Alguns arquivos para 2 usuários, um servidor Tomcat por aproximadamente 1000 acessos por dia e um script executando 24/7 para alimentar o Tomcat de outro computador.
Cerca de 4 semanas atrás, decidimos usar esse servidor (superdimensionado para o uso atual) para compartilhar mais arquivos. Cerca de 350 Gb de Word / Excel / qualquer para cerca de 150 usuários.
Desde então, o servidor congela cerca de duas vezes por semana.
Os logs estão vazios de qualquer evento suspeito.
O servidor agora reinicializa todas as noites, mas nada melhor.
Eu corri o Memtest durante horas: sem erro
O software RAID não mostra nada em seu log.
Quando o problema ocorrer:
1. alguns usuários reclamam do fato de não poderem acessar seus arquivos |
2. Eu faço logon no servidor (30 segundos ou 30 minutos depois)
3. Eu posso fazer o que por cerca de 30 segundos
4. o mouse pode se mover, e nada mais funciona
5. as luzes dos discos rígidos piscam uma vez a cada 2 segundos
Eu então forço um poweroff com o interruptor principal, e reinicio.
Alguma ideia de onde / como eu posso procurar mais informações? Como os registros do Windows não mostram nada de especial, não tenho a menor idéia.
Tags windows-server-2003