2009-07-06 - Estou pensando que é o disco rígido.
Eu fiz um chkdsk e ele caiu com os mesmos sintomas de antes do meio do chkdsk. Estou usando um Solid State Drive (SSD), o "SSD PQI DK9128GD6R000A03 128GB SATA 2.5", com um MTBF de 1.500.000 horas. Apesar de ter um MTBF de 133 anos, parece ter morrido após 2 semanas ou uso normal! Para checar minha teoria, copiei os arquivos VMware para um disco rígido padrão, executei o chkdsk e funcionou como um encanto.Vou ver se o sistema sobreviveu a uma semana de tempo de atividade e, se isso acontecer, posso oficialmente defenestratar meu SSD PQI .
2009-07-07 - O sistema caiu novamente. De volta à prancheta de desenho.
2009-07-08 - Demorei mais 20 dias para instalar o SSD. Vamos ver se ele trava de novo (foi).
2009-07-09 - desinstalou o OpenVPN, atualizou para a versão mais recente do Skype, atualizou para o SQL 2008 para o SP1, removeu o TeamViewer. Vamos ver se ele falha novamente (aconteceu no meio de um backup do Acronis).
2009-07-09 - Suspeito que a quantidade de memória virtual disponível na máquina VMware que executa o servidor seja muito pequena, estou com 4 GB no momento. Aumentando-o (isso não teve efeito).
2009-07-09 - descobriu que, se o contêiner VMware que executa o Windows Server 2008 travar com 100% de utilização da CPU e eu pausar / reiniciá-lo, ele interrompe e retoma a operação! Isso tende a apontar para um problema com o VMware ou seu sistema operacional host (que é o XP), em vez de um problema no próprio Windows Server 2008. Chegando muito perto do cerne do problema agora.
2009-07-09 - O Windows Server 2008 falha apenas quando o SO host está sobrecarregado. Aumentado o número de CPUs que ele pode utilizar para 2 CPUs, isso parece ter resolvido o problema.
Em conclusão:
- O problema original foi causado por um disco rígido defeituoso com setores defeituosos (na verdade, era um SSD de 128GB do PQI - não esperaria que um Solid State Drive (SSD) falhasse duas semanas após a compra, mas isso aconteceu).
- O próximo problema foi causado pelo sistema operacional host que executava o VMware sob carga alta. Corrigido isso alocando mais RAM e aumentando o tamanho do arquivo de paginação.
- Se isso acontecer novamente, eu tenho uma solução alternativa (basta pausar / reiniciar o VMware v6.5 para "descongelar" o Windows Server 2008 sendo executado dentro dele).
Problema resolvido, obrigado pessoal!