O log de eventos do Windows é o único local para executar uma postagem após uma falha do servidor?

1

Um par de dias atrás, um de nossos servidores da Web caiu nas primeiras horas. Ele não estava respondendo a nenhum pedido remoto (para ser honesto, eu não sei se ele teria respondido se um teclado e um monitor USB estivessem conectados a ele) e um engenheiro do centro de dados reiniciava o servidor para nós.

Tudo voltou ao normal, e eu verifiquei os logs de eventos para ver se havia alguma pista sobre o que deu errado. Tudo o que posso realmente ver é o evento "o desligamento anterior em 1:00 foi inesperado" (que é o tempo que o servidor caiu, não o tempo que o engenheiro bateu o botão de energia).

O servidor tem o IIS - mas, obviamente, os logs do site mostram apenas as solicitações de arquivos que levaram à falha (ou congelamento) e não há aumento no volume de tráfego antes da falha. O SQL Server também está instalado, mas os logs apenas relatam que uma dúzia de transações foi avançada quando o servidor voltou a funcionar.

Existe mais alguma coisa que eu possa olhar para encontrar uma causa possível para o acidente?

    
por Dan 28.08.2009 / 22:24

3 respostas

1

Parece que a caixa foi pendurada. Já que o suporte no local apenas retornou a caixa, é possível, mas é improvável que você consiga algo dos logs.

Você precisa ativar o suporte a CrashOnCtrlScroll ( link ), reinicializar a caixa e, na próxima vez, travar alguém pressione a tecla RIGHT Ctrl e pressione Scroll Lock duas vezes. Isto irá verificar o erro (tela azul) na caixa, escrevendo o estado atual e, em seguida, reinicie-o.

Você também vai querer ter certeza de que o sistema está configurado para Kernel ou Complete dump de memória.

Obrigado Brian Desmond MVP do Active Directory

    
por 29.08.2009 / 01:26
2

Se você tiver a opção ativada para criar um arquivo de despejo de memória, essa é outra possibilidade, embora sejam necessárias habilidades avançadas de análise e / ou um caso de suporte com a Microsoft para obter informações úteis. Normalmente, o arquivo de despejo será salvo em% SystemRoot% \ MEMORY.DMP.

    
por 28.08.2009 / 22:33
2

Se foi uma "Tela Azul da Morte" que causou a falha e o servidor está configurado para salvar um despejo de memória (que é o padrão), você pode depurar a saída. O melhor recurso de instruções que encontrei para isso é "Como solucionar falhas do sistema Windows em minutos ".

Caso contrário, se houver ferramentas de monitoramento do sistema fornecidas pelo fabricante, como o HP OpenView ou o Dell OpenManage, procure evidências de falhas de hardware.

Por fim, se o servidor estiver em um no-break, você precisará procurar falhas relacionadas à energia.

    
por 28.08.2009 / 22:36