Amazon EC2 Windows Server 2008 - Falha de reinicialização / inicialização - Logs?

1

Pela segunda vez em 24 horas, nosso Web Production Server e Database Server não está inicializando. Instalou o IIS7 e o MSSQL 2008 R2 - executando asp.net e aplicativos legados de asp clássicos.

A falha inicial aparentemente ocorreu devido a um erro no tamanho do arquivo de paginação - esses erros de inicialização eram visíveis nos logs do sistema após a montagem do volume da instância em outra instância existente e a visualização por meio do visualizador de eventos. A Microsoft disse que havia um hotfix disponível. Nova imagem do servidor, Hotfix aplicado, todas as várias configurações do sistema feitas = algumas reinicializações e 8 horas depois sem erros.

... até que a segunda falha aconteceu após uma simples reinicialização. E visualizando os logs de eventos da mesma forma que anteriormente, não sabemos ao certo por que essa instância (que é praticamente idêntica a nossas outras instâncias do EC2 - exceto para os aplicativos clássicos asp) está se recusando a inicializar. Nenhuma segurança, sistema, aplicativo ou qualquer outro erro para falar.

Assim, a questão mais ampla é: Como podemos descobrir o que aconteceu? Alguém pode sugerir onde procurar no volume recuperado por erros de inicialização, etc.?

2ª pergunta: alguma ideia brilhante para voltar a funcionar? Percebemos que a opção "Obter registro do sistema" na interface do Amazon apenas resulta em uma tela em branco

Muito obrigado Brett

    
por user71887 23.02.2011 / 18:04

2 respostas

2

Eu entendo sua frustração, pois lidamos intensamente com imagens do Windows no EC2, tanto como um consumidor quanto como um provedor de ferramenta / solução de gerenciamento EC2.

A recuperação de log em branco é um enorme aborrecimento e parece acontecer de vez em quando. Eu entrei em contato com a Amazon sobre isso, e a resposta geral é que às vezes as informações de log estão em branco ... Não há muito para continuar, então estou apenas informando sobre minhas próprias comunicações sobre isso.

As reinicializações das instâncias do Windows EC2 também me deixam nervoso. Depois de muitas reinicializações com falha, só posso recomendar que você esteja pronto para restaurar sua imagem e banco de dados, se necessário. Passei muitas horas pesquisando informações sobre atrasos de reinicialização no EC2 e, geralmente, há duas descobertas:

  1. Pode ser realmente muito, muito lento. Pense em horas, não em minutos.
  2. Já consegui encontrar uma postagem que parecia sugerir que as instâncias do Windows com certificados SSL podem ser um problema após a reinicialização. Soa estranho, mas novamente estou apenas passando a informação.

Boa sorte!

    
por 23.02.2011 / 21:53
2

Simon, você é um deus! .. seriosuly.

Depois de mais algumas pesquisas seguindo sua dica de problemas de SSL, encontramos isso: Instância do Windows 2008 do Amazon EC2 que não responde após a reinicialização

Aparentemente, ao inicializar, a Amazon faz uma série de verificações na instância - verificação e assim por diante; e um certificado incomum (de uma CA desconhecida) causa uma falha de inicialização e um servidor que não responde.

Seguindo as etapas mostradas na postagem acima, nosso servidor agora inicializa - de novo e de novo.

Muito obrigada; Espero que o Pai Natal lhe traga muitos presentes bons para você boas ações.

Brett

    
por 24.02.2011 / 10:47