Recuperando uma instância do EC2 com falha que é apoiada pelo EBS

1

Eu tinha uma instância do EC2 que era suportada pelo EBS (ou seja, inicializa um volume do EBS). O hardware parece ter deixado de funcionar. Estou tendo problemas para recuperá-lo, o que é frustrante, já que todo o objetivo de ter um volume suportado pelo EBS é que a imagem do disco deve ser robusta contra falhas do CPU.

Primeiro, tentei criar uma nova AMI com base nessa máquina, mas a nova AMI estava presa na pendência. Mergulhando com as ferramentas de linha de comando, vi que a máquina não conseguia parar corretamente. Então eu fiz

ec2-stop-instances --force

e depois

ec2-detach-volume --force

Mas não consegui fazer uma AMI a partir de um volume separado. Eu tentei criar uma nova instância e anexar o volume do EBS a ele (depois de desanexar aquele que veio com) e inicializá-lo, mas esse não conseguiu inicializar dizendo

"State Transition Reason: Server.InternalError: Internal error on launch"

Eu estou supondo que tem que haver uma maneira de fazer o disco voltar e rodar novamente - esse é o ponto do EBS, certo? Mas como?

    
por Leopd 29.07.2011 / 23:48

2 respostas

4

Eu tive uma falha de instância algumas vezes em mim, principalmente quando a AWS teve sua "pequena" falha no EBS. Assim como você, não consegui finalizar as instâncias ou desconectar o volume. Acabei criando um instantâneo do volume do EBS (sim, deixe-me criar um instantâneo sem desanexar), criando um volume a partir desse instantâneo e anexando-o como o dispositivo raiz em uma instância.

Lembre-se de que, embora a unidade física não tenha sido danificada, uma falha ainda pode danificar o sistema de arquivos ou os dados.

Eu também tive sucesso anexando o volume como um volume comum não inicializável, executando uma verificação do sistema de arquivos (por exemplo, e2fsck) e usando o rsync, em um procedimento semelhante ao que você usaria para migrar do armazenamento efêmero / da instância. para EBS:

  1. Copie o diretório raiz (/) para o dispositivo EBS ( rsync -aXHv )
  2. (opcionalmente, rsync os dispositivos também (/ dev), embora eu não acho que seja necessário)
  3. liberar gravações e desmontar

A mensagem que acabei levando para casa foi ter backups atuais mesmo dos drives EBS - então agora eu executo o snapshot consistente-ec2 com freqüência em volumes de dados e (menos frequentemente) no meu volume raiz, e giro com ec2- instantâneos de ameixa seca.

Espero que alguma combinação dos itens acima (snapshot, check disk, rsync) possa ajudá-lo.

(Como um aparte, as poucas outras vezes que eu vi isso acontecer, eu tive algum processo rodando que consumiu toda a memória - e o AMI que eu estava usando não tinha nenhuma configuração de espaço de swap - o log do console o console da AWS) é bom para identificar esse tipo de problema)

    
por 30.07.2011 / 07:41
0

talvez você tenha problemas com a própria unidade EBS. por exemplo, algumas informações importantes foram removidas.

verifique artigos sobre como criar uma AMI baseada em EBS. este por exemplo

link

    
por 30.07.2011 / 01:05