Eu tive uma falha de instância algumas vezes em mim, principalmente quando a AWS teve sua "pequena" falha no EBS. Assim como você, não consegui finalizar as instâncias ou desconectar o volume. Acabei criando um instantâneo do volume do EBS (sim, deixe-me criar um instantâneo sem desanexar), criando um volume a partir desse instantâneo e anexando-o como o dispositivo raiz em uma instância.
Lembre-se de que, embora a unidade física não tenha sido danificada, uma falha ainda pode danificar o sistema de arquivos ou os dados.
Eu também tive sucesso anexando o volume como um volume comum não inicializável, executando uma verificação do sistema de arquivos (por exemplo, e2fsck) e usando o rsync, em um procedimento semelhante ao que você usaria para migrar do armazenamento efêmero / da instância. para EBS:
- Copie o diretório raiz (/) para o dispositivo EBS (
rsync -aXHv
) - (opcionalmente, rsync os dispositivos também (/ dev), embora eu não acho que seja necessário)
- liberar gravações e desmontar
A mensagem que acabei levando para casa foi ter backups atuais mesmo dos drives EBS - então agora eu executo o snapshot consistente-ec2 com freqüência em volumes de dados e (menos frequentemente) no meu volume raiz, e giro com ec2- instantâneos de ameixa seca.
Espero que alguma combinação dos itens acima (snapshot, check disk, rsync) possa ajudá-lo.
(Como um aparte, as poucas outras vezes que eu vi isso acontecer, eu tive algum processo rodando que consumiu toda a memória - e o AMI que eu estava usando não tinha nenhuma configuração de espaço de swap - o log do console o console da AWS) é bom para identificar esse tipo de problema)