Servidor reinstala não funcionando

0

meu servidor Ubuntu travou recentemente e desde então eu estou com dificuldades para recuperá-lo.

O servidor parou de responder, ping retornou retornos esporádicos e nenhum dos serviços (SSH ou Webmin) se conectavam. O desligamento não foi possível, então eu tive que desligá-lo.

O hard reset parece ter destruído o sistema de arquivos raiz como a pasta de inicialização e muitos outros estavam vazios, o que significa que acabei no modo de recuperação do grub após a reinicialização.

Bem, decidi reinstalar o sistema operacional, que é onde minha jornada começa.

Primeiro, o que está funcionando:

  • A nova instalação funciona sem problemas
  • Todas as unidades são encontradas, incluindo o raid
  • ao abrir um shell no modo de recuperação da unidade USB, posso montar todas as unidades sem problemas (unidade de invasão e backup)

A configuração é

  • SSD para o sistema operacional, home e swap (3 partições separadas)
  • 3 unidades de 4 TB para uma invasão de software 10 (uma sobressalente)
  • uma unidade swappable de 2 TB separada para backups off-line

E aqui é onde eu estou preso:

  • O servidor inicializa, mostra a janela do grub e carrega o kernel (muitas das mensagens de status normais ...)

  • As últimas mensagens bem-sucedidas parecem ser

    Comece: Carregando os drivers essenciais ... concluídos

    Início: executando scripts / init-premount ... concluído

    [19.000] aleatório: inicialização rápida

    Comece a esperar pelo sistema de arquivos raiz

A partir daí, há muitos dos abaixo

Begin: Running scripts/local-block ... mdadm: no devices listed in config file were found
done

Até que finalmente desista de

Gave up waiting for root device. Common problems...
...
ALERT! UUID=.... does not exist. Dropping to shell 

Após o qual o sistema congela.

O UUID listado está correto e representa a partição de inicialização do meu SSD.

De alguma forma, parece que nenhuma das unidades são acessadas de repente, nem a unidade de inicialização (erro UUID) nem a matriz de raid (mensagem de erro mdadm)

Eu tentei grup-updates e reinstala o que me causa erros estranhos. Mas sempre que eu inicializo do meu stick USB, selecione a opção de resgate e abra um shell com a partição ssd-boot que posso ver e montar todas as partições.

Algumas das mensagens do grup que estou recebendo:

grub-update

Found linux image....

Found initrd image....

WARNING: Failed to connect lvmdat. Falling back to device scanning
grup-probe: error: cannot find a GRUB drive for dev/sdb1 check your device map

Eu verifiquei o / etc / fstab e todas as entradas parecem boas para mim. UUIDs macth o que eu esperaria, / SWAP e estão disponíveis

Alguém tem uma ideia de onde procurar a seguir? Meu próximo passo seria reparticionar completamente o SSD que gostaria de evitar ...

Obrigado Thomas

    
por TZ04 25.05.2017 / 14:24

0 respostas