Bad Sector no disco faz com que o servidor inteiro falhe

2

O disco rígido do nosso servidor dedicado foi recentemente diagnosticado com setores defeituosos, e cada vez que certos dados no disco estão prestes a serem acessados, todo o servidor não responde antes de eu reiniciar o painel do robô. Pedimos ao nosso provedor de servidor para instalar uma nova unidade de disco, e eles fizeram. Agora eu quero copiar tudo para o novo disco (como o disco antigo também ainda está conectado), então eu inicio o servidor no modo de recuperação (inicialização de rede) e executo o seguinte no servidor de inicialização de rede via SSH (root) :

ddrescue -d -f -r3 /dev/sdb /dev/sda /home/ddrescue.log

após cerca de 5 minutos, o servidor não responde e nem mesmo responde ao SSH (como se a porta estivesse fechada).

O que poderia causar isso? Como posso evitar que o servidor seja banido quando alguns setores defeituosos estão prestes a serem acessados?

    
por chakmeshma 11.08.2018 / 22:50

2 respostas

1

Você deve tentar ativar o TLER - recuperação de erros por tempo limitado

Sem ele, um disco com setores defeituosos tentará ler os afetados por mais de 30 segundos, possivelmente causando falhas em todo o subsistema de disco.

    
por 12.08.2018 / 14:33
0

Da aparência dele, seu hardware / driver / o que congela quando encontra um bloco defeituoso e você não pode continuar com o backup.

Você tem uma lista de bloqueios ruins?

Que tal fazer um backup lógico (com o tar, por exemplo)?

A maneira como eu abordaria isso, mas não testei:

  • de alguma forma, obter uma lista de blocos ruins ( fsck.ext4 com -c e / ou -l )?
  • com a lista de blocos inválidos, localize os arquivos afetados usando debugfs :
    icheck block ...
          Print a listing of the inodes which use the one or  more  blocks
          specified on the command line.
  • crie um backup lógico com tar --exclude ...

Boa sorte. : -s

    
por 12.08.2018 / 13:41