QNAP reconstrução de ts-1679u-rp RAID 6 com ordem errada

3

Eu tenho um qnap ts-1679u-rp em execução no RAID 6. Tem 2 erros de disco. Por isso, substituí o disco 2 (disco 3 e disco 13) por um novo disco do mesmo modelo e capacidade.

Não foi possível reconstruir.
 1. Eu tentei colocar de volta o disco antigo, mas eu esqueci o pedido. Então, de qualquer forma eu inseri-lo em (disco 3 e disco 13).
 2. Falha ao iniciar.
 3. Troquei a localização e tente novamente. não foi iniciado.
 4. Eu conecto um VGA ao QNAP para ver a tela do console. 5. Ele disse, não é possível conectar porque o disco 6 leu o erro.
6. Eu tentei retirar todos os 3 discos (disco 3, disco 13, disco 6). É iniciado e a interface web está finalmente disponível, mas o formato do disco não é reconhecido. Não consigo acessar meu disco.
7. com o poder, eu empurro o disco 3, disco 13, disco 6 em. Ainda não consigo acessar meu disco.

Acho que estraguei minha Configuração RAID. Vou perder meus dados? Como posso me recuperar dessa falha?

Existem 16 discos no total. Eu usei todos os 16 discos para o RAID 6. 16x4TB.

    
por user1093137 21.11.2014 / 15:39

2 respostas

5

Tão frequentemente quanto não com arrays RAID, se você não conseguir reconstruí-lo, você está acabado. Parece que o disco 6 também pode ter falhado. Com a perda de três discos (mesmo se o controlador RAID estiver alucinando essa perda), seus dados estão praticamente ausentes.

Eu vejo que você não tem backups. Isso é ruim. Mas, para o resto da sua carreira, imagino que você possa começar a usar o RAID corretamente. São muitas coisas - uma maneira de distribuir a carga de trabalho para melhorar o desempenho e uma maneira de reduzir o impacto operacional imediato de uma falha que exigiria uma restauração do backup. Pode até mesmo ser usado para limitar a perda de dados em caso de falha, a curto prazo (ou seja, menor que o intervalo de backup). Mas, o RAID não é :

  1. Um substituto para backups. Você pode ter uma falha grave no disco ou o controlador RAID pode falhar ou seus dados podem ser perdidos por inúmeros outros motivos que resultam em software ou natureza destruindo-os.
  2. Uma licença para ignorar falhas de disco ou para usar discos suspeitos. Quando suspeitar de uma falha no disco, você deve corrigi-lo imediatamente.

Quando no futuro você projetar matrizes RAID, você deve considerar com muito cuidado as chances de uma falha catastrófica acontecer antes de poder corrigi-la. Com uma matriz RAID 1 de dois discos, as chances de ambos falharem ao mesmo tempo são muito baixas, mas em sua configuração apenas três de 16 (19%) tiveram que falhar. A probabilidade básica sugere que o array é frágil. Use matrizes com números menores de discos ou números mais altos de falhas toleráveis. Vários volumes podem ajudar; Volumes agregados de RAID usando níveis compostos como RAID 10 e RAID 60. Um array RAID 60 teria tolerado até 4 falhas (até 2 em uma metade), e você provavelmente teria sido OK.

Para estender esse conceito um pouco, quando você estiver usando o RAID, considere o uso de hot spares. As peças de reposição são incríveis porque a matriz pode começar a reconstruir imediatamente e sair do estado degradado muito mais rapidamente. Eles basicamente adicionam discos à tolerância a falhas de sua matriz, desde que as falhas não sejam tão agrupadas que impeçam a reconstrução a tempo.

Além disso, considere o tempo que a matriz levará para ser reconstruída. Demora um tempo para copiar um disco de 4 TB, que é um dos motivos pelos quais as matrizes de disco são geralmente construídas com discos menores do que isso (há outras razões).

Finalmente:

  • Use discos de alta qualidade . Confira o MTTF, se citado. Use os de classe corporativa. O preço premium está lá por um motivo. Evite os "verdes" que circulam excessivamente para economizar energia ou algo semelhante.
  • Etiquete seus discos . Então, você não vai esquecer em que ordem eles entram.

Espero que esta lição não seja muito cara.

    
por 22.11.2014 / 09:13
1

Consegui recuperar meus dados felizmente. Aqui está como eu faço:

  1. Digitei vi /etc/raidtab para ver a ordem do disco. Eu consegui trocar a ordem de disco de volta para o disco 3 e disco 13
  2. O erro de é
[ 984.796055] ata1.00: cmd 25/00:20:60:04:5a/00:00:5a:00:00/e0 tag 2 dma 16384 in    
[ 984.796055] res 40/00:01:00:00:00/00:00:00:00:00/00 Emask 0x14 (ATA bus error)    
[ 984.796058] ata1.00: status: { DRDY }    
[ 984.796066] ata1.00: hard resetting link    
[ 985.520017] ata1.01: hard resetting link    
[ 985.996057] ata1.00: SATA link up 3.0 Gbps (SStatus 123 SControl 300)    
[ 985.996068] ata1.01: SATA link down (SStatus 4 SControl 300)    
[ 986.012323] ata1.00: configured for UDMA/133    
[ 986.012331] ata1.00: device reported invalid CHS sector 0    
[ 986.012340] ata1: EH complete    

O Drive 6 tem problema ao configurar o link. Então eu suspeito que o link esteja solto. Então eu empurro o drive um pouco com mais força e tento novamente. Curiosamente, o link está pronto desta vez! Então, fiquei com apenas 2 falhas na unidade.

  1. digite mdadm -E /dev/sda3 para verificar o status do disco. Eu faço isso para todos os 16 discos. sda3 para sdp3. O disco 3 e o disco 13 estão marcados como falhos.

  2. digite storage_boot_init 2 para montar todo o disco 16. Com muita sorte, os dados estão finalmente disponíveis na pasta \share\MD0_DATA e \share\ .

Devo admitir anteriormente, eu não sabia muito sobre o RAID 6 e usá-lo cegamente. Agora que posso recuperar meus dados, vou fazer o backup em outro lugar antes de reconstruir o disco defeituoso. Eu já rotulei toda a minha ordem de disco. Aprendi minha lição! Este é um pesadelo de dados real para mim!

    
por 23.11.2014 / 02:31

Tags