Tão frequentemente quanto não com arrays RAID, se você não conseguir reconstruí-lo, você está acabado. Parece que o disco 6 também pode ter falhado. Com a perda de três discos (mesmo se o controlador RAID estiver alucinando essa perda), seus dados estão praticamente ausentes.
Eu vejo que você não tem backups. Isso é ruim. Mas, para o resto da sua carreira, imagino que você possa começar a usar o RAID corretamente. São muitas coisas - uma maneira de distribuir a carga de trabalho para melhorar o desempenho e uma maneira de reduzir o impacto operacional imediato de uma falha que exigiria uma restauração do backup. Pode até mesmo ser usado para limitar a perda de dados em caso de falha, a curto prazo (ou seja, menor que o intervalo de backup). Mas, o RAID não é :
- Um substituto para backups. Você pode ter uma falha grave no disco ou o controlador RAID pode falhar ou seus dados podem ser perdidos por inúmeros outros motivos que resultam em software ou natureza destruindo-os.
- Uma licença para ignorar falhas de disco ou para usar discos suspeitos. Quando suspeitar de uma falha no disco, você deve corrigi-lo imediatamente.
Quando no futuro você projetar matrizes RAID, você deve considerar com muito cuidado as chances de uma falha catastrófica acontecer antes de poder corrigi-la. Com uma matriz RAID 1 de dois discos, as chances de ambos falharem ao mesmo tempo são muito baixas, mas em sua configuração apenas três de 16 (19%) tiveram que falhar. A probabilidade básica sugere que o array é frágil. Use matrizes com números menores de discos ou números mais altos de falhas toleráveis. Vários volumes podem ajudar; Volumes agregados de RAID usando níveis compostos como RAID 10 e RAID 60. Um array RAID 60 teria tolerado até 4 falhas (até 2 em uma metade), e você provavelmente teria sido OK.
Para estender esse conceito um pouco, quando você estiver usando o RAID, considere o uso de hot spares. As peças de reposição são incríveis porque a matriz pode começar a reconstruir imediatamente e sair do estado degradado muito mais rapidamente. Eles basicamente adicionam discos à tolerância a falhas de sua matriz, desde que as falhas não sejam tão agrupadas que impeçam a reconstrução a tempo.
Além disso, considere o tempo que a matriz levará para ser reconstruída. Demora um tempo para copiar um disco de 4 TB, que é um dos motivos pelos quais as matrizes de disco são geralmente construídas com discos menores do que isso (há outras razões).
Finalmente:
- Use discos de alta qualidade . Confira o MTTF, se citado. Use os de classe corporativa. O preço premium está lá por um motivo. Evite os "verdes" que circulam excessivamente para economizar energia ou algo semelhante.
- Etiquete seus discos . Então, você não vai esquecer em que ordem eles entram.
Espero que esta lição não seja muito cara.