Substituição preventiva do disco rígido RAID

2

Por experiência, aprendi que todo disco rígido irá falhar, é apenas uma questão de tempo.

Eu aprendi minha lição da maneira mais difícil e agora faço backup.

Quando eu faço um novo drive, muitas vezes eu megrego a lista de drives com o período de garantia. Fabricante do disco rígido estão lá para ganhar dinheiro e, obviamente, na maioria das vezes, eles projetaram seu disco rígido para durar pelo menos o período de garantia. Então, após esse período, espero que a taxa de falha seja maior. Eu já tinha 2 de 3 drive de um RAID 5 falhou quase ao mesmo tempo (segunda unidade falhou ao reconstruir o array e sim eu tinha um backup recente).

Minha pergunta é: Qual é a melhor prática com a substituição preventiva do disco rígido em um RAID após a garantia?

Você se importa com isso? Quantas unidades no array você substitui?

Notas sobre respostas
Ao criar uma nova matriz: use unidades de diferentes fabricantes / lotes. Ao ter uma matriz já antiga: adicione uma nova reserva.

    
por Hapkido 30.05.2009 / 13:55

4 respostas

4

Depende se você está falando de equipamento de classe de servidor ou equipamento de desktop.

Se é uma máquina de mesa construída com seu próprio dinheiro e unidades de prateleira, e você não está preocupado com compatibilidade, então sim, sua estratégia é boa. A cada X anos, saia e compre unidades totalmente novas para substituir suas unidades atuais. Eles serão mais rápidos, mais silenciosos e maiores. Você poderia substituir as unidades individualmente, permitindo que a matriz se reconstruísse e, em seguida, quando as recriações forem concluídas, reconfigure sua matriz para ser maior. (Nem todos os adaptadores raid suportam operações como esta - recriações on-line e mudanças de tamanho.)

Se é uma máquina de classe de servidor como um HP Proliant ou IBM System X, fica mais complicado. Você pode precisar usar discos rígidos na lista de compatibilidade do seu adaptador RAID. Nesse caso, as unidades serão caras porque provavelmente elas não serão mais produzidas ou, de qualquer maneira, elas são simplesmente caras para começar com as coisas de classe de servidor. Pior ainda, você pode estar comprando equipamentos do seu revendedor e não sabendo disso - isso não é incomum com os revendedores de servidores.

Além disso, você pode estar descartando unidades com bons tempos de vida e substituindo-as por unidades destinadas a problemas. Em vez de substituí-las de maneira proativa, faz mais sentido criar o servidor com um hot spare para começar e garantir que o RAID Array suporte recriações automáticas usando um hot spare. Em seguida, a reconstrução ocorrerá antes mesmo de você sair da cama para entrar no datacenter, e você poderá substituir a unidade morta sem gastar dinheiro ou tempo.

    
por 30.05.2009 / 14:18
5

O estudo do Google sobre as taxas de falhas no disco rígido mostrou que havia menos correlação com a idade do que se suspeitava anteriormente . O melhor conselho que ouvi é evitar a criação de matrizes de discos de um lote ou de um único fabricante. O estudo do Google mostrou que há uma strong correlação entre os drives de um lote de fabricação similar que falham simultaneamente.

Se você está preocupado com a confiabilidade de um conjunto de dados RAID, meu strong conselho é migrar para o RAID10 ou falhar no RAID6.

Dado o MTBF e as taxas de erro por leitura de Gb, a chance de uma falha dupla durante a reconstrução de um conjunto RAID5 degradado é muito alta para o conforto com as unidades de tamanho de terabytes no mercado hoje. ref link

    
por 30.05.2009 / 14:04
0

Concordarei 100% com o mesmo lote de unidades que falham juntas. Eu tenho 10 estações de trabalho Dell, depois de 4 anos, eu tive 6 das unidades de todos falhar com 12 meses um do outro.

Com servidores de produção, sempre comprei de um lugar como a Dell e me certifiquei de que estariam as peças sobressalentes por pelo menos enquanto planejava manter o servidor em funcionamento, normalmente quatro anos.

Eu tive 3 servidores com RAID que uma unidade falha em mim. Eu nunca tive peças de reposição quentes, mas dell me deu as substituições no dia seguinte e a reconstrução foi feita em nenhum momento. Isso além de backups adequados e você deve estar bem.

    
por 30.05.2009 / 18:19
0

Você pode tentar usar o raid6. Ele pode sobreviver a 2 discos defeituosos, certifique-se de sempre ter um disco hot spare.

    
por 31.05.2009 / 12:29

Tags