O que conta como uma matriz 'grande' do RAID 5?

Question

O que conta como uma matriz 'grande' do RAID 5?

#1 resposta do (18 votos)
#2 resposta do (9 votos)

11

Uma edição recente com um NAS Buffalo TeraStation aqui no meu escritório me fez investigar o Raid 5.

Eu encontrei alguns artigos diferentes falando sobre a inadequação do uso do RAID 5 em grandes arrays ou com discos grandes

Aqui está um artigo de exemplo que fala sobre problemas com a reconstrução de um array com grande consumidor drives.

Estou tentando descobrir o que conta como "grande"?

O NAS que temos aqui é uma instalação de Raid 5 de 4 unidades, cada unidade tem 1 TB. Uma unidade falhou e foi substituída, a matriz está atualmente sendo reconstruída.

Esta configuração é tão grande, em termos de provável problema durante a reconstrução?

Qual é a confiabilidade dessa configuração para uso diário?

raid raid5

por Rob 28.04.2014 / 14:14

2 respostas

9

A razão pela qual o artigo existe é chamar a atenção para as taxas de erros de bits irrecuperáveis nos HDDs. Especificamente, o seu barato 'home PC' discos. Eles normalmente têm uma especificação de fábrica de 1/10 ^ 14. Isso é cerca de 12,5 TB de dados, o que se você estiver fazendo um RAID-5 com discos de 2 TB ... você acertará rapidamente.

Isso significa que você deve:

use grupos RAID menores e aceite um espaço desperdiçado maior.
Use o RAID-6 e aceite a penalidade de gravação adicional. (50% maior que o RAID5)
Compre discos mais caros - o "grau de servidor" tem uma especificação UBER de 1/10 ^ 16, o que significa que esse é um ponto discutível. (1.2PB é melhor que 12.5TB)

Eu gostaria de sugerir que o RAID-6 é geralmente o caminho para frente, mas isso vai custar seu desempenho.

por 28.04.2014 / 14:39

Tags raid raid5

Preciso saber se alguém está usando o endereço IP do servidor de arquivos para acessar em vez do nome. Alguma ideia? Existe uma ferramenta de linha de comando fácil para o pacote que fareja um único comando no linux?

score 18 · Accepted Answer

Projetando a confiabilidade de uma matriz de disco:

Encontre a taxa URE da sua unidade (os fabricantes não gostam de falar sobre a falha de suas unidades, então você pode ter que cavar para encontrar isso. Deve ser 1/10 ^ X onde X é em torno de 12-18 vezes) .
Decida o que é uma taxa de risco aceitável para suas necessidades de armazenamento †. Normalmente, isso representa < 0,5% de chance de falha, mas pode ser de vários por cento em um armazenamento "scratch" e pode ser < 0,1 para dados críticos.
1 - ( 1 - [Drive Size] x [URE Rate]) ^ [Data Drives‡] = [Risk]
Para matrizes com mais de um disco de paridade ou espelhos com mais de um par de discos no espelho, altere o 1 após os Drives in Array para o número de discos com paridade / espelho.

Então, eu tenho um conjunto de quatro unidades WD Green de 1TB em uma matriz. Eles têm uma taxa de URE de 1/10 ^ 14. E eu os uso como armazenamento de rascunho. 1 - (1 - 1TB x 1/10^14byte) ^ 3 = > 3.3% risco de falha na reconstrução do array após o término de uma unidade. Eles são ótimos para armazenar meu lixo, mas eu não estou colocando dados críticos lá.

_{† Determinar falhas aceitáveis é um processo longo e complicado. Pode ser resumido como Budget = Risk * Cost . Portanto, se uma falha custar US $ 100 e tiver 10% de chance de acontecer, você deve ter um orçamento de US $ 10 para evitá-la. Isso simplifica grosseiramente a tarefa de determinar o risco, os custos de várias falhas e a natureza das possíveis técnicas de prevenção - mas você tem a idéia.} _{‡ [Data Drives] = [Total Drives] - [Parity Drives] . Um espelho de dois discos (RAID1) e RAID5 tem 1 unidade de paridade. Um espelho de três discos (RAID1) e RAID6 tem 2 unidades de paridade. É possível ter mais unidades de paridade com RAID1 e / ou esquemas personalizados, mas atípicos.}

Esta equação estatística vem com suas advertências:

Essa taxa de URE é a taxa anunciada e normalmente é melhor na maioria das unidades que saem da linha de montagem. Você pode ter sorte e comprar uma unidade que seja de magnitude superior à anunciada. Da mesma forma você poderia ter uma unidade que morre de mortalidade infantil.
Algumas linhas de produção têm execuções incorretas (em que muitos discos na execução falham ao mesmo tempo), portanto, a obtenção de discos de diferentes lotes de produção ajuda a distribuir a probabilidade de falha simultânea.
Discos mais antigos são mais propensos a morrer sob o estresse de uma reconstrução.
Fatores ambientais cobram um pedágio:
- Discos que são ciclados por calor normalmente têm maior probabilidade de morrer (por exemplo, ligá-los / desligá-los regularmente).
- A vibração pode causar todos os tipos de problemas - veja o vídeo no YouTube de TI gritando em uma matriz de disco .
"Existem três tipos de mentiras: mentiras, mentiras e estatísticas" - Benjamin Disraeli