Qual é a estabilidade a longo prazo dos dados armazenados NVMe ou SSD?

4

Contexto:
Precisamos de acesso imediato a 30 TB de dados de áudio, embora apenas uma pequena fração seja solicitada para reprodução, que a reprodução precisa ser feita imediatamente, mesmo para dados de vários anos. Os dados residem em uma SAN de vários arrays e um backup noturno é realizado em novos dados. Alguns dados também são removidos todas as noites. Como ambos são eventos de gravação, chame de 20 GB por noite. A tendência geral é que mais dados novos sejam gravados do que dados antigos sejam removidos.

As Listas de Patrulhamento Semanal (PR) e Verificação de Consistência (CC) representam a maior parte da atividade do disco nos arrays, além de apenas girarem até falharem.

Pergunta:
Estou tentando descobrir se a SAN baseada em disco deve ser substituída por uma usando NVMe, que nível de RAID considerar e se faz sentido reduzir a frequência de atividade de PR ou CC para a tecnologia VNAND?

É do meu conhecimento, o que mata o VNAND é escreve, e nós estaríamos escrevendo muito menos dados do que o mínimo diário na maioria das unidades, mesmo considerando a verificação de consistência.

Não consegui encontrar quase nenhum teste de RAID 5/6 no NVMe ou mesmo no SSD em geral. Eu estou depois principalmente disponibilidade a longo prazo.

Pesquisa:
A maioria das outras questões sobre este tópico é anterior à tecnologia NVMe e tem 6-7 anos de idade. Esta é uma exceção, mas também não cobre esse cenário. Understanding NVMe requisitos de armazenamento e hardware

Relacionado:
Armazenamento a longo prazo de dados críticos de negócios

Configuração do Raid 0 de um ano

    
por Rowan Hawkins 11.04.2018 / 02:54

2 respostas

0

Encargos elétricos desaparecendo também mata NAND. Provavelmente muito lentamente em um bom estado sólido, mas perceptível após o tempo. Bastante diferente dos eixos magnéticos que armazenam dados por 10 anos ou mais. Se eles girarem novamente, isto é.

Pesquise dados de confiabilidade como uma função de bytes gravados, horas de fiação e outras métricas. Especificações do fornecedor, bem como quaisquer conjuntos de dados públicos. Substitua as unidades sempre que elas mostrarem desgaste. Especialmente perto do fim de sua garantia, talvez 3 anos de idade.

Use mídias diferentes para seus backups do que os dados on-line. Se o armazenamento primário estiver em estado sólido, use fita ou eixos magnéticos para o armazenamento de proteção.

Reinicie a mídia de arquivamento pelo menos a cada 10 anos. Transfira os backups antigos de que você gosta para qualquer que seja a mídia de proteção atual.

Ser um bom arquivista não é específico para o tipo de mídia ou esquema de redundância, o armazenamento evolui com o tempo. Não há uma resposta aqui, mesmo para requisitos semelhantes de desempenho, disponibilidade e custo.

    
por 11.04.2018 / 15:55
0

Ao usar SSDs sobre HDs, você obterá algum benefício de energia e provavelmente terá um benefício de confiabilidade (os SSDs de nível corporativo são muito mais confiáveis do que os HDDs de nível corporativo). Não há nenhum problema com a resistência ne e especialmente não no nível de atividades que você tem e até mesmo em níveis mais elevados a resistência não é um problema real. Você provavelmente também pode optar pelas unidades relativamente mais baratas otimizadas para leitura (com 0,3 DWPD) e não se preocupe com a resistência do disco.

A única questão em tal caso de uso é se o custo dos drives garante as vantagens de potência e confiabilidade.

Quanto à confiabilidade / disponibilidade, todos os SSDs de nível empresarial anunciam MTBF de 2 milhões de horas, e os com quem trabalhei ultrapassaram essa marca. O lado oposto é que todos os HDDs de nível empresarial exigem 1,2 milhões de horas de MTBF e nenhum ficou sequer na metade do caminho, então você verá uma grande confiabilidade saltar para cima com a mudança. Novamente, se valer a pena pelo custo ou não, é o seu cálculo a ser feito.

Minha qualificação aqui é que trabalhei em sistemas de armazenamento corporativo envolvendo HDDs e SSDs e trabalhei na integração de hardware / software e estava profundamente envolvido na confiabilidade dos sistemas combinados. Os conjuntos de dados nos quais eu confiei são privados, portanto não há pesquisas abertas que eu possa apontar.

    
por 21.11.2018 / 11:26

Tags