A vida média dos drives SATA?

0

Qual é a vida média de um hardrive SATA?

Quase todos os dados que posso encontrar fornecem taxas de falha nos primeiros 0-5 anos, mas nenhum parece realmente encontrar o fim da vida útil das unidades.

Os relatórios, gráficos e estudos do google, do backblaze e dos likes contam apenas parte da história à medida que eles se concentram nos primeiros 5 anos +/-.

Hipoteticamente, dizer que 50% dos drives morrem em 8 anos não infere que os outros 50% morrem em 16 anos. Existe um gráfico que leva 100% de um conjunto de unidades para a morte e dá os resultados? Ou algo que forneceria informações equivalentes?

Assumindo uma carga pesada de trabalho de consumidor em unidades consumidoras em casa / escritório com controle climático típico, o que é uma média real de vida de disco rígido? Novamente, não taxas de falha devido à vida útil definida (curta) .

Os resultados do mundo real para nós é que temos menos de 10% de falhas de unidade em 10 anos e nunca falhas próximas, por isso estou bastante à vontade para usar discos antigos, mas gosto de ser informado sempre que possível; Nosso conjunto atual de drives varia de 0-8 (em execução) anos, em média, provavelmente em torno de 3-4 anos, a falha mais recente foi uma unidade de execução de 5 anos. Além disso, temos um inversor de 40 gb e 80 gb cada um com mais de 10 anos (data de fabricação) e ainda usados de maneira confiável aqui e ali. Dados suficientes para dizer que os discos rígidos SATA duram bem mais de 5 anos, mas não o suficiente para mostrar uma tendência de quanto tempo.

Backround:

Estamos mudando para uma configuração OBR10 para uma pequena empresa com unidades SATA de 4 a 6 anos e estou tentando descobrir o quão prudente seria passar para uma cópia de 3 cópias MD RAID 10 vs 2 .

Com espelhos de dados diários e backups completos, não seria prejudicial ter uma perda de matriz primária completa e precisar recriar e restaurar a partir do backup, mas eu adoraria evitar esse cenário. No entanto, não consigo encontrar dados que pareçam muito além da idade de nossas unidades atuais . e não há indícios de que eles falhem em massa na marca de 5 +/- anos em que os dados parece parar.

    
por Damon 02.01.2017 / 08:43

1 resposta

8

TLDR: É impossível colocar um número na vida média do disco rígido, porque é complexo demais.

Não há uma medida real da vida média, pois depende profundamente de uma carga inteira de fatores diferentes. É um pouco como perguntar quanto tempo é um pedaço de string . Para uma unidade específica, uma folha de dados pode ter algumas informações relevantes, embora ainda seja uma indicação bruta , que pode precisar ser interpretada com uma pitada de sal e folhas de chá.

Para começar, uma única falha na unidade quando você tem uma unidade é uma tragédia tendo uma unidade de uma matriz invadida que faz parte de um cluster de matrizes é uma estatística.Não é possível olhar para uma determinada dirija e diga "isso certamente durará uma década". Pode-se dizer "Esta unidade deve durar 5 anos" e planejar substituí-la de uma maneira planejada.

Eu também notaria que o backblaze e o google, e a maior parte da indústria está preocupada com as taxas de falhas average e confiabilidade ao longo da vida útil de uma unidade condições específicas . Eles querem comprar um caminhão cheio de drives, executá-los da forma mais barata e eficiente possível, e não se preocupar com eles até a substituição planejada. É ainda melhor saber "estes são os sinais de que uma unidade vai morrer" do que tê-los morrendo e ser capaz de equilibrar os custos de resfriar um lugar com os custos de hardware de unidades de disco rígido tostadas fritando.

Na prática, os discos rígidos são dispositivos comuns - e normalmente a maioria dos lugares não acompanha a confiabilidade. Foi apenas recentemente (relativamente!) Que grandes empresas começaram a implantar frotas gigantescas dessas unidades e começaram a compartilhar suas informações de confiabilidade.

Há uma boa razão para que haja um enfoque na análise preditiva de falhas e na seleção de modelos para confiabilidade sobre confiabilidade a longo prazo . Simplesmente todo hardware morre e é "mais barato" em termos de mão-de-obra, tempo de inatividade e, em alguns casos, até mesmo para substituir os drives antes eles tendem a morrer de falha mecânica.

Específicos unidades podem ter problemas - o Seagate 7200.11 era conhecido por morrer aleatoriamente devido a firmware ruim, por exemplo, e foi corrigido posteriormente. Outras marcas e modelos de drive podem ter níveis ridículos de confiabilidade. Eu literalmente nunca tive uma unidade de desktop HGST falhando, nunca.

Você pode procurar o tempo médio de falha para o modelo - que deve se correlacionar com a vida média do disco, mas a literatura moderna parece considerá-lo uma carga de hóquei em cavalos. A Seagate mudou para AFR de qualquer maneira.

Enquanto pesquisava isso, deparei-se com esse ótimo conjunto de slides por alguém da WD. Não tenho certeza se a palestra associada está em qualquer lugar on-line.

Há uma indicação excelente de qual é a confiabilidade / tempo de vida mínimos que uma grande fabricante de discos rígidos espera.

Avoid an un-manageable catastrophe midway (or beyond) through a product’s warranty life

A garantia típica para um dispositivo empresarial e para os discos rígidos de consumo mais antigos é de 5 anos. São 3 anos para unidades mais novas. Assim, o fabricante do seu disco rígido assume que suas unidades não falharão antes de 5 anos, pois isso lhes custará dinheiro. Como tal, eles assumem que você assume o risco ou o substitui após o tempo.

O restante da apresentação é uma boa leitura, mas passa pela maior parte da física.

Este é um pequeno gráfico simples que mostra todos os elementos envolvidos na confiabilidade do disco rígido, tirados do mesmo conjunto de slides

E enquanto a clássica curva do banho é o que as pessoas falam sobre a confiabilidade do drive, coisas como o ciclo de trabalho real , quando as gravações acontecem em um disco, e a temperatura importa     

por 02.01.2017 / 11:41