Qual é o estado atual (2016) dos SSDs no RAID?

48

Existem muitos recursos disponíveis on-line que discutem o uso de unidades SSD em configurações RAID - no entanto, elas ocorrem há alguns anos, e o ecossistema SSD é muito rápido - exatamente como esperamos que o lançamento do produto "Optane" da Intel mais tarde este ano, que vai mudar tudo ... de novo.

Vou começar minha pergunta afirmando que há uma diferença qualitativa entre os SSDs de nível de consumidor (por exemplo, Intel 535) e os SSDs de grau de datacenter (por exemplo, Intel DC S3700).

Minha principal preocupação está relacionada ao TRIM de suporte em cenários RAID. No meu entender, apesar de serem mais de 6 anos desde que os SSDs foram introduzidos em computadores de consumo e 4 anos desde que o NVMe estava comercialmente disponível - os controladores RAID modernos ainda não suportam a emissão de comandos TRIM para SSDs conectados - com exceção de Controladores RAID da Intel no modo RAID-0.

Surpreende-me que o TRIM support não esteja presente no modo RAID-1, dado o modo como as unidades se espelham, parece simples. Mas eu divago.

Eu notei que se você quiser tolerância a falhas com discos (HDD e SSD), você os usaria em uma configuração RAID - mas como os SSDs seriam sem TRIM isso significa que eles sofreriam Write-Amplification, o que resulta em extra desgaste, o que, por sua vez, faria com que os SSD falhassem prematuramente - essa é uma ironia infeliz: um sistema projetado para proteger contra falhas de unidade pode resultar diretamente nele.

Então:

  1. O TRIM de suporte é necessário para os SSDs modernos (era de 2015-2016)?

    1.1. Existe alguma diferença na necessidade de TRIM de suporte entre SSDs baseados em SATA, SATA-Express e NVMe?

  2. Muitas vezes, as unidades são anunciadas como tendo melhorado a coleta de lixo interna; isso evita a necessidade de TRIM ? Como o processo de GC funciona em ambientes RAID?

    1.1. Por exemplo, consulte este QA de 2010, que descreve a degradação de desempenho muito ruim devido ao não-TRIMming ( link ) - e este artigo de 2015 defende que o uso do TRIM é altamente recomendável ( ). Qual é a sua resposta a esses argumentos strongs para a necessidade de TRIM ?

  3. Muitos artigos e discussões de anos anteriores dizem respeito ao Flash SLC vs MLC e que o SLC é preferível, devido à sua vida útil muito mais longa - no entanto, parece que todos os SSDs hoje (independentemente de onde eles estejam no espectro Consumer-to-Enterprise) ) são os dias da MLC - essa distinção de relevância é mais?

    1.1 E quanto ao flash TLC?

  4. Os SSDs corporativos tendem a ter limites de resistência / gravação muito mais altos (geralmente medidos em quantas vezes você pode sobrescrever completamente o disco por dia, durante o ciclo de vida esperado de 5 anos) se o ciclo de gravação o limite é muito alto (por exemplo, 100 gravações completas por dia) isso significa que elas não precisam de TRIM porque esses limites são tão altos, ou - o oposto - esses limites só são atingíveis usando TRIM ? / p>

por Dai 13.05.2016 / 11:47

4 respostas

24

Vamos tentar responder uma pergunta de cada vez:

  • O suporte TRIM é necessário para as SSDs modernas (era 2015-2016)?

Resposta curta: na maioria dos casos, não. Longa resposta: se você reservar espaço livre suficiente (~ 20%), mesmo o drive consumidor geralmente tem valores de consistência de desempenho bastante bons (mas você precisa para evitar as unidades que, em vez disso, sufocam gravações sustentadas ). As unidades de nível corporativo são ainda melhores, porque possuem um espaço disponível mais alto por padrão e porque sua combinação controlador / firmware é otimizada para o uso contínuo da unidade. Por exemplo, dê uma olhada na unidade S3700 que você referenciou: mesmo sem aparar, ela tem uma consistência de gravação muito boa.

  • Muitas vezes, as unidades são anunciadas como tendo melhorado o recurso interno coleta de lixo, isso elimina a necessidade de TRIM? Como seu processo de GC funciona em ambientes RAID

O coletor de lixo de drive faz sua mágica dentro da sandbox da unidade - ele não sabe nada sobre o ambiente externo. Isso significa que ele é (principalmente) não afetado pelo nível de RAID do array. Dito isso, alguns níveis de RAID (basicamente baseados em paridade) podem às vezes (e em algumas implementações específicas) aumentar o fator de amplificação de gravação, o que, por sua vez, significa um trabalho maior para as rotinas de GC.

  • Muitos artigos e discussões de anos anteriores dizem respeito ao SLC vs MLC flash e que o SLC é preferível, devido à sua vida útil muito mais longa, no entanto, parece que todos os SSDs (independentemente de onde eles estão no espectro Consumer-to-Enterprise) são os dias do MLC - isto é distinção de relevância mais

Os drives SLC basicamente desapareceram da empresa, sendo relegados principalmente para tarefas militares e algumas tarefas industriais. A empresa marcada agora está dividida em três graus:

  • O flash HMLC / MLCe é o único com os melhores chips MLC binários e certificado para suportar pelo menos 25000/30000 ciclos de reescrita;
  • Os chips
  • 3D MLC são classificados em cerca de 5000-10000 ciclos de reescrita;
  • os chips planar MLC e 3D TLC normais são classificados em cerca de 3000 ciclos de reescrita.

Na realidade, qualquer um dos tipos de flash acima deve fornecer a você uma capacidade total de gravação e, de fato, você pode encontrar unidades corporativas com todos os tipos de flash acima.

A diferenciação real entre as unidades corporativas e de consumidor é:

  • o combo controlador / firmware, com drives corporativos muito mais difíceis de morrer devido a um bug inesperado do controlador;
  • o cache de gravação protegido contra energia, extremamente importante para evitar danos à Camada de Tradução Flash (FTL), que é armazenada no próprio flash.

Os drivers de nível empresarial são melhores principalmente devido a seus controladores e capacitores de energia, e não devido a um melhor flash.

  • Os SSDs corporativos tendem a ter uma resistência / limites de escrita (muitas vezes medidos em quantas vezes você pode substituir a unidade em um dia, durante os 5 anos esperados de uma unidade tempo de vida), isso evita quaisquer preocupações sobre a Amplificação de causado por não executar o TRIM?

Como dito acima, os inversores de nível corporativo têm muito mais espaço de reposição padrão (~ 20%), o que, por sua vez, reduz drasticamente a necessidade de TRIMs regulares

De qualquer forma, por favor, considere alguns RAIDs de software que suportam TRIMs (alguém disse Linux MDRAID? )

    
por 13.05.2016 / 13:08
9

TRIM não é algo com que eu me preocupo ao usar SSDs em controladores RAID modernos. Os SSDs melhoraram, os recursos do controlador RAID de hardware foram otimizados para essas cargas de trabalho e os relatórios de resistência geralmente estão em vigor.

TRIM é para unidades SATA inferiores. Para SAS SSDs, temos SCSI unmap, e talvez seja por isso que não encontro necessidades TRIM ...

Mas o outro comentarista está correto. O armazenamento definido por software (SDS) está mudando a forma como usamos os SSDs. Em soluções SDS, os controladores RAID são irrelevantes. E coisas como o TRIM tendem a ser menos importantes porque os SSDs estão preenchendo papéis especificados. Penso no cache de leitura de armazenamento Nimble ou no ZFS L2ARC e ZIL ... Todos eles atendem a necessidades específicas e o software aproveita os recursos com mais inteligência.

    
por 13.05.2016 / 12:22
1

Níveis de RAID com SSD Uma resposta acima sugere que os níveis de RAID com paridade, como o RAID 5, aumentam a amplificação de gravação. Existe realmente mais do que uma maneira de interpretar isso: o impacto em uma unidade ou o impacto no conjunto de unidades.

Comparado a nenhuma redundância, o RAID 5 adiciona gravações ao conjunto à medida que adiciona paridade de soma de verificação. Em comparação com um conjunto RAID 0 de unidades (n-1), o impacto por unidade do conjunto RAID 5 com n unidades não é nada. Cada um dos n drives recebe tantas gravações. O RAID 5 adiciona 1 / (n-1) gravações extras ao conjunto. No entanto, RAID 1 e RAID 10 adicionam 100% de gravações extras ao conjunto, porque tudo escrito em um SSD é gravado em seu espelho.

Portanto, em termos de gravação em um conjunto RAID 5 versus um conjunto RAID 10 com o mesmo número de unidades, os SSDs no conjunto RAID 5 receberão menos gravações. E isso permanece verdadeiro mesmo se você aumentar o número de SSDs no conjunto RAID 10 para equalizar a capacidade utilizável.

    
por 03.02.2017 / 00:19
0

shodanshok tocou na resposta real aqui. Se você reservar espaço extra, "superprovisionamento", a consistência do desempenho de gravação e resistência do seu SSD será melhorada ao longo do tempo, e a falta de suporte a TRIM se tornará praticamente irrelevante. A reserva desse espaço extra pode ser feita de forma tão simples quanto, começando com um novo SSD, particionando menos que a capacidade total. A maioria dos controladores in-drive trata o espaço nunca utilizado da mesma forma que o espaço reservado e, portanto, reduz significativamente a amplificação de gravação. Para inicialização e sistema operacional, provavelmente 10% de espaço reservado é suficiente. Para unidades que são reescritas frequentemente, aumente esse espaço.

    
por 03.02.2017 / 00:08