Erros cksum do ZFS no LSI 9207-9i (SAS2308) com SSDs Samsung 850 Pro

4

Estou testando um controlador LSI 9207-8i com 8 unidades SSDs Samsung 850 Pro de 256 GB conectadas. Os SSDs estão executando o firmware mais recente EXM02B6Q, o controlador está executando o P17 e exibiu os mesmos problemas com o P19. A RAM do servidor é ECC e está testando no modo espelhado.

Eu testei com o ZFS-On-Linux e FreeBSD, e tentei o driver da LSI em ambos os sistemas operacionais.

Os discos se comportam como esperado, mas durante as operações de IO pesado eles parecem estar escrevendo blocos defeituosos. Ao executar uma limpeza nos discos, erros de soma de verificação são exibidos. Para simular o IO pesado, estou usando um tamanho de registro de 16k com primarycache = metadata e secondarycache = none. Eu gerar um arquivo aleatório de 4GB e dd isso para outro arquivo em 4 threads. Dar um loop nisso algumas vezes é o suficiente para um scrub mostrar erros de checksum.

Ainda para confirmar se isso é um problema com o controlador, SSDs ou cabos. Estou suspeitando dos SSDs, mas testarei com um 9211-8i na próxima oportunidade.

Alguém já passou por um problema semelhante ou alguém tem alguma sugestão sobre o que fazer a seguir - além de substituir o controlador / SSDs?

Atualização: Testei outro Samsung 850 Pro 256GB com firmware EXM01B6Q em um servidor totalmente diferente, usando o controlador SATA integrado. O mesmo problema ocorre com as somas de verificação.

    
por Christopher King 17.03.2015 / 18:06

3 respostas

4

Eu tive esse problema no passado com o Samsung 850 Evo também. As unidades se apresentam como 512K alinhadas no OmniOS / OpenSol, o que, por não ter o parâmetro ashift, você consegue esse problema. Parece ser algum tipo de problema de coleta de lixo nos próprios discos, eu escrevo uma tonelada de dados, esfrego - e vejo erros.

Acabamos forçando os discos a se apresentarem como 4K alinhados no sd.conf, e o ZFS começou a se comportar corretamente.

Eu pensei em trazer isso para outra pessoa que tenha o mesmo problema.

    
por 12.02.2017 / 08:15
3

Consegui resolver o problema definindo ashift = 12 (alinhamento 4k) ao criar o pool.

    
por 17.06.2015 / 11:23
0

Eu suspeitaria dos SSDs Samsung 850 orientados para o consumidor ou do backplane da unidade, supondo que haja um nessa configuração.

Isso ocorre principalmente porque você está tendo erros em dois sistemas operacionais diferentes. Você pode fornecer outros detalhes sobre a configuração de hardware?

    
por 17.03.2015 / 18:12

Tags