Eu tenho uma matriz de 45 discos do Seagate Barracuda 3 TB ST3000DM001 (sim, essas são unidades de desktop que conheço) em um JBOD Supermicro sc847, conectado via LSI 9285. Eu encontrei uma solução para a descrição do problema abaixo reduzindo a velocidade via
MegaCli -PhySetLinkSpeed -phy0 2 -a0;
for i in $(seq 48); do MegaCli -PhySetLinkSpeed -phy${i} 2 -a0; done
e reinicializando.
A questão permanece: Isso é típico dos equipamentos atuais de 6 gb / s? Este é o triste estado do armazenamento SATA? Ou alguns dos meus equipamentos (os cabos sff-8088 vêm à mente) são ruins?
O problema foi:
Sincronizando o HW RAID-6, discos mantidos off-line. A busca de valores SMART revelou que os que foram offlines não aumentavam mais as horas de ativação. Ou seja, o firmware deles (CC4C) parece travar.
Pesquisando o assunto mudando para o Software RAID-6, com os discos passados, recebi toneladas de mensagens do kernel espalhadas por todos os discos, com 6 gb / s:
sd 0:0:9:0: [sdb] Sense Key : No Sense [current]
Info fld=0x0
sd 0:0:9:0: [sdb] Add. Sense: No additional sense information
E finalmente, quando um disco off-line:
megasas: [ 5]waiting for 160 commands to complete
...
megasas: [35]waiting for 159 commands to complete
...
megasas: [155]waiting for 156 commands to complete
...
megaraid_sas: pending commands remain after waiting, will reset adapter.
Reinicialização do controlador feio aqui e minutos depois:
megaraid_sas: Reset successful.
sd 0:0:28:0: Device offlined - not ready after error recovery
...
sd 0:0:28:0: [sdu] Unhandled error code
sd 0:0:28:0: [sdu] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK
sd 0:0:28:0: [sdu] CDB: Read(10): 28 00 23 21 2f 40 00 00 70 00
sd 0:0:28:0: [sdu] killing request
Velocidade reduzida para 3 gb / s como descrita acima, todos os problemas desapareceram.