FreeNAS está recebendo erros de paridade / CRC incorrigíveis

1

Na minha instalação do FreeNAS 9.3, recebo mais e mais erros de paridade / CRC incorrigíveis (como estes aqui:

May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): READ_FPDMA_QUEUED. ACB: 60 00 b8 0e 18 40 91 00 00 01 00 00
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): CAM status: Uncorrectable parity/CRC error
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): Retrying command
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): READ_FPDMA_QUEUED. ACB: 60 00 68 10 18 40 91 00 00 01 00 00
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): CAM status: Uncorrectable parity/CRC error
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): Retrying command
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): READ_FPDMA_QUEUED. ACB: 60 00 18 12 18 40 91 00 00 01 00 00
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): CAM status: Uncorrectable parity/CRC error

primeiro eu mudei dois discos com essas menções - mas agora um dos meus discos mais recentes (em outra porta) também está recebendo esses discos. Então, tenho certeza de que essa unidade não tem problemas.

O que pode causar esses erros? Nós não temos o ECC Ram neste servidor ...

No S.M.A.R.T. Log não é nada que aponta para problemas, por isso estou confuso:

197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0


SMART Error Log Version: 1                                
No Errors Logged

SMART Self-test log structure revision number 1           
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      2398         -
    
por Mr.Gosh 15.05.2015 / 16:05

1 resposta

3

Você tem um disco, controlador ou falha no cabo.

Você não forneceu detalhes sobre o hardware envolvido nesta solução. O problema não é de RAM, mas trate isso como qualquer outro esforço de solução de problemas:

  • Isso está afetando vários discos.
  • Os relatórios SMART nos discos não mostram erros ... Mas eles são SATA ...
  • Investigue como os discos estão conectados? Via backplane? Através de cabos de fan-out combinados?
  • Isso soa como equipamento SATA. Você trocou de cabos?
  • Qual é o seu relatório de controlador?
  • Você google a string de erro que você está recebendo?
por 06.06.2015 / 14:54