Por que o mdadm desabilitou um disco na minha matriz de raid?

0

No syslog eu vejo:

Jun  3 15:07:12 storage kernel: [36518.430143] md/raid1:md0: Disk failure on sdd1, disabling device.
Jun  3 15:07:12 storage kernel: [36518.430143] md/raid1:md0: Operation continuing on 1 devices.

Esta foi uma falha de disco em um dos dois arrays raid1. Na semana passada eu tive duas falhas de disco ao mesmo tempo, uma em cada matriz. Eu suspeito que isso pode não ser um problema com os discos.

Eu adicionei as unidades novamente e tudo parece estar funcionando bem por enquanto.

Como posso descobrir por que o Linux desativou meus dispositivos?

    
por oliver602 05.06.2017 / 23:04

1 resposta

1

O primeiro passo para diagnosticar isso seria executar testes S.M.A.R.T no disco - algo como

sudo smartctl -A /dev/sdX

Para ver o que é auto reportado. Você também pode querer fazer longos testes em disco e ver o que eles dizem - embora provavelmente não muito.

Também pode valer a pena informar que tipo de discos você está usando. Um tempo atrás eu estava usando 2 discos regulares que pareciam ter problemas semelhantes - não me lembro os sintomas exatos ou mensagens, mas, eventualmente, atribui isso a eles não serem compatíveis com o RAID. Existem diferenças entre as unidades de desktop padrão e as unidades de classe RAID / Enterprise com relação ao tratamento do RAID - até mesmo o RAID do software MDADM.

    
por 06.06.2017 / 00:02