Resolução de problemas 'Buffer I / O error' no software-raid / md-device

1

Eu tenho um array mdadm RAID-5 que faz com que Buffer I/O error on dev md0, logical block 1598030208, async page read seja escrito% dodmesg ao ler esse bloco. Naturalmente, a leitura também falha efetivamente. Esse comportamento é consistente nas reinicializações e é sempre o mesmo bloco.

Eu gostaria de entender de onde vem o erro. Pelo que entendi, qualquer uma das unidades físicas deve causar problemas, ou talvez a matriz esteja em um estado inconsistente. De qualquer forma, gostaria de saber qual é, para que eu possa tomar outras medidas para tentar resolver o problema.

Infelizmente, dmesg não fornece mais dicas. Eu olhei para os parâmetros smart de todas as unidades envolvidas, mas nenhuma levanta suspeitas. O que mais posso tentar solucionar o array?

Obrigado antecipadamente!

Editar: conforme solicitado, a saída de mdadm --detail /dev/md0 :

/dev/md0:
        Version : 1.0
  Creation Time : Sat Dec 28 03:50:47 2013
     Raid Level : raid5
     Array Size : 15621798144 (14898.11 GiB 15996.72 GB)
  Used Dev Size : 3905449536 (3724.53 GiB 3999.18 GB)
   Raid Devices : 5
  Total Devices : 5
    Persistence : Superblock is persistent

    Update Time : Fri Dec 22 11:36:24 2017
          State : clean 
 Active Devices : 5
Working Devices : 5
 Failed Devices : 0
  Spare Devices : 0

         Layout : left-symmetric
     Chunk Size : 64K

           Name : 0
           UUID : 01a3d3c1:6a5ac63d:0cc10dd0:f8e7a1c4
         Events : 2132931

    Number   Major   Minor   RaidDevice State
       5       8       51        0      active sync   /dev/sdd3
       1       8       83        1      active sync   /dev/sdf3
       4       8       35        2      active sync   /dev/sdc3
       7       8       67        3      active sync   /dev/sde3
       6       8        3        4      active sync   /dev/sda3

Atualização: tentei depurar a matriz escrevendo repair to md/sync_action . O processo foi concluído sem qualquer saída para dmesg ou sinais de problemas em /proc/mdstat . No entanto, a leitura da matriz ainda falha no mesmo bloco acima, 1598030208 .

Atualização 2, para referência: Eu fiz esta pergunta na lista de discussão do linux-raid: link

    
por RQM 26.12.2017 / 20:13

0 respostas