zpool status reporta erro… o que vem depois?

6

No nosso servidor FreeNAS, zpool status me dá:

  pool: raid2
 state: ONLINE
status: One or more devices has experienced an unrecoverable error.  An
    attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
    using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://www.sun.com/msg/ZFS-8000-9P
 scrub: none requested
config:

    NAME                                            STATE     READ WRITE CKSUM
    raid2                                           ONLINE       0     0     0
      raidz1                                        ONLINE       0     0     0
        gptid/5f3c0517-3ff2-11e2-9437-f46d049aaeca  ONLINE       0     0     0
        gptid/5fe33556-3ff2-11e2-9437-f46d049aaeca  ONLINE       3 1.13M     0
        gptid/60570005-3ff2-11e2-9437-f46d049aaeca  ONLINE       0     0     0
        gptid/60ebeaa5-3ff2-11e2-9437-f46d049aaeca  ONLINE       0     0     0
        gptid/61925b86-3ff2-11e2-9437-f46d049aaeca  ONLINE       0     0     0

errors: No known data errors

O que devo fazer? scrub do pool?

    
por Ze'ev 04.04.2014 / 20:25

4 respostas

5

Digite zpool clear raid2 para limpar os erros e iniciar um scrub.

Se os erros persistirem após isso, substitua o disco.

Mais detalhes sobre o hardware ajudariam, então este é um conselho genérico. Minha recomendação para o monte de discos de consumo conectados a uma placa-mãe do PC é diferente do que eu faria para equipamentos de nível corporativo.

    
por 04.04.2014 / 20:30
3

A ferramenta diz o que você precisa fazer: " Determine se o dispositivo precisa ser substituído ".

As ferramentas são tão inteligentes e precisam de você, como administrador humano, para descobrir algumas coisas. As etapas necessárias são específicas para o seu hardware e sua configuração, portanto, você precisará tomar algumas decisões com base no seu conhecimento do sistema.

Dê uma olhada na saída do comando. Parece que o dispositivo gptid/5fe33556-3ff2-11e2-9437-f46d049aaeca está com erros de "WRITE". '1.13M' é uma taxa de erro muito alta e suspeito que o problema tenha ocorrido por um tempo sem que você tenha percebido. Veja se você consegue descobrir o motivo e depois substituir o disco.

Se você tiver um controlador de hardware, esse controlador poderá ter ferramentas adicionais para ajudá-lo a determinar a natureza da falha.

O ZFS pode lidar com setores corruptos, portanto não há necessidade de pânico. Mas não ignore o problema também.

Como medida preventiva, você também deve executar um scrub do ZFS regularmente. Veja o link . Isso irá alertá-lo quando o ZFS encontrar um problema, bem antes de atingir a marca de 1,13 M.

    
por 04.04.2014 / 20:29
3

Use o seguinte comando para alterar / dev / adaX para suas unidades.

[blackout @ freenas ~] # smartctl -a / dev / ada0 | grep "Serial"
Número de série: WD-WCC4EXXXXXXXX
também um útil commant [blackout @ freenas ~] # status do glabel

    
por 28.10.2015 / 01:10
2

Embora a pergunta seja antiga, pode ser vista por outras pessoas.

Nesse caso, lembre-se de que a saída de zpool status e zpool status -v está relacionada a todos os erros detectados. Isso inclui erros devido às portas SATA da sua placa-mãe (se usadas), à placa HBA (se usada), aos próprios cabos SATA ... não apenas aos discos.

Três testes rápidos de diagnóstico são: verifique o disco rapidamente usando smartctl , verifique se a placa está encaixada corretamente e não solta e tente uma porta diferente ou um cabo SATA (o cabo é uma causa comum de erros de leitura / gravação).

    
por 27.11.2017 / 06:56