ZFS substitui discos no freebsd, como e quando

2

Eu tenho a seguinte configuração de zpool:

zpool status
    NAME        STATE     READ WRITE CKSUM
    data        ONLINE       0     0     0
      raidz2-0  ONLINE       0     0     0
        da1     ONLINE       0     0     0
        da0     ONLINE       0     0     0
        da3     ONLINE       0     0     0
        da4     ONLINE       0     0     0
        da2     ONLINE       0     0     0
        da5     ONLINE       0     0     0
        da7     ONLINE       0     0     0
        da6     ONLINE       0     0     0
      raidz2-1  ONLINE       0     0     0
        da21    ONLINE       0     0     1  (repairing)
        da14    ONLINE       0     0     0
        da22    ONLINE       0     0     0
        da23    ONLINE       0     0     0
        da13    ONLINE       0     0     0
        da9     ONLINE       0     0     0
        da12    ONLINE       0     0     0
        da20    ONLINE       0     0     0
      raidz2-2  ONLINE       0     0     0
        da11    ONLINE       0     0     0
        da18    ONLINE       0     0     0
        da8     ONLINE       0     0     0
        da10    ONLINE       0     0     0
        da15    ONLINE       0     0     0
        da16    ONLINE       0     0     0
        da17    ONLINE       0     0     0
        da19    ONLINE       0     0     0

da21 tem 1 CKSUM falhando a cada ~ 2 semanas. Preciso substituí-lo já, ou devo esperar até que haja mais erros? Eu estou bem do lado cauteloso, mas também não quero substituir um disco perfeitamente saudável.

Para realmente fazer isso, as etapas a seguir estão corretas? O guia oficial ( link ) tem alguns passos entre eles que dependem "cfgadm" mas eu não tenho isso no freebsd, então eu prefiro ter certeza de que não estou fazendo algo estúpido antes de começar a sujar as mãos.

zpool offline da21
<*physically replace device*>
zpool online daXX
zpool replace data da21 daXX

Posso fazer isso durante um scrub, ou devo esperar que o scrub termine / pare?

Qualquer ajuda muito apreciada:)

    
por Sebastian 11.10.2018 / 12:06

2 respostas

0

da21 has 1 CKSUM fail every ~2 weeks. Do i need to replace it already, or should i wait till there are more errors? I am rather on the cautious side, but don't want to replace a perfectly healthy disk either.

Eu primeiro substituo o cabo e verifico se o problema persistir em outro compartimento / outro gabinete / outro controlador (se possível em sua configuração). Eu tive mais erros de soma de verificação em uma dessas situações. Geralmente, os discos com falha mostram-se com erros de leitura ou gravação.

Também seria essencialmente livre em comparação com outra substituição de disco completa, que você ainda pode fazer se os erros persistirem (especialmente em Z2 ou Z3, onde a pressão para agir é muito menor). Claro, se você não pode correr o menor risco, você não deve fazer isso - mas neste caso, você já usaria Z3 ou vários espelhos, não é? E você ainda tem um backup atual e verificado pronto, então o risco é muito pequeno.

Can I do this during a scrub, or should i wait for the scrub to finish/stop it?

Se houver tempo, eu sempre esperarei o matagal. Você pode ter certeza de que outros discos no vdev também não exibem erros ocultos que podem levar a sérios danos se não forem encontrados antes de remover o disco (dependendo do nível de discos adicionais).

Se não houver tempo, simplesmente cancele o scrub com zpool scrub -s <poolname> .

    
por 16.10.2018 / 16:53
0

Eu substituí-lo agora, pessoalmente. Não adianta se preocupar com isso depois, e depois ter que lutar para conseguir um substituto.

Eles são hot swap? Eu acabei de sair do antigo e aparecer no novo. Se você puder evitar fazê-lo enquanto um scrub estiver em execução, faça isso.

    
por 11.10.2018 / 16:12