Falha no disco do Zpool - Onde estou?

3

Depois de verificar o status de um dos meus zpools hoje, fui confrontado com o seguinte:

root@server: zpool status -v myPool


pool: myPool
 state: ONLINE
status: One or more devices has experienced an unrecoverable error.  An
        attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
        using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://www.sun.com/msg/ZFS-8000-9P
 scrub: resilver completed after 3h6m with 0 errors on Tue Sep 28 11:15:11 2010
config:

        NAME           STATE     READ WRITE CKSUM
        myPool         ONLINE       0     0     0
          raidz1       ONLINE       0     0     0
            c6t7d0     ONLINE       0     0     0
            c6t8d0     ONLINE       0     0     0
            spare      ONLINE       0     0     0
              c6t9d0   ONLINE      54     0     0
              c6t36d0  ONLINE       0     0     0
            c6t10d0    ONLINE       0     0     0
            c6t11d0    ONLINE       0     0     0
            c6t12d0    ONLINE       0     0     0
        spares
          c6t36d0      INUSE     currently in use
          c6t37d0      AVAIL   
          c6t38d0      AVAIL   

errors: No known data errors

Pelo que vejo, o c6t9d0 encontrou 54 erros de gravação. Parece que ele foi resilvered automaticamente com o disco sobressalente c6t36d0, que está atualmente em uso.

Minha pergunta é: onde exatamente eu estou? Sim, a 'ação' me diz para determinar se o disco precisa ou não ser substituído, mas este disco ainda está em uso? Posso substituir / remover?

Qualquer explicação seria muito apreciada, já que sou muito novo neste material:)

update: Após seguir o conselho da C10k Consulting, ou seja, destacar:

zpool detach myPool c6t9d0

e adicionando como sobressalente:

zpool add myPool spare c6t9d0

Parece que tudo está bem. O novo status do meu zpool é:

root@server: zpool status -v myPool
  pool: myPool
 state: ONLINE
 scrub: resilver completed after 3h6m with 0 errors on Tue Sep 28 11:15:11 2010
config:

        NAME         STATE     READ WRITE CKSUM
        muPool      ONLINE       0     0     0
          raidz1     ONLINE       0     0     0
            c6t7d0   ONLINE       0     0     0
            c6t8d0   ONLINE       0     0     0
            c6t36d0  ONLINE       0     0     0
            c6t10d0  ONLINE       0     0     0
            c6t11d0  ONLINE       0     0     0
            c6t12d0  ONLINE       0     0     0
        spares
          c6t37d0    AVAIL   
          c6t38d0    AVAIL   
          c6t9d0     AVAIL   

errors: No known data errors

Obrigado pela sua ajuda c10k consulting:)

    
por JT.WK 07.10.2010 / 04:10

3 respostas

3

zpool remove myPool c6t37d0

zpool replace myPool c6t9d0 c6t37d0

Isso fará com que uma das suas hot spares seja utilizável como um disco normal (c6t37d0) e, em seguida, substitua o disco defeituoso (c6t9d0) pelo disco agora livre (c6t37d0) Uma vez que tudo esteja feliz, substitua fisicamente c6t9d0 e, em seguida:

zppol add myPool spare c6t9d0

E você voltará a uma configuração feliz com 3 peças de reposição disponíveis.

Ou você pode simplesmente extrair o c6t9d0 e deixar o c6t36d0 tomar o seu lugar, emitindo:

zpool detach myPool c6t9d0

Em seguida, substitua c6t9d0 e adicione-o novamente como sobressalente.

    
por 07.10.2010 / 04:19
3

(Eu só queria comentar, mas não tenho os pontos.) Apenas no caso de JT.WK queria saber onde nos documentos isso é, isso é muito semelhante a " Guia de Administraçà £ o do ZFS do Oracle® Solaris "page 88" Ativando e desativando hot spares no pool de armazenamento " . Ainda sou novo no ZFS, e o Admin Guide me ajuda bastante.

    
por 07.10.2010 / 05:31
3

Parece que você está apenas arranhando a superfície em termos de gerenciamento do armazenamento do ZFS.

Sugerir o uso desses dois links e eu acho que você vai pegar alguns pontos de dados adicionais para você:

Para gerenciar zpools: link

 General ZFS Admin reference: [Dead link due to oracle request]
 http://www.filibeto.org/~aduritz/truetrue/solaris10/zfsadminguide-html/toc.html

Existem muitos mais, mas estes dois ficaram na minha mente para o seu tópico em particular.

    
por 07.10.2010 / 05:01