Bem, do log tudo está ok, ou? Reconstrução iniciada, sem erro, rebusos ainda em andamento.
Contexto e contexto
Eu tenho um controlador 3ware LSI RAID e uma configuração RAID6 em 16 discos físicos. Um dos HDDs morreu ontem à noite, e eu o substitui por um novo (idêntico) drive esta manhã.
Problema
O comando
/c0/u0 show
me dá
Unit UnitType Status %RCmpl %V/I/M Port Stripe Size(GB)
------------------------------------------------------------------------
u0 RAID-6 REBUILDING 7%(A) - - 256K 6519.12
u0-0 DISK OK - - p0 - 465.651
u0-1 DISK OK - - p1 - 465.651
u0-2 DISK OK - - p2 - 465.651
u0-3 DISK OK - - p13 - 465.651
u0-4 DISK OK - - p4 - 465.651
u0-5 DISK OK - - p5 - 465.651
u0-6 DISK OK - - p6 - 465.651
u0-7 DISK OK - - p7 - 465.651
u0-8 DISK OK - - p8 - 465.651
u0-9 DISK OK - - p9 - 465.651
u0-10 DISK OK - - p10 - 465.651
u0-11 DISK OK - - p11 - 465.651
u0-12 DISK OK - - p12 - 465.651
u0-13 DISK OK - - p3 - 465.651
u0-14 DISK OK - - p14 - 465.651
u0-15 DISK DEGRADED - - p15 - 465.651
u0/v0 Volume - - - - - 6519.12
Que no início eu estava seriamente preocupado (isto é, o novo disco também era ruim ou havia algo errado com o hardware da baia), mas a reconstrução está progredindo (acho que (A)
significa ativo) e show alarms
não dê erros;
c0 [Thu Aug 22 2013 23:14:32] WARNING Drive removed: port=15
c0 [Thu Aug 22 2013 23:14:32] ERROR Degraded unit: unit=0, port=15
c0 [Thu Aug 22 2013 23:14:32] WARNING Drive removed: port=15
c0 [Sun Aug 25 2013 08:53:27] INFO Drive inserted: port=15
c0 [Sun Aug 25 2013 08:54:33] INFO Rebuild started: unit=0
Eu não estava gerenciando a matriz da última vez que um disco falhou, mas da última vez que os relatórios ficaram assim:
c0 [Thu Apr 11 2013 20:52:51] WARNING Drive removed: port=3
c0 [Thu Apr 11 2013 20:52:51] ERROR Degraded unit: unit=0, port=3
c0 [Thu Apr 11 2013 20:52:51] WARNING Drive removed: port=3
c0 [Fri Apr 12 2013 10:42:35] INFO Drive inserted: port=3
c0 [Fri Apr 12 2013 10:44:24] INFO Rebuild started: unit=0
c0 [Fri Apr 12 2013 15:10:21] INFO Rebuild completed: unit=0
Então parece que, pelos alarmes, pelo menos, o que aconteceu da última vez está acontecendo de novo.
Então - é possível que degraded
neste contexto signifique apenas que ele está sendo reconstruído e, portanto, está fora de ação ou estou sendo brutalmente otimista e os erros degradados simplesmente não aparecem nos alarmes de exibição
UPDATE
Como sugerido - o disco foi reconstruído e tudo parece OK!