Primeiro, olhe /var/log/messages
(ou seja, dmesg) para ver porque o / dev / sdb1 foi retirado do RAID. Provavelmente, houve um erro ao ler ou gravar em / dev / sdb1.
Se você executar smartctl -a /dev/sdb
, suspeito que o disco tenha um valor diferente de zero para reallocated sectors
ou current pending sectors
. Se tiver um setor realocado, o disco está começando a degradar e deve ser substituído imediatamente se este for um servidor de produção. Embora você possa fazer mdadm /dev/md0 -r /dev/sdb1
seguido por mdadm /dev/md0 -a /dev/sdb1
para remover e adicionar novamente a partição, é melhor fazer backup dos seus dados e substituir / dev / sdb imediatamente.
Para substituir o disco, faça o seguinte:
- Faça o backup de seus dados e desligue a máquina.
- Anote o número de série de cada unidade (assim você sabe qual precisa ser substituído).
- Instale seu novo disco rígido, inicialize a máquina e verifique se os nomes dos dispositivos não foram alterados. Se os nomes dos dispositivos tiverem mudado, pegue um pedaço de papel e observe qual novo nome de dispositivo corresponde a cada nome antigo e número de série. Você já deve saber disso, mas pode usar
cat /proc/mdstat
para ver quais nomes de dispositivos estão sendo usados pelos RAIDs efdisk -l
ousmartctl -a <device>
para verificar os números de série. - Particione o novo disco conforme apropriado (usando os mesmos tamanhos de partição dos outros discos).
- Para cada RAID, adicione a partição apropriada da nova unidade com
mdadm <md device> -a <new disk partition>
(Ah, e caso você queira perguntar ... sim, o software RAID é tão incrível. Você pode adicione quantos espelhos quiser ao RAID1 de um software Linux. - Verifique periodicamente o status de recriação com
cat /proc/mdstat
. - Quando a reconstrução estiver concluída, execute
mdadm -f <md device> -f <bad disk's partition>
seguido por 'mdadm -f -f para cada RAID1 que use o disco danificado. Isso marca a partição do disco defeituoso como falha e, em seguida, remove-a do RAID. - Desligue a máquina e remova o disco danificado.
- Se você quiser mais de um espelho daqui para frente, repita as etapas de 3 a 6 para um ou mais discos adicionais. Caso contrário, você terá que usar o mdadm para redimensionar os RAIDs de volta para 2 dispositivos (ou então o md irá avisá-lo sobre matrizes degradadas toda vez que você reinicializar).
NOTA: se o SMART diags não relatar erros críticos para / dev / sdb, pode ser apenas que / dev / sdb1 foi retirado / dev / md0 porque excedeu o limite de tempo limite. Nesse caso, o / dev / sdb pode estar bem, mas não faria mal fazer backup dos seus dados e adicionar um ou mais espelhos adicionais de qualquer maneira.