Procedimento adequado para substituir a unidade com falha no conjunto Xserve RAID RAID5 com hot spare?

5

Eu tenho um conjunto RAID-5 de cinco unidades (com uma sexta reserva) em um Xserve RAID executando o firmware 1.5 / 1.50f. Uma das unidades no conjunto RAID-5 tem uma luz de status âmbar / laranja acesa e vem recebendo erros ocasionais como:

Timestamp:  11/10/10 10:34:53 AM
Priority:   Warning
Controller: Upper Controller
Type:   112
Event ID:   1000
Event:  Disk 5 Reported An Error. COMMAND:0x35 ERROR:0x10 STATUS:0x51 LBA:0x19B80
Description:    The drive reported an ATA error. This is a failure in the communication from the RAID Controller to the drive.

Eu verifiquei duas vezes as unidades no RAID Admin e, como a unidade está apenas em estado de alerta, a peça de reposição ainda não foi puxada para o RAID. Como esta é uma unidade antiga, gostaria de substituir essa unidade em primeiro lugar. Eu tenho um backup completo e atual dos dados, mas quero ter certeza de que entendi o processo corretamente.

Eu entendo a seção "Instalando ou substituindo um módulo de unidade da Apple" do link , mas ele e A ajuda integrada do RAID Admin não descreve o que acontecerá ao substituir uma unidade em um conjunto RAID que tenha um hot spare. Quando eu puxar a unidade e substituí-la, ela irá usar corretamente a unidade recém-inserida ou usará o hot spare? Se usar o hot spare, o hot spare retornará para um hot spare quando a nova unidade for inserida ou será permanentemente um membro do conjunto RAID e precisará ser movido para o slot da unidade original? Ou, devo apenas puxar o hot spare, retirar a unidade com falha e estourar o hot spare no slot da unidade com falha?

    
por morgant 10.11.2010 / 18:43

1 resposta

1

De acordo com o manual no link , nenhuma unidade faz parte de um grupo de discos ou matriz serão tratados como hot spares globais (conforme a seção "Creating RAID Array") e serão reconstruídos automaticamente após a perda ou falha de uma unidade.

Parece que sua unidade não está em estado de falha, mas, como outros já mencionaram, se você puxar a unidade, ela deverá forçar o XServe a começar a reconstruir a paridade na unidade reserva. No entanto, durante esse período da reconstrução, você não poderá puxar nenhuma das outras unidades ou perderá os dados. Eu não estou familiarizado com as ferramentas de RAID envolvidas, mas deve dar a você algum tipo de interface de monitoramento para ver até onde ela está.

No meu sistema Dell MD3000i, quando a unidade falha ou é puxada, o hot spare entra imediatamente, e quando uma unidade de substituição é inserida, após a reconstrução, inicia o que é conhecido como "cópia de segurança" e replica hot spare de volta para a substituição, altura em que o sobressalente volta a ser um sobressalente novamente. No entanto, com base no que li no manual, parece que o XServe faz com que a unidade sobressalente faça parte da matriz, portanto, um bom palpite é que a sua unidade substituta acabará sendo a peça sobressalente novamente, já que não é parte do array:

"O controlador RAID que controla o array afetado tentará automaticamente reconstruir os dados para retornar o sistema a um estado protegido. Por exemplo, se um unidade hot spare está disponível quando uma unidade falha em uma matriz, o controlador unidade disponível e integra-a na matriz. O controlador recria o RAID array usando a nova unidade. "

    
por 16.04.2013 / 22:18

Tags