Se um controlador RAID falhar, ele interromperá o serviço até que seja substituído?

6

Se eu tiver 2 unidades em um RAID 1 e o RAID Controller falhar, isso significa que os sites no servidor terão tempo de inatividade até que o controlador seja substituído? Ou tudo ainda continua como invasão de software automaticamente até que a placa de invasão defeituosa seja substituída?

    
por Winker 17.08.2017 / 20:48

4 respostas

21

Or does everything still carry on as software raid automatically until the faulty raid card is replaced?

Como isso funcionaria? O software iria magicamente ignorar o ataque ao hardware, que funciona como controlador de disco? Não só o sistema operacional não vê os discos, eles são fisicamente conectados ao controlador RAID de hardware. Se o controlador falhar, sua conexão com os discos falhará.

Então não, você desce. É por isso que as pequenas configurações ganham muito com as ofertas de nuvem e as grandes configurações têm vários servidores.

    
por 17.08.2017 / 21:10
12

the Raid Controller fails

Sou engenheiro eletrônico, então minha imagem mental da palavra "falhar" pode variar de engenheiros de software ... Quero dizer, com que frequência vocês colocam óculos de segurança para depurar?

Se a sua placa controladora RAID tem algum tipo de falha de hardware que envolve MOSFETs em curto, capacitores de tântalo explodindo em bolas de fogo, acidentes de fornecimento de energia e coisas do tipo, muitas coisas podem acontecer, como desligar a fonte de alimentação do servidor porque detecta um curto. Nesse caso, tudo cai.

Se o chip principal da sua placa RAID parar de repente, o que acontece a seguir depende muito de como o sistema operacional e os drivers lidam com a morte súbita e inesperada de um periférico. Por exemplo, eu tinha um PC com um disco rígido morto. O PC congelou por um tempo enquanto o sistema operacional aguardava o disco rígido responder.

As pessoas que escrevem sistemas operacionais e drivers geralmente fazem isso em hardware de trabalho. Portanto, o código que lida com "CPU com placa de extensão acaba de pegar fogo" nunca foi depurado. Não posso culpá-los. Fato da vida.

Houve um tempo em que projetei um periférico USB. Eu rapidamente descobri que tinha que depurar essa coisa com um laptop lixo, porque se meu periférico USB se comportasse mal demais, o sistema operacional iria apenas OMFG e travaria e / ou reinicializaria.

Em resumo, um cartão dentro de um PC que recebe uma falha de hardware pode ter qualquer tipo de consignação, desde o nada até o kernel panic ou o desligamento total. Então não há como responder sua pergunta. Uma falha na placa RAID é semelhante a uma falha na placa-mãe. A única coisa que importa é recuperar seus dados.

    
por 17.08.2017 / 23:37
6

Você pode configurar raid ou hardware de software. O software não pode ser capturado magicamente, já que o software vê dois discos em uma raid 1 como um único disco. Não tem ideia dos discos físicos por trás do cartão. Só sabe o que a placa de ataque apresenta para o sistema operacional.

Então, para responder à sua pergunta se o cartão de ataque falhar, então o servidor está indo para baixo com ele. É muito raro que uma carta de ataque falhe.

    
por 17.08.2017 / 20:55
0

Se você realmente precisar desse nível de disponibilidade, sugiro que procure em um servidor ftServer da Stratus, com 99,999% de tempo de atividade. Você pode usar praticamente qualquer sistema operacional e não precisa alterar nada em seu aplicativo.

Eu trabalhei em armazenamento interno há quase 10 anos atrás. Podemos surpreender remover qualquer dispositivo (literalmente asserir pci reset sempre), detectar a falha e failover para o secundário com interrupção zero de serviço. Ele consegue isso usando a tecnologia lockstep.

No entanto, é caro, mas não ultrajante; 3-4x o custo de um servidor equivalente. As pessoas que costumam comprar esses produtos medem seu tempo de inatividade em dezenas de milhares de dólares por segundo, ou a vida está em jogo.

    
por 19.08.2017 / 00:08