Preciso de um segundo controlador RAID para tolerância a falhas?

8

Eu tenho um servidor com 3 discos rígidos instalados e uma capacidade total de 6. Estamos planejando maximizar, mas nosso consultor também sugeriu obter um segundo controlador RAID "para redundância" para suportar os novos drives. Para mim, isso não faz muito sentido. Mesmo com um segundo controlador RAID executando metade dos discos, ainda estamos presos com apenas metade de nossos discos / programas / dados se um dos controladores morrer (o que não é muito melhor do que rodar com nenhum deles). Estamos colocando o vmware no servidor e ele mencionou vagamente alguns recursos avançados de tolerância a falhas / failover, mas se os discos estão inacessíveis devido a um controlador com falha, como ele deve funcionar?

Contando apenas os motivos de redundância, não de desempenho, por que eu desejaria ter um segundo controlador RAID no meu servidor?

    
por Bigbio2002 22.08.2011 / 20:49

4 respostas

10

Em um design de 'alta disponibilidade de caixa única', então sim, você desejaria um segundo controlador, idealmente em um segundo barramento também. Mas esse tipo de abordagem deu lugar a um design mais barato baseado em clustering, em que uma falha de caixa não interrompe o serviço. Portanto, depende se você planeja usar um ambiente em cluster ou confiar em uma única caixa. Mesmo que sua resposta seja a última, ter controladores duplos pode ser visto como um acréscimo de complexidade e talvez seja um exagero.

edite - com base no seu comentário sobre o uso do ESXi em sua outra pergunta, eu tenho que dizer que seu clustering é fabuloso , nós temos muitos clusters de 32-way que funcionam brilhantemente.

    
por 22.08.2011 / 20:59
6

Um segundo controlador RAID que é usado ativamente não é para redundância. Só se for um controlador de stand-by frio onde você troca todos os seus discos para quando o primeiro morre. Então você tem redundância (para o controlador). Mas cuidado ao fazer isso, como postado aqui .

Portanto, o RAID é para redundância de discos, levando a um único ponto de falha no controlador. Ter um segundo (não utilizado) controlador pode resolver isso como você poderia mudar todo o disco para o novo. Se isso funciona, depende de outros fatores ...

Eu não sou um falante nativo, mas para mim, "tolerância a falhas" é algo diferente de "redundância". Algum orador de inglês pode me ajudar aqui?

    
por 22.08.2011 / 20:57
3

Em uma única caixa, você realmente precisa de dois controladores RAID, conectados a dois complexos de raiz PCI-E diferentes, para ter redundância completa de subsistema de E / S. Isso pode ser alcançado por duas configurações diferentes:

  • use discos SAS portáveis de porta dupla, com cada link SAS conectado a um controlador diferente. Dessa maneira, cada controlador é conectado a cada disco. Obviamente, os dois controladores não podem operar em discos ao mesmo tempo; alguma forma de bloqueio / cerca é necessária para coordenar o acesso aos discos. SCSI tem alguma provisão especial para fornecer o mecanismo de esgrima necessário, mas estes devem ser coordenados por software apropriado. Em outras palavras, você não pode simplesmente conectar um disco a dois controladores e chamá-lo por dia; em vez disso, você precisa de uma configuração de software apropriada para permitir que funcione sem problemas;
  • use discos SAS / SATA de link único normais e mais baratos, conectando metade deles a cada controlador. Por exemplo, com 6 discos, você precisa conectar 3 discos a um controlador e 3 discos a outro controlador. Em cada controlador, configure uma matriz RAID conforme necessário (por exemplo: RAID 5 ou RAID1). Em seguida, no nível do sistema operacional, você pode configurar um RAID de software entre as duas matrizes de disco, obtendo redundância de matriz completa. Embora mais barata, essa solução tem o inconveniente adicional de efetivamente reduzir pela metade sua capacidade de armazenamento (devido ao nível de software RAID1).

Um problema-chave em ambas as abordagens é que você não tem redundância completa de sistema: um problema na placa-mãe / CPU pode derrubar todo o sistema, independentemente de quantos controladores / discos você tiver.

Por esse motivo, esse tipo de redundância na caixa raramente é usado ultimamente (exceto nas implantações SAN de médio / alto porte); em vez disso, o armazenamento em cluster / espelhamento de rede está ganhando ampla tração. Com o clustering (ou espelhamento de rede), você tem redundância total do sistema, pois um único sistema com falha não pode negar o acesso aos dados. Obviamente, o agrupamento tem suas próprias armadilhas, então não é uma bala de prata / fácil, mas em algumas situações suas vantagens não podem ser negadas. Além disso, você também pode usar o espelhamento de rede assíncrona para ter uma redundância de dados quase em tempo real em um local geograficamente diferente, para que um único evento catastrófico não cause estragos em seus dados.

    
por 21.10.2016 / 10:47
1

Você precisaria de unidades SAS de porta dupla para fornecer failover real em vários controladores. Embora existam, é decididamente não disponível - não na faixa de preço de um único servidor que tenha apenas armazenamento interno.

Estas são tecnologias frequentemente empregadas em sistemas SAN, onde a morte do controlador é um problema real.

Para um único servidor sem outros recursos de failover, um segundo controlador não ganhará nada - ele apenas custará mais dinheiro e proporcionará mais lucro ao consultor.

    
por 17.10.2011 / 16:11