Falha no quorum do cluster de failover

2

Eu tenho dois nós que são inicializados pelo iscsi para implementar o cluster do Windows 2008. E estou usando a opção de maioria do disco como quorum over iscsi. Mas quando a conexão iscsi do quorum falhou (pode ser a restauração do servidor san), o cluster de failover também falhou. Se eu redefinir um dos nós, ele poderá ser aberto, mas o disco do sistema ficará off-line. Eu não posso mudar seu status como on-line, porque ele diz que é reservado por cluster de failover (disco está em iscsi, beacuse iscsi boot). E esse disco funciona como somente leitura. Qualquer coisa nele não pode ser apagada ou escrita. Então, não consigo juntar novamente o nó ao cluster. Eu tenho que reinstalar o windows. Então, o que estou perguntando é, como posso implementar mais backups de quorum? Quero dizer, posso usar a maioria dos discos e a maioria dos arquivos ao mesmo tempo? AFAIK, todos os nós também mantêm a cópia do quórum também. Mas eu não sei, às vezes, os servidores san ficam offline. E a conexão iscsi do quorum e as conexões iscsi dos nós se perdem. Portanto, nem o quorum mantido nos nós nem o disco iscsi do quorum não é suficiente para iniciar o cluster novamente. Eu quero usar a maioria do disco e a maioria de compartilhamento de arquivos ao mesmo tempo. Posso fazer isso? Você tem alguma outra sugestão? Atenciosamente.

    
por oruchreis 13.05.2010 / 01:18

2 respostas

0

este é um problema com qualquer cluster de failover da Microsoft usando o Server 2012 ou inferior usando a maioria de discos ou a maioria de nós e discos. A testemunha de disco é um ponto de falha para o cluster. Mesmo se todos os nós estiverem ativos, se o disco testemunha falhar (perdemos o acesso a ele), o cluster fica inativo. então o que fazer?

1) Certifique-se de que sua testemunha de disco esteja altamente disponível, portanto, é menos provável que ela fique off-line 2) Considere usar um compartilhamento de arquivos e uma testemunha de compartilhamento de arquivos alternativa, selecione testemunha de compartilhamento de nó e arquivo como seu tipo de Quórum 3) Use o Windows Server 2012 R2 para o seu cluster. O Server 2012 r2 usa um modelo de quorum dinâmico e não sofre o mesmo problema.

    
por 02.07.2016 / 13:01
0

Acho que você precisa revisar sua arquitetura. Você realmente tem 1 componente que causam 2 falhas ao mesmo tempo: o servidor SAN causará 2 falhas no link. Esse cenário geralmente não é tratado pelo cluster de failover se você não fizer medições extras. Se você usa um servidor SAN, ele tem que ser tolerante a falhas e nunca ser redefinido se não para manutenção e você sabe que terá que parar o cluster. Eu escrevi um software de cluster de failover no shell POSIX e o testei no windows também com o CYGWIN, ele pode funcionar, mas como é um script unix clássico ele usa muito garfo e assim por diante, consome muito mais cpu do que no linux. Se você pode estar interessado em explorar uma nova solução: link

    
por 14.11.2015 / 18:53