Eu adoro o material Linux HA, e o DRBD está atingindo um nível muito alto de impressionante. Os equivalentes do Windows nunca forneceram nada próximo do mesmo nível de estabilidade e configurabilidade nas situações em que os encontrei.
Alguém tem experiência com clusters de redundância de failover Linux e Windows e, em caso afirmativo, qual você prefere para servidor de arquivos e / ou servidor web?
Por um pouco de fundo. Instalamos e administramos um cluster da Microsoft por vários anos no Windows 2000. O cluster era um par de servidores Web com uma matriz RAID razoavelmente grande (para o tempo) para armazenamento de multimídia sendo veiculado na Web - 100 dos milhares de comerciais de mp3 sendo servido para estações de rádio. Nós tivemos uma série de coisas que não gostamos neste cenário. Primeiro, o cluster da Microsoft usou um array de armazenamento compartilhado. Apesar de ter sido hot swap RAIDed, bastou uma pequena corrupção no sistema de arquivos NTFS na unidade e, de repente, você ficou inativo durante várias horas enquanto ChkDsk executava.
Então, na próxima versão que compramos em um produto chamado NeverFail - link Este produto replica os dados entre os servidores primário e secundário automaticamente mantendo-o sincronizado no nível de escrita do bloco. Isso eliminou os problemas que tivemos com armazenamento compartilhado. Mas introduziu seus próprios problemas. Qualquer reinicialização requer uma ressincronização de dados, em que o sistema analisa tudo para sincronização. Enquanto o sistema está ativo e disponível durante essa sincronização, em um servidor com menos de um terrabyte de arquivos mp3, isso leva várias horas. E uma típica sessão de patch da Microsoft requer alguns desses resyncs. Por isso, muitas vezes nos leva mais de 2 dias para consertar as 2 máquinas. Como resultado, nos vemos adiando o patch e não o fazendo tão frequentemente quanto deveríamos, o que não é o ideal. E o processo é delicado e deve ser seguido especificamente.
Então, estamos pensando em mover o site principal com todo esse conteúdo para um par de caixas LAMP com Linux HA e DRBD.
Portanto, estou curioso para saber se alguém tem experiência em administrar clusters Linux e Windows que possam me dizer o que experimentaram. Especificamente, estamos nos perguntando sobre o tempo de ressincronização nas reinicializações, etc, e a experiência geral de administração de um sistema Linux como esse.
Embora tenhamos sido trilateralmente uma vitrine, agora temos um cara que conhece o Linux em casa e eu estou aprendendo agora e adicionei várias caixas Linux ao nosso sistema, então estamos abertos a isso de um Administrador. ponto de vista.
Primeiro algumas observações, tenho certeza que os outros terão mais dados. O DRBD existe há mais tempo do que as ferramentas nativas de sincronização de diretórios do Windows, por isso pode ser mais robusto. Em segundo lugar, a tecnologia DFS / Replication do Windows 2008 foi reescrita para um melhor desempenho. Ele não existe há tanto tempo quanto o DRBD, mas promete replicar grandes diretórios entre vários servidores. O DFS / Replication não faz isso em um nível de bloco como o DRBD, apenas no nível do arquivo / diretório. Resyncs completos com DFS / Replication estão online, ao invés de offline, então você não terá a mesma falha de serviço que você teve com neverfailgroup.