Como configurar o GlusterFS para uma configuração de gravação assíncrona de baixa latência com um número volátil de nós?

1

Eu preciso de um sistema de armazenamento com os seguintes requisitos:

  • Pool dinâmico de servidores de aplicativos Linux EC2 (1-20) com escala automática diária
  • Baixa latência lê
  • Possivelmente async escreve (< 5 minutos)
  • A maioria dos recursos posix, exceto o bloqueio
  • Cada servidor de aplicativos pode trabalhar de forma autônoma, portanto, precisa de todos os dados localmente (modo de replicação)

Como eu quero replicar muitas máquinas (configuração N-Master), penso que preciso de escritas assíncronas, o que seria aceitável, pois o aplicativo pode aguentar 5 minutos de atraso na propagação de gravação. Mas não tenho certeza de como fazer isso no GlusterFS e se é viável. Como você configuraria isso?

Dada essa configuração, deixe-me fazer mais duas perguntas:

  1. Como o GlusterFS gerencia gravações assíncronas conflitantes? Se não estou muito preocupado com a perda de dados, qual é a melhor maneira de resolver esses conflitos?
  2. Além disso, a maioria das documentações do GlusterFS escrevem manualmente adicionando / removendo tijolos. Alguém executa com sucesso uma configuração onde a adição / remoção de tijolos é feita automaticamente, muitas vezes dia?
  3. Existe talvez uma alternativa melhor ao GlusterFS para esses requisitos específicos?

Antecedentes: Eu hospedo 2000 lojas do Magento, usando o NFS no momento. É uma droga (SPOF, confiabilidade), então estou procurando uma alternativa. O software Magento pode ser executado em armazenamento somente leitura, no entanto, 98% dessas lojas usam módulos externos que de alguma forma dependem de um sistema de arquivos gravável compartilhado. Agora eu poderia dizer aos desenvolvedores da loja que eles deveriam abandonar esses módulos, mas tenho medo de não manter muitos clientes;)

Obrigado!

    
por Willem 18.07.2012 / 11:41

1 resposta

2

Você está obviamente usando o NFS no momento, e ele atende a todas as suas caixas (configuração de recurso async / POSIX / baixa latência) - então porque você simplesmente não combina NFS com DRBD + Heartbeat para obter uma solução HA NFS? ?

Nuvem da Amazon! = baixa latência - e o Gluster pode ser melhor no melhor dos momentos. Nós demos uma corrida, mas sua confiabilidade simplesmente não estava lá - e não era mais apropriada do que o NFS.

Alças curtas e obsoletas, não tivemos problemas com o NFS em clusters - mas acho que depende de qual taxa de transferência você está usando, de quais switches você está sujeito na infraestrutura da Amazon, etc.

Ps. Oi Willem (Eu sei qual empresa você representa e estou surpreso por sua postagem aqui à procura de apoio!).

    
por 18.07.2012 / 19:30