Directory sync com descoberta automática de pares

9

Estou trabalhando com um cluster de servidores Linux que está por trás do recurso de escalonamento automático em nuvem da Amazon ( documentação ). Existem arquivos que se acumulam em cada servidor, eles são arquivos de cache para o aplicativo. Estou procurando uma maneira automatizada de fazer com que os servidores sincronizem essa pasta entre si.

  • Rsync funcionaria se alguém tivesse uma maneira inteligente de fazer a detecção de pares.
  • O mesmo vale para Unison .
  • Também consideramos o uso de um SaaS, como o Dropbox.
  • Gluster parece ser um exagero, e não tenho certeza de como é fácil fazer com que um novo computador se junte automaticamente ao cluster.

Idealmente, o que aconteceria é quando um novo servidor é lançado, ele descobre seus pares e começa a sincronizar a pasta. A partir desse ponto, um último registro de vídeo ganha a sincronização P2P.

Alguma coisa lá fora que faz isso?

    
por Caleb 08.04.2011 / 06:26

5 respostas

1

Você sabe o quão estranho pode parecer, mas usar o rtorrent com o DHT ativado no intervalo ec2 privado pode funcionar

Isso lhe daria

  • Descoberta automática de pares
  • Estados do arquivo confirmado (yay para hashes)
  • Requisitos mínimos de configuração (adicione o ímã (ou ip virtual para o último torrent) para o torrent no script de inicialização)
  • escalabilidade
por 01.08.2011 / 06:24
1

O upstream do Rsync fornece suporte para o SLP (Service Location Protocol). Ele não está habilitado em fontes rsync vanilla, mas você pode encontrar o suporte a SLP no tarball rsync-patches na página inicial do rsync (slp.diff). Por exemplo. O pacote rsync do SUSE é construído com este patch; Eu não sei sobre outras distribuições.

Não tenho certeza se é isso que você está procurando, nem tenho experiência com o SLP.

    
por 11.04.2011 / 15:47
0

Talvez eu esteja perdendo alguma coisa aqui, mas há alguma razão para você não ter apenas configurado um diretório NFS simples e ter todas as máquinas montadas? Sempre que o aplicativo gravar o novo arquivo de cache, ele deverá substituir os antigos.

    
por 24.05.2011 / 20:42
0

Eu tenho certeza que há alguma ferramenta de gerenciamento de Amazon, como Ferramentas , que permite você escreve um script de boot para fazer os nós descobrirem uns aos outros, através de endereços IP privados ou públicos.

A propósito, rsync e Unison não são a ferramenta certa, se eles têm que distribuir alterações para armazenar em cache com muita freqüência. Neste caso, você deve considerar algum sistema de arquivos realmente distribuído.

    
por 01.06.2011 / 02:36
0

Talvez DRBD (dispositivo de bloco distribuído)?

    
por 17.06.2011 / 20:41