Temos um conjunto crescente de arquivos de dados (arquivos .wav, arquivos de imagem, etc.) que são dados, ou seja, não fazem parte do código do aplicativo - enviados e modificados pelos usuários. O número de arquivos está nos 1000s e o tamanho total atinge GBs.
Temos vários clusters de servidores em diferentes locais ao redor do mundo (EUA, UE, ME). Em cada cluster, é importante que os dados sejam exibidos localmente e não no S3 (os arquivos de dados não são exibidos diretamente aos clientes, mas são processados pelos servidores). Queremos designar um servidor de arquivos em cada local que servirá os arquivos via NFS para os outros nós no mesmo cluster.
Então, a questão é:
S3
. Nós vemos várias opções:
origin
que replica para S3
para backup / controle de versão e para os nós por meio de rsync
(ou similar). S3
usando algo como a ferramenta S3 ou similar. origin
- o código do aplicativo é enviado diretamente para S3
e os escravos são replicados como acima. Estávamos nos perguntando qual é a solução recomendada e quais ferramentas estão disponíveis para a parte de replicação (ou seja, na categoria de sistema de arquivos para sistema de arquivos e na categoria de sistema de arquivos / S3).
Tags backup rsync amazon-s3 replication s3cmd