Estou procurando uma maneira de fazer backups diários de um bucket da AWS como backups incrementais. Estes devem ser armazenados offline e longe da AWS.
Para outros sistemas de armazenamento (como unidades NAS), eu uso um rsync diário para backups. Usando a opção --link-dest
do rsync, sou capaz de tirar um instantâneo completo todos os dias do sistema de arquivos remoto. Todos os arquivos que não foram alterados desde o backup anterior são vinculados ao backup anterior. Isso significa que os snapshots diários completos ocupam apenas o espaço de armazenamento dos backups incrementais.
Eu gostaria de configurar algo semelhante para um bucket amazon S3. Há 20 GB no balde, mas apenas 50 MB por dia.
Observe que este é o backup do conteúdo de um bucket do S3, NÃO faz backup de outro conteúdo para o bucket do S3.
Eu posso ver como eu usaria as ferramentas da AWS CLI para fazer backups completos. Não vejo como posso fazer backups incrementais.
Eu acho que eu poderia (diariamente) sincronizar o S3 com um disco rígido local e fazer o backup diário do disco rígido local. Isso parece muito desajeitado.
Editar
Isto foi planejado como uma simples questão técnica, não uma discussão geral sobre segurança de backup. Mas desde que me perguntam "por que você precisa disso", agora vejo que preciso explicar os princípios básicos dos backups.
Anedota: Eu recentemente testemunhei um provedor de TI terceirizado derrubar (inteiramente) um balde S3 por causa de uma falta de comunicação. Isso poderia ter sido muito caro (cerca de £ 100 mil de trabalho recente, £ 1 milhão de trabalho total). Por sorte, também tivemos cópias em nossos laptops locais e, por apenas R $ 1 mil, reconstruímos o conteúdo para eles.
Renovou minha convicção de que o único "backup" válido está em um sistema isolado armazenado fora do local e off-line e com uma rotação de mídia que efetivamente implementa um tempo de bloqueio . Outros backups podem melhorar, proporcionando uma recuperação mais rápida, etc ... mas manter todos os seus backups da AWS em sua própria conta da AWS não é seguro, porque ... erro do usuário.