Eu tenho feito pesquisas sobre isso, engraçado o suficiente.
Seus backups para o S3 podem falhar dependendo da sua região devido à consistência eventual; O aviso básico é que, se você fizer isso o suficiente, em algum momento você terá erros ao abrir ou encontrar arquivos, pois a mágica do sistema de arquivos no segundo plano da Amazon é sincronizada entre os servidores, portanto seus backups podem não ser confiáveis.
Para saber se você precisa salvá-los de outra forma, isso depende do seu gerenciamento de risco. Você confia na Amazon para manter seus dados?
É possível que eles percam algo ou tenham uma falha maior no sistema de armazenamento; eles sem dúvida têm cláusulas em seus contratos especificando que, se eles perderem seus dados, esse é o seu problema. Não é deles. Além disso, como seus dados estão hospedados em outro lugar, você não sabe o que eles farão com isso; aplicação da lei quer seus dados? Você pode até não saber que alguém o acessou.
Você confia nisto? Se os dados não forem fundamentais para o seu negócio e você estiver disposto a aceitar esse risco, não haverá necessidade de fazer o download para o armazenamento externo. Se você não estiver disposto a arriscar que seus dados estarão seguros nos servidores de armazenamento da Amazon, você deve tomar providências para despejá-los periodicamente em seu próprio armazenamento.
Em outras palavras, não acho que haja uma resposta direta para isso, pois depende da sua tolerância ao risco e das necessidades do negócio. Muitas pessoas não confiariam completamente em sua renda apenas com armazenamento na nuvem, pessoalmente, eu me sinto um pouco desconfiado disso ...
Para fazer isso melhor, em discussões e pesquisas, outra abordagem a considerar é a criação de um volume EBS grande o suficiente para armazenar os dados, anexá-los à instância do EC2, salvar seus dados lá e desmontar o volume e salvá-los. dados para S3. Estou no meio de pesquisar se isso seria feito salvando o próprio arquivo de volume no S3 ou no conteúdo ... mas você pode excluir a instância do EBS quando feito para economizar custos de armazenamento.
EDIT Vejo na releitura que você está salvando FROM S3 para a instância EC2, e não vice-versa (embora eu não saiba se o problema de consistência eventual ainda poderia causar problemas ). Você está tentando salvar dados em uma instância do EC2 como backup? Eu acho que o custo não é uma boa tática; Pode ser mais barato fazer o backup de uma unidade local quando você considera o armazenamento a longo prazo desse tipo de dados, juntamente com o tempo da VM. Com os custos de transmissão, você pode copiar os dados para um disco local como backup.
Eu ainda manteria os avisos sobre confiar na Amazon e no armazenamento deles. Se você quiser manter tudo no Amazon S3, mas tiver mais redundância, duplique os buckets do S3 entre as regiões e, se houver uma interrupção afetando uma região, ela não deverá eliminar todos eles. Você esperaria. Tudo é possível embora.
Tudo se resume a quanto você valoriza seus dados, quanto está disposto a pagar por isso e quanto risco deseja tolerar.