As instâncias do EC2 são basicamente servidores regulares que executam um sistema operacional, que não apenas permite executar as tarefas de processamento de dados, mas também qualquer outra etapa, como o download, especialmente se o download for uma tarefa complexa.
Você configuraria uma instância do EC2 que monta permanentemente um bucket S3 no sistema operacional sistema, em seguida, criar um script (por exemplo, um script shell) que regularmente ou semi-regularmente baixa os dados e armazena-lo no balde.
Uma opção ainda mais simples seria usar AWS Lambda para executar o download no S3 sem ter que ativar um servidor EC2, o que significa que você pode fazer o processamento de forma independente e também evitar a transferência dos dados para o servidor primeiro e depois para o S3.
Observe que qualquer operação de dados terá um determinado preço, portanto, leia as políticas de preços do EC2 e do S3 e calcule os custos experimentais .