De acordo com a Amazon, você está no caminho certo com chamadas paralelas através do AWS CLI. O Amazon definitivamente recomenda isso como uma técnica de otimização de desempenho.
Já tentou definir o máximo de solicitações simultâneas nas suas configurações ou quando chamar o roteiro?
Aqui está o meu folheto:
$ seq 0 93 | xargs -I {} date -d "2017-01-01 {} days" +%Y-%m-%d | xargs -I {} -P31 aws s3 cp s3://source_bucket/dt={}/ s3://dest_bucket/dt={}/ --recursive --no-progress
Você pode definir o número total de dias usando o comando seq
(93 por ~ 3 meses) e definir o número de chamadas paralelas (~ 30 por um mês por vez) usando o sinalizador -P
.
Eu uso a opção --no-progress
em vez da opção --quiet
, já que posso canalizar a saída do comando para um arquivo de log de transferências bem-sucedidas.