Eu quero fazer o download de uma grande quantidade de dados com o rsync.
Eu quero receber arquivos com extensão .faa.gz
. Este é o primeiro filtro.
Em segundo lugar, quero apenas incluir caminhos que contenham a subpasta latest_assembly_versions
.
Por exemplo: ftp://ftp.ncbi.nlm.nih.gov/genomes/genbank/bacteria/Abiotrophia_defectiva/latest_assembly_versions/GCA_000160075.2_ASM16007v2
.
Mas não ftp://ftp.ncbi.nlm.nih.gov/genomes/genbank/bacteria/Abiotrophia_defectiva/all_assembly_versions/GCA_000160075.2_ASM16007v2
por exemplo. Que contém a subpasta all_assembly_versions
no mesmo nível.
A pasta bacteria
é o tipo da minha "raiz".
Cheguei até aqui:
rsync --copy-links --include '/***/latest_assembly_versions/***' --recursive --times --verbose rsync://ftp.ncbi.nlm.nih.gov/genomes/genbank/bacteria/
O que não funciona ...
Tags rsync