wget arquivos por padrão somente a partir de diretórios especificados recursivamente

4

Eu preciso baixar em uma base horária (às vezes com mais freqüência), arquivos que estão sendo escritos em segmentos de 24 horas. Os arquivos nos quais estou interessado estão em subdiretórios específicos que estou tentando especificar com -I list , mas isso não funciona por algum motivo.

Se eu não especificar diretórios, os arquivos precisam ser baixados com a opção -A acclist , mas acabo com muitos diretórios vazios que estão sendo criados porque existem no host.

minha linha atual diz:

wget -np -nH --cut-dirs=X -c -N -r -l 0 \
     -I /dir1,/dir2,...,/some_dir -A acclist \
     http://hostname/X_sub_directories/

Como faço para baixar somente os arquivos que eu quero e crie somente a hierarquia de diretórios para esses arquivos?

    
por Shahar 31.07.2014 / 11:30

1 resposta

0

você pode adicionar um comando post process para eliminar os diretórios vazios criados.

wget -np -nH --cut-dirs=X -c -N -r -l 0 \
     -I /dir1,/dir2,...,/some_dir -A acclist \
     http://hostname/X_sub_directories/    \
     &&  find -depth -type d -empty -exec rmdir {} \;
    
por 27.08.2015 / 17:01

Tags