passar um link alternativo para wget ao baixar fotos / arquivos em erro

0

wget é uma ótima ferramenta para fazer download de arquivos ou páginas da web. Não é o primeiro timke que eu acho que os links de uma página da Web não estão atualizados ou errados. Por exemplo, uma página da web que tenha suas fotos / arquivos vinculados a http://websitehttp//website.file.extension . Existe uma maneira de dizer ao wget que, se nenhum conteúdo for encontrado, ele deve procurar no endereço http//website.file.extension em vez de http://websitehttp//website.file.extension ?

EDIT: Após o comentário do @Tiger, posso obter o status de saída, mas como perguntar ao wget sobre esse arquivo específico que não conseguiu obtê-lo no link / endereço correto?

wget_output=$(wget –limit-rate=200k –no-clobber –convert-links –random-wait -r -p -E "$URL")
if [ $? -ne 0 ]; then
  ...
fi
    
por nopeva 06.12.2016 / 22:59

1 resposta

1

Aqui está um script simples que pode ajudar você a começar:

#!/bin/sh

# Make sure a URL is passed first
if [ -z "$1" ]
then
    echo "
Pass the full URL to be downloaded. For example:

 ${0##*/} \"http://websitehttp/website.file.extension\"

If that URL fails, then \"http://website.file.extension\"
will be tried automatically.
"
    exit 1
fi

# Attempt download
wget -v "${1}"

# Check for an error and if so, try an alternative download
if [ "$?" != "0" ]
then
    url2='echo ${1} | cut -d '/' -f 4-'
    # DEBUG echo "[$url2]"
    wget -v "http://${url2}"
fi

echo "Done"
exit 0
    
por 06.12.2016 / 23:43

Tags