Wget - Dificuldade para excluir domínios e diretórios

2

Estou usando o Wget no Windows 7. Acredito que isso me restrinja ao Wget 1.11.4.

Para qualquer pessoa interessada nos detalhes, eu publiquei um arquivo wgetrc de amostra . Este exemplo é realmente o que estou usando atualmente. Meu comando do Wget é o seguinte:

wget 2> "I:\Current\Wget\wgeterr.log"

Estou tendo problemas com as opções que devem restringir o download. Conforme detalhado no final de wgetrc (acima), algumas formas dessas restrições parecem não funcionar.

Em particular, acho que estou indicando corretamente, com exclude_domains, que não quero incluir o twitter.com no download, como uma pasta no mesmo nível do site que estou baixando (por exemplo, raywoodcockbio.wordpress .com). No entanto, estou recebendo o twitter.com, no entanto.

A pergunta é: como posso impedir que o twitter.com (também o facebook e outras pastas de sites de mídia social) sejam incluídos no meu download?

    
por Ray Woodcock 27.04.2014 / 23:37

1 resposta

0

Veja o parâmetro exclude_directories ou -X de wget . A opção -X especifica uma lista de diretórios excluídos do download. Por exemplo. se você não quiser que o Wget baixe as coisas do diretório /foo-bar , especifique -X /foo-bar na linha de comando.

    
por 28.04.2014 / 00:03