Estou executando o comando:
wget -r --wait=2 --random-wait -P ./pdfs -A pdf -e robots=off https://www.<somesite>/documents
O comando trabalhou em outros sites para baixar recursivamente todos os pdfs, mas no site que eu preciso não...
Eu preciso baixar todos os arquivos com "h11v10" no nome de um servidor http, de diretórios diferentes ( DF ). Eu tentei maneiras diferentes, mas nenhuma delas funcionou.
wget --http-user user --http-password pass \
'https://e4ftl01.cr.us...
Até sexta-feira isso funcionou:
wget --no-passive-ftp ftp://xxx/file.dump
Baixei o arquivo, tudo bem. Mas agora ele simplesmente não sai para o CLI, apenas trava na última linha e nada é baixado:
--2018-06-04 14:21:14-- ftp://xxx/file...
Estou usando o shell bash no Amazon Linux. Eu tenho um comando em um script de shell
wget -O - "http://localhost:8088/subco/books/$e_id/segments/$segment_id?product=$product_id&audience=teacher" > /dev/null
Lendo isto - link , eu...
Ao espelhar o FTP usando wget , continuo recebendo Nenhum arquivo, , não importa qual pasta eu escolha.
Por exemplo:
$ wget -m ftp://ftp.osuosl.org/pub/facebook
--2018-04-22 14:13:42-- ftp://ftp.osuosl.org/pub/facebook
=>...
Eu gostaria de processar e converter todos os arquivos baixados do wget em formato HTML de um URL.
Eu quero converter uma página da web completa no formato DOCX. Estamos falando de 3000 documentos HTML baixados do URL. Esta tarefa torna-se te...
Eu tenho tentado baixar páginas específicas no site.
O site usa um URL comum para acessar as próximas páginas, como abaixo.
link
link
link até 450.
Eu só quero baixar essas páginas e não os hiperlinks que estão vinculados nas p...
Isto é para o meu script Raspberry Pi 3 adicionar uma impressora a um novo sistema (para poupar tempo da próxima vez que o quebro).
Eu quero automatizar o processo de aquisição de drivers usando wget ou curl . Alguma idéia?
Tentativa...
Eu tenho uma lista muito longa de arquivos no seguinte formato:
https://server.com/Nonsense%20text%20Actual%20Filename01.ext<br>
https://server.com/Non%20essential%20text%20Actual%20Filename02.ext<br>
https://server.com/Not%20requ...