algo melhor que o httrack para baixar arquivos?

0

Estou tentando fazer download de documentos (pdf, tiff, imagens) de páginas da Web que possuem javascript e quadros neles. exemplo: link

'httrack --get-files' não baixou nenhum, existem outras maneiras de pensar? outro programa? terei que escrever esse programa sozinho?

Muito obrigado!

    
por Zenet 03.08.2010 / 21:04

1 resposta

0

Como esse URL termina com "cgi", imagino que isso esteja executando um script CGI no servidor - o que significa que ele provavelmente está esperando outros dados. Existem algumas opções sobre onde esses dados podem ser obtidos

Primeiro, esses outros dados podem vir da sua sessão de login. Veja os documentos para wget para a opção --load-cookies para especificar que ele deve usar o arquivo de cookie do seu navegador (as instruções no meu computador são para formatos de arquivo de cookie de navegador antigos).

A outra opção é que ele está esperando dados POST do seu navegador. Você precisará descobrir quais são as variáveis e valores do formulário e passá-los usando as opções --post-data ou --post-file do wget.

    
por 03.08.2010 / 23:39