Como baixar todos os links em um PDF

1

Eu tenho muitos PDFs e preciso baixar todos os hyperlinks dentro deles. Eu tentei abrir o PDF no Firefox e usando Download Them All, mas eu acho que muitas vezes não obtê-los todos. Então, como posso conseguir isso?

    
por darmi 14.05.2015 / 05:11

1 resposta

0

Pergunta interessante! Eu sou parcial para utilitários de linha de comando sempre que disponível, então neste caso eu estou usando o seguinte:

Ambos são portáveis (o PDFtk está disponível apenas como um instalador, mas você pode copiar pdftk.exe e libiconv2.dll em outro lugar e desinstalá-lo se quiser). Você pode, claro, substituir Wget por cURL ou o que quiser.

O seguinte, executado a partir da linha de comando do Windows, fará o download de todos os documentos / páginas vinculados a partir de um PDF:

for /f "tokens=2" %l in ('pdftk Test.pdf dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

Use o seguinte comando para vários PDFs:

for %f in (*.pdf) do for /f "tokens=2" %l in ('pdftk "%~f" dump_data_annots ^| find "AnnotActionURI"') do wget "%l"
    
por 14.05.2015 / 06:37