Gerar um único PDF a partir de páginas HTML de um site

0

Aqui está o problema: há um site que eu preciso frequentemente para referência e eu gostaria de uma versão offline que também funciona em dispositivos móveis, um PDF vem à mente.

Eu posso fazer uma cópia off-line da versão HTML com o wget, esse não é o problema.

O que eu realmente gostaria de ser uma maneira de transformar todas as páginas HTML em um único PDF com os links internos ainda funcionando. Portanto, um link que se referiria a outro URL na versão da web deve se referir à página correspondente no PDF.

Idealmente, também deve haver uma maneira de gerar uma tabela de conteúdo para colocar no PDF.

Como posso conseguir isso?

Bash / Python / ruby / quaisquer scripts e outras coisas de linha de comando também são bem-vindos.

(Eu estou no OSX 10.9 pelo caminho.)

    
por selfawaresoup 08.11.2013 / 12:04

1 resposta

1

Você deve dar uma olhada em wkhtmltopdf , uma ferramenta gratuita que, a julgar pela lista de recursos avançados anunciados em sua página de manual , deve pelo menos aproximadamente satisfazê-lo:

Printing more then one HTML document into a PDF file.

Running without an X11 server.

Adding a document outline to the PDF file.

Adding headers and footers to the PDF file.

Generating a table of contents.

Adding links in the generated PDF file.

Printing using the screen media-type.

Disabling the smart shrink feature of webkit.

    
por 08.11.2013 / 15:01

Tags