HTML recursivo para PDF

12

Eu tenho uma pasta com essa estrutura:

/main-folder
 /index.html
 /subfolder1
    /index1.html
    /file1.html

com muitos arquivos de subpasta e apenas html ... eu quero converter todos eles para pdf usando apenas um comando ou um script simples que não requer todos os nomes de arquivos.

Você conhece um

    
por Matteo Pagliazzi 15.12.2011 / 19:14

2 respostas

15

Eu sugeriria instalar a ferramenta WKHtmlToPDF do link (movido de: link ).

Você pode então mudar para a pasta raiz e usar find e xargs para convertê-los:

cd /main-folder
find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf

Isso criará um PDF com cada arquivo HTML.

    
por dan_linder 15.12.2011 / 19:51
5

O seguinte comando deve fazer o trabalho de um link:

gnome-web-print http://www.ubuntu.com ubuntu.pdf

Para vários links, não deve ser difícil escrever um loop que lide com cada link, um por um.

    
por jcollado 15.12.2011 / 19:00