Codificando problemas com o htmldoc e programas semelhantes ao htmldoc?

1

Eu quero converter alguns arquivos html em um único arquivo pdf.

  1. Eu usei htmldoc :

    htmldoc --webpage --header "/" --footer "" -f all.pdf   0010.html 0099.html
    

    A saída all.pdf não converte algumas coisas bem. Por exemplo, o matemática expresseion ⌈(1.02 n)⌉ (descrito na caixa vermelha) não é mostrar corretamente, e algum pequeno ícone (descrito em caixa verde) foi adicionado. ( Vejo a imagem abaixo. )

    Existe uma opção --charset para htmldoc no link . Eu não encontro utf-8 . Qual deles pode exibir expressões matemáticas bem?

    Como devo usar htmldoc corretamente para converter e combinar o arquivos html para um arquivo pdf, para evitar os problemas acima, tanto quanto possível?

  2. Eu ordeno a possibilidade de os problemas virem dos arquivos html, imprimindo um arquivo html em um arquivo pdf no navegador Google Chrome. isto parece bem sem os problemas acima. ( Vejo a imagem abaixo. )

    Mas eu gosto de uma solução de linha de comando, que preferencialmente pode funcionar como htmldoc para estruturar os arquivos html em um arquivo pdf com a opção --book .

    Existem programas de linha de comando semelhantes a htmldoc para eu tentar para ver se eles podem funcionar sem os problemas acima?

Todos os meus arquivos (arquivos html e arquivos PDF gerados) estão em este arquivo tar :

0010_files 0010.html 0099.html 0099_files  all.pdf 0010.pdf    

em que all.pdf é o único arquivo PDF gerado por htmldoc dos dois arquivos html e 0010.pdf é o arquivo PDF gerado pela abertura e impressão de 0010.html no Google Chrome.

A saída de htmldoc e minha adição manual de três caixas de estrutura de tópicos:

Saída da impressão 0010.html do Google Chrome:

    
por Tim 05.05.2015 / 19:47

1 resposta

1

Não há suporte UTF-8 para html2doc. Talvez na versão 1.9.

Aqui está outra opção:

Instale os utilitários de linha de comando wkhtmltopdf : para converter html para pdf ou imagem usando o WebKit.

sudo apt-get install wkhtmltopdf

E instale poppler-utils :

sudo apt-get install poppler-utils

Vá para seus arquivos html:

cd <your_html_path>

e inicie a conversão para arquivos únicos com:

wkhtmltopdf 0010.html 0010.pdf
wkhtmltopdf 0099.html 0099.pdf

ou para todos os arquivos de uma só vez:

for f in *.html; do wkhtmltopdf "$f" "${f%%.*}.pdf"; done

Converta todos os arquivos pdf em um só:

pdfunite *.pdf out.pdf

ou como script:

#!/bin/bash
# Convert all html files in the current folder into one pdf
#
for f in *.html; do wkhtmltopdf "$f" "${f%%.*}.pdf"; done
pdfunite *.pdf out.pdf

Mais infos e opções para wkhtmltopdf aqui .

    
por A.B. 05.05.2015 / 21:07