Converter html2pdf com suporte a toc, color e unicode?

1

Existe uma maneira de converter arquivos html grandes (produzidos com a sphinx por sinal) para o pdf com cor, tabela de conteúdo (toc) e suporte a unicode?

htmldoc - mas não suporta cor nem unicode.

rst2pdf sphinx plugin - mas atualmente ele quebra a renderização matemática e também não pode distorcer linhas de código.

Existe uma maneira de exportar para xetex em sphinx - mas não pode envolver blocos de código e também não suporta svg images.

Editar :

Eu tentei usar pandoc :

pandoc index.html --mathjax --toc -o index.pdf

dá:

pandoc: Error producing PDF from TeX source.
! LaTeX Error: Command \guillemotright unavailable in encoding OT1.

See the LaTeX manual or LaTeX Companion for explanation.
Type  H <return>  for immediate help.
 ...                                              

l.55   2012-Sep-11} »

Estou preso ...

    
por Adobe 10.09.2012 / 13:02

3 respostas

1

Você já tentou wkhtmltopdf ? É baseado no WebKit e tem suporte a CSS, é claro, com cores.

Ele não tem suporte a TOC , err, acho que sim.

É basicamente renderização para PDF.

    
por 11.09.2012 / 16:21
1

Se você está no linux ou no Mac, pode experimentar html2pdf ou html2ps foo.html; ps2pdf foo.ps . Nenhum desses métodos é perfeito, mas eles podem funcionar.

Você também pode tentar abrir o arquivo em uma suíte de escritório e exportar para o pdf. Eu sei que ambas as palavras e libreoffice suportam isso. Esta é a única opção que conheço se você estiver usando o Windows.

A melhor maneira seria exportar o arquivo como TeX ou LaTeX e compilar o pdf, você pode editar o código LaTeX para corrigir qualquer problema de quebra automática. Você também pode converter facilmente suas imagens para png usando convert do ImageMagick:

$ mogrify -format png *.svg
    
por 10.09.2012 / 16:30
0

Imprimir páginas em pdf o addon do firefox faz um toc .

    
por 11.09.2012 / 16:26