Como faço para superar o erro chm2pdf na descrição?

0

O erro é:

ERR011: Unable to parse HTML element on line 13!
PAGES: 2854
BYTES: 9759142
Something wrong happened when launching htmldoc.
exit value:  256
Check if output exists or if it is good.
Done.

O que recebi da execução de chm2pdf --webpage '/home/brentonhorne/Drugs/CHM/Goodman and gillman.chm'

Eu olhei no pdf gerado e tinha

ÿØÿàJFIFÿÛC  
$$$$$'--'7;7LLPÿÛC  
"$"'--'7;7LLfÿÀXÎ"ÿÄÿÄ^!1"A2Qaq#BRTbr¡²³Ò36CSst¢±Ñ$%45U´ÁÂÓ¿Dcd£âÃãðEáñ&euòÿÄ?ÓÉ,ãÍé:«+ÜcÃ#ÿJ¦sñÒñ´VУ¹æè ÿÒ5Fk»ÁO'ôÚÜC ÷ <
¦Ôð³NÀ·8¡»ºhA2ÉÃ4SLkæ;¤vȱ¬õ«xJì9þ-ÿf··¢gz«åMìê Ǻ³²Ü\ËÞ: Ê qê

para a primeira página (capa do livro). Ele também falhou ao renderizar muitas imagens e equações, com muita formatação de texto perdida (muitas coisas que estão em negrito no arquivo CHM original não estão mais em negrito). Como eu supero esse problema? Estou executando 32 bits 12.10 se isso ajuda.

CHM2PDF_TEMP_WORK_DIR=tempfile.mkdtemp()
CHM2PDF_TEMP_ORIG_DIR=tempfile.mkdtemp()

está localizado no script python / usr / bin / chm2pdf.

    
por BH2017 15.02.2013 / 09:13

1 resposta

0

Este é um erro normal quando o HTML contém outras linguagens (como javascript) ou contém erros de formatação.

Use --extract-only para extrair os arquivos HTML do CHM , altere os arquivos HTML para algo que seja HTML válido e use --dontextract para converter os novos arquivos em um único PDF ( --extract-only e --dontextract opções foram criadas apenas para superar esses tipos de erros).

Alguns ponteiros sobre extração e manipulação de um arquivo podem ser encontrados aqui:

  • link
  • link
  • link

O primeiro link desses 3 mostra que 2 opções CHM2PDF_TEMP_WORK_DIR e CHM2PDF_TEMP_ORIG_DIR são usado para armazenar os arquivos temporários do disco. Do link:

% bl0ck_qu0te%     
por Rinzwind 15.02.2013 / 09:26