Criar pdf a partir do livro HTML

16

Existem alguns sites que fornecem livros como páginas HTML (por exemplo, material jurídico).

O que posso usar para criar um livro em PDF a partir dessas páginas, com base na estrutura já existente?

No Windows, há o Adobe Professional (software comercial). Eu estou supondo que o Linux tem algo livre? Uma solução envolvendo scripts seria OK para mim.

    
por Lucian Sasu 16.11.2010 / 16:55

8 respostas

9

O Caliber é uma ferramenta bastante poderosa para converter coisas em e-books em vários formatos. Disponível em um Centro de Software perto de você!

Não se deixe enganar por sua interface menos bonita, pode fazer muito.

    
por Oli 16.11.2010 / 17:08
4

A maneira mais fácil? Arquivo > Imprima a partir do seu navegador. Selecione Imprimir para arquivo como sua impressora e ele perguntará onde você deseja. Não deixe de marcar PDF. Clique em "Imprimir" e ele será salvo na sua unidade, em vez de ser realmente impresso.

    
por Jacob Peddicord 16.11.2010 / 17:03
4

O Htmldoc pode ser útil, veja aqui; link está disponível no centro de software, infelizmente a versão 1.8 tem um problema com arquivos codificados unicode, mas em muitas ocasiões ainda pode ser um salvador , o problema é corrigido na versão de desenvolvimento 1.9.

Eu costumo usar a maravilhosa extensão de scrapbook aqui; link para que o Firefox capture as páginas da Web, use as ferramentas de edição na página de recados para corrigi-las se isso for necessário e, em seguida, use o htmldoc para converter todas as páginas em PDF.

    
por Sabacon 16.11.2010 / 17:26
3

Você pode tentar o link . É um conversor para HTML / XHTML e CSS para PDF. Tudo escrito em Python.

    
por Nichod 16.11.2010 / 20:35
3

Eu recomendaria usar o OpenOffice / LibreOffice para criar o PDF. Como teste, baixei o Wget manul (tudo em uma página) e, em seguida, abri a página HTML no OponOffice e cliquei no botão "Exportar diretamente para PDF". Ele criou o PDF com um índice do índice.

No passado, descobri que esta é a maneira mais fácil de converter páginas HTML em PDF. Também permite que você faça alterações sem muito esforço.

Screenshots:

  • Manual do Wget exportado para PDF usando o Open Office

  • ExportardiretamenteparaaopçãoPDFnoOpenOffice

por SiliconChaos 16.11.2010 / 18:49
2

Eu realmente votei na solução de calibre. Mas aqui está outro que você poderia tentar. Instale o AbiWord . Ele pode fazer conversões entre qualquer formato que conheça na linha de comando. Para converter todos os arquivos .html em uma pasta para .pdf, você poderia fazer:

for file in *.html ; do abiword --to=pdf "$file" ; done

Para tipografia de nível superior (mas possivelmente mais complicada), outra opção seria PrinceXML .

    
por frabjous 16.11.2010 / 21:36
2

Dependendo do documento html a ser impresso, você pode ter os melhores resultados usando o pandoc . Este é um dos conversores mais versáteis de HTML para LaTeX. O arquivo .tex resultante pode ser facilmente convertido para PDF , usando xelatex ou pdflatex . Muitas opções estão disponíveis se você estiver interessado em aprofundar a sintaxe e os pacotes do LaTeX. Isso pode não funcionar bem se imagens incorporadas e estilos HTML sofisticados forem preservados.

    
por loevborg 07.01.2011 / 16:18
1

No google-chrome, você pode criar um arquivo pdf para um site inteiro usando uma extensão. Eu pessoalmente uso a extensão do Web2PDF Converter que cria um PDF em apenas um clique.

Aqui está uma captura de tela deste plug-in, fornecida pelo site de loja da web google extensions.

Alémdisso,vocêpodeverumPDFcriadopormimcomestaferramenta,baixandooseguinte(cliquedireito,salvardestinocomo): link (alguns navegadores como o google-chrome podem permitir que você veja isso online).

E se você deseja editar os PDFs criados pela extensão para remover a assinatura digital colocada pela extensão na parte inferior de cada página ou para remover qualquer outra coisa, dê uma olhada: Remover informações de texto de um PDF?

Boa sorte!

    
por Geppettvs D'Constanzo 15.04.2011 / 19:52