O Caliber é uma ferramenta bastante poderosa para converter coisas em e-books em vários formatos. Disponível em um Centro de Software perto de você!
Não se deixe enganar por sua interface menos bonita, pode fazer muito.
Existem alguns sites que fornecem livros como páginas HTML (por exemplo, material jurídico).
O que posso usar para criar um livro em PDF a partir dessas páginas, com base na estrutura já existente?
No Windows, há o Adobe Professional (software comercial). Eu estou supondo que o Linux tem algo livre? Uma solução envolvendo scripts seria OK para mim.
O Caliber é uma ferramenta bastante poderosa para converter coisas em e-books em vários formatos. Disponível em um Centro de Software perto de você!
Não se deixe enganar por sua interface menos bonita, pode fazer muito.
A maneira mais fácil? Arquivo > Imprima a partir do seu navegador. Selecione Imprimir para arquivo como sua impressora e ele perguntará onde você deseja. Não deixe de marcar PDF. Clique em "Imprimir" e ele será salvo na sua unidade, em vez de ser realmente impresso.
O Htmldoc pode ser útil, veja aqui; link está disponível no centro de software, infelizmente a versão 1.8 tem um problema com arquivos codificados unicode, mas em muitas ocasiões ainda pode ser um salvador , o problema é corrigido na versão de desenvolvimento 1.9.
Eu costumo usar a maravilhosa extensão de scrapbook aqui; link para que o Firefox capture as páginas da Web, use as ferramentas de edição na página de recados para corrigi-las se isso for necessário e, em seguida, use o htmldoc para converter todas as páginas em PDF.
Eu recomendaria usar o OpenOffice / LibreOffice para criar o PDF. Como teste, baixei o Wget manul (tudo em uma página) e, em seguida, abri a página HTML no OponOffice e cliquei no botão "Exportar diretamente para PDF". Ele criou o PDF com um índice do índice.
No passado, descobri que esta é a maneira mais fácil de converter páginas HTML em PDF. Também permite que você faça alterações sem muito esforço.
Screenshots:
Eu realmente votei na solução de calibre. Mas aqui está outro que você poderia tentar. Instale o AbiWord . Ele pode fazer conversões entre qualquer formato que conheça na linha de comando. Para converter todos os arquivos .html em uma pasta para .pdf, você poderia fazer:
for file in *.html ; do abiword --to=pdf "$file" ; done
Para tipografia de nível superior (mas possivelmente mais complicada), outra opção seria PrinceXML .
Dependendo do documento html a ser impresso, você pode ter os melhores resultados usando o pandoc . Este é um dos conversores mais versáteis de HTML para LaTeX. O arquivo .tex resultante pode ser facilmente convertido para PDF , usando xelatex
ou pdflatex
. Muitas opções estão disponíveis se você estiver interessado em aprofundar a sintaxe e os pacotes do LaTeX. Isso pode não funcionar bem se imagens incorporadas e estilos HTML sofisticados forem preservados.
No google-chrome, você pode criar um arquivo pdf para um site inteiro usando uma extensão. Eu pessoalmente uso a extensão do Web2PDF Converter que cria um PDF em apenas um clique.
Aqui está uma captura de tela deste plug-in, fornecida pelo site de loja da web google extensions.
Alémdisso,vocêpodeverumPDFcriadopormimcomestaferramenta,baixandooseguinte(cliquedireito,salvardestinocomo): link (alguns navegadores como o google-chrome podem permitir que você veja isso online).
E se você deseja editar os PDFs criados pela extensão para remover a assinatura digital colocada pela extensão na parte inferior de cada página ou para remover qualquer outra coisa, dê uma olhada: Remover informações de texto de um PDF?
Boa sorte!