Como converter uma página da Web em um PDF?

7

Existem várias maneiras de converter uma página da Web em um PDF (serviços on-line, bookmarklets, soluções Print to PDF, etc.).

Mas nenhum deles produz PDFs pesquisáveis. Parece que todos eles convertem HTML em uma imagem gigantesca. Existe alguma maneira de converter uma página da Web em um PDF pesquisável?

    
por AngryHacker 24.01.2012 / 18:00

8 respostas

7

Eu encontrei o projeto wkhtmltopdf , que parece fazer o truque. É a linha de comando, então há uma curva de aprendizado, mas não tão ruim.

Especificamente para converter uma página da web, abra uma janela de comando no diretório em que wkhtmltopdf foi instalado e execute o seguinte:

wkhtmltopdf.exe http://www.yourpage.com/index.htm c:\misc\cnn.pdf

O aplicativo tem uma quantidade ridícula de opções projetadas para ajustar a saída conforme necessário, mas os padrões fornecem um resultado muito bom.

    
por 24.01.2012 / 19:47
6
O

escritor CutePDF usa o GhostScript para processamento de texto e, em seguida, o ps2pdf para criar PDFs pesquisáveis de páginas da web. Isso obviamente não funcionará se o texto na página for uma imagem para começar.

    
por 24.01.2012 / 18:02
3

Qual é o problema com as soluções de impressão em PDF? Tenho duas impressoras virtuais instaladas no meu sistema: PDF Creator & Impressora virtual do Adobe Acrobat X. Ambos funcionam bem. Posso pesquisar texto em PDFs gerados com facilidade, desde que meu visualizador de PDF tenha recursos de OCR (o que é comum atualmente). Se você está pensando em criar algo como texto e documento do Word, você não pode. Sua limitação do formato PDF ou diz como funciona o formato PDF. Devido a isso, podemos incorporar fontes etc. neste formato sem qualquer dependência para torná-lo universal.
E, eu não acho que o projeto wkhtmltopdf pode gerar um arquivo PDF no qual o texto pode ser pesquisado sem usar a tecnologia OCR ( porque violará a especificação do PDF).

    
por 25.01.2012 / 00:09
1

Eu uso o Adobe Acrobat 8 Professional (a versão atual é Adobe Acrobat X ). Ele tem uma opção de menu File... Create PDF... From Web Page... que me pede um URL, depois ele baixa a página no URL como um arquivo PDF, com texto pesquisável. Ele também converterá páginas vinculadas a essa página, de forma recursiva. Você pode acabar com muitas páginas HTML em um arquivo PDF de várias páginas, com links entre páginas preservados.

Para algumas páginas da Web, o Acrobat Create PDF obtém a formatação errada. Nesse caso, volto ao driver de impressora Adobe PDF 8.0 que o Acrobat 8 Professional instalou no meu sistema. É muito bom dar-me um equivalente em PDF da página da Web que estou vendo, com texto pesquisável.

O Adobe Acrobat 8 Professional não é software livre. É um software proprietário de preço integral. No entanto IMHO, ele merece tanto um lugar no computador de cada trabalhador do conhecimento como o Microsoft Office. E você não especificou que insistiu em uma maneira de software livre para converter uma página da Web em PDF pesquisável.

    
por 25.01.2012 / 00:21
0

Essa é uma ótima ferramenta que converte páginas da web em PDFs pesquisáveis: link . Experimente e veja se satisfaz suas necessidades.

    
por 21.02.2013 / 16:15
0

Acabei de imprimir esta página no Google Chrome e a salvei como um pdf. Não tenho problemas em usar a pesquisa no arquivo PDF impresso. A saída pode variar dependendo do tipo de página, se a página contiver quadros flash - então você provavelmente não poderá procurar conteúdo lá.

    
por 21.02.2013 / 16:29
0

O GrabzIt pode converter páginas da Web em PDFs totalmente pesquisáveis. Além disso, eles fornecem uma ferramenta de tarefas agendadas on-line gratuita , o que significa que nenhuma codificação é necessária.

    
por 07.05.2013 / 13:43
0

PrimoPDF! É de graça. Ele funciona perfeitamente e pode transformar qualquer coisa que você pode imprimir em um PDF (pesquisável). Ele funciona adicionando a si mesmo como uma nova impressora. Fácil de desinstalar também.

Espero que isso ajude.

    
por 07.05.2013 / 15:51