Como faço para exportar páginas do navegador com hiperlinks embutidos?

3

Fez uma triste descoberta hoje. Eu tenho o Ubuntu 10.04 LTS. Meu cliente está no negócio de anúncios e ela teve uma tarefa de competição de marketing para mim. Ela queria que eu visitasse sites dos concorrentes e exportasse as home pages como PDF. No entanto, ela queria que eu fizesse isso com hiperlinks embutidos.

Como se vê, o Firefox (e até mesmo o último Chrome) no Ubuntu 10.04 LTS não incorpora hyperlinks nas exportações de páginas da Web em PDF.

Claro, há vários plug-ins do Google Chrome e FF que permitem exportar como PDF, mas o que eles fazem é conectar-se ao URL remotamente, gerar o PDF remotamente e forçar um download no seu navegador para baixá-lo de um local remoto . Isso não é bom para mim, porque algumas dessas páginas concorrentes exigem um login inicial. Isso significa que tudo o que recebo de volta na impressão em PDF desses plug-ins FF ou Chrome é uma página de login.

Existe uma maneira de contornar este problema, para consertar a impressora PDF quebrada no Ubuntu 10.04?

    
por Volomike 18.01.2011 / 04:08

1 resposta

3

A ferramenta a ser usada chama-se wkhtmltopdf, esta ferramenta está nos repositórios, mas todas as versões compiladas do repositório não possuem a funcionalidade de link embutido devido às mudanças em algumas bibliotecas qt.

Então, instale o wkhtmltopdf nos repositórios para obter todas as dependências:

sudo apt-get install wkhtmltopdf

Em seguida, faça o download do versão estática daqui. Descompacte o arquivo em sua área de trabalho e, em seguida, mova para bin:

sudo mv Desktop/wkhtmltopdf-i386 /usr/bin/wkhtmltopdf-static

Agora você pode usar a ferramenta para gerar arquivos PDF com links:

wkhtmltopdf-static http://google.com google.pdf

Para seus sites com o requisito de login, você precisa fazer login via firefox e, em seguida, exportar o arquivo de cookie usando o Exportar cookies plugin do firefox. Com um cookies.txt, você pode executar:

wkhtmltopdf-static --cookie-jar cookies.txt http://google.com google.pdf

Eu sei que muitas dessas necessidades precisam ser feitas na linha de comando, mas é a melhor maneira de fazer isso e você tem muito mais controle. O wkhtmltopdf é uma ferramenta bastante poderosa.

    
por Martin Owens -doctormo- 18.01.2011 / 07:06