Como copiar texto do PDF e colá-lo em outro formato de texto de preservação de aplicativo?

0

Eu tenho um arquivo PDF.
Eu preciso copiar algum texto dele preservando sua formatação (então eu preciso salvar italic , negrito , _underline_, tamanhos e cores de fontes, links).

Parece que preciso copiar texto do PDF como HTML ou RTF (ou algo semelhante).

Eu tentei:

  • copiar texto de Atril, colar no LibreOffice Writer - tem texto simples mesmo se eu selecionar colar como RTF;
  • copiar texto de Atril, colar em Abiword - texto simples;
  • copiar texto do Okular, colar no LibreOffice ou no Abiword - tem texto simples;
  • convertendo PDF para HTML com pdf2htmlex - obteve HTML, mas a cópia do navegador da Web torna todo o texto claro novamente;
  • importando PDF para o LibreOffice Impress - a formatação é preservada, mas a cópia é difícil devido à grande quantidade de blocos de texto.

Qual software do repositório LTS do Ubuntu 16.04 devo usar para resolver meu problema?

    
por N0rbert 10.04.2018 / 23:04

1 resposta

1

Isso não é possível em geral. Nem mesmo com o Acrobat Reader Pro. A Adobe recomenda salvar como doc do Word ou HTML. O Evince ou o Okular permitirão que você copie e cole usando o do visualizador no utf8, mas isso descarta a formatação, principalmente.

Como você disse, a melhor aposta seria usar a importação do LibreOffice que tenta preservar muitos recursos do formato pdf que mapeiam para o odf. Além disso, você pode usar a ferramenta pdftk para selecionar páginas específicas de um arquivo pdf maior e depois importá-las para o LibreOffice.

    
por Martin W 10.04.2018 / 23:30