localize e substitua pelo arquivo pdf da linha de comando

4

no linux, eu quero encontrar texto específico ou palavra do arquivo pdf e substituí-lo por outro texto.e fazer um novo arquivo pdf a partir da linha de comando.i tentei com sed, encontrar, série awk em arquivos de texto.mas eu quero começar em pdf file.which utilitário de linha de comando me ajudar? .thanks com antecedência.

    
por denny 28.07.2016 / 07:28

2 respostas

7

Use pdftk para descompactar o arquivo, depois edite por sed e finalmente recompacte-o.

pdftk input.pdf output uncompressed.pdf uncompress
sed -i 's/foo/bar/g' uncompressed.pdf
#uncopressed.pdf now has all the changes
pdftk uncopressed.pdf output changed.pdf compress

É claro que qualquer texto em imagens não pode ser alterado assim.

    
por Fiximan 28.07.2016 / 08:11
0

Uma possível solução poderia ser assim ...

Você pode converter arquivos pdf em arquivos de texto puro usando algumas ferramentas do pacote poppler-utils .

Pode ser instalado via:

sudo apt-get install poppler-utils

Converter arquivo pdf em arquivo de texto

pdftotext /home/USER/Desktop/test.pdf /home/USER/Desktop/test.txt

Agora você pode editar e substituir em seu arquivo pdf.

Depois disso, você pode convertê-lo novamente usando um pacote chamado cups-pdf OU text2pdf .

Pode não ser a solução perfeita, mas deve fazer o seu trabalho.

Espero que isso ajude!

    
por teufelsfrucht 28.07.2016 / 07:51