Existe uma maneira melhor de redigir um PDF?

18

Eu tive que imprimir alguns PDFs recentemente para enviar para alguém, mas eu queria redigir (apagar) alguns pequenos pedaços de texto.

Uma rápida pesquisa no Google não disponibilizou nenhuma ferramenta para este fim específico, por isso recorri ao imagemagick & amp; gimp:

  • convert document.pdf document.png
  • gimp document-0.png
  • (use o pincel para escurecer o texto)
  • imprimir página redigida do gimp
  • imprimir as páginas restantes do xpdf

O problema com esta estratégia é que o processo de conversão (de PDF para PNG ou qualquer outro formato) perde qualidade. Eu tentei editar o PDF no gimp, mas não funcionou de imediato.

Existe uma ferramenta específica que permite a redação dessa maneira? (Nem precisa ser uma redação "real" - não estou enviando uma cópia eletrônica para que a redação "falsa" funcione porque a cópia impressa não pode ser hackeada para revelar o texto subjacente.)

Ou há algum truque para editar PDFs no gimp?

    
por bstpierre 27.10.2011 / 21:04

15 respostas

13

(originalmente eu recomendei o Okular, mas não funcionou como eu esperava)

1. Edite o documento em um editor de vetor

Consegui abrir um arquivo PDF no Inkscape , desenhar um retângulo sobre um texto e imprimi-lo. O Inkscape é um editor de vetores, portanto não há rasterização envolvida. Algumas fontes pareciam erradas - provavelmente porque o documento foi criado na máquina Windows com fontes que estão ausentes na minha.

Observe que qualquer método que não envolva rasterização é aceitável apenas se você for imprimir o documento redigido em papel e não distribuí-lo eletronicamente, pois o texto ainda pode ser recuperado em apagões .

2. Aumentar a resolução de rasterização ao abrir em um editor de bitmap

Com relação à "perda de qualidade" ao abrir a página no Gimp : você pode abrir diretamente um arquivo PDF no Gimp. Será rasterizado no processo. A quantidade de perda de qualidade no processo é uma questão de resolução que você escolhe ao importar - 300 dpi deve lhe dar uma qualidade muito decente (o padrão é 100).

Você também pode obter bons resultados com o comando convert do ImageMagick se disser para aumentar a resolução:

convert -density 300x300 ...
    
por Sergey 27.10.2011 / 23:40
8

Basicamente o que você está tentando fazer é destaque / anotar um PDF, mas com alguma flexibilidade para a opacidade do marcador e cor (você mencionou que você não precisa para censurar / remover algo, apenas redigir). Você já deu uma olhada nas respostas aqui: Como posso destacar ou anotar PDFs?

Uma das respostas mais bem classificadas recomenda o Xournal , que não foi mencionado aqui e seria minha arma de escolha. É uma ferramenta que permite fazer anotações manuscritas, mas possui recursos extras que permitem anotar um PDF. Por padrão, ele salvará suas anotações como um arquivo separado, mas também permitirá que você exporte o PDF anotado como um novo PDF. Isso deve manter o layout, fontes, etc.

Com Xournal você escolheria "Anotar PDF", em seguida, usar um marcador preto sólido para mascarar as peças que você deseja editar, e "Exportar para PDF".

Existem algumas histórias na internet sugerindo que Xournal rasteriza o texto no PDF exportado (obrigado por apontar isso, MHC). Este não parece ser verdade:. Com anotações simples, o texto permanece selecionável e pesquisáveis e o tamanho do arquivo não aumenta por muito (que aumentou de 205 kb para 220 kb no exemplo abaixo)

Para instalar, execute em um terminal: sudo apt-get install xournal ou apenas selecione-o no Centro de Software

    
por Tomas 20.04.2013 / 04:29
5

Eu faço muitos arquivos PDF todos os dias, então passo muito tempo pensando como fazer da melhor maneira.

Para mim, a melhor maneira é dividir PDF em um arquivo PDF de uma página, ao lado de editar com o GIMP, ao lado de combiná-lo. Eu não uso imagemagick em todos os arquivos (eu não uso nada), então eu não perco camada de texto em todas as páginas, mas apenas em redigido. Não carregue todo o arquivo PDF de uma só vez, porque isso causa exaustão de memória.

Dividir PDF em arquivos de uma página

Divida facilmente arquivos PDF em um PDF de uma página com essa função bash (coloque-a em ~ / .bashrc):

function pdf_split(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
    done;
};

Agora você pode inserir split_pdf file.pdf para obter muitos arquivos PDF.

Redigir arquivos

Mas agora você precisa editar todos esses arquivos. Você pode fazer isso com gimp original-filename-*.pdf . Eu sugiro configurar atalho no GIMP (Janela principal- > Editar- > Atalho) para substituir o arquivo (eu uso CTRL + R), filtro de desfoque (por exemplo, CTRL + D), fechar arquivo (por exemplo, CTRL + W) e sair GIMP (por exemplo, CTRL + Q). Lembre-se de não carregar o GIMP em muitos arquivos de uma só vez, mas o GIMP como você está carregando depois de aberto, assim você pode usar gimp original-filename-*.pdf em milhares de arquivos seguros.

Combine arquivos

Você pode combinar arquivos facilmente com: pdftk originam-filename-*.pdf cat output "new-file-anon.pdf";

Conecte tudo junto

Essas operações são muito repetitivas e chatas, então eu conecto tudo em um script:

function pdf_redact(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
        gimp "${Outfile[@]}";
        pdftk "${Outfile[@]}" cat output "$filename-anon.pdf";
        rm "${Outfile[@]}";

    read -p "Do you want open output file? " -n 1 -r
    echo    
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
            evince "$filename-anon.pdf";
    fi

    read -p "Do you want upload output file to Scribd.com? " -n 1 -r
    echo 
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
        scribd_up "$filename-anon.pdf";
    fi
    done;
};

A versão mais recente deste script está sempre acessível em: link

Lembre-se de fechar o GIMP (CTRL + Q) após toda a redação para continuar o script.

No vício, como eu abrir arquivos redigidos (eu gosto de ler para verificar se todos) e como fazer o upload para o Scribd com o meu outro script - scribd_up , agora posso redigir muitos arquivos PDF de forma muito eficiente.

    
por Adam Dobrawy 02.08.2014 / 17:26
3

Você pode usar o Okular.

sudo apt-get install okular
  1. Abra o pdf com o Okular.
  2. Pressione F6 .
  3. Pressione 8 .
  4. Realce o texto que você deseja redigir.
  5. Clique com o botão direito do mouse no texto, selecione as propriedades, selecione "Tipo" como "Realçar", pressione Ok .
  6. Imprima o arquivo em um pdf.
por eharvey 13.01.2016 / 17:24
2

Abra o PDF com a ferramenta gratuita PDF-Xchange PDF Viewer . Apague o texto a ser redigido usando retângulos pretos. Impressão. Isso fará com que você tenha uma redação "falsa" fácil e de alta qualidade.

    
por MetaEd 27.10.2011 / 21:20
2

Você também pode experimentar esta ferramenta: link

Aqui está (mas, de qualquer forma, o texto é selecionável):

    
por franzlorenzon 11.03.2013 / 10:07
2

Eu lembro que uma vez eu e um colega tivemos que encontrar uma maneira de editar um par de pdf. Acabamos usando o Gimp. Eu vou comentar os detalhes ... nós abrimos o pdf diretamente com o gimp (em um terminal)

gimp the_file.pdf

Quando terminar de editar, não salvamos as alterações, em vez de imprimirmos no arquivo pdf ... Isso pareceu funcionar bem.

    
por maniat1k 28.10.2011 / 00:31
2

O PDF Studio é um não-opensource e é um software que requer compras.

Em termos desta questão, a partir da versão 8, ela possui um recurso de redação manual. Os usuários podem selecionar um objeto de texto e redigi-lo. O conteúdo é removido do PDF e substituído por um retângulo preto.

Na versão 9 no terceiro trimestre de 2013, as anotações de redação e a gravação também estarão disponíveis para imagens e formas.

    
por Lilou 20.04.2013 / 04:08
1

Use o LibreOffice Draw para essa edição rápida que você está procurando. Depois de terminar, você pode salvá-lo como formato LibreOffice Draw ou exportá-lo novamente para o formato PDF ( File > Export as PDF )

ParapoderimportararquivosPDFparaoLibreOfficeDrawvocêdeveprimeiroinstalaropacotelibreoffice-pdfimport.

Instale-oatravésdoCentrodeSoftwaredoUbuntu( libreoffice-pdfimport ) ou através de um terminal com sudo apt-get install libreoffice-pdfimport .

    
por Bruno Pereira 27.10.2011 / 22:20
1

A melhor maneira que encontrei para fazer isso é usar o link . Você pode anotar, adicionar texto e imagens, desenhar um retângulo "branco" em torno de coisas que deseja redigir, e você pode rapidamente fazer o download e salvá-lo. Ele também funciona muito bem com documentos de várias páginas, algo com que muitas outras soluções não funcionam bem. Por exemplo, se você abrir um documento de várias páginas no Gimp ou no Inkscape, só poderá abrir uma página por vez. O processo é muito mais rápido no PDFescape. Todo o processo para eu redigir um documento de duas páginas leva menos de um minuto.

    
por user184478 17.02.2014 / 21:51
1

Como muitas soluções aqui recomendam redigir / apagar através de anotações (que deixam o conteúdo original no pdf), eu recomendo rasterizar o pdf depois para remover verdadeiramente o conteúdo original.

Aqui está uma maneira de fazer isso que, ao mesmo tempo, mantém a qualidade e o tamanho do arquivo baixos (pelo menos no meu caso de um monte de páginas em preto-e-branco):

$  convert -quality 100 -density 180 -compress zip notreallyredacted.pdf trulyredacted.pdf

Nota: convert precisa do ImageMagick.

Nota 2: convert não preserva o conteúdo dos formulários que você pode ter preenchido. Para que ele não se perca, você pode querer imprimir o documento "para um arquivo" em algo como evince first (ou em qualquer aplicação que você preencheu o formulário) e então rasterizá-lo.

    
por balu 28.01.2016 / 08:57
1

Se você não quiser lembrar o encantamento correto para convert , use pdf-redact-tools , um script de shell automatizando o processo de explosão de um PDF em imagens PNG e mesclando-as novamente após a redação (usando uma ferramenta de sua escolha, por exemplo, gimp). É conventientemente apt-get instalável .

    
por kynan 13.02.2016 / 22:47
0

Existem vários editores para editar documentos PDF diretamente, como pdfedit , ou convertê-los para outros formatos de vetor que possam ter melhor suporte, como pstoedit . No entanto, eu não recomendaria o uso de nenhum deles, já que o risco de fazer algo estúpido, como apenas pintar o texto com preto, deixando os vetores no lugar, é fácil, tornando a redação trivial para desfazer.

Ir o vetor para rota de bitmap é a maneira mais segura, preferencialmente a rota de bitmap de 1 bit, para evitar possíveis problemas com canais alfa ou diferenças de cores que podem deixar o texto legível.

Se possível, você deve sempre redigir o documento original e simplesmente remover a informação, não a tinta no PDF, pois até mesmo o espaçamento e o espaçamento do texto ao redor do texto redigido podem revelá-lo.

    
por Grumbel 27.10.2011 / 23:10
0

Eu adiciono à lista: Krita . Não teve perda de qualidade, porque ao importar PDF você pode definir o dpi (configurá-lo para 300, como disse @Sergey). Depois de editar, clique em "Exportar como PDF". Por fim, acho o Krita mais intuitivo que o Gimp, depois de ter sido um usuário de longa data do Photoshop.

    
por jmjr 24.11.2016 / 22:26
-1

Se estiver usando o LibreOffice para criar um arquivo PDF, abra o documento no LibreOffice, destaque o texto a ser redigido, clique com o botão direito e selecione o caractere, selecione Plano de fundo e clique em preto. Exportar para PDF.

    
por Dave 28.05.2014 / 20:23