Como remover uma marca d'água de um arquivo PDF?

41

Eu achei que seria uma tarefa simples, mas acabou acontecendo de outra maneira.

A marca d'água é a mesma imagem (sobreposta, mas transparente) em todas as páginas. Eu mesmo criei o arquivo PDF (por isso, não há preocupações com direitos autorais aqui) usando o PDFCreator 0.9.8.

Já experimentei o Adobe Acrobat Pro do meu amigo, mas não funcionou. Ele tenta removê-lo, mas não pode. Tentei remover o cabeçalho / rodapé, etc., mas a marca d'água não desaparece.

Como posso remover a marca d'água?

    
por Shiki 30.07.2012 / 20:01

8 respostas

72

Para marcas d'água baseadas em imagem, existem várias ferramentas que prometem sua remoção automática. Por exemplo:

Tudo isso é gratuito, mas requer uma licença para produzir a saída desejada.

No entanto, a marca d'água desse arquivo PDF específico (que o OP me enviou por e-mail) não é uma imagem única que é repetida em todas as páginas. Acontece que o PDFCreator o codificou (quase pixel a pixel) em cada um deles. Isso torna a marca d'água muito mais difícil de remover (e resulta em um arquivo PDF bastante inchado).

Como a marca d'água é composta de muitas imagens minúsculas, você pode removê-las com um editor de PDF (por exemplo, Foxit Advanced PDF Editor ), simplesmente selecionando-os e pressionando Excluir . Infelizmente, você precisa repetir isso para todas as páginas.

Uma solução menos demorada seria remover a marca d'água programaticamente. Nós precisamos:

Etapas

  1. Faça o download do Pdftk e extraia pdftk.exe e libiconv2.dll para % windir% \ System32 , um diretório no caminho ou qualquer outro local de sua escolha.

  2. Faça o download e instale o Notepad ++.

  3. Os fluxos de PDF geralmente são compactados usando o algoritmo DEFLATE . Isso economiza espaço, mas torna a fonte do PDF ilegível.

    O comando

    pdftk original.pdf output uncompressed.pdf uncompress
    

    descompacta todos os fluxos, para que possam ser modificados por um editor de texto.

  4. Abra uncompressed.pdf com o Notepad ++ para revelar a estrutura da marca d'água.

    Neste caso específico, cada página começa com o bloco

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    e quase 4.000 blocos como este. Esse bloco específico define apenas um ( /W 1 /H 1 ) dos pixels da marca d'água.

    Rolando para baixo até que o padrão mude, revela que o fluxo da marca d'água tem 95.906 bytes (contando novas linhas). O mesmo fluxo exato é repetido em todas as páginas do arquivo PDF.

  5. Pressione Ctrl + H e defina o seguinte:

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    A expressão regular q 9 0 0 9 2997 4118\.67 cm.{95881} corresponde à primeira linha do bloco acima ( q 9 0 0 9 2997 4118.67 cm ) e a todos os seguintes 95.881 caracteres, ou seja, o fluxo da marca d'água.

    Clicar em Substituir tudo remove-o de todas as páginas do arquivo PDF.

  6. A marca d'água foi removida, mas o arquivo PDF tem erros (os comprimentos dos fluxos estão incorretos) e não foi compactado.

    O comando

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    cuida de ambos.

  7. uncompressed.pdf não é mais necessário. Você pode excluí-lo.

O resultado é o mesmo PDF sem a marca d'água (e cerca de metade do tamanho).

    
por 30.07.2012 / 20:06
6

Parece que a marca d'água é, na verdade, parte das imagens dentro do arquivo .PDF, e não uma imagem separada renderizada por ela, seja qual for o que você estiver usando para exibir o arquivo .PDF. Talvez você não consiga remover a marca d'água sem extrair as imagens do .PDF, executá-las por meio de um editor de imagens e, em seguida, reconstruir o .PDF manualmente.

    
por 30.07.2012 / 20:05
4

Para marcas d'água de texto, editar uma versão PostScript pode ser muito mais fácil: Depois

$ pdftops document.pdf

edite document.ps e converta de volta para PDF via

$ ps2pdf document.ps

    
por 16.12.2014 / 19:45
1

Os artefatos do selo são que você pode excluí-lo no Adobe Acrobat Pro, no entanto ele se regenera em uma movimentação do mouse porque o objeto de fluxo o mantém persistente.

Se você tentar editar a fonte do pdf - o que é complicado, há uma chance de o arquivo ser corrompido.

Se o selo é um fluxo, podemos interrompê-lo desconectando o computador da rede, o que eu fiz.

Em seguida, usando o Adobe Acrobat Pro, selecionei uma das minhas anotações, cliquei com o botão direito para obter o pop-up e selecione "Mostrar lista de comentários".

Selecione a marca / selo nefasto da lista, clique com o botão direito para obter o pop-up e selecione "Excluir". Faça isso em todas as páginas em que a afixação ocorre.

Salve o arquivo com outro nome. Meu aplicativo caiu, mas não antes de salvar o arquivo!

Abra o novo & arquivo muito menor; note que todas as marcas d'água / selos são gonzo.

No meu caso, o tamanho do arquivo do meu documento de 3 páginas encolheu de 300 kb para impressionantes 60 kb. Todos os dados e anotações originais permaneceram intactos - sem as marcas d'água.

~ Boa caçada: o)

    
por 23.10.2014 / 21:26
1

converta o documento em um arquivo .rtf usando zamzar. A marca de água desaparece automaticamente após a conversão. Por favor Note: - Funciona perfeitamente se o documento contiver material de texto. Sempre foi de grande ajuda .. (Usuário do Mac)

    
por 13.01.2015 / 16:42
1

Encontrou outra maneira de fazer isso:

  1. Use a ferramenta pdf2htmlEX (ou qualquer outro conversor PDF para HTML) para converter o PDF em um arquivo HTML.
  2. Edite o HTML com um editor de texto e remova a marca d'água. Salve isso.
  3. Imprimir no HTML para um novo documento PDF
  4. Lucro
por 17.03.2017 / 13:49
0

Este é um suplemento para a resposta do @Dennis de 18:06 em 30 de julho de 2012. Ele certamente aborda o caso mais difícil.

No caso mais simples em que a marca d'água é simples, um texto sem adornos, por exemplo

Smedley For Commissioner

as marcas d'água PDF descompactadas podem ser definidas assim:

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

em que 75.96 é o deslocamento horizontal e 625 o deslocamento vertical para essa instância de marca d'água específica. (Sim, os números reais e inteiros podem ser vistos.)

Um regexp como o seguinte funciona para todas as marcas d'água, ignorando qualquer variação no posicionamento:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Lembre-se de que uma variedade de operadores PDF modificadores podem entrar em jogo com marcas d'água que possuem uma formatação mais complicada. Tal fantasia pode transformar o que o leitor espera (esperanças?) Numa string contígua, facilmente procurada, em uma confusão de sopa de letrinhas. Por exemplo,

E1 = mc² by Smedley™

Pode ser o produto disso:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

. . ou muito pior, se a sua marca d'água for colorida!

Tendo observado tudo isso, também notarei que o PDFtk tem uma versão GUI que pretende manipular marcas d'água, levando em consideração uma taxa de licenciamento de US $ 4. Não é nada caro!

Por outro lado, acho que atualmente seu site anuncia suporte total para O / S através de Windows 8 e OS X 10.8 Mountain Lion . Aquela safra é mais de 4 anos atrás. O PDFtk está ficando desatualizado? Eu suspeito que não, mas eu não sei.

    
por 16.10.2016 / 07:22
0

Aqui estão formas gratuitas e pagas para o fazer, sugiro que utilize o Google Drive.

O Google Drive pode abrir arquivos e fazer pequenas edições. Além disso, ele pode ser usado para remover marcas d'água do PDF on-line.

  1. Abra sua conta do Google Drive, que é basicamente igual à sua Conta do Gmail.
  2. Clique em "Novo" > "Upload de arquivo", selecione um documento PDF e faça o upload.
  3. Depois de concluído, você pode verificar o arquivo enviado no seu Drive e, em seguida, à direita clique para abri-lo com o "Google Docs".
  4. Depois disso, sua marca d'água será removida automaticamente. Salvar vá em “File” e clique em “Download as” e escolha “PDF documento ”.
por 29.01.2018 / 06:43