Para marcas d'água baseadas em imagem, existem várias ferramentas que prometem sua remoção automática. Por exemplo:
Tudo isso é gratuito, mas requer uma licença para produzir a saída desejada.
No entanto, a marca d'água desse arquivo PDF específico (que o OP me enviou por e-mail) não é uma imagem única que é repetida em todas as páginas. Acontece que o PDFCreator o codificou (quase pixel a pixel) em cada um deles. Isso torna a marca d'água muito mais difícil de remover (e resulta em um arquivo PDF bastante inchado).
Como a marca d'água é composta de muitas imagens minúsculas, você pode removê-las com um editor de PDF (por exemplo, Foxit Advanced PDF Editor ), simplesmente selecionando-os e pressionando Excluir . Infelizmente, você precisa repetir isso para todas as páginas.
Uma solução menos demorada seria remover a marca d'água programaticamente. Nós precisamos:
- Pdftk : uma ferramenta para (des) compactar e corrigir fluxos de PDF.
- Notepad ++ : um editor de texto capaz de substituir Expressões regulares compatíveis com Perl .
Etapas
-
Faça o download do Pdftk e extraia pdftk.exe e libiconv2.dll para % windir% \ System32 , um diretório no caminho ou qualquer outro local de sua escolha.
-
Faça o download e instale o Notepad ++.
-
Os fluxos de PDF geralmente são compactados usando o algoritmo DEFLATE . Isso economiza espaço, mas torna a fonte do PDF ilegível.
O comando
pdftk original.pdf output uncompressed.pdf uncompress
descompacta todos os fluxos, para que possam ser modificados por um editor de texto.
-
Abra uncompressed.pdf com o Notepad ++ para revelar a estrutura da marca d'água.
Neste caso específico, cada página começa com o bloco
q 9 0 0 9 2997 4118.67 cm BI /CS/RGB /W 1 /H 1 /BPC 8 ID Ÿ®¼ EI Q
e quase 4.000 blocos como este. Esse bloco específico define apenas um (
/W 1 /H 1
) dos pixels da marca d'água.Rolando para baixo até que o padrão mude, revela que o fluxo da marca d'água tem 95.906 bytes (contando novas linhas). O mesmo fluxo exato é repetido em todas as páginas do arquivo PDF.
-
Pressione Ctrl + H e defina o seguinte:
Find: q 9 0 0 9 2997 4118\.67 cm.{95881} Replace: (blank) Match case: checked Wrap around: checked Regular expression: selected . matches newline: checked
A expressão regular
q 9 0 0 9 2997 4118\.67 cm.{95881}
corresponde à primeira linha do bloco acima (q 9 0 0 9 2997 4118.67 cm
) e a todos os seguintes 95.881 caracteres, ou seja, o fluxo da marca d'água.Clicar em Substituir tudo remove-o de todas as páginas do arquivo PDF.
-
A marca d'água foi removida, mas o arquivo PDF tem erros (os comprimentos dos fluxos estão incorretos) e não foi compactado.
O comando
pdftk uncompressed.pdf output nowatermark.pdf compress
cuida de ambos.
-
uncompressed.pdf não é mais necessário. Você pode excluí-lo.
O resultado é o mesmo PDF sem a marca d'água (e cerca de metade do tamanho).