Como remover imagens de um arquivo PDF

Question

Como remover imagens de um arquivo PDF

#1 resposta do Rinzwind (10 votos)
#2 resposta do Kurt Pfeifle (9 votos)
#3 resposta do Rmano (1 votos)
#4 resposta do Sudheer (0 votos)

8

Eu tenho um documento PDF bastante grande (~ 100MB) com muitas imagens (como ilustrações e imagens de fundo), e gostaria de ter uma cópia desse pdf sem imagens, mas não consigo encontrar como fazer isso.

Não estou falando de convertê-lo apenas em texto, gostaria de manter os parágrafos / tabelas / colunas múltiplas como estão.

Estou confortável com a linha de comando e tenho vários computadores com diferentes distribuições que posso usar.

command-line pdf

por Ornux 06.06.2014 / 13:47

4 respostas

9

Os últimos lançamentos do Ghostscript podem fazer isso também. Basta adicionar o parâmetro -dFILTERIMAGE ao seu comando.

Existem ainda mais dois novos parâmetros que podem ser adicionados para remover seletivamente os tipos de conteúdo "vetor" e "texto" :

-dFILTERIMAGE : produz uma saída em que todas as imagens raster são removidas.
-dFILTERTEXT : produz uma saída em que todos os elementos de texto são removidos.
-dFILTERVECTOR : produz uma saída em que todos os desenhos vetoriais são removidos.

Quaisquer duas dessas opções podem ser combinadas. (Se você combinar todos os 3, você obterá todas as páginas ficando em branco ...)

Exemplos

Aqui está a captura de tela de uma página de exemplo em PDF que contém todos os três tipos de conteúdo mencionados acima:

_{Captura de tela da página PDF original contendo elementos "image", "vector" e "text".}

por Kurt Pfeifle 16.06.2016 / 16:42

1

Enquanto a resposta do @Rinzwind é a Coisa certa , gostaria de comentar a solução "intermediária". Normalmente, você pode reduzir bastante o tamanho das imagens usando ghostscript com

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen \
   -dNOPAUSE -dQUIET -dBATCH -sOutputFile=small.pdf original.pdf

... é realmente muito útil para revisão. A página de manual para escrever PDF é aqui .

por Rmano 06.06.2014 / 19:03

0

Você pode usar o editor pdf mestre, excluir essas imagens e salvar como um novo arquivo pdf. Você pode baixá-lo do centro de software do Ubuntu.

por Sudheer 06.06.2014 / 13:57

Tags command-line pdf

Execute o Tomcat7 como usuário tomcat7 (ou qualquer outro) Como importar a biblioteca de músicas do iTunes no Rhythmbox

score 10 · Accepted Answer

cpdf -draft original.pdf -o version_without_images.pdf

Não está nos repositórios, mas você pode encontrar um download ( pré-compilado ou fonte ) no site deles .

Manual :

15.1 Minuta de documentos

A opção -draft remove imagens bitmap (fotográficas) de um arquivo, para que possa ser impresso com menos tinta. Opcionalmente, a opção -boxes pode ser adicionada, preenchendo os espaços deixados em branco com uma caixa cruzada denotando onde a imagem estava. Isso não é garantido para ser totalmente visível em todos os casos (o bitmap pode ter sido parcialmente coberto por objetos de vetor ou recortado no original). Por exemplo:
 cpdf -draft -boxes in.pdf -o out.pdf