Gostaria de rasterizar um PDF para imagem usando o Ghostscript com todo o conteúdo preservado, exceto para suprimir fontes. Eu não quero converter texto em curvas (como -dNoOutputFonts
), eu quero o texto totalmente despojado. (O motivo para isso é executar o OCR em imagens no PDF, sem executá-lo em nenhum texto existente.)
Isso pode ser feito no Ghostscript? Talvez haja uma maneira de forçar todas as fontes a serem substituídas por uma fonte em branco, ou emitir um comando PDL para alterar todo o texto para tornar transparente?
Tags ghostscript