O que você deseja é chamado de verificador de vírus. Por exemplo. ClamAV
Eu preciso de um script de shell para detectar PDFs válidos. Ou seja, preciso manter apenas PDFs ASCII simples. Outros PDFs que contenham conteúdo não ASCII e scripts mal-intencionados precisam ser excluídos. Como eu poderia fazer isso? Existe algum script disponível para fazer isso?
O que você deseja é chamado de verificador de vírus. Por exemplo. ClamAV
Existem alguns scripts python aqui. "The Malware Archives: PDF Files" também Bruce Schneier mencionou isso em seu site.
pdf2ps é fácil, mas muito menos seguro. Isso é interessante. O link não permite elementos multimídia.
Tags pdf ascii shell-script