Eu acho que é quase impossível porque o PDF consiste em diferentes blocos de dados (como textes, fontes, cores) e o chamado dicionário salvo no final do arquivo. Esta parte (dicionário) tem todas as informações sobre onde esses pedaços são colocados dentro do arquivo. Então, sem essa informação, qualquer software só pode adivinhar e pode ser completamente cego tentando conectar todas essas coisas juntas