Se você estiver usando o Adobe Acrobat (versão 9 ou mais recente), tente usar outro tipo de OCR chamado Clearscan. O OCR padrão usado em aplicativos como o acrobat não é muito bom, e o Clearscan tenta melhorar, além de reduzir o tamanho do arquivo.
Aqui está um guia para o Acrobat 9, citado no Blog da Acrolaw .
ClearScan OCR is not the default in Acrobat 9, so you’ll need to
change a setting to use it. Here’s how.
Choose: Document < OCR Text Recognition > Recognize Text using OCR... Click the Edit... button in the OCR window:
Change the PDF Output Style to ClearScan.
Click OK twice to OCR the document.
Note: The setting is "sticky" for future sessions.
Eu não tinha um pdf com texto OCR à mão, mas para a versão mais recente do Acrobat Pro DC a opção é chamada 'Reconhecer texto' (você pode usar o painel Ferramentas à direita do documento para procurá-lo) - faz parte da ferramenta Enhance Scans).
Se você quiser saber mais sobre o Clearscan, a postagem no blog explica sobre isso em detalhes .