Essas ferramentas gratuitas parecem promissoras para seus propósitos: Scantailor ou Bookscanner .
Se você tiver acesso ao Adobe Acrobat, foi assim que eu fiz. O fluxo de trabalho básico seria combinar as imagens em um PDF, cortar o espaço preto extra de todas as páginas de uma só vez, duplicar cada uma das páginas, recortar as pares e ímpares em dois lotes para cortá-las ao meio e depois OCR.