Software como Tesseract (código aberto) e Adobe Acrobat (proprietário) contém ferramentas OCR pré-configuradas para extrair texto de uma imagem. Você poderia olhar para usá-los. Se você quiser descobrir e projetar algoritmos para aumentar a legibilidade do texto, então você pode ler um pouco sobre o processamento de imagens e escrever códigos para executar as funções de transformação na imagem.