O que você está procurando é o software OCR . Existe uma versão on-line gratuita que você pode experimentar para ver como ela atende às suas necessidades.
Para uma abordagem mais robusta, você pode usar tesseract-ocr , o que deve permitir uma abordagem mais em lote e é patrocinada pelo Google.