Apesar de parecerem na tela, as imagens de texto não têm uma resolução muito alta. Você pode ver isso ampliando a exibição em um visualizador de PDF. As imagens são pixelizadas e nem todas em preto e branco.
Eu extraí as imagens com imagens em pdf. Gocr trabalhou nas imagens .ppm resultantes, mas com muitos erros. Eu não pude fazer o tesseract trabalhar com as imagens apesar da conversão para o tiff monocromático.