Pós-processamento de imagem: sem papel

0

Eu tento fazer com que o Unpaper funcione, é uma ferramenta muito poderosa para pós-processar páginas de livros digitalizados. Eu li o documento, mas ainda não consigo fazer funcionar nem no Windows nem no Linux. Minha foto é um Bitmap que eu converti para o formato .pbm com o Gimp (também tentei pgm e pnm). Então eu uso este comando:

unpaper -l double --pre-rotate -90 inputFile.pbm outputFile.pbm

(- l double significa que tenho 2 páginas em uma folha e --pre-rotate -90 vira a imagem para a esquerda)

Deve fazer algo assim:

Mas meu arquivo de saída não tem diferenças entre a entrada, apenas girada.

    
por 3498DB 27.07.2011 / 10:40

1 resposta

0

Eu finalmente descobri o problema. O problema foi a conversão para o formato .pbm feito pelo Gimp (v2.6.11). O arquivo convertido não era binário (apenas pixels brancos ou pretos), enquanto a Wikipedia diz " O PBM é para bitmaps (preto e branco, não cinzas) ". Então eu usei ImageMagick para a conversão e agora o unpaper funciona perfeitamente e eu tenho excelentes resultados com o tesseract 3.

    
por 28.07.2011 / 16:47

Tags