conversão em lote do tesseract

0

Eu estou tentando OCR um livro usando tesseract no entanto eu não quero digitar cada página como um livro perto de 1000 páginas. Como eu conseguiria isso

Eu tentei tesseract * .tif * o que me dá isso read_params_file: parâmetro não encontrado: II *

    
por user140393 25.03.2013 / 13:17

3 respostas

1

Para evitar a substituição do arquivo de saída para cada nova página, eu fiz:

for i in *tif; do b='basename "$i" .tif'; tesseract "$i" "$b" hocr; done 

Funcionou bem.

(encontrei esta solução aqui .)

    
por karkaf 19.02.2014 / 15:48
0

Eu tentei isso e funciona

for i in *.tif ; do tesseract $i outtext;  done;

Verifique se, quando estiver no terminal, você altera o diretório para o local de todos os arquivos tif.

    
por Meer Borg 25.03.2013 / 13:47
0

Você pode usar o VietOCR , que usa o Tesseract e suporta o OCR em lote / em massa.

    
por nguyenq 06.04.2013 / 21:16