conversão em lote do tesseract

Question

conversão em lote do tesseract

#1 resposta do karkaf (1 votos)
#2 resposta do Meer Borg (0 votos)
#3 resposta do nguyenq (0 votos)

0

Eu estou tentando OCR um livro usando tesseract no entanto eu não quero digitar cada página como um livro perto de 1000 páginas. Como eu conseguiria isso

Eu tentei tesseract * .tif * o que me dá isso read_params_file: parâmetro não encontrado: II *

por user140393 25.03.2013 / 12:17

3 respostas

Como faço para desfazer e instalar o driver GPU proprietário? Problemas gráficos após a atualização

score 1 · Answer 1

Para evitar a substituição do arquivo de saída para cada nova página, eu fiz:

for i in *tif; do b='basename "$i" .tif'; tesseract "$i" "$b" hocr; done

Funcionou bem.

(encontrei esta solução aqui .)

score 0 · Answer 2

Eu tentei isso e funciona

for i in *.tif ; do tesseract $i outtext;  done;

Verifique se, quando estiver no terminal, você altera o diretório para o local de todos os arquivos tif.

score 0 · Answer 3

0

Você pode usar o VietOCR , que usa o Tesseract e suporta o OCR em lote / em massa.

por nguyenq 06.04.2013 / 19:16