Para evitar a substituição do arquivo de saída para cada nova página, eu fiz:
for i in *tif; do b='basename "$i" .tif'; tesseract "$i" "$b" hocr; done
Funcionou bem.
(encontrei esta solução aqui .)
Eu estou tentando OCR um livro usando tesseract no entanto eu não quero digitar cada página como um livro perto de 1000 páginas. Como eu conseguiria isso
Eu tentei tesseract * .tif * o que me dá isso read_params_file: parâmetro não encontrado: II *
Eu tentei isso e funciona
for i in *.tif ; do tesseract $i outtext; done;
Verifique se, quando estiver no terminal, você altera o diretório para o local de todos os arquivos tif.