Encontrei uma solução para esse problema. O Hocr2pdf tem problemas com a produção de pdfs de várias páginas, então produzi tifs de página única, rodei o tesseract-ocr, executei hocr2pdf e combinei os resultados com o seguinte script:
for f in ./*.tif; do
tesseract "$f" "$f" -l fra hocr
hocr2pdf -i "$f" -s -o "$f.pdf" < "$f.html"
done
pdftk *.tif.pdf cat output "output.pdf" && rm *.tif.pdf && rm *.tif.html