Se você está bem apenas com a conversão do formato de arquivo (sem tornar o texto pesquisável (via OCR como apontado por Jonathan Ben-Avraham), esta será uma tarefa perfeita para convert
do Pacote ImageMagick (disponível para várias plataformas: Win, Linux, Mac).
Basta usar esse comando para converter seu arquivo TIFF de várias páginas
convert multi-page.tif book.pdf
No entanto, você deve empregar o parâmetro -compress
. Se você tiver um TIF colorido de 24 bits, poderá usar LZW
(sem perdas) ou JPEG
(com perdas), por exemplo,
convert -compress LZW multi-page.tif book.pdf
Se o seu TIFF é preto e branco (por favor, certifique-se, é realmente salvo com apenas 1bit colordepth), eu costumo usar -compress Fax
.
Aqui está um exemplo para um arquivo de exemplo de 5 páginas, com algum texto nele - a relação real entre os algoritmos de compressão depende, é claro, do conteúdo do seu arquivo:
24bit JPEG: 1294kB
24bit LZW: 1759kB
1bit Fax: 135kB
Após essa conversão, você ainda pode executar uma ferramenta de OCR (como o Adobe Acrobat Pro) para tornar o texto pesquisável e copiável.