Sei que perguntas semelhantes foram feitas antes, mas antes de marcá-las como duplicadas, deixe-me explicar.
Acabei de comprar online um .pdf
ebook e gostaria de tê-lo como .epub
. Eu costumo usar calibre
(v1.0.0) para esse tipo de tarefa com grande sucesso. Desta vez, grandes proporções de linhas parecem ficar confusas durante a conversão.
Jérôme disait aimer le rouge. Sa marotte
FRQVLVWDLW VXUWRXW ¡ O#HQOHYHU 'ªJUDIHU OD
dentelle était un geste qu'il effectuait avec la
Mesmo que você não fale francês, você notará que a linha do meio é lixo. E não é apenas uma linha inútil, substitui o conteúdo real.
O visualizador de e-books de calibre exibe o pdf
inicial com o lixo, enquanto é exibido muito bem com meu visualizador de PDF padrão. Eu tentei converter para mobi
, txt
, mkd
, sem sucesso.
Eu tentei pdftotext
e a ferramenta on-line link e recebi o mesmo resultado.
Em seguida, convertei os arquivos pdf
para .pbm
e tentei executar gocr
e ocrad
nele. Os resultados do OCR foram bastante interessantes, mas não bons o suficiente para serem usados como estão.
Jérôme _sȧit aimer le rouge. Sa marotte
consistait surTout à l'enlever. Dégrafer la
dentelle était un geste qu_l effectuait avec la
Você tem alguma idéia de outras ferramentas que poderiam ajudar no processo ou opções para ajustar calibre ou programas de OCR?
Nota: Estou executando o Ubuntu 13.10.
Tags pdf epub conversion ocr calibre