Como formatar duas colunas OCR PDF em uma coluna

0

Estou tendo problemas para ler um PDF no meu Kindle porque o texto do OCR é exibido em duas colunas por página. (IE O livro foi escaneado duas páginas por vez, o que o OCR deles fizeram.) Como posso formatar isso em uma coluna (ou qualquer estilo) para que eu possa lê-lo no meu Kindle?

    
por grossmae 12.05.2012 / 05:43

2 respostas

5

A versão mais recente do k2pdfopt pode manter o OCR com opção de saída de PDF nativo (-mode 2col) ou restaure o OCR usando o seu próprio OCR . Além disso, executar a saída k2pdfopt através do Caliber, como alguns sugeriram, não é necessário se você usar as configurações corretas em k2pdfopt.

Editar: v2.x de k2pdfopt, lançado em 3 de setembro de 2013, preservará o texto anteriormente OCR por padrão, mesmo quando não for usado no modo de saída de PDF nativo (por exemplo, quando o texto é refluído).

    
por 09.11.2012 / 14:08
1

Encontrado este guia. Basicamente usando k2pdfopt para converter as duas colunas em apenas uma. E, em seguida, executá-lo através do Caliber para uma versão mais limpa.

Esta é uma solução parcial, pois remove os benefícios do OCR. O arquivo resultante é apenas imagens e, portanto, muito grande.

    
por 13.05.2012 / 08:46

Tags