Como posso extrair o conteúdo de arquivos digitalizados?

1

Eu já usei o Preview e o Automator antes para extrair texto de documentos PDF, mas eles não funcionam em documentos digitalizados. Como posso extrair o conteúdo de arquivos digitalizados com a formatação preservada? Eu não quero pagar pela Adobe.

    
por Rosa Reyes 27.02.2017 / 03:17

2 respostas

0

Como já foi dito, seus documentos digitalizados são imagens (de texto). Para entender o texto, você precisará executar o OCR (Optical Character Recognition) sobre esse documento.

Existem vários produtos de OCR disponíveis para Mac e pode ser que o seu scanner tenha sido fornecido com esse produto. No entanto, ao solicitar formatação, você está exigindo alguns recursos bastante sofisticados, que não estão disponíveis em produtos básicos. Você pode, portanto, ter que esperar pagar por esse software de OCR. Sob este ponto de vista, você pode reconsiderar o Acrobat.

    
por 27.02.2017 / 09:41
0

Por "digitalizado", presumo que você queira dizer que o documento contém apenas imagens de texto, em vez dos caracteres de texto. Nesse caso, use o software de reconhecimento óptico de caracteres (OCR).

Para o sistema operacional Windows, existem FreeOCR , a9t9 e outros . Há também software para Android, Linux e Mac, e também existem serviços online baseados em navegador.

    
por 27.02.2017 / 06:25