Eu tenho um documento com muitas páginas que têm tabelas colunares como as seguintes.
#1 2.1 This is some text. It can go onto the next line
like this.
#2 1.3 More text.
#3 3.2 And some more text that goes on to the next
line also.
#4 2.3 And some more text.
Quando eu escrevo o documento, parece que o OCR as colunas como blocos separados em algumas páginas e outras páginas em outras páginas, ele captura todo o texto como um grande bloco. Neste exemplo, digamos que ele foi capturado em 4 blocos, conforme mostrado na imagem a seguir.
Portanto, quando exporto (ou copia / colo), o Acrobat exporta-o em ordem de blocos. Então eu recebo um texto como o seguinte.
#1
#2
#3
2.1
1.3
3.2
This is some text. It can go onto the next line
like this.
More text.
And some more text that goes on to the next
line also.
#4 2.3 And some more text.
Se eu exportar para o Word, o layout ficará bem, mas isso é porque o Acrobat criou o documento do Word com seções e colunas. Neste caso, uma seção de três colunas até o final da linha # 3. Em seguida, uma seção de uma coluna para a linha # 4. Então, quando eu exportar do Word para o texto dá o mesmo resultado
Como posso dizer ao Acrobat para o OCR ou exportar o texto usando as teclas simples esquerda / direita / superior / inferior, para obter texto como o original (assim como no meu primeiro exemplo)? Obrigado!
Informações do sistema:
macOS 10.12.5 (16F73)
Architecture: x86_64
Build: 17.9.20044.222436
AGM: 4.30.69
CoolType: 5.14.5
JP2K: 1.2.2.38123
Tags adobe-acrobat ocr