Existe uma maneira de excluir todos os recuos (esquerda, direita, suspensa, etc), guias, margens e qualquer outro item de formatação de página?

0

Acabei de usar o software OCR para digitalizar um documento com mais de 20 páginas no Word 2007. O resultado é um monte de páginas com margens e recuos próprios. Eu pareço ter sido capaz de redefinir as margens, mas coisas como recuos parecem ser relativas às margens. Portanto, reduzir o tamanho da margem fez com que alguns parágrafos saíssem do lado esquerdo da página porque o recuo foi definido como um valor negativo. Gostaria de limpar toda a formatação de página e manter a formatação visual como fonte, tamanho da fonte, cor da fonte, negrito, sublinhado, itálico, etc. Dessa maneira, posso começar do zero e reformatar os layouts de página da maneira que desejar.

    
por oscilatingcretin 08.07.2013 / 01:48

1 resposta

0

Não tenho certeza se isso é uma opção para você, mas você poderia usar outro formato baseado em texto simples (como TeX ou HTML) e tentar filtrar as informações por uma linguagem de script como Perl ou Python, , desde que a saída seja "simples" o suficiente, mesmo usando um editor de texto inteligente e expressões regulares poderiam fazer o trabalho).

Observe que, embora você possa usar o Word para exportar para esse formato, mas se você puder usar o formato imediatamente no software de OCR, eu definitivamente tentarei usá-lo primeiro. Como regra geral para editores WYSIWYG, os arquivos exportados em formatos de marcação tendem a ser extremamente complicados.

    
por 08.07.2013 / 02:02